WO2003072819A2 - Analyse von nukleinsäure-fragmentmischungen un genexpressionsanalyse - Google Patents

Analyse von nukleinsäure-fragmentmischungen un genexpressionsanalyse Download PDF

Info

Publication number
WO2003072819A2
WO2003072819A2 PCT/EP2003/002032 EP0302032W WO03072819A2 WO 2003072819 A2 WO2003072819 A2 WO 2003072819A2 EP 0302032 W EP0302032 W EP 0302032W WO 03072819 A2 WO03072819 A2 WO 03072819A2
Authority
WO
WIPO (PCT)
Prior art keywords
nucleic acid
acid fragments
fragments
mixture
fragment
Prior art date
Application number
PCT/EP2003/002032
Other languages
English (en)
French (fr)
Other versions
WO2003072819A3 (de
Inventor
Achim Fischer
Original Assignee
Axaron Bioscience Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Axaron Bioscience Ag filed Critical Axaron Bioscience Ag
Priority to AU2003210377A priority Critical patent/AU2003210377A1/en
Priority to US10/504,847 priority patent/US20060029937A1/en
Priority to EP03742963A priority patent/EP1492888A2/de
Priority to CA002480320A priority patent/CA2480320A1/en
Publication of WO2003072819A2 publication Critical patent/WO2003072819A2/de
Publication of WO2003072819A3 publication Critical patent/WO2003072819A3/de

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • C12Q1/683Hybridisation assays for detection of mutation or polymorphism involving restriction enzymes, e.g. restriction fragment length polymorphism [RFLP]

Definitions

  • the invention relates to a method for analyzing nucleic acid fragment mixtures and the use of the method for gene expression analysis.
  • sequenced expressed sequence tag
  • sequenced expressed sequence tag
  • the abundance of a transcript is no longer represented by the frequency of an event, for example the frequency with which a clone representing this transcript occurs, but by the intensity of the respective band.
  • This largely eliminates the redundancy that characterizes the EST sequencing of the prior art, which is associated with a cost reduction.
  • the respective bands are isolated from the gel, reamplified by means of PCR and cloned. More modern variants of this method, as are described, for example, in EP 0 743 367, are based on fragment generation by means of restriction digestion of double-stranded cDNA, which significantly increases the reproducibility of the fragment patterns obtained.
  • fragment-specific information such as fragment length, partial nucleotide sequence, information about position and / or orientation of the fragment within the starting cDNA etc.
  • fragment-specific information such as fragment length, partial nucleotide sequence, information about position and / or orientation of the fragment within the starting cDNA etc.
  • bp long partial sequence which is known for each fragment, as well as the information about the distance of this sequence from the 3 'end of the fragment.
  • the method described has disadvantages which lead to the unreliability of said signatures: (1) the identification of 4 nucleotides of the 8 bp long sequence, which is carried out by “invasive” or “selective” amplification primers, is imprecise, since primers are often also incorporated whose selective portion, namely the nucleotides located at the 3 'end, are not perfectly complementary to the template, and (2) the determination of the fragment length via the electrophoretic mobility is inaccurate, since the mobility of a fragment in addition to the length of G / C content and the exact sequence of the fragment (cf. Forensic Sei. Int.
  • the fragments obtained are separated by gel electrophoresis , its length and therefrom the distance between the two restriction endonuclease recognition sites on which the formation of a fragment is based, and signatures are generated, consisting of the sequence of the first recognition site, the sequence of the second recognition site and the assumed distance between the two recognition sites (expressed in base pairs) Using these signatures, database searches are carried out in order to allocate the detected fragments to the genes from which the fragments are derived, which also shows that due to great uncertainties in the determination of fragment sizes on the basis of fragment mobilities, there is a high response Part of incorrect assignments of database entries to detected fragments occurs.
  • the object of the present invention is achieved by a method for analyzing nucleic acid fragments, comprising the steps:
  • step (b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one restriction endonuclease, the interface of which lies outside of its recognition site, (c) identification of one or more nucleotides of the cut nucleic acid fragments from (b), the identification being simultaneous for several or all nucleic acid fragments are carried out.
  • the object according to the invention is achieved by a method for analyzing nucleic acid fragments, comprising the steps:
  • step (a) Provision of a mixture of nucleic acid fragments which have at least one recognition site for a restriction endonuclease cutting outside their recognition site, (b) incubation of at least a subset of the mixture of nucleic acid fragments from step (a) with at least one restriction endonuclease, the interface of which lies outside of its recognition site and which creates overhanging ends of known position and length but unknown sequence,
  • the mixture of nucleic acid fragments is preferably, optionally amplified, restriction fragments of cDNA or genomic DNA.
  • the fragments or a part of the fragments can be flanked by sequence regions common to all or some fragments. These common sequence regions can be, for example, linkers or adapters attached to the fragments, that is to say double-stranded nucleic acid fragments which can be obtained by Hybridization of two essentially or at least partially complementary oligonucleotides are readily available.
  • adapters are characterized by a length between 5 and 200 nucleotides, preferably between 10 and 80 nucleotides, particularly preferably between 15 and 40 nucleotides.
  • the fragments preferably have a characteristic size distribution with a smallest occurring size, a largest occurring size and an average size, the size being influenced or determined by the positions and / or the frequency of the recognition site or sites for the restriction endonuclease or restriction endonucleases used for fragment generation of course, the length of any attached linker or adapter must also be taken into account.
  • a mixture of nucleic acid fragments preferably double-stranded cDNA, is cut with at least one restriction endonuclease, which preferably has a four-based recognition sequence.
  • restriction endonucleases are Alul, Bfal, Bst I, Chal, Csp6l, Cv JI, Cv / JI, Dpnl, Dpnll, Haelll, Hhal, HwPlI, Hpall, HpyCm IV, HpyCIl4 V, Mbol, Msel, Mspls, Nlalll , Sau3al, Tail, Taql, Tsp5091.
  • linker molecules are attached to one or both ends of the fragments thus obtained - generally via enzymatic ligation.
  • fragment ends and linker ends are compatible with one another, ie are smooth or have overhangs that are complementary to one another.
  • single-stranded fragment ends can be removed using a nuclease or, in the case of 5 'overhangs, filled in using a polymerase and thus converted into smooth ends if the attachment of linkers with smooth ends is intended.
  • Another example of post-treatment of fragment ends is partial filling, which can prevent, usually undesirable, ligation of two fragment ends to one another.
  • a palindromic and thus self-complementary overhang of the sequence 3'-CTAG-5 'generated by treatment with the restriction endonuclease Sau3al can be converted into a no longer self-complementary overhang of the sequence 5'-TAG-3' by treatment with a polymerase in the presence of dGTP , Only such linkers with an overhang 5 '-ATC-3' complementary to it could now be attached to such an overhang; ligation of two fragment ends with one another would no longer be possible.
  • an amplification with one or more PCR primers directed against the attached linkers or with one or more against the fragments is optionally carried out to display a desired subset of fragments attached linker directed PCR primer and in addition a PCR primer which is directed against a terminal region of the original nucleic acid fragments, preferably the starting cDNA molecules.
  • a PCR primer which is directed against a terminal region of the original nucleic acid fragments, preferably the starting cDNA molecules.
  • the region which was introduced by the cDNA primer used for cDNA synthesis or a region which is artificially attached to the 5 'end of the mRNA used for cDNA synthesis or to the 3' end of the first strand cDNA was added.
  • the cDNA primer used is preferably an oligo-dT primer which can have an extension by one or more nucleotides at its 3 'end and / or at its 5' end, at least some of which have no " If two or more restriction endonucleases which generate different ends are used for the fragment generation, different linkers can be used in the subsequent step, some of which attach to one type of end and another part to another type of end If these linkers differ not only in their ends and thus in their compatibility (ie, their attachability) to the fragment ends, but also in their remaining sequence, then in a subsequent PCR amplification, specific fragments can be targeted by suitable choice of the primers (those on the linker sequences of the selected primers under the set amplification conditions can be amplified), while certain other fragments (those to the linker sequences of which the selected primers cannot bind) remain unamplified.
  • a further possibility for the selective amplification of certain fragments is to use invasive primers which are extended at their 3 'end to the linker sequence common to all fragments by one or more additional selective bases (see for example EP 0 743 367).
  • a further possibility for selective isolation or amplification, which can be used in the course of the method according to the invention, is described in WO 94/01582.
  • Restriction endonucleases that cut outside their recognition site are those restriction endonucleases in which the partial sequence that triggers the enzyme activity (the recognition site), which is usually one of 4-8
  • Base pair of existing region of double-stranded DNA and on which the Enzyme binds to the DNA double strand, and the interface, that is to say the region of the DNA double strand in which the sugar phosphate backbone of the DNA strands is hydrolytically separated, is offset from one another on at least one of the two strands forming the double strand.
  • restriction endonucleases such as Fokl [cutting characteristic GGATG (9/13): the “upper” strand is cut 9 bases away from the recognition site GGATG, the “lower” strand 13 bases away from the recognition site] or Btsl [Cutting characteristic GCAGTG (2/0)] or the restriction endonuclease Bcgl [cutting characteristic (10/12) CGANNNNNNTGC (12/10): both strands are cut once in front of and once behind the recognition site].
  • Fokl cutting characteristic GGATG (9/13): the “upper” strand is cut 9 bases away from the recognition site GGATG, the “lower” strand 13 bases away from the recognition site] or Btsl [Cutting characteristic GCAGTG (2/0)] or the restriction endonuclease Bcgl [cutting characteristic (10/12) CGANNNNNNTGC (12/10): both strands are cut once in front of and once behind the recognition site].
  • restriction endonucleases Aarl, Acelll, Alol, Alw ⁇ , Bael, Bbr7l, Bbsl, Bbvl, BceA ⁇ , Beeil, BciYl, BfuAl, Bmrl, Bpli, Bpml, BpuEl, Bsal, BsaXl, BscAl, BseKIll, BseMIll , BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, Bst ⁇ 5l, Cjel, CjeVl, Earl, Ecil, Eco57l, Eco57Ml, Fall, Faul, HaelV, Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil PsrI, RleAl, Sapl, SfaNl, Sthl32l, Stsl, Taqll, TspOT I
  • restriction endonucleases which produce single-stranded overhangs, which can be both 3 'overhangs and 5' overhangs. If restriction endonucleases are to be used which produce smooth ends (for example Mlyl, cutting characteristic GAGTC (5/5), or SspO5 I, GGTGA (8/8)), the smooth ends can be converted into overhanging ends in an additional step.
  • T4 DNA polymerase incubation with T4 DNA polymerase in the presence of a selected nucleotide triphosphate; the exonuclease activity of the T4 DNA polymerase then degrades one of the two strands in the 3 '-' 5 'direction until the first "nucleotide of the same name" in the strand is reached (for example up to the first "G” if the nucleotide triphosphate dGTP used see Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons).
  • Another type of restriction endonucleases that cut outside their recognition site are enzymes in which the recognition site is interrupted by a sequence of any or largely any nucleotides.
  • enzymes such as Xcml (cutting characteristic CCANNNNN / NNNNTGG) or S / ZI (cutting characteristic GGCCNNNN / NGGCC).
  • Another special case to be considered outside of their recognition site of restriction endonucleases which are cutting is so-called "nicking endonucleases" which only cut one strand of a nucleic acid double strand.
  • Examples of such endonucleases are N.AlwI (GGATCNNN N) and N.BstNBI (GAGTCNNNN / N) the sense strand on the marked with "/" Cut position.
  • the recognition site for a restriction endonuclease that cuts outside of its recognition site in the nucleic acid fragments from the fragment mixture in (a) is preferably located within the terminal sequence regions common to many or all fragments of the mixture, in particular in the sequence regions of the adapters or linkers attached to the fragments.
  • the selection of the enzyme and the position of the recognition site are to be selected such that, when the restriction endonuclease or restriction endonucleases act, a "proximal" cut is made and the respective nucleic acid fragment is cut in the fragment-specific area which is outside the flanking linker common to all or many fragments
  • recognition sites for the restriction endonucleases to be used which are outside individual fragments and which lie outside the flanking linker areas common to all or many fragments are protected against recognition by the corresponding restriction endonuclease
  • recognition sites for certain restriction endonucleases can be achieved, for example, by incorporating methylated nucleotides such as methyl dCTP Protection against restriction endonucleolytic cleavage is also provided by using a methylase belonging to the selected restriction endonuclease.
  • the enzyme BamRl methylase converts recognition sites of the restriction endonuclease BamHl into their C-methylated form, which Bam ⁇ l no longer recognizes and cuts.
  • the enzyme CpG methylase methylates CG dinucleotides, for example preventing a cut of a DNA fragment containing the sequence CGTCTC with the restriction endonuclease BsmBl (cutting characteristic CGTCTC (1/5)).
  • the above measures ensure that each nucleic acid fragment present in the mixture in the course of a restriction induction only on exactly one predetermined position is cut.
  • nucleic acid molecules preferably cDNA or genomic DNA
  • restriction endonuclease from step (b)
  • linker molecules to the ends generated with the latter and to carry out a PCR amplification with primers which are directed against the terminal linker molecules.
  • One or more nucleotides of the cut nucleic acid fragments can be identified in several different ways. In particular, three preferred procedures are suitable for this, which should not, however, preclude further procedures:
  • the terminating nucleotides carry marking groups which can be used to detect incorporation
  • the four dideoxynucleotides carry four distinguishable labeling groups, in particular four different fluorophores, and it can then be recognized from the fluorescence activity which of the four
  • restriction endonucleases are particularly suitable: Aarl, Acelll, Alwl, Bbr7l, Bbsl, Bbvl, BceAl, Bce, BfuAl, Bsal, BscAl, BsmAl, BsmBl, Bsm ⁇ l, BspMl, Earl, Faul, Fokl, Hgä, Plel, S SfaNl, SM321, Stsl. Attachment of adapters with overhanging ends of suitable length and suitable type (3 'overhang or 5' overhang) to fragments having an overhanging end, the attachment being carried out in a sequence-specific manner.
  • the overhanging fragment ends can in particular have been generated using one of the following restriction endonucleases: Aarl, Acelll, Alol, Alwl, Bael, Bbr7l, Bbsl, Bbvl, BceAl, Bcett, Bcgl, BciVl, BfuAl, Bmrl, BpR, Bpml, BpuEl,
  • Sequencing adapter used, which differ in their overhang.
  • a sequential or a parallel procedure is of course also conceivable, in which different adapters are used in separate fastening reactions.
  • adapters bearing marking groups which differ both in their overhang and in their marking group.
  • the labeling groups are fluorophores, so that the fluorescence activity of the fastening products shows which adapter has been fastened to a given fragment end.
  • Mixture can be, for example, adapters of the general structure
  • adapter means the double-stranded portion of the adapter
  • X represents one of the four possible nucleotides in the form of a single-stranded overhang
  • F means a fluorophore which identifies the overhanging base X.
  • N is a mixture of all four possible nucleotides or a universal nucleotide such as inosine.
  • the first nucleotide of the dibasic fragment overhang would be determined by attaching the first adapter
  • the second nucleotide of the dibasic fragment overhang would be determined by attaching the second adapter.
  • the sequence of the overhanging end can be determined.
  • overhangs of a length of more than two nucleotides can also be sequenced.
  • marking groups which allow the simultaneous detection of more than four (namely usually an integer multiple of four) different markings.
  • the first four of the different markings could be used to identify a first base of fragment overhangs generated, the second four of the different markings for identification of a second base of the fragment overhangs generated, and possibly further sets of four different markings for further bases of the fragment overhangs generated , Such a “multiplexing” would result in a reduction in the number of experimental steps required.
  • so-called “quantum dots” could be considered as marker groups, of which numerous different ones can be detected in a common measurement without the measurement results influencing one another (Han et al., Nat. Biotechnol. 19, 631-5 [2001]).
  • Extension of selective oligonucleotide primers whose nucleotide or nucleotides located at the 3 'end can hybridize with the nucleotide or nucleotides to be sequenced, followed by the identification of those primers which were extended in the extension reaction. If necessary, the extension can be carried out by means of the polymerase chain reaction (PCR).
  • Linkers or adapters are preferably attached to the ends of the nucleic acid fragments to be sequenced, which can serve as primer binding sites common to all or many fragments.
  • the oligonucleotide primers are then designed in such a way that, after denaturing the nucleic acid fragments to be sequenced, they correspond to those at the 3 'end of the
  • Nucleic acid fragment strands can hybridize attached linker strand. It must be ensured here that the oligonucleotide primers hybridized in this way "overlap" by one or more nucleotides with the region of the nucleic acid fragment adjacent to the linker region, that is to say at their 3 'end they have nucleotides which correspond to the nucleotides of the
  • nucleic acid fragments if there is complementarity.
  • selective nucleotides which allow the primer to be extended by means of a polymerase if they have become part of a double strand as a result of said hybridization, but which at least largely prevent the primer from being extended if they do not
  • nucleotides are identified simultaneously for several or all nucleic acid fragments, preferably after the nucleic acid fragments contained in the mixture have been separated according to a fragment-specific property, in particular according to the size and / or mobility of the fragments, by electrophoretic separation.
  • the method of gel electrophoresis is particularly preferred, in which flat gels or gel-filled capillaries are used for the separation.
  • enzymatic reactions according to variants 1-3 are carried out in step (c) in such a way that one or two nucleotides of the fragments are identified in parallel batches, the nucleotides of the fragments to be identified in the parallel batches being in a defined position relative to one another , for example adjacent to each other.
  • One or two nucleotides of known position are then first determined in parallel separations of the said approaches for each of the separated fragments, which is preferably done by means of different marker groups which allow information about the nucleotides to be determined.
  • the determined nucleotides for individual or all of the separated fragments are then brought into the order in which they are present on the associated starting fragment from the mixture of nucleic acid fragments.
  • signatures in the form of short sequence sections which characterize the associated fragment are generated for the examined fragments.
  • the length of these sequence sections is preferably at least 14 bases, more preferably at least 16 bases, in particular at least 20 bases.
  • a signature can also contain other information characterizing a fragment, for example exact or approximate distances (specified in base pairs) between characteristic areas of the fragment, for example the distance between two known sequence sections estimated with the aid of an internal length standard based on the electrophoretic mobility, between a known sequence section and a fragment end, or between both fragment ends.
  • the length of the sequence sections is preferably at least 10 bases.
  • the information content of a signature is preferably large enough to allow the unambiguous identification and / or isolation of the associated fragment.
  • experience has shown that approximately 14-20 base pairs of sequence information without additional information about distances within the fragment in question are usually sufficient to recognize a transcript containing this sequence segment from a mixture of cDNA molecules and to identify the associated gene.
  • t ⁇ g sequencing such as SAGE (Velculescu et al., Science 270: 484-487 [1995], WO 00/53806) or MPSS (Brenner et al., Nature Biotechnol.
  • the information content of a signature identifying a fragment can be increased, among other things, by the following information:
  • an additional statement about the fragment to be identified or the associated transcripts or genes in question could be, for example, "3 'fragment double-stranded cDNA generated by the restriction endonuclease Rsal", whereby the identity of the sequence part of a signature with a 5' ⁇ 3 'direction is "above” (upstream) or "Before" the sequence region of a transcript located most towards the 3 'end of the fragment would be recognized as insignificant.
  • signatures whose sequence portion was in the wrong orientation with regard to the 5' -3 'preferred direction of an mRNA Sequence or the cDNA sequence derived from it is not recognized as significant.
  • additional information is given as to which molecular biological procedure the signatures were generated, which precludes the occurrence of certain partial sequences as a signature or part of a signature about genes in question could, for example, be "from the totality of all genes expressed in the leaf” if transcripts from leaf samples are to be identified by means of plant signatures generated, but for example genes which are only expressed in the root should not be taken into account.
  • the simultaneous identification of one or more nucleotides of the cut nucleic acid fragments takes place in step c) via the following individual steps: ca) identification of a first nucleotide of the cut nucleic acid fragments from b), the identification being carried out simultaneously for several or all nucleic acid fragments, cb) optionally identifying a further nucleotide of the cut nucleic acid fragments from b), the identification being carried out simultaneously for several or all nucleic acid fragments, cc) optionally repeating step (c b) until the desired number of
  • Nucleotides has been identified, cd) summarizing the sequence information obtained in steps (ca) to (cc) for a selected group or all nucleic acid fragments into fragment-specific signatures, a signature being able to contain further information about the respective fragment in addition to the sequence information, wherein the nucleotide identification in steps ca) to cc) optionally also includes the separation of the nucleic acid fragments of the mixture.
  • step a) At least a subset of the mixture of nucleic acid fragments provided in step a) is subjected to the following process steps aa) to ad):
  • aa separation of the mixture of nucleic acid fragments according to at least one fragment-specific property, ab) optionally detection of the relative frequency of some or all fragments in the separated mixture, ac) optionally comparing the information obtained in (aa) and / or (ab) about the composition of different mixtures of nucleic acid fragments according to step (a), ad) optionally registering nucleic acid detected in (ab) and / or (ac) Fragments which occur in different mixtures of nucleic acid fragments at different relative frequencies ⁇
  • III) is a mixture of nucleic acid fragments which is at least partially identical to I) or II).
  • At least one fragment of one of groups (I) to (III) is obtained in an additional process step.
  • the fragments of interest are preferably obtained by specific PCR amplification from a mixture of nucleic acid fragments, in which fragment-specific oligonucleotide primers are used, which are accessible and can be produced by the signatures determined in step (cd).
  • a further preferred embodiment relates to one of the above methods according to the invention, in which a mixture of nucleic acid fragments according to step a) or a subset of this mixture of nucleic acid fragments according to step a) is provided, which was produced by the following steps: i) flanking on both sides of the restriction fragments of the mixture with identical or different adapters ii) hybridizing the fragments from step (i) with different primers in each case, all of which have regions complementary to the adapters from step (i) and which have their respective 3 'ends have one or more nucleotides, which after
  • Hybridization of the primer with its target sequence protrude beyond the region complementary to the adapter and are complementary to the nucleotides opposite them in the double strand of a subset of the fragments from the nucleic acid mixture from (a). iii) sequence-specific extension of the primers from ii) and, if appropriate, subsequent PCR amplification of the nucleic acid fragments from the fragment mixture which had been extended in a sequence-specific manner in step ii).
  • Sequence-specific extension means that only those primers whose nucleotide or nucleotides at the 3 'end at step 3) are or are complementary to the opposite nucleotides of the fragment with which they hybridize a nucleic acid are hybridized - Have formed double strand.
  • a method for gene expression analysis comprising the following steps:
  • fragments of interest optionally obtained fragments of interest from the mixture of nucleic acid fragments from (al) or (b1), the fragments of interest being the fragments registered in (e), ml) optionally identifying the genes belonging to the nucleic acid fragments of interest, from which the nucleic acid fragments are derived by means of
  • the fragments of interest can be the fragments registered in (e).
  • steps (fl) to (i) are repeated, changing the position and / or sequence of the recognition site ensures that nucleotide positions of the fragments to be analyzed other than those previously examined are converted into single-stranded overhangs and thus further, previously unidentified Nucleotides can be identified.
  • a simultaneous approach in parallel approaches is of course also possible.
  • the procedure is as follows: At least one fragment mixture is provided in which many or all fragments have identical ends, for example smooth ends or overhanging ends of the same length and sequence. This mixture is aliquoted, for example in 10 substantially equal aliquots.
  • Each of the mixtures is mixed with one of a selection of different adapters (here one of 10 different adapters) and exposed to ligation conditions, with all adapters being distinguished by an end that is compatible with the fragment ends, that is to say attachable to them. Furthermore, all adapters have at least one recognition site for a restriction endonuclease that cuts outside their recognition sequence, for example Mmel.
  • the adapters differ from one another in that the recognition sequence is removed from the adapter end to be attached to the fragment ends.
  • two different adapters differ in this distance by an integer multiple of the length of the overhanging ends, which can be generated by said restriction endonuclease which cuts outside their recognition sequence.
  • the distance is accordingly 18 bp in some adapters, 16 bp in other adapters, 14 bp, 12 bp, 10 bp, 8 bp, 6 bp, 4 in the other adapters bp, 2 bp or 0 bp.
  • bases 19 and 20 are in the case of the first reaction, bases 17 and 18 in the second reaction, and bases 15 and 16, 13 in the remaining reactions and 14, 11 and 12, 9 and 10, 7 and 8, 5 and 6, 3 and 4 or 1 and 2 in the form of a single-stranded overhang.
  • the complete set of all 10 reactions thus allows the identification of a coherent, 20 base long partial sequence or signature for the fragments present in the fragment mixture.
  • recognition sites for restriction endonucleases cutting at different distances from their recognition sites at the same position.
  • an adapter could have one at its end to be attached to the fragment ends Detection point for Earl (cutting characteristic CTCTTC (l / 4)), a second adapter in the same position a detection point for SfaNl (cutting characteristic GCATC (5/9)) and a third adapter in the same position a detection point for Stsl (cutting characteristic GGATG (10/14 )), which made it possible to use the method according to the invention to identify 13 base partial sequences of the fragments.
  • Detection point for Earl cutting characteristic CTCTTC (l / 4)
  • a second adapter in the same position a detection point for SfaNl (cutting characteristic GCATC (5/9)
  • a third adapter in the same position a detection point for Stsl (cutting characteristic GGATG (10/14 )
  • a method for gene expression analysis comprising the following steps:
  • a2) provision of at least one mixture of nucleic acid fragments, in particular a mixture of cDNA fragments, having at least one recognition site for a restriction endonuclease that cuts outside of its recognition site and that is located on linkers attached to starting fragments, b2) incubation of the mixture of nucleic acid fragments from ( a2) with the restriction endonuclease or the restriction endonucleases from step (a2), c2) identification of a first nucleotide of the cut nucleic acid fragments from (b2), the identification being cut simultaneously for several or all nucleic acid fragments of the mixture and with separation of the mixture and for
  • Identification of the nucleotide of suitably treated nucleic acid fragments takes place according to at least one fragment-specific property, d2) optionally identification of a further nucleotide of the cut nucleic acid fragments from (b2) according to (c2), e2) optionally repetition of step (d2) until the desired number of Nucleotides has been identified, f2) optionally repeating steps (a2) to (e2) one or more times, the position and / or sequence of the recognition site being changed in such a way that the repetition or repetitions in each case the identification of previously unidentified nucleotides allow, g2) combining the sequence information obtained in steps (c2) to (f2) for a selected group or all nucleic acid fragments into fragment-specific ones Signatures, where a signature can contain further information about the respective fragment in addition to the sequence information, h2) assignment of the fragment-specific information obtained in the separation according to a fragment-specific property in (c2) to the signatures obtained in (g2) for the nucleic acid fragments, being the
  • information includes the relative or absolute mobility of the fragments and / or the apparent or actual fragment length determined on the basis of a length standard and the assignment can take place in tabular and / or computer-readable form, i2) if necessary, identification of the nucleic acid Fragments belonging to genes from which the nucleic acid fragments derive, by searching electronic databases for the signatures from (g2), j2) optionally providing at least one further mixture of nucleic acid fragments, in particular a mixture of cDNA fragments, obtained from analogue ones Way to the mixture of nucleic acid fragments from (a2), it being possible here to dispense with the addition of linkers having at least one recognition site for a restriction endonuclease that cuts outside its recognition site, k2) separation of the mixture or mixture the nucleic acid fragments from (i2) according to a fragment-specific property essentially under the conditions of the separation into (c2),
  • Separation of the fragments may include the relative or absolute mobility of the fragments and or the apparent or actual fragment length determined on the basis of a length standard and the assignment may be in tabular and / or computer-readable form, m2) if necessary, comparison of the relative or absolute frequencies of at least part of the fragments separated in (k2) with the relative or absolute frequencies of the respective homologous, that is to say completely or essentially sequence-identical fragments originating from different mixtures of nucleic acid fragments, n2) where appropriate, registration of those fragments whose relative or absolute frequency differ from the relative or absolute frequency of their homologous fragments of other mixtures of nucleic acid fragments by at least a preselected factor, o2) where appropriate, assigning the fragments registered in (n2) to those genes or Transcripts, from which said fragments are derived, using the results obtained in step (h2), p2) optionally obtaining the fragments registered in (n2) from the mixture of nucleic acid fragments from (a2) or (i2) and / or (j
  • steps (i2) to (n2) can also be carried out before steps (a2) to (h2).
  • nucleic acid fragments preferably mixtures of cDNA fragments
  • Mixtures of nucleic acid fragments can be produced by methods known from the prior art.
  • EP 0 743 describes
  • Fragment subpools obtained from RNA preparations are then separated by gel electrophoresis according to their size, and the bands obtained. Signal patterns are compared with each other. Bands or signals originating from homologous fragments, the intensity of which differs between different samples, represent genes that are in the compared ones
  • the fragment-specific property is a property, in particular a physical or physicochemical property, which can be realized by different molecules within a continuum or in the form of a larger number (for example at least 10 or at least 100) of different gradations or forms. It is particularly preferred to use different mobility of different nucleic acid fragments in separation systems, in particular different electrophoretic mobility in electrophoresis systems such as agarose or polyacrylamide gel electrophoresis. Mobility is usually influenced by the length of a fragment; however, it is not a strictly linear relationship, since the G / C content and conformation of a nucleic acid molecule also influence mobility. Therefore, the mobility of a nucleic acid molecule can usually only be used for approximate, but not for absolute size determination.
  • the fragment-specific property can be a specific partial sequence of n nucleotides, where n can be equal to or greater than 1.
  • Said partial sequence of a fragment preferably adjoins a linker attached to the end of the fragment, so that a mixture of different fragments according to this partial sequence can be separated by extension, optionally a repeated extension in the form of an amplification, of selective oligonucleotide primers.
  • extension optionally a repeated extension in the form of an amplification, of selective oligonucleotide primers.
  • separation of a fragment mixture means the production of mixtures of amplified fragments, each of which copies produced by amplification contains only a part of the fragments present in the starting mixture.
  • said partial sequence is at least partly in the form of a single-stranded one Overhang, and a mixture of different fragments after this partial sequence is separated by attaching adapters with compatible overhangs.
  • This process also called “categorization of nucleotide sequence populations”, is described in WO 94/01582. A combination of both measures is also conceivable and is described, for example, in WO 01/75180.
  • the relative frequency of some or all of the fragments is detected by measuring the signal strength obtained in the detection of individual nucleic acid fragments.
  • the nucleic acid fragments contain detectable labeling groups, the use of fluorophores as labeling groups being particularly preferred.
  • the relative frequency of a fragment as an area under the corresponding curve in the fluorogram (the plot of the measured fluorescence intensity as a function of the retention time) is readily available in the form of a numerical value.
  • a fragment here is to be understood as the entirety of all the sequence-identical nucleic acid molecules of a mixture, possibly plus the sequence of complementary nucleic acid molecules.
  • the numerical values obtained as the relative frequency of fragments are often stored in a computer-readable form.
  • nucleic acid fragments preferably cDNA fragments, of different relative frequencies
  • those fragments are identified which differ in their proportion between different biological samples or between different mixtures of cDNA fragments. If care is taken to generate cDNA fragments from the mRNA molecules present in the samples, the frequency distribution of which is similar or even equal to the frequency distribution of the different mRNA molecules, then cDNA fragments between mutually compared fragment mixtures of different frequencies also show mRNA -Molecules of different frequencies and thus differentially expressed genes.
  • a threshold value for frequency differences can optionally be set, so that, for example, only those cDNA fragments whose relative frequency between mutually compared fragment mixtures is at least the same are further investigated Factor two differs.
  • the simultaneous identification of a nucleotide or a plurality of nucleotides for several or all nucleic acid fragments is preferably carried out by, as described above, on the overhanging fragment ends generated by means of at least one restriction endonuclease cutting outside their recognition site for identity the characteristic process of the nucleotide to be identified is carried out, for which a mixture of several or all nucleic acid fragments is used and the result of which can preferably be observed by incorporating a label, in particular a fluorescent label.
  • the identified nucleotides lie in proximity to one another, that is to say that the information about the nucleotide identities thus obtained results in a coherent partial sequence of the respective nucleic acid fragment.
  • the “sequencing reaction” has expired, the products formed in the process are separated, in which case the separation can again take place according to the fragment-specific property from (b1) or (c2).
  • the nucleotide identity obtained for some positions is assigned to each or some of the separated nucleic acid molecules.
  • the information received about a fragment is called a signature.
  • the signature can also contain further information, for example sequence information obtained in another way or approximate fragment size obtained via fragment mobility.
  • fragment-specific signatures can be determined for all or part of the fragments contained in a fragment mixture.
  • signatures are determined in particular for those fragments which differ in their relative frequency between the fragment mixtures to be compared by at least one fixed factor. Otherwise, the sequence portion of a signature does not necessarily have to be a coherent sequence.
  • partial nucleotide sequences of both fragment ends of a given fragment are determined and combined to form a signature; it is of course also possible to include additional information in the signature, such as approximate fragment lengths.
  • the signature could be for a particular fragment
  • the fragment "begins” with the nucleotide sequence CTCA at the 5 'end, "ends” with the nucleotide sequence GGAT at the 3' end and in total, possibly plus terminal linker regions, approximately 200 bp ( 4 bp + 192 bp + 4 bp) is long.
  • the formulation "approximately” takes into account that the length determination of fragments based on the electrophoretic mobility, as stated above, is subject to a certain error.
  • Fragments of interest can be obtained from the mixture of nucleic acid fragments, preferably cDNA fragments, with the aid of the fragment-specific signatures determined, for example by means of PCR using gene-specific primers.
  • a mixture of 3'-cDNA fragments was obtained by means of the restriction endonuclease Rsal, followed by the ligation of linker to the (smooth) fragment ends, and if the above signature GTACAGTA was obtained for a selected fragment Fragment known that after the Rs 1 cut (removal of the first two nucleotides of the Rs ⁇ l recognition site, GT), the first nucleotides following the linker sequence are the sequence ACAGTA.
  • a primer is now used for PCR amplification which, following the linker sequence at its 3 'end, has precisely this nucleotide sequence ACAGTA
  • the associated fragment can be accessed directly by amplification from the fragment mixture, since said primer selectively promotes amplification of those fragments. with which it is sequence-identical (or complementary) over its entire length.
  • the fragment obtained in this way can then be subjected to a further analysis, for example sequencing, followed by a database query for entries which are identical or similar to sequences.
  • a prerequisite for this procedure is of course a sufficiently high information content of the signature, ie a sufficient length and thus specificity of the fragment-specific area of the amplification primer.
  • the primer used would therefore have to be extended at its 3 'end by further specific bases. It must also be taken into account here that the greater the distance from the 3 'end of the primer, the less the ability of polymerases to discriminate against the extension of primers hybridized with partial mismatch with the template strand are. If a primer is extended at its 3 'end to increase the specificity by further fragment-specific bases, a certain loss in the specificity of those bases which immediately follow the sequence section of the primer complementary to the respective linker sequence is to be expected.
  • the signatures obtained for nucleic acid fragments of interest are used to design fragment-specific oligonucleotide primers.
  • the genes belonging to the nucleic acid or cDNA fragments of interest can be identified by searching electronic databases if the information content of a signature is high enough to permit clear or largely unambiguous identification of a gene and if the database has corresponding entries. How high the information content of signatures of a biological species has to be in order to allow a clear assignment of a signature to the associated gene can be determined empirically and can even differ from gene to gene within a biological species; for example, a particular decamer (a 10-nucleotide signature) may be characteristic of a single gene, while another decamer appears in many different genes.
  • the signatures obtained for nucleic acid fragments of interest are used to identify the nucleic acid fragments in a database search.
  • the signatures obtained for nucleic acid fragments of interest are used to create EST banks.
  • the signatures obtained for the individual fragments obtained from a cDNA preparation are used in order to design fragment-specific oligonucleotide primers. These are then used to obtain the respective fragments by means of PCR amplification. The fragments obtained are finally sequenced and the sequences are recorded in a database.
  • EST banks generated in this way can also be referred to as normalized EST banks, since each fragment is generated only once, regardless of its abundance or the abundance of the mRNA or cDNA molecules it represents.
  • redundancy can be practically excluded; however, in contrast to normalized banks according to the prior art, the redundancy information of the individual fragments, clones and those transcripts from which they are derived is not lost. Rather, abundance information can be obtained from the respective separation, for example by means of capillary gel electrophoretic separation The signal strength of the individual fragments of an examined fragment mixture can be taken and added to each received EST sequence as additional information.
  • mixtures of genomic DNA or cDNA generated restriction fragments flanked on both sides by identical or different adapters are used as a mixture of nucleic acid fragments, the fragments flanked by the adapter first being amplified by means of their 3 'end via the complementary one to the adapter Be subjected to a range extended by one or more nucleotides of primers and the amplification products thus obtained are used to carry out the method.
  • fragments are used as a mixture of nucleic acid fragments which were generated by restriction digestion with at least some of the type IIs restriction endonucleases from genomic or cDNA and which are flanked on one or both sides by adapter sequences.
  • overhanging ends are produced from the type IIs restriction endonucleases used, the sequence of which is not determined directly by the restriction endonuclease, but by the nucleic acid sequence of the interface and which can consequently differ from fragment to fragment.
  • adapters can be used for attachment which can only be attached to certain overhanging ends, in particular those whose nucleotide sequence is complementary to the nucleotide sequence of the overhanging adapter ends.
  • the required enzymatic reaction batches are created using an automatic pipetting device.
  • the fluorograms obtained by means of gel electrophoresis are automatically evaluated.
  • a Signals of different fluorograms belonging to one another are assigned to the computer system, which (i) homologous fragments from different mixtures of nucleic acid fragments, (ii) fragments of a nucleic acid mixture and the reaction products which were obtained for the identification of one or more nucleotides of the fragments of this mixture, (iii) Reaction products, which were obtained for the identification of several nucleotides of the fragments of a mixture of nucleic acid fragments, represent.
  • Such an automatic assignment can take place, for example, according to the following instruction:
  • Fragment length and signal intensity of all previously assigned signals is compared, 4. Cancel the process if the differences from (2) a preselected one
  • the automatic evaluation carry out the steps (dl), (el), (gl), (hl), (il), oil), (kl), (ml), (c2), (d2) , (e2), (f2), (g2), (h2), (i2), (12), (m2), (n2) and / or (o2).
  • Fig. 4 the identification of a nucleotide for all fragments of a mixture of nucleic acid fragments
  • Fig. 5 the identification of four nucleotides for all fragments of a mixture of nucleic acid fragments.
  • Figure 2 shows sequencing of the second position of the overhanging ends. Sequencing of a nucleic acid fragment representing the 3 'end of a cDNA molecule is shown.
  • the one for sequencing The adapters used are distinguished by a different sequence of the overhanging ends and by different marker groups which code for the sequence of the respective overhanging end.
  • a marker group indicating the base A is indicated by a dotted adapter, a marker indicating a C by a hatched adapter, a marker indicating a G by a filled adapter and a marker indicating a T by a cross-hatched adapter.
  • a marker group attached to the fragment in (1) by ligation and indicating a T indicates that the first base of the overhang is the complementary base A.
  • a labeling group attached to the fragment in (2) by ligation and indicating a C indicates that the second base of the overhang is the base G complementary thereto.
  • FIG. 3 shows the generation of various overhanging ends by shortening a nucleic acid fragment
  • FIG. 3 shows the release of shortened overhanging fragment ends which, with respect to the double-stranded region of the starting fragment, positions -5 and -6 (left), -3 and -4 (middle) and -1 and -2 (right) in terminal single-stranded and thus contain sequencing accessible via adapter ligation.
  • a 3 'cDNA fragment obtained by means of the restriction endonuclease Mbol is shown here as the starting fragment.
  • Figure 5 shows the identification of four nucleotides for all fragments of a mixture of nucleic acid fragments (fragments 1-7).
  • sequence signatures result:
  • FIG. 6 shows the separation of a mixture of nucleic acid fragments by means of capillary gel electrophoresis.
  • cDNA fragments were generated from a suspension culture of Saccharomyces cerevisiae.
  • the signals obtained from a stationary phase (gray) and from a culture in the logarithmic phase (black) are shown.
  • the horizontal scale shows the fragment size, the vertical scale shows the fluorescence intensity.
  • E one of the fragments from a mixture of nucleic acid fragments, B1-B16, identification of the first to sixteenth base of the fragment, FAM, PET, VIC, NED, the respective fluorophore detected during the identification of a base, (G), (A ), (T), (C), the base identified by means of the respective fluorophore.
  • FAM the first to sixteenth base of the fragment
  • FAM the respective fluorophore detected during the identification of a base
  • G A
  • T the base identified by means of the respective fluorophore.
  • the bar at the top shows the fragment size, so it is a fragment with a size of approximately 140 bp.
  • FIG. 8 shows a list of some signatures obtained from a suspension culture of Saccharomyces cerevisiae.
  • the fragment size, the signatures determined according to the method according to the invention, the open reading frames (ORFs) identified by means of BLAST analysis and the signal intensity obtained by means of capillary gel electrophoresis are to be specified in each case.
  • FIG. 9 shows the identification of several nucleotides of four nucleic acid fragments of a mixture of nucleic acid fragments.
  • the fragments are approximately 75 bp, 77 bp, 78 bp and 79 bp in length.
  • F separated fragments of the mixture, B1-B6, identification of the first to sixth bases of the fragments, FAM, PET, VIC, NED, the respective fluorophore detected when identifying a base, (G), (A), T), ( C), the base identified by means of the respective fluorophore.
  • the signature TCATTG results for the fragment with a length of 75 bp, the signature ACTGGC for the fragment with a length of 77 bp, with the signature ATGCCT for the fragment with a length of 78 bp, and for the fragment with a length of 79 bp Signature TATGCT.
  • RNA from a suspension culture of Saccharomyces cerevisiae was precipitated with ethanol and dissolved in 15.5 ⁇ l of water.
  • 10 ⁇ M cDNA primer CP31V 5 -ACCTACGTGCAGATTTTTTTTTTTTTTTTTTTTV-3 ', SEQ ID NO: 1 were added, denatured for 5 minutes at 65 ° C. and placed on ice.
  • the mixture was mixed with 3 ul 100 mM dithiothreitol (Life Technologies GmbH, Düsseldorf), 6 ul 5x Superscript buffer (Life Technologies GmbH, Düsseldorf), 1.5 ul 10 mM dNTPs, 0.6 ul RNase inhibitor (40 U / ul ; Röche Molecular Biochemicals) and 1 ⁇ l Superscript II (200 U / ⁇ l, Life Technologies) and incubated at 42 ° C. for 1 hour for cDNA first strand synthesis.
  • the pellet was dissolved in a restriction mixture consisting of 15 ⁇ l 10X universal buffer, 1 ⁇ l Mbol and 84 ⁇ l H 2 O and the reaction was incubated at 37 ° C. for 1 hour. It was extracted with phenol, then with chloroform and precipitated with ethanol.
  • the pellet was prepared in a ligation mixture from 0.6 ⁇ l lOx ligation buffer (Röche Molecular Biochemicals), 1 ⁇ l 10 mM ATP (Röche Molecular Biochemicals), 1 ⁇ l linker ML2025 (produced by hybridization of oligonucleotides ML20 (5 -TCACATGCTAAGTCTCGCGA-3 ', SEQ ID NO: 2) and LM25 (5'-GATCTCGC GAGACTTAGCATGTGAC-3 ', SEQ ID NO: 3)), 6.9 ⁇ l H 2 O and 0.5 ⁇ l T4 DNA ligase (1 U / ⁇ l; Röche Molecular Biochemicals) dissolved and the ligation performed overnight at 16 ° C.
  • ML2025 produced by hybridization of oligonucleotides ML20 (5 -TCACATGCTAAGTCTCGCGA-3 ', SEQ ID NO: 2) and LM25 (5'-GATCTCGC GAGACTTAGCATGTGAC
  • the ligation reaction was made up to 100 ⁇ l with water, extracted with phenol, then with chloroform and, after addition of 1 ⁇ l glycogen (20 mg / ml, Röche Molecular Biochemicals), precipitated with 100 ⁇ l 28% 8000 polyethylene glycol (Promega) / 10 mM MgCl 2 , The pellet was washed with 70% ethanol and taken up in 40 ul water.
  • Example 2 Amplification of cDNA-3 'restriction fragments divided into subpools
  • PCR batches were prepared, containing 2 ⁇ l of the ligation reaction from example 1, 2 ⁇ l of 10 ⁇ PCR buffer (670 mM Tris-Cl, pH 8.8, 170 mM
  • Primer ML20 had a fluorescent label (selected from one of the dye sets 5'-FAM, 5 '-JOE, 5'-ROX and 5' -TAMRA [dye set 1] or 5'-FAM , 5'-VIC, 5'-NED and 5'-PET [dye set 2]; further processing of the samples according to Example 3), or ML20 was used unlabelled (further processing of the samples according to Example 4 or Example 5).
  • the fluorograms were displayed and evaluated using the GeneScan version 3.7 software for Windows NT (Applied Biosystems To identify differentially expressed genes, fluorograms obtained with RNA preparations from yeast cells in different growth stages, but with the same amplification primers of the first and the second round of amplification, were compared with one another.
  • the fluorograms were matched using GeneScan and visually detected differences in the For comparisons of this type, the GeneScan function "align data by size" was first used to ensure that "matching" fragments from RNA preparations of different growths (ie representing the same gene / transcript) were used stadiums could be assigned to each other. In the next step, the signal strengths were normalized by adapting the average height of the signals of a sample to the average signal strength of a sample to be compared therewith.
  • fragments of identical size and thus identical transcripts which occur in comparing samples, and whose intensities differ from one another after normalization by at least a preselected factor, including the signature determined, were tabulated; In some cases, the associated values for fragment length (determined using the internal length standard), the signal intensity and the information about the amplification primers used were also included. For general transcriptome analysis (ie an "inventory" of expressed genes), all the signatures determined were tabulated, regardless of relative signal strengths.
  • the pellets were taken up in 20 ⁇ l of a ligation batch, containing 1.2 ⁇ l lOx ligation buffer (Röche), 8 ⁇ l 0.5 ⁇ g / ⁇ l Eco57I linker and a linker selected from ECO 1/2 to ECO11 / 12; see. Table 1; Production of the linkers by hybridization of the respectively stated complementary oligonucleotides) and 1 ⁇ l T4 DNA ligase (1 U / ⁇ l, Röche). It was ligated at 16 ° C overnight.
  • Example 3 a fragment occurring in Example 3 and the associated products from Example 4 shortened by means of Eco57l and provided with a sequencing adapter) were assigned to one another and recorded in tabular form, with the respective fluorophore also being used to determine the respective one Base identity was identified.
  • Such a table can, for example, have the format given in Table 3.
  • the partial cDNA sequences (“signatures”) obtained in this way were used to identify the relevant genes for a BLAST search.
  • the cDNA signature GATCTAGACAACCAAA which can be seen in Table 3, was used to code the yeast gene KTR4 (ORF YBR199W), coding for a putative Alpha-1,2-mannosyltransferase, Figure 8 shows further examples of signatures obtained from yeast.
  • the numerical values of this example relate to the use of Eco57l, which generates two-base overhangs for the identification of two neighboring bases ("doublets"), and of sequencing adapters, which optionally identify the first or the second base of such an overhang.
  • doublets the recognition sites for Eco57I in the Eco57I linkers are each offset by two bases
  • reaction according to example 3 results from the known recognition site of Mbol (cf. example 1)
  • Example 5 Determination of terminal bases via ⁇ // - / «reaction
  • a linker was selected from BCE1 to BCE13; see. Table 1; Production of the linkers by hybridization of the respectively stated complementary oligonucleotides) and 2 ⁇ l of Quick T4 DNA ligase (New England Biolabs) dissolved and ligated for 1 h at room temperature.
  • 2 ⁇ l of the ligation with 2 ⁇ l of 10 ⁇ M amplification primer 2 (identical in sequence to that strand of the Bce AI linker whose 3 ′ end had been linked to the fragments cut with Mbol), 2 ⁇ l of 10 ⁇ M CP31, 5 ul 10X Advantage 2 buffer, 1 ul 10mM dNTPs, 37 ul water and 1 ul 50x Advantage 2 DNA Polymerase Mix were mixed and amplified under the following conditions: 2 min. 94 ° C initial denaturation, then 25 cycles consisting of 20 sec. 94 ° C denaturation, 30 sec. 65 ° C annealing, 2 min. 72 ° C extension.

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäurefragmenten, umfassend die folgenden Schritte: a) Bereitstellung mindestens einer Mischung von Nukleinsäurefragmenten, die mindestens eine Erkennungsstelle für eine ausserhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease aufweisen, b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsäurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle ausserhalb ihrer Erkennungsstelle liegt, c) Identifikation eines oder mehrerer Nukleotide der geschnittenen Nukleisäurefragmente aus (b) und gegebenenfalls Identifikation weiterer fragmentspezifischer Eigenschaften der geschnittenen Nukleinsäurefragmente aus (b), wobei diese Identifikation(en) simultan für mehrere oder für alle Nukleinsäurefragmente erfolgen.

Description

Analyse von Nukleinsäure-Fragmentmischungen
Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäure-Fragmentmischungen sowie die Anwendung des Verfahrens zur Genexpressionsanalyse.
Aus dem Stand der Technik sind Verfahren zur Sequenzierung von Nukleinsäuremischungen, wie sie etwa durch das „Umschreiben" (die reverse Transkription) von mR A-Molekülen in cDNA-Moleküle erhalten werden können, bekannt. Die beim Umschreiben zahlreicher verschiedener, aus einer Zelle oder einem Gewebe gewonnener mR A-Moleküle erhaltenen cDNA-Moleküle werden kloniert, meist in Plasmid- oder Phagenvektoren, und anschließend „klonweise" sequenziert (Sambrook, Maniatis, Fritsch. Molecular cloning: a laboratory manual, Cold Spring Harbor/NY 1989), wobei die Sequenzierung üblicherweise „strangaufbauend" nach dem Kettenabbruchprinzip von Sanger oder „kettenabbauend" bei der Sequenzierung nach Maxam und Gilbert erfolgt. In jedem Fall wird die Separation unterschiedlicher Moleküle also über eine Vereinzelung in Form von in bakterielle Zellen transformierten Plasmiden vorgenommen, gefolgt von einer Vermehrung der vereinzelten Moleküle zu identischen Kopien, so daß bei der Sequenzierung „reine" (also von identischen Molekülen stammende) Signale erhalten werden. Besagte Vorgehensweise eignet sich beispielsweise zur sogenannten „EST-Sequenzierung" (EST = expressed sequence tag), bei der zahlreiche auf beschriebene Weise erhaltene Klone partiell sequenziert („ansequenziert") werden und die erhaltenen Sequenzergebnisse aufgelistet werden. Je nachdem ob die sequenzierte Bank zuvor normalisiert wurde oder nicht, spiegelt die relative Häufigkeit, mit der eine bestimmte cDNA bzw. ein bestimmter EST sequenziert wurde, die Abundanz des zugehörigen Transkripts wieder. Somit kann die EST-Sequenzierung nicht nur zur Detektion exprimierter Gene, sondern auch zum Vergleich von Expressionsstärken zwischen verschiedenen biologischen Proben eingesetzt werden (vgl. etwa Lee et al., Proc. Natl. Acad. Sei. U.S.A. 92 (1995), 8303-8307). Das Verfahren der EST-Sequenzierung zur, gegebenenfalls vergleichenden, Expressionsprofilierung ist jedoch gerade aufgrund dieses Zusammenhangs zwischen der relativen Transkript- und der relativen Klonabundanz sehr aufwendig, da einige Transkripte (beispielsweise sog. housekeeping-Gene) eine sehr viel größere Häufigkeit haben als andere Transkripte und somit Klone solcher häufiger Transkripte unter Umständen einige hundert bis einige tausend Mal sequenziert werden müssen, um andererseits auch weniger abundante Transkripte erfassen zu können.
In der Vergangenheit wurden mehrere alternative Verfahren beschrieben, bei welchen nicht vollständige cDNA-Moleküle analysiert werden, sondern lediglich Fragmente hiervon. Insbesondere sind zu nennen die Verfahren des RAP (RNA arbitrarily primed PCR; Welsh et al., Nucleic Acids Res. 20: 4965-70) und des Differential Display (Liang und Pardee, Science 257: 967-971), bei denen mittels PCR mit kurzen Primern zufallig ausgewählter Sequenz Transkriptfragmente amplifiziert werden. Diese Fragmente, deren Länge wiederum von Transkript zu Transkript stark variieren kann, werden mittels Gelelektrophorese ihrer Größe nach aufgetrennt und nachgewiesen. Hierbei wird, zumindest theoretisch, die Abundanz eines Transkripts nicht mehr durch die Häufigkeit eines Ereignisses, etwa der Häufigkeit, mit der ein dieses Transkript repräsentierender Klon auftritt, sondern durch die Intensität der jeweiligen Bande repräsentiert. Hierdurch wird die Redundanz, durch die sich die EST-Sequenzierung des Standes der Technik auszeichnet, weitgehend eliminiert, was mit einer Kostensenkung verbunden ist. Um eine Sequenzierung einzelner Fragmente zu ermöglichen, werden die jeweiligen Banden aus dem Gel isoliert, mittels PCR reamplifiziert und kloniert. Modernere Varianten dieses Verfahrens, wie sie etwa in der EP 0 743 367 beschrieben sind, basieren auf einer Fragmenterzeugung mittels Restriktionsverdau doppelsträngiger cDNA, wodurch die Reproduzierbarkeit der erhaltenen Fragmentmuster deutlich erhöht wird. Dennoch weisen Verfahren dieser Art noch den Nachteil auf, daß bei der Isolation von Banden aus einem Gel häufig durch andere, unerwünschte DNA-Fragmente verunreinigte Produkte erhalten werden. Weiterhin ist die Isolation und Klonierung einzelner Banden sehr arbeitsaufwendig, so daß eine Identifikation von Fragmenten ohne eine vorherige Isolation sehr wünschenswert wäre. Sutcliffe et al. (Proc. Natl. Acad. Sei. U.S.A. 97: 1976-1981) beschreiben ein „TOGA" genanntes Verfahren, mRNA-Moleküle in cDNA- Restriktionsfragmente zu überfuhren, welche mittels Kapillargelelektrophorese aufgetrennt werden. Für Fragmente von Interesse (welche im Vergleich verschiedener Präparationen durch Intensitätsunterschiede der betreffenden Banden differentiell exprimierte Gene anzeigen) wird eine Signatur (also eine Sammlung fragmentspezifischer Informationen wie beispielsweise Fragmentlänge, partielle Nukleotidsequenz, Information über Position und/oder Orientierung des Fragments innerhalb der Ausgangs-cDNA etc.) definiert, hier bestehend aus einer 8 bp langen Teilsequenz, welche für jedes Fragment bekannt ist, sowie der Information über die Distanz dieser Sequenz vom 3 '-Ende des Fragments. Mittels dieser Signatur lassen sich durch Durchsuchen von Sequenzdatenbanken Gene mit der gleichen Signatur identifizieren. Ist die erzeugte Signatur fehlerfrei, so können cDNA- Fragmenten die zugehörigen Gene zugeordnet werden, ohne daß die Fragmente isoliert und sequenziert werden müssen. Das beschriebene Verfahren ist allerdings mit Nachteilen behaftet, die zur Unzuverlässigkeit besagter Signaturen führen: (1) ist die Identifikation von 4 Nukleotiden der 8 bp langen Sequenz, welche durch „invasive" oder „selektive" Amplifikationsprimer erfolgt, ungenau, da oft auch Primer inkorporiert werden, deren selektiver Anteil, nämlich die am 3 '-Ende gelegenen Nukleotide, nicht perfekt komplementär zum Template sind, und (2) ist die Ermittlung der Fragmentlänge über die elektrophoretische Mobilität ungenau, da die Mobilität eines Fragments neben der Länge auch noch von G/C-Gehalt und der genauen Sequenz des Fragments abhängt (vgl. Forensic Sei. Int. 94, 155-6 [1998]; zum Begriff der Komplementarität vgl. die aus der Literatur bekannte Basenpaar-Regeln, etwa in Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons). Daher wird oft eine falsche Länge angenommen. Eine falsche Länge und/oder eine falsche Sequenz fuhren jedoch dazu, daß eine für ein gegebenes Fragment ermittelte Signatur nicht auf das zu identifizierende Gen hinweist, sondern die entsprechende Datenbanksuche entweder kein oder ein falsches Ergebnis zutage fördert. Ahnliche Einschränkungen gelten für ein vergleichbares, „GeneCalling" genanntes Verfahren, bei welchem cDNA Doppeldaus mit verschiedenen Kombinationen aus Restriktionsendonukleasen unterworfen wird (Shimkets et al., Natur e Biotechnol. 17, 798-803 [1999]). Die erhaltenen Fragmente werden gelelektrophoretisch aufgetrennt, ihre Länge und daraus der Abstand zwischen beiden der Bildung eines Fragments zugrundeliegenden Restriktionsendonuklease-Erkennungsstellen ermittelt, und es werden Signaturen erzeugt, bestehend aus der Sequenz der ersten Erkennungsstelle, der Sequenz der zweiten Erkennungsstelle und dem angenommenen Abstand beider Erkennungsstellen voneinander (ausgedrückt in Basenpaaren). Mittels dieser Signaturen werden Datenbanksuchen durchgeführt, um detektierte Fragmente den Genen zuzuordnen, von welchen sich die Fragmente ableiten. Auch hier zeigt sich, daß aufgrund großer Unsicherheiten bei der Bestimmung von Fragmentgrößen anhand von Fragmentmobilitäten ein hoher Anteil von Falsch-Zuordnungen von Datenbankeinträgen zu detektierten Fragmenten auftritt.
Daher war es Aufgabe der vorliegenden Erfindung, in einer Mischung vorliegenden Nukleinsaurefragmenten Signaturen zuzuordnen, die die Nachteile des Standes der Technik nicht aufweisen. Die erfindungsgemäße Aufgabe wird gelöst durch ein Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte:
(a) Bereitstellung einer Mischung von Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende
Restriktionsendonuklease aufweisen,
(b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt, (c) Identifikation jeweils eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt.
Des weiteren wird die erfindungsgemäße Aufgabe gelöst durch ein Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte:
(a) Bereitstellung einer Mischung von Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease aufweisen, (b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt und welche überhängende Enden bekannter Position und Länge, aber unbekannter Sequenz erzeugt,
(c) Identifikation jeweils eines oder mehrerer Nukleotide der überhängenden Enden der geschnittenen Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt.
Bei der Mischung von Nukleinsaurefragmenten handelt es sich bevorzugt um, gegebenenfalls amplifizierte, Restriktionsfragmente von cDNA oder genomischer DNA. Die Fragmente oder ein Teil der Fragmente können von allen oder einigen Fragmenten gemeinsamen Sequenzbereichen flankiert werden. Bei diesen gemeinsamen Sequenzbereichen kann es sich beispielsweise um an die Fragmente angefügte Linker oder Adapter handeln, also doppelsträngige Nukleinsaurefragmente, welche etwa durch Hybridisierung zweier zueinander im wesentlichen oder mindestens teilweise komplementärer Oligonukleotide leicht erhältlich sind. Typischerweise zeichnen sich Adapter durch eine Länge zwischen 5 und 200 Nukleotiden, bevorzugt zwischen 10 und 80 Nukleotiden, besonders bevorzugt zwischen 15 und 40 Nukleotiden aus. Vorzugsweise zeigen die Fragmente eine charakteristische Größenverteilung mit einer kleinsten vorkommenden Größe, einer größten vorkommenden Größe sowie einer Durchscnnittsgröße, wobei die Größe durch die Positionen und/oder die Häufigkeit der Erkennungsstelle oder Erkennungsstellen für die zur Fragmenterzeugung verwendete Restriktionsendonuklease oder Restriktionsendonukleasen beeinflußt oder bestimmt wird, wobei natürlich noch die Länge gegebenenfalls angefügter Linker bzw. Adapter berücksichtigt werden muß. In einer bevorzugten Ausführungsform wird eine Mischung aus Nukleinsaurefragmenten, vorzugsweise doppelsträngige cDNA, mit mindestens einer Restriktionsendonuklease geschnitten, welche vorzugsweise eine vierbasige Erkennungssequenz aufweist. Beispiele für geeignete Restriktionsendonukleasen sind Alul, Bfal, Bst I, Chal, Csp6l, Cv JI, Cv/JI, Dpnl, Dpnll, Haelll, Hhal, HwPlI, Hpall, HpyCm IV, HpyCIl4 V, Mbol, Msel, Mspl, Nlalll, Rsal, Sau3al, Tail, Taql, Tsp5091. Häufig werden an jeweils einem oder beiden Enden der so erhaltenen Fragmente Linkermoleküle - in der Regel über enzymatische Ligation - befestigt. Dies kann ohne Nachbehandlung der Fragmente geschehen, wenn Fragmentenden und Linkerenden zueinander kompatibel sind, also glatt sind oder zueinander komplementäre Überhänge aufweisen. Es ist aber auch möglich, die Fragmentenden nachzubehandeln, um Komplementarität zu erzielen. Beispielsweise können einzelsträngige Fragmentenden mittels einer Nuclease entfernt werden oder auch, im Falle von 5 '-Überhängen, mittels einer Polymerase aufgefüllt und somit in glatte Enden überführt werden, wenn die Befestigung von Linkern mit glatten Enden beabsichtigt ist. Ein anderes Beispiel für eine Nachbehandlung von Fragmentenden ist eine partielle Auffüllung, die eine, in der Regel unerwünschte, Ligation zweier Fragmentenden miteinander verhindern kann. Etwa kann ein durch Behandlung mit der Restriktionsendonuklease Sau3al erzeugter palindromischer und somit selbstkomplementärer Überhang der Sequenz 3'-CTAG-5' durch Behandlung mit einer Polymerase in Gegenwart von dGTP in einen nicht mehr selbstkomplementären Überhang der Sequenz 5'-TAG-3' überführt werden. An einem solchen Überhang ließen sich nunmehr ausschließlich Linker mit einem hierzu komplementären Überhang 5 '-ATC- 3 ' befestigen; eine Ligation zweier Fragmentenden miteinander wäre nicht mehr möglich. Nach Befestigung der Linker folgt gegebenenfalls zur Darstellung einer gewünschten Untergruppe von Fragmenten eine Amplifikation mit einem oder mehreren gegen die angefügten Linker gerichteten PCR-Primer oder mit einem oder mehreren gegen die angefügten Linker gerichteten PCR-Primer und zusätzlich einem PCR-Primer, welcher gegen eine terminale Region der ursprünglichen Nukleinsaurefragmente, vorzugsweise der Ausgangs-cDNA-Moleküle, gerichtet ist. Hierzu eignet sich beispielsweise diejenige Region, welche durch den zur cDNA-Synthese eingesetzten cDNA-Primer eingeführt wurde, oder eine Region, welche künstlich an das 5 '-Ende der zur cDNA-Synthese eingesetzten mRNA oder an das 3 '-Ende der Erststrang-cDNA angefügt wurde. Im ersten Fall werden „cDNA-interne" Fragmente amplifiziert, die also vor der Linkerbefestigung beidseitig durch Restriktionsschnitt erzeugte Enden aufwiesen, im zweiten Fall „terminale" Fragmente, die vor der Linkerbefestigung einseitig ein durch Restriktionsschnitt erzeugtes Ende aufwiesen und deren anderes Ende mit dem 3 '-Ende oder dem 5 '-Ende der ursprünglichen Nukleinsaurefragmente bzw. der Ausgangs-cDNA identisch ist. Als cDNA- Primer kommt bei dieser Ausfuhrungsform vorzugsweise ein Oligo-dT-Primer zur Anwendung, welcher an seinem 3'-Ende und/oder an seinem 5 '-Ende eine Extension um ein oder mehrere Nukleotide aufweisen kann, von denen mindestens einige kein „T" sind. Werden für die Fragmenterzeugung zwei oder mehr Restriktionsendonukleasen eingesetzt, welche unterschiedliche Enden erzeugen, so können im nachfolgenden Schritt verschiedene Linker eingesetzt werden, von denen sich ein Teil an einer Art von Enden und ein anderer Teil an einer anderen Art von Enden befestigen läßt. Sofern sich diese Linker nicht nur in ihren Enden und damit in ihrer Kompatibilität (d.h. ihrer Befestigbarkeit) zu den Fragmentenden, sondern auch in ihrer übrigen Sequenz voneinander unterscheiden, so können in einer nachfolgenden PCR-Amplifikation gezielt durch geeignete Wahl der Primer bestimmte Fragmente (diejenigen, an deren Linkersequenzen die gewählten Primer unter den eingestellten Amplifikationsbedingungen binden können) amplifiziert werden, während bestimmte andere Fragmente (diejenigen, an deren Linkersequenzen die gewählten Primer nicht binden können) unamplifiziert bleiben. Eine weitere Möglichkeit zur selektiven Amplifikation bestimmter Fragmente besteht im Einsatz invasiver, an ihrem 3 '-Ende gegenüber der allen Fragmenten gemeinsamen Linkersequenz um eine oder mehrere zusätzliche selektive Basen verlängerter Primer (siehe beispielsweise EP 0 743 367). Noch eine weitere Möglichkeit zur selektiven Isolation bzw. Amplifikation, welche im Zuge des erfindungsgemäßen Verfahrens zur Anwendung kommen kann, wird in der WO 94/01582 beschrieben.
Außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonukleasen sind solche Restriktionsendonukleasen, bei denen die die Enzymaktivität auslösende Teilsequenz (die Erkennungsstelle), bei welcher es sich meist um einen aus 4-8
Basenpaaren bestehenden Bereich doppelsträngiger DNA handelt und an welcher das Enzym an den DNA-Doppelstrang bindet, und die Schnittstelle, also der Bereich des DNA- Doppelstrangs, in dem das Zuckerphosphat-Rückgrat der DNA-Stränge hydrolytisch durchtrennt wird, auf mindestens einem der beiden den Doppelstrang bildenden Stränge gegeneinander versetzt liegen. Beispiele hierfür sind Typ IIs-Restriktionsendonukleasen wie etwa Fokl [Schneidecharakteristik GGATG(9/13): der „obere" Strang wird in 9 Basen Entfernung von der Erkennungsstelle GGATG, der „untere" Strang in 13 Basen Entfernung von der Erkennungsstelle geschnitten] oder Btsl [Schneidecharakteristik GCAGTG(2/0)] oder die Restriktionsendonuklease Bcgl [Schneidecharakteristik (10/12)CGANNNNNNTGC (12/10): beide Stränge werden jeweils einmal vor und einmal hinter der Erkennungsstelle geschnitten]. Weitere Beispiele sind die Restriktionsendonukleasen Aarl, Acelll, Alol, Alwϊ, Bael, Bbr7l, Bbsl, Bbvl, BceAΪ, Beeil, BciYl, BfuAl, Bmrl, Bpli, Bpml, BpuEl, Bsal, BsaXl, BscAl, BseMϊl, BseKI, Bsgl, BsmAl, BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, BstΕ5l, Cjel, CjeVl, Earl, Ecil, Eco57l, Eco57Ml, Fall, Faul, HaelV, Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil, PsrI, RleAl, Sapl, SfaNl, Sthl32l, Stsl, Taqll, TspOT I, TspGΨ I, 7YM 1 HI. Zur Durchführung des erfindungsgemäßen Verfahrens werden vorzugsweise solche Restriktionsendonukleasen eingesetzt, die einzelsträngige Überhänge erzeugen, wobei es sich sowohl um 3 '-Überhänge als auch um 5 '-Überhänge handeln kann. Sollen Restriktionsendonukleasen eingesetzt werden, welche glatte Enden erzeugen (z.B. Mlyl, Schneidecharakteristik GAGTC(5/5), oder SspO5 I, GGTGA(8/8)), so können die glatten Enden in einem zusätzlichen Schritt in überhängende Enden überführt werden. Dies kann beispielsweise durch Inkubation mit T4 DNA-Polymerase in Gegenwart eines ausgewählten Nukleotidtriphosphats geschehen; die Exonukleaseaktivität der T4 DNA- Polymerase baut dann einen der beiden Stränge in 3 '- '5 '-Richtung ab, bis das erste „gleichnamige" Nukleotid im Strang erreicht ist (also beispielsweise bis zum ersten „G", wenn das eingesetzte Nukleotidtriphosphat dGTP war; siehe Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons). Ein anderer Typ von außerhalb ihrer Erkennungsstelle schneidenden Restriktionsendonukleasen sind Enzyme, bei welchen die Erkennungsstelle durch eine Abfolge beliebiger oder weitgehend beliebiger Nukleotide unterbrochen ist. Beispiel hierfür sind Enyzme wie Xcml (Schneidecharakteristik CCANNNNN/NNNNTGG) oder S/ZI (Schneidecharakteristik GGCCNNNN/NGGCC). Ein weiterhin zu berücksichtigender Sonderfall außerhalb ihrer Erkennungsstelle schneidender Restriktionsendonukleasen sind sogenannte „nicking Endonukleasen", die lediglich einen Strang eines Nukleinsäuredoppelstrangs durchtrennen. Beispiele für solche Endonukleasen sind N.AlwI (GGATCNNN N) und N.BstNBI (GAGTCNNN/N), welche jeweils nur den Sinn-Strang an der mit „/" gekennzeichneten Position schneiden. Ist der Einsatz solcher Endonukleasen zur Durchführung des erfindungsgemäßen Verfahrens beabsichtigt, so muß dafür Sorge getragen werden, daß die betreffenden Fragmente nach erfolgtem Schnitt in Fragmente überführt werden, welche einen einzelsträngigen Überhang aufweisen. Dies kann beispielsweise durch eine von folgenden zwei Maßnahmen geschehen: (1) „Abschmelzen" eines kurzen, an die Schnittstelle grenzenden Einzelstrangs durch alkalische oder Hitzedenaturierung, wobei das restliche Fragment doppelsträngig bleiben soll, (2) Inkubation mit einer weiteren Restriktionsendonuklease, welche auch den Gegenstrang zum mittels der „nicking Endonuklease" geschnittenen (oder noch zu schneidenden) Strang schneiden kann.
Die in den Nukleinsaurefragmenten aus der Fragmentmischung in (a) auftretende Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease befindet sich vorzugsweise innerhalb der vielen oder allen Fragmenten der Mischung gemeinsamen endständigen Sequenzbereiche, so insbesondere in den Sequenzbereichen der an die Fragmente angefügten Adapter oder Linker. Hierbei sind die Auswahl des Enzyms und die Position der Erkennungsstelle derart zu wählen, daß bei Einwirkung der Restriktionsendonuklease oder Restriktionsendonukleasen ein „proximaler" Schnitt erfolgt und das jeweilige Nukleinsäurefragment im fragmentspezifischen Bereich geschnitten wird, welcher sich außerhalb der allen oder vielen Fragmenten gemeinsamen, flankierenden Linker-Bereiche befindet. In einer besonders bevorzugten Ausführungsform sind gegebenenfalls bei einzelnen Fragmenten vorhandene Erkennungsstellen für die einzusetzenden Restriktionsendonukleasen, welche außerhalb der allen oder vielen Fragmenten gemeinsamen, flankierenden Linker-Bereiche liegen, gegen eine Erkennung durch die entsprechende Restriktionsendonuklease geschützt. Ein solcher Schutz von bestimmten Erkennungsstellen für bestimmte Restriktionsendonukleasen kann nach dem Stand der Technik beispielsweise durch Einbau methylierter Nukleotide wie etwa Methyl-dCTP erreicht werden. Alternativ kann ein Schutz gegen restriktionsendonukleolytische Spaltung auch durch Einsatz einer zur ausgewählten Restriktionsendonuklease gehörigen Methylase erfolgen. Beispielsweise überführt das Enzym BamRl Methylase Erkennungsstellen der Restriktionsendonuklease BamHl in ihre C-methylierte Form, welche von BamΑl nicht mehr erkannt und geschnitten wird. Das Enzym CpG Methylase methyliert CG-Dinukleotide, wodurch beispielsweise ein Schnitt eines DNA-Fragments enthaltend die Sequenz CGTCTC mit der Restriktionsendonuklease BsmBl (Schneidecharakteristik CGTCTC(l/5)) verhindert wird. Jedenfalls stellen obige Maßnahmen sicher, daß jedes in der Mischung vorhandene Nukleinsäurefragment im Zuge eines Restriktionsdaus lediglich an genau einer vorbestimmten Position geschnitten wird. Weiterhin wäre es möglich, die zur Erzeugung der Nukleinsaurefragmente aus (a) eingesetzten Ausgangs-Nukleinsäuremoleküle (vorzugsweise cDNA oder genomische DNA) vorab mit der Restriktionsendonuklease aus Schritt (b) zu inkubieren, sodann wie oben beschrieben mit mindestens einer weiteren, in der Regel häufig schneidenden Restriktionsendonuklease zu behandeln, an den mit letzterer erzeugten Enden Linkermoleküle zu befestigen und eine PCR-Amplifikation mit Primern vorzunehmen, welche gegen die endständigen Linkermoleküle gerichtet sind. Diese Vorgehensweise stellt sicher, daß die Nukleinsaurefragmente in Schritt (b) ausschließlich an den gewünschten, durch die angefügten Linker determinierten Stellen geschnitten werden, da Fragmente mit einer "eigenen", fragmentinternen Erkennungsstelle für besagte Restriktionsendonuklease nach erfolgtem Schnitt nicht mehr amplifiziert werden können und somit in der Fragmentmischung gemäß (a) nicht auftreten.
Die Identifikation jeweils eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente kann auf mehrere verschiedene Weisen erfolgen. Insbesondere eignen sich hierfür drei bevorzugte Vorgehensweisen, wodurch weitere Vorgehensweisen jedoch nicht ausgeschlossen werden sollen:
1. Verlängerung zurückversetzter 3 '-Enden mit zur heute üblichen Sequenzierung nach Sanger verwendeten Didesoxynukleotid-Triphosphaten („ddNTPs") oder auch mit acyclischen Nukleotiden (also mit sogenannten „Abbruchnukleotiden" oder „Kettenterminatoren"), wobei jeder auffüllbare Strang um genau ein Nukleotid verlängert wird und die Kettenverlängerung hiernach abbricht, da keine freie 3'- OH-Gruppe mehr vorliegt. Da der Einbau sequenzspezifisch erfolgt, ist so das dem eingebauten Nukleotid im Doppelstrang gegenüberliegende Nukleotid eindeutig identifizierbar. Bevorzugterweise tragen die Abbruchnukleotide Markierungsgruppen, anhand derer ein Einbau nachweisbar ist. In einer besonders bevorzugten Ausführungsform tragen die vier Didesoxynukleotide vier unterscheidbare Markierungsgruppen, insbesondere vier verschiedene Fluorophore. Es ist dann anhand der Fluoreszenzaktivität erkennbar, welches der vier
Abbruchnukleotide eingebaut wurde und dementsprechend auch, welches Nukleotid auf dem jeweiligen Gegenstrang vorliegt. Die Durchführung dieser ersten Ausführungsform setzt natürlich voraus, daß die Nukleinsaurefragmente aus (c) zurückversetzte und daher mittels einer Polymerase auffüllbare 3 '-Enden aufweisen. Dies kann leicht durch geeignete Wahl der Restriktionsendonuklease aus (b) gewährleistet werden. Geeignet sind insbesondere folgende TypIIs- Restriktionsendonukleasen: Aarl, Acelll, Alwl, Bbr7l, Bbsl, Bbvl, BceAl, Bce , BfuAl, Bsal, BscAl, BsmAl, BsmBl, BsmΕl, BspMl, Earl, Faul, Fokl, Hgä , Plel, Sapl, SfaNl, SM321, Stsl. Befestigung von Adaptern mit überhängenden Enden geeigneter Länge und geeigneter Sorte (3 '-Überhang oder 5 '-Überhang) an ein überhängendes Ende aufweisenden Fragmenten, wobei die Befestigung sequenzspezifisch erfolgt. Die überhängenden Fragmentenden können insbesondere mittels einer der folgenden Restriktionsendonukleasen erzeugt worden sein: Aarl, Acelll, Alol, Alwl, Bael, Bbr7l, Bbsl, Bbvl, BceAl, Bcett, Bcgl, BciVl, BfuAl, Bmrl, BpR, Bpml, BpuEl,
Bsal, BsaXl, BscAl, BseMll, BseRl, Bsgl, BsmAl, BsmBl, BsmFl, Bsp24l, BspCN I, BspMl, BsrOl, BstF5l, Btsl, Cjel, CjeYl, Earl, Ecil, Eco57l, Eco57Ml, Fall, Faul, Fokl, HaeYV, Hgal, HinAl, Hphl, Mboll, Mmel, Mnll, Plel, Ppil, Psrl, RleAl, Sapl, SfaNl, SM321, Stsl, Taqll, Tsp Υ I, TspGΨ I, 7ΪA111II. Vorzugsweise werden in der Befestigungsreaktion mehrere Adapter (sogenannte
Sequenzieradapter) eingesetzt, welche sich in ihrem Überhang unterscheiden. Dabei ist selbstverständlich auch eine sequenzielle oder eine parallele Vorgehensweise denkbar, bei der in separaten Befestigungsreaktionen verschiedene Adapter eingesetzt werden. Besonders bevorzugt ist der Einsatz von Markierungsgruppen tragenden Adaptern, welche sich sowohl in ihrem Überhang als auch in ihrer Markierungsgruppe unterscheiden. In einer Ausführungsform handelt es sich bei den Markierungsgruppen um Fluorophore, so daß anhand der Fluoreszenzaktivität der Befestigungsprodukte erkennbar ist, welcher Adapter an einem gegebenen Fragmentende befestigt worden ist. Zur Ermittlung der Identität der ein einbasiges überhängendes Ende bildenden Base eines Fragments in einer
Mischung können beispielsweise Adapter der allgemeinen Struktur
F-Adapter-X
zur Anwendung kommen, wobei Adapter den doppelsträngigen Anteil des Adapters meint, X eines der vier möglichen Nukleotide in Form eines einzelsträngigen Überhangs darstellt und F ein Fluorophor meint, welches die überhängende Base X kennzeichnet. So könnte folgende Zuordnung getroffen werden:
Figure imgf000012_0001
Somit läßt sich beispielsweise von einem bei der Auftrennung der Befestigungsprodukte mittels eines automatischen Nukleinsäure- Sequenzierungsgeräts erhaltenen ROX-Signal ableiten, daß an einem bestimmten Fragment der ein überhängendes G aufweisende Adapter befestigt wurde und daß es sich demnach bei der überhängenden Base des betreffenden Fragments um ein C gehandelt hatte.
Zur Identifikation von mehrbasigen Fragmentüberhängen wird meist „nukleotidweise" vorgegangen, für einen zweibasigen Überhang also folgendermaßen: Es werden in separaten Ansätzen zwei Adapter eingesetzt, welche folgende allgemeine Struktur aufweisen:
(1) F-Adapter-NXj zur Identifikation des ersten Nukleotids bzw.
(2) F-Adapter-X2N zur Identifikation des zweiten Nukleotids,
wobei N eine Mischung aller vier möglichen Nukleotide oder auch ein universelles Nukleotid wie etwa Inosin darstellt. In einem ersten Ansatz würde dann durch Befestigung des ersten Adapters das erste Nukleotid des zweibasigen Fragmentüberhangs, in einem zweiten Ansatz durch Befestigung des zweiten Adapters das zweite Nukleotid des zweibasigen Fragmentüberhangs ermittelt werden. Wiederum ist bevorzugt, daß wie oben beschrieben eine eindeutige und bekannte Beziehung zwischen der Natur des Fluorophors F und dem der Sequenzierung dienenden spezifischen Nukleotid X, oder X2 besteht. Durch Identifikation desjenigen ersten und zweiten Adapters, welcher (in der Regel in zwei parallelen Ansätzen, wobei in einem Ansatz die Natur der ersten Base des Überhangs und im zweiten Ansatz die Natur der zweiten Base des Überhangs bestimmt wird) am überhängenden Ende befestigt wurde, läßt sich die Sequenz des überhängenden Endes bestimmen.
In doppelsträngiger Darstellung erfolgt die Sequenzierung eines zweibasigen 3'- Überhangs Y1Y2 eines Fragments beispielsweise gemäß folgendem Schema:
Fragment Y2Yi -Fragment
+ F-Adapter-NXi F-Adapter-X2N Adapter Adapter
Figure imgf000013_0001
F-Adapter-N X\ -Fragment F-Adapter-X2 N -Fragment
Adapter- Y2Yt -Fragment Adapter- Y2 Yi -Fragment
uenz des Überhangs Yi Y2 kann dann folgender Tabelle entnommen werden:
Figure imgf000014_0001
Sinngemäß lassen sich so selbstverständlich auch Überhänge einer Länge von mehr als zwei Nukleotiden, also beispielsweise von drei oder vier Nukleotiden, sequenzieren. Weiterhin ist es möglich, zur Identifikation von mehr als einer Base der erzeugten Überhänge innerhalb eines einzigen Experiments, Markierungsgruppen einzusetzen, welche den simultanen Nachweis von mehr als vier (nämlich in der Regel einem ganzzahligen Vielfachen von vier) verschiedenen Markierungen zulassen. In diesem Fall könnten die ersten vier der verschiedenen Markierungen zur Identifikation einer ersten Base erzeugter Fragmentüberhänge eingesetzt werden, die zweiten vier der verschiedenen Markierungen zur Identifikation einer zweiten Base der erzeugten Fragmentüberhänge, und gegebenenfalls weitere Sätze von je vier verschiedenen Markierungen für weitere Basen der erzeugten Fragmentüberhänge. Ein derartiges „Multiplexing" hätte eine Reduktion der Anzahl erforderlicher experimenteller Schritte zur Folge. Als Markierungsgruppen, von denen zahlreiche verschiedene in einer gemeinsamen Messung detektiert werden können, ohne daß die Messergebnisse sich gegenseitig beeinflussen, kämen beispielsweise sogenannte „Quantum Dots" in Frage (Han et al., Nat. Biotechnol. 19, 631-5 [2001]). Extension selektiver Oligonukleotidprimer, deren am 3 '-Ende gelegenes Nukleotid oder Nukleotide mit dem oder den zu sequenzierenden Nukleotiden des Gegenstrangs hybridisieren können, gefolgt von der Identifikation derjenigen Primer, welche in der Extensionsreaktion verlängert wurden. Gegebenenfalls kann die Extension mittels der Polymerasekettenreaktion (PCR) erfolgen.
Bevorzugterweise werden an den Enden der zu sequenzierenden Nukleinsaurefragmente zunächst Linker bzw. Adapter befestigt, welche als allen oder vielen Fragmenten gemeinsame Primerbindungsstelle dienen können. Die Oligonukleotidprimer werden dann derart ausgestaltet, daß sie nach Denaturierung der zu sequenzierenden Nukleinsaurefragmente mit dem am 3 '-Ende der
Nukleinsäurefragmentstränge befestigten Linkerstrang hybridisieren können. Hierbei ist dafür Sorge zu tragen, daß die dergestalt hybridisierten Oligonukleotidprimer um ein oder mehrere Nukleotide mit dem an die Linkerregion angrenzenden Bereich des Nukleinsäurefragments „überlappen", also an ihrem 3 '-Ende Nukleotide aufweisen, welche mit den Nukleotiden des
Nukleinsäurefragments hybridisieren können, sofern eine Komplementarität gegeben ist. Es handelt sich also um „selektive Nukleotide", die eine Verlängerung des Primers mittels einer Polymerase zulassen, wenn sie durch besagte Hybridisierung Bestandteil eines Doppelstrangs geworden sind, die die Verlängerung des Primers aber mindestens weitgehend verhindern, wenn sie keine
Basenpaarung mit dem Gegenstrang ausbilden konnten.
Beispielsweise läßt sich in folgender Situation, in welcher der selektive Primer 5'-YYYYYYYYYN-3' an die Linkerregion XXXXXXXX des Fragments der Sequenz 5 -OOOOOOOOOOOOOOOOOOOOOOOMXXXXXXXX-3 ' hybridisiert vorliegt, eine effiziente Extension des hybridisierten Primers nur dann erreichen, wenn die selektive Base N des Primers komplementär ist zur letzten fragmentspezifϊschen Base M:
5 '- YYYYYYYYYN
3 -XXXXXXXXXMOOOOOOOOOOOOOOOOOOOOOOO-5 ' Die für mehrere oder alle Nukleinsaurefragmente simultane Identifikation jeweils eines oder mehrerer Nukleotide erfolgt vorzugsweise nach Auftrennung der in der Mischung enthaltenen Nukleinsaurefragmente nach einer fragmentspezifischen Eigenschaft, insbesondere nach Größe und/oder Mobilität der Fragmente durch elektrophoretische Auftrennung. Besonders bevorzugt ist das Verfahren der Gelelektrophorese, bei der zur Auftrennung Flachgele oder gelgefüllte Kapillaren verwendet werden. In einer bevorzugten Ausführungsform werden in Schritt (c) enzymatische Umsetzungen gemäß Varianten 1-3 derart durchgeführt, daß in parallelen Ansätzen jeweils ein oder jeweils zwei Nukleotide der Fragmente identifiziert werden, wobei die in den parallelen Ansätzen zu identifizierenden Nukleotide der Fragmente in definierter Position zueinander, beispielsweise zueinander benachbart, liegen. Es werden dann zunächst in parallelen Auftrennungen der besagten Ansätze für jedes der aufgetrennten Fragmente ein oder zwei Nukleotide bekannter Position ermittelt, was vorzugsweise mittels verschiedener Markierungsgruppen geschieht, welche Aufschluß über die zu ermittelnden Nukleotide erlauben. In einem weiteren Schritt werden dann für einzelne oder alle der aufgetrennten Fragmente die ermittelten Nukleotide in diejenige Reihenfolge gebracht, in der sie auf dem zugehörigen Ausgangs-Fragment aus der Mischung von Nukleinsaurefragmenten vorliegen. Dabei kann die Reihenfolge dieser beiden Maßnahmen natürlich auch vertauscht werden. Jedenfalls werden auf diese Weise für die untersuchten Fragmente Signaturen in Form kurzer Sequenzabschnitte erzeugt, welche das zugehörige Fragment charakterisieren. Die Länge dieser Sequenzabschnitte beträgt vorzugsweise mindestens 14 Basen, stärker bevorzugt mindestens 16 Basen, insbesondere mindestens 20 Basen. Neben einem oder mehreren Sequenzabschnitten kann eine Signatur auch andere ein Fragment kennzeichnende Informationen enthalten, beispielsweise genaue oder ungefähre Distanzen (angegeben in Basenpaaren) zwischen charakteristischen Bereichen des Fragments, beispielsweise den unter Zuhilfenahme eines internen Längenstandards anhand der elektrophoretischen Mobilität geschätzten Abstand zwischen zwei bekannten Sequenzabschnitten, zwischen einem bekannten Sequenzabschnitt und einem Fragmentende, oder zwischen beiden Fragmentenden. In diesem Fall beträgt die Länge der Sequenzabschnitte vorzugsweise mindestens 10 Basen. Jedenfalls ist der Informationsgehalt einer Signatur vorzugsweise groß genug, um die eindeutige Identifikation und/oder Isolation des zugehörigen Fragments zu erlauben. Beispielsweise reichen erfahrungsgemäß ca. 14-20 Basenpaare Sequenzinformation ohne zusätzliche Information über Distanzen innerhalb des betreffenden Fragments meist aus, um ein diesen Sequenzabschnitt enthaltenes Transkript aus einer Mischung von cDNA- Molekülen zu erkennen und das zugehörige Gen zu identifizieren. Diese Tatsache nutzen beispielsweise Verfahren der „tαg-Sequenzierung" wie SAGE (Velculescu et al., Science 270: 484-487 [1995], WO 00/53806) oder MPSS (Brenner et al., Nature Biotechnol. 18: 630-634 [2000]) aus. Hierbei ist zu beachten, daß die Länge einer Teilsequenz für eine eindeutige Identifikation eines Transkripts im Transkriptom meist länger sein muß als der theoretischen Mindestlänge entspricht, da die Nukleotidsequenz in Genomen nicht rein zufallig ist und bestimmte Nukleotidsequenzen bevorzugt werden. Dementsprechend würde man mit einer aus einer Folge von 8 Nukleotiden bestehenden Signatur, die theoretisch für 48 = 65.536 verschiedene Transkripte codieren könnte, in der Praxis zahlreiche verschiedene menschliche cDNAs identifizieren, die sich alle durch besagte Signatur auszeichnen. Dem steht die derzeit geschätzte Zahl von lediglich ca. 30.000- 40.000 Genen beim Menschen gegenüber. Um also Eindeutigkeit zu gewährleisten, muß der Informationsgehalt einer Signatur hinreichend über dem theoretischen Minimum liegen. Dabei kann der Informationsgehalt einer ein Fragment kennzeichnenden Signatur unter anderem durch folgende Angaben erhöht werden:
1. längere Sequenz,
2. Information über tatsächliche oder ungefähre Länge auch von Bereichen des Fragments, deren Sequenz unbekannt ist,
3. Vorauswahl möglicher Identitäten.
Bei der Vorauswahl möglicher Identitäten wird durch eine Zusatzaussage über das zu identifizierende Fragment oder der in Frage kommenden zugehörigen Transkripte oder Gene die Zahl bzw. die Wahrscheinlichkeit möglicher Fehlzuordnungen reduziert. Eine Zusatzaussage über das zu identifizierende Fragment könnte beispielsweise sein „mittels der Restriktionsendonuklease Rsal erzeugtes 3 '-Fragment doppelsträngiger cDNA", wodurch die Identität des Sequenzanteils einer Signatur mit einem in 5 '→3 '-Richtung gesehen „oberhalb" (upstream) bzw. „vor" der am meisten zum 3 '-Ende des Fragments hin gelegenen Ryαl-Erkennungsstelle gelegenen Sequenzbereich eines Transkripts als nicht signifikant erkannt würde. Weiterhin würden auch Signaturen, deren Sequenzanteil in falscher Orientierung hinsichtlich der 5 '-3 '-Vorzugsrichtung einer mRNA-Sequenz bzw. der von ihr abgeleiteten cDNA-Sequenz vorliegt, als nicht signifikant erkannt. Auch hier geht also als Zusatzinformation ein, auf welche molekularbiologische Vorgehensweise die Signaturen erzeugt wurden, was ein Auftreten bestimmter Teilsequenzen als Signatur bzw. Bestandteil einer Signatur ausschließt. Eine Zusatzaussage über in Frage kommende Gene könnte beispielsweise sein „aus der Gesamtheit aller im Blatt exprimierten Gene", wenn mittels erzeugter pflanzlicher Signaturen Transkripte aus Blattproben identifiziert werden sollen, beispielsweise aber Gene, die ausschließlich in der Wurzel exprimiert werden, keine Berücksichtigung erfahren sollen. In einer bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens zur Analyse von Nukleinsaurefragmenten erfolgt die simultane Identifikation eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente in Schritt c) über die folgenden Einzelschritte: ca) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cb) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cc) gegebenenfalls Wiederholung von Schritt (cb), bis die gewünschte Anzahl von
Nukleotiden identifiziert worden ist, cd) Zusammenfassung der in den Schritten (ca) bis (cc) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, wobei die Nukleotididentifikation in den Schritten ca) bis cc) gegebenenfalls auch die Auftrennung der Nukleinsaurefragmente der Mischung mit umfaßt.
In einer weiteren bevorzugten Ausführungsform wird mindestens eine Teilmenge der in Schritt a) bereitgestellten Mischung von Nukleinsaurefragmenten den folgenden Verfahrensschritten aa) bis ad) unterworfen:
aa) Auftrennung der Mischung von Nukleinsäure-Fragmenten nach mindestens einer fragmentspezifischen Eigenschaft, ab) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der aufgetrennten Mischung, ac) gegebenenfalls Vergleich der in (aa) und/oder (ab) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsäure-Fragmenten gemäß Schritt (a), ad) gegebenenfalls Registrierung von in (ab) und/oder (ac) detektierten Nukleinsäure- Fragmenten, welche in verschiedenen Mischungen von Nukleinsäure-Fragmenten in unterschiedlicher relativer Häufigkeit auftreten^
während eine Fragmentmischung ausgewählt aus der Gruppe I) bis III) nach den Schritten b) und c) behandelt werden, wobei I) eine weitere Teilmenge der in Schritt a) bereitgestellten Mischung von Nukleinsaurefragmenten,
II) eine Teilmenge der in Schritt a) bereitgestellten Mischung von Nukleinsaurefragmenten, die zuvor nach mindestens einer fragmentspezifischen Eigenschaft aufgetrennt worden ist, III) eine mit I) oder II) zumindest zum Teil identische Mischung von Nukleinsaurefragmenten, ist.
Es ist weiterhin bevorzugt, daß in einem der vorstehenden erfindungsgemäßen Verfahren in einem zusätzlichen Verfahrensschritt mindestens ein interessierendes Fragment einer der Gruppen (I) bis (III) gewonnen wird.
Die interessierenden Fragmente werden hierbei vorzugsweise durch spezifische PCR- Amplifikation aus einem Gemisch von Nukleinsaurefragmenten gewonnen, bei der fragmentspezifische Oligonukleotidprimer eingesetzt werden, welche durch die in Schritt (cd) ermittelten Signaturen zugänglich und herstellbar sind.
Eine weitere bevorzugte Ausführungsform betrifft eines der vorstehenden erfindungsgemäßen Verfahren, bei dem eine Mischung aus Nukleinsaurefragmenten gemäß Schritt a) oder eine Teilmenge dieser Mischung aus Nukleinsaurefragmenten gemäß Schritt a) bereitgestellt wird, die durch die folgenden Schritte hergestellt wurde: i) beidseitige Flankierung der Restriktionsfragmente der Mischung mit identischen oder verschiedenen Adaptern ii) Hybridisierung der Fragmente aus Schritt (i) mit jeweils unterschiedlichen Primern, die alle zu den Adaptern aus Schritt (i) komplementäre Bereiche aufweisen und die an ihrem 3 '-Ende jeweilig ein oder mehrere Nukleotide aufweisen, welche nach
Hybridisierung des Primers mit seiner Zielsequenz über den zum Adapter komplementären Bereich hinausragen und komplementär zu den ihnen im Doppelstrang gegenüberliegenden Nukleotiden einer Teilmenge der Fragmente aus der Nukleinsäuremischung aus (a) sind. iii) sequenzspezifische Extension der Primer aus ii) und gegebenenfalls anschließende PCR-Amplifikation der Nukleinsaurefragmente aus der Fragmentmischung, die in Schritt ii) sequenzspezifisch verlängert worden waren.
Sequenzspezifische Extension bzw. Verlängerung heißt, daß nur oder zumindest vorrangig diejenigen Primer verlängert werden, deren am 3 '-Ende befindliches Nukleotid oder Nukleotide gemäß Schritt ii) komplementär zu den ihnen gegenüberliegenden Nukleotiden desjenigen Fragments ist oder sind, mit welchem sie unter Hybridisierung einen Nukleinsäure-Doppelstrang gebildet haben.
In einer besonders bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird ein Verfahren zur Genexpressionsanalyse bereitgestellt, umfassend die folgenden Schritte:
al) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, insbesondere mindestens einer Mischung von cDNA-Fragmenten, bl) Auftrennung der Mischung von Nukleinsäure-Fragmenten nach mindestens einer fragmentspezifischen Eigenschaft, cl) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der aufgetrennten Mischung, dl) gegebenenfalls Vergleich der in (bl) und/oder (cl) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsäure-Fragmenten aus (al), el) gegebenenfalls Registrierung von in (dl) detektierten Nukleinsäure-Fragmenten, welche in verschiedenen Mischungen von Nukleinsäure-Fragmenten in unterschiedlicher relativer Häufigkeit auftreten, fl) Inkubation einer Mischung von Nukleinsaurefragmenten, ausgewählt aus der Gruppe I: eine Teilmenge der Mischung aus (al), der Gruppe II: die in (bl) aufgetrennte Mischung von cDNA-Fragmenten oder ein Teil hiervon, der Gruppe III: eine mit der Mischung aus (al) oder der aufgetrennten Mischung aus (bl) mindestens teilweise identische Mischung von Nukleinsaurefragmenten, jedoch zusätzlich aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, mit der oder den außerhalb ihrer Erkennungsstelle schneidenden Restriktionsendonuklease oder Restriktionsendonukleasen, gl) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, hl) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, il) gegebenenfalls Wiederholung von Schritt (hl), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, j l) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (fl) bis (il), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart verändert wurde, daß die Wiederholung oder Wiederholungen jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlauben, kl) Zusammenfassung der in den Schritten (gl) bis (j l) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann,
11) gegebenenfalls Gewinnung interessierender Fragmente aus der Mischung von Nukleinsäure-Fragmenten aus (al) oder (bl), wobei die interessierenden Fragmente die in (e) registrierten Fragmente sein können, ml) gegebenenfalls Identifikation der zu den interessierenden Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels
Durchsuchen elektronischer Datenbanken, wobei die interessierenden Fragmente die in (e) registrierten Fragmente sein können. Bei der Wiederholung der Schritte (fl) bis (i) wird durch Veränderung von Position und/oder Sequenz der Erkennungsstelle dafür gesorgt, daß andere als die bisher untersuchten Nukleotidpositionen der zu analysierenden Fragmente in einzelsträngige Überhänge überführt werden und somit weitere, zuvor noch nicht identifizierte Nukleotide identifiziert werden können. Hierbei ist neben einer sequentiellen Vorgehensweise selbstverständlich auch ein gleichzeitiges Vorgehen in Parallelansätzen möglich. In einer bevorzugten Vorgehensweise wird folgendermaßen vorgegangen: Es wird mindestens eine Fragmentmischung bereitgestellt, in welcher viele oder alle Fragmente identische Enden aufweisen, beispielsweise glatte Enden oder überhängende Enden gleicher Länge und Sequenz. Diese Mischung wird aliquotiert, beispielsweise in 10 im wesentlichen gleichgroße Aliquots. Jede der Mischungen wird mit einem aus einer Auswahl verschiedener Adapter (hier also einem von 10 verschiedenen Adaptern) versetzt und Ligationsbedingungen ausgesetzt, wobei sich alle Adapter durch ein zu den Fragmentenden kompatibles, also hieran befestigbares, Ende auszeichnet. Weiterhin weisen alle Adapter mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungssequenz schneidende Restriktionsendonuklease, beispielsweise Mmel, auf. Dabei unterscheiden sich die Adapter durch die Entfernung der Erkennungssequenz von dem an den Fragmentenden zu befestigenden Adapterende voneinander. In einer besonders bevorzugten Ausführungsform unterscheiden sich zwei verschiedene Adapter in dieser Entfernung um ein ganzzahliges Vielfaches der Länge der überhängenden Enden, welche von besagter außerhalb ihrer Erkennungssequenz schneidenden Restriktionsendonuklease erzeugt werden können. Im Beispiel der Restriktionsendonuklease Mmel (Schneidecharakteristik TCCRAC(20/18)) beträgt die Distanz dementsprechend in manchen Adaptern 18 bp, in anderen Adaptern 16 bp, in den übrigen Adaptern 14 bp, 12 bp, 10 bp, 8 bp, 6 bp, 4 bp, 2 bp oder 0 bp. Werden nun alle 10 Adapterbefestigungsprodukte einer Inkubation mit der Restriktionsendonuklease, hier Mmel, ausgesetzt, so sind im Fall der ersten Reaktion die Basen 19 und 20, in der zweiten Reaktion die Basen 17 und 18, in den übrigen Reaktionen die Basen 15 und 16, 13 und 14, 11 und 12, 9 und 10, 7 und 8, 5 und 6, 3 und 4 bzw. 1 und 2 in Form eines einzelsträngigen Überhangs freigelegt. Somit erlaubt der vollständige Satz aller 10 Reaktionen die Identifikation einer zusammenhängenden, 20 Basen langen Teilsequenz bzw. Signatur für die in der Fragmentmischung vorhandenen Fragmente. Außer einer Veränderung der Position einer Schnittstelle wäre es natürlich ebenso denkbar, an ein und derselben Position verschiedener Adapter Erkennungsstellen für in verschiedener Distanz von ihren Erkennungsstellen schneidenden Restriktionsendonukleasen bereitzustellen. So könnte beispielsweise ein Adapter an seinem an den Fragmentenden zu befestigenden Ende eine Erkennungsstelle für Earl (Schneidecharakteristik CTCTTC(l/4)), ein zweiter Adapter an gleicher Position eine Erkennungsstelle für SfaNl (Schneidecharakteristik GCATC (5/9)) und ein dritter Adapter an gleicher Position eine Erkennungsstelle für Stsl (Schneidecharakteristik GGATG (10/14)) aufweisen, wodurch sich mittels des erfindungsgemäßen Verfahrens 13 Basen lange Teilsequenzen der Fragmente identifizieren ließen. Selbstverständlich ist eine Kombination beider Vorgehensweisen (Veränderung von Position und Sequenz) ebenso denkbar.
In einer weiteren besonders bevorzugten Ausführungsform des erfindungsgemäßen Verfahrens wird ein Verfahren zur Genexpressionsanalyse bereitgestellt, umfassend die folgenden Schritte:
a2) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, insbesondere einer Mischung von cDNA-Fragmenten, aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, welche auf an Ausgangs-Fragmente angefügten Linkern liegt, b2) Inkubation der Mischung von Nukleinsaurefragmenten aus (a2) mit der Restriktionsendonuklease oder den Restriktionsendonukleasen aus Schritt (a2), c2) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente der Mischung sowie unter Auftrennung der Mischung geschnittener und auf zur
Identifikation des Nukleotids geeignete Weise behandelter Nukleinsäure-Fragmente nach mindestens einer fragmentspezifischen Eigenschaft erfolgt, d2) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2) gemäß (c2), e2) gegebenenfalls Wiederholung von Schritt (d2), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, f2) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (a2) bis (e2), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart verändert wurde, daß die Wiederholung oder Wiederholungen jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlauben, g2) Zusammenfassung der in den Schritten (c2) bis (f2) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, h2) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft in (c2) erhaltenen fragmentspezifischen Informationen zu den in (g2) für die Nukleinsäure-Fragmente erhaltenen Signaturen, wobei die fragmentspezifischen
Informationen im Fall einer elektrophoretischen Auftrennung der Fragmente die relative oder absolute Mobilität der Fragmente und/oder die anhand eines Längenstandards ermittelte scheinbare oder tatsächliche Fragmentlänge umfassen und wobei die Zuordnung in tabellarischer und/oder computerlesbarer Form erfolgen kann, i2) gegebenenfalls Identifikation der zu den Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels Durchsuchen elektronischer Datenbanken nach den Signaturen aus (g2), j2) gegebenenfalls Bereitstellung mindestens einer weiteren Mischung von Nukleinsäure- Fragmenten, insbesondere einer Mischung von cDNA-Fragmenten, gewonnen auf analoge Weise zu der Mischung von Nukleinsäure-Fragmenten aus (a2), wobei hier auf die Anfügung von Linkern aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease verzichtet werden kann, k2) Auftrennung der Mischung oder Mischungen von Nukleinsäure-Fragmenten aus (i2) nach einer fragmentspezifischen Eigenschaft im wesentlichen unter den Bedingungen der Auftrennung in (c2),
12) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft in (k2) erhaltenen fragmentspezifischen Informationen zu den einzelnen aufgetrennten Fragmenten, wobei die fragmentspezifischen Informationen relative oder absolute Häufigkeit der einzelnen Fragmente sowie im Fall einer elektrophoretischen
Auftrennung der Fragmente die relative oder absolute Mobilität der Fragmente und oder die anhand eines Längenstandards ermittelte scheinbare oder tatsächliche Fragmentlänge umfassen kann und wobei die Zuordnung in tabellarischer und/oder computerlesbarer Form erfolgen kann, m2) gegebenenfalls Vergleich der relativen oder absoluten Häufigkeiten mindestens eines Teils der in (k2) aufgetrennten Fragmente mit den relativen oder absoluten Häufigkeiten der jeweils homologen, also ganz oder im wesentlichen sequenzidentischen, aus verschiedenen Mischungen von Nukleinsäure-Fragmenten stammenden Fragmente, n2) gegebenenfalls Registrierung derjenigen Fragmente, deren relative oder absolute Häufigkeit sich von der relativen oder absoluten Häufigkeit ihrer homologen Fragmente anderer Mischungen von Nukleinsäure-Fragmenten um mindestens einen vorgewählten Faktor unterscheiden, o2) gegebenenfalls Zuordnung der in (n2) registrierten Fragmente zu denjenigen Genen bzw. Transkripten, von denen sich besagte Fragmente herleiten, unter Verwendung der in Schritt (h2) erhaltenen Ergebnisse, p2) gegebenenfalls Gewinnung der in (n2) registrierten Fragmente aus der Mischung von Nukleinsäure-Fragmenten aus (a2) oder (i2) und/oder (j2),
wobei die Schritte (i2) bis (n2) auch vor den Schritten (a2) bis (h2) durchgeführt werden können.
Die Erzeugung von Mischungen von Nukleinsäure-Fragmenten, vorzugsweise von Mischungen von cDNA-Fragmenten kann nach aus dem Stand der Technik bekannten Verfahren vorgenommen werden. Beispielsweise beschreibt EP 0 743
367, auf welche hiermit vollinhaltlich Bezug genommen wird, die Erzeugung von mittels meist häufig schneidender Restriktionsendonukleasen gewonnener, die 3'- Enden von cDNA-Molekülen repräsentierender und auf einer Seite von Linkern flankierter Fragmente, welche mittels selektiver (an ihrem 3 '-Ende über die allen Primern eines Typs gemeinsame „universelle" Bindungsstelle hinaus um eine oder mehrere „selektive" Nukleotide verlängerter) PCR-Primer in Form mehrerer Untergruppen („Subpools") amplifiziert werden. Jede dieser Untergruppen besteht dann aus einer Teilmenge der zunächst erzeugten Gesamtheit aller cDNA-3'- Fragmente. Einander entsprechende (d.h. mit den gleichen selektiven Primern erzeugte), aus verschiedenen auf differentiell exprimierte Gene zu untersuchende
RNA-Präparationen gewonnene Fragment-Subpools werden dann gelelektrophoretisch nach ihrer Größe aufgetrennt, und die erhaltenen Bandenbzw. Signalmuster werden miteinander verglichen. Von homologen Fragmenten stammende Banden bzw. Signale, deren Intensität sich zwischen zwischen verschiedenen Proben unterscheidet, repräsentieren Gene, die in den verglichenen
Proben unterschiedlich stark exprimiert sind (vgl. beispielsweise Abb. 1 der EP 0 743 367). Aus dem Stand der Technik sind weitere alternative Verfahren zur Erzeugung von Mischungen von cDNA-Fragmenten zur Expressionsanalyse bekannt, vgl. beispielsweise Kato: Nucleic Acids Res. 23, 3685-3690 (1995), Ivanova et al., Nucleic Acids Res. 23, 2954-2958 (1995), Bachern et al, Plant J. 9, 745-753 (1996), Prashar et al., Proc. Natl. Acad. Sei. U. S. A. 93, 659-663 (1996), Shimkets et al., Nat. Biotechnol. 17, 798-803 (1999), Ke et al., Analyt. Biochem. 269, 201-204 (1999)., Jing et al., Analyt. Biochem. 287, 334-337 (2000), Sutcliffe et al., Proc. Natl. Acad. Sei. U. S. A. 97, 1976-1981 (2000), WO 99/42610, EP 0 981 609.
Bei der fragmentspezifischen Eigenschaft handelt es sich um eine, insbesondere physikalische oder physikochemische, Eigenschaft, welche von verschiedenen Molekülen innerhalb eines Kontinuums oder in Form einer größeren Anzahl (beispielsweise mindestens 10 oder mindestens 100) unterschiedlicher Abstufungen oder Ausprägungen verwirklicht sein kann. Besonders bevorzugt ist die Ausnutzung unterschiedlicher Mobilität verschiedener Nukleinsaurefragmente in Trennsystemen, insbesondere unterschiedlicher elektrophoretischer Mobilität in Elektrophoresesystemen wie Agarose- oder Polyacrylamidgelelektrophorese. Hierbei ist die Mobilität in der Regel von der Länge eines Fragments beeinflußt; allerdings handelt es sich um keine streng lineare Beziehung, da auch G/C-Gehalt und Konformation eines Nukleinsäuremoleküls die Mobilität beeinflussen. Daher kann die Mobilität eines Nukleinsäuremoleküls in der Regel lediglich zur ungefähren, nicht aber zur absoluten Größenbestimmung herangezogen werden. Weiterhin kann es sich bei der fragmentspezifischen Eigenschaft um eine bestimmte Teilsequenz von n Nukleotiden handeln, wobei n gleich oder größer 1 sein kann. Bevorzugterweise grenzt besagte Teilsequenz eines Fragments an einen am Ende des Fragments befestigten Linker an, so daß eine Auftrennung einer Mischung verschiedener Fragmente nach dieser Teilsequenz über Extension, gegebenenfalls eine wiederholte Extension in Form einer Amplifikation, selektiver Oligonukleotidprimer erfolgen kann. Eine derartige Vorgehensweise ist beispielsweise in der EP 0 743 367 beschrieben. In diesem Fall ist mit „Auftrennung einer Fragmentmischung" die Herstellung von Mischungen amplifizierter Fragmente gemeint, von denen jede durch Amplifikation erzeugte Kopien nur eines Teils der in der Ausgangsmischung vorhandenen Fragmente enthält. In einem anderen bevorzugten Fall liegt besagte Teilsequenz zumindest teilweise in Form eines einzelsträngigen Überhangs vor, und die Auftrennung einer Mischung verschiedener Fragmente nach dieser Teilsequenz erfolgt über Befestigung von Adaptern mit kompatiblen Überhängen. Dieser Vorgang, auch „Kategorisierung von Nukleotidsequenz-Populationen" genannt, ist in der WO 94/01582 beschrieben. Auch eine Kombination beider Maßnahmen ist denkbar und beispielsweise in der WO 01/75180 beschrieben. Die Detektion der relativen Häufigkeit einiger oder aller Fragmente erfolgt über Messung der bei der Detektion einzelner Nukleinsaurefragmente erhaltenen Signalstärke. In einer bevorzugten Ausführungsform enthalten die Nukleinsaurefragmente detektierbare Markierungsgruppen, wobei der Einsatz von Fluorophoren als Markierungsgruppen besonders bevorzugt ist. Wird zur Auftrennung und Detektion beispielsweise ein automatisches Sequenzierungsgerät verwendet, so ist die relative Häufigkeit eines Fragments als Fläche unter der entsprechenden Kurve im Fluorogramm (der Auftragung der gemessenen Fluoreszenzintensität in Abhängigkeit von der Retentionszeit) in Form eines Zahlenwerts leicht erhältlich. Unter einem Fragment ist hierbei die Gesamtheit aller sequenzidentischen Nukleinsäuremoleküle einer Mischung zu verstehen, gegebenenfalls zuzüglich der Nukleinsäuremoleküle hierzu komplementärer Sequenz. Oft werden die als relative Häufigkeit von Fragmenten erhaltenen Zahlenwerte in computerlesbarer Form gespeichert.
Im Schritt der Registrierung von Nukleinsäure-Fragmenten, vorzugsweise von cDNA- Fragmenten, unterschiedlicher relativer Häufigkeiten werden diejenigen Fragmente identifiziert, welche sich in ihrem Anteil zwischen verschiedenen biologischen Proben bzw. zwischen verschiedenen Mischungen von cDNA-Fragmenten unterscheiden. Wird dafür Sorge getragen, daß aus den in den Proben vorhandenen mRNA-Molekülen cDNA- Fragmente erzeugt werden, deren Häufigkeitsverteilung der Häufigkeitsverteilung der verschiedenen mRNA-Moleküle ähnlich ist oder ihr sogar gleicht, so zeigen cDNA- Fragmente zwischen miteinander verglichenen Fragmentmischungen unterschiedlicher Häufigkeit auch mRNA-Moleküle unterschiedlicher Häufigkeit und somit differentiell exprimierte Gene an. Um kleinere Schwankungen beispielsweise in der Effizienz der zuvor erfolgten enzymatischen Schritte oder der Detektion zu kompensieren, kann gegebenenfalls ein Schwellenwert für Häufigkeitsunterschiede festgelegt werden, so daß beispielsweise nur diejenigen cDNA-Fragmente weiter untersucht werden, deren relative Häufigkeit zwischen miteinander verglichenen Fragmentmischungen sich um mindestens den Faktor zwei unterscheidet.
Die simultane Identifikation eines Nukleotids oder mehrerer Nukleotide für mehrere oder alle Nukleinsaurefragmente erfolgt vorzugsweise, indem wie oben beschrieben an mittels mindestens einer außerhalb ihrer Erkennungsstelle schneidenen Restriktionsendonuklease erzeugten überhängenden Fragmentenden ein für die Identität des jeweils zu identifizierenden Nukleotids charakteristischer Prozeß durchgeführt wird, für den eine Mischung aus mehreren oder allen Nukleinsaurefragmenten eingesetzt wird und dessen Ergebnis sich vorzugsweise über den Einbau einer Markierung, insbesondere m einer Fluoreszenzmarkierung, beobachten läßt. Hierbei ist bevorzugt, daß die identifizierten Nukleotide in Nachbarschaft zueinander liegen, die so erhaltenen Informationen über die Nukleotididentitäten also eine zusammenhängende Teilsequenz des jeweiligen Nukleinsäurefragments ergeben. In einer bevorzugten Ausführungsform wird nach Ablauf besagten Prozesses, der „Sequenzierungsreaktion", eine Auftrennung der im Prozeß entstandenen Produkte vorgenommen, wobei hier die Aufitrennung wiederum nach der fragmentspezifischen Eigenschaft aus (bl) bzw. (c2) erfolgen kann.
Bei der Zusammenfassung der erhaltenen Sequenzinformationen zu fragmentspezifischen Signaturen wird jedem oder einigen der aufgetrennten Nukleinsäuremoleküle die für einige Positionen erhaltene Nukleotididentität zugeordnet. Die über ein Fragment erhaltene Information wird als Signatur bezeichnet. Hierbei kann die Signatur neben Sequenzinformation noch weitere Informationen enthalten, beispielsweise auf andere Weise erhaltene Sequenzinformation oder über die Fragmentmobilität erhaltene ungefähre Fragmentgröße. Werden beispielsweise gemäß o.g. EP 0 743 367 cDNA-3 '-Fragmente unter Verwendung der Restriktionsendonuklease Rsal (Erkennungssequenz GTAC) erzeugt und wird einem ausgewählten Fragment, von der Erkennungsstelle für Rsal aus gesehen, den in Schritten (gl) bis (jl) identifizierten Nukleotiden die Identität A (1. Nukleotid), G (2. Nukleotid), T (3. Nukleotid) sowie A (4. Nukleotid) zugewiesen, so läßt sich hieraus eine Sequenzsignatur der Nukleotidsequenz GTACAGTA erzeugen. Neben der ungefähren Fragmentgröße könnte als weitere Randinformation noch aufgenommen werden, daß sich (einen vollständigen Ablauf des Rsαl-Verdaus vorausgesetzt) zwischen der Teilsequenz GTAC und dem 3 '-Fragmentende naturgemäß keine weitere identische Teilsequenz befinden kann. Jedenfalls können fragmentspezifische Signaturen für alle oder einen Teil der in einer Fragmentmischung enthaltenen Fragmente ermittelt werden. Bei der Anwendung des erfindungsgemäßen Verfahrens zur vergleichenden Genexpressionsanalyse werden Signaturen insbesondere für diejenigen Fragmente ermittelt, welche sich in ihrer relativen Häufigkeit zwischen den zu vergleichenden Fragmentmischungen um mindestens einen festgelegten Faktor unterscheiden. Im übrigen muß es sich bei dem Sequenzanteil einer Signatur nicht notwendigerweise um eine zusammenhängende Sequenz handeln. So ist es beispielsweise denkbar, daß von einem gegebenen Fragment terminale Nukleotidteilsequenzen beider Fragmentenden bestimmt und zu einer Signatur zusammengefaßt werden; auch hierbei ist es selbstverständlich möglich, weitere Informationen wie z.B. ungefähre Fragmentlänge in die Signatur aufzunehmen. Beispielsweise könnte für ein bestimmtes Fragment die Signatur
5'-CTCA{192}GGAT-3'
bedeuten, daß das Fragment mit der Nukleotidsequenz CTCA am 5 '-Ende „beginnt", mit der Nukleotidsequenz GGAT am 3 '-Ende „aufhört" und insgesamt, gegebenenfalls zuzüglich terminaler Linkerbereiche, ungefähr 200 bp (= 4 bp + 192 bp + 4 bp) lang ist. Hierbei berücksichtigt die Formulierung „ungefähr", daß die Längenbestimmung von Fragmenten anhand der elektrophoretischen Mobilität wie oben ausgeführt einem gewissen Fehler unterworfen ist.
Die Gewinnung interessierender Fragmente aus der Mischung von Nukleinsäure- Fragmenten, vorzugsweise von cDNA-Fragmenten kann unter Zuhilfenahme der ermittelten fragmentspezifischen Signaturen beispielsweise mittels PCR mit Hilfe genspezifischer Primer erfolgen. Wurde etwa im oberen Beispiel eine Mischung von 3'- cDNA-Fragmenten mittels der Restriktionsendonuklease Rsal gewonnen, gefolgt von der Ligation von Linkem an die erzeugten (glatten) Fragmentenden, und wurde für ein ausgewähltes Fragment die obige Signatur GTACAGTA erhalten, so ist über das Fragment bekannt, daß nach erfolgtem Rs l-Schnitt (Entfernung u.a. der ersten beiden Nukleotide der Rsαl-Erkennungsstelle, GT) die ersten auf die Linkersequenz folgenden Nukleotide die Sequenz ACAGTA darstellen. Wird nun ein Primer zur PCR-Amplifikation eingesetzt, welcher auf die Linkersequenz an seinem 3 '-Ende folgend eben diese Nukleotidsequenz ACAGTA aufweist, so ist das zugehörige Fragment direkt durch Amplifikation aus der Fragmentmischung zugänglich, da besagter Primer selektiv eine Amplifikation derjenigen Fragmente begünstigt, mit denen er über seine volle Länge sequenzidentisch (bzw. komplementär hierzu) ist. Das so erhaltene Fragment kann dann einer weiteren Analyse unterzogen werden, beispielsweise einer Sequenzierung, gefolgt von einer Datenbankabfrage nach sequenzidentischen oder sequenzähnlichen Einträgen. Voraussetzung für diese Vorgehensweise ist selbstverständlich ein hinreichend hoher Informationsgehalt der Signatur, d.h. eine hinreichende Länge und damit Spezifität des fragmentspezifischen Bereichs des Amplifikationsprimers. Grenzte die Teilsequenz ACAGTA in mehr als einem der in der Mischung befindlichen Fragmente direkt an die Linkerregion, so würde sich unter Zuhilfenahme besagten Primers eine Mischung dieser Fragmente amplifizieren lassen. Um ein einzelnes interessierendes Fragment auf die beschriebene Weise zu gewinnen, müßte der eingesetzte Primer demnach an seinem 3'- Ende um weitere spezifische Basen verlängert werden. Hierbei ist auch in Rechnung zu stellen, daß die Diskriminierungsfahigkeit von Polymerasen gegen Verlängerung von unter partieller Fehlpaarung („mismatch") mit dem Matrizenstrang („template") hybridisierten Primern umso geringer ist, je weiter diese Fehlpaarungen vom 3 '-Ende des Primers entfernt sind. Wird also ein Primer an seinem 3 '-Ende zur Spezifitätserhöhung um weitere fragmentspezifische Basen verlängert, ist mit einem gewissen Verlust an Spezifität derjenigen Basen zu rechnen, welche unmittelbar auf den zur jeweiligen Linkersequenz komplementären Sequenzabschnitt des Primers folgen.
In einer bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden die für interessierende Nukleinsaurefragmente erhaltenen Signaturen eingesetzt, um fragmentspezifische Oligonukleotidprimer zu entwerfen. Bei dieser Anwendung ist weiterhin bevorzugt, die erhaltenen Oligonukleotidprimer zur Amplifikation ausgewählter Fragmente einzusetzen, wobei als Amplifikationstemplate in der Regel die Mischung von Nukleinsaurefragmenten oder eine Teilmenge hiervon eingesetzt wird.
Die Identifikation der zu den interessierenden Nukleinsäure- bzw. cDNA-Fragmenten gehörigen Gene mittels Durchsuchen elektronischer Datenbanken kann erfolgen, wenn der Informationsgehalt einer Signatur hoch genug ist, um eine eindeutige oder weitgehend eindeutige Identifikation eines Gens zuzulassen, und wenn die Datenbank entsprechende Einträge aufweist. Wie hoch der Informationsgehalt von Signaturen einer biologischen Spezies sein muß, um eine eindeutige Zuordenbarkeit einer Signatur zum zugehörigen Gen zu erlauben, ist empirisch zu ermitteln und kann selbst innerhalb einer biologischen Spezies von Gen zu Gen verschieden sein; so kann es etwa vorkommen, daß ein bestimmtes Decamer (eine aus 10 Nukleotiden bestehende Signatur) charakteristisch für ein einziges Gen ist, während ein anderes Decamer in zahlreichen verschiedenen Genen auftritt. In einer bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden die für interessierende Nukleinsaurefragmente erhaltenen Signaturen zur Identifizierung der Nukleinsaurefragmente in einer Datenbanksuche eingesetzt.
In einer weiteren bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden die für interessierende Nukleinsaurefragmente erhaltenen Signaturen eingesetzt, um EST- Banken zu erstellen. Hierzu werden die für die einzelnen, aus einer cDNA-Präparation gewonnenen, Fragmente erhaltenen Signaturen eingesetzt, um fragmentspezifische Oligonukleotidprimer zu entwerfen. Diese werden dann verwendet, um mittels PCR- Amplifikation die jeweiligen Fragmente zu gewinnen. Die gewonnenen Fragmente werden schließlich sequenziert und die Sequenzen werden in einer Datenbank erfaßt. Solchermaßen erzeugte EST-Banken können auch als normalisierte EST-Banken bezeichnet werden, da jedes Fragment, unabhängig von seiner Abundanz bzw. der Abundanz der von ihm repräsentierten mRNA- bzw. cDNA-Moleküle, lediglich ein einziges Mal erzeugt wird. Dies ist von großem Vorteil im Vergleich mit nach dem Stand der Technik erzeugten EST-Banken, die ein extrem hohes Maß an Redundanz zeigen (vgl. Lee et al., Proc. Natl. Acad. Sei. U.S.A. 92, 8303-8307 [1995]). Diese Redundanz auf traditionelle Weise hergestellter EST-Banken folgt daraus, daß abundante Transkripte (beispielsweise einer Abundanz von 1000 mRNA-Kopien pro Zelle) durch wesentlich mehr zur EST-Bank beitragende cDNA-Klone repräsentiert werden als weniger abundante Transkripte (beispielsweise einer Abundanz von 1 mRNA-Kopie pro Zelle - der Häufigkeitsunterschied von diese beiden Transkripte repräsentierenden Klonen betrüge in diesem Beispiel 1:1000). Aus dem Stand der Technik sind weiterhin Verfahren zur Normalisierung von cDNA-Banken bekannt, bei denen unter Ausnutzung der Reassoziationskinetik von Nukleinsäuren eine Konzentrationsangleichung abundanter und weniger abundanter Klone vorgenommen wird (Soares et al, Proc. Natl. Acad. Sei. U.S.A. 91, 9228-9232 [1994]). Solche normalisierte Banken zeichnen sich zwar durch eine Abreicherung besonders abundanter Klone aus, jedoch ist der Abundanzunterschied häufiger und weniger häufiger Klone immer noch beträchtlich und kann zwischen einer und zwei Größenordnungen betragen, was Herstellung und Analyse von Banken dieser Art sehr teuer macht. Bei der Herstellung von normalisierten Banken gemäß dem erfindungsgemäßen Verfahren kann eine Redundanz praktisch ausgeschlossen werden; dennoch geht im Gegensatz zu normalisierten Banken nach dem Stand der Technik Abundanzinformation der einzelnen Fragmente, Klone sowie derjenigen Transkripte, von denen diese sich ableiten, nicht verloren. Vielmehr kann Abundanzinformation der jeweiligen, beispielsweise mittels kapillargelelektrophoretischer Auftrennung erhaltenen Signalstärke der einzelnen Fragmente einer untersuchten Fragmentmischung entnommen und als Zusatzinformation einer jeden erhaltenen EST-Sequenz abrufbar beigefügt werden.
In einer weiteren bevorzugten Anwendung des erfindungsgemäßen Verfahrens werden als Mischung von Nukleinsaurefragmenten Mischungen aus genomischer DNA oder cDNA erzeugter, beidseitig von identischen oder verschiedenen Adaptern flankierter Restriktionsfragmente eingesetzt, wobei die adapterflankierten Fragmente zunächst einer Amplifikation mittels an ihrem 3 '-Ende über den zum Adapter komplementären Bereich hinaus um ein oder mehrere Nukleotide verlängerter Primer unterzogen werden und die so erhaltenen Amplifkationsprodukte zur Durchführung des Verfahrens eingesetzt werden.
In einer weiteren Ausführungsform des erfindungsgemäßen Verfahrens werden als Mischung von Nukleinsaurefragmenten solche Fragmente eingesetzt, welche durch Restriktionsverdau mit mindestens zum Teil dem Typ IIs angehörigen Restriktionsendonukleasen aus genomischer oder cDNA erzeugt wurden und welche einseitig oder beidseitig von Adaptersequenzen flankiert sind. Bei dieser Anwendung werden von der oder den eingesetzten Typ IIs-Restriktionsendonukleasen überhängende Enden erzeugt, deren Sequenz nicht unmittelbar durch die Restriktionsendonuklease, sondern durch die Nukleinsäuresequenz der Schnittstelle determiniert wird und die sich folglich von Fragment zu Fragment unterscheiden können. Gewünschtenfalls können zur Befestigung Adapter eingesetzt werden, welche sich lediglich an bestimmten überhängenden Enden befestigen lassen, insbesondere an solchen, deren Nukleotidsequenz komplementär ist zur Nukleotidsequenz der überhängenden Adapter-Enden. Auf diese Weise ist es möglich, bestimmte vorausgewählte Adapter lediglich an einem Teil aller Nukleinsaurefragmente zu befestigen und somit eine Teilmenge der eingesetzten Mischung von Nukleinsaurefragmenten zu erzeugen (sog. "molekulare Indexierung", vgl. Kato, Nucleic Acids Res. 1996, Jan. 15, 24 (2): 394-395, sowie WO 94/01582).
In einer besonders bevorzugten Ausführungsform werden die erforderlichen enzymatischen Reaktionsansätze mittels eines Pipettierautomaten erstellt.
In einer weiteren besonders bevorzugten Ausführungsform werden die mittels Gelelektrophorese, vorzugsweise mittels Kapillargelelektrophorese, erhaltenen Fluorogramme automatisch ausgewertet. Bei dieser Auswertung werden mittels eines Computersystems zueinander gehörige Signale verschiedener Fluorogramme einander zugeordnet, die (i) homologe Fragmente aus verschiedenen Mischungen von Nukleinsäure- Fragmenten, (ii) Fragmente einer Nukleinsäuremischung und die Reaktionsprodukte, welche zur Identifikation eines oder mehrerer Nukleotide der Fragmente dieser Mischung erhalten wurden, (iii) Reaktionsprodukte, welche zur Identifikation mehrerer Nukleotide der Fragmente einer Mischung von Nukleinsäure-Fragmenten erhalten wurden, repräsentieren. Eine solche automatische Zuordnung kann beispielsweise nach folgender Anweisung erfolgen:
1. Wähle ein geeignetes Startsignal, das noch in keiner Zuordnung enthalten ist,
2. Suche nach dem hierzu am besten passenden Signal, wobei die Kriterien (a) möglichst geringer Unterschied der ermittelten Fragmentlänge und (b) möglichst geringer Unterschied in der Signalintensität sind und wobei diese beiden Kriterien in frei wählbarer Gewichtung eingehen können, 3. Wiederhole Schritt (2), wobei jedes zusätzliche Signal mit dem Mittelwert aus
Fragmentlänge und Signalintensität aller bisher zugeordneten Signale verglichen wird, 4. Breche den Vorgang ab, wenn die Unterschiede aus (2) einen vorgewählten
Schwellenwert überschreiten. 5. Wiederhole Schritt (1) bis (3), bis alle Signale eines Satzes von einander zuzuordnenden Fluorogrammen einander zugeordnet worden sind oder als nicht einander zuordenbar erkannt worden sind.
Weiterhin ist bevorzugt, daß die automatische Auswertung die Durchführung der Schritte (dl), (el), (gl), (hl), (il), öl), (kl), (ml), (c2), (d2), (e2), (f2), (g2), (h2), (i2), (12), (m2), (n2) und/oder (o2) umfaßt.
Nachfolgend wird die Erfindung durch die Zeichnungen näher erläutert. Es zeigen
Fig. 1: die Erzeugung adapterflankierter Nukleinsaurefragmente,
Fig. 2: die Sequenzierung überhängender Fragmentenden mittels Adapterligation, Fig. 3: die Erzeugung verschiedener überhängender Enden durch Verkürzung eines Nukleinsäurefragments,
Fig. 4: die Identifikation eines Nukleotidsfür alle Fragmente einer Mischung von Nukleinsaurefragmenten, Fig. 5: die Identifikation von vier Nukleotide für alle Fragmente einer Mischung von Nukleinsaurefragmenten.
Fig. 6: die Auftrennung einer Mischung von Nukleinsäure-Fragmenten mittels Kapillargelelektrophorese,
Fig. 7: die Identifikation mehrerer Nukleotide eines Nukleinsäurefragments mittels Kapillargelelektrophorese,
Fig. 8: eine Auflistung einiger aus einer Suspensionskultur von Saccharomyces cerevisiae gewonnenen Signaturen.
Fig. 9: zeigt die Identifikation mehrerer Nukleotide von vier Nukleinsaurefragmenten einer Mischung von Nukleinsaurefragmenten.
Fig. 1 zeigt die Erzeugung adapterflankierter Nukleinsaurefragmente, wobei 1 die Fragmentierung einer Nukleinsäurepräparation mittels zweier
Restriktionsendonukleasen, und
2 die Befestigung von Adaptern an den Fragmentenden darstellt.
Fig. 2 zeigt die Sequenzierung überhängender Fragmentenden mittels Adapterligation, wobei
1 die Sequenzierung der ersten Position der überhängenden Enden, und
2 die Sequenzierung der zweiten Position der überhangenden Enden zeigt. Es ist die Sequenzierung eines das 3 '-Ende eines cDNA-Moleküls repräsentierenden Nukleinsäurefragments gezeigt. Die zur Sequenzierung eingesetzten Adapter zeichnen sich durch verschiedene Sequenz der überhängendenden Enden sowie durch verschiedene Markierungsgruppen aus, welche für die Sequenz des jeweiligen überhängenden Endes codieren. Eine die Base A anzeigende Markierungsgruppe wird durch einen gepunkteten Adapter, eine ein C anzeigende Markierung durch einen schraffierten Adapter, eine ein G anzeigende Markierung durch einen ausgefüllten Adapter und eine ein T anzeigende Markierung durch einen kreuzschraffierten Adapter angezeigt. Eine in (1) durch Ligation am Fragment befestigte, ein T anzeigende Markierungsgruppe zeigt an, daß es sich bei der ersten Base des Überhangs um die hierzu komplementäre Base A handelt. Eine in (2) durch Ligation am Fragment befestigte, ein C anzeigende Markierungsgruppe zeigt an, daß es sich bei der zweiten Base des Überhangs um die hierzu komplementäre Base G handelt.
Fig. 3 stellt die Erzeugung verschiedener überhängender Enden durch Verkürzung eines Nukleinsäurefragments dar, wobei
1 die Befestigung dreier verschiedener, jeweils an unterschiedlicher Position eine Erkennungsstelle (schraffierter Bereich) für eine Typ IIS- Restriktionsendonuklease enthaltender Adapter,
2 die Inkubation der Befestigungsprodukte mit besagter Typ IIS- Restriktionsendonuklease, und
3 die Freisetzung verkürzter überhängender Fragmentenden zeigt, welche in Bezug auf den doppelsträngigen Bereich des Ausgangsfragments die Positionen -5 und -6 (links), -3 und -4 (Mitte) sowie -1 und -2 (rechts) in terminal-einzelsträngiger und damit einer Sequenzierung über Adapterligation zugänglicher Form enthalten, zeigt. Als Ausgangsfragment ist hier ein mittels der Restriktionsendonuklease Mbol gewonnenes 3 '-cDNA-Fragment dargestellt.
Fig. 4 beschreibt die Identifikation einer Base für alle Fragmente einer Mischung von Nukleinsaurefragmenten. Die Fragmente werden mit fluoreszenten Markierungsgruppen versehen und mittels Kapillargelelektrophorese nach ihrer Mobilität aufgetrennt. Das resultierende Fluorogramm (oben dargestellt) wird zu einer Katalogisierung der Fragmente (Vergabe durchlaufender Nummern) eingesetzt. Danach werden für die zu bestimmende Position der Fragmente gemäß obiger Beschreibung die dort befindlichen Nukleotide identifiziert. Nach Durchführung der entsprechenden Reaktionen, bei denen die Identität besagter Nukleotide mittels Einführung nukleotidspezifischer Markierungsgruppen codiert wird, werden die Produkte ebenfalls mittels Kapillargelelektrophorese aufgetrennt, und die Identität der eingeführten Markierungsgruppen unter Berücksichtigung von Mobilität und gegebenenfalls Signalintensität ermittelt. Die Identifikation der interessierenden Base ergibt „G" für Fragment 3, „A" für Fragment 2, „T" für Fragmente 1 und 6, sowie „C" für die Fragmente 4, 5 und 7.
Fig. 5 zeigt die Identifikation von vier Nukleotidenfür alle Fragmente einer Mischung von Nukleinsaurefragmenten (Fragmente 1-7). Im Falle der direkten Aufeinanderfolge der vier Nukleotide ergeben sich folgende Sequenzsignaturen:
Fragment 1: TGT AFragment 2: ATGA
Fragment 3: GATG
Fragment 4: CCGT Fragment 5: CACC
Fragment 6: TGAT
Fragment 7: CTCC
Fig. 6 zeigt die Auftrennung einer Mischung von Nukleinsäure-Fragmenten mittels Kapillargelelektrophorese. Es wurden wie beschrieben cDNA-Fragmente aus einer Suspensionskultur von Saccharomyces cerevisiae erzeugt. Es sind die von einer stationären Phase (grau) sowie einer in der logarithmischen Phase (schwarz) befindlichen Kultur erhaltenen Signale gezeigt. Einige der Fragmente repräsentieren konstitutiv exprimierte Gene (mit „C" markierte Signale = constitutively expressed), andere in der stationären Phase herunterregulierte Gene (mit „D" markierte Signale = downregulated) und wieder andere in der stationären Phase heraufregulierte Gene (mit „U" markiertes Signal = upregulated). Die horizontale Skala zeigt die Fragmentgröße, die vertikale Skala gibt die Fluoreszenzintensität an.
Fig. 7 zeigt die Identifikation mehrerer Nukleotide eines Nukleinsäurefragments mittels Kapillargelelektrophorese. E, eines der Fragmente aus einer Mischung von Nukleinsäure- Fragmenten, B1-B16, Identifikation der ersten bis sechzehnten Base des Fragments, FAM, PET, VIC, NED, das jeweilige bei der Identifikation einer Base detektierte Fluorophor, (G), (A), (T), (C), die mittels des jeweiligen Fluorophors identifizierte Base. Für das ausgewählte Fragment ergibt sich die Signatur GATCTCACAAATGGTT. Die Leiste am oberen Rand zeigt die Fragmentgröße, es handelt sich also um ein Fragment einer Größe von ungefähr 140 bp.
Fig. 8 zeigt eine Auflistung einiger aus einer Suspensionskultur von Saccharomyces cerevisiae gewonnenen Signaturen. Angebeben sind jeweils die Fragmentgröße, die gemäß dem erfindungsgemäßen Verfahren ermittelten Signaturen, die mittels BLAST-Analyse identifizierten open reading frames (ORFs) sowie die mittels Kapillargelekektrophorese erhaltene Signalintensität.
Fig. 9 zeigt die Identifikation mehrerer Nukleotide von vier Nukleinsaurefragmenten einer Mischung von Nukleinsaurefragmenten. Die Fragmente haben eine ungefähre Länge von 75 bp, 77 bp, 78 bp und 79 bp. F, aufgetrennte Fragmente der Mischung, B1-B6, Identifikation der ersten bis sechsten Base der Fragmente, FAM, PET, VIC, NED, das jeweilige bei der Identifikation einer Base detektierte Fluorophor, (G), (A), T), (C), die mittels des jeweiligen Fluorophors identifizierte Base. Für das Fragment der Länge 75 bp ergibt sich die Signatur TCATTG, für das Fragment der Länge 77 bp ergibt sich die Signatur ACTGGC, für das Fragment der Länge 78 bp ergibt sich die Signatur ATGCCT, und für das Fragment der Länge 79 bp ergibt sich die Signatur TATGCT.
Die Erfindung wird weiterhin durch die nachfolgenden Beispiele näher erläutert.
Beispiel 1: Gewinnung von cDNA-3 '-Restriktionsfragmenten
25 μg Gesamt-RNA aus einer Suspensionskultur von Saccharomyces cerevisiae wurde mit Ethanol gefallt und in 15,5 μl Wasser gelöst. Es wurden 0,5 μl 10 μM cDNA-Primer CP31V (5 -ACCTACGTGCAGATTTTTTTTTTTTTTTTTTV-3', SEQ ID NO: 1) hinzugegeben, 5 Minuten bei 65°C denaturiert und auf Eis gestellt. Die Mischung wurde mit 3 μl 100 mM Dithiothreitol (Life Technologies GmbH, Karlsruhe), 6 μl 5x Superscript-Puffer (Life Technologies GmbH, Karlsruhe), 1,5 μl 10 mM dNTPs, 0,6 μl RNase Inhibitor (40 U/μl; Röche Molecular Biochemicals) und 1 μl Superscript II (200 U/μl, Life Technologies) versetzt und zur cDNA-Erststrangsynthese 1 Stunde bei 42°C inkubiert. Zur Zweitstrangsynthese wurden 48 μl Zweitstrang-Puffer (vgl. Ausubel et al., Current Protocols in Molecular Biology (1999), John Wiley & Sons), 3,6 μl 10 mM dNTPs, 148,8 μl H2O, 1,2 μl RNaseH (1,5 U/μl, Promega) und 6 μl DNA Polymerase I (New England Biolabs GmbH, Schwalbach, 10 U/μl) hinzugefügt und die Reaktionen 2 Stunden bei 22°C inkubiert. Es wurde mit 100 μl Phenol, dann mit 100 μl Chloroform extrahiert und mit 0,1 Vol. Natriumacetat pH 5,2 und 2,5 Vol. Ethanol gefallt. Nach Zentrinigation für 20 Minuten bei 15.000 g und Waschen mit 70% Ethanol wurde das Pellet in einem Restriktionsansatz aus 15 μl lOx Universal buffer, 1 μl Mbol und 84 μl H2O gelöst und die Reaktion 1 Stunde bei 37°C inkubiert. Es wurde mit Phenol, dann mit Chloroform extrahiert und mit Ethanol gefällt. Das Pellet wurde in einem Ligationsansatz aus 0,6 μl lOx Ligationspuffer (Röche Molecular Biochemicals), 1 μl 10 mM ATP (Röche Molecular Biochemicals), 1 μl Linker ML2025 (hergestellt durch Hybridisierung von Oligonukleotiden ML20 (5 -TCACATGCTAAGTCTCGCGA-3 ', SEQ ID NO: 2) und LM25 (5'-GATCTCGC GAGACTTAGCATGTGAC-3', SEQ ID NO: 3)), 6,9 μl H2O und 0,5 μl T4 DNA Ligase (1 U/μl; Röche Molecular Biochemicals) gelöst und die Ligation über Nacht bei 16°C durchgeführt. Die Ligationsreaktion wurde mit Wasser auf 100 μl aufgefüllt, mit Phenol, dann mit Chloroform extrahiert und nach Zugabe von 1 μl Glycogen (20 mg/ml, Röche Molecular Biochemicals) mit 100 μl 28% Polyethylenglycol 8000 (Promega)/10 mM MgCl2 gefällt. Das Pellet wurde mit 70% Ethanol gewaschen und in 40 μl Wasser aufgenommen. Beispiel 2: Amplifikation von cDNA-3 '-Restriktionsfragmenten unter Aufteilung in Subpools
Zur ersten Runde Amplifikation wurden PCR-Ansätze hergestellt, enthaltend 2 μl gefällter Ligationsreaktion aus Beispiel 1, 2 μl lOx PCR-Puffer (670 mM Tris-Cl, pH 8,8, 170 mM
(NHt)2SO4, 1% (v/v) Tween 20), 1,5 μl 20 mM MgCl2, 0,4 μl 10 mM dNTPs, 2 μl
RediLoad (Invitrogen GmbH, Karlsruhe), 0,2 μl Taq DNA Polymerase (Röche Molecular
Biochemicals), 1 μl 4 μM Oligonukleotidprimer CP31XiX2 (5'-ACCTACGTGCAGA ττττττττττττττττττχ χ2_3 , mit X] = Gj A oder Cj χ2 = Q, A, T oder C; SEQ ID NO: 4), 1 μl 4 μM Oligonukleotidprimer ML20 und 9,9 μl Wasser. Es wurden mit allen 12 Reaktionen ewe^s einen der 12 möglichen CP31X1X2-Primer enthaltend) 25 Amplifikationszyklen durchgeführt, bestehend je aus den Phasen Denaturierung (30 sec. 94°C), Annealing (30 sec. 65°C) und Extension (2 min. 72°C). Je 5 μl der Reaktionen wurden mittels Elektrophorese durch ein l,5%iges Agarosegel überprüft. Die Reaktionen wurden mit Wasser auf 100 μl verdünnt. Es wurden weitere PCR-Ansätze hergestellt, enthaltend 2 μl verdünnter Amplifikationsreaktion, 2 μl lOx PCR-Puffer, 1,5 μl 20 mM MgCl2, 0,4 μl 10 mM dNTPs, 2 μl RediLoad, 0,2 μl Taq DNA Polymerase, 1 μl 4 μM Oligonukleotidprimer CP31VNX3X4 (5'-ACCTACGTGCAGATTTTTTTTTTTTTTTTTT VNXs t-3 ' mit V = Mischung aus G, A und C, N = Mischung aus G, A, T und C, X3, X4 = G, A, T oder C; SEQ ID NO: 5), 1 μl 4 μM Oligonukleotidprimer ML20 und 9,9 μl Wasser. Je nach geplanter Weiterverarbeitung der Ansätze wies Primer ML20 eine Fluoreszenzmarkierung auf (ausgewählt aus einem der Farbstoff-Sets 5'-FAM, 5 '-JOE, 5'- ROX und 5 '-TAMRA [Farbstoff-Set 1] oder 5'-FAM, 5'-VIC, 5'-NED und 5'-PET [Farbstoff-Set 2]; Weiterverarbeitung der Proben gemäß Beispiel 3), oder ML20 wurde unmarkiert eingesetzt (Weiterverarbeitung der Proben gemäß Beispiel 4 bzw. Beispiel 5). Es wurden mit allen 2x192 Reaktionen öe eils eme der 12 möglichen verdünnten Amplifikationsreaktionen sowie einen der 16 möglichen CP31VNX3X4-Primer enthaltend; 12 x 16 = 192; ML20 jeweils markiert oder unmarkiert) 25 Amplifikationszyklen durchgeführt, bestehend je aus den Phasen Denaturierung (30 sec. 94°C), Annealing (30 sec. 65°C) und Extension (2 min. 72°C). Es wurden wiederum je 5 μl der Reaktionen mittels Agarosegelelektrophorese überprüft. Die restlichen Reaktionsansätze wurden mittels QiaQuick-Säulen (Qiagen AG, Hilden) gemäß Herstellerangaben gereinigt; die Elution erfolgte in je 50 μl Wasser. Es wurde eine photometrische Mengenbestimmung durchgeführt. Beispiel 3: Auftrennung und Darstellung der fluoreszenzmarkierten Amplifikations- produkte mittels Kapillargelelektrophorese
Je 2 μl der gereinigten fluoreszenzmarkierten Amplifikationsprodukte aus Beispiel 2 wurden mit 10 μl Wasser verdünnt und (im Fall der Verwendung von Farbstoff-Set 2 nach Zugabe von 0,5 μl GeneScan 500 LIZ Längenstandard [Applied Biosystems GmbH, Weiterstadt]) mittels eines ABI Prism 3100 Genetic Analyzers (Applied Biosystems) kapillargelelektrophoretisch aufgetrennt. Um durch „Multiplexing" einen höheren Durchsatz des Geräts zu erreichen, wurden in weiteren Ansätzen jeweils 1 μl FAM- markierter Amplifikationsprodukte, 1 μl VIC-markierter Amplifikationsprodukte, 1 μl NED-markierter Amplifikationsprodukte sowie 1 μl PET-markierter
Amplifikationsprodukte vermischt, mit 0,5 μl LIZ-Längenstandard sowie 7,5 μl Wasser versetzt und zur Elektrophorese eingesetzt. Ein „Multiplexing" unter Einsatz von Farbstoff-Set 1 erfolgte sinngemäß; hierbei wurden mit FAM, JOE oder TAMRA markierte Fragmente mit GeneScan 500 ROX-Längenstandard vermischt. Darstellung und Auswertung der Fluorogramme erfolgte mittels der Software GeneScan Version 3.7 für Windows NT (Applied Biosystems). Zur Identifikation differentiell exprimierter Gene wurden mit RNA-Präparationen von in verschiedenen Wachstumsstadien befindlichen Hefezellen, aber mit den gleichen Amplifikationsprimern der ersten sowie der zweiten Amplifikationsrunde erhaltene Fluorogramme miteinander verglichen. Hierzu wurden die Fluorogramme mittels GeneScan zur Deckung gebracht und visuell auf Unterschiede in den erhaltenen Signalmustern untersucht. Für Vergleiche dieser Art wurde zunächst mittels der GeneScan-Funktion „align data by size" dafür Sorge getragen, daß zueinander „passende" (also das gleiche Gen/Transkript repräsentierende) Fragmente aus RNA- Präparationen verschiedener Wachstumsstadien einander zugeordnet werden konnten. Im nächsten Schritt wurde eine Normalisierung der Signalstärken durchgeführt, indem die Signale einer Probe in ihrer durchschnittlichen Höhe der Durchschnittssignalstärke einer hiermit zu vergleichenden Probe angepaßt wurden. Zur Identifikation differentiell exprimierter Gene wurden in miteinander verglichenen Proben auftretende, Fragmente identischer Größe und somit identische Transkripte repräsentierende Signale, deren Intensitäten sich nach Normalisierung um mindestens einen vorgewählten Faktor voneinander unterschieden, einschließlich der ermittelten Signatur tabelliert; hierbei wurden in einigen Fällen auch die zugehörigen Werten für Fragmentlänge (anhand des internen Längenstandards bestimmt), die Signalintensität sowie die Information über die eingesetzten Amplifikationsprimer einbezogen. Zur allgemeinen Transkriptomanalyse (also einer „Bestandsaufnahme" exprimierter Gene) wurde eine Tabellierung aller ermittelten Signaturen, unabhängig von relativen Signalstärken, vorgenommen.
Beispiel 4: Ermittlung terminaler Basen über Ligation
Je 1 μg der gereinigten nicht fluoreszenzmarkierten Amplifikationsprodukte aus Beispiel 2 wurden mit 5 μl lOx NEBuffer 3 versetzt und mit Wasser auf 49 μl aufgefüllt. Es wurde 1 μl Mbόl (5 U/μl, New England Biolabs) hinzugefügt und 1 h bei 37°C inkubiert; dann wurde für 20 min. bei 65°C hitzeinkubiert. Die Reaktionen wurden mit TE-gesättigtem Phenol, dann mit Chloroform extrahiert und mit Ethanol gefällt. Die Pellets wurden in 20 μl eines Ligationsansatzes aufgenommen, enthaltend 1,2 μl lOx Ligationspuffer (Röche), 8 μl 0,5 μg/μl Eco57I-Linker öe eils ein Linker, ausgewählt aus ECO 1/2 bis ECO11/12; vgl. Tabelle 1; Herstellung der Linker durch Hybridisierung der jeweils angegebenen zueinander komplementären Oligonukleotide), sowie 1 μl T4 DNA-Ligase (1 U/μl, Röche). Es wurde über Nacht bei 16°C ligiert. Zur Amplifikation der Ligationsprodukte wurden 2 μl des Ligationsansatzes mit 2 μl 10 μM Amplifikationsprimer 1 (sequenzidentisch mit jeweils demjenigen Strang des Eco57l- Linkers, dessen 3 '-Ende mit den mit Mbol geschnittenen Fragmenten verknüpft worden war), 2 μl 10 μM CP31V, 5 μl lOx Advantage 2 Puffer (Clontech/BD Biosciences Europe, Heidelberg), 1 μl 10 mM dNTPs, 37 μl Wasser und 1 μl 50x Advantage 2 DNA Polymerase Mix (Clontech) vermischt, und es wurde unter folgenden Bedingungen amplifiziert: 2 min. 94°C initiale Denaturierung, dann 25 Zyklen bestehend aus 20 sec. 94°C Denaturierung, 30 sec. 65°C Annealing, 2 min. 72°C Extension. Nach Überprüfung der Amplifikation mittels Agarosegelelektrophorese wurden 10 μl der Amplifikationsprodukte mit 2,5 μl Buffer G+ +SAM (Fermentas GmbH, St. Leon-Rot), 0,25 μl 10 mg/ml BSA, 10,65 μl Wasser und 1,6 μl Eco57I (5 U/μl) vermischt. Es wurde 1 h bei 37°C inkubiert, dann für 20 min. bei 65 °C denaturiert. 6,5 μl dieser Reaktion wurden mit 1 μl 20 mM ATP, 2 μl 0,5 μg/μl Sequenzieradapter SO15NX oder SO15XN (vgl. Tabelle 2; Herstellung der Linker durch Hybridisierung der jeweils angegebenen zueinander komplementären Oligonukleotide) und 0,5 μl T4 DNA-Ligase (1 U/μl; Röche) vermischt und über Nacht bei 16°C inkubiert. Die Reaktionen wurden mit Wasser auf 50 μl verdünnt und mittels QiaQuick-Säulen gereinigt. Es wurde in 25 μl Wasser eluiert. Je 2,5 μl der gereinigten Amplifikationsansätze aus Beispiel 2 wurden mit 9,5 μl Wasser verdünnt und nach Zugabe von 0,5 μl GeneScan 500 LIZ Längenstandard (Applied Biosystems GmbH, Weiterstadt) mittels des ABI 3100 kapillargelelektrophoretisch aufgetrennt. Zur Auswertung wurden die Fluorogramme aus Beispiel 3 mit den zugehörigen Fluorogrammen aus Beispiel 4 miteinander verglichen. Zur Identifikation von Signalen in miteinander verglichenen Fluorogrammen, die dieselbe Fragmentspezies repräsentieren, wurden (1) Korrekturen des Fluorophor-spezifischen Laufverhaltens'sowie (2) Korrekturen der von ermittelter Base zu ermittelter Base zunehmenden Fragmentverkürzung vorgenommen (indem beispielsweise die Länge eines Fragments, bei welchem von der ursprünglichen Λ &oI-Erkennungsstelle ausgehend Base 3 und 4 durch Eco57I-Schnitt in einen einzelsträngigen Überhang umgewandelt worden waren, rechnerisch um +4 Basen korrigiert wurde und die Länge eines Fragments, bei welchem von der ursprünglichen wl-Erkennungsstelle ausgehend Base 5 und 6 durch Eco57l- Schnitt in einen einzelsträngigen Überhang umgewandelt worden waren, rechnerisch um +6 Basen korrigiert wurde). Dann wurde für alle zu einer Fragmentspezies (also ein in Beispiel 3 auftretendes Fragment sowie die zugehörigen, mittels Eco57l verkürzten und mit einem Sequenzieradapter versehenen Produkte aus Beispiel 4) gehörigen Signale einander zugeordnet und tabellarisch erfaßt, wobei weiterhin anhand des jeweiligen Fluorophors die jeweilig zu ermittelnde Basenidentität identifiziert wurde. Eine solche Tabelle kann beispielsweise das in Tabelle 3 angegebene Format aufweisen.
Die auf diese Weise erhaltenen cDNA-Teilsequenzen („Signaturen") wurden zur Identifikation der jeweiligen zugehörigen Gene für eine BLAST-Suche eingesetzt. Mittels der Tabelle 3 entnehmbaren cDNA-Signatur GATCTAGACAACCAAA ließ sich das Hefegen KTR4 (ORF YBR199W), codierend für eine putative alpha-1,2- Mannosyltransferase, identifizieren. Weitere Beispiele aus Hefe erhaltener Signaturen sind Figur 8 zu entnehmen.
Tabelle 1:
Figure imgf000043_0001
Figure imgf000044_0001
Tabelle 2:
Figure imgf000045_0001
Tabelle 3:
Figure imgf000046_0001
Doppelsträngiger Anteil des Fragments nach rechnerischer Entfernung des Linkers, um den Beitrag des Fluorophors zur elektrophoretischen Fragmentmobilität korrigiert. Die Zahlenwerte dieses Beispiels beziehen sich auf die Verwendung von Eco57l, welches zweibasige Überhänge zur Identifikation jeweils zweier benachbarter Basen („Dubletts") erzeugt, sowie von Sequenzieradaptern, welche wahlweise die erste oder die zweite Base eines solchen Überhangs identifizieren. Zur Identifikation mehrerer aufeinanderfolgender Dubletts sind die in den Eco57I- Linkern liegenden Erkennungsstellen für Eco57l jeweils um zwei Basen gegeneinander versetzt. Reaktion gemäß Beispiel 3 resultiert aus der bekannten Erkennungsstelle von Mbol (vgl. Beispiel 1) Beispiel 5: Ermittlung terminaler Basen über ^//-/«-Reaktion
Je 1 μg der gereinigten nicht fluoreszenzmarkierten Amplifikationsprodukte aus Beispiel 2 wurden mit 5 μl lOx NEBuffer 3 versetzt und mit Wasser auf 49 μl aufgefüllt. Es wurde 1 μl Mbol (5 U/μl, New England Biolabs) hinzugefügt und 1 h bei 37°C inkubiert; dann wurde für 20 min. bei 65 °C hitzeinkubiert. Die Reaktionen wurden mit TE-gesättigtem Phenol, dann mit Chloroform extrahiert und mit Ethanol gefällt. Die Pellets wurden in 50 μl Mung Bean Nuclease Buffer (New England Biolabs) aufgenommen. Nach Zugabe von 1 μl Mung Bean Nuclease (lU/μl, New England Biolabs) wurde für 30 min. bei 30°C inkubiert. Es wurde 1 μl 0,5 M EDTA hinzugefügt, mit Phenol, dann mit Chloroform extrahiert und mit Ethanol gefallt. Es wurde in einem Ligationsansatz aus 7,5 μl 2x Ligationspuffer (New England Biolabs), 6,5 μl 0,5 μg/μl RceAI-Linker öeweils ein Linker, ausgewählt aus BCE1 bis BCE13; vgl. Tabelle 1; Herstellung der Linker durch Hybridisierung der jeweils angegebenen zueinander komplementären Oligonukleotide), sowie 2 μl Quick T4 DNA Ligase (New England Biolabs) gelöst und 1 h bei Raumtemperatur ligiert. Zur Amplifikation der Ligationsprodukte wurden 2 μl der Ligation mit 2 μl 10 μM Amplifikationsprimer 2 (sequenzidentisch mit jeweils demjenigen Strang des Bce AI-Linkers, dessen 3 '-Ende mit den mit Mbol geschnittenen Fragmenten verknüpft worden war), 2 μl 10 μM CP31, 5 μl lOx Advantage 2 Puffer, 1 μl 10 mM dNTPs, 37 μl Wasser und 1 μl 50x Advantage 2 DNA Polymerase Mix vermischt, und es wurde unter folgenden Bedingungen amplifiziert: 2 min. 94°C initiale Denaturierung, dann 25 Zyklen bestehend aus 20 sec. 94°C Denaturierung, 30 sec. 65°C Annealing, 2 min. 72°C Extension. Nach Überprüfung der Amplifikation mittels Agarosegelelektrophorese wurden 10 μl der Amplifikationsprodukte mit 3 μl NEBuffer BceAl (New England Biolabs), 0,3 μl 10 mg/ml BSA, 13,7 μl Wasser und 3 μl BceAl (1 U/μl) vermischt. Es wurde 4 h bei 37°C inkubiert, dann für 20 min. bei 65°C denaturiert. 9 μl dieser Reaktion wurden mit 1 μl ddNTP-Mix (je 10 mM FAM-ddATP, JOE-ddTTP, ROX-ddATP und TAMRA-ddCTP, PerkinElmer Life Sciences Inc., Boston) und 0,5 μl Klenow-Polymerase (5 U/μl, New England Biolabs) vermischt und 5 min. bei 37°C inkubiert. Nach Abstoppen mit EDTA und Hitzedenaturierung für 20 min. bei 75°C wurde mit Wasser auf 50 μl verdünnt und mittels QiaQuick- Säulen gereinigt. Auftrennung, Auswertung und Analyse der Daten wurden analog Beispiel 4 durchgeführt.

Claims

Patentansprüche
Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte: a) Bereitstellung mindestens einer Mischung von solchen Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease aufweisen, b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt, c) Identifikation eines oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) und gegebenenfalls Identifikation weiterer fragmentspezifischer Eigenschaften der geschnittenen Nukleinsaurefragmente aus (b), wobei diese Identifikation(en) simultan für mehrere oder für alle Nukleinsaurefragmente erfolgen.
Verfahren zur Analyse von Nukleinsaurefragmenten, umfassend die Schritte:
(a) Bereitstellung einer Mischung von Nukleinsaurefragmenten, die mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease aufweisen,
(b) Inkubation zumindest einer Teilmenge der Mischung von Nukleinsaurefragmenten aus Schritt (a) mit mindestens einer Restriktionsendonuklease, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt und welche überhängende Enden bekannter Position und Länge, aber unbekannter Sequenz erzeugt, (c) Identifikation jeweils eines oder mehrerer Nukleotide der überhängenden Enden der geschnittenen Nukleinsaurefragmente aus (b) und gegebenenfalls Identifikation weiterer fragmentspezifischer Eigenschaften der geschnittenen
Nukleinsaurefragmente aus (b), wobei diese Identifikation(en) simultan für mehrere oder für alle Nukleinsaurefragmente erfolgen.
Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß im Rahmen der Identifikation in Schritt (c) zusätzlich die Auftrennung der geschnittenen Nukleinsaurefragmente nach fragmentspezifischen Eigenschaften erfolgt. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die Auftrennung der geschnittenen Nukleinsaurefragmente nach fragmentspezifischen Eigenschaften durch Gelelektrophorese erfolgt.
Verfahren nach Anspruch 4, dadurch gekennzeichnet, daß die Auftrennung durch Kapillarelektrophorese erfolgt.
Verfahren nach einem der Ansprüche 1 bis 5, dadurch gekennzeichnet, daß der Verfahrensschritt (c) die folgenden Einzelschritte (ca) bis (cd) umfaßt:
ca) Identifikation jeweils eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cb) gegebenenfalls Identifikation jeweils eines weiteren Nukleotids der geschnittenen
Nukleinsaurefragmente aus (b), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, cc) gegebenenfalls Wiederholung von Schritt (cb), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, cd) Zusammenfassung der in den Schritten (ca) bis (cc) erhaltenen Sequenzinformation für eine ausgewählte Gruppe oder alle Nukleinsäure-Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, wobei die Nukleotid-Identifikation in den Schritten (ca) bis (cc) gegebenenfalls auch die Auftrennung der Nukleinsaurefragmente der Mischung mit umfaßt.
Verfahren nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß eine von der in Schritt (b) zu inkubierenden Teilmenge verschiedene Teilmenge der in Schritt (a) bereitgestellten Mischung von Nukleinsaurefragmenten den folgenden
Verfahrensschritten (aa) bis (ad) unterworfen wird: aa) Auftrennung der Mischung von Nukleinsaurefragmenten nach mindestens einer fragmentspezifischen Eigenschaft, ab) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der in (aa) aufgetrennten Mischung, ac) gegebenenfalls Vergleich der in (aa) und/oder (ab) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsaurefragmenten aus Schritt (a), ad) gegebenenfalls Registrierung von in (ab) detektierten Nukleinsaurefragmenten, welche in verschiedenen Mischungen von Nukleinsaurefragmenten in unterschiedlicher relativer Häufigkeit auftreten,
während eine andere Teilmenge ausgewählt aus der Gruppe (I) bis (III) nach den Schritten (b) und (c) behandelt wird, wobei
I) eine weitere Teilmenge der in Schritt (a) bereitgestellten Mischung von Nukleinsaurefragmenten,
II) eine Teilmenge der in Schritt (a) bereitgestellten Mischung von Nukleinsaurefragmenten, die zuvor nach mindestens einer fragmentspezifischen Eigenschaft aufgetrennt worden ist,
III) eine mit (I) oder (II) zumindest zum Teil identische Mischung von Nukleinsaurefragmenten, ist.
8. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in einem zusätzlichen Verfahrensschritt mindestens ein interessierendes Fragment entweder aus der Mischung von Nukleinsäure-Fragmenten aus (a) oder aus einer Mischung von Nukleinsäure-Fragmenten aus (a), die zuvor nach einer fragmentspezifischen Eigenschaft aufgetrennt worden ist, isoliert wird. Verfahren nach Anspruch 6, dadurch gekennzeichnet, daß in einem zusätzlichen Verfahrensschritt mindestens ein interessierendes Fragment entweder aus der Mischung von Nukleinsäure-Fragmenten aus (a) oder „ aus einer Mischung von Nukleinsäure-Fragmenten aus (a), die zuvor nach einer fragmentspezifischen Eigenschaft aufgetrennt worden ist, isoliert wird.
Verfahren nach Anspruch 9, dadurch gekennzeichnet, daß in dem zusätzlichen
Verfahrensschritt zur Isolierung von Fragmenten fragmentspezifische Oligonukleotidprimer unter Verwendung der in Schritt (cd) ermittelten Signaturen hergestellt und anschließend zur spezifischen Amplifikation dieser Fragmente mittels
PCR aus dem Gemisch von Nukleinsaurefragmenten eingesetzt werden.
Verfahren nach einem der Ansprüche 6 bis 10, dadurch gekennzeichnet, daß die in Schritt (cd) erhaltenen Signaturen einzelner Nukleinsaurefragmente der
Fragmentmischung in einer Datenbanksuche zur Identifizierung dieser Fragmente eingesetzt werden.
Verfahren nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die Mischung von Nukleinsaurefragmenten aus (a) eine Mischung von cDNA-Fragmenten oder eine Mischung von Fragmenten genomischer DNA ist.
Verfahren nach einem der Ansprüche 1 bis 12, dadurch gekennzeichnet, daß die Mischung von Nukleinsaurefragmenten aus (a) Restriktionsfragmente umfaßt, die aus der Inkubation eines Nukleinsäure-Gemisches mit mindestens einem
Restriktionsenzym hervorgegangen sind.
Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß als Mischung von Nukleinsaurefragmenten aus (a) mindestens eine weitere Teilmenge bereitgestellt wird, die durch die folgenden Schritte hergestellt wird:
beidseitige Flankierung der Restriktionsfragmente der Mischung mit identischen oder verschiedenen Adaptern ii) Hybridisierung der Fragmente aus Schritt (i) mit jeweils unterschiedlichen Primern, die alle zu den Adaptern aus Schritt (i) komplementäre Bereiche aufweisen und die an ihrem 3 '-Ende jeweilig ein oder mehrere Nukleotide aufweisen, welche über den zum
Adapter komplementären Bereich hinausragen und komplementär zu einer Teilmenge der Fragmente aus der Nukleinsäuremischung aus (a) sind. iii) sequenzspezifische Extension der Primer aus (ii) und gegebenenfalls anschließende PCR-Amplifikation der Nukleinsaurefragmente aus der Fragmentmischung, die in Schritt (ii) sequenzspezifisch verlängert worden waren.
15. Verfahren nach einem der Ansprüche 1 bis 14, wobei die Mischung aus Nukleinsaurefragmenten aus Schritt (a) dadurch bereitgestellt wird, daß die jeweiligen Nukleinsaurefragmente der zu analysierenden Fragmentmischung mit einem oder mehreren Linkern ligiert werden, die an mindestens einer spezifischen Position mindestens eine Erkennungsstelle für eine Restriktionsendonuklease besitzen, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt.
16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, daß die jeweiligen Nukleinsaurefragmente der zu analysierenden Fragmentmischung mit jeweils mehreren verschiedenen Linkern ligiert werden, die sich untereinander in der Position der Erkennungsstelle für eine Restriktionsendonuklease unterscheiden, deren Schnittstelle außerhalb ihrer Erkennungsstelle liegt.
17. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß die für mehrere oder alle Nukleinsaurefragmente simultane Identifikation einer oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) über das Auffüllen überhängender Enden mit Markierungsgruppen tragenden Abbruchnukleotiden nach der Sequenzierungsmethode nach Sanger durchgeführt wird.
18. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß die in Schritt c) für mehrere oder alle Nukleinsaurefragmente simultane Identifikation einer oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) über die folgenden Schritte (cm) bis (cp) erfolgt:
cm)Hybridisierung jeweils eines Stranges der Nukleinsaurefragmente aus (b) mit selektiven Oligonukleotidprimern, deren am 3 '-Ende gelegenes Nukleotid oder Nukleotide mit dem oder den zu sequenzierenden Nukleotiden des jeweiligen Stranges hybridisieren können cn) Extension dieser selektiven Oligonukleotidprimer; cp) Identifikation derjenigen selektiven Oligonukleotidprimer, welche in Schritt (cn) verlängert wurden.
19. Verfahren nach einem der Ansprüche 1 bis 16, dadurch gekennzeichnet, daß die parallele Identifikation einer oder mehrerer Nukleotide der geschnittenen Nukleinsaurefragmente aus (b) über die sequenzspezifische Befestigung von Adaptern mit überhängenden Enden geeigneter Länge und Sorte erfolgt, welche sich in ihrem
Überhang voneinander unterscheiden.
20. Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß die überhängenden Enden der eingesetzten Adapter einen degenerierten Anteil und einen Anteil mit definierter Sequenz umfassen.
21. Verfahren nach Anspruch 19 oder 20, dadurch gekennzeichnet, daß die eingesetzten Adapter, deren überhängende Enden unterschiedliche Anteile mit definierter Sequenz umfassen, unterschiedlich markiert sind.
22. Verfahren nach einem der Ansprüche 1 bis 21, dadurch gekennzeichnet, dass es zur Katalogisierung von Nukleinsäure-Signaturen eingesetzt wird.
23. Verfahren nach einem der Ansprüche 1 bis 21, dadurch gekennzeichnet, dass es zur Erzeugung von EST-Banken eingesetzt wird.
24. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, dass es zur Identifikation von Genen eingesetzt wird, die in mindestens zwei biologischen Proben untereinander differentiell exprimiert sind.
25. Verfahren nach Anspruch 24, dadurch gekennzeichnet,
daß Verfahrensschritt a) die folgenden Teilschritte al) bis el) umfaßt, wobei al) bis el) folgendermaßen lauten: al) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, insbesondere mindestens einer Mischung von cDNA-Fragmenten, bl) Auftrennung der Mischung von Nukleinsäure-Fragmenten aus al) nach mindestens einer fragmentspezifischen Eigenschaft, cl) gegebenenfalls Detektion der relativen Häufigkeit einiger oder aller Fragmente in der aufgetrennten Mischung aus bl), dl) gegebenenfalls Vergleich der in (bl) und/oder (cl) erhaltenen Informationen über die Zusammensetzung verschiedener Mischungen von Nukleinsäure-Fragmenten aus (al) el) gegebenenfalls Registrierung von in (dl) detektierten Nukleinsäure-Fragmenten, welche in verschiedenen Mischungen von Nukleinsäure-Fragmenten in unterschiedlicher relativer Häufigkeit auftreten;
daß Verfahrensschritt b) durch Verfahrensschritt fl) ersetzt wird, wobei fl) folgendermaßen lautet: fl) Inkubation einer Mischung von Nukleinsaurefragmenten, ausgewählt aus der Gruppe I: eine Teilmenge der Mischung aus (al), der Gruppe II: die in (bl) aufgetrennte Mischung von cDNA-Fragmenten oder ein Teil hiervon, der Gruppe III: eine mit der Mischung aus (al) oder der aufgetrennten Mischung aus (bl) mindestens teilweise identische Mischung von Nukleinsaurefragmenten, jedoch zusätzlich aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, mit mindestens einer außerhalb ihrer Erkennungsstelle schneidenden Restriktionsendonuklease;
und daß Verfahrensschritt c) die folgenden Teilschritte gl) bis kl) umfaßt, wobei gl) bis kl) folgendermaßen lauten:
gl) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, hl) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (fl), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente erfolgt, il) gegebenenfalls Wiederholung von Schritt (hl), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, jl) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (fl) bis (il), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart variiert wird, daß die Wiederholung der Schritte (fl) bis (il) jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlaubt, kl) Zusammenfassung der in den Schritten (gl) bis 1) erhaltenen Sequenzinformation für alle Nukleinsäure-Fragmente oder für eine ausgewählte Gruppe der Nukleinsäure- Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur gegebenenfalls neben der Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthält;
und daß gegebenenfalls zusätzlich mindestens einer der optionalen Schritte 11) und ml) durchgeführt wird, wobei 11) und ml) folgendermaßen lauten:
11) Gewinnung interessierender Fragmente aus der Mischung von Nukleinsäure- Fragmenten aus (al) oder (bl), wobei die interessierenden Fragmente vorzugsweise die in (el) registrierten Fragmente sind, ml) Identifikation der zu den interessierenden Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels Durchsuchen elektronischer Datenbanken, wobei die interessierenden Fragmente vorzugsweise die in (el) registrierten Fragmente sind.
26. Verfahren nach Anspruch 24, dadurch gekennzeichnet,
daß Verfahrensschritt a) durch den Verfahrensschritt a2) ersetzt wird, wobei a2) folgendermaßen lautet:
a2) Bereitstellung mindestens einer Mischung von Nukleinsäure-Fragmenten, aufweisend einen Linker und, innehalb der Sequenz des Linkers, aufweisend mindestens eine Erkennungsstelle für mindestens eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease, daß Verfahrensschritt b) durch den Verfahrensschritt b2) ersetzt wird, wobei b2) folgendermaßen lautet:
b2) Inkubation der Mischung von Nukleinsaurefragmenten aus (a2) mit der mindestens einen Restriktionsendonuklease aus Schritt (a2),
daß Verfahrensschritt c) die Teilschritte c2) bis i2) umfaßt, wobei c2) bis i2) folgendermaßen lauten: c2) Identifikation eines ersten Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2), wobei die Identifikation simultan für mehrere oder alle Nukleinsaurefragmente der Mischung, sowie unter Auftrennung der Mischung geschnittener Nukleinsäure- Fragmente nach mindestens einer fragmentspezifischen Eigenschaft erfolgt, d2) gegebenenfalls Identifikation eines weiteren Nukleotids der geschnittenen Nukleinsaurefragmente aus (b2) gemäß Schritt (c2), e2) gegebenenfalls Wiederholung von Schritt (d2), bis die gewünschte Anzahl von Nukleotiden identifiziert worden ist, f2) gegebenenfalls ein- oder mehrmalige Wiederholung der Schritte (a2) bis (e2), wobei die Position und/oder Sequenz der Erkennungsstelle jeweils derart verändert wurde, daß ihre Wiederholung jeweils die Identifikation zuvor noch nicht identifizierter Nukleotide erlaubt, g2) Zusammenfassung der in den Schritten (c2) bis (f2) erhaltenen Sequenzinformation für alle Nukleinsäure-Fragmente oder für eine ausgewählte Gruppe der Nukleinsäure- Fragmente zu fragmentspezifischen Signaturen, wobei eine Signatur neben der
Sequenzinformation noch weitere Informationen über das jeweilige Fragment enthalten kann, h2) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft in
(c2) erhaltenen fragmentspezifischen Informationen zu den in (g2) für die Nukleinsäure-Fragmente erhaltenen Signaturen, wobei die fragmentspezifischen
Informationen im Fall einer elektrophoretischen Auftrennung der Fragmente die relative oder absolute Mobilität der Fragmente und/oder die anhand eines Längenstandards ermittelte scheinbare oder tatsächliche Fragmentlänge umfassen und wobei die Zuordnung in tabellarischer und/oder computerlesbarer Form erfolgen kann, i2) gegebenenfalls Identifikation der zu den Nukleinsäure-Fragmenten gehörigen Gene, von denen sich die Nukleinsäure-Fragmente herleiten, mittels Durchsuchen elektronischer Datenbanken nach den Signaturen aus (g2);
und daß zusätzlich mindestens einer der Schritte j2) bis p2) durchgeführt wird, wobei 11) und ml) folgendermaßen lauten: j2) gegebenenfalls Bereitstellung mindestens einer weiteren Mischung von Nukleinsäure- Fragmenten, gewonnen auf analoge Weise zu der Mischung von Nukleinsäure-
Fragmenten aus (a2), wobei hier auf die Anfügung von Linkem aufweisend mindestens eine Erkennungsstelle für eine außerhalb ihrer Erkennungsstelle schneidende Restriktionsendonuklease verzichtet werden kann, k2) Auftrennung der Mischung von Nukleinsäure-Fragmenten aus Q2) nach einer fragmentspezifischen Eigenschaft,
12) Zuordnung der bei der Auftrennung nach einer fragmentspezifischen Eigenschaft in (k2) erhaltenen fragmentspezifischen Informationen zu den einzelnen aufgetrennten Fragmenten, m2) gegebenenfalls Vergleich der relativen oder absoluten Häufigkeiten mindestens eines Teils der in (k2) aufgetrennten Fragmente mit den relativen oder absoluten
Häufigkeiten der jeweils homologen, aus anderen Nukleinsäurefragment-Mischungen stammenden Fragmente, n2) gegebenenfalls Registrierung derjenigen Fragmente, deren relative oder absolute Häufigkeit sich von der relativen oder absoluten Häufigkeit ihrer homologen, aus anderen Nukleinsäurefragment-Mischungen stammenden Fragmente unterscheidet, o2) gegebenenfalls Zuordnung der in (n2) registrierten Fragmente zu denjenigen Genen bzw. Transkripten, von denen sich besagte registrierte Fragmente herleiten, p2) gegebenenfalls Gewinnung der in (n2) registrierten Fragmente aus der Mischung von Nukleinsäure-Fragmenten aus (a2) oder (i2) und/oder ), wobei die Schritte (i2) bis (n2) auch vor den Schritten (a2) bis (h2) durchgeführt werden können.
PCT/EP2003/002032 2002-02-27 2003-02-27 Analyse von nukleinsäure-fragmentmischungen un genexpressionsanalyse WO2003072819A2 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
AU2003210377A AU2003210377A1 (en) 2002-02-27 2003-02-27 Analysis of mixtures of nucleic acid fragments and of gene expression
US10/504,847 US20060029937A1 (en) 2002-02-27 2003-02-27 Analysis of mixtures of nucleic acid fragments
EP03742963A EP1492888A2 (de) 2002-02-27 2003-02-27 Analyse von nukleinsäure-fragmentmischungen und genexpressionsanaylse
CA002480320A CA2480320A1 (en) 2002-02-27 2003-02-27 Analysis of mixtures of nucleic acid fragments and of gene expression

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10208333A DE10208333A1 (de) 2002-02-27 2002-02-27 Analyse von Nukleinsäure-Fragmentmischungen
DE10208333.9 2002-02-27

Publications (2)

Publication Number Publication Date
WO2003072819A2 true WO2003072819A2 (de) 2003-09-04
WO2003072819A3 WO2003072819A3 (de) 2004-07-22

Family

ID=27675015

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2003/002032 WO2003072819A2 (de) 2002-02-27 2003-02-27 Analyse von nukleinsäure-fragmentmischungen un genexpressionsanalyse

Country Status (6)

Country Link
US (1) US20060029937A1 (de)
EP (1) EP1492888A2 (de)
AU (1) AU2003210377A1 (de)
CA (1) CA2480320A1 (de)
DE (1) DE10208333A1 (de)
WO (1) WO2003072819A2 (de)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5858671A (en) * 1996-11-01 1999-01-12 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
US6013445A (en) * 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
WO2000053806A1 (en) * 1999-03-05 2000-09-14 Chugai Pharmaceutical Co. Ltd. Method of identifying gene transcription patterns
WO2002002805A2 (en) * 2000-06-30 2002-01-10 Syngenta Participations Ag Method for identification, separation and quantitative measurement of nucleic acid fragments

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19518505A1 (de) * 1995-05-19 1996-11-21 Max Planck Gesellschaft Verfahren zur Genexpressionsanalyse
US6016445A (en) * 1996-04-16 2000-01-18 Cardiotronics Method and apparatus for electrode and transthoracic impedance estimation
DE69929542T2 (de) * 1998-10-27 2006-09-14 Affymetrix, Inc., Santa Clara Komplexitätsmanagement und analyse genomischer dna
US6468749B1 (en) * 2000-03-30 2002-10-22 Quark Biotech, Inc. Sequence-dependent gene sorting techniques

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6013445A (en) * 1996-06-06 2000-01-11 Lynx Therapeutics, Inc. Massively parallel signature sequencing by ligation of encoded adaptors
US5858671A (en) * 1996-11-01 1999-01-12 The University Of Iowa Research Foundation Iterative and regenerative DNA sequencing method
WO2000053806A1 (en) * 1999-03-05 2000-09-14 Chugai Pharmaceutical Co. Ltd. Method of identifying gene transcription patterns
WO2002002805A2 (en) * 2000-06-30 2002-01-10 Syngenta Participations Ag Method for identification, separation and quantitative measurement of nucleic acid fragments

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
GREEN C D ET AL: "Open systems: panoramic views of gene expression" JOURNAL OF IMMUNOLOGICAL METHODS, ELSEVIER SCIENCE PUBLISHERS B.V.,AMSTERDAM, NL, Bd. 250, Nr. 1-2, 1. April 2001 (2001-04-01), Seiten 67-79, XP004230695 ISSN: 0022-1759 *
SHIMKETS R A ET AL: "Gene expression analysis by transcript profiling coupled to a gene database query" NATURE BIOTECHNOLOGY, NATURE PUBLISHING, US, Bd. 17, August 1999 (1999-08), Seiten 798-803, XP002130008 ISSN: 1087-0156 in der Anmeldung erwähnt *

Also Published As

Publication number Publication date
EP1492888A2 (de) 2005-01-05
DE10208333A1 (de) 2003-09-04
AU2003210377A1 (en) 2003-09-09
AU2003210377A8 (en) 2003-09-09
CA2480320A1 (en) 2003-09-04
US20060029937A1 (en) 2006-02-09
WO2003072819A3 (de) 2004-07-22

Similar Documents

Publication Publication Date Title
EP0743367B2 (de) Verfahren zur Genexpressionsanalyse
DE69233719T2 (de) Primer, Sätze und Restriktionsfragmente und deren Benutzung in selektiver Restriktionsfragmentenamplifikation
DE102008025656B4 (de) Verfahren zur quantitativen Analyse von Nukleinsäuren, Marker dafür und deren Verwendung
DE69627768T2 (de) Reihenanalyse-Verfahren der Genexpression
DE60025850T2 (de) Verfahren zur erzeugung von oligonukleotiden, im besonderen zur detektion amplifizierter restriktionsfragmente, die durch aflp erhalten wurden
DE60219199T2 (de) Analyse und detektion von mehreren zielsequenzen unter verwendung von zirkulären proben
DE10056802B4 (de) Verfahren zur Detektion von Methylierungszuständen zur toxikologischen Diagnostik
DE69937447T2 (de) Verfahren zur erkennung von nukleinsäuren
DE4129653A1 (de) Verfahren zum nachweis aehnlicher nukleinsaeuren
DE60014067T2 (de) Zusammensetzungen und verfahren zur genetischen analyse
DE10130800A1 (de) Verfahren zum Nachweis von Cytosin-Methylierung mit hoher Sensitivität
WO2001042493A2 (de) Verfahren zur parallelen detektion des methylierungszustandes von genomischer dna
EP1369493B1 (de) Verfahren zur quantitiven Bestimmung des Methylierungsgrades von Cytosinen in CpG-Positionen
DE3901675A1 (de) Reinigung polymorpher komponenten komplexer genome
EP1228246B1 (de) Verfahren zur unterscheidung von 5-position methylierungsänderungen
DE19635347C1 (de) Sequentielle Hybridisierung von Pilzzellen-DNA sowie Verfahren zum Nachweisen von Pilzzellen in klinischem Material
WO2003072819A2 (de) Analyse von nukleinsäure-fragmentmischungen un genexpressionsanalyse
EP1055003A1 (de) VERFAHREN ZUR CHARAKTERISIERUNG VON mRNA-MOLEKÜLEN
DE10144132A1 (de) Identifikation und Quantifizierung von Nukleinsäuren durch Erzeugen und Analyse von Sequenz-tags einheitlicher Länge
DE602004008916T2 (de) Verfahren zur herstellung eines genexpressionsprofils
DE60109002T2 (de) Methode zum Nachweis von transkribierten genomischen DNA-Sequenzen
WO2004033721A2 (de) Hybridisierungsproben reduzierter komplexität
EP3094745B1 (de) Verfahren zur dekonvolution nukleinsäure enthaltender substanzgemische
DE60318315T2 (de) Nukleinsäure vervielfältigungsverfahren
DE10060827A1 (de) Verfahren zur Codierung von Hybridisierungssonden

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ OM PH PL PT RO RU SC SD SE SG SK SL TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IT LU MC NL PT SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2480320

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2003742963

Country of ref document: EP

ENP Entry into the national phase

Ref document number: 2006029937

Country of ref document: US

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 10504847

Country of ref document: US

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

WWP Wipo information: published in national office

Ref document number: 2003742963

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 10504847

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: JP

WWW Wipo information: withdrawn in national office

Country of ref document: JP