WO2001042493A2 - Verfahren zur parallelen detektion des methylierungszustandes von genomischer dna - Google Patents

Verfahren zur parallelen detektion des methylierungszustandes von genomischer dna Download PDF

Info

Publication number
WO2001042493A2
WO2001042493A2 PCT/DE2000/004381 DE0004381W WO0142493A2 WO 2001042493 A2 WO2001042493 A2 WO 2001042493A2 DE 0004381 W DE0004381 W DE 0004381W WO 0142493 A2 WO0142493 A2 WO 0142493A2
Authority
WO
WIPO (PCT)
Prior art keywords
factor
dna
binding protein
primers
transcription factor
Prior art date
Application number
PCT/DE2000/004381
Other languages
English (en)
French (fr)
Other versions
WO2001042493A3 (de
Inventor
Alexander Olek
Christian Piepenbrock
Original Assignee
Epigenomics Ag
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Epigenomics Ag filed Critical Epigenomics Ag
Priority to DE10083729T priority Critical patent/DE10083729D2/de
Priority to US10/149,109 priority patent/US20040248090A1/en
Priority to EP00989842A priority patent/EP1238112A2/de
Priority to CA002395047A priority patent/CA2395047A1/en
Priority to AU26632/01A priority patent/AU778411B2/en
Publication of WO2001042493A2 publication Critical patent/WO2001042493A2/de
Publication of WO2001042493A3 publication Critical patent/WO2001042493A3/de

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Definitions

  • the present invention relates to a method for the parallel detection of the methylation state of genomic DNA.
  • the present invention describes a method for parallel detection of the methylation state of genomic DNA samples, starting from a sample simultaneously amplifying numerous different fragments from sequences involved or / and transcribed and / or translated sequences and then the sequence context contained in the amplified fragments of CpG Dinucleotides is examined.
  • 5-Methylcytosine is the most common covalently modified base in the DNA of eukaryotic cells. For example, it plays a role in the regulation of transcription, genomic imprinting and in tumorigenesis. The identification of 5-methylcytosine as a component of genetic information is therefore of considerable interest. However, 5-methylcytosine positions cannot be identified by sequencing since 5-methylcytosine has the same base pairing behavior like cytosine. In addition, in the case of PCR amplification, the epigenetic information which the 5-methylcytosines carry is completely lost. The modification of the genomic base cytosine to 5'-methylcytosine represents the most important and best-studied epigenetic parameter to date. Nevertheless, there are still methods to determine comprehensive genotypes of cells and individuals, but no comparable approaches to a large extent Generate and evaluate epigenotypic information.
  • REs restriction endonucleases
  • methylation-sensitive restriction endonucleases
  • REs are characterized by the fact that they cut a DNA into a specific DNA sequence, usually between 4 and 8 bases long The position of such sections can then be verified by gel electrophoresis, transfer to a membrane and hybridization.
  • Methylation-sensitive means that certain bases within the recognition sequence must be unmethylated in order for the section to be carried out according to the methylation pattern of the DNA
  • the fewest methylable CpG are within the recognition sequences of REs and cannot be examined with this method.
  • PCR combines a variant with this method; amplification by two primers located on both sides of the recognition sequence takes place after a cut only if the recognition sequence is methylated.
  • the sensitivity increases theoretically to a single molecule of the target sequence, but only individual positions can be examined with great effort (Shemer, R. et al., PNAS 93, 6371-6376). Again, it is a prerequisite that the methylable position is within the recognition sequence of a RE.
  • a relatively new and the most frequently used method for the investigation of DNA for 5-methylcytosine is based on the specific reaction of bisulfite with cytosine, which is converted into uracil after subsequent alkaline hydrolysis, which corresponds to the thymidine in its base-pairing behavior.
  • 5-methylcytosine is not modified under these conditions.
  • the original DNA is thus converted in such a way that methylcytosine, which originally cannot be distinguished from the cytosine by its hybridization behavior, can now be detected by "normal" molecular biological techniques as the only remaining cytosine, for example by amplification and hybridization or sequencing.
  • 5-methylcytsosine can also be found in the following review article: Rein, T., DePamphilis, M. L, Zorbas, H., Nucleic Acids Res. 26, 2255 (1998).
  • MAR matrix attachment regions
  • SAR scaffold attachment regions
  • insulators can, for example, inhibit the effect of the enhancer on the promoter if they are located between the enhancer and the promoter or, if they are located between heterochromatin and a gene, protect the active gene from the influence of the heterochromatin.
  • Examples of such insulators are: 1. So-called LCR (locus control regions), which consists of several sites that are hypersensitive to DNAase I; 2. Certain sequences such as SCS (specialized chromatin structures) or SCS ', 350 or 200 bp long and highly resistant to degradation by DNAase I and flanked on both sides by hypersensitive sites (100 bp spacing). The protein BEAF-32 binds to scs'. These insulators can lie on both sides of the gene.
  • Patents related generally to the use of oligomer arrays and photolithographic mask design include e.g. B. US-A 5,837,832, US-A 5,856,174, WO-A 98/27430 and US-A 5,856,101.
  • Patents that restrict the use of photolabile protective groups on nucleosides such as. B. WO-A98 / 39348 and US-A 5,763,599.
  • Matrix-assisted laser desorption / ionization mass spectrometry is a new, very powerful development for the analysis of biomolecules (Karas, M. and Hillenkamp, F. 1988. Laser desorption ionization of proteins with molecular masses exceeding 10,000 daltons. Anal. Chem 60: 2299-2301).
  • An analyte molecule is embedded in a UV absorbing matrix.
  • a short laser pulse evaporates the matrix into a vacuum, thus transporting the analyte unfragmented into the gas phase.
  • An applied voltage accelerates the ions into a field-free flight tube. Due to their different masses, ions are accelerated to different extents. Smaller ions reach the detector earlier than larger ones and the flight time is in the mass of the Converted ions.
  • Fluorescent-labeled probes have been used in many cases for scanning an immobilized DNA array.
  • the simple application of Cy3 and Cy5 dyes to the 5'OH of the respective probe is particularly suitable for fluorescence labeling.
  • the fluorescence of the hybridized probes is detected, for example, using a confocal microscope.
  • the dyes Cy3 and Cy5, among many others, are commercially available.
  • DNA base frequency counts indicate that the four bases in the DNA are not equally distributed. Accordingly, the following frequencies (probabilities of occurrence) of the bases can be determined from DNA databases.
  • Model 1 can be improved with the help of these values.
  • P 2s (PrimD) P b ⁇ NA ( ⁇ * P bDNA (A) '* P bDNA (CY * P büNA (G) c (model 3 for bisulfite DNA strand)
  • P 2a (PrimD) P b ⁇ NA (A r * P bDNA (T) '* P bDNA (G) s * P b ⁇ NA (c ⁇ (model 3 for anti-sense strand to a bisulfite DNA strand)
  • Model 3 takes this property into account and assumes that the primary DNA is a random sequence with dependence on directly adjacent bases (Markov chain of the first order).
  • the pairwise base probabilities determined empirically from the database result for both DNA strands as P bDNA (from; to) from the following table:
  • P 3s (PrimE) P rbDNA (B) P rbDNA ( B ⁇ • B l) P rbDNA ( B 2> 'ß l) P ' rbDNA ( B 3> 'B ⁇ )
  • the bisulfite treated DNA is amplified using a number of primers. From the point of view of the model, the DNA consists of one sense and one anti-sense strand with a length of N bases (all chromosomes are summarized here). A primer can be expected to be on the sense strand
  • target regions can be amplified simultaneously using appropriately adapted primer pairs. It is not absolutely necessary to know the sequence context of all these target regions in advance, since in many cases, as also exemplified below, consensus sequences from the sequencing of related target regions are known, which, as described below, are used for the design of specific target regions of specific or selective primer pairs can be.
  • the method is successfully applied when the amplification of the chemically pretreated genomic DNA yields more fragments up to a maximum of 2000 base pairs in length than can be statistically expected from the target regions to be examined in each case.
  • the statistical expected value for the number of these fragments is calculated using the formulas listed in the prior art.
  • the number of fragments produced in the amplification step can be detected by any molecular biological, chemical or physical method.
  • the human haploid genome contains 3 billion base pairs and 100,000 genes, which in turn code an average of 2,000 base pairs long mRNA, the genes including the introns are on average 15,000 base pairs long. Promoters cover an average of 1000 base pairs per gene. If the statistical expected value for the number of amplified products that are based on two primers in transcribed sequences must therefore be calculated, the expected value for the entire genome must first be calculated using the above formula (method 3) and with the proportion of the transcribed sequences in the total genome to calculate. The same procedure is used for parts of any genome as well as for promoters and translated sequences (coding for mRNA).
  • the present invention thus describes a method for the parallel detection of the methylation state of genomic DNA. Several cytosine methylations in a DNA sample are to be analyzed simultaneously. The following process steps are carried out one after the other:
  • genomic DNA sample is chemically treated in such a way that at the 5'-position unmethylated cytosine bases are converted into uracil, thymine or another base which is unlike the cytosine in hybridization behavior.
  • the treatment of genomic DNA with bisulfite (hydrogen sulfite, disulfite) and subsequent alkaline hydrolysis, which leads to a conversion of unmethylated cytosine nucleobases into uracil, is preferably used for this purpose.
  • a second process step more than ten different fragments are simultaneously amplified from the pretreated genomic DNA by using synthetic oligonucleotides as primers, whereby more than twice as many fragments as statistically expected come from sequences involved in transcription and / or translation that are involved in gene regulation. This can be achieved using various methods.
  • At least one of the oligonucleotides used for the amplification contains fewer nucleobases than statistically a sequence-specific hybridization to the chemically treated genomic DNA sample would be required, which can lead to the amplification of several fragments at the same time.
  • the total number of nucleobases contained in this oligonucleotide is less than 17. In a particularly preferred variant of the method, the number of nucleobases contained in this oligonucleotide is less than 14.
  • oligonucleotides with different sequences are used simultaneously in one reaction vessel for the amplification.
  • more than 26 different oligonucleotides are used simultaneously to produce a complex amplificate.
  • more than twice the number that is statistically to be expected comes from genome sections involved in the regulation of genes, e.g. Promoters and enhancers, comes as would be expected with a purely random choice of the oligonucleotide sequences.
  • more than twice the number of the amplified fragments originates from genome sections which are transcribed in mRNA in at least one cell of the respective organism, or from genome sections (exons) spliced into mRNA after transcription than would be expected if the oligonucleotide sequences were chosen at random.
  • more than twice the number of the amplified fragments comes from genome sections which code for parts of one or more gene families, or else they come from genome sections which are used for so-called “matrix attachment sites” (MARs).
  • MARs matrix attachment sites
  • more than twice as many of the amplified fragments come from genome sections which organize the packing density of the chromatin as so-called “boundary elements”, or else they come from multiple drug resistance genes (MDR) - Promoters or coding regions than would be expected with a purely random choice of the oligonucleotide sequences.
  • MDR drug resistance genes
  • two oligonucleotides or two classes of oligonucleotides are used to amplify the fragments described, one or a class of which, except in the context of CpG or CpNpG, may contain base C but not base G and which the other or the other class may contain the base G, but not the base C, except in the context of CpG or CpNpG.
  • the amplification is carried out by means of two oligonucleotides, one of which contains a four to sixteen base long sequence which is complementary to or corresponds to such a DNA as it would arise if an equally long DNA fragment, which one of the factors
  • Amt aryl hydrocarbon receptor nuclear translocator AML-1a CBFA2 core binding factor, runt domain, alpha subunit 2
  • AP-1 activator protein-1 (AP-1); Synonyms: c-Jun
  • CDP CUTL1 cut (Drosophila) -Iike 1 (CCAAT displacement protein)
  • CDP CUTL1 cut (Drosophila) -Iike 1 (CCAAT displacement protein)
  • CDP CR1 complement component (3b / 4b) receptor 1
  • CDP CR3 complement component (3b / 4b) receptor 3 CHOP-C / EBPalpha DDIT; DNA-damage-inducible transcript 3 / CCAAT / enhancer binding protein (C / EBP), alpha c-Myc / Max avian myelocytomatosis viral oncogene / MYC-ASSOCIATED
  • CRE-BP1 / c-Jun activator protein-1 (AP-1); Synonyms: c-Jun CREB MP responsive element binding protein E2F E2F transcription factor (originally identified as a DNA- binding protein essential E1A-dependent activation of the adenovirus E2 promoter)
  • E47 transcription factor 3 E2A immunoglobulin enhancer binding factors E12 / E47
  • E47 transcription factor 3 E2A immunoglobulin enhancer binding factors E12 / E47
  • Egr-1 early growth response 1 Egr-2 early growth response 2 (Krox-20 (Drosophila) homolog)
  • ELK-1 ELK1 member of ETS (environmental tobacco smoke) oncogene family
  • HNF-1 TCF1 transcription factor 1, hepatic; LF-B1, hepatic nuclear factor (HNF1), albumin proximal factor
  • IRF-1 interferon regulatory factor 1 IRF-1 interferon regulatory factor 1
  • MEF-2 MADS box transcription enhancer factor 2, polypeptide A (myocyte enhancer factor 2A)
  • MZF1 ZNF42 zinc finger protein 42 (myeloid-specific retinoic acid-responsive)
  • MZF1 ZNF42 zinc finger protein 42 (myeloid-specific retinoic acid-responsive)
  • NF-E2 NFE2 nuclear factor (erythroid-derived 2), 45kD NF-kappaB (p50) nuclear factor of kappa light polypeptide gene enhancer in B-cells p50 subunit
  • P53 tumor protein p53 (Li-Fraumeni syndrome); TP53
  • Pax-3 paired box gene 3 (Waardenburg syndrome 1)
  • Pax-6 paired box gene 6 aniridia, keratitis
  • SRF serum response factor c-fos serum response element-binding transcription factor
  • TATA cellular and viral TATA box elements Tax / CREB Transiently-expressed axonal glycoprotein / cAMP responsive element binding protein
  • TCF11 Transcription Factor 11; TCF11; NFE2L1; nuclear factor
  • YY1 ubiquitously distributed transcription factor belonging to theGLI-Kruppel class of zinc finger proteins
  • binds would be treated chemically in such a way that at the 5'-position unmethylated cytosine bases are converted into uracil, thymidine or another base which is unlike the cytosine in terms of hybridization behavior.
  • the amplification is carried out by means of two oligonucleotides or two classes of oligonucleotides, of which one or the one class contains the four to sixteen base long sequence which is complementary to or corresponds to such a DNA as it arises would, if an equally long DNA fragment, which can bring about the specific localization of genome / chromatin sections within the cell nucleus via its sequence or secondary structure, were treated in such a way that unmethylated cytosine bases in the 5'-position in uracil, thymidine or another of the Hybridization behavior from the base which is dissimilar to the cytosine can be transformed.
  • the amplification is carried out by means of two oligonucleotides or two classes of oligonucleotides, one or one of which is one of the sequences
  • TCGCGTGTA TACACGCGA
  • TGTACGCGA TGTACGCGA
  • TCGCGTACA TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC, TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACG, TTGTACGCTA, TCGCGTACG
  • ATTGCGTGT ACACGCAAT, GTACGTAAT, ATTACGTAC, ATTGCGTGA, TCACGCAAT, TTACGTAAT, ATTACGTAA, ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGATA, ATCGCGCTGAT, GTACTGGT
  • ATTAT ATAAT, GTAAT, ATTAC, ATTGT, ACAAT, GTAAT, ATTAC,
  • GAAAG CTTTC, TTTTT, AAAAA,
  • GTAAG GTAAG, CTTAC, TTTGT, ACAAA,
  • ATCGATTA ATCGATTA
  • TAATCGAT ATCGATCGAT
  • TAATCGAT ATCGATTA
  • ATCGATCGG CCGATCGAT, TCGATCGAT, ATCGATCGA, ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC,
  • TATCGATA TATCGATA, TATCGGTG, CACCGATA, TATTAATA, TATTAATA, TATTGGTG, CACCAATA,
  • TAGGTGTTA TAACACCTA, TAATATTTG, CAAATATTA, TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC,
  • GTAGGTGG CCACCTAC, TTATTTGT, ACAAATAA, GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT,
  • TGCGTGGGCGG CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA, TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT,
  • TGCGTAGGCGT ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT, TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA, ATAGGAAGT, ACTTCCTAT, ATTTTTTGT, ACAAAAAAT TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT, TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC, TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT, TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAACGTTAATTAAT
  • TAGATAA TTATCTA, TTATTTG, CAAATAA, TTGATAA, TTATCAA, TTATTAG, CTAATAA, GATAA, TTATC, TTATT, AATAA,
  • GATAG GATAG
  • CTATC TTATT
  • AATAA AATAA
  • GATAAG AATAAG
  • CTTATC TTTATT
  • AATAAA AATAAA
  • TGTTTATTTA TAAATAAACA, TAAATAAATA, TATTTATTTA, TGTTTGTTTA, TAAACAAACA, TAAATAAATA, TATTTATTTA, TATTTATTTA, TAAATAAATA, TAAATAAATA, TATTTATTTA, TATTTGTTTA, TAAACAAATA, TAAATAATA
  • TAAAGTTTA TAAACTTTA, TGAATTTTG, CAAAATTCA, TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA,
  • AAAGTGAAATT AATTTCACTTT, GGTTTTATTTT, AAAATAAAACC, AAAGCGAAATT, AATTTCGCTTT, GGTTTCGTTTT, AAAACGAAACC,
  • CAATTTCTCTTTTCC TAGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTT
  • TTATTAAAAATAGAAA TTTCTATTTTTAATAACA, TTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAA, TGTTATTAAAAATAGAAT, ATTCTATTTTTAATAACA, GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC, TTACTACAAA, TTACTAGCACCA
  • TAGGGG CCCCTA
  • TTTTTA TAAAAA
  • GAGGGG CCCCTC
  • TTTTTT AAAAAA
  • TGTTGAGTTAT ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, GGGGATTTTT, AAAAATCCCC, GGGAATTTTT, AAAAATTCCC, GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, GGAAATTTTT, AAAAATTTCC, GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, GGGAATT
  • ATAAT ATAAT
  • ATTAT ATTAT
  • ATAAT GTAAT
  • ATTAC ATTAT
  • ATAAT ATAAT
  • CGTTACGGTT AACCGTAACG, AATCGTGACG, CGTCACGATT, CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC, CGTTACGTTT, AAACGTAACG, AAGCGTGACG, CGTCACGACGTTCGGACGTC
  • TTTACGTATGA TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA, TTTACGTTTGA, TCAAACGTAAA, TTAAGCGTGAA, TTCACGCTTAA, TTTACGTTTTA, TAAAACGTAAA, TGAAGCGTGAA, TTCACGGGTACA
  • TAGGTTA TAACCTA, TGATTTA, TAAATCA
  • TTTTAAATTATTTT AAAATAATTTAAAA, GGGGTGGTTTGGGG,
  • TTTTAAATTTTTTTTT AAAAAAATTTAAAA, GGGGGGGTTTGGGG,
  • TTTTAAATAATTTT AAAATTATTTAAAA
  • GGGGTTGTTTGGGG GGGGTTGTTTGGGG
  • GAGGCGGGG CCCCGCCTC, TTTCGTTTT, AAAACGAAA, GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA, AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA, AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA,
  • GGGGGCGGGGT ACCCCGCCCCC, ATTTCGTTTTT, AAAAACGAAAT, GGGGGCGGGGT, ACCCCGCCCCC, GTTTCGTTTTT, AAAAACGAAAC, TATTATTTTAT, ATAAAATAATA, GTGGGGTGATAT, TATCAAGATAT, TATCAAGATAT, TATCAAGATAT, TATCAAGATAT
  • ATTACGTGAT ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATCACGTAAC,
  • TTTTATATGG CCATATAAAA, TTATATAAGG, CCTTATATAA, TTATATATGG, CCATATATAA, TTATATATGG, CCATATATAA, AAATAAT, ATTATTT, GTTGTTT, AAACAAC, AAATTAA, TTAATTT, TTAGTTT, AAACTAATTATT, AAACTAATATT, AAAT
  • GGGGGTTGACGTA TACGTCAACCCCC
  • TACGTTAATTTTT AAAAATTAACGTA
  • TAACGCATACCCCC ATGATTTAGTA
  • TACTAAATCAT TGTTGAGTTAT
  • ATAACTCAACA GTTAT
  • GTTAT ATAAC
  • ATGAT ATCAT
  • TTACGTGA TCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, TTACTTA, GACGTACA, TCACGTACA
  • TGACGTGT ACACGTCA
  • ATACGTTA TAACGTAT
  • TGACGTGG CCACGTCA
  • TTACGTTA TAACGTAA
  • CGGTTATTTTG CAAAATAACCG, TAAGATGGTCG or CGACCATCTTA
  • the oligonucleotides used for the amplification contain, in addition to the consensus sequences defined above, several positions at which either one of the three bases G, A and T or any of the bases C, A and T can be present.
  • the oligonucleotides used for the amplification contain, apart from one of the consensus sequences described above, a maximum of as many additional bases as are required for the simultaneous amplification of more than one hundred different fragments per reaction from the DNA treated chemically as above.
  • a third method step the sequence context of all or part of the CpG dinucleotides or CpNpG trinucleotides contained in the amplified fragments is examined.
  • the analysis is carried out by hybridizing the fragments already provided with a fluorescence marker in the amplification to an oligonucleotide array (DNA chip).
  • the fluorescent marker can be introduced either via the primers used or through a fluorescence-labeled nucleotide (eg Cy5-dCTP, commercially available from Amersham-Pharmacia).
  • Complementary fragments hybridize to the respective oligomers immobilized on the chip surface, non-complementary fragments are removed in one or more washing steps.
  • the fluorescence at the respective hybridization sites on the chip then allows conclusions to be drawn about the sequence context of the CpG dinucleotides or CpNpG trinucleotides contained in the amplified fragments.
  • the amplified fragments are immobilized on a surface and then hybridization is carried out with a combinatorial library of distinguishable oligonucleotide or PNA oligomer probes. Again, non-complementary probes are removed by one or more washing steps.
  • the hybridized probes are either detected via their fluorescent markers or, in a further particularly preferred variant of the method, are detected using matrix-assisted laser desorption / ionization mass spectrometry (MALDI-MS) on the basis of their unique mass.
  • MALDI-MS matrix-assisted laser desorption / ionization mass spectrometry
  • the amplification products can also be influenced in terms of their average size by changing the chain extension times in the amplification step. Since mainly smaller fragments (approx. 200-500 base pairs) are examined here, a shortening of the chain extension steps is e.g. B. a PCR useful.
  • the amplified products are Gel electrophoresis is separated and the fragments in the desired size range are cut out before your analysis.
  • the amplificates cut out of the gel are amplified again using the same set of primers. Then only fragments of the desired size can be created, since others are no longer available as templates.
  • Another object of the present invention is a kit containing at least two primer pairs, reagents and auxiliary substances for amplification and / or reagents and auxiliary substances for chemical treatment and / or a combinatorial probe library and / or an oligonucleotide array (DNA chip), insofar as they are necessary or useful for carrying out the method according to the invention.
  • the CG-rich regions in the human genome are so-called CpG islands, which have a regulatory function.
  • CpG Islands in such a way that they have at least 500 bp and a GC content of> 50%, and the ratio CG / GC is> 0.6.
  • 16 Mb are CpG Islands. This means that about 0.5% of the genome sequence lies in these CpG islands, if one also considers a region up to 1000 bp downstream. This consideration is based on data from the Ensembl Database from 10/31/00, source Sanger Center. The sequence available there was approx. 3.5 GB, and the repeats were masked for the calculations.
  • the primers are AGTAGTAGTAGT (Seq. ID 1) AAAACAAAAACC (Seq. ID 2) and alternatively AGTAGTAGTAGT (Seq. ID 19) and ACAAAAACTAAA (seq. ID 20).
  • the first pair of primers leads at least to the amplificates Seq. ID 3 to 18, the second pair of primers for the amplicons of Seq. ID 21 to 31.
  • F specifies the number of predicted amplicons that can be expected if one considers N bases as a database from the genome.
  • P is the respective probability of hybridization of a primer oligonucleotide, separated after hybridization in the sense and antisense strand.
  • M is the maximum permissible length of the amplicons to be expected.
  • the probability P is determined by a first order Markov chain.
  • the assumption is made that the DNA is a random sequence depending on neighboring bases.
  • the transition probabilities of neighboring bases are necessary for the calculation of a Markov chain. These were determined empirically from 12% of the assembled human genome, which was completely treated with bisulfite, and summarized in Table 1.
  • Table 2 shows the transition probabilities for the corresponding complementary reverse Strand specified. These result from simply swapping the entries in Table 1.
  • AACAAAAACTAA 900.17 on the complementary reverse strand.
  • the primers cannot hybridize on the other strands, since no bis occur in the sense strand due to the bisulfite treatment outside the context CG and accordingly complementarily on the antisense strand.
  • An amplificate is created if, when there is a perfect base pairing on the sense strand within the maximum fragment length M, a primer on the opposite strand forms a perfect base pairing, which is the probability

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Beschrieben ist ein Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer DNA bei dem man folgende Schritte ausführt: (a) in einer genomischen DNA Probe wandelt man durch chemische Behandlung an der 5'-Position unmethylierte Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin unähnliche Base um; (b) aus dieser chemisch behandelten genomischen DNA amplifiziert man mehr als zehn unterschiedliche Fragmente, die jeweils weniger als 2000 Basenpaare lang sind, gleichzeitig durch Verwendung von synthetischen Oligonukleotiden als Primer, wobei diese Primer jeweils Sequenzen aus an der Genregulation beteiligten und/oder transkribierten und/oder translatierten genomischen Sequenzen enthalten, wie sie nach einer Behandlung gemäß Schritt (a) vorliegen würden; (c) man bestimmt den Sequenzkontext aller oder eines Teils der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide.

Description

Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer DNA
Die vorliegende Erfindung betrifft ein Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer DNA.
Die nach den methodischen Entwicklungen der letzten Jahre in der Molekularbiologie gut studierten Beobachtungsebenen sind die Gene selbst, die Übersetzung dieser Gene in RNA und die daraus entstehenden Proteine. Wann im Laufe der Entwicklung eines Individuums welches Gen angeschaltet wird und wie Aktivieren und Inhibieren bestimmter Gene in bestimmten Zellen und Geweben gesteuert wird, ist mit hoher Wahrscheinlichkeit mit Ausmaß und Charakter der Methylierung der Gene bzw. des Genoms korrelierbar. Insofern ist die Annahme naheliegend, daß pathogene Zustände sich in einem veränderten Methylierungsmuster einzelner Gene oder des Genoms äußern.
Stand der Technik sind Verfahren, welche das Studium von Methylierungsmustern einzelner Gene gestatten. Jüngere Fortentwicklungen dieser Methode erlauben auch die Analyse kleinster Mengen an Ausgangsmaterial. Die vorliegende Erfindung beschreibt ein Verfahren zur parallelen Detektion des Methylierungszustandes genomischer DNA Proben, wobei ausgehend von einer Probe gleichzeitig zahlreiche verschiedenene Fragmente aus an der Genregulation beteiligten oder/und transkribierten und/oder translatierten Sequenzen amplifiziert werden und anschließend der Sequenzkontext in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide untersucht wird.
5-Methylcytosin ist die häufigste kovalent modifizierte Base in der DNA eukaryotischer Zellen. Sie spielt beispielsweise eine Rolle in der Regulation der Transkription, genomischem Imprinting und in der Tumorgenese. Die Identifizierung von 5- Methylcytosin als Bestandteil genetischer Information ist daher von erheblichem Interesse. 5-Methylcytosin-Positionen können jedoch nicht durch Sequenzierung identifiziert werden, da 5-Methylcytosin das gleiche Basenpaarungsverhalten aufweist wie Cytosin. Darüber hinaus geht bei einer PCR-Amplifikation die epigenetische Information, welche die 5-Methylcytosine tragen, vollständig verloren. Die Modifikation der genomischen Base Cytosin zu 5'-Methylcytosin stellt den bis heute wichtigsten und best-untersuchten epigenetischen Parameter dar. Trotzdem gibt es bis heute zwar Methoden, umfassende Genotypen von Zellen und Individuen zu ermitteln, aber noch keine vergleichbaren Ansätze auch in großem Maße epigenotypische Information zu generieren und auszuwerten.
Es sind im Prinzip drei prinzipiell verschiedene Methoden bekannt, den 5-Methyl-Status eines Cytosins im Sequenzkontext zu bestimmen.
Die erste prinzipielle Methode beruht auf der Verwendung von Restriktionsendo- nukleasen (RE), welche „methylierungssensitiv" sind. REs zeichnen sich dadurch aus, daß sie an einer bestimmten DNA-Sequenz, meist zwischen 4 und 8 Basen lang, einen Schnitt in die DNA einführen. Die Position solcher Schnitte kann dann durch Gelektrophorese, Transfer auf eine Membran und Hybridisierung nachgewiesen werden. Methylierungssensitiv bedeutet, daß bestimmte Basen innerhalb der Erkennungssequenz unmethyliert vorliegen müssen, damit der Schnitt erfolgen kann. Das Bandenmuster nach einem Restriktionsschnitt und Gelektrophorese ändert sich also je nach Methylierungsmuster der DNA. Allerdings befinden sich die wenigsten methylierbaren CpG innerhalb von Erkennungssequenzen von REs, können also nach dieser Methode nicht untersucht werden.
Die Empfindlichkeit dieser Methoden ist extrem niedrig (Bird, A.P., and Southern, E.M., J.Mol. Biol. 118, 27-47). Eine Variante kombiniert PCR mit dieser Methode, eine Amplifikation durch zwei auf beiden Seiten der Erkennungssequenz liegende Primer erfolgt nach einem Schnitt nur dann, wenn die Erkennungssequenz methyliert vorliegt. Die Empfindlichkeit steigt in diesem Fall auf theoretisch ein einziges Molekül der Zielsequenz, allerdings können mit hohem Aufwand nur einzelne Positionen untersucht werden (Shemer, R. et al., PNAS 93, 6371-6376). Wiederum ist Voraussetzung, daß sich die methylierbare Position innerhalb der Erkennungssequenz einer RE befindet. Die zweite Variante beruht auf partieller chemischer Spaltung von Gesamt-DNA, nach dem Vorbild einer Maxam-Gilbert Sequenzierreaktion, Ligation von Adaptoren an die so generierten Enden, Amplifikation mit generischen Primern und Auftrennung auf einer Gelektrophorese. Mit diesem Verfahren können definierte Bereiche bis zur Größe von weniger als tausend Basenpaaren untersucht werden. Das Verfahren ist allerdings so kompliziert und unzuverlässig, daß es praktisch nicht mehr verwendet wird (Ward, C. et al., J. Biol. Chem. 265, 3030-3033).
Eine relativ neue und die mittlerweile am häufigsten angewandte Methode zur Untersuchung von DNA auf 5-Methylcytosin beruht auf der spezifischen Reaktion von Bisulphit mit Cytosin, das nach anschließender alkalischer Hydrolyse in Uracil umgewandelt wird, welches in seinem Basen-Paarungsverhalten dem Thymidin entspricht. 5-Methylcytosin wird dagegen unter diesen Bedingungen nicht modifiziert. Damit wird die ursprüngliche DNA so umgewandelt, daß Methylcytosin, welches ursprünglich durch sein Hybridisierungsverhalten vom Cytosin nicht unterschieden werden kann, jetzt durch „normale" molekularbiologische Techniken als einzig verbliebenes Cytosin beispielsweise durch Amplifikation und Hybridisierung oder Sequenzierung nachgewiesen werden kann. Alle diese Techniken beruhen auf Basenpaarung, welche jetzt voll ausgenutzt werden kann. Der Stand der Technik, was die Empfindlichkeit betrifft, wird durch ein Verfahren definiert, welches die zu untersuchende DNA in einer Agarose-Matrix einschließt, dadurch die Diffusion und Renaturierung der DNA (Bisulphit reagiert nur an einzelsträngiger DNA) verhindert und alle Fällungs- und Reinigungsschritte durch schnelle Dialyse ersetzt (Olek, A. et al., Nucl. Acids. Res. 24, 5064-5066). Mit dieser Methode können einzelne Zellen untersucht werden, was das Potential der Methode veranschaulicht. Allerdings werden bisher nur einzelne Regionen bis etwa 3000 Basenpaare Länge untersucht, eine globale Untersuchung von Zellen auf Tausende von möglichen Methylierungsereignissen ist nicht möglich. Allerdings kann auch dieses Verfahren keine sehr kleinen Fragmente aus geringen Probenmengen zuverlässig analysieren. Diese gehen trotz Diffusionsschutz durch die Matrix verloren.
Eine Übersicht über die weiteren bekannte Möglichkeiten, 5-Methylcytsosine nachzuweisen, kann auch dem folgenden Übersichtsartikel entnommen werden: Rein, T., DePamphilis, M. L, Zorbas, H., Nucleic Acids Res. 26, 2255 (1998).
Die Bisulphit-Technik wird bisher bis auf wenige Ausnahmen (z.B. Zeschnigk, M. et al., Eur. J. Hum. Gen. 5, 94-98; Kubota T. et al., Nat. Genet. 16, 16-17) nur in der Forschung angewendet. Immer aber werden kurze, spezifische Stücke eines bekannten Gens nach einer Bisulphit-Behandlung amplifiziert und entweder komplett sequenziert (Olek, A. and Walter, J., Nat. Genet. 17, 275-276) oder einzelne Cytosin- Positionen durch eine „Primer-Extension-Reaktion" (Gonzalgo, M. L. and Jones, P.A., Nucl. Acids. Res. 25, 2529-2531 ) oder Enzymschnitt (Xiong, Z. and Laird, P.W., Nucl. Acids. Res. 25, 2532-2534) nachgewiesen. Zudem ist auch der Nachweis durch Hybridisierung beschrieben worden (Olek et al, WO9928498).
Gemeinsamkeiten zwischen Promotoren bestehen nicht nur im Vorkommen von TATA- oder GC-Boxen sondern auch darin, für welche Transkriptionsfaktoren sie Bindestellen besitzen und in welchem Abstand diese sich zueinander befinden. Die existierenden Bindestellen für ein bestimmtes Protein stimmen in ihrer Sequenz nicht vollständig überein, es finden sich aber konservierte Folgen von mindestens 4 Basen, die durch das Einfügen von „Wobbles", d. h. Positionen, an denen sich jeweils unterschiedliche Basen befinden, noch verlängert werden können. Des weiteren liegen diese Bindestellen in bestimmten Abständen zueinander vor.
Die Verteilung der DNA im Interphase-Chromatin, das den größten Teil des nuklearen Volumens einnimmt, unterliegt jedoch einer ganz speziellen Ordnung. So ist die DNA an mehreren Stellen an die nukleare Matrix, eine filamentöse Struktur an der Innenseite der nuklearen Membran, angeheftet. Diese Regionen bezeichnet man als matrix attachment regions (MAR) oder scaffold attachment regions (SAR). Das Anheften hat wesentlichen Einfluß auf die Transkription bzw. die Replikation. Diese MAR-Fragmente weisen keine konservativen Sequenzen auf, bestehen allerdings zu 70% aus A bzw. T und liegen in der Nähe von cis-agierenden Regionen, die die Transkription allgemein regulieren, und Topoisomerase Il-Erkennungsstellen. Neben Promotoren und Enhancern existieren weitere regulatorische Elemente für verschiedene Gene, sogenannte Insulators. Diese Insulators können z.B. die Wirkung des Enhancers auf den Promotor inhibieren, wenn sie zwischen Enhancer und Promotor liegen, oder aber, zwischen Heterochromatin und einem Gen gelegen, das aktive Gen vor dem Einfluß des Heterochromatins schützen. Beispiele für solche Insulators sind: 1. sogenannte LCR (locus control regions), welche aus mehreren gegenüber DNAase I hypersensitiven Stellen besteht; 2. bestimmte Sequenzen wie SCS (specialized chromatin structures) bzw. SCS', 350 bzw. 200 bp lang und hoch- resistent gegen Degradierung durch DNAase I und auf beiden Seiten von hypersensitiven Stellen flankiert (Abstand je 100 bp). An scs' bindet das Protein BEAF- 32. Diese Insulators können auf beiden Seiten des Gens liegen.
Eine Übersicht über den Stand der Technik in der Oligomer Array Herstellung läßt sich auch einer im Januar 1999 erschienen Sonderausgabe von Nature Genetics (Nature Genetics Supplement, Volume 21 , January 1999) und der dort zitierten Literatur entnehmen.
Patente, die sich allgemein auf die Verwendung von Oligomer Arrays und photolithographisches Maskendesign beziehen, sind z. B. US-A 5,837,832, US-A 5,856,174, WO-A 98/27430 und US-A 5,856,101. Zudem existieren einige Stoff- und Verfahrenspatente, welche die Verwendung photolabiler Schutzgruppen an Nukleosiden einschränken, so z. B. WO-A98/39348 und US-A 5,763,599.
Matrix-assistierte Laser Desorptions/Ionisations Massenspektrometrie (MALDI) ist eine neue, sehr leistungsfähige Entwicklung für die Analyse von Biomolekülen (Karas, M. and Hillenkamp, F. 1988. Laser desorption ionization of proteins with molecular masses exceeding 10.000 daltons. Anal. Chem. 60: 2299-2301). Ein Analytmolekül wird in eine im UV absorbierende Matrix eingebettet. Durch einen kurzen Laserpuls wird die Matrix ins Vakuum verdampft und das Analyt so unfragmentiert in die Gasphase befördert. Eine angelegte Spannung beschleunigt die Ionen in ein feldfreies Flugrohr. Auf Grund ihrer verschiedenen Massen werden Ionen unterschiedlich stark beschleunigt. Kleinere Ionen erreichen den Detektor früher als größere und die Flugzeit wird in die Masse der Ionen umgerechnet.
Für die Abtastung eines immobilisierten DNA-Arrays sind vielfach fluoreszent markierte Sonden verwendet worden. Besonders geeignet sind für die Fluoreszenzmarkierung ist das einfache Anbringen von Cy3 und Cy5 Farbstoffen am 5'OH der jeweiligen Sonde. Die Detektion der Fluoreszenz der hybridisierten Sonden erfolgt beispielsweise über ein Konfokalmikroskop. Die Farbstoffe Cy3 und Cy5 sind, neben vielen anderen, kommerziell erhältlich.
Um die erwartete Anzahl von amplifizierten Fragmenten ausgehend von einer beliebigen Templat-DNA und zweien nicht für jeweils eine bestimmte Position spezifischen Primern zu berechnen, muß ein statistisches Modell über den Aufbau des Genoms zu Grunde gelegt werden.
Wir geben hier die Berechnung für drei Modelle an, beziehen uns allerdings in diesem Patent auf die in Modell 3 beschriebene Methode.
Modell 1 :
Im einfachsten Fall wird angenommen, daß ein primärer DNA-Strang eine Zufallsfolge von vier gleich häufig vorkommenden Basen ist. Damit ergibt sich als Wahrscheinlichkeit, daß sich für einen beliebiger Primer PrimA (der Länge k) an einer gegebenen Stelle im Genom eine perfekte Basenpaarung ergibt:
Pa {PrimA)=0.25k (Modell 1 für DNA)
(diese Wahrscheinlichkeit ist für den sense- und anti-sense-Strang der DNA gleich)
Bei einer Bisulfitbehandlung der DNA werden diejenigen Cytosine durch Uracil ersetzt, die nicht zu einem methylierten CG gehören. Das Basenpaarungsverhalten des Uraciis entspricht dem des Thymins. Da CG in der DNA sehr selten sind (unter zwei Prozent), kann die statistische Häufigkeit der Cs nach der Bisulfitbehandlung vernachlässigt werden. Die Wahrscheinlichkeit, daß sich für einen Primer PrimB (Länge k, davon a As, t Ts, g Gs und c Cs) auf bisulfitbehandelter DNA eine perfekte Basenpaarung ergibt, ist unterschiedlich für einen mit Bisulfit behandelten Strang und den zugehörigen anti- sense Strang:
P {PrimB)=0.5a *0.25'*0.25c *0g (Modell 1 für Bisulfit-DNA-Strang)
P!a (PrimB)=0.25a *0.5' *0C *0.25g (Modell 1 für anti-sense-Strang zu einem
Bisulfit-DNA-Strang)
(wenn der Primer C oder G enthält, wird somit einer der Wahrscheinlichkeitswerte 0).
Modell 2:
Zählungen der Basenhäufigkeiten der DNA ergeben, daß die vier Basen in der DNA nicht gleichverteilt sind. Entsprechend kann man aus DNA-Datenbanken folgende Häufigkeiten (Wahrscheinlichkeiten für ein Vorkommen) der Basen ermitteln.
DAM U)=0.281 1 ßAM (7 0.2784 DAM (C)=0.2206 PDNA (G)=0.2199
Als Grundlage für diese Statistik (und die folgenden für Modell 2 und 3) dienen ca. 6% des Genoms vom Homo Sapiens aus High Throughput Sequencing Projekten (Datenbank "htgs" vom NIH/NCBI vom 6.9.1999). Die Gesamtmenge der Daten beträgt mehr als 1.5x108 Basenpaare, was einem Schätzfehler für die Einzelwahrscheinlichkeiten kleiner 10~5 entspricht.
Mit Hilfe dieser Werte läßt sich das Modell 1 verbessern.
Damit ist die Wahrscheinlichkeit, daß sich für einen Primer PrimC (Länge k, davon a
As, t Ts, g Gs und c Cs) eine perfekte Basenpaarung ergibt: P2(PrimC)=PDNA (τy *PDNA (A)'*PDNA (C)g *PDNA (G)c (Modell 3 für DNA)
Für den mit Bisulfit behandelten Strang ergeben sich folgende Wahrscheinlichkeiten unter der Annahme, daß alle CpG-Positionen methyliert sind (man erhält eine gleiche Statistik für die Bisulfitbehandlung des DNA-sense- und des DNA-antisense-Stranges):
PbDNA
Figure imgf000009_0001
PbDNA (C)=0.0lA0 PbυNA (G)= .2l99 PbüN4 (T)=0ΛS50
Damit ergibt sich als Wahrscheinlichkeit, daß sich für einen Primer PritnD (Länge k, davon a As, Ts, g Gs und c Cs) eine perfekte Basenpaarung ergibt:
P2s(PrimD)=PbυNA (τγ *PbDNA (A)' *PbDNA (CY *PbüNA(G)c (Modell 3 für Bisulfit-DNA- Strang)
P2a (PrimD)=PbϋNA (A r *PbDNA (T)'*PbDNA (G)s *PbυNA (cγ (Modell 3 für anti-sense- Strang zu einem Bisulfit-DNA-Strang)
Modell 3:
Wesentliche Schätzfehler in Modell 2 ergeben sich vor allem bei der mit Bisulfit behandelten DNA aus der Tatsache, daß C nur noch im Kontext CG auftreten kann. Modell 3 berücksichtigt diese Eigenschaft und nimmt an, daß die primäre DNA eine Zufallsfolge mit Abhängigkeit direkt benachbarter Basen ist (Markov-Kette erster Ordnung). Die empirisch aus der Datenbank (vollständig methyliert; mit Bisulphit behandelt) ermittelten paarweisen Basenwahrscheinlichkeiten ergeben sich gleich für beide DNA-Stränge als P bDNA (von;nach) aus der folgenden Tabelle:
Figure imgf000010_0002
R^UHO.2811 PbDNA (C)= .0\A0 PbDNA (G)=0.2l99
PbDNA (T)=0.A$50
und für den dazu revers-komplementären Strang (durch entsprechendes Austauschen der Einträge) RrADΛM ( von' n ch)
Figure imgf000010_0003
rbDNA (.4)=0.4850 *™ (00.2199 rbDNA (G)=0.0140 rbDNA
Figure imgf000010_0001
Damit hängt die Wahrscheinlichkeit, daß sich für einen Primer PrimE (mit der Basenfolge B B2 B3 B4 ...; z.B. ATTG...) eine perfekte Basenpaarung ergibt, von der genauen Abfolge der Basen ab und ergibt sich als das Produkt:
P3s(PrimE)=PrbDNA (B ) P rbDNA (B\ • Bl) P rbDNA (B 2 >' ß l) P 'rbDNA (B3 >' B Λ)
(Modell 3 für rbDNA w rbDNA (B2) rbDNA (B3) Bisulfit-DNA-Strang)
, „_.. - (Modell 3 für
Figure imgf000011_0001
anti-sense-Strang zu einem Bisulfit-DNA-Strang)
Berechnung der Anzahl der zu erwartenden amplifizierten Fragmente
Die mit Bisulfit behandelte DNA wird unter Benutzung einer Anzahl Primer amplifiziert. Aus Sicht des Modells besteht die DNA aus je einem sense- und einem anti-sense- Strang der Länge N Basen (alle Chromosomen werden hier zusammengefaßt). Für einen Primer Prim ist zu erwarten, daß er auf dem sense-Strang
N *P XPrim)
perfekte Basenpaarungen ergibt - für diese Berechnung können die Funktionen P1s, P2s oder P3s von Modell 1, 2 oder 3 eingesetzt werden, je nach gewünschter Abschätzungsgüte. Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit für eine perfekte Basenpaarung auf dem sense-Strang an einer gegebenen Position:
i> 4 ( Primers ) = P,{ Prim U )
+ {l- P PrimU)) P{ PrimV)
+ {l-P{PrimU))(l-P{PrimV))P PrimW)
+(l-P{PrimU)){l-P{PrimV)){l-P^PrimW))P PrimX)
+ ...
Und damit als Anzahl der zu erwartenden perfekten Basenparungen mit irgendeinem der Primer
N*P (Primers) Für die Bestimmung von Pa(Primers) auf dem anti-sense-Strang werden die analogen Gleichungen verwendet. Ein Amplifikat entsteht genau dann, wenn bei einer perfekten Basenpaarung auf dem sense-Strang innerhalb der maximalen Fragmentlänge /W ein Primer auf dem Gegenstrang eine perfekte Basenpaarung bildet. Die Wahrscheinlichkeit dafür ist
, M - ( l — Pa (Primers))
Für große M und kleine Pa(Primers) kann dieses durch folgenden Ausdruck berechnet werden:
-PΛ Primers) r / , , , u
{( 1 -P „ {Printer s))M - l log ( 1 —Pa {Primers))
Für die Gesamtzahl F der Fragmente, die durch die Amplifikation beider Stränge zu erwarten sind, ergibt sich damit:
( 1 — P ( Primers ) )
F=N *P, (Primers) λ . , " . _ . ^ [( 1 - P a ( Primers))" - l log ( 1 — Pa ( Primers ) )
( 1 — P ( Primers ) )
+N *P- lta , Ϊ^ ^»lπ "fJfm)l' '
Diese Methode liefert einen präzisen Erwartungswert für die Vorhersage der Anzahl der Bindungssites bestimmter Sequenzen an ein beliebiges zuvor mit Bisulfit behandeltes genomisches DNA Fragment. Sie dient hier als Grundlage für die Berechnung der statistisch erwarteten Anzahl von Amplifikaten in einer PCR-Reaktion ausgehend von zwei Primersequenzen und einer DNA der Länge N, wobei nur die Amplifikate berücksichtigt werden, die eine Anzahl von M Nukleotiden nicht überschreiten. In diesem Patent wird davon ausgegangen, daß M den Wert 2000 hat. Die bekannten Verfahren für den Nachweis von Cytosin Methylierungen in genomischer DNA sind prinzipiell nicht so ausgelegt, daß eine Vielzahl von Zielregionen im zu untersuchenden Genom gleichzeitig erfaßt werden. Aufgabe der vorliegenden Erfindung ist es, ein Verfahren zu schaffen, mit dem eine Probe genomischer DNA gleichzeitig an mehreren Positionen gleichzeitig auf Cytosin Methylierung hin untersucht werden kann.
Die Aufgabe wird durch die kennzeichnenden Merkmale des Anspruchs 1 gelöst. Vorteilhafte Weiterbildungen der Merkmal sind in den abhängigen Ansprüchen gekennzeichnet.
Im Unterschied zu anderen Verfahren kann nach chemischer Vorbehandlung der DNA durch Verwendung entsprechend angepaßter Primerpaare eine Amplifikation von vielen Zielregionen gleichzeitig erfolgen. Dabei ist es nicht unbedingt notwendig den Sequenzkontext aller dieser Zielregionen vorab zu kennen, da in vielen Fällen, wie nachfolgend auch beispielhaft aufgeführt, Konsensussequenzen aus der Sequenzierung verwandter Zielregionen bekannt sind, die wie unten beschrieben für das Design für bestimmte Zielregionen spezifischer oder selektiver Primerpaare eingesetzt werden können. Das Verfahren ist dann erfolgreich angewandt, wenn die Amplifikation der chemisch vorbehandelten genomischen DNA mehr Fragmente bis maximal 2000 Basenpaare Länge als statistisch zu erwarten aus den jeweils zu untersuchenden Zielregionen liefert.
Dabei wird der statistische Erwartungswert für die Anzahl dieser Fragmente über die im Stand der Technik aufgeführten Formeln berechnet. Die Anzahl der im Amplifikationsschritt hergestellten Fragmente kann dagegen mittels einer beliebigen molekularbiologischen, chemischen oder physikalischen Methode nachgewiesen werden.
Für die Durchführung der erforderlichen statistischen Betrachtungen, die auch für die unten aufgeführten Ansprüche relevant sind, werden die folgenden Werte angenommen: Das menschliche haploide Genom enthält 3 Milliarden Basenpaare und 100.000 Gene, die wiederum im Mittel eine 2000 Basenpaare lange mRNA codieren, die Gene inklusive der Introns sind durchschnittlich 15000 Basenpaare lang. Promotoren umfassen je Gen 1000 Basenpaare durchschnittlich. Ist daher der statistische Erwartungswert für die Anzahl der Amplifikate, die ausgehend von zwei Primern in transkribierten Sequenzen liegen, zu berechnen, so ist zunächst der Erwartungswert für das Gesamtgenom nach obiger Formel (Methode 3) zu berechnen und mit dem Anteil der transkribierten Sequenzen am Gesamtgenom zu berechnen. Analog wird für Teile eines beliebigen Genoms sowie für Promotoren und translatierte Sequenzen (mRNA codierend) vorgegangen.
Die vorliegende Erfindung beschreibt somit ein Verfahren zur parallelen Detektion des Methylierungszustandes genomischer DNA. Dabei sollen mehrere Cytosin- Methylierungen in einer DNA-Probe gleichzeitig analysiert werden. Dazu werden die folgenden Verfahrensschritte nacheinander ausgeführt:
Zuerst wird eine genomische DNA Probe derart chemisch behandelt, daß an der 5'- Position unmethylierte Cytosinbasen in Uracil, Thymin oder eine andere vom Hybridisierungsverhalten her dem Cytosin unähnliche Base verwandelt werden. Bevorzugt wird dazu die oben beschriebene Behandlung genomischer DNA mit Bisulfit (Hydrogensulfit, Disulfit) und anschließender alkalischer Hydrolyse verwendet, die zu einer Umwandlung nicht methylierter Cytosin-Nukleobasen in Uracil führt.
In einem zweiten Verfahrensschritt werden aus der vorbehandelten genomischen DNA mehr als zehn unterschiedliche Fragmente gleichzeitig durch Verwendung von synthetischen Oligonukleotiden als Primer amplifiziert, wobei mehr als doppelt so viele Fragmente als statistisch zu erwarten aus an der Genregulation beteiligten, transkribierten und/oder translatierten Sequenzen stammen. Dies kann mittels verschiedener Methoden erreicht werden.
In einer bevorzugten Variante des Verfahrens enthält mindestens eines der für die Amplifikation verwendeten Oligonukleotide weniger Nukleobasen als es statistisch für eine sequenzspezifische Hybridisierung an die chemisch behandelte genomische DNA Probe erforderlich wäre, was zur Amplifikation mehrerer Fragmente gleichzeitig führen kann. Dabei ist die Gesamtzahl der in diesem Oligonukleotid enthaltenen Nukleobasen kleiner als 17. In einer besonders bevorzugten Variante des Verfahrens ist die Anzahl der in diesem Oligonukleotid enthaltenen Nukleobasen kleiner als 14.
In einer weiteren, bevorzugten Variante des Verfahrens werden für die Amplifikation mehr als 4 Oligonukleotide mit unterschiedlicher Sequenz gleichzeitig in einem Reaktionsgefäß verwendet. In einer besonders bevorzugten Varianten werden zur Herstellung eines komplexen Amplifikates mehr als 26 verschiedene Oligonukleotide gleichzeitig verwendet. In einer besonders bevorzugten Variante des Verfahrens stammt mehr als eine doppelt so hohe Anzahl, wie statistisch zu erwarten, aus an der Regulation von Genen beteiligten Genomabschnitten, z.B. Promotoren und Enhancern, stammt, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre. In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, die in mindestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden, oder aber aus nach der Transkription in mRNA gespliceten Genomabschnitten (Exons), als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre.
In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, welche für Teile einer oder mehrerer Genfamilien kodieren, oder aber sie stammen aus Genomabschnitten, welche für sogenannte „matrix attachment Sites" (MARs)- charakteristische Sequenzen enthalten, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre.
In einer weiteren besonders bevorzugten Variante des Verfahrens stammt mehr als eine doppelt so hohe Anzahl der amplifizierten Fragmente aus Genomabschnitten, welche als sogenannte „boundary elements" die Verpackungsdichte des Chromatins organisieren, oder aber sie stammen aus multiple drug resistance gene" (MDR)- Promotoren oder kodierenden Regionen, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre.
In einer weiteren, besonders bevorzugten Variante des Verfahrens werden zur Amplifkation der beschriebenen Fragmente zwei Oligonukleotide oder zwei Klassen von Oligonukleotiden verwendet, von denen eines oder eine Klasse außer im Kontext CpG oder CpNpG zwar die Base C enthalten kann, nicht aber die Base G und von denen das andere oder die andere Klasse außer im Kontext CpG oder CpNpG zwar die Base G, nicht aber die Base C enthalten kann.
In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels zweier Oligonukleotide durchgeführt, von denen eines eine vier bis sechzehn Basen lange Sequenz enthält, die zu einer solchen DNA komplementär ist oder dieser entspricht, wie sie entstehen würde, wenn ein ebenso langes DNA Fragment, an welches einer der Faktoren
AhR/Arnt aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear translocator
Amt aryl hydrocarbon receptor nuclear translocator AML-1a CBFA2; core-binding factor, runt domain, alpha subunit 2
(acute myeloid leukemia 1 ; aml1 oncogene)
AP-1 activator protein-1 (AP-1); Synonyme: c-Jun
C/EBP CCAAT/enhancer binding protein
C/EBPalpha CCAAT/enhancer binding protein (C/EBP), alpha
C/EBPbeta CCAAT/enhancer binding protein (C/EBP), beta
CDP CUTL1 ; cut (Drosophila)-Iike 1 (CCAAT displacement protein)
CDP CUTL1 ; cut (Drosophila)-Iike 1 (CCAAT displacement protein)
CDP CR1 complement component (3b/4b) receptor 1 CDP CR3 complement component (3b/4b) receptor 3 CHOP-C/EBPalpha DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer binding protein (C/EBP), alpha c-Myc/Max avian myelocytomatosis viral oncogene/MYC-ASSOCIATED
FACTOR X
CREB cAMP responsive element binding protein CRE-BP1 CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN
2, CREB2, CREBP1 ; now ATF2; activating transcription factor 2
CRE-BP1/c-Jun activator protein-1 (AP-1); Synonyme: c-Jun CREB MP responsive element binding protein E2F E2F transcription factor (originally identified as a DNA- binding protein essential E1A-dependent activation of the adenovirus E2 promoter)
E47 transcription factor 3 (E2A immunoglobulin enhancer binding factors E12/E47)
E47 transcription factor 3 (E2A immunoglobulin enhancer binding factors E12/E47)
Egr-1 early growth response 1 Egr-2 early growth response 2 (Krox-20 (Drosophila) homolog) ELK-1 ELK1 , member of ETS (environmental tobacco smoke) oncogene family
Freac-2 FKHL6; forkhead (Drosophila)-Iike 6; FORKHEAD-RELATED ACTIVATOR 2; FREAC2
Freac-3 FKHL7; forkhead (Drosophila)-Iike 7; FORKHEAD-RELATED ACTIVATOR 3; FREAC3
Freac-4 FKHL8; forkhead (Drosophila)-Iike 8; FORKHEAD-RELATED ACTIVATOR 4; FREAC4
Freac-7 FKHL11 ; forkhead (Drosophila)-Iike 9; FORKHEAD- RELATED ACTIVATOR 7; FREAC7
GATA-1 GATA-binding protein 1/Enhancer-Binding Protein GATA1 GATA-1 GATA-binding protein 1/Enhancer-Binding Protein GATA1 GATA-1 GATA-binding protein 1/Enhancer-Binding Protein GATA1 GATA-2 GATA-binding protein 2/Enhancer-Binding Protein GATA2 GATA-3 GATA-binding protein 3/Enhancer-Binding Protein GATA3 GATA-X HFH-3 FKHL10; forkhead (Drosophila)-Iike 10; FORKHEAD- RELATED ACTIVATOR 6; FREAC6
HNF-1 TCF1 ; transcription factor 1 , hepatic; LF-B1 , hepatic nuclear factor (HNF1), albumin proximal factor
HNF-4 hepatocyte nuclear factor 4
IRF-1 interferon regulatory factor 1
ISRE interferon-stimulated response element
Lmo2 complex LIM domain only 2 (rhombotin-like 1)
MEF-2 MADS box transcription enhancer factor 2, polypeptide A (myocyte enhancer factor 2A)
MEF-2 MADS box transcription enhancer factor 2, polypeptide A (myocyte enhancer factor 2A) myogenin/NF-1 Myogenin (myogenic factor 4)/Neurofibromin 1 ; NEUROFIBROMATOSIS, TYPE I
MZF1 ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- responsive)
MZF1 ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- responsive)
NF-E2 NFE2; nuclear factor (erythroid-derived 2), 45kD NF-kappaB (p50) nuclear factor of kappa light polypeptide gene enhancer in B- cells p50 subunit
NF-kappaB (p65) nuclear factor of kappa light polypeptide gene enhancer in B- cells p65 subunit
NF-kappaB nuclear factor of kappa light polypeptide gene enhancer in B- cells
NF-kappaB nuclear factor of kappa light polypeptide gene enhancer in B- cells
NRSF NEURON RESTRICTIVE SILENCER FACTOR; REST; RE1- silencing transcription factor
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ;
POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ;
POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ;
POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ;
POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ;
POU2F1 ; POU domain, class 2, transcription factor 1
P300 E1A (adenovirus E1A oncoprotein)-BINDING PROTEIN,
300-KD
P53 tumor protein p53 (Li-Fraumeni syndrome); TP53
Pax-1 paired box gene 1
Pax-3 paired box gene 3 (Waardenburg syndrome 1)
Pax-6 paired box gene 6 (aniridia, keratitis)
Pbx lb pre-B-cell leukemia transcription factor
Pbx-1 pre-B-cell leukemia transcription factor 1
RORalpha2 RAR-RELATED ORPHAN RECEPTOR ALPHA; RETINOIC
ACID-BINDING RECEPTOR ALPHA
RREB-1 ras responsive element binding protein 1
SP1 simian-virus-40-protein-1
SP1 simian-virus-40-protein-1
SREBP-1 sterol regulatory element binding transcription factor 1
SRF serum response factor (c-fos serum response element- binding transcription factor)
SRY sex determining region Y
STAT3 signal transducer and activator of transcription 1 , 91 kD
Tal-1alpha/E47 T-cell acute lymphocytic leukemia 1 /transcription factor 3
(E2A immunoglobulin enhancer binding factors E12/E47)
TATA cellular and viral TATA box elements Tax/CREB Transiently-expressed axonal glycoprotein/cAMP responsive element binding protein
Tax/CREB Transiently-expressed axonal glycoprotein/cAMP responsive element binding protein
TCF11/MafG v-maf musculoaponeurotic fibrosarcoma (avian) oncogene family, protein G
TCF11 Transcription Factor 11 ; TCF11 ; NFE2L1 ; nuclear factor
(erythroid-derived 2)-like 1
USF upstream stimulating factor Whn winged-helix nude X-BP-1 X-box binding protein 1 oder
YY1 ubiquitously distributed transcription factor belonging to theGLI-Kruppel class of zinc finger proteins
bindet, derart chemisch behandelt würde, daß an der 5'-Position unmethylierte Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin unähnliche Base verwandelt werden.
In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgeführt, von denen eines oder die eine Klasse die vier bis sechzehn Basen lange Sequenz enthält, welche zu einer solchen DNA komplementär ist oder dieser entspricht, wie sie entstehen würde, wenn ein ebenso langes DNA Fragment, welches über seine Sequenz oder Sekundärstruktur die spezifische Lokalisierung von Genom/Chromatinabschnitten innerhalb des Zellkerns herbeiführen kann, derart chemisch behandelt würde, daß an der 5'-Position unmethylierte Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin unähnliche Base verwandelt werden.
In einer weiteren bevorzugten Variante des Verfahrens wird die Amplifikation mittels zweier Oligonukleotide oder zweier Klassen von Oligonukleotiden durchgeführt, von denen eines oder die eine Klasse eine der Sequenzen
TCGCGTGTA, TACACGCGA, TGTACGCGA, TCGCGTACA, TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC, TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC, TTGCGTGTA, TACACGCAA, TGTACGTAA, TTACGTACA, TACGTG, CACGTA, TACGTG, CACGTA,
ATTGCGTGT, ACACGCAAT, GTACGTAAT, ATTACGTAC, ATTGCGTGA, TCACGCAAT, TTACGTAAT, ATTACGTAA, ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGTAA, ATCGCGTGT, ACACGCGAT, GTACGCGAT, ATCGCGTAC, TGTGGT, ACCACA, ATTATA, TATAAT,
TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA, TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAA, TTTGGT, ACCAAA, ATTAAA, TTTAAT, TGTGGA, TCCACA, TTTATA, TATAAA , TTTGGA, TCCAAA, TTTAAA, TTTAAA, TGTGGT, ACCACA, ATTATA, TATAAT,
ATTAT, ATAAT, GTAAT, ATTAC, ATTGT, ACAAT, GTAAT, ATTAC,
GAAAG, CTTTC, TTTTT, AAAAA,
GTAAT, ATTAC, ATTGT, ACAAT,
GAAAT, ATTTC, ATTTT, AAAAT,
GTAAG, CTTAC, TTTGT, ACAAA,
TTAATAATCGAT, ATCGATTATTAA, ATCGATTATTGG, CCAATAATCGAT,
ATCGATTA, TAATCGAT, TAATCGAT, ATCGATTA,
ATCGATCGG, CCGATCGAT, TCGATCGAT, ATCGATCGA, ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC,
TATCGATA, TATCGATA, TATCGGTG, CACCGATA, TATTAATA, TATTAATA, TATTGGTG, CACCAATA,
GTGTAATATTT, AAATATTACAC, GGGTATTGTAT, ATACAATACCC, GTGTAATTTTT, AAAAATTACAC, GGGGATTGTAT, ATACAATCCCC, ATGTAATTTTT, AAAAATTACAT, GGGGATTGTAT, ATACAATCCCC, ATGTAATATTT, AAATATTACAT, GGGTATTGTAT, ATACAATACCC, ATTACGTGGT, ACCACGTAAT, ATTACGTGGT, ACCACGTAAT, TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA, TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA, TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA,
TGACGT, ACGTCA, GCGTTA, TAACGC, TGACGT, ACGTCA, ACGTTA, TAACGT, TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC, TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC,
TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA, TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC,
GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA, GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT,
TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA, TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT,
TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT, TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA, ATAGGAAGT, ACTTCCTAT, ATTTTTTGT, ACAAAAAAT, TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT, TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC, TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT, TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC, GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, GTAAATAAATA, TATTTATTTAC, TGTTTATTTAT, ATAAATAAACA,
AAAGTAAATA, TATTTACTTT, TGTTTATTTT, AAAATAAACA, AATGTAAATA, TATTTACATT, TGTTTATATT, AATATAAACA, TAAGTAAATA, TATTTACTTA, TGTTTATTTA, TAAATAAACA, TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACA,
ATAAATA, TATTTAT, TGTTTAT, ATAAACA, ATAAATA, TATTTAT, TATTTAT, ATAAATA, GATA, TATC, TATT, AATA,
TAGATAA, TTATCTA, TTATTTG, CAAATAA, TTGATAA, TTATCAA, TTATTAG, CTAATAA, GATAA, TTATC, TTATT, AATAA,
GATG, CATC, TATT, AATA,
GATAG, CTATC, TTATT, AATAA, GATAAG, CTTATC, TTTATT, AATAAA,
TGTTTATTTA, TAAATAAACA, TAAATAAATA, TATTTATTTA, TGTTTGTTTA, TAAACAAACA, TAAATAAATA, TATTTATTTA, TATTTATTTA, TAAATAAATA, TAAATAAATA, TATTTATTTA, TATTTGTTTA, TAAACAAATA, TAAATAAATA, TATTTATTTA,
GTTAATGATT, AATCATTAAC, AATTATTAAT, ATTAATAATT, GTTAATTATT, AATAATTAAC, AATAATTAAT, ATTAATTATT, GTTAATTAAT, ATTAATTAAC, ATTAATTAAT, ATTAATTAAT, GTTAATGAAT, ATTCATTAAC, ATTTATTAAT, ATTAATAAAT,
TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA, TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA,
AAAGTGAAATT, AATTTCACTTT, GGTTTTATTTT, AAAATAAAACC, AAAGCGAAATT, AATTTCGCTTT, GGTTTCGTTTT, AAAACGAAACC,
TAGTTTTATTTTTTT, AAAAAAATAAAACTA, GGGAAAGTGAAATTG,
CAATTTCACTTTCCC,
TAGTTTTATTTTTTT, AAAAAAATAAAACTA, GGAAAAGTGAAATTG,
CAATTTCACTTTTCC,
TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGAAAAGAGAAATTG,
CAATTTCTCTTTTCC, TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGGAAAGAGAAATTG,
CAATTTCTCTTTCCC,
TAGGTG, CACCTA, TATTTG, CAAATA,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AGGGTTATTTTTAGAG,
CTCTAAAAATAACCCT,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGAGTTATTTTTAGAG,
CTCTAAAAATAACTCC ,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AGAGTTATTTTTAGAG,
CTCTAAAAATAACTCT,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGGGTTATTTTTAGAG,
CTCTAAAAATAACCCC ,
TGTTATTAAAAATAGAAA, TTTCTATTTTTAATAACA, TTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAA, TGTTATTAAAAATAGAAT, ATTCTATTTTTAATAACA, GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC, TTTGGTAT, ATACCAAA, GTGTTAAA, TTTAACAC GGGGA, TCCCC, TTTTT, AAAAA,
TAGGGG, CCCCTA, TTTTTA, TAAAAA, GAGGGG, CCCCTC, TTTTTT, AAAAAA,
TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT, TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, GGGGATTTTT, AAAAATCCCC, GGGAATTTTT, AAAAATTCCC, GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, GGAAATTTTT, AAAAATTTCC, GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, GGGATTTTTT, AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, GGGAATTTTT, AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, GGGATTTTTT, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, GGGATTTTTTA, TAAAAAATCCC, TGGAAAGTTTT, AAAACTTTCCA, TTTAGTATTACGGATAGAGGT, ACCTCTATCCGTAATACTAAA, GTTTTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAAAAAC , TTTAGTATTACGGATAGAGTT, AACTCTATCCGTAATACTAAA, GGTTTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAAAACC, TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, GGCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGCC, TTTAGTATTACGGATAGCGGT, ACCGCTATCCGTAATACTAAA, GTCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGAC,
ATATGTAAAT, ATTTACATAT, ATTTGTATAT, ATATACAAAT, TTATGTAAAT, ATTTACATAA, ATTTGTATAA, TTATACAAAT,
GAATATTTA, TAAATATTC, TGAATATTT, AAATATTCA, GAATATGTA, TACATATTC, TGTATATTT, AAATATACA,
ATAAT, ATTAT, ATTAT, ATAAT, GTAAT, ATTAC, ATTAT, ATAAT,
AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT,
ATTTGTATATT, AATATACAAAT, GGTATGTAAAT, ATTTACATACC, ATTTGTATATT, AATATACAAAT, AATATGTAAAT, ATTTACATATT, ATTTGTATATT, AATATACAAAT, AGTATGTAAAT, ATTTACATACT, ATTTGTATATT, AATATACAAAT, GATATGTAAAT, ATTTACATATC,
AGGAGT, ACTCCT, ATTTTT, AAAAAT, GGGAGT, ACTCCC, ATTTTT, AAAAAT, GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, AGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCT, TCGTTTCGTTTTAGATAT, ATATCTAAAACGAAACGA, ATATTTAGAGCGGAACGG, CCGTTCCGCTCTAAATAT,
CGTTACGGTT, AACCGTAACG, AATCGTGACG, CGTCACGATT, CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC, CGTTACGTTT, AAACGTAACG, AAGCGTGACG, CGTCACGCTT, CGTTACGTTT, AAACGTAACG, GAGCGTGACG, CGTCACGCTC,
TTTACGTATGA, TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA, TTTACGTTTGA, TCAAACGTAAA, TTAAGCGTGAA, TTCACGCTTAA, TTTACGTTTTA, TAAAACGTAAA, TGAAGCGTGAA, TTCACGCTTCA, TTTACGTATTA, TAATACGTAAA, TGATGCGTGAA, TTCACGCATCA,
AATTAATTAA, TTAATTAATT, TTGATTGATT, AATCAATCAA, TATTAATTAA, TTAATTAATA, TTGATTGATG, CATCAATCAA,
TAATTAT, ATAATTA, ATGATTG, CAATCAT,
TAGGTTA, TAACCTA, TGATTTA, TAAATCA,
TTTTAAATATTTTT, AAAAATATTTAAAA, GGGGGTGTTTGGGG,
CCCCAAACACCCCC,
TTTTAAATTATTTT, AAAATAATTTAAAA, GGGGTGGTTTGGGG,
CCCCAAACCACCCC,
TTTTAAATTTTTTT, AAAAAAATTTAAAA, GGGGGGGTTTGGGG,
CCCCAAACCCCCCC,
TTTTAAATAATTTT, AAAATTATTTAAAA, GGGGTTGTTTGGGG,
CCCCAAACAACCCC,
GAGGCGGGG, CCCCGCCTC, TTTCGTTTT, AAAACGAAA, GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA, AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA, AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA,
GGGGGCGGGGT, ACCCCGCCCCC, ATTTCGTTTTT, AAAAACGAAAT, GGGGGCGGGGT, ACCCCGCCCCC, GTTTCGTTTTT, AAAAACGAAAC, TATTATTTTAT, ATAAAATAATA, GTGGGGTGATA, TATCACCCCAC, GATTATTTTAT, ATAAAATAATC, GTGGGGTGATT, AATCACCCCAC,
ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATCACGTAAC,
TTTTATATGG, CCATATAAAA, TTATATAAGG, CCTTATATAA, TTATATATGG, CCATATATAA, TTATATATGG, CCATATATAA, AAATAAT, ATTATTT, GTTGTTT, AAACAAC, AAATTAA, TTAATTT, TTAGTTT, AAACTAA, AAATTAT, ATAATTT, GTAGTTT, AAACTAC, AAATAAA, TTTATTT, TTTGTTT, AAACAAA,
ATTTTTCGGAAATG, CATTTC CG AAAAAT, TATTTTCGGGAAAT,
ATTTCCCGAAAATA,
ATTTTTCGGAAATG, CATTTC CG AAAAAT, TATTTTCGGGAAAT,
ATTTCCCGAAAATA,
ATTTTCGGGAAATG, CATTTCCCGAAAAT, TATTTTTCGGAAAT,
ATTTCCGAAAAATA,
ATTTTCGGGAAGTG, CACTTCCCGAAAAT, TATTTTTCGGAAAT,
ATTTCCGAAAAATA,
AATAGATGTT, AACATCTATT, AATATTTGTT, AACAAATATT, AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT,
GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, GTATAAATG, CATTTATAC, TATTTATAT, ATATAAATA, GTATAAAAA, TTTTTATAC, TTTTTATAT, ATATAAAAA, GTATAAAAG, CTTTTATAC, TTTTTATAT, ATATAAAAA, TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, TTATAAATG, CATTTATAA, TATTTATAG, CTATAAATA, TTATAAAAA, TTTTTATAA, TTTTTATAG, CTATAAAAA, TTATAAAAG, CTTTTATAA, TTTTTATAG, CTATAAAAA, GGGGGTTGACGTA, TACGTCAACCCCC, TGCGTTAATTTTT, AAAAATTAACGCA,
GGGGGTTGACGTA, TACGTCAACCCCC, TACGTTAATTTTT, AAAAATTAACGTA,
TGACGTATATTTTT, AAAAATATACGTCA, GGGGATATGCGTTA,
TAACGCATATCCCC,
TGACGTATATTTTT, AAAAATATACGTCA, GGGGGTATGCGTTA,
TAACGCATACCCCC, ATGATTTAGTA, TACTAAATCAT, TGTTGAGTTAT, ATAACTCAACA, GTTAT, ATAAC, ATGAT, ATCAT,
TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, GACGTT, AACGTC, AGCGTT, AACGCT,
TGACGTGT, ACACGTCA, ATACGTTA, TAACGTAT, TGACGTGG, CCACGTCA, TTACGTTA, TAACGTAA, CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG oder CGACCATCTTA
enthält, welche zu einer solchen DNA komplementär ist oder dieser entspricht, wie sie entstehen würde, wenn ein ebenso langes DNA Fragment, welches über seine Sequenz oder Sekundärstruktur die spezifische Lokalisierung von Genom/Chromatinabschnitten innerhalb des Zellkerns herbeiführen kann, derart chemisch behandelt würde, daß an der 5'-Position unmethylierte Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin unähnliche Base verwandelt werden.
In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation verwendeten Oligonukleotide außer den oben definierten Konsensussequenzen mehrere Positionen, an denen entweder irgendeine der drei Basen G, A und T oder irgendeine der Basen C, A und T vorhanden sein kann.
In einer besonders bevorzugten Variante des Verfahrens enthalten die zur Amplifikation verwendeten Oligonukleotide außer einer der oben beschriebenen Konsensussequenzen nur maximal zusätzlich so viele weitere Basen, wie es zur gleichzeitigen Amplifikation von mehr als einhundert verschiedenen Fragmenten pro Reaktion aus der chemisch wie oben behandelten DNA erforderlich ist.
In einem dritten Verfahrensschritt wird nun der Sequenzkontext aller oder eines Teils der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide untersucht. In einer besonders bevorzugten Variante des Verfahrens erfolgt die Analyse durch Hybridisierung der bereits in der Amplifikation mit einem Fluoreszenzmarker versehenen Fragmente an einen Oligonukleotid- Array (DNA Chip). Der Fluoreszenzmarker kann entweder über die verwendeten Primer oder aber durch ein fluoreszenzmarkiertes Nukleotid (z. B. Cy5-dCTP, kommerziell von Amersham- Pharmacia erhältlich) eingeführt werden.
Dabei hybridisieren komplementäre Fragmente an die jeweiligen auf der Chipoberfläche immobilisierten Oligomere, nicht komplementäre Fragmente werden in einem oder mehreren Waschschritten entfernt. Die Fluoreszenz an den jeweiligen Hybridisierungsorten auf dem Chip erlaubt dann den Rückschluß auf den Sequenzkontext der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide.
In einer weiteren bevorzugten Variante des Verfahrens werden die amplifizierten Fragmente auf einer Oberfläche immobilisiert und anschließend eine Hybridisierung mit einer kombinatorischen Bibiliothek von unterscheidbaren Oligonukleotid- oder PNA- Oligomer-Sonden durchgeführt. Wiederum werden nicht komplementäre Sonden durch einen oder mehrere Waschschritte entfernt. Die hybridisierten Sonden werden entweder über ihre Fluoreszenzmarker detektiert oder in einer weiteren besonders bevorzugten Variante des Verfahrens mittels Matrix-assistierter Laser- Desorptions/Ionisations Massenspektrometrie (MALDI-MS) anhand ihrer eindeutigen Masse nachgewiesen. Dabei werden die Sondenbibliotheken derart synthetisiert, daß die Masse eines jeden Bestandteils eindeutig seiner Sequenz zugeordnet werden kann.
Die Amplifikate können zudem in einer weiteren bevorzugten Variante des Verfahrens hinsichtlich Ihrer durchschnittlichen Größe durch Veränderung der Kettenverlängerungszeiten im Amplifikationsschritt beeinflußt werden. Da hier vorwiegend kleinere Fragmente (ca. 200-500 Basenpaare) untersucht werden, ist eine Verkürzung der Kettenverlängerungsschritte z. B. einer PCR sinnvoll.
In einer weiteren bevorzugten Variante des Verfahrens werden die Amplifikate durch Gelelektrophorese aufgetrennt, und die Fragmente im gewünschten Größenbereich werden vor Ihrer Analyse ausgeschnitten. In einer weiteren besonders bevorzugten Variante werden die aus dem Gel ausgeschnittenen Amplifikate unter Verwendung des gleichen Satzes an Primern erneut amplifiziert. Dabei können dann nur noch Fragmente der gewünschten Größe entstehen, da Andere als Templat nicht mehr verfügbar sind.
Ein weiterer Gegenstand der vorleigenden Erfindung ist ein Kit, enthaltend mindestens zwei Primerpaare, Reagenzien und Hilfsstoffe für die Amplifikation und/oder Reagenzien und Hilfsmittel für die chemische Behandlung und/oder eine kombinatorische Sondenbibliothek und/oder einen Oligonukleotid-Array (DNA-Chip), soweit sie für die Durchführung des erfindungsgemäßen Verfahrens erforderlich oder dienlich sind.
Die folgenden Beispiele erläutern die Erfindung.
Beispiele:
Beispiel 1 :
Primer zur bevorzugten Amplifikation von CG reichen Regionen im Humangenom
Bei den CG reichen Regionen im Humangenom handelt es sich um sogenannte CpG- islands, die eine regulatorischen Funktion besitzen. Wir definieren CpG Islands derart, dass sie mindestens 500 bp umfassen sowie einen GC-Gehalt von >50% aufweisen , ausserdem ist der Quotient CG/GC > 0,6. Unter diesen Bedingungen liegen 16 Mb als CpG Islands vor. Damit liegen etwa 0,5 % der Genomsequenz in diesen CpG islands, wenn man auch noch jeweils eine Region bis 1000 bp downstream zusätzlich betrachtet. Dieser Überlegung liegen Daten aus der Ensembl Database vom 31.10.00, Quelle Sanger Centre, zugrunde. Die dort verfügbare Sequenz umfasste ca. 3,5 GB, und für die Berechnungen wurden die Repeats maskiert.
Statistisch wäre es bei 12meren zu erwarten, dass sie nur 0,005 mal so häufig an eine der CG-reichen Regionen hybridisieren wie an eine andere beliebige Region im Genom. Es wurden nun Primer gefunden, welche 1 ,8 mal häufiger an eine CG reiche Region binden. Zudem ergibt sich mit den entsprechend gefundene Reverse Primer nahezu eine Spezifität für diese CpG islands.
In diesem Beispiel sind die Primer AGTAGTAGTAGT (Seq. ID 1) AAAACAAAAACC (Seq. ID 2) und alternativ AGTAGTAGTAGT (Seq. ID 19) und ACAAAAACTAAA (seq. ID 20). Das erste Primerpaar führt mindestens zu den Amplifikaten Seq. ID 3 bis 18, das zweite Primerpaar zu den Amplifikaten der Seq. ID 21 bis 31.
Beispiel 2:
Berechnung der Vorhersage der Anzahl von Amplifikaten in Genomischen Regionen.
Gemäß Anspruch 8 im Patent wird gezeigt mehr als doppelt so viele Amplifikate erstellen zu können, als es statistisch zu erwarten wäre nach Formel 1.
(P „ (Primers)) r , , , U
Figure imgf000028_0001
F gibt dabei die Anzahl der Vorhergesagten Amplifikate an, die zu erwarten sind, wenn man N Basen als Datenbasis aus dem Genom betrachtet. P ist die jeweilige Wahrscheinlichkeit für die Hybridisierung eines Primeroligonukleotids, getrennt nach Hybridisierung im Sense- und Antisense-Strang. M ist die maximal zulässige Länge der zu erwartenden Amplifikate.
Die Wahrscheinlichkeit P wird bestimmt durch eine Markov Kette erster Ordnung. Dabei wird die Annahme gemacht, dass die DNA eine Zufallsfolge in Abhängigkeit benachbarter Basen ist. Für die Berechnung einer Markovkette sind die Übergangswahrscheinlichkeiten von benachbarten Basen notwendig. Diese wurden empirisch aus 12% des assemblierten humanen Genoms, das vollständig mit Bisulfit behandelt wurde, ermittelt und in Tabelle 1 zusammengefasst. In Tabelle 2 sind die Übergangswahrscheinlichkeiten für den entsprechenden komplementär reversen Strang angegeben. Diese ergeben sich durch einfaches Vertauschen der Einträge aus der Tabelle 1.
Tabelle 1
Figure imgf000029_0002
mit P bDNA U)=0.2811
Figure imgf000029_0001
J\α« (00.2199
/WΛ (00.4850 und für den dazu revers-komplementären Strang (durch entsprechendes Austauschen der Einträge) P^DNA ( von >' nach)
Tabelle 2
Figure imgf000029_0003
R O0.4850 (00.2199 *™ (00.0140 O0.2811
Damit hängt die Wahrscheinlichkeit, dass sich für einen Primer PrimE (mit der Basenfolge Bi B2 B3 B4 ...; z.B. ATTG...) eine perfekte Basenpaarung ergibt, von der genauen Abfolge der Basen ab und ergibt sich als das Produkt: rbDNA \ B \ ,' B2) PrbDNA ( B2 ; B3) P rbDNA B3 ; B
P3s(PrimE)=PrbDNA (B A!
"rbDNA B\ ) rbDNA \ 2) P rbDNA \ 31
(Bisulfit-DNA-Strang)
Figure imgf000030_0001
(anti-sense-Strang zu einem Bisulfit-DNA-Strang); für einen Primer Prim auf dem sense-Strang ergeben sich
N *PχPrim) perfekte Basenpaarungen - Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit für eine perfekte Basenpaarung auf dem sense-Strang an einer gegebenen Position: Ps ( Primers )=PS{ Prim U )
+ (l -Pi(PrimU))Pi (PrimV) + (l -P (PrimU))( l -P PrimV))P\PrimW) + ( l -PXPrimU)) ( l -PχPrimV))( l -P (PrimW))P (PrimX) + ... (PrimU, PrimV, PrimW... sind hier verschiedene Primer mit unterschiedlichen Basenpaarungen) und damit als Anzahl der zu erwartenden perfekten Basenpaarungen mit irgendeinem der Primer
N *P (Primers) . Für die Bestimmung von Pa(Primers) auf dem anti-sense-Strang werden die analogen Gleichungen verwendet.
Für das Beispiel mit zwei Primern (einem sense-Primer und einem antisense-Primer) ergeben sich folgende Wahrscheinlichkeiten: P(AGTAGTAGTAGT) = 0.000000860027 P(AACAAAAACTAA) = 0.000030005828
Auf den CpG-lslands, die insgesamt ca. 30.000.000 Basen enthalten, erwartet man eine Häufigkeit von Hybridisierungen für: AGTAGTAGTAGT: 25.80 auf dem sense Strang
AACAAAAACTAA: 900.17 auf dem komplementär reversen Strang.
Auf den jeweils anderen Strängen können die Primer nicht hybridisieren, da auf dem sense-Strang durch die Bisulfitbehandlung keine Cs außerhalb des Kontextes CG auftreten und entsprechend komplementär auf dem antisense-Strang.
Ein Amplifikat entsteht genau dann, wenn bei einer perfekten Basenpaarung auf dem sense-Strang innerhalb der maximalen Fragmentlänge M ein Primer auf dem Gegenstrang eine perfekte Basenpaarung bildet, die Wahrscheinlichkeit dafür ist
Pa (Primers) 2_, ( l — Pa (Primers))' ' für große M und kleine Pa(Primers) wird dieses durch folgenden Ausdruck berechnet:
Pa (Primers) . M ( l -Pa (Primers))M - l ] log ( 1 — P a ( Primers ) ) für die Gesamtzahl F der Amplifikate, die durch die Amplifikation beider Stränge zu erwarten sind, ergibt sich damit
F=N *Ps(Primers) ^ ?*^ ( \ -Pa (Primers))M - l ] g (l -Pa (Prιmers)) Formel l
+N *P (Primers)- — ,, nmers>) (ι _ (Primers))M - ] a K ' \og (l -Ps(Primers)yκ Λ " J
Für das oben angegebene Beispiel ergeben sich für die CpG-lslands mit 30 Mega Basen 3.0498 Amplifikate. Wir können jedoch zeigen (siehe Beispiel 1), dass man mit Primern, die für bestimmte Regionen spezifisch sind, mehr als statistisch vorhergesagte Amplifikate erzeugen kann.

Claims

Patentansprüche
I . Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer DNA, dadurch gekennzeichnet, daß man folgende Schritte ausführt:
a) in einer genomischen DNA Probe wandelt man durch chemische Behandlung an der 5'-Position unmethylierte Cytosinbasen in Uracil, Thymidin oder eine andere vom Hybridisierungsverhalten her dem Cytosin unähnliche Base um;
b) aus dieser chemisch behandelten genomischen DNA amplifiziert man mehr als zehn unterschiedliche Fragmente, die jeweils weniger als 2000 Basenpaare lang sind, gleichzeitig durch Verwendung von synthetischen Oligonukleotiden als Primer, wobei diese Primer jeweils Sequenzen aus an der Genregulation beteiligten und/oder transkribierten und/oder translatierten genomischen Sequenzen enthalten, wie sie nach einer Behandlung gemäß Schritt a) vorliegen würden;
c) man bestimmt den Sequenzkontext aller oder eines Teils der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide.
2. Verfahren nach Anspruch 1 , dadurch gekennzeichnet, daß man die chemische Behandlung mitteis einer Lösung eines Bisulfits, Hydrogensulfits oder Disulfits durchführt.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß mindestens eines der in Schritt b) verwendeten Oligonukleotide weniger Nukleobasen enthält als es statistisch für eine sequenzspezifische Hybridisierung an die chemisch behandelte genomische DNA Probe erforderlich wäre.
4. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide kürzer als 18 Nukleobasen ist.
5. Verfahren nach einem der Ansprüche 1 bis 3, dadurch gekennzeichnet, daß mindestens eines der in Schritt b) des Anspruchs 1 verwendeten Oligonukleotide kürzer als 15 Nukleobasen ist.
6. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß man in Schritt b) des Anspruchs 1 mehr als 4 verschiedene Oligonukleotide gleichzeitig für die Amplifikation verwendet.
7. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß man in Schritt b) des Anspruchs 1 mehr als 26 verschiedene Oligonukleotide gleichzeitig für die Amplifikation verwendet.
8. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als nach berechnet nach Formel 1 aus an der Regulation von Genen beteiligten Genomabschnitten, wie Promotoren und Enhancern, stammt, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist wie berechnet nach Formel 1 ,
(P ( Primers ) )
^ ' ( M»" (1 -f,(WM,)) l" -f-l w*'>)'' -11 Formel 1
[P (Primers))
wobei man die Berechnung wie folgt durchführt:
bei der mit Bisulfit behandelten DNA kann C nur noch im Kontext CG auftreten, so wird angenommen, daß die primäre DNA eine Zufallsfolge mit Abhängigkeit direkt benachbarter Basen ist (Markov-Kette erster Ordnung); die empirisch aus der Datenbank (vollständig methyliert; mit Bisullfit behandelt) ermittelten paarweisen Basenwahrscheinlichkeiten ergeben sich gleich für beide DNA- Stränge als P bDNA (von;nach) aus der folgenden Tabelle:
Figure imgf000034_0002
mit
J O0.2811
/ 0.0140
Figure imgf000034_0001
/ O0.4850
und für den dazu revers-komplementären Strang (durch entsprechendes Austauschen der Einträge) PrbDNA (vo ; nach)
Figure imgf000034_0003
rbDNA (Λ)=0.4850 rbDNA (C)=0.2199 rbDNA (G)=0.0140 rbDNA (7,)=0.2811
;damit hängt die Wahrscheinlichkeit, daß sich für einen Primer PrimE (mit der Basenfolge Bi B2 B3 B4 ...; z.B. ATTG...) eine perfekte Basenpaarung ergibt, von der genauen Abfolge der Basen ab und ergibt sich als das Produkt:
Figure imgf000035_0001
(Bisulfit-DNA-Strang)
P D3a t(Pτ,n ■m -
Figure imgf000035_0002
(anti-sense-Strang zu einem Bisulfit-DNA-Strang); für einen Primer Prim auf dem sense-Strang ergeben sich
N *P (Prim) ; perfekte Basenpaarungen - Werden mehrere Primer (PrimU, PrimV, PrimW, PrimX, etc.) gleichzeitig verwendet, ergibt sich als Wahrscheinlichkeit für eine perfekte Basenpaarung auf dem sense-Strang an einer gegebenen Position: P s ( Primers ) = P ( Prim U )
+ ( l -P (PrimU))Ps(PrimV)
+ ( l -P SPrimU))( l -P (PrimV))P s (PrimW)
+ { \ -P SPrimU))( l -P (PrimV)) ( l ~P (PrimW))P s (PrimX)
+ ... und damit als Anzahl der zu erwartenden perfekten Basenparungen mit irgendeinem der Primer
N *P Primers) ; für die Bestimmung von Pa(Primers) auf dem anti-sense-Strang werden die analogen Gleichungen verwendet; ein Amplifikat entsteht genau dann, wenn bei einer perfekten Basenpaarung auf dem sense-Strang innerhalb der maximalen Fragmentlänge M ein Primer auf dem Gegenstrang eine perfekte Basenpaarung bildet, die Wahrscheinlichkeit dafür ist
Figure imgf000035_0003
( l —Pa (Primers))' ' für große M und kleine Pa(Primers) wird dieses durch folgenden Ausdruck berechnet:
Figure imgf000035_0004
für die Gesamtzahl F der Amplifikate, die durch die Amplifikation beider Stränge zu erwarten sind, ergibt sich damit F=N *P, (Primers) ^" ^ ™^ , Λ( l -P a (Primers))M - 1 } log ( l -Pa (Prιmers)) Formel l
( P i PviϊϊiQTS ) )
+^ ^„ (^gra) log ( 1 (frimera )) [( . - ( Η ,era))" - i ]
9. Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als berechnet entsprechend Anspruch 8 aus Genomabschnitten stammt, die in mindestens einer Zelle des jeweiligen Organismus in mRNA transkribiert werden, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8.
10.Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als berechnet entsprechend Anspruch 8 aus nach der Transkription in mRNA gespiiceten Genomabschnitten (Exons) stammt, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8.
11.Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche für Teile einer oder mehrerer Genfamilien kodieren, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8.
12.Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als berechnet entsprechend Anspruch 8. aus Genomabschnitten stammen, welche für sogenannte „matrix attachment Sites" (MARs)- charakteristische Sequenzen enthalten, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8.
13.Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als berechnet entsprechend Anspruch 8 aus Genomabschnitten stammen, welche als sogenannte „boundary elements" die Verpackungsdichte des Chromatins organisieren, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre, oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8.
14.Verfahren nach einem der Ansprüche 1 bis 7, dadurch gekennzeichnet, daß in Schritt b) des Anspruchs 1 mehr als doppelt so viele amplifizierte Fragmente als berechnet entsprechend Anspruch 8 aus „multiple drug resistance gene" (MDR)- Promotoren oder kodierenden Regionen stammen, als bei einer rein zufälligen Wahl der Oligonukleotidsequenzen zu erwarten wäre oder aber deren Anteil an den insgesamt nachweisbaren Fragmenten mehr als doppelt so hoch ist als berechnet entsprechend Anspruch 8.
15.Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß zur Amplifkation der in Anspruch 1 beschriebenen Fragmente zwei Oligonukleotide oder zwei Klassen von Oligonukleotiden verwendet werden, von denen eines oder eine Klasse außer im Kontext CpG oder CpNpG zwar die Base C enthalten kann, nicht aber die Base G und von denen das andere oder die andere Klasse außer im Kontext CpG oder CpNpG zwar die Base G, nicht aber die Base C enthalten kann.
16.Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß die in Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchgeführt wird, von denen eines eine vier bis sechzehn Basen lange Sequenz enthält, welche zu einer solchen DNA komplementär ist oder dieser entspricht, wie sie entstehen würde, wenn ein ebenso langes DNA Fragment, an welches einer der Transkriptionsfaktoren
AhR/Arnt aryl hydrocarbon receptor/aryl hydrocarbon receptor nuclear translocator
Amt aryl hydrocarbon receptor nuclear translocator AML-1a CBFA2; core-binding factor, runt domain, alpha subunit 2 (acute myeloid leukemia 1 ; aml1 oncogene)
AP-1 activator protein-1 (AP-1); Synonyme: c-Jun
C/EBP CCAAT/enhancer binding protein
C/EBPalpha CCAAT/enhancer binding protein (C/EBP), alpha
C/EBPbeta CCAAT/enhancer binding protein (C/EBP), beta
CDP CUTL1 ; cut (Drosophila)-Iike 1 (CCAAT displacement protein)
CDP CUTL1 ; cut (Drosophila)-Iike 1 (CCAAT displacement protein)
CDP CR1 complement component (3b/4b) receptor 1 CDP CR3 complement component (3b/4b) receptor 3 CHOP-C/EBPalpha DDIT; DNA-damage-inducible transcript 3/CCAAT/enhancer binding protein (C/EBP), alpha c-Myc/Max avian myelocytomatosis viral oncogene/MYC-ASSOCIATED FACTOR X
CREB cAMP responsive element binding protein CRE-BP1 CYCLIC AMP RESPONSE ELEMENT-BINDING PROTEIN 2, CREB2, CREBP1 ; now ATF2; activating transcription factor 2
CRE-BP1/c-Jun activator protein-1 (AP-1); Synonyme: c-Jun
CREB MP responsive element binding protein
E2F E2F transcription factor (originally identified as a DNA- binding protein essential E1A-dependent activation of the adenovirus E2 promoter)
E47 transcription factor 3 (E2A immunoglobulin enhancer binding factors E12/E47)
E47 transcription factor 3 (E2A immunoglobulin enhancer binding factors E12/E47)
Egr-1 early growth response 1 Egr-2 early growth response 2 (Krox-20 (Drosophila) homolog) ELK-1 ELK1 , member of ETS (environmental tobacco smoke) oncogene family
Freac-2 FKHL6; forkhead (Drosophila)-Iike 6; FORKHEAD-RELATED ACTIVATOR 2; FREAC2
Freac-3 FKHL7; forkhead (Drosophila)-Iike 7; FORKHEAD-RELATED ACTIVATOR 3; FREAC3
Freac-4 FKHL8; forkhead (Drosophila)-Iike 8; FORKHEAD-RELATED ACTIVATOR 4; FREAC4
Freac-7 FKHL11 ; forkhead (Drosophila)-Iike 9; FORKHEAD- RELATED ACTIVATOR 7; FREAC7 GATA-1 GATA-binding protein 1/Enhancer- Binding Protein GATA1
GATA-1 GATA-binding protein 1/Enhancer- Binding Protein GATA1
GATA-1 GATA-binding protein 1/Enhancer- Binding Protein GATA1
GATA-2 GATA-binding protein 2/Enhancer- Binding Protein GATA2
GATA-3 GATA-binding protein 3/Enhancer- Binding Protein GATA3
GATA-X
HFH-3 FKHL10; forkhead (Drosophila)-Iike 10; FORKHEAD- RELATED ACTIVATOR 6; FREAC6
HNF-1 TCF1 ; transcription factor 1 , hepatic; LF-B1 , hepatic nuclear factor (HNF1 ), albumin proximal factor
HNF-4 hepatocyte nuclear factor 4
IRF-1 interferon regulatory factor 1
ISRE interferon-stimulated response element
Lmo2 complex LIM domain only 2 (rhombotin-like 1)
MEF-2 MADS box transcription enhancer factor 2, polypeptide A (myocyte enhancer factor 2A)
MEF-2 MADS box transcription enhancer factor 2, polypeptide A (myocyte enhancer factor 2A) myogenin/NF-1 Myogenin (myogenic factor 4)/Neurofibromin 1 ; NEUROFIBROMATOSIS, TYPE I
MZF1 ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- responsive)
MZF1 ZNF42; zinc finger protein 42 (myeloid-specific retinoic acid- responsive)
NF-E2 NFE2; nuclear factor (erythroid-derived 2), 45kD NF-kappaB (p50) nuclear factor of kappa light polypeptide gene enhancer in B- cells p50 subunit
NF-kappaB (p65) nuclear factor of kappa light polypeptide gene enhancer in B- cells p65 subunit
NF-kappaB nuclear factor of kappa light polypeptide gene enhancer in B- cells
NF-kappaB nuclear factor of kappa light polypeptide gene enhancer in B- cells
NRSF NEURON RESTRICTIVE SILENCER FACTOR; REST; RE1- silencing transcription factor
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; POU2F1 ; POU domain, class 2, transcription factor 1
Oct-1 OCTAMER-BINDING TRANSCRIPTION FACTOR 1 ; POU2F1 ; POU domain, class 2, transcription factor 1
P300 E1A (adenovirus E1A oncoprotein)-BINDING PROTEIN, 300-KD
P53 tumor protein p53 (Li-Fraumeni syndrome); TP53 Pax-1 paired box gene 1
Pax-3 paired box gene 3 (Waardenburg syndrome 1)
Pax-6 paired box gene 6 (aniridia, keratitis)
Pbx l b pre-B-cell leukemia transcription factor
Pbx-1 pre-B-cell leukemia transcription factor 1
RORalpha2 RAR-RELATED ORPHAN RECEPTOR ALPHA; RETINOIC
ACID-BINDING RECEPTOR ALPHA
RREB-1 ras responsive element binding protein 1
SP1 simian-virus-40-protein-1
SP1 simian-virus-40-protein-1
SREBP-1 sterol regulatory element binding transcription factor 1
SRF serum response factor (c-fos serum response element- binding transcription factor)
SRY sex determining region Y
STAT3 Signal transducer and activator of transcription 1 , 91 kD
Tal-1alpha/E47 T-cell acute lymphocytic leukemia 1 /transcription factor 3
(E2A immunoglobulin enhancer binding factors E12/E47)
TATA cellular and viral TATA box elements Tax/CREB Transiently-expressed axonal glycoprotein/cAMP responsive element binding protein
Tax/CREB Transiently-expressed axonal glycoprotein/cAMP responsive element binding protein
TCF11/MafG v-maf musculoaponeurotic fibrosarcoma (avian) oncogene family, protein G
TCF11 Transcription Factor 11 ; TCF11 ; NFE2L1 ; nuclear factor
(erythroid-derived 2)-like 1
USF upstream stimulating factor Whn winged-helix nude X-BP-1 X-box binding protein 1 oder YY1 ubiquitously distributed transcription factor belonging to theGLI-Kruppel class of zinc finger proteins
bindet, einer chemischen Behandlung gemäß Anspruch 1 unterzogen würde.
17.Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß man die in Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchführt, von denen eines die eine vier bis sechzehn Basen lange Sequenz enthält, welche zu einer solchen DNA komplementär ist oder dieser entspricht, wie sie entstehen würde, wenn ein ebenso langes DNA Fragment, welches über seine Sequenz oder Sekundärstruktur die spezifische Lokalisierung von Genom/Chromatinabschnitten innerhalb des Zellkerns herbeiführen kann, einer chemischen Behandlung gemäß Anspruch 1 unterzogen würde. I δ.Verfahren nach einem der Ansprüche 1 bis 4, dadurch gekennzeichnet, daß die in Anspruch 1 beschriebene Amplifikation mittels zweier Oligonukleotide durchgeführt wird, von denen mindestens eine der Sequenzen (von 5'nach 3')
TCGCGTGTA, TACACGCGA, TGTACGCGA, TCGCGTACA, TTGCGTGTT, AACACGCAA, GGTACGTAA, TTACGTACC, TCGCGTGTT, AACACGCGA, GGTACGCGA, TCGCGTACC, TTGCGTGTA, TACACGCAA, TGTACGTAA, TTACGTACA, TACGTG, CACGTA, TACGTG, CACGTA,
ATTGCGTGT, ACACGCAAT, GTACGTAAT, ATTACGTAC, ATTGCGTGA, TCACGCAAT, TTACGTAAT, ATTACGTAA, ATCGCGTGA, TCACGCGAT, TTACGCGAT, ATCGCGTAA, ATCGCGTGT, ACACGCGAT, GTACGCGAT, ATCGCGTAC, TGTGGT, ACCACA, ATTATA, TATAAT,
TGAGTTAG, CTAACTCA, TTGATTTA, TAAATCAA, TGATTTAG, CTAAATCA, TTGAGTTA, TAACTCAA,
TTTGGT, ACCAAA, ATTAAA, TTTAAT, TGTGGA, TCCACA, TTTATA, TATAAA , TTTGGA, TCCAAA, TTTAAA, TTTAAA, TGTGGT, ACCACA, ATTATA, TATAAT,
ATTAT, ATAAT, GTAAT, ATTAC, ATTGT, ACAAT, GTAAT, ATTAC,
GAAAG, CTTTC, TTTTT, AAAAA,
GTAAT, ATTAC, ATTGT, ACAAT,
GAAAT, ATTTC, ATTTT, AAAAT,
GTAAG, CTTAC, TTTGT, ACAAA,
TTAATAATCGAT, ATCGATTATTAA, ATCGATTATTGG, CCAATAATCGAT,
ATCGATTA, TAATCGAT, TAATCGAT, ATCGATTA,
ATCGATCGG, CCGATCGAT, TCGATCGAT, ATCGATCGA, ATCGATCGT, ACGATCGAT, GCGATCGAT, ATCGATCGC,
TATCGATA, TATCGATA, TATCGGTG, CACCGATA, TATTAATA, TATTAATA, TATTGGTG, CACCAATA,
GTGTAATATTT, AAATATTACAC, GGGTATTGTAT, ATACAATACCC, GTGTAATTTTT, AAAAATTACAC, GGGGATTGTAT, ATACAATCCCC, ATGTAATTTTT, AAAAATTACAT, GGGGATTGTAT, ATACAATCCCC, ATGTAATATTT, AAATATTACAT, GGGTATTGTAT, ATACAATACCC, ATTACGTGGT, ACCACGTAAT, ATTACGTGGT, ACCACGTAAT, TGACGTAA, TTACGTCA, TTACGTTA, TAACGTAA, TGACGTTA, TAACGTCA, TGACGTTA, TAACGTCA, TTACGTAA, TTACGTAA, TTACGTAA, TTACGTAA, TGACGTTA, TAACGTCA, TAACGTTA, TAACGTTA,
TGACGT, ACGTCA, GCGTTA, TAACGC, TGACGT, ACGTCA, ACGTTA, TAACGT, TTTCGCGT, ACGCGAAA, GCGCGAAA, TTTCGCGC, TTTGGCGT, ACGCCAAA, GCGTTAAA, TTTAACGC,
TAGGTGTTA, TAACACCTA, TAATATTTG, CAAATATTA, TAGGTGTTT, AAACACCTA, GAATATTTG, CAAATATTC,
GTAGGTGG, CCACCTAC, TTATTTGT, ACAAATAA, GTAGGTGT, ACACCTAC, ATATTTGT, ACAAATAT,
TGCGTGGGCGG, CCGCCCACGCA, TCGTTTACGTA, TACGTAAACGA, TGCGTGGGCGT, ACGCCCACGCA, ACGTTTACGTA, TACGTAAACGT,
TGCGTAGGCGT, ACGCCTACGCA, ACGTTTACGTA, TACGTAAACGT, TGCGTAGGCGG, CCGCCTACGCA, TCGTTTACGTA, TACGTAAACGA, ATAGGAAGT, ACTTCCTAT, ATTTTTTGT, ACAAAAAAT,
TCGGAAGT, ACTTCCGA, ATTTTCGG, CCGAAAAT, TCGGAAGT, ACTTCCGA, GTTTTCGG, CCGAAAAC, TCGGAAAT, ATTTCCGA, ATTTTCGG, CCGAAAAT, TCGGAAAT, ATTTCCGA, GTTTTCGG, CCGAAAAC, GTAAATAA, TTATTTAC, TTGTTTAT, ATAAACAA, GTAAATAAATA, TATTTATTTAC, TGTTTATTTAT, ATAAATAAACA,
AAAGTAAATA, TATTTACTTT, TGTTTATTTT, AAAATAAACA, AATGTAAATA, TATTTACATT, TGTTTATATT, AATATAAACA, TAAGTAAATA, TATTTACTTA, TGTTTATTTA, TAAATAAACA, TATGTAAATA, TATTTACATA, TGTTTATATA, TATATAAACA,
ATAAATA, TATTTAT, TGTTTAT, ATAAACA, ATAAATA, TATTTAT, TATTTAT, ATAAATA, GATA, TATC, TATT, AATA,
TAGATAA, TTATCTA, TTATTTG, CAAATAA, TTGATAA, TTATCAA, TTATTAG, CTAATAA, GATAA, TTATC, TTATT, AATAA,
GATG, CATC, TATT, AATA,
GATAG, CTATC, TTATT, AATAA, GATAAG, CTTATC, TTTATT, AATAAA, TGTTTATTTA, TAAATAAACA, TAAATAAATA, TATTTATTTA, TGTTTGTTTA, TAAACAAACA, TAAATAAATA, TATTTATTTA, TATTTATTTA, TAAATAAATA, TAAATAAATA, TATTTATTTA, TATTTGTTTA, TAAACAAATA, TAAATAAATA, TATTTATTTA,
GTTAATGATT, AATCATTAAC, AATTATTAAT, ATTAATAATT, GTTAATTATT, AATAATTAAC, AATAATTAAT, ATTAATTATT, GTTAATTAAT, ATTAATTAAC, ATTAATTAAT, ATTAATTAAT, GTTAATGAAT, ATTCATTAAC, ATTTATTAAT, ATTAATAAAT,
TAAAGTTTA, TAAACTTTA, TGAATTTTG, CAAAATTCA, TAAAGGTTA, TAACCTTTA, TGATTTTTG, CAAAAATCA,
AAAGTGAAATT, AATTTCACTTT, GGTTTTATTTT, AAAATAAAACC, AAAGCGAAATT, AATTTCGCTTT, GGTTTCGTTTT, AAAACGAAACC,
TAGTTTTATTTTTTT, AAAAAAATAAAACTA, GGGAAAGTGAAATTG,
CAATTTCACTTTCCC,
TAGTTTTATTTTTTT, AAAAAAATAAAACTA, GGAAAAGTGAAATTG,
CAATTTCACTTTTCC,
TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGAAAAGAGAAATTG,
CAATTTCTCTTTTCC,
TAGTTTTTTTTTTTT, AAAAAAAAAAAACTA, GGGAAAGAGAAATTG,
CAATTTCTCTTTCCC,
TAGGTG, CACCTA, TATTTG, CAAATA,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AGGGTTATTTTTAGAG,
CTCTAAAAATAACCCT,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGAGTTATTTTTAGAG,
CTCTAAAAATAACTCC ,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, AGAGTTATTTTTAGAG,
CTCTAAAAATAACTCT,
TTTTAAAAATAATTTT, AAAATTATTTTTAAAA, GGGGTTATTTTTAGAG,
CTCTAAAAATAACCCC,
TGTTATTAAAAATAGAAA, TTTCTATTTTTAATAACA, TTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAA, TGTTATTAAAAATAGAAT, ATTCTATTTTTAATAACA, GTTTTATTTTTAGTAATA, TATTACTAAAAATAAAAC, TTTGGTAT, ATACCAAA, GTGTTAAA, TTTAACAC GGGGA, TCCCC, TTTTT, AAAAA,
TAGGGG, CCCCTA, TTTTTA, TAAAAA,
GAGGGG, CCCCTC, TTTTTT, AAAAAA,
TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT,
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC,
TGTTGAGTTAT, ATAACTCAACA, ATGATTTAGTA, TACTAAATCAT,
TGTTGATTTAT, ATAAATCAACA, GTGAGTTAGTA, TACTAACTCAC, GGGGATTTTT, AAAAATCCCC, GGGAATTTTT, AAAAATTCCC, GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, GGGGATTTTT, AAAAATCCCC, GGAAATTTTT, AAAAATTTCC, GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, GGGAATTTTT, AAAAATTCCC, GGAAATTTTT, AAAAATTTCC, GGGATTTTTT, AAAAAATCCC, GGAAAGTTTT, AAAACTTTCC, GGGAATTTTT, AAAAATTCCC, GGGAATTTTT, AAAAATTCCC, GGGATTTTTT, AAAAAATCCC, GGGAAGTTTT, AAAACTTCCC, GGGATTTTTTA, TAAAAAATCCC, TGGAAAGTTTT, AAAACTTTCCA, TTTAGTATTACGGATAGAGGT, ACCTCTATCCGTAATACTAAA, GTTTTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAAAAAC, TTTAGTATTACGGATAGAGTT, AACTCTATCCGTAATACTAAA, GGTTTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAAAACC, TTTAGTATTACGGATAGCGTT, AACGCTATCCGTAATACTAAA, GGCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGCC, TTTAGTATTACGGATAGCGGT, ACCGCTATCCGTAATACTAAA, GTCGTTGTTCGTGGTGTTGAA, TTCAACACCACGAACAACGAC,
ATATGTAAAT, ATTTACATAT, ATTTGTATAT, ATATACAAAT, TTATGTAAAT, ATTTACATAA, ATTTGTATAA, TTATACAAAT,
GAATATTTA, TAAATATTC, TGAATATTT, AAATATTCA, GAATATGTA, TACATATTC, TGTATATTT, AAATATACA,
ATAAT, ATTAT, ATTAT, ATAAT, GTAAT, ATTAC, ATTAT, ATAAT,
AATGTAAAT, ATTTACATT, ATTTGTATT, AATACAAAT,
ATTTGTATATT, AATATACAAAT, GGTATGTAAAT, ATTTACATACC, ATTTGTATATT, AATATACAAAT, AATATGTAAAT, ATTTACATATT, ATTTGTATATT, AATATACAAAT, AGTATGTAAAT, ATTTACATACT, ATTTGTATATT, AATATACAAAT, GATATGTAAAT, ATTTACATATC,
AGGAGT, ACTCCT, ATTTTT, AAAAAT, GGGAGT, ACTCCC, ATTTTT, AAAAAT, GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, GGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCC, AGATATGTTCGGGTATGTTT, AAACATACCCGAACATATCT, TCGTTTCGTTTTAGATAT, ATATCTAAAACGAAACGA, ATATTTAGAGCGGAACGG, CCGTTCCGCTCTAAATAT,
CGTTACGGTT, AACCGTAACG, AATCGTGACG, CGTCACGATT, CGTTACGGTT, AACCGTAACG, GATCGTGACG, CGTCACGATC, CGTTACGTTT, AAACGTAACG, AAGCGTGACG, CGTCACGCTT, CGTTACGTTT, AAACGTAACG, GAGCGTGACG, CGTCACGCTC, TTTACGTATGA, TCATACGTAAA, TTATGCGTGAA, TTCACGCATAA, TTTACGTTTGA, TCAAACGTAAA, TTAAGCGTGAA, TTCACGCTTAA, TTTACGTTTTA, TAAAACGTAAA, TGAAGCGTGAA, TTCACGCTTCA, TTTACGTATTA, TAATACGTAAA, TGATGCGTGAA, TTCACGCATCA,
AATTAATTAA, TTAATTAATT, TTGATTGATT, AATCAATCAA, TATTAATTAA, TTAATTAATA, TTGATTGATG, CATCAATCAA,
TAATTAT, ATAATTA, ATGATTG, CAATCAT,
TAGGTTA, TAACCTA, TGATTTA, TAAATCA,
TTTTAAATATTTTT, AAAAATATTTAAAA, GGGGGTGTTTGGGG,
CCCCAAACACCCCC,
TTTTAAATTATTTT, AAAATAATTTAAAA, GGGGTGGTTTGGGG,
CCCCAAACCACCCC,
TTTTAAATTTTTTT, AAAAAAATTTAAAA, GGGGGGGTTTGGGG,
CCCCAAACCCCCCC,
TTTTAAATAATTTT, AAAATTATTTAAAA, GGGGTTGTTTGGGG,
CCCCAAACAACCCC,
GAGGCGGGG, CCCCGCCTC, TTTCGTTTT, AAAACGAAA, GAGGTAGGG, CCCTACCTC, TTTTGTTTT, AAAACAAAA, AAGGCGGGG, CCCCGCCTT, TTTCGTTTT, AAAACGAAA, AAGGTAGGG, CCCTACCTT, TTTTGTTTT, AAAACAAAA,
GGGGGCGGGGT, ACCCCGCCCCC, ATTTCGTTTTT, AAAAACGAAAT, GGGGGCGGGGT, ACCCCGCCCCC, GTTTCGTTTTT, AAAAACGAAAC, TATTATTTTAT, ATAAAATAATA, GTGGGGTGATA, TATCACCCCAC, GATTATTTTAT, ATAAAATAATC, GTGGGGTGATT, AATCACCCCAC,
ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, ATTACGTGAT, ATCACGTAAT, GTTACGTGAT, ATCACGTAAC,
TTTTATATGG, CCATATAAAA, TTATATAAGG, CCTTATATAA, TTATATATGG, CCATATATAA, TTATATATGG, CCATATATAA, AAATAAT, ATTATTT, GTTGTTT, AAACAAC, AAATTAA, TTAATTT, TTAGTTT, AAACTAA, AAATTAT, ATAATTT, GTAGTTT, AAACTAC, AAATAAA, TTTATTT, TTTGTTT, AAACAAA,
ATTTTTCGGAAATG, CATTTC CG AAAAAT, TATTTTCGGGAAAT,
ATTTCCCGAAAATA,
ATTTTTCGGAAATG, CATTTC CG AAAAAT, TATTTTCGGGAAAT,
ATTTCCCGAAAATA,
ATTTTCGGGAAATG, CATTTCCCGAAAAT, TATTTTTCGGAAAT,
ATTTCCGAAAAATA,
ATTTTCGGGAAGTG, CACTTCCCGAAAAT, TATTTTTCGGAAAT, ATTTCCGAAAAATA,
AATAGATGTT, AACATCTATT, AATATTTGTT, AACAAATATT, AATAGATGGT, ACCATCTATT, ATTATTTGTT, AACAAATAAT,
GTATAAATA, TATTTATAC, TATTTATAT, ATATAAATA, GTATAAATG, CATTTATAC, TATTTATAT, ATATAAATA, GTATAAAAA, TTTTTATAC, TTTTTATAT, ATATAAAAA, GTATAAAAG, CTTTTATAC, TTTTTATAT, ATATAAAAA, TTATAAATA, TATTTATAA, TATTTATAG, CTATAAATA, TTATAAATG, CATTTATAA, TATTTATAG, CTATAAATA, TTATAAAAA, TTTTTATAA, TTTTTATAG, CTATAAAAA, TTATAAAAG, CTTTTATAA, TTTTTATAG, CTATAAAAA, GGGGGTTGACGTA, TACGTCAACCCCC, TGCGTTAATTTTT, AAAAATTAACGCA,
GGGGGTTGACGTA, TACGTCAACCCCC, TACGTTAATTTTT, AAAAATTAACGTA,
TGACGTATATTTTT, AAAAATATACGTCA, GGGGATATGCGTTA,
TAACGCATATCCCC,
TGACGTATATTTTT, AAAAATATACGTCA, GGGGGTATGCGTTA,
TAACGCATACCCCC,
ATGATTTAGTA, TACTAAATCAT, TGTTGAGTTAT, ATAACTCAACA,
GTTAT, ATAAC, ATGAT, ATCAT,
TTACGTGA, TCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGG, CCACGTAA, TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, TTACGTGA, TCACGTAA, GACGTT, AACGTC, AGCGTT, AACGCT,
TGACGTGT, ACACGTCA, ATACGTTA, TAACGTAT, TGACGTGG, CCACGTCA, TTACGTTA, TAACGTAA, CGGTTATTTTG, CAAAATAACCG, TAAGATGGTCG oder CGACCATCTTA
enthält, welche zu einer solchen DNA komplementär ist oder dieser entspricht, wie sie entstehen würde, wenn ein ebenso langes DNA Fragment, welches über seine Sequenz oder Sekundärstruktur die spezifische Lokalisierung von Genom/Chromatinabschnitten innerhalb des Zellkerns herbeiführen kann, einer chemischen Behandlung gemäß Anspruch 1 unterzogen würde.
19.Verfahren nach einem der Ansprüche 16 bis 18, dadurch gekennzeichnet, daß die zur Amplifikation verwendeten Oligonukleotide außer den in den Ansprüchen 16 bis 18 definierten Konsensussequenzen mehrere Positionen enthalten, an denen entweder irgendeine der drei Basen G, A und T oder irgendeine der Basen C, A und T vorhanden sein kann.
20.Verfahren nach Anspruch 19, dadurch gekennzeichnet, daß die zur Amplifikation verwendeten Oligonukleotide außer einer der in den Anspruch 18 beschriebenen Konsensussequenzen nur maximal zusätzlich so viele weitere Basen enthalten, wie es zur gleichzeitigen Amplifikation von mehr als einhundert verschiedenen Fragmenten pro Reaktion aus der chemisch behandelten DNA, berechnet entsprechend Anspruch 8, erforderlich ist.
21. Verfahren nach einem der vorangehenden Ansprüche dadurch gekennzeichnet, daß die Untersuchung des Sequenzkontextes aller oder eines Teils der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide gemäß Anspruch 1 c) durch Hybridisierung der bereits in der Amplifikation mit einem Fluoreszenzmarker versehenen Fragmente an einen Oligonukleotid- Array (DNA Chip) erfolgt.
22.Verfahren nach einem der Ansprüche 1 bis 20 dadurch gekennzeichnet, daß die amplifizierten Fragmente auf einer Oberfläche immobilisiert und anschließend eine Hybridisierung mit einer kombinatorischen Bibiliothek von unterscheidbaren Oligonukleotid- oder PNA-Oligomer-Sonden durchgeführt wird.
23.Verfahren nach Anspruch 22 dadurch gekennzeichnet, daß die Sonden mittels Matrix-assistierter Laser-Desorptions/Ionisations Massenspektrometrie (MALDI-MS) anhand ihrer eindeutigen Masse nachgewiesen werden und damit der Sequenzkontext aller oder eines Teils der in den amplifizierten Fragmenten enthaltenen CpG Dinukleotide oder CpNpG Trinukleotide entschlüsselt wird.
24.Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß die Amplifikation wie beschrieben in Schritt b) des Anspruchs 1 durch eine Polymerase Kettenreaktion ausgeführt wird, in der die Größe der amplifizierten Fragmente mittels auf weniger als 30 s verkürzter Kettenverlängerungsschritte begrenzt wird.
25.Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, daß nach der Amplifikation gemäß Schritt b) des Anspruchs 1 die Produkte durch Gelelektrophorese aufgetrennt werden und die Fragmente, die kleiner als 2000 Basenpaare oder kleiner als ein beliebiger Grenzwert unterhalb von 2000 Basenpaaren sind, durch Ausschneiden von den anderen Produkten der Amplifikation vor der Auswertung gemäß Schritt c) des Anspruchs 1 abgetrennt werden.
26.Verfahren nach Anspruch 25 dadurch gekennzeichnet, daß nach der Abtrennung von Amplifikaten bestimmter Größe diese vor der Durchführung des Schrittes c) des Anspruchs 1 nochmals amplifiziert werden.
27. Kit, enthaltend mindestens zwei Primerpaare, Reagenzien und Hilfsstoffe für die Amplifikation und/oder Reagenzien und Hilfsmittel für die chemische Behandlung gemäß Anspruch 1 a) und/oder eine kombinatorische Sondenbibliothek und/oder einen Oligonukleotid-Array (DNA-Chip), soweit sie für die Durchführung des erfindungsgemäßen Verfahrens erforderlich oder dienlich sind.
PCT/DE2000/004381 1999-12-06 2000-12-06 Verfahren zur parallelen detektion des methylierungszustandes von genomischer dna WO2001042493A2 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE10083729T DE10083729D2 (de) 1999-12-06 2000-12-06 Verfahren zur parallelen Detektion des Methylierungszustandes von genomischer DNA
US10/149,109 US20040248090A1 (en) 1999-12-06 2000-12-06 Method for the parallel detection of the degree of methylation of genomic dna
EP00989842A EP1238112A2 (de) 1999-12-06 2000-12-06 Verfahren zur parallelen detektion des methylierungszustandes von genomischer dna
CA002395047A CA2395047A1 (en) 1999-12-06 2000-12-06 Method for the parallel detection of the degree of methylation of genomic dna
AU26632/01A AU778411B2 (en) 1999-12-06 2000-12-06 Method for the parallel detection of the degree of methylation of genomic DNA

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19959691.3 1999-12-06
DE19959691A DE19959691A1 (de) 1999-12-06 1999-12-06 Verfahren zur parallelen Detektions des Methylierungszustandes von genomischer DNA

Publications (2)

Publication Number Publication Date
WO2001042493A2 true WO2001042493A2 (de) 2001-06-14
WO2001042493A3 WO2001042493A3 (de) 2002-02-07

Family

ID=7932213

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/DE2000/004381 WO2001042493A2 (de) 1999-12-06 2000-12-06 Verfahren zur parallelen detektion des methylierungszustandes von genomischer dna

Country Status (6)

Country Link
US (1) US20040248090A1 (de)
EP (1) EP1238112A2 (de)
AU (1) AU778411B2 (de)
CA (1) CA2395047A1 (de)
DE (2) DE19959691A1 (de)
WO (1) WO2001042493A2 (de)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002038801A1 (en) * 2000-11-13 2002-05-16 Human Genetic Signatures Pty Ltd Detection of methylated dna molecules
WO2003031649A2 (de) * 2001-10-05 2003-04-17 Epigenomics Ag Verfahren zum nachweis von cytosin-methylierung in cpg-inseln
WO2004081232A1 (en) * 2003-03-13 2004-09-23 Beijing Institute For Cancer Research The method of in vitro detecting aberrant dysplasia, and the artificial nucleotides being used
US7799525B2 (en) 2003-06-17 2010-09-21 Human Genetic Signatures Pty Ltd. Methods for genome amplification
US7803580B2 (en) 2004-09-10 2010-09-28 Human Genetic Signatures Pty. Ltd. Amplification blocker comprising intercalating nucleic acids (INA) containing intercalating pseudonucleotides (IPN)
US7833942B2 (en) 2004-12-03 2010-11-16 Human Genetic Signatures Pty. Ltd. Methods for simplifying microbial nucleic acids by chemical modification of cytosines
US7846693B2 (en) 2003-09-04 2010-12-07 Human Genetic Signatures Pty. Ltd. Nucleic acid detection assay
EP2322656A1 (de) * 2009-11-17 2011-05-18 Centre National de la Recherche Scientifique (C.N.R.S) Verfahren zur Diagnose von Hautkrankheiten
US8088914B2 (en) 2004-04-13 2012-01-03 The Rockefeller University MicroRNA and methods for inhibiting same
US8119788B2 (en) * 2005-09-27 2012-02-21 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services, Centers For Disease Control And Prevention Compositions and methods for the detection of Candida species
US8168777B2 (en) 2004-04-29 2012-05-01 Human Genetic Signatures Pty. Ltd. Bisulphite reagent treatment of nucleic acid
US8343738B2 (en) 2005-09-14 2013-01-01 Human Genetic Signatures Pty. Ltd. Assay for screening for potential cervical cancer
US8431347B2 (en) 2005-05-26 2013-04-30 Human Genetic Signatures Pty Ltd Isothermal strand displacement amplification using primers containing a non-regular base
US8685675B2 (en) 2007-11-27 2014-04-01 Human Genetic Signatures Pty. Ltd. Enzymes for amplification and copying bisulphite modified nucleic acids
EP2971171A4 (de) * 2013-03-14 2016-11-02 Abbott Molecular Inc Multiplex-methylierungs-spezifische verstärkersysteme und -verfahren
US9732375B2 (en) 2011-09-07 2017-08-15 Human Genetic Signatures Pty. Ltd. Molecular detection assay using direct treatment with a bisulphite reagent

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7582420B2 (en) 2001-07-12 2009-09-01 Illumina, Inc. Multiplex nucleic acid reactions
US8076063B2 (en) 2000-02-07 2011-12-13 Illumina, Inc. Multiplexed methylation detection methods
US7955794B2 (en) 2000-09-21 2011-06-07 Illumina, Inc. Multiplex nucleic acid reactions
US20110151438A9 (en) 2001-11-19 2011-06-23 Affymetrix, Inc. Methods of Analysis of Methylation
EP1567669B1 (de) * 2002-12-02 2010-03-24 Illumina Cambridge Limited Bestimmung der methylierung von nukleinsäuresequenzen
US20060134650A1 (en) * 2004-12-21 2006-06-22 Illumina, Inc. Methylation-sensitive restriction enzyme endonuclease method of whole genome methylation analysis
US20060292585A1 (en) * 2005-06-24 2006-12-28 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
US7901882B2 (en) * 2006-03-31 2011-03-08 Affymetrix, Inc. Analysis of methylation using nucleic acid arrays
WO2008096146A1 (en) * 2007-02-07 2008-08-14 Solexa Limited Preparation of templates for methylation analysis
US20080213870A1 (en) * 2007-03-01 2008-09-04 Sean Wuxiong Cao Methods for obtaining modified DNA from a biological specimen
US8361746B2 (en) * 2008-07-24 2013-01-29 Brookhaven Science Associates, Llc Methods for detection of methyl-CpG dinucleotides
WO2010048337A2 (en) 2008-10-22 2010-04-29 Illumina, Inc. Preservation of information related to genomic dna methylation

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997046705A1 (en) * 1996-06-03 1997-12-11 The Johns Hopkins University School Of Medicine Methylation specific detection
WO1998056952A1 (en) * 1997-06-09 1998-12-17 University Of Southern California A cancer diagnostic method based upon dna methylation differences
WO1999028498A2 (de) * 1997-11-27 1999-06-10 Epigenomics Gmbh Verfahren zur herstellung komplexer dna-methylierungs-fingerabdrücke
WO1999055905A1 (en) * 1998-04-23 1999-11-04 Commonwealth Scientific And Industrial Research Organisation ASSAY FOR METHYLATION IN THE GST-Pi GENE

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19543065C2 (de) * 1995-11-09 2002-10-31 Gag Bioscience Gmbh Zentrum Fu Verfahren zur Genomanalyse und Mittel zur Durchführung des Verfahrens
US6117635A (en) * 1996-07-16 2000-09-12 Intergen Company Nucleic acid amplification oligonucleotides with molecular energy transfer labels and methods based thereon

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997046705A1 (en) * 1996-06-03 1997-12-11 The Johns Hopkins University School Of Medicine Methylation specific detection
WO1998056952A1 (en) * 1997-06-09 1998-12-17 University Of Southern California A cancer diagnostic method based upon dna methylation differences
WO1999028498A2 (de) * 1997-11-27 1999-06-10 Epigenomics Gmbh Verfahren zur herstellung komplexer dna-methylierungs-fingerabdrücke
WO1999055905A1 (en) * 1998-04-23 1999-11-04 Commonwealth Scientific And Industrial Research Organisation ASSAY FOR METHYLATION IN THE GST-Pi GENE

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HUANG TIM HUI-MING ET AL: "Methylation profiling of CpG islands in human breast cancer cells." HUMAN MOLECULAR GENETICS, Bd. 8, Nr. 3, März 1999 (1999-03), Seiten 459-470, XP002175857 ISSN: 0964-6906 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002038801A1 (en) * 2000-11-13 2002-05-16 Human Genetic Signatures Pty Ltd Detection of methylated dna molecules
WO2003031649A2 (de) * 2001-10-05 2003-04-17 Epigenomics Ag Verfahren zum nachweis von cytosin-methylierung in cpg-inseln
WO2003031649A3 (de) * 2001-10-05 2003-10-02 Epigenomics Ag Verfahren zum nachweis von cytosin-methylierung in cpg-inseln
US8029996B2 (en) 2001-10-05 2011-10-04 Epigenomics Ag Method for the determination of cystosine methylation in CpG islands
WO2004081232A1 (en) * 2003-03-13 2004-09-23 Beijing Institute For Cancer Research The method of in vitro detecting aberrant dysplasia, and the artificial nucleotides being used
CN100344771C (zh) * 2003-03-13 2007-10-24 北京市肿瘤防治研究所 体外检测异型增生恶变潜能的方法及所用人工核苷酸序列
US7799525B2 (en) 2003-06-17 2010-09-21 Human Genetic Signatures Pty Ltd. Methods for genome amplification
US7846693B2 (en) 2003-09-04 2010-12-07 Human Genetic Signatures Pty. Ltd. Nucleic acid detection assay
US9382539B2 (en) 2004-04-13 2016-07-05 The Rockefeller University MicroRNA and methods for inhibiting same
US9200290B2 (en) 2004-04-13 2015-12-01 The Rockefeller University MicroRNA and methods for inhibiting same
US8697859B2 (en) 2004-04-13 2014-04-15 The Rockefeller University MicroRNA and methods for inhibiting same
US8088914B2 (en) 2004-04-13 2012-01-03 The Rockefeller University MicroRNA and methods for inhibiting same
US8383807B2 (en) 2004-04-13 2013-02-26 The Rockefeller University MicroRNA and methods for inhibiting same
US8168777B2 (en) 2004-04-29 2012-05-01 Human Genetic Signatures Pty. Ltd. Bisulphite reagent treatment of nucleic acid
US7803580B2 (en) 2004-09-10 2010-09-28 Human Genetic Signatures Pty. Ltd. Amplification blocker comprising intercalating nucleic acids (INA) containing intercalating pseudonucleotides (IPN)
US8598088B2 (en) 2004-12-03 2013-12-03 Human Genetic Signatures Pty. Ltd. Methods for simplifying microbial nucleic acids by chemical modification of cytosines
US7833942B2 (en) 2004-12-03 2010-11-16 Human Genetic Signatures Pty. Ltd. Methods for simplifying microbial nucleic acids by chemical modification of cytosines
US8431347B2 (en) 2005-05-26 2013-04-30 Human Genetic Signatures Pty Ltd Isothermal strand displacement amplification using primers containing a non-regular base
US8343738B2 (en) 2005-09-14 2013-01-01 Human Genetic Signatures Pty. Ltd. Assay for screening for potential cervical cancer
US8119788B2 (en) * 2005-09-27 2012-02-21 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services, Centers For Disease Control And Prevention Compositions and methods for the detection of Candida species
US8685675B2 (en) 2007-11-27 2014-04-01 Human Genetic Signatures Pty. Ltd. Enzymes for amplification and copying bisulphite modified nucleic acids
WO2011061184A1 (en) * 2009-11-17 2011-05-26 Centre National De La Recherche Scientifique (C.N.R.S) Methods for diagnosing skin diseases
EP2322656A1 (de) * 2009-11-17 2011-05-18 Centre National de la Recherche Scientifique (C.N.R.S) Verfahren zur Diagnose von Hautkrankheiten
US9732375B2 (en) 2011-09-07 2017-08-15 Human Genetic Signatures Pty. Ltd. Molecular detection assay using direct treatment with a bisulphite reagent
EP2971171A4 (de) * 2013-03-14 2016-11-02 Abbott Molecular Inc Multiplex-methylierungs-spezifische verstärkersysteme und -verfahren
US9701999B2 (en) 2013-03-14 2017-07-11 Abbott Molecular, Inc. Multiplex methylation-specific amplification systems and methods

Also Published As

Publication number Publication date
US20040248090A1 (en) 2004-12-09
DE19959691A1 (de) 2001-08-16
AU778411B2 (en) 2004-12-02
AU2663201A (en) 2001-06-18
CA2395047A1 (en) 2001-06-14
DE10083729D2 (de) 2003-05-15
WO2001042493A3 (de) 2002-02-07
EP1238112A2 (de) 2002-09-11

Similar Documents

Publication Publication Date Title
WO2001042493A2 (de) Verfahren zur parallelen detektion des methylierungszustandes von genomischer dna
DE10056802B4 (de) Verfahren zur Detektion von Methylierungszuständen zur toxikologischen Diagnostik
DE69833758T2 (de) Verfahren zur erkennung von genpolymorphismen und allelexpression unter verwendung von sondenchips
EP0743367B1 (de) Verfahren zur Genexpressionsanalyse
DE10010280B4 (de) Verfahren zur Detektion von Cytosin-Methylierung in DNA Proben
EP1268856A2 (de) Detektion von snp's und cytosin-methylierungen
WO2001062961A1 (de) Ligase/polymerase-verfahren zur detektion von cytosin-methylierung in dna proben
DE10201138A1 (de) Verfahren zum Nachweis von Cytosin-Methylierungsmustern durch exponentielle Ligation hybridisierter Sondenoligonukleotide
DE10010282B4 (de) Verfahren zur Detektion von Cytosin-Methylierung in DNA Proben
EP1228247B1 (de) Verfahren zur kontrollierbaren durchführung komplexer pcr-amplifikationen
WO2002083943A2 (de) Mikroarray-verfahren zur anreicherung von dna-fragmenten aus komplexen mischungen
US5618702A (en) PCR amplification of mRNA
DE60122899T2 (de) Verfahren zur detektion von haplotypen mittels massenspektrometrie
EP0509089A1 (de) Verbindungen und methoden zur analyse von genomischen variationen
DE19951189C2 (de) Verfahren zur Unterscheidung von 5-Position-Methylierungsänderungen von Cytosin-Basen und Cytosin-zu-Thymin-Mutationen und zum Nachweis von single nucleotide polymorphisms (SNPs) oder Punktmutation in genomischer DNA
EP1320632B1 (de) Verfahren zur altersbestimmung von individuen
DE10013847A1 (de) Oligonukleotide oder PNA-Oligomere und Verfahren zur parallelen Detektion des Methylierungszustandes genomischer DNA
EP1339873B1 (de) Diagnose von mit humos assoziierten krankheiten
DE102005048503B4 (de) Verfahren zur Steuerung der abschnittsweisen enzymatischen Nukleinsäurevervielfältigung über inkomplette Komplementärstränge
DE20121965U1 (de) Nukleinsäuren für die Diagnose von mit DNA Addukten assoziierten Krankheiten
DE10051714A1 (de) Verfahren zur kontrollierbaren Durchführung komplexer PCR-Amplifikationen
EP1492888A2 (de) Analyse von nukleinsäure-fragmentmischungen und genexpressionsanaylse

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A2

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CR CU CZ DE DK DM DZ EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A2

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

121 Ep: the epo has been informed by wipo that ep was designated in this application
DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
WD Withdrawal of designations after international publication

Free format text: DE

AK Designated states

Kind code of ref document: A3

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BY BZ CA CH CN CR CU CZ DK DM DZ EE ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NO NZ PL PT RO RU SD SE SG SI SK SL TJ TM TR TT TZ UA UG US UZ VN YU ZA ZW

AL Designated countries for regional patents

Kind code of ref document: A3

Designated state(s): GH GM KE LS MW MZ SD SL SZ TZ UG ZW AM AZ BY KG KZ MD RU TJ TM AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE TR BF BJ CF CG CI CM GA GN GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 26632/01

Country of ref document: AU

WWE Wipo information: entry into national phase

Ref document number: 2395047

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 2000989842

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2000989842

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 10149109

Country of ref document: US

REG Reference to national code

Ref country code: DE

Ref legal event code: 8642

NENP Non-entry into the national phase

Ref country code: JP

WWG Wipo information: grant in national office

Ref document number: 26632/01

Country of ref document: AU

WWW Wipo information: withdrawn in national office

Ref document number: 2000989842

Country of ref document: EP