EP1075550A1 - Methode zur identifizierung und darstellung interindividueller dna-sequenzunterschiede - Google Patents

Methode zur identifizierung und darstellung interindividueller dna-sequenzunterschiede

Info

Publication number
EP1075550A1
EP1075550A1 EP99929095A EP99929095A EP1075550A1 EP 1075550 A1 EP1075550 A1 EP 1075550A1 EP 99929095 A EP99929095 A EP 99929095A EP 99929095 A EP99929095 A EP 99929095A EP 1075550 A1 EP1075550 A1 EP 1075550A1
Authority
EP
European Patent Office
Prior art keywords
sequencing
dna
sequences
gene segments
individual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
EP99929095A
Other languages
English (en)
French (fr)
Inventor
Margret Hoehe
Karla KÖPKE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genprofile AG
Original Assignee
Genprofile AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genprofile AG filed Critical Genprofile AG
Publication of EP1075550A1 publication Critical patent/EP1075550A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes

Definitions

  • the invention relates to a method for identifying and representing interindividual DNA sequence differences.
  • Fields of application of the invention are molecular biology, medicine, biology, veterinary medicine, agriculture and ecobiology.
  • the invention has for its object to develop a method of comparative sequencing of DNA target fragments as virtual analysis units of genes and genomes on the basis of a multiplexing principle.
  • This invention represents a form of 'targeted genome analysis'. It is based on the basic principle of the 'multiplex sequencing method' (EP 303 459) described by Church and Kieffer-Higgins, which is developed for the de novo sequencing of genomic sequences.
  • the PCR-based multiplex sequencing method according to the invention represents a completely new development in terms of concept and content (cf. Figs. 1 and 1b).
  • the multipex PCR sequencing method according to the invention is specifically designed for the identification of sequence differences in multiple copies of known sequences.
  • the process for clone selection, amplification and tagging has been completely redeveloped.
  • the new method is not based on the use of hybrid DNA is the essential basis of the Church process.
  • the new method focuses in this redefined form on multiple, PCR-generated copies of defined genomic target region / candidate gene segments, whose simultaneous sequencing takes place in a single sequencing process, also the highly specific detection of individual sequences of one and the same, defined segment from a mixture of multiples Reactions / segment-specific sequences, and on the identification of inter-individual DNA sequence differences between individual genes by grouping base-specific individual termination reactions and detection of sequence differences directly by visual inspection (cf. Fig. 2).
  • a high quality of the 'images' and thus the prerequisite for the identification of sequence differences is given by the high specificity of the oligonucleotides at the PCR, sequencing and detection level.
  • the overall process of 'multiplex PCR sequencing' includes the following methodological / technological segments:
  • EP-A-303 459 The main differences from EP-A-303 459 are to be emphasized: the basis for multiplex sequencing is not hybrid DNA which contains any fragmented genomic DNA fragment, but rather DNA target fragments selected by highly specific oligonucleotides; 'tags' are not externally synthesized oligos and are part of the vector; likewise, 'sequencing primer hybridizing regions' are not part of the vector, but an integral part of the genomic target fragment; DNA sequence interpretation by parallelizing multiple individual termination reactions of the same base for the immediate identification of DNA sequence differences as additional and missing bands can be immediately identified by visual inspection (Fig. 2).
  • Different approaches to the division into DNA segments / PCR fragments are a) overlapping design (Fig. 3), b) staggered design (Fig. 4), c) virtual dissection at the sequencing level (Fig. 5).
  • the type of decomposition and thus the multiplex factor or the utilization of the capacity of the method is related to the genomic organization and size of the gene, the number of non-overlapping gene segments and the scope of the planned sequencing project (number of genes or genomes), as well as technical aspects such as the multifunctional use of oligonucleotides as PCR primers, sequencing primers and 'probes'.
  • the amplification of multiple, N DNA segments per individual this can take place separately for each segment (or, for example, by amplifying large segments that have several 3
  • Sequencing segments also called virtual gene segments, contain, cf. Fig. 5), or simultaneously by multiplex PCR.
  • the cleaning of each PCR product is possible by enzymatic means, through columns, vacuum systems, etc .; So different cleaning methods come into consideration.
  • thermosequenase for 'cycle sequencing', here detection of one or both strands;
  • multiplexing at the gel level Association of individual sequencing reactions, dissolution of the ter ⁇ iation reaction mixtures on the gel; also as an option to integrate 'coupled amplification and genomic sequencing'.
  • DTE Direct transfer electrophoresis
  • the method is used to develop specific gene profile patterns that are genetic
  • Sequence variants e.g. also "single nucleotide polymorphisms"
  • the starting point is either two groups, consisting of the sick and healthy, or two groups of a species that are different with regard to the phenotypic trait examined.
  • the variants in DNA sequence regions which include both the regulating and the coding regions of a candidate gene, are statistically dependent, the sequence profiles formed from the sequence variants of a gene or from the variants of different genes and other genetic markers are and / or haplotypes evaluated simultaneously. As the number of variants increases, the maximum results
  • the method aims at reducing the number of these different genotypes or haplotypes by forming genotypes or haplotype classes according to different similarity criteria
  • Haplotypes summarized in genotype or haplotype classes. Each step is characterized by a specific sum of squares, which results from the deviations of all variable values from the relevant cluster mean values in all clusters. Using a ⁇ 2 -
  • Each step of the test is checked to see whether the frequencies of the genotypes or haplotypes differ in the genotypes or Differentiate haplotype classes significantly between the two groups to be examined. The process is continued until all haplo or genotypes have been combined into two classes.
  • the steps with the greatest significant haplo or genotype frequency differences between the two groups examined are used to classify the haplo or genotypes.
  • the individual DNA sequences of a candidate gene to be examined are determined from all 60 persons and their parents, for example by means of multiplex sequencing. A mutation may occur at 4 different sequence positions P1, P2, P3 and P4. It should be clarified whether there are specific haplotype profiles that are associated with the disease.
  • the two individual haplotype profiles which are determined in full by specifying the occurrence of the mutation at P1, P2, P3 and P4 with respect to a reference sequence, are given.
  • the following 6 different haplotype profiles may exist among all 60 people (1: variant as in the reference sequence; 2: variant carries the respective mutation):
  • a hierarchical cluster analysis is then carried out to classify these 6 haplotypes.
  • the Euclidean distance was used as the simplest measure as the distance measure.
  • the results are included in the attachment.
  • 3 haplotype classes are formed from the 6 haplotypes, class 1 from haplotype numbers 1 and 4, class 2 from haplotypes numbers 2 and 5 and class 3 from 3 and 6.
  • haplotype classes 1 and 2 summarized.
  • there is no longer any significant difference between the two newly created haplotype classes of the second step which were created by merging the haplotype classes of the first step.
  • Consensus profiles are derived from the haplotype classes of step 1:
  • a method as described under 4. extends to plant genomes, bacterial genomes, basically genomes of all species, so that in the areas of molecular biology, medicine, biology, veterinary medicine, agricultural science and ecobiology, information about the emergence of different characteristics based on genetic variations is obtained can be.
  • a specific method for image generation and image analysis which enables the direct detection of DNA sequence differences, SNPs (single nucleotide polymorphisms), and Indel polymorphisms on the basis of a specific application scheme of the individual termination reactions.
  • An essential element of the image / data management is that band patterns of a given base of a defined DNA segment serve as a specific identification pattern for each nucleic acid segment.
  • the multiplex sequencing method according to the invention was carried out in a 15-plex
  • the protocol uses microtiter plates (96-wells) and multichannel pipettes.
  • the current modular production line is based on microplates and integrated 12
  • PCR primers were selected according to the 'staggered dissection' principle (see Fig. Lb). They allow amplification at an annealing temperature of 60 oC.
  • the program Primerselect from the Dnastar package was used.
  • PCR fragments per individual 14 gene-specific and 1 HLA fragment for control for the coding strand and 15 gene-specific for the complementary strand
  • the reactions contained 100 ng genomic DNA, 10 mM TrisHCl (pH 8.3), 1.5 mM MgC12, 50 KC1, 200 ⁇ M from each nucleoside triphosphate, 30 pmol from each primer, 3 U Taq polymerase, and water in a final volume of 50 ⁇ l.
  • the Taq polymerase was dissolved in 5 ⁇ l of single-use reaction buffer mixture (10 mM TrisHCl (pH 8.3), 1.5 mM MgC12, 50 KC1) at 88 for a 4-minute interval oC following an initial denaturation of 94 oC for 4 min. Reaction batches were carried out for 30-35 cycles at 94 oC (15 sec), 60 oC (15 sec) and 72 oC (30 sec) or at 94 oC (15 sec), 60 oC (30 sec) and 72 oC (1 min) amplified.
  • the amplification was checked using a 5 ⁇ l aliquot from the PCR mixture on a 2% agarose gel.
  • 5'-biotinylated primers were used as antisense primers in the PCR protocol described, since the multiplexing protocoU is based on single-strand sequencing using a solid phase system. All of the steps listed below are based on a unit of 24 or a multiple thereof of DNA samples, which corresponds to one or more membranes / images.
  • PCR products were eluted in a volume of 60 ⁇ l 1 x TE on a 96-well scale.
  • single-stranded (es) PCR-DNA was isolated by means of a magnetic streptavidin / biotin interaction.
  • the 15-biotinylated PCR product-containing eluate was made up to a total volume of 160 ⁇ l with distilled water, an equal volume of washed magnetic particles was added to prepare a mixture of single-stranded DNA templates for sequencing.
  • the magnetic particles were washed according to the regulations (Dynal, Oslo).
  • the original protocol was modified for the simultaneous immobilization of the 15 different PCR products in such a way that only approximately 1 A (4 x instead of 15 x) of the prescribed amount of magnetic particles was used.
  • Direct multiplex (15-plex) solid phase T7 / Mn-dideoxy sequencing of esPCR-DNA The multiplex sequencing reactions were carried out with twice the amount of reagents compared to a 15-fold amount of reagents if the reactions had been processed individually with the exception of an altered amount of the 15 different sequencing primers. Double the amount, 2 pmol, of each sequencing primer was used in a multiplex sequencing reaction.
  • 15-plex primer 2 ⁇ l of primer cocktail (2 pmol of each primer) and 4 ⁇ l of 5 ⁇ reaction buffer (75 mM NaCl, 40 mM TrisHCl, pH 7.5) were added to each mixture of 15 matrices in a microtiter well .
  • the annealing mixtures with a total volume of 22 ⁇ l were heated in a water bath at 80 ° C. for 2 minutes and then incubated at 37 ° C. for 20 minutes. The samples were centrifuged briefly and cooled on ice.
  • IPPase in 1 x TE in a final volume of 34 ⁇ l.
  • 7 ⁇ l of these mixtures were mixed with 5 ⁇ l of a base-specific nucleotide termination mixture (100 ⁇ M from each dNTP, 1 ⁇ M from each ddNTP, in 25 mM NaCl) and then incubated for 15 min at 37 ° C. After the sequencing reaction had taken place, the 96-well plates were centrifuged briefly and the supernatants were removed by magnetic separation.
  • the termination products were eluted by adding 5 ⁇ l of stop solution (95% formamide, 20 mM EDTA, 0.05% bromophenol blue, 0.05% xylene-cyanol FF) and then heating for 2 min at 80 ° C .
  • the supernatants, which contain the mixtures of the sequencing products, were again removed by magnetic separation, transferred to a new microtiter plate and stored at -20 ° C. Before application, the samples were denatured for 2 min at 80 C in a water bath and immediately quenched on ice. 1 ⁇ l of each sample was applied to the sequencing gel.
  • DTE Direct transfer electrophoresis
  • Hybridization probes were made as follows:
  • Oligonucleotides with a minimum length of 18 nucleotides and reverse complementary to the target segment, which is an integral part of the genomic target fragment, were in protons of 1 ⁇ l (2 pmol) with [ ⁇ - 32 P] dATP (6000 Ci / mmol; NEN) and 1 ⁇ l (14 U calf thymus teminal deoxynucleotidyl transferase (USB) end labeled according to the manufacturer's instructions.
  • a 10 ⁇ l terminal transferase reaction with 8 ml hybridization buffer (7% SDS, 10% polyethylene glycol (PEG) , 0.25 M NaCl, 0.051% phosphoric acid, 82 mM Na2HPO4 x H2O, 10 mM EDTA, 32 mM NaOH (also to be used as a prehybridization solution), the volume for the hybridization of a membrane.
  • 8 ml hybridization buffer 7 SDS, 10% polyethylene glycol (PEG) , 0.25 M NaCl, 0.051% phosphoric acid, 82 mM Na2HPO4 x H2O, 10 mM EDTA, 32 mM NaOH (also to be used as a prehybridization solution), the volume for the hybridization of a membrane.
  • PEG polyethylene glycol
  • 0.051% phosphoric acid 82 mM Na2HPO4 x H2O
  • 10 mM EDTA 32 mM NaOH
  • the membranes were removed in units of 5 at room temperature using a membrane washing machine (environmental and engineering technology Gm bH, Dresden), who carried out 5 washing steps with 1500 ml washing solution (1% SDS, 0.022% phosphoric acid, 69 mM Na2H2PO4 x H2O, 5 mM EDTA, 32 mM NAOH). Each of the membranes was then covered with transparent film. After exposure to a Molecular Dynamics phosphor fluor imager screen for 1 to 20 h, the radioactive sample was stripped with stripping buffer (0.2% SDS, 2 mM EDTA, pH 8.3) for 5 -10 min at 65 ° C for at least 2 x, removed. The images were read in using a Molecular Dynamics Phosphor Fluor Imager and the image files for genotyping were transferred to a PC.
  • a membrane washing machine environment and engineering technology Gm bH, Dresden
  • the protocols are based on multiple wells (96-well format). Multi-channel pipettes were used.
  • the current modular production line is based on multiple wells and includes:
  • PCR primers were selected according to the 'offset' decomposition pattern, which is shown in Fig. 2, in order to achieve complete and redundant coverage of the known gene sequence. They were chosen to allow amplification at the same annealing temperature of 60 ° C. The 'PrimerSele' program of the 'Dnastar' package was used.
  • PCR method In order to sequentially sequence the coding and complementary strands, 15 PCR products per single sample (14 gene-specific and one HLA fragment were produced as a control for the forward strand and 15 gene-specific fragments for the reverse strand; separately in a Perkin Elmer 9600 or amplified in MJ Research Tetrads
  • the reaction mixtures contained 100 ng of genomic DNA, 10 mM Tris-HCl (pH 8.3), 1.5 mM MgCl 2 , 50 mM KC1, 200 ⁇ M each nucleoside triphosphate, 30 pmol each primer, 3 U Taq polymerase (Boehringer Mannheim) and H 2 0 with a final volume of 50 ⁇ l each.
  • the 1 x reaction buffer (10 mM Tris-HCl (pH 8.3 ), 1.5 mM MgCl 2 , 50 mM KC1) was added within a time interval of 4 min at 88 ° C. after a 4-minute initial denaturation phase of 94 ° C.
  • the reaction mixtures were 30-35 cycles at 94 ° C. ( 15 sec .), 60 ° C (15 seconds) and 72 ° C (30 seconds) or at 94 ° C (15 seconds), 60 ° C (30 seconds) and 72 ° C (1 minute) .
  • amplification was checked briefly by dissolving 5 ⁇ l PCR products on a 2% agarose gel and visualizing the bands using ethidium bromide and ultraviolet radiation. Enough PCR DNA was usually generated for double sequence analysis. Since the multiplex protocols were based on a direct solid-phase sequencing protocol, which ensured the sequencing of the coding strand, 5'-biotinylated primers were introduced as antisense primers in the PCR protocol described. During the following steps, a unit of 24 individual DNA samples or a multiple thereof formed the work units that correspond to one or a multiple of a membrane / sequence image ('images').
  • PCR products All 15 PCR products of an individual, 10 ⁇ l per PCR product corresponding to approximately 200 ng PCR-DNA, were pooled in a microtiter well, which thus contained approximately at least 150 ⁇ l PCR products. 24 x 4 15-plex pools of PCR products were then purified by the 96-well QIA vac multiple system (Qiagen). The pools of the PCR products were eluted with 50 ⁇ l of 1 ⁇ TE buffer in a 96-well format. For the multiplex sequencing of the coding strand based on solid phase sequencing, single-stranded PCR-DNA was separated by the interaction of streptavidin on magnetic 'beads' with biotin. The eluted product volume containing 15 biotmylated PCR products was made up to a final volume of 160 ⁇ l with distilled H 2 O to be washed with an equal amount 17
  • Direct solid-phase multiplex (15-plex) -T7IMn dideoxy sequencing of single-stranded PCR DNA Multiplex sequencing reactions were carried out with a double amount of reagents compared to the 15-fold amount of reagents that would be required if the reactions were carried out individually except for the amounts of the 15 different sequencing primers. Double the amount (2 pmol) of each sequencing primer was used in a multiplex sequencing reaction in order to counter the annealing of the primers to both the target and the neighboring fragment; see also Fig. 2.
  • 15-plex primer annealing Each pool of 15 matrices contained in a microtiter well was treated with 2 ⁇ l of a primer cocktail (2 pmol of each primer) and 4 ⁇ l of 5 reaction buffer (75 mM NaCl, 40 mM Tris-HCl, pH 7.5) mixed. These annealing mixtures with a total reaction volume of 22 ⁇ l were heated in a water bath at 80 ° C. for 2 minutes and incubated at 37 ° C. for 20 minutes. The samples were briefly centrifuged and cooled on ice.
  • Termination products were eluted by adding 5 ⁇ l stop solution (95% formamide, 20 mM EDTA, 0.05% bromophenol blue, 0.05% xylenecanol FF) and heating to 80 ° C. for 2 minutes.
  • the supernatant liquid containing the pools of the terminated sequencing reactions was removed by magnetic separation and applied to a new microtiter plate and stored at -20 ° C.
  • the samples were denatured for 2 minutes in a water bath at 80 ° C. and quickly cooled on ice / water, 1 ⁇ l per sample was applied to the sequencing gel.
  • the complementary strand sequencing was carried out using a 15-plex 'cycle' sequencing using 2 ⁇ l of the respective PCR product, which is approximately 40 ng equivalent, thermosequenase and using the reaction conditions described by the supplier (Amersham), with the exception that the sequencing primer was replaced by a mixture of 15 primers, 0.5 pmol per primer.
  • 15 sequencing reactions were carried out with the simple amount of the reagents, which corresponds to a fifteenth of the reagents used for the standard reactions.
  • Direct transfer electrophoresis (DTE): 96 samples (corresponding to the pooled base-specific termination reactions of 24 individuals), each 1 ⁇ l, were placed on an ultra-thin, 0.125 mm, 5% acrylic amide gel with a 12-channel Hamilton pipette (Hamilton, Reno, NV) applied, resolved according to size at 3150 V and applied to a nylon membrane (neutral 1.2 ⁇ m Biodyne A, Pall, size: 32 x 45 cm) by DTE, as described in detail by Richterich and Church (1993). The transmission was computer controlled and followed a modified speed gradient of 11 cm / h for 80 min., And of 8 cm / h.
  • DTE Direct transfer electrophoresis
  • the 'sequence images' which enable the sequence differences between the individual genes to be identified directly by visual inspection, were created by introducing a specific loading system: the termination reaction pools of a given base G, T, A, C were loaded in blocks of 12 individuals each, to facilitate the identification of variants by identifying additional and / or missing bands ('Skilied Pattern Interpretation' - trained pattern recognition). After the DNA forms were transferred from the gels to the nylon membranes, they were crosslinked by ultraviolet light for 30 seconds.
  • Olligonucleotides at least 18 nt long, and reverse complementary to the 'Tag' sequences that 19
  • the membranes were grouped in groups of 5 at room temperature using an automated device for blot incubation and washing (Umwelt- und Ingenieurtechnik GmbH, Dresden), programmed for 5 washing steps with 1800 ml buffer, 1% SDS, 0.022% H 3 PO 4 , 69 mM Na ⁇ PO, x H 2 O, 5 mM EDTA (free acid) containing 32 mM NaOH.
  • Each of the wet membranes was placed between a Saran shell and a polyester pad.
  • the radioactive probes were adjusted with 0.2% SDS and 2 mM EDTA (free acid, adjusted to pH 8.3 with a tris lye) at least twice for 5 to 10 minutes at 65 ° C.
  • the resolution and the signal-to-background ratio were essentially the same as those achieved with the optimized uniplex method, and thus the image quality that is desirable for the identification of sequence variants with high accuracy was guaranteed.
  • the sequence images were scanned and the image files were transferred to computers for reading the genotypes.
  • the human ⁇ -opioid receptor gene including its 5 'regulating, coding and important intronic sequences was sequenced in 250 individuals.

Abstract

Die Erfindung betrifft eine Methode zur Identifizierung und Darstellung interindividueller DNA-Sequenzunterschiede. Sie ist dadurch gekennzeichnet, dass man die genomische DNA der zu untersuchenden Individuen isoliert, Segmente der zu vergleichenden Gene, genomischen Regionen, Genome definiert, diese Segmente mittels PCR unter Verwendung hochspezifischer Oligonukleotide gezielt isoliert und in einer ausreichenden Anzahl von Kopien herstellt, eine simultane Sequenzierung aller gewonnenen Gensegmente, die nun als PCR-Produkte vorliegen, durchführt, das dadurch entstehende Gemisch von Terminationsreaktionen, das die individuellen Sequenzen aller Gensegmente enthält, anschliessend auf einem Sequenziergel elektrophoretisch trennt und mittels direkter Transferelektrophorese auf eine Membran überträgt, anschliessend durch Hybridisierung der Membran mit einem markierten, hochspezifischen Oligonukleotid die individuellen Sequenzen eines bestimmten Gensegmentes aus dem ursprünglichen Gemisch sichtbar macht, diesen Vorgang so oft wiederholt, bis alle Gensegmente aus dem ursprünglichen Pool detektiert sind, und anschliessend durch Image-Analyse interindividuelle DNA-Sequenzunterschiede detektiert, und durch mathematische Aufarbeitung ein Genprofilmuster erstellt und auswertet.

Description

Methode zur Identifizierung und Darstellung interindividueller DNA- Sequenzunterschiede
Die Erfindung betrifft eine Methode zur Identifizierung und Darstellung interindividueller DNA-Sequenzunterschiede. Anwendungsgebiete der Erfindung sind die Molekularbiologie, die Medizin, die Biologie die Veterinärmedizin, die Agrarwirtschaft und die Ökobiologie.
Nach der erstmaligen Sequenzierung eines menschlichen Referenzgenoms, die im Jahre 2005 abgeschlossen sein wird, nach der Dokumentierung gesamtgenomischer Sequenzen verschiedenster Modellorganismen und Bakterien sowie der Sequenzierung aller Gene des Menschen und anderer Species wird die vergleichende Untersuchung individueller genetischer und genomischer Variabilität einer der Schwerpunkte der nächsten Ära der Genomforschung ('Postgenomics') werden. Sie stellt eine 'via regia' zur Erforschung von Gesamtgen- und Genomprofilen dar, die instrumenteil für die Identifizierung von Varianten bzw. Gensegmenten ist, die an der Pathogenese von Erkrankungen beteiligt sind, und die Variabilität physiologischer und psychologischer Merkmale mitbedingen. Es ist deshalb entscheidend, zum gegenwärtigen Zeitpunkt entsprechende methodische Ansätze zu entwickeln, die die vergleichende Sequenzierung mit geringerem Aufwand ermöglichen, und zugleich eine Ausgangsbasis für die zukünftige Entwicklung noch wesentlich effizienterer Methoden schaffen.
Der Erfindung liegt die Aufgabe zugrunde, eine Methode der vergleichenden Sequenzierung von DNA-Zielfragmenten als virtuelle Analyse-Einheiten von Genen und Genomen auf der Basis eines Multiplexing-Prinzipes zu entwickeln.
Die Erfindung wird gemäß den Ansprüchen realisiert.
Diese Erfindung stellt eine Form der 'targeted genome analysis' dar. Sie beruht auf dem Grundprinzip der von Church und Kieffer-Higgins beschriebenen 'Multiplex Sequenziermethode ' (EP 303 459), das für die de novo Sequenzierung genomischer Sequenzen ausgearbeitet ist.
Die erfindungsgemäße PCR-basierte Multiplex Sequenziermethode stellt jedoch konzeptionell und inhaltlich eine vollkommene Neuentwicklung dar (vgl. Abb. 1 und Abb. 1 b). Die erfindungsgemäße Multipex-PCR-Sequenziermethode ist hingegen spezifisch für die Identifizierung von Sequenzunterschieden in multiplen Kopien bekannter Sequenz konzipiert. Das Verfahren zur Klonselektion, -amplifikation und Tagging ist vollkommen neu entwickelt worden. Auch basiert die neue Methode nicht auf der Verwendung von Hybrid-DNA, die unerläßliche Grundlage des Church- Verfahrens ist.
Die neue Methode konzentriert sich in dieser neudefinierten Form auf multiple, PCR- generierte Kopien von definierten genomischen Zielregionen-/Kandidatengensegmenten, deren simultane Sequenzierung in einem einzigen Sequenziervorgang stattfindet, auch die hochspezifische Detektierung individueller Sequenzen ein- und desselben, definierten Segments aus einem Gemisch multipler Reaktionen/segmentspezifischer Sequenzen, und auf die Identifizierung interindividueller DNA-Sequenzunterschiede zwischen individuellen Genen durch Gruppierung basenspezifischer individueller Terminationsreaktionen und Detektion von Sequenzunterschieden unmittelbar durch visuelle Inspektion (vgl. Abb. 2). Eine hohe Qualität der 'Images' und damit die Voraussetzung für die Identifizierung von Sequenzunterschieden ist durch eine hohe Spezifität der Oligonukleotide auf PCR-, Sequenzier-, und Detektionsebene gegeben. Der Gesamtvorgang der 'Multiplex PCR Sequenzierung' beinhaltet folgende methodische/technologische Segmente:
Hervorzuheben sind als wesentliche Unterschiede zum EP-A- 303 459: Basis für Multiplex-Sequenzierung ist nicht Hybrid-DNA, die ein beliebig fragmentiertes genomisches DNA-Fragment enthält, sondern durch hochspezifische Oligonukleotide selektierte DNA-Zielfragmente; 'tags' sind nicht extern synthetisierte Oligos und Bestandteil des Vektors, ebenso sind 'sequencing primer hybridizing regions' nicht Bestandteil des Vektors, sondern integraler Bestandteil des genomischen Zielfragmentes; DNA Sequenzinterpretation durch Parallelisierung vielfacher individueller Terminationsreaktionen derselben Base zur unmittelbaren Identifizierung von DNA Sequenzunterschieden als zusätzliche und fehlende Banden mittels visueller Inspektion unmittelbar identifiziert werden (Abb. 2).
a) Die Dissektion ('Zergliederung') eines Gens, Genoms, oder jeder genomischen Zielregion von Interesse in DNA-Segmente, die Templates für die Amplifizierung mittels PCR darstellen. Unterschiedliche Ansätze zur Aufteilung in DNA-Segmente/PCR-Fragmente sind a) overlapping design (Abb. 3), b) staggered design (Abb.4), c) Virtual dissection at the sequencing level (Abb. 5). Die Art der Zergliederung und damit der Multiplex-Faktor bzw. die Ausschöpfung der Kapazität der Methode steht in Zusammenhang mit der genomischen Organisation und Größe des Gens, der Anzahl sich nichtüberlappender Gensegmente und dem Umfang des geplanten Sequenziervorhabens (Anzahl der Gene bzw. Genome), sowie technischen Gesichtspunkten wie dem multifunktionalen Gebrauch von Oligonukleotiden als PCR-Primer, Sequenzierprimer, und 'Probes'. b) Die Amplifizierung multipler, N DNA-Segmente pro Individuum; diese kann separat für jedes Segment stattfinden (oder z.B. durch Amplifizierung großer Segmente, die mehrere 3
Sequenziersegmente, auch virtuelle Gensegmente genannt, beinhalten, vgl. Abb. 5), oder simultan durch Multiplex PCR. Die Vereinigung multipler, N PCR-Produkte pro Individuum. Erzeugung multipler einsträngiger 'Templates' mittels irreversibler Biotin- Streptavidin-Kopplung unter Verwendung von 'magnetic beads' aus einem Gemisch von PCR-Produkten. Hier bestehen Modifikationsmöglichkeiten der Separierung der beiden DNA-Stränge; es könnten auch biotinylierte Terminationsreaktionen magnetisch separiert werden. c) Die Reinigung jedes PCR-Produktes ist möglich auf enzymatischem Wege, durch Säulen, Vakuumsysteme etc.; es kommen also unterschiedliche Reinigungsmethoden in Betracht. d) Die simultane Durchführung von multiplen, N Sequenzierreaktionen mittels Einsatz multipler, N Sequenzierprimer unterschiedlicher Nukleotidkomposition, die jeweils hochspezifisch an ein bestimmtes genomisches Fragment binden. Im Falle daß per Design diesselbe DNA-Sequenz zwei benachbarten PCR-Fragmenten gemeinsam sein sollte (d.h. daß der Sequenzierprimer zugleich an zwei benachbarte Fragmente binden könnte), wird die Konzentration der Sequenzierprimer verdoppelt (vgl. auch Abb. 3). Die Multiplex Sequenzierung erfolgt mittels der Dideoxy-Methode nach Sanger et al. (74 Proc.Natl.Acad.Sci.USA 5463, 1977) unter Verwendung von T7/Mn für die Sequenzierung einsträngiger DNA, bzw. Thermosequenase für 'cycle sequencing', hier Detektion sowohl eines oder beider Stränge; Alternative: multiplexing auf der Gelebene; Vereinigung individueller Sequenzierreaktionen, Auflösung der Terπώiationsreaktionsgemische auf dem Gel; ebenso als Möglichkeit 'coupled amplification und genomic sequencing' zu integrieren. e) Die direkte Transferelektrophorese (DTE) der Gemische von Terminationsreaktionen auf einen festen Träger, eine Nylonmembran, mittels eines computer-gesteuerten Gradienten der Transfergeschwindigkeit, um einen adäquaten Bandenabstand zur Detektion von Sequenzunterschieden zu erreichen. Fixierung der DNA an die Membran mittels UV-Licht durch Interkalation. f) Die sukzessive Detektion multipler individueller DNA-Sequenzen der jeweiligen PCR- Segmente mittels hochspezifischer Sonden, die mit 32P-ATP endmarkiert ist, oder Chemilumineszenz. Die dem Sequenzierprimer unmittelbar benachbarte Nukleotidsequenz dient als 'tag', als 'probe hybridizing region'; durch NichtÜberlappung der 'tag' Sequenz mit der Seqenzierprimersequenz wird die Detektion unspezifischer Sequenz durch 'πύspriming' vermieden, und damit Hintergrundrauschen, das mit der Variantendetektion interferieren könnte. g) 'Image- Analyse durch 'Mustererkennung'. Ein spezifisches Ladeschema, welches die basenspezifischen Terminationsreaktionen von je 12 Individuen als Block gruppiert, können DNA-Sequenzunterschiede unmittelbar durch zusätzliche und/oder fehlende Banden identifiziert werden. Methode zur Merkmals- und Risikodifferenzierung von genetischen Profilen auf DNA- Sequenzebene
Die Methode dient zur Erarbeitung von spezifischen Genprofilmustern, die eine genetische
Differenzierung für das Risiko von Erkrankungen bzw. für die Ausprägung phänotypischer
Merkmale jeder Art in jeder Species zuläßt, aus einer großen Menge von Sequenzdaten bzw.
Sequenzvarianten (z.B. auch "single nucleotide polymorphisms"). Als Ausgangspunkt dienen entweder zwei Gruppen, bestehend aus Erkrankten und Gesunden, oder zwei bezüglich des untersuchten phänotypischen Merkmals differente Gruppen einer Species. Da beispielsweise die Varianten in DNA-Sequenzbereichen, die sowohl die regulierenden als auch die kodierenden Bereiche eines Kandidatengens umfassen, statistisch abhängig sind, werden die aus den Sequenzvarianten eines Gens oder aus den Varianten verschiedener Gene und sonstiger genetischer Marker gebildeten Sequenzprofile in Form von Geno- und/oder Haplotypen simultan ausgewertet. Mit steigender Anzahl von Varianten ergibt sich bei maximaler
Auflösung der Variabilität auf DNA-Sequenzebene eine in der Regel statistisch nicht mehr zur
Vorhersage auswertbare große Anzahl von verschiedenen Geno- bzw. Haplotypen. Das
Verfahren zielt auf die Reduktion der Anzahl dieser verschiedenen Geno- bzw. Haplotypen durch Bildung von Geno- oder Haplotypklassen nach unterschiedlichen Ähnlichkeitskriterien
(Abstand der Geno- bzw. Haplotypen im n-dimensionalen Raum (bei n untersuchten
Varianten), Anzahl und Art der Variantenaustausche zwischen den einzelnen Geno- bzw.
Haplotypen, phylogenetischer Abstand etc.) mittels statistischer Klassifizierungs- oder Fuzzy-
Methoden. Ausgehend von der Idee, daß sich Geno- bzw. Haplotypen nicht unterscheiden lassen, wenn die Varianten für die Differenzierung des untersuchten Merkmals bzw. Risikos irrelevant sind, wird zur Klassenbildung beispielsweise eine hierachische Clusteranalyse benutzt und die Veränderungen der Häufigkeitsverteilungen der Haplo- bzw. Genotypen der beiden differenten phänotypischen Gruppen hinsichtlich der Klasseneinteilung von einem
Schritt zum anderen ausgenutzt. Schrittweise werden die jeweils ähnlichsten Geno- bzw.
Haplotypen in Geno- bzw. Haplotypklassen zusammengefaßt. Jeder Schritt ist durch eine spezifische Fehlerquadratsumme, die sich aus den Abweichungen aller Variablenwerte zu den betreffenden Clustermittelwerten in allen Clustern ergibt, charakterisiert. Mittels eines χ2-
Testes wird in jedem Schritt überprüft, ob sich die Häufigkeiten der Geno- bzw. Haplotypen in den auf der jeweiligen Stufe gebildeten Geno-bzw. Haplotypklassen zwischen den beiden zu untersuchenden Gruppen signifikant voneinander unterscheiden. Das Verfahren wird fortgeführt, bis alle Haplo- bzw. Genotypen in zwei Klassen zusammengefaßt worden sind.
Unter Berücksichtigung der schrittweisen Frequenzveränderungen werden die Schritte mit den größten signifikanten Haplo- bzw. Genotypfrequenzunterschieden zwischen den beiden untersuchten Gruppen zur Klasseneinteilung der Haplo- bzw. Genotypen ausgenutzt. Durch
Vergleich der in den Klassen zusammengefaßten Haplo- bzw. Genotypen (Consensusmuster der Klassen) werden die für das Merkmal oder Risiko relevanten Varianten in Form von genetischen Consensusprofilen abgeleitet. Existiert kein Schritt mit signifikanten Frequenzunterschieden, so kann keine Aussage getroffen werden.
Fiktives, einfaches Beispiel zur Merkmals- und Risikodifferenzierung von genetischen Profilen auf DNA-Sequenzebene mit 4 Varianten
Gegeben seien 30 Personen, die an einer Erkrankung A leiden (Gruppe A der Erkrankten), und weitere 30 Personen, die keine Anzeichen für Erkrankung A tragen (Gruppe G der Gesunden), wobei sich die Gruppen hinsichtlich anderer Merkmale mcht sigmfikant unterscheiden mögen. Von allen 60 Personen und deren Eltern seien die individuellen DNA- Sequenzen eines zu untersuchenden Kandidatengens beispielsweise mittels Multiplex- Sequenzierung bestimmt. An 4 verschiedenen Sequenzpositionen Pl, P2, P3 und P4 möge eine Mutation auftreten. Es soll geklärt werden, ob spezifische Haplotypprofile existieren, die mit der Krankheit assoziiert sind.
Für jede Person aus den beiden Gruppen A und G seien die beiden individuellen Haplotypprofile, die durch die Angabe des Vorkommens der Mutation an Pl, P2, P3 und P4 bezüglich einer Referenzsequenz vollständig bestimmt werden, gegeben. Es mögen unter allen 60 Personen die folgenden 6 verschiedenen Haplotypprofile existieren (1: Variante wie in der Referenzsequenz; 2: Variante trägt die jeweilige Mutation):
Nummer des Pl P2 P3 P4 Häufigkeit in Häufigkeit in Haplotyps Gruppe A Gruppe G
1 1 2 1 2 7 2
2 1 1 1 1 16 18
3 2 2 2 1 11 16
4 2 2 1 2 10 3
5 1 1 1 2 4 6 6 2 1 2 1 12 15
Zum besseren Verständnis der jetzt folgenden Auswertung, die bezüglich der hierarchischen Clusteranalyse und der Auswertung von Kontingenztafeln mittels des kommerziellen Statistikprogramm-Paketes SPSS für Windows NT, Version 7. 5 einschließlich der EXACT- Module vorgenommen wurde, sind in der Anlage zum Beispiel Auszüge des Ausdrucks von SPSS enthalten. Zur Prüfung von Häufigkeitsunterschieden des Vorkommens dieser 6 verschiedenen Haplotypen (VAR00001 = Nummer des Haplotyps) in den Gruppen A (VAR0002= 1) und G (VAR0002=2) wurde ein χ2-Test durchgeführt. Nach dem exakten Test (p=0,14) kann die Gleichheit der Verteilungen nicht abgelehnt werden.
Zur Klassifizierung dieser 6 Haplotypen wird anschließend eine hierarchische Clusteranalyse durchgeführt. Als Distanzmaß wurde in diesem Beispiel die euklidische Distanz als einfachstes Maß benutzt. Die Ergebnisse sind in der Anlage enthalten. Im Schritt 1 werden aus den 6 Haplotypen 3 Haplotypklassen gebildet, Klasse 1 aus Haplotypnummer 1 und 4, Klasse 2 aus den Haplotypen Nummer 2 und 5 sowie Klasse 3 aus 3 und 6. Im 2. und für dieses Beispiel letzten Schritt werden Haplotypklasse 1 und 2 zusammengefaßt. Die anschließende Prüfung von Häufigkeitsunterschieden der verschiedenen Haplotypen in den Haplotypklassen des 1. Schrittes ergibt einen signifikanten Unterschied (p=0,017) zwischen der Gruppe der Erkrankten und der Gesunden. Im letzten Schritt ist kein signifikanter Unterschied zwischen den beiden neu entstandenen Haplotypklassen des 2. Schrittes, die durch Vereinigung der Haplotypklassen des 1. Schrittes entstanden sind, mehr zu beobachten.
Aus den Haplotypklassen des 1. Schrittes werden Consensusprofile abgeleitet:
Haplotypklasse des 1. Schrittes Consensusprofil
1 *212
2 111* 3 2*21
Aus dem paarweisen Vergleich der Häufigkeiten der Consensusprofile geht hervor, daß das Consensusprofil *212 (*steht für 1 oder 2) mit der Erkrankung A assoziiert ist.
Kontingenztabelle für alle Haplotypen
Count
VAR00002
1.00 2.00 Total
VAR00001 1 ,00 7 2 9
2.00 16 18 34
3.00 11 16 27
4.00 10 3 13
5,00 4 6 10
6,00 12 15 27 Total 60 60 120
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig. Point
Value df (2-sided) (2-sided) (1-sided Probabilitv
Pearson
8.324a Chi-Square 5 .139 .141
Likelihoσd Ratio 8,704 5 ,121 ,140
Rsher's Exact Test 3,150 ,147
Linear-by-üπear Association ,582b 1 ,446 ,480 ,240 ,033 N of Valid Cases 120 a. 2 cells (16,7%) have expected couπt less than 5. The miπimum expected couπt is 4,50. b. The standardized statistic is ,763. Clusteranalyse für die Haplotypen
Average Linkage (Between Groups)
Agglomeration Schedule
Clu ster Stage Ciuster Com jiπed Rrst AoDβars
Ciuster Ciuster Ciuster Ciuster Next
Staσe 1 2 Coefficieπts 1 2 Staσe
1 3 6 1,000 0 0 5
2 2 5 1,000 0 0 4
3 1 4 1,000 0 0 4
4 1 2 1,390 3 2 5 5 1 3 1.720 4 1 0
HIERARCHICAL CLUSTER ANALYSIS**
Dendrogram usiπg Average Linkage (Betweeπ Groups)
Rescaied Distaπce Ciuster Combine
C A S E 0 5 10 15 20 '25 Label Num + + * + + +
3 -+ +
6 -* I
2 _+ + I
5 -+ +- + l _+ +
4 -+ Kontingenztabelle für die Verteilung der Haplotypen in 3 Klassen nach dem 1. Schritt
Couπt
VAR00002
1.00 2.00 Total
VAR00001 1,00 17 5 22
2,00 20 24 44
3,00 23 31 54 Total 60 60 120
Chi-Square Tests
Asymp.
Sig. Exact Sig. Exact Sig. Point
Value df (2-sided) (2-sided) (1-sided) Probabiiitv
Pearson
8,094a Chi-Square 2 .017 ,017
Likelihood Ratio 8,470 2 ,014 ,017
Rsher's Exact Test 8,139 ,017
Unear-by-Linear Association 5,879* 1 ,015 ,021 ,010 ,005 N of Valid Cases | 120 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 11,00. b. The standardized statistic is 2,425.
10
Kontingenztabelle für die Verteilung der Haplotypen in 2 Klassen nach dem 2. Schritt
Count
VAR00002
1.00 2.00 Total
VAR00001 1,00 37 29 66 3,00 23 31 54 Total 60 60 120
Chi-Square Tests
Asymp.
Sig. Exact Sig. Exact Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 2.1550 1 .142
Continuity Correction 1,650 1 ,199
Likelihood Ratio 2,162 1 .141
Rsher's Exact Test ,199 ,099
Linear-by-Linear Association 2,137 1 ,144 N of Valid Cases 120 a. Computed only for a 2x2 table b. 0 cells (,0%) have expected couπt less than 5. The miπimum expected couπt is 27,00.
11
Die Erfindung kann im Wesen auch folgendermaßen beschrieben werden:
1. Methode zur Verwendung eines Sets von Oligonukleotiden, die mit gesamtgenomischer DNA und DNA-Zielfragmenten hybridisieren, um damit zugleich die gezielte und simultane Generierung multipler individueller Sequenzen durch Amplifikation, Sequenzierung, und Dekodierung eines Pools von genomischen Sequenzen durchzuführen.
2. Eine Methode zur simultanen Sequenzierung und Analyse von multiplen DNA- Zielfragmenten, die mittels PCR amplifiziert werden
3. Eine Methode wie unter 2. beschrieben erweitert auf alle Nukleinsäuren.
4. Eine Methode zur Identifizierung interindividueller DNA Sequenzunterschiede in Kandidatengenen oder jeder genomischen Zielregion, die Erkrankungen ursächlich zugrundeliegen, genetisches Risiko für eine Erkrankung tragen, oder mit interindividuell unterschiedlicher Ansprechbarkeit auf Medikamente, suchterzeugende Substanzen, oder endogene Liganden einhergehen.
5. Eine Methode wie unter 4. beschrieben, erweitert auf Pflanzengenome, bakterielle Genome, grundsätzlich Genome aller Spezies, so daß in den Bereichen Molekularbiologie, Medizin, Biologie, Verterinärmedizin, Agrarwissenschaften und Ökobiologie Aufschlüsse über die Entstehung unterschiedlicher Merkmale auf der Basis genetischer Variationen gewonnen werden können.
6. Eine Methode zur simultanen Generierung jedweder Nukleinsäuresequenzen und deren Varationsanalyse.
7. Ein spezifisches Verfahren zur Image-Generierung und Image- Analyse, die auf der Basis eines spezifischen Auftragsschemas der individuellen Terminationsreaktionen die unmittelbare Detektion von DNA Sequenzunterschieden, SNPs (single nucleotide polymorphisms), und Indel-Polymorphismen ermöglicht. Ein wesentliches Element der Images/Datenverwaltung liegt auch darin, daß Bandenmuster einer gegebenen Base eines definierten DNA-Segmentes als spezifisches Identifizierungsmuster für jedes Nukleinsäure-Segment dient.
8. Ein Verfahren, das es ermöglicht, DNA-Sequenzen multipler Individuen simultan in einem Gefäß und in einem Vorgang durchzuführen
Im folgenden wird die Erfindung durch Ausführungsbeispiele näher erläutert:
Die erfindungsgemäße Multiplex-Sequenziermethode wurde in einem 15-Plex-
Sequenzierungsprojekt verwendet. In analoger Weise können auch 20-, 40- und 55-Plex-
Sequenzierprojekte durchgeführt werden.
Das Protokoll verwendet Mikrotiterplatten (96-wells) und Multichannel-Pipetten.
Die gegenwärtige modular aufgebaute Produktionslinie ist Mikrotiterplatten basiert und integriert 12
1. einen automatischen Pipettierroboter (Biomek 2000, Beckman);
2. PCR- Automaten (MJ Research 3)
3. ultradünne Gel-Direkttransfer-Elektrophorese (DTE)
4. semi-automatisierte parallele Hybridisierung
5. einem Phosphor-Fluor-Imager (Molecular Dynamics)
6. PCR-basierte Image- Analyse mittels 'skilled pattern interpretation'
Gendissektion (Zergliederung), Primer-Design:
PCR-Primer wurden nach dem 'staggered dissection' Prinzip ausgewählt (vgl. Abb. lb) ausgewählt. Sie erlauben die Amplifizierung mit einer annealing Temperatur von 60 oC. Es wurde das Programm Primerselect aus dem Dnastar-Paket verwendet.
PCR:
Für die vergleichende Sequenzierung des kodierenden und komplementären Stranges wurden 15 PCR-Fragmente pro Individuum (14 genspezifische und 1 HLA-Fragment zur Kontrolle für den kodierenden Strang und 15 genspezifische für den komplementären Strang) einzeln in einem Perkin-Elmer 9600 oder MJ Research PCR-Automat amplifiziert. Die Reaktionen enthielten 100 ng genomische DNA, 10 mM TrisHCl (pH 8,3), 1,5 mM MgC12, 50 KC1, 200 μM von jedem Nukleosid-Triphosphat, 30 pmol von jedem Primer, 3 U Taq-Polymerase, und Wasser in einem Endvolumen von 50 μl. Um unspezifische Polymerase- Aktivität zu verhindern, wurde die Taq-Polymerase in 5 μl Einmal-Reaktionspuffer-Gemisch ( 10 mM TrisHCl (pH 8,3), 1,5 mM MgC12, 50 KC1), während eines Zeitintervalls von 4 min bei 88 oC nachfolgend einer anfänglichen Denaturierung von 94 oC für 4 min zugegeben. Reaktionsansätze wurden für 30-35 Zyklen bei 94 oC (15 sec), 60 oC (15 sec) und 72 oC (30 sec) oder bei 94 oC (15 sec), 60 oC (30 sec) und 72 oC (1 min) amplifiziert.
Die Amplifizierung wurde mittels eines 5 μl Aliquots aus dem PCR-Ansatz auf einem 2 % Agarosegel überprüft. 5'-biotinylierte Primer wurden als Antisense-Primer in dem beschriebenen PCR-Protokoll verwendet, da das Multiplexing-ProtokoU auf der Einzelstrangsequenzierung mittels eines Festphasensystems basiert. Allen nachfolgend aufgeführten Schritten liegt eine Einheit von 24 oder einem vielfachen davon an DNA-Proben zugrunde, die einer oder mehreren Membranen/Images entspricht.
Aufreinigung der PCR-Produkte:
Alle 15PCR-Produkte pro Induvidium, 10 μl von jedem entsprechen ungefähr 200 ng amplifizierter PCR-DNA, wurden in einem Mikrotiter-Well zusammengefaßt, welche letztlich mindestens 150 μl an PCR-Produkten enthielt. 24 x 4 15-Plex-Poole wurden anchließend über das 96-Well QIAvac manifold-System (Qiagen) aufgereinigt. Die aufgereinigten Pools an 13
PCR-Produkten wurden in einem Volumen von 60 μl 1 x TE im 96-well-Maßstab eluiert.
Für die Festphasen-Multiplex-Sequenzierung des kodierenden Strangs wurde einzelsträngige (es) PCR-DNA mittels einer magnetischen Streptavidin/Biotin-Interaktion isoliert. Das 15- biotinylierte PCR-Produkt enthaltende Eluat wurde mit destilliertem Wasser auf ein Gesamtvolumen von 160 μl aufgefüllt, mit einem gleichen Volumen an gewaschenen Magnetpartikeln versetzt, um ein Gemisch an einzelstängiger DNA-Matrizen für die Sequenzierung herzustellen. Parallel dazu wurden die Magnetpartikel vorschriftsgemäß gewaschen (Dynal, Oslo). Das ursprüngliche Protokoll wurde für die simultane Immobilisierung der 15 verschiedenen PCR-Produkte dahingehend modifiziert , daß nur ungefähr lA ( 4 x anstelle 15 x) der vorgeschriebenen Menge an Magnetpartikeln verwendet wurde.
Zusammengefaßt, 24 x 80 μl equivalent zu ca. 2 x 1 ml (800 μg) an Streptavidin-beschichteten Magnetpartikeln wurden 2 x in einer gleichen Menge an 1 x Binde- und Wasch-(B & W) Puffer gewaschen, in dem doppeltem Volumen 2 x B & W-Puffer resuspendiert, und in 24 Aliquots a 160 μl auf eine 96-Well-Platte verteilt. Anschließend wurden die 160 μl an gepooltem und gereinigtem PCR-Produkten mit einem gleichen Volumen gewaschener Magentpartikel versetzt und für 15 min bei Raumtemperatur inkubiert. Das Aufschmelzen der DNA-Helices und die Trennung der DNA-Stränge erfolgte vorschriftsmäßig; es wurden jedoch 4-5-fache Volumina an Puffer und Lösungen verwendet um die 15-fache Menge an prozessierter PCR-DNA auszugleichen. Anschließend wurden die Magnet-Partikel mit der an sie gebundenen esPCR-DNA in 60 μl Wasser resuspendiert.
Direkte Multiplex (15-plex)-Festphasen T7/Mn-didesoxy-Sequenzierung von esPCR-DNA: Die Multiplex-Sequenzierreaktionen wurden mit der doppelten Menge an Reagenzien, verglichen mit einer 15-fachen Menge an Reagenzien falls die Reaktionen einzeln prozessiert worden wären, durchgeführt, mit der Ausnahme einer veränderten Menge der 15 verschiedenen Sequenzier-Primer. Die doppelte Menge, 2 pmol von jedem Sequenzierprimer wurden in einer Multiplex-Sequenzierreaktion verwendet.
15-Plex-Primer : jedes in einem Mikrotiter-Well befindliche Gemisch aus 15 Matrizen wurde mit 2 μl Primercocktail (2 pmol von jedem Primer) und 4 μl 5 x Reaktionspuffer (75 mM NaCl, 40 mM TrisHCl, pH 7,5) versetzt. Die annealing-Gemische mit einem Gesamtvolumen von 22 μl wurden in einem Wasserbad 2 min bei 80 °C erhitzt und anschließend für 20 min bei 37 °C inkubiert. Die Proben wurden kurz zentrifugiert und auf Eis abgekühlt. Vor dem Start der Sequenzierreaktion wurden 8 μl Mangan-DTT-Gemisch (25 mM DTT, 3,75 mM isocitric-Säure, 1,25 mM MnC12 in Wasser ), dem annealing-Gemisch zugesetzt, gefolgt durch die Zugabe von 4 μl verdünnter Sequenase (0,5 U Sequenase für 15 Matrizen und 0,03 U 14
IPPase in 1 x TE) in einem Endvolumen von 34 μl. Jeweils 7 μl dieser Gemische wurden mit jeweils 5μl eines basenspezifischen Nukleotid-Terminationsgemisches (100 μM von jedem dNTP, 1 μM von jedem ddNTP, in 25 mM NaCl) versetzt und anschließend für 15 min bei 37 °C inkubiert. Nach erfolgter Sequenzierreaktion wurden dei 96-Well-Platten kurzzeitig zentrifugiert und die Überstände durch magnetische Abtrennung entfernt. Die Terminationsprodukte wurden eluiert, indem 5μl Stopp-Lösung (95% Formamid, 20 mM EDTA, 0,05 % Bromphenol-Blau, 0,05 % Xylen-cyanol FF) zugegeben wurden und anschließend eine Erhitzung für 2 min bei 80 °C erfolgte. Die Überstände, die die Gemische der Sequenzierprodukte enthalten wurden erneut durch magnetische Trennung abgenommen, in eine neue Mikrotiterplatte überführt und bei -20 °C gelagert. Vor dem Auftragen wurden die Proben für 2 min bei 80 C in einem Wasserbad denaturiert und sofort auf Eis abgeschreckt. Für das Sequenziergel wurden von jeder Probe 1 μl aufgetragen.
Direkte Multiplex (15-Plex) Cycle-Sequenzeirung von PCR-DNA:
Für die Sequenzierung des komplementären Stranges wurde eine 15-Plex-Cycle-Sequenzierung mit 2 μl, entpsrechend ca. 40 ng von jedem PCR-Produkt, Thermo Sequenase, unter denen vom Hersteller vorgegebenenen Reaktionsbedingungen (Amersham) durchgeführt. Eine Ausnahme, der ursprüngliche Sequenzier-Primer wurde durch ein Gemisch von 15 Primern (0,5 pmol/Primer) ersetzt.
Direkte Transfer-Elektrophorese(DTE):
96 Proben (entprechend den gepoolten Terminationsreaktionen von 24 Individuen), von jeder 1 μl, wurden mit einer Hamilton-12-Kanal-Pipette (Hamilton, Reno, NV) auf ein ultradünnes, 0,125 mm, 5 % Acrylamidgel aufgetragen, nach Größe bei 3150 V aufgetrennt und nach dem Protokoll von Richterich und Church (1993) auf eine Nylonmembran (neutral), 1,2 μm Biodyne A, Pall, 32 x 45 cm übertragen. Der Transfer erfolgte Computer gestützt mittels einem modifizierten Geschwindigkeitsgradienten von 11 cm/h für 80 min und 8 cm/h für 5 Stunden, welches eine optimale Auflösung der Sequenzierprodukte für die Image-Analyse mittels visueller Inspektion erbrachte. Images, die eine direkte Identifizierung von Sequenzunterschieden verschiedener individueller Gene durch visuelle Inspektion ermöglichen, wurden durch die Einführung eines spezifischen Ladeprinzips generiert. Die Terminationsreaktion eines Gemisches einer gegebenen Base G, T, A, C wurden in Blöcken von jeweils 12 Individuen geladen, um hierdurch die Detektion von Mutationen durch die Identifzierung von zusätzlichen und/oder fehlenden Banden (skilled pattern interpretation, vgl. Abb. la, lb und 2) zu erreichen. Nach dem Transfer wurde die DNA durch Bestrahlung mit UV-Licht fixiert. 15
Sequentielle Hybridisierung: Hybridisierungssonden wurden wie folgt hergestellt:
Oligonukleotide mit einer Mindestlänge von 18 Nukleotiden und revers komplementär zu dem Zielsegment, welches intergraler Bestandteil des genomischen Zielfragmentes ist, wurden in Protionen von 1 μl (2 pmol) mit [α-32P]dATP (6000Ci/mmol; NEN) und 1 μl ( 14 U Kalbsthymus teminaler Desoxynukleotidyl-Transferase (USB) entsprechend den Vorgaben des Herstellers endmarkiert. Nach Vorhybridisierung bei 42 °C für mindestens 15 min, wurde eine 10 μl terminale Transferasereaktion mit 8 ml Hybridisierungspuffer ( 7 %SDS, 10 % Polyethylenglykol (PEG), 0,25 M NaCl, 0,051 % Phosphorsäure, 82 mM Na2HPO4 x H2O, 10 mM EDTA, 32 mM NaOH; auch als Prähybridisierungslösung zu verwenden) verdünnt, dem Volumen für die Hybridisierung einer Membran. Ein bis zwei Membranen wurden in einer Glasröhre bei 42 ° C über Nacht, mindestens für 4 h, hybridisert. Die Membranen wurden in Einheiten von 5 bei Raumtemperatur mittels eines Automaten für die Membranwaschung (Umwelt- und Ingenieurtechnik GmbH, Dresden) gewaschen, der 5 Waschschritte mit jeweils 1500 ml Waschlösung (1 % SDS, 0,022 % Phosphorsäure, 69 mM Na2H2PO4 x H2O, 5 mM EDTA, 32 mM NAOH) durchführte. Nachfolgend wurde jede der Membranen mit Klarsichtfolie bedeckt. Nach Exposition zu einem Molecular Dynamics Phosphor Fluor Imager Screen für 1 bis 20 h wurde die radioaktive Probe mit Stripping-Puffer (0,2 % SDS, 2 mM EDTA, pH 8,3) für 5 -10 min bei 65 °C mindestens 2 x, entfernt. Die Images wurden mittels eines Molecular Dynamics Phosphor Fluor Imagers eingelesen und die Images-Files für die Genotypisierung auf einen PC transferiert.
Protokolle:
Im folgenden werden die Protokolle der Schritte des "Multiplex-PCR-Sequenzierungssystems" (Abb. 1) beschrieben, das für die 15 Plex-Produktionssequenzierung in diesem Verfahren angewendet wurde. Die Protokolle basieren auf Mehrfachwells (96-Well-Format). Es wurden Mehrkanalpipetten verwendet. Die derzeitige modulare Produktionslinie basiert auf Mehrfachwells und schließt ein:
1. einen Beckman Biomek 2000 Pipettierungsroboter,
2. MJ Research Tetrads Thermozykler;
3. eine ultradünne Geldirektübertragungselektrophorese (DTE),
4. eine halbautomatische parallele Probenuntersuchung,
5. einen 'Molecular Dynamics '-Phosphor-Fluor-Imager und
6. eine computergestützte 'skilled pattern analysis' durch 'geschulte Mustererkennung'. 16
Genzerlegung, Primerdesign: PCR-Primer wurden nach dem 'versetzten' Zerlegungsmuster, das in Abb. 2 dargestellt wird, ausgewählt, um eine vollständige und redundante Abdeckung der bekannten Gensequenz zu erreichen. Sie wurden so ausgewählt, daß eine Amplifikation bei der gleichen Annealingtemperatur von 60°C ermöglicht wurde. Es wurde das 'PrimerSele'- Programm des 'Dnastar' -Paketes angewendet.
PCR-Verfahren: Um die Kodierungs- und Komplementärstränge vergleichend zu sequenzieren, wurden 15 PCR-Produkte pro Einzelprobe (14 genspezifische und ein HLA-Fragment wurden als Kontrolle für den Forwardstrang und 15 genspezifische Fragmente für den Reversestrang hergestellt; separat in einem Perkin Eimer 9600 oder in MJ Research Tetrads amplifiziert. Die Reaktionsgemische enthielten 100 ng genomischer DNS, 10 mM Tris-HCl (pH 8,3), 1,5 mM MgCl2, 50 mM KC1, 200 μM jedes Nucleosidtriphosphates, 30 pmol jedes Primers, 3 U Taq- Polymerase (Boehringer Mannheim) und H20 mit einem Endvolumen von je 50 μl. Zur Vermeidung einer nichtspezifischen Enzymaktivität wurde rαg-Polymerase in einem Volumen von 5 μl, das 1 x Reaktionspuffer (10 mM Tris-HCl (pH 8,3), 1,5 mM MgCl2, 50 mM KC1) enthielt, innerhalb eines Zeitintervalls von 4 Min. bei 88 C nach einer 4-minütigen anfänglichen Denaturationsphase von 94 °C zugesetzt. Die Reaktionsgemische wurden 30-35 Zyklen bei 94°C (15 Sek.), 60°C (15 Sek.) und 72°C (30 Sek.) bzw. bei 94°C (15 Sek.), 60 °C (30 Sek.) und 72 °C (1 Min.) unterzogen. Die Amplifikation wurde kurz geprüft durch Auflösung von 5 μl PCR-Produkten auf einem 2% -igen Agarosegel und Sichtbarmachung der Banden mittels Ethidiumbromid und ultravioletter Bestrahlung. Gewöhnlich wurde ausreichend PCR-DNS für eine doppelte Sequenzanalyse erzeugt. Da sich die Multiplexprotokolle auf ein direktes Festphasensequenzierungsprotokoll stützten, das die Sequenzierung des Kodierungsstrangs gewährleistete, wurden 5'biotinylierte Primer als Antisenseprimer im beschriebenen PCR-ProtokoU eingeführt. Während der folgenden Schritte bildete eine Einheit von 24 einzelnen DNS-Proben oder ein Mehrfaches davon die Arbeitseinheiten, die einer oder einem Vielfachen einer Membran/eines Sequenzbildes ('Images') entsprechen.
Reinigung der PCR-Produkte: Sämtliche 15 PCR-Produkte eines Individuums, 10 μl pro PCR- Produkt entsprechend etwa 200 ng PCR-DNS, wurden in ein Mikrotiterwell gepoolt, das somit etwa mindestens 150 μl PCR-Produkte enthielt. 24 x 4 15-plex-Pools von PCR-Produkten wurden dann einer Reinigung durch das 96-Well-QIA vac-Mehrfachsystem (Qiagen) unterzogen. Die Pools der PCR-Produkte wurden mit 50 μl von 1 x TE-Puffer in ein 96-Well- Format eluiert. Für die auf einer Festphasen-Sequenzierung basierenden Multiplexsequenzierung des Kodierungsstranges wurde einzelsträngige PCR-DNS durch die Interaktion von Streptavidin auf magnetischen 'Beads' mit Biotin abgetrennt. Das eluierte Produktvolumen, das 15 biotmylierte PCR-Produkte enthält, wurde mit destilliertem H2O auf ein Endvolumen von 160 μl aufgefüllt, um mit einer gleichen Menge gewaschener 17
magnetischer 'Beads' zusammengebracht zu werden, um die gepoolten PCR-Produkte zu immobilisieren und Gemische einzelsträngiger DNS als Sequenziermatrizen herzustellen. Parallel dazu waren die 'Beads', gemäß den Empfehlungen des Herstellers (Dynal, Oslo), gewaschen worden. Das Protokoll des Herstellers war modifiziert worden, um die gleichzeitige Immobilisierung von 15 verschiedenen PCR-Produkten zu ermöglichen, wobei etwa nur lA (4x anstatt 15x) der erforderlichen/empfohlenen Menge an 'Beads' verwendet wurde. Kurz gesagt, 24 x 80 μl, was etwa 2 x 1 ml (800 μg) mit Streptavidin überzogenen magnetischen 'Beads' äquivalent ist, wurden zwei Mal in entsprechenden Volumina von 1 x Binde- und Waschpuffer gewaschen, erneut in dem doppelten Volumen von 2x Binde- und Waschpuffer suspendiert, und in 24 Aliquoten von 160 μl auf einer 96-Well-Platte verteilt. Dann wurden die gepoolten, gereinigten PCR-Produkte in einem Endvolumen von 160 μl mit gleichen Volumina von vorgewaschenen 'Beads' versetzt und 15 Min. bei Zimmertemperatur inkubiert. Das Schmelzen der DNS-Doppelstrangmoleküle und die Abtrennung der DNS- Stränge erfolgten gemäß dem Herstellerprotokoll. Eine vier- bis fünffache Menge von Puffern und Lösungen wurde jedoch für die Akkomodierung der 15-fachen Menge behandelter PCR- DNS verbraucht. Nach Abschluß der Behandlung wurden die Perlen mit gebundener einzelsträngiger PCR-DNS in 16 μl H20 erneut suspendiert.
Direkte Festphasen-Multiplex (15-plex)-T7IMn-Dideoxy-Sequenzierung einzelsträngiger PCR- DNS: Multiplex-Sequenzierungsreaktionen wurden mit einer doppelten Menge von Reagenzien durchgeführt verglichen mit der 15-fachen Menge von Reagenzien, die erforderlich wäre, wenn die Reaktionen einzeln durchgeführt worden wären, ausgenommen die Mengen der 15 verschiedenen Sequenzierungsprimer. Die doppelte Menge (2 pmol) jedes Sequenzierungsprimers wurde in einer Multiplex- Sequenzierungsreaktion eingesetzt, um dem Annealing der Primer an beide, das Ziel- und das Nachbarfragment, begegnen zu können; siehe auch Abb. 2. 15-Plex-Primer-Annealing: Jeder Pool von 15 Matrizen, die in einem Mikrotiterwell enthalten waren, wurden mit 2 μl eines Primercocktails (2 pmol jedes Primers) und 4 μl von 5 Reaktionspuffer (75 mM NaCl, 40 mM Tris-HCl, pH 7,5) gemischt. Diese Annealinggemische von einem gesamten Reaktionsvolumen von 22 μl wurden 2 Min. lang in einem Wasserbad von 80°C erhitzt und 20 Min. lang bei 37°C inkubiert. Die Proben wurden kurz zentrifugiert und auf Eis gekühlt. Bevor die Sequenzierungsreaktionen eingeleitet wurden, wurden dem jeweiligen Annealinggemisch 8 μl eines Mangan-DTT-Gemisches (25 mM DTT, 3,75 mM Iso-Zitronensäure, 1,25 mM MnC^ in H2O) zugesetzt, gefolgt von 4 μl Sequenase- Lösung (0,5 U Sequenase für 15 Matrizen und 0,03 U IPPase in 1 x TE), was ein Endvolumen von 34 μl ergab. 7 μl dieser Gemische wurden in 5 μl basenspezifische Nukleotidgemische (100 μM jedes dNTP: 1 μM jedes ddNTP, in 25 mM NaCl) aliquotiert und 15 Min. bei 37 °C inkubiert. Nachdem die Extension beendet war, wurde die 96-Well-Platte kurz zentrifugiert, die überstehende Flüssigkeit wurde mittels magnetischer Trennung entfernt; die 18
Terminationsprodukte wurden durch Zusatz von 5 μl Stopplösung (95 % Formamid, 20 mM EDTA, 0,05 % Bromphenolblau, 0,05 % Xylenzyanol FF) und eine 2-minütige Erhitzung auf 80° C eluiert. Die überstehende Flüssigkeit, die die Pools der terminierten Sequenzierungsreaktionen enthält, wurde mittels magnetischer Trennung entfernt und auf eine neue Mikrotiterplatte aufgetragen und bei -20 °C gelagert. Unmittelbar vor dem Aufbringen wurden die Proben 2 Min. lang in einem Wasserbad von 80 °C denaturiert und schnell gekühlt auf Eis/Wasser, 1 μl pro Probe wurde auf das Sequenzierungsgel aufgebracht.
Direkte Multiplex (15-plex)- 'Cycle ' Sequenzierung von PCR-DNS
Die Komplementärstrangsequenzierung erfolgte mit einer 15-plex-' Cycle '-Sequenzierung bei Verwendung von 2 μl des jeweiligen PCR-Produktes, was etwa 40 ng äquivalent ist, Thermosequenase und Anwendung der durch den Lieferanten (Amersham) beschriebenen Reaktionsbedingungen, mit der Ausnahme, daß der Sequenzierungsprimer durch ein Gemisch von 15 Primern, 0,5 pmol pro Primer, ersetzt wurde. So wurden 15 Sequenzierungsreaktionen durchgeführt mit der einfachen Menge der Reagenzien, was einem Fünfzehntel der Reagenzien, die für die Standardreaktionen verwendet wurden, entspricht.
Direkübertragungselektrophorese (DTE): 96 Proben (die den gepoolten basenspezifischen Terminationsreaktionen von 24 Individuen entsprachen), je lμl, wurden mit einer 12-kanaligen Hamilton-Pipette (Hamilton, Reno, NV) auf ein ultradünnes, 0,125 mm, 5 %-iges Akrylamidgel aufgebracht, aufgelöst nach der Größe bei 3150 V und auf eine Nylonmembran (neutral 1,2 μm Biodyne A, Pall, Größe: 32 x 45 cm) durch DTE aufgebracht, wie im einzelnen von Richterich und Church (1993) beschrieben wurde. Die Übertragung war computergesteuert und folgte einem modifizierten Geschwindigkeitsgradienten von 11 cm/Std für 80 Min., und von 8 cm/Std. für 5 Stunden, was für gleichmäßige Abstände zwischen den Banden von etwa 0,8 mm, optimal für eine Bildanalyse durch visuelle Prüfung, sorgte. Die 'Sequenzimages', die eine Identifizierung der Sequenzunterschiede zwischen den individuellen Genen unmittelbar durch visuelle Prüfung ermöglichen, wurden durch Einführung eines spezifischen Ladesystems erzeugt: die Terminationsreaktionspools einer gegebenen Base- G, T, A, C wurden in Blocks von je 12 Individuen geladen, um die Identifizierung von Varianten durch Feststellung zusätzlicher und/oder fehlender Banden zu erleichtern ('Skilied Pattern Interpretation' -geschulte Mustererkennung). Nach der Übertragung der DNS-Formen von den Gelen auf die Nylonmembranen wurden sie 30 Sekunden lang durch ultraviolettes Licht vernetzt.
Sequentielle Hybridisierung: Die 'Proben' wurden wie folgt hergestellt:
Olligonucleotide, mindestens 18 nt lang, und reverskomplementär zu den 'Tag '-Sequenzen, die 19
Bestandteil der genomischen Zielsegmente sind (siehe Abb. 2), wurden durch Zusatz von etwa 15 dAMP-Resten aus 2,6 μl [α -32P] dATP (6000 Ci/mmol; NEN) in Portionen von 1 μl (2pmol) markiert mit 1 μl (14 U) Kalbsmymus ϊüsenterminal-deoxynucleotidyltransferase (USB) gemäß den Herstellerempfehlungen. Nach einem Prähybridisierungsschritt von mindestens 15 Min. bei 42 C wurde eine 10 μl Terminaltransferasereaktion in 8 ml Hybridisierungspuffer [7 % SDS, 10 % Polyäthylenglykol (PEG), 0,25 M NaCl, 0,051 % H3PO4, 82 mM Na2HPO4 x H2O, 10 mM EDTA (freie Säure), 32 mM NaOH; auch für die Prähybridisierung verwendet], dem berechneten Volumen für die Hybridisierung einer Membran, verdünnt. Gewöhnlich wurden 1 bis 2 Membranen in ein Glasrohr (Container) eingebracht und über Nacht, zumindest 4 Stunden lang, bei 42 °C hybridisiert. Die Membranen wurden in Gruppen von 5 bei Zimmertemperatur unter Einsatz eines automatisierten Gerätes für die Blotinkubation und das Waschen (Umwelt- und Ingenieurtechnik GmbH, Dresden), programmiert für 5 Waschschritte mit 1800 ml Puffer, der 1 % SDS, 0,022 % H3PO4, 69 mM Na^PO, x H2O, 5 mM EDTA (freie Säure), 32 mM NaOH enthält, gewaschen. Jede der feuchten Membranen wurde zwischen eine Saran-Hülle und eine Polyesterunterlage gelegt. Nach Exposition in einem 'Molecular Dynamics'-Phosphor-Fluor- Imager bei Zimmertemperatur 1 bis 20 Stunden lang, wurden die radioaktiven Sonden mit 0,2 % SDS und 2 mM EDTA (freie Säure, eingestellt auf einen pH von 8,3 mit einer tris-Lauge) mindestens zweimal 5 bis 10 Min. lang bei 65 C entfernt. Während der 15 Hybridisierungen waren die Auflösung und das Verhältnis Signal zum Hintergrund im wesentlichen die gleichen, wie sie mit dem optimierten Uniplex- Verfahren erzielt wurden und damit war die Bildqualität, die für die Identifizierung von Sequenzvarianten mit hoher Genauigkeit wünschenswert ist, garantiert. Die Sequenzbilder wurden eingescannt und die Bilddateien wurden auf Computer übertragen für das Lesen der Genotypen.
Ergebnis:
Vergleichende Sequenzanalyse des humanen μ-Opioid-Rezeptorgens
Das humane μ-Opioid-Rezeptorgen inklusive seiner 5 '-regulierenden, kodierenden und wichtiger intronischer Sequenzen wurde in 250 Individuen vergleichend sequenziert. Die
Gruppe der 250 untersuchten Individuen beinhaltete Süchtige mit einer Familiengeschichte, der
Krankheit und Kontrollen. Insgesamt wurden 1,7 Mbasen analysiert. Die Analyse der Daten zeigte, daß eine spezifische Konstellation von Polymorphismen (Haplotyp) mit einer signifikant erhöhten Frequenz in Individuen mit einer genetischen Disposition zu
Drogenmißbrauch beobachtet wurde, das Projekt die folgenden Schritte: a) Klonierung der 5 '-regulierenden und wichtiger intronischer Sequenzen, welches die vorher bekannte cDNA-Sequenzinformation (2162bp) auf insgesamt 6968 bp erweiterte, 20
b) Dissektion (Zergliederung) der gesamten genomischen Sequenz sowohl des kodierenden als auch des komplementären Stranges in PCR-Fragmente, 15-Plex-Sequenzierung beider Stränge. Generierung von zwei Sätzen a ll Membranen, die pro Strang 1,7 Mbasen an vergleichender Sequenzinfomation enthalten, 15 Hybridisierungszyklen pro Membran, Auswertung von ca. 330 Images über 'skilled pattern analysis' c) Determimerung des gesamten polymorphen Spektrums mit insgesamt 37 Varianten, Haplotyp-Analyse von 23 Varianten resultierend in zahlreichen individuellen Genptrofilen, Derterminierung von allelischen Kategorien über simularity analyse. d) Identifizierung einer allelischen Kategorie in US- Amerikanern afrikanischer Abstammung, die mit der genetischen Disposition zu Drogenmißbrauch assoziiert ist.

Claims

21Patentansprüche:
1. Methode zur Identifizierung, Darstellung und Auswertung sowie Interpretation interindividueller DNA Sequenzunterschiede, dadurch gekennzeichnet, daß man
- die genomische DNA der zu untersuchenden Individuen isoliert,
- Segmente der zu vergleichenden Gene, genomischen Regionen, Genome definiert,
- diese Segmente mittels PCR unter Verwendung hochspezifischer Oligonukleotide gezielt isoliert und in einer ausreichenden Anzahl von Kopien herstellt,
- eine simultane Sequenzierung aller gewonnenen Gensegmente, die nun als PCR-Produkte vorliegen, durchführt,
- das dadurch entstehende Gemisch von Terminationsreaktionen, das die individuellen Sequenzen aller Gensegmente enthält, anschließend auf einem Sequenziergel elektrophoretisch trennt und
- mittels direkter Transferelektrophorese auf eine Membran überträgt,
- anschließend durch Hybridisierung der Membran mit einem markierten, hochspezifischen Oligonukleotid die individuellen Sequenzen eines bestimmten Gensegmentes aus dem ursprünglichen Gemisch sichtbar macht,
- diesen Vorgang sooft wiederholt, bis alle Gensegmente aus dem ursprünglichen Pool detektiert sind
- und anschließend durch Image-Analyse interindividuelle DNA-Sequenzunterschiede detektiert, und durch mathematische Aufarbeitung ein Genprofilmuster erstellt und auswertet.
2. Methode nach Anspruch 1, dadurch gekennzeichnet, daß sie auf alle Nukleinsäuren angewendet wird.
3. Methode nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß multiple Gensegmente eines bestimmten Individuums simultan sequenziert werden, oder ein und dasselbe Segment simultan in multiplen Individuen sequenziert werden.
4. Methode nach Anspruch 1 bis 3, dadurch gekennzeichnet, daß die simultane Sequenzierung mit multiplen, hochspezifischen Sequenzierprimern durchgeführt wird, wobei die Anzahl der Sequenzierprimer der Anzahl der Gensegmente entspricht.
5. Methode nach Anspruch 1-3, dadurch gekennzeichnet, daß die simultane Sequenzierung mit multiplen, hochspezifischen Sequenzierprimern durchgeführt wird, wobei die Anzahl der Sequenzierprimer der Anzahl der virtuellen Gensegmente entspricht. 22
6. Methode nach Anspruch 5, dadurch gekennzeichnet, daß virtuelle Gensegmente dadurch gekennzeichnet sind, daß sie Bestandteil eines mehrere Gensegmente umfassenden PCR- Fragmentes sind.
7. Methode nach einem der Ansprüche 1 bis 6, dadurch gekennzeichnet, daß sie für 20 - 30, bevorzugt 24, Individuen, durchgeführt wird, so daß eine Membran die Sequenzen aller Gensegmente der untersuchten Individuen enthält.
8. Methode nach einem Ansprüchen 1 bis 6, dadurch gekennzeichnet, daß deine Membran nicht nur die Sequenzen aller Gensegmente einzelner Individuen enthält, nämlich 20-30, bevorzugt 24, Individuen enthält, sondern alternativ auch die Sequenzen eines Gensegmentes in multiplen Individuen enthält.
9. Methode nach Anspruch 8, dadurch gekennzeichnet, daß sie 2-100 x 20-30, bevorzugt 24, enthält.
10. Methode nach einem der Ansprüche 1 bis 9, dadurch gekennzeichnet, daß spezifisch für den Nukleinsäuresequenzvergleich die basenspezifischen Terminationsreaktionen von jeweils 12 Individuen nebeneinander angeordnet werden, so daß auf der Membran und schließlich auf dem Image jeweils Blöcke von je 12 individuellen G-Reaktionen, und analog T-, A-, und C- Reaktionen sichtbar werden.
11. Methode nach Anspruch 10, dadurch gekennzeichnet, daß die Sequenzunterschiede unmittelbar dargestellt werden.
12. Methode nach einem der Ansprüche 1 bis 11, dadurch gekennzeichnet, daß die hochspezifischen Oligonukleotide radioaktiv oder mittels anderer Verfahren markiert sind.
13. Methode nach Anspruch 12, dadurch gekennzeichnet, daß die Sichtbarmachung definierter DNA-Sequenzen aus dem Reaktionsgemisch dadurch erfolgt, daß die hochspezifischen Oligonukleotide mit einer DNA-Sequenz hybridisiert, die integraler Bestandteil eines definierten genomischen Zielsegmentes ist, und die sich an die Sequenzierprimerhybridisierungsregion anschließt.
14. Methode nach Anspruch 12, dadurch gekennzeichnet, daß die Sichtbarmachung definierter DNA-Sequenzen aus dem Reaktionsgemisch dadurch erfolgt, daß die hochspezifischen Oligonukleotide mit einer DNA-Sequenz hybridisiert, die extern synthetisiert wurde und intergraler Bestandteil des PCR- oder Sequenzierprimers ist. 23
15. Methode nach einem der Ansprüche 1 bis 14, dadurch gekennzeichnet, daß Genprofilmuster, die eine genetische Differenzierung für das Erkennungsrisiko bzw. für die Ausprägung phänotypischer Merkmale jeder Art in jeder Species zulassen, durch Reduktion der Anzahl von Geno- bzw. Haplotypen mittels Klassifizierungsverfahren unter Ausnutzung des Häufigkeitsvergleichs von Geno- bzw. Haplotypen zweier verschiedener phänotypischer Gruppen einer Spezies erstellt werden.
16. Verwendung eines definierten Sets von Oligonukleotiden für diagnostische Zwecke, wobei die Oligonukleotide mit gesamtgenomischer DNA und DNA-Zielfragmenten hybridisieren, um damit zugleich die gezielte und simultane Generierung multipler individueller Sequenzen durch Amplifikation, Sequenzierung und Dekodierung eines Pools von genomischen Sequenzen durchzuführen
17. Verwendung der Methode gemäß der Ansprüche 1 bis 15 zur Identifizierung interindividueller DNA Sequenzunterschiede in Kandidatengenen, Genomen oder jeder genomischen Zielregion, die Erkrankungen ursächlich zugrundeliegen, genetisches Risiko für eine Erkrankung tragen, oder mit interindividuell unterschiedlicher Ansprechbarkeit auf Medikamente, suchterzeugende Substanzen, oder endogene Liganden einhergehen.
18. Verwendung nach Anspruch 17, dadurch gekennzeichnet, daß Pflanzengenome, bakterielle Genome, grundsätzlich Genome aller Spezies, so daß in den Bereichen Molekularbiologie, Medizin, Biologie, Verterinäπnedizin, Agrarwissenschaften und Ökobiologie Aufschlüsse über die Entstehung unterschiedlicher Merkmale auf der Basis genetischer Variationen gewonnen werden können.
19. Verwendung der Methode gemäß Ansprüche 1 bis 15 zur Image-Generierung und Image- Analyse, die auf der Basis eines spezifischen Auftragsschemas der individuellen Terminationsreaktionen die unmittelbare Detektion von DNA Sequenzunterschieden, SNPs (single nucleotide polymorphisms), und Indel-Polymorphismen. und der Images/Datenverwaltung indem Bandenmuster einer gegebenen Base eines definierten DNA- Segmentes als spezifisches Identifizierungsmuster für jedes Nukleinsäure-Segment dienen.
20. Verwendung der Methode gemäß Ansprüche 1 bis 15 um DNA-Sequenzen multipler Individuen simultan in einem Gefäß und in einem Vorgang durchzuführen.
EP99929095A 1998-05-06 1999-05-03 Methode zur identifizierung und darstellung interindividueller dna-sequenzunterschiede Withdrawn EP1075550A1 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE19821114A DE19821114A1 (de) 1998-05-06 1998-05-06 Methode zur Identifizierung und Darstellung interindividueller DNA-Sequenzunterschiede
DE19821114 1998-05-06
PCT/DE1999/001385 WO1999057308A1 (de) 1998-05-06 1999-05-03 Methode zur identifizierung und darstellung interindividueller dna-sequenzunterschiede

Publications (1)

Publication Number Publication Date
EP1075550A1 true EP1075550A1 (de) 2001-02-14

Family

ID=7867445

Family Applications (1)

Application Number Title Priority Date Filing Date
EP99929095A Withdrawn EP1075550A1 (de) 1998-05-06 1999-05-03 Methode zur identifizierung und darstellung interindividueller dna-sequenzunterschiede

Country Status (6)

Country Link
EP (1) EP1075550A1 (de)
JP (1) JP2002513915A (de)
AU (1) AU4602199A (de)
CA (1) CA2340623A1 (de)
DE (1) DE19821114A1 (de)
WO (1) WO1999057308A1 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7058517B1 (en) 1999-06-25 2006-06-06 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
US6844154B2 (en) 2000-04-04 2005-01-18 Polygenyx, Inc. High throughput methods for haplotyping
US6931326B1 (en) 2000-06-26 2005-08-16 Genaissance Pharmaceuticals, Inc. Methods for obtaining and using haplotype data
JP2009195226A (ja) * 2008-01-25 2009-09-03 Food & Agricultural Materials Inspection Center 動物由来dna検出用プライマー配列

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4942124A (en) * 1987-08-11 1990-07-17 President And Fellows Of Harvard College Multiplex sequencing
WO1996036737A1 (en) * 1995-05-19 1996-11-21 Ely Michael Rabani Parallel multiplex polynucleotide sequencing

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See references of WO9957308A1 *

Also Published As

Publication number Publication date
JP2002513915A (ja) 2002-05-14
WO1999057308A1 (de) 1999-11-11
DE19821114A1 (de) 1999-11-11
CA2340623A1 (en) 1999-11-11
AU4602199A (en) 1999-11-23

Similar Documents

Publication Publication Date Title
DE69531831T2 (de) Verfahren mit einer hohen umsatzrate für das auffinden von sequenzen oder genetischen veränderungen in nukleinsäuren
EP1232287B1 (de) Oligomer-array mit pna- und/oder dna-oligomeren auf einer oberfläche
DE69527444T3 (de) Glycosylase verwendende detektion von bestimmten nukleinsäuresequenzen
DE69627122T2 (de) Nachweis von Polymorphismus
US6156502A (en) Arbitrary sequence oligonucleotide fingerprinting
EP1204765B1 (de) Verfahren zur relativen quantifizierung der methylierung von cytosin basen in dna-proben
DE69936379T2 (de) Verfahren zur genotypisierung und dna-analyse
WO2001077384A2 (de) DETEKTION VON SNPs UND CYTOSIN-METHYLIERUNGEN
DE10019058A1 (de) Detektion von Variationen des DNA-Methylierungsprofils
DE60213803T2 (de) Happier mapping
JPH08510910A (ja) ヒトゲノムの延長ヌクレオチド反復配列の直接検出
DE10119468A1 (de) Mikroarray-Verfahren zur Anreicherung von DNA-Fragmenten aus komplexen Mischungen
EP1366195B1 (de) Verfahren zur detektion von nukleinsäuremolekülen
EP1075550A1 (de) Methode zur identifizierung und darstellung interindividueller dna-sequenzunterschiede
Knoll et al. Sequence‐based, in situ detection of chromosomal abnormalities at high resolution
EP1947196A1 (de) Verfahren zur amplifikation mehrerer nukleinsäuresequenzen zur differenzierung
WO2009106322A1 (de) Verfahren zur anreicherung oder analyse von dna fragmenten aus einer komplexen genomischen dna probe
Singh DNA profiling and its applications
EP1289646A2 (de) Verfahren und vorrichtung zur synthese und analyse von trägergebundenen arrays von oligomeren, insbesondere von primerpaaren für die pcr, sowie träger mit oligomeren
Brookes et al. Cloning the shared components of complex DNA resources
DE10245145B4 (de) Verfahren zum Nachweis von SNPs auf polydimensionalen Microarrays
WO2005078132A2 (en) OLIGONUCLEOTIDE PROBES FOR DIAGNOSIS AND IDENTIFICATION OF THE DIFFERENT FORMS OF β-THALASSEMIA, METHODS AND DIAGNOSTIC KIT THEREOF
DE19963536C2 (de) Verfahren zur Analyse von Nukleinsäuresequenzen
DE10021204A1 (de) Verfahren zur hochparallelen Analyse von Polymorphismen
KR20030050478A (ko) 다중 중합효소 연쇄반응에 의한 mody3유전자의 증폭을 위한 프라이머 세트

Legal Events

Date Code Title Description
PUAI Public reference made under article 153(3) epc to a published international application that has entered the european phase

Free format text: ORIGINAL CODE: 0009012

17P Request for examination filed

Effective date: 20001115

AK Designated contracting states

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LI LU MC NL PT SE

STAA Information on the status of an ep patent application or granted ep patent

Free format text: STATUS: THE APPLICATION IS DEEMED TO BE WITHDRAWN

18D Application deemed to be withdrawn

Effective date: 20021203