DE69928688T2 - Verfahren zur identifizierung von punkt mutationen in einem genom - Google Patents

Verfahren zur identifizierung von punkt mutationen in einem genom Download PDF

Info

Publication number
DE69928688T2
DE69928688T2 DE69928688T DE69928688T DE69928688T2 DE 69928688 T2 DE69928688 T2 DE 69928688T2 DE 69928688 T DE69928688 T DE 69928688T DE 69928688 T DE69928688 T DE 69928688T DE 69928688 T2 DE69928688 T2 DE 69928688T2
Authority
DE
Germany
Prior art keywords
population
gene
point mutations
mutations
der
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE69928688T
Other languages
English (en)
Other versions
DE69928688D1 (de
Inventor
William G. Thilly
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Massachusetts Institute of Technology
Original Assignee
Massachusetts Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Massachusetts Institute of Technology filed Critical Massachusetts Institute of Technology
Application granted granted Critical
Publication of DE69928688D1 publication Critical patent/DE69928688D1/de
Publication of DE69928688T2 publication Critical patent/DE69928688T2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6858Allele-specific amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Nitrogen And Oxygen Or Sulfur-Condensed Heterocyclic Ring Systems (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

  • Staatliche Förderung
  • Die Erfindung wurde insgesamt oder zum Teil durch die Fördergelder P30-ES02109, P01-ES07168 und P42-ES04675 aus den Fördergeldern des „National Institute of Environmental Health Sciences", USA, gefördert. Die US-Regierung hat bestimmte Rechte an der Erfindung.
  • Stand der Technik
  • Im letzten Jahr hat das „National Institute of Health" (USA) 36 Millionen $ für ein Drei-Jahres-Programm zum Auffinden von 100 000 menschlichen Einzelnucleotid-Polymorphismen („single nucleotide polymorphisms", SNPs) zugeteilt (Masood, 1999). Das SNP-Konsortium, eine Gruppe von öffentlichen und privaten Institutionen, hat außerdem 45 Millionen $ für ein Projekt bereitgestellt, um in zwei Jahren 300 000 SNPs zu identifizieren (Wellcome, 1999). Verfahren, die zurzeit zum Identifizieren von Punktmutationen und anderen Punktmutationen verfügbar sind, umfassen Einzelstrang-Konformations-Polymorphismus („single strand conformation polymorphism", SSCP) (Orita et al., 1989), Restriktionsfragment-Längenpolymorphismus („restriction fragment length polymorphism", RFLP) (Arnheim et al., 1985), Längenpolymorphismus amplifizierter Fragmente („amplified fragment length polymorphism", AFLP) (Yunis et al., 1991), Mikro- und Minisatelliten-Variation (Koreth et al., 1996), Allel-spezifische Hybridisierung (Shuber et al., 1997), denaturierende Gradienten-Gel-Elektrophorese (DGGE) (Guldberg und Guttler, 1993), DNA-Chips mit Nachweis durch Fluoreszenz oder Massenspektrometrie (Chee et al., 1996; Cargill et al., 1999; Hacia et al., 1999; Griffin et al., 1999; Li et al., 1999) und direkte Sequenzierung. Eine weitere Vorgehensweise ist die direkte Sequenzierung des Genoms.
  • Bei allen vorstehend aufgezählten Verfahren ist es erforderlich, jedes Individuum oder kleine Pools von höchstens etwa einem Dutzend Individuen zu testen (Trulzsch et al., 1999). Da die Kosten pro Individuum nicht gerade gering sind, hat dies zur Folge, dass die Entdeckung von Mutationen in großen Populationen sehr teuer ist. Jedoch sind solche Untersuchungen erforderlich, um Punktmutationen, die mit einer geringen Häufigkeit auftreten, mit einer geeigneten statistischen Genauigkeit zu bestimmen (Hagmann, 1999).
  • Ein Bedarf besteht für ein Verfahren zur Identifizierung von mit geringer Häufigkeit auftretenden, ererbten Punktmutationen in großen Populationen.
  • Zusammenfassung der Erfindung
  • Gemäß einem Aspekt der vorliegenden Erfindung wird ein Verfahren zur Identifizierung von Genen bereitgestellt, welche ein Allel enthalten, das die Langlebigkeit erhöht, umfassend:
    • (a) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (b) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (c) Vergleich der summierten Häufigkeit der Punktmutationen, welche in einem ausgewählten Gen oder Genteilstück der jungen Population gefunden werden, wie in (a) berechnet, mit der summierten Häufigkeit der Punktmutationen, welche im gleichen Gen oder Genteilstück der älteren Population gefunden werden, wie in (b) berechnet,
    wobei eine signifikante Erhöhung der summierten Häufigkeit der Punktmutationen in der älteren Population anzeigt, dass das ausgewählte Gen ein Allel oder Allele enthält, welche die Langlebigkeit erhöhen.
  • Gemäß einem weiteren Aspekt der vorliegenden Erfindung wird ein Verfahren zur Identifizierung von Genen bereitgestellt, welche ein Allel enthalten, das die Langlebigkeit erhöht, oder welche an ein Gen gekoppelt sind, das die Langlebigkeit erhöht, umfassend:
    • (a) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, welche nicht von einer Krankheit betroffen sind, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche in jedem Gen oder Segment davon identifiziert werden;
    • (b) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von Testpersonen gefunden werden, welche die Krankheit haben, und Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment davon identifiziert werden;
    • (c) Vergleich der summierten Häufigkeit der Punktmutationen, welche in einem ausgewählten Gen oder Genteilstück der jungen Population gefunden werden, wie in (a) bestimmt, mit der summierten Häufigkeit der Punktmutationen, welche in dem ausgewählten Gen der Population von Testpersonen gefunden werden, wie in (b) bestimmt,
    wobei eine signifikante Erhöhung der summierten Häufigkeit der Punktmutationen in der jungen Population anzeigt, dass das ausgewählte Gen ein Allel enthält, das die Langlebigkeit erhöht, oder an ein Gen gekoppelt ist, das die Langlebigkeit erhöht.
  • Außerdem wird ein Verfahren zur Identifizierung ererbter Punktmutationen in einer Zielregion eines Genoms offenbart, umfassend das Bereitstellen eines Pools von DNA-Fragmenten, die aus einer Population isoliert wurden, und
    • (a) Amplifizieren der Zielregion jedes dieser Fragmente in einer „high fidelity"-Polymerase-Kettenreaktion (PCR) unter Bedingungen, die für die Herstellung von doppelsträngigen DNA-Produkten geeignet sind, welche eine terminale Hochtemperatur-„isomelting"-Domäne enthalten, die mit einer nachweisbaren Markierung markiert ist, und wobei der mutierte Anteil jeder PCR-induzierten Mutation nicht größer als etwa 5 × 10–5 ist;
    • (b) Schmelzen und erneutes Annealing des Produkts von (a) unter Bedingungen, die geeignet sind, eine doppelsträngige DNA zu bilden, wodurch ein Gemisch aus Wildtyp-Homodoppelsträngen („homoduplexes") und Heterodoppelsträngen („heteroduplexes"), die Punktmutationen enthalten, gebildet wird;
    • (c) Abtrennen der Heterodoppelstränge von den Homodoppelsträngen aufgrund der unterschiedlichen Schmelztemperaturen der Heterodoppelstränge und der Homodoppelstränge und Gewinnen der Heterodoppelstränge, wodurch ein zweiter Pool von DNA erzeugt wird, der in Zielregionen, welche Punktmutationen enthalten, angereichert ist;
    • (d) Amplifizieren des zweiten Pools in einer „high fidelity"-PCR unter Bedingungen, unter denen nur eine Homoduplex-doppelsträngige DNA produziert wird, wodurch ein Gemisch aus einer homodoppelsträngigen DNA, die eine Wildtyp-Zielregion enthält, und homodoppelsträngige DNAs, welche Zielregionen enthalten, die Punktmutationen umfassen, hergestellt wird;
    • (e) Auftrennen der homodoppelsträngigen DNAs, welche Zielregionen enthalten, die Punktmutationen umfassen, aufgrund der unterschiedlichen Schmelztemperaturen der DNAs und Gewinnen der aufgetrennten DNAs, welche eine Zielregion enthalten, die Punktmutationen umfasst; und
    • (f) Sequenzieren der Zielregion der gewonnenen DNAs, welche eine Zielregion enthalten, die Punktmutationen umfasst.
  • In bestimmten Verfahren kann die Population mindestens etwa 1000 oder mindestens etwa 10 000 Individuen umfassen. In einem ganz besonderen Verfahren kann die Population zwischen etwa 10 000 und 1 000 000 Individuen umfassen. In weiteren Verfahren besteht die Population aus Mitgliedern der gleichen demographischen Gruppe, z.B. Gruppen europäischer Abstammung, afrikanischer Abstammung, asiatischer Abstammung oder indischer Abstammung. In einem bevorzugten Verfahren ist der Pool von Fragmenten mit Fragmenten angereichert, welche die Zielregion enthalten. Die Heterodoppelstränge können von den Homodoppelsträngen in (c) abgetrennt werden, und die homodoppelsträngigen DNAs können in (d) durch eine konstante denaturierende Gel-Kapillar-Elektrophorese, konstante denaturierende Gel-Elektrophorese, denaturierende Gradienten-Gel-Elektrophorese oder denaturierende Hochleistungs-Flüssigkeits-Chromatographie aufgelöst werden. Die Zielregion kann eine beliebige gewünschte Region des Genoms sein, z.B. ein Teil eines Protein- oder RNA-codierenden Gens. Die Zielregion kann etwa 80 bis etwa 3000 Basenpaare (bp) umfassen. In einem Verfahren ist die Zielregion eine „isomelting"-Domäne. In anderen Verfahren weist die Zielregion etwa 80 bis etwa 1000 bp oder etwa 100 bis etwa 500 bp auf.
  • Außerdem werden Verfahren zur Identifizierung von Genen offenbart, welche ein schädliches Allel enthalten. In einem bestimmten Verfahren umfasst das Verfahren:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (c) Vergleich der summierten Häufigkeit der Punktmutationen, welche in einem ausgewählten Gen oder Genteilstück der jungen Population gefunden werden, wie in (a) berechnet, mit der summierten Häufigkeit der Punktmutationen, welche im gleichen Gen oder Genteilstück der älteren Population gefunden werden, wie in (b) berechnet, wobei eine signifikante Verringerung der summierten Häufigkeit der Punktmutationen in der älteren Population anzeigt, dass das ausgewählte Gen ein schädliches Allel enthält.
  • In einem weiteren Verfahren umfasst das Verfahren zur Identifizierung von Genen, welche ein schädliches Allel enthalten:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt; und
    • (c) Vergleich der Häufigkeit von jeder Punktmutation, die in einem ausgewählten Gen oder Genteilstück der jungen Population identifiziert wird, wie in (a) bestimmt, mit der Häufigkeit der gleichen Punktmutationen, welche im gleichen ausgewählten Gen der älteren Population identifiziert werden, wie in (b) bestimmt, wobei eine signifikante Verringerung der Häufigkeit von zwei oder mehreren Punktmutationen in dem ausgewählten Gen der älteren Population im Vergleich zu dem ausgewählten Gen der jungen Population anzeigt, dass das ausgewählte Gen ein schädliches Allel enthält.
  • In einem bestimmten Verfahren umfasst das Verfahren weiterhin:
    • (d) Bestimmung der Häufigkeit der zwei oder mehreren Punktmutationen, welche in der älteren Population abnehmen, in dem ausgewählten Gen von einer oder mehreren altersspezifischen Populationen mittleren Alters;
    • (e) Bestimmung der altersspezifischen Abnahme der zwei oder mehreren Punktmutationen; und
    • (f) Vergleich der altersspezifischen Abnahme, wie in (e) bestimmt, mit der theoretischen altersspezifischen Abnahme von schädlichen Allelen, die tödliche Krankheiten verursachen, X(h, t), und Bestimmung, ob die Funktionen signifikant verschieden sind, wobei eine Bestimmung, dass die altersspezifische Abnahme, wie in (e) bestimmt, nicht signifikant verschieden ist von der theoretischen altersspezifischen Abnahme von schädlichen Allelen, die eine oder mehrere tödliche Krankheiten verursachen, weiterhin anzeigt, dass das ausgewählte Gen ein schädliches Allel enthält und dass eine hohe Wahrscheinlichkeit besteht, dass es ursächlich für die eine oder die mehreren tödlichen Krankheiten ist.
  • In weiteren Verfahren umfasst das Verfahren ferner:
    • (g) Bestimmung der Häufigkeit der zwei oder mehreren Punktmutationen, welche in der älteren Population abnehmen, in dem ausgewählten Gen von einer oder mehreren Populationen von Testpersonen; und
    • (h) Vergleich der Häufigkeiten der zwei oder mehreren Punktmutationen in dem ausgewählten Gen oder Genteilstück in der jungen Population mit den Häufigkeiten der zwei oder mehreren Punktmutationen in dem ausgewählten Gen oder Genteilstück in den Populationen von Testpersonen; wobei eine signifikante Erhöhung der Häufigkeiten der einen oder mehreren Punktmutationen in der Population der Testpersonen im Vergleich zur jungen Population anzeigt, dass das Gen ein schädliches Allel enthält, welches bei der Krankheit eine ursächliche Rolle spielt; oder
    • (g) Bestimmung der Häufigkeit der zwei oder mehreren Punktmutationen, die in der älteren Population abnehmen, in dem ausgewählten Gen von einer oder mehreren Populationen von Testpersonen, die aus Individuen mit einer frühzeitig auftretenden Krankheit bestehen; und
    • (h) Vergleich der Häufigkeiten der zwei oder mehreren Punktmutationen in dem ausgewählten Gen oder Genteilstück in der jungen Population mit den Häufigkeiten der zwei oder mehreren Punktmutationen in dem ausgewählten Gen oder Genteilstück in den Populationen von Testpersonen; wobei eine signifikante Erhöhung der Häufigkeiten der einen oder mehreren Punktmutationen in der Population von Testpersonen im Vergleich zur jungen Population anzeigt, dass das Gen ein schädliches Allel enthält, welches einen sekundären Risikofaktor darstellt, der den Ausbruch der Krankheit beschleunigt.
  • Außerdem werden Verfahren zur Identifizierung von Genen offenbart, welche ein schädliches Allel enthalten oder welche an ein Gen gekoppelt sind, das ein schädliche Allel enthält. Ein bestimmtes Verfahren umfasst:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt;
    • (c) Vergleich der Häufigkeit von jeder Punktmutation, welche in einem ausgewählten Gen oder Genteilstück der jungen Population identifiziert wird, wie in (a) bestimmt, mit der Häufigkeit der gleichen Punktmutationen, welche in dem ausgewählten Gen der älteren Population identifiziert wird, wie in (b) bestimmt, wobei eine signifikante Verringerung der Häufigkeit einer Punktmutation in dem ausgewählten Gen der älteren Population im Vergleich zu dem ausgewählten Gen der jungen Population anzeigt, dass das ausgewählte Gen ein schädliches Allel enthält oder an ein Gen gekoppelt ist, das ein schädliches Allel enthält.
  • Außerdem wird ein Verfahren zur Identifizierung von Genen offenbart, welche ein schädliches Allel enthalten oder welche an ein Gen gekoppelt sind, das ein schädliches Allel enthält, umfassend:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von Testpersonen mit frühzeitigem Ausbruch gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von Testpersonen mit spätem Ausbruch gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt;
    • (c) Vergleich der Häufigkeiten der Punktmutationen, die in einem ausgewählten Gen oder Genteilstück der Population von Testpersonen mit frühzeitigem Ausbruch gefunden werden, mit den Häufigkeiten der gleichen Punktmutationen in dem ausgewählten Gen oder Genteilstück der Population von Testpersonen mit spätem Ausbruch, wobei eine signifikante Erhöhung der Häufigkeiten von einer oder mehreren Punktmutationen in der Population von Testpersonen mit frühzeitigem Ausbruch im Vergleich zur Population von Testpersonen mit spätem Ausbruch anzeigt, dass das Gen ein schädliches Allel enthält, welches einen sekundären Risikofaktor darstellt, der den Ausbruch der Krankheit beschleunigt.
  • Außerdem werden Verfahren zur Identifizierung von Genen offenbart, die ein schädliches Allel enthalten, welches einen sekundären Risikofaktor darstellt, der den Ausbruch einer Krankheit beschleunigt.
  • Ein bestimmtes Verfahren umfasst:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von Testpersonen mit frühzeitigem Ausbruch gefunden werden, Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeit aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von Testpersonen mit spätem Ausbruch gefunden werden, Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeit aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (c) Vergleich der summierten Häufigkeit der Punktmutationen, welche in einem ausgewählten Gen oder Genteilstück der Population von Testpersonen mit frühzeitigem Ausbruch gefunden werden, wie in (a) berechnet, mit der summierten Häufigkeit der Punktmutationen, welche im gleichen Gen oder Genteilstück der Population von Testpersonen mit spätem Ausbruch gefunden werden, wie in (b) berechnet, wobei eine signifikante Verringerung der summierten Häufigkeit der Punktmutationen in der Population von Testpersonen mit spätem Ausbruch anzeigt, dass das ausgewählte Gen ein schädliches Allel enthält, welches einen sekundären Risikofaktor darstellt, der den Ausbruch einer Krankheit beschleunigt.
  • Außerdem wird ein Verfahren zur Identifizierung von Genen offenbart, welche ein Allel enthalten, das die Langlebigkeit erhöht, umfassend:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, und Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden;
    • (c) Vergleich der summierten Häufigkeit der Punktmutationen, welche in einem ausgewählten Gen oder Genteilstück der jungen Population gefunden werden, wie in (a) bestimmt, mit der summierten Häufigkeit der Punktmutationen, welche im gleichen Gen oder Genteilstück der älteren Population gefunden werden, wie in (b) bestimmt, wobei eine signifikante Erhöhung der summierten Häufigkeit der Punktmutationen in der älteren Population anzeigt, dass das ausgewählte Gen ein Allel enthält, welches die Langlebigkeit erhöht.
  • In einem weiteren Verfahren umfasst das Verfahren zur Identifizierung von Genen, welche ein Allel enthalten, das die Langlebigkeit erhöht:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, und Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, und Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt; und
    • (c) Vergleich der Häufigkeit jeder Punktmutation, welche in einem ausgewählten Gen oder Genteilstück der jungen Population identifiziert wird, wie in (a) bestimmt, mit der Häufigkeit der gleichen Punktmutationen, welche in dem ausgewählten Gen der älteren Population identifiziert werden, wie in (b) bestimmt, wobei eine signifikante Erhöhung der Häufigkeit von zwei oder mehreren Punktmutationen in dem ausgewählten Gen der älteren Population im Vergleich zu dem ausgewählten der jungen Population anzeigt, dass das ausgewählte Gen ein Allel enthält, welches die Langlebigkeit erhöht.
  • In einem weiteren Verfahren umfasst das Verfahren zur Identifizierung von Genen, welche ein Allel enthalten, das die Langlebigkeit erhöht, oder welche an ein Gen gekoppelt sind, das die Langlebigkeit erhöht:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, und Bestimmung der Häufigkeit, mit der jede Punktmutation auftritt;
    • (c) Vergleich der Häufigkeit von jeder Punktmutation, die in einem ausgewählten Gen oder Genteilstück der jungen Population identifiziert wird, wie in (a) bestimmt, mit der Häufigkeit der gleichen Punktmutationen, welche in dem ausgewählten Gen der älteren Population identifiziert werden, wie in (b) bestimmt, wobei eine signifikante Erhöhung der Häufigkeit einer Punktmutation in dem ausgewählten Gen der älteren Population im Vergleich zu dem ausgewählten Gen der jungen Population anzeigt, dass das ausgewählte Gen ein Allel enthält, welches die Langlebigkeit erhöht, oder an ein Gen gekoppelt ist, welches die Langlebigkeit erhöht.
  • Außerdem wird ein Verfahren zur Identifizierung von Genen offenbart, welche die Inzidenz einer Krankheit beeinflussen, umfassend:
    • (a) Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, welche nicht von der Krankheit betroffen sind, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche in jedem Gen oder Segment davon identifiziert werden;
    • (b) Identifizierung der ererbten Punktmutationen, welche in den Genen oder Genteilstücken einer Population von Testpersonen gefunden werden, welche die Krankheit haben, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche in jedem Gen oder Segment davon identifiziert werden;
    • (c) Vergleich der summierten Häufigkeit der Punktmutationen in einem ausgewählten Gen oder Genteilstück in der jungen Population mit der summierten
  • Häufigkeit der Punktmutationen in dem ausgewählten Gen oder Genteilstück in der Population von Testpersonen; wobei eine signifikante Erhöhung der summierten Häufigkeit der Punktmutationen in der Population von Testpersonen anzeigt, dass das Gen bei der Krankheit eine ursächliche Rolle spielt.
  • Außerdem werden Verfahren zur Identifizierung eines Gens offenbart, welches deletäre Allele enthält. Ein bestimmtes Verfahren umfasst:
    • (a) Identifizierung der ererbten Punktmutationen, die in einem beliebigen (in beliebigen) Exon(s) und Spleißstellen des Gens einer Population von jungen Individuen identifiziert werden;
    • (b) Identifizierung der Untergruppe von Punktmutationen in (a), die obligatorische Knock-out-Punktmutationen sind, und Bestimmung der Häufigkeiten, mit denen jede obligatorische Knock-out-Punktmutation auftritt; und
    • (c) Summierung der Häufigkeit aller obligatorischen Knock-out-Punktmutationen, die in dem Gen identifiziert werden; wobei eine summierte Häufigkeit von weniger als etwa 2% anzeigt, dass das Gen ein deletäres Allel enthält.
  • Ein weiteres Verfahren umfasst:
    • (a) Identifizierung der ererbten Punktmutationen, die in einem beliebigen (in beliebigen) Exon(s) und Spleißstellen des Gens einer Population von jungen Individuen auftreten:
    • (b) Identifizierung der Untergruppe von Punktmutationen in (a), die obligatorische Knock-out-Punktmutationen sind, und Bestimmung der Häufigkeiten, mit denen jede obligatorische Knock-out-Punktmutation auftritt;
    • (c) Identifizierung der Untergruppe von Punktmutationen in (a), die mutmaßliche Knock-out-Punktmutationen sind, und Bestimmung der Häufigkeiten, mit denen jede mutmaßliche Knock-out-Punktmutation auftritt; und
    • (d) Summierung der Häufigkeit aller obligatorischen Knock-out-Punktmutationen und mutmaßlichen Knock-out-Punktmutationen, die in dem Gen identifiziert werden; wobei eine summierte Häufigkeit von weniger als etwa 2% anzeigt, dass das Gen ein deletäres Allel enthält.
  • In einem bestimmten Verfahren zeigt eine Summe von etwa 0,02% bis etwa 2% an, dass das Gen ein rezessives deletäres Allel enthält. In einem anderen Verfahren zeigt eine Summe von weniger als etwa 0,02% an, dass das Gen ein dominantes deletäres Allel enthält. Eine Summe von größer als 2% legt nahe, dass das Gen keine deletären Allele enthält.
  • Außerdem werden Verfahren zur Isolierung und Identifizierung einer Zielregion eines Genoms offenbart, die ererbte Punktmutationen enthält.
  • Außerdem wird eine isolierte Nucleinsäure offenbart, die zu einem Strang eines Gens oder Allel davon komplementär ist, das durch die hier beschriebenen Verfahren identifiziert wird.
  • Außerdem werden Anordnungen („Arrays") von isolierten Nucleinsäuren wie hier beschrieben, die an einem festen Träger immobilisiert sind, offenbart.
  • Ferner werden isolierte Nucleinsäuren und ein Array von isolierten Nucleinsäuren wie hier beschrieben für die Verwendung in der Therapie (umfassend Prophylaxe) oder Diagnose und die Verwendung solcher Nucleinsäuren für die Herstellung eines Medikaments zur Behandlung einer bestimmten Krankheit oder eines bestimmten Zustands wie hier beschrieben offenbart.
  • Kurze Beschreibung der Zeichnungen
  • 1 ist eine schematische Darstellung einer mehrstufigen Krebshypothese für eine sporadisch auftretende Krebserkrankung (Herrero-Jimenez et al., 1998), wobei der Verlust beider Allele des ersten „Gatekeeper"- („Pförtner-") Gens „GK" und des restlichen aktiven Allels des zweiten „Gatekeeper"-Gens „A" die Geschwindigkeits-begrenzenden Ereignisse darstellen. Von einer ererbten Mutation im Gen „GK" würde man erwarten, dass sie zu einer familiären Krebserkrankung mit frühzeitigem Ausbruch führt, während durch eine ererbte inaktivierende Mutation in dem einen Allel des Gens „A" ein Risiko entsteht, dass der Betroffene an einer sporadisch auftretenden Krebserkrankung sterben wird.
  • 2A ist eine grafische Darstellung, welche die altersabhängige Mortalität durch Pankreaskrebs, OBS(h, t), für europäisch-amerikanische Männer, geboren in den Jahren 1900 bis 1909, zeigt. Die gefüllten Quadrate stellen die tatsächlichen Werte dar. Die durchgezogene Linie zeigt das Modell, das in Herrero-Jimenez et al., 1998, aufgestellt wird.
  • 2B ist eine grafische Darstellung, welche den erwarteten altersabhängigen überlebenden Anteil mit Risiko, X(h, t), für Pankreaskrebs in dieser allgemeinen Population zeigt.
  • Die 3A bis 3F sind Histogramme, welche die erwartete Zahl von Individuen ±2 SD mit einem bestimmten Polymorphismus bei gegebenen Populationsgrößen von 1000 (3A bis 3C) und 10 000 (3D bis 3F) für die hypothetischen Situationen von monogenen (3A und D), multigenen (n = 5) (3B3E) und polygenen (n = 2) (3C3F) Risiken für Pankreaskrebs zeigen, die für Populationen von 10 000 im vorausgehenden Abschnitt analysiert wurden. Es ist ersichtlich, dass man bei einer Probe von 1000 eine Unterscheidung zwischen Populationen von Neugeborenen, Testpersonen und Hundertjährigen bezüglich eines Polymorphismus, der im Fall einer einfachen monogenen Vererbung mit einer erwarteten Häufigkeit auftritt, mit einem Vertrauenskoeffizient von 95% machen könnte, nicht jedoch bei multigenen oder polygenen Risikofaktoren. Die Zahl der Gene, die an jedem dieser Fälle beteiligt sind, ist mit n bezeichnet. Diese Vertrauensgrenzen beziehen sich auf den Fall von einer einzigen und nur einer Punktmutation, wobei die drei Populationsgruppen verglichen werden.
  • 4 ist eine grafische Darstellung, welche zeigt, dass die Zahl der europäisch-amerikanischen Frauen (EAF) und der europäisch-amerikanischen Männer (EAM), die ein Alter von 100+ Jahren erreichen, in den Vereinigen Staaten Jahr für Jahr zunimmt (Census, 1900–1936; DHHS, 1937–1992).
  • Die 5A und 5B sind grafische Darstellungen von Alters- und Geburtsjahr-spezifischen Mortalitätskurven bei Darmkrebs für EAM (5A) und EAF (5B) (Daten registriert 1930–1992).
  • Die 6A und 6B sind grafische Darstellungen von Alters- und Geburtsjahr-spezifischen Mortalistätskurven bei Darmkrebs für nicht-europäisch-amerikanische Männer (NEAM) (6A) und nicht-europäisch-amerikanische Frauen, hauptsächlich afrikanisch-amerikanischer Abstammung, (NEAF) (6B), (Daten registriert 1930–1992).
  • Die 7A und 7B sind grafische Darstellungen, die altersspezifische relative Überlebensraten bei Colonkrebs für europäisch-amerikanische Frauen, bezogen auf das Jahr der Diagnose (7A) und auf das Jahr der Geburt (7B), zeigen.
  • 8 ist eine grafische Darstellung, die den prozentualen Anteil aller Todesfälle mit unbestimmter Diagnose für europäisch-amerikanische Männer im Alter von 50 bis 54, 75 bis 79 und 90 bis 94 als Funktion ihres Geburtsjahrs zeigt.
  • Die 9A und 9B sind grafische Darstellungen von Alters- und Geburtsjahr-spezifischen Mortalitätskurven bei Colonkrebs, die mit historischen Veränderungen in der Unterbewertung (zu wenig Fälle werden registriert, „underreporting") und in den Überlebensraten bei europäisch-amerikanischen Männern (9A) und europäisch-amerikanischen Frauen (9B) abgeglichen wurden. OBS·(h, t) = OBS(h, t) ÷ [R(h, t) (1 – S(h, t))].
  • Die 10A und 10B sind grafische Darstellungen von Alters- und Geburtsjahr-spezifischen Mortalitätskurven bei Colonkrebs, die mit historischen Veränderungen in der Unterbewertung („underreporting") und in den Überlebensraten bei nicht-europäisch-amerikanischen Männern (10A) und nicht-europäisch-amerikanischen Frauen (10B) abgeglichen wurden. OBS·(h,t) = oBS(h, t) ÷ [R(h, t) (1 – s(h, t))].
  • Die 11A und 11B sind grafische Darstellungen der Masse von Männern (11A) oder Frauen (11B) als Funktion des Alters (Hamill, P. V., et al., Am. J. Clin. Nutr. 32 (3): 607–629, 1979).
  • 12 ist eine Darstellung des mutierten Anteils des hprt-Locus als Funktion des Alters (n = 740); die Steigung der Linie stellt 2,1 × 10–7 hprt-Mutationen pro Zelljahr dar.
  • 13 ist eine grafische Darstellung, welche die Alters- und Geburtsjahr-spezifische Mortalität bei Hodenkrebs für EAM zeigt.
  • 14 ist eine Darstellung als Venn-Diagramm einer Population mit Risiko, F(h, t), welche als Schnittmenge der Population mit einem primären genetischen Risiko (G) und der Population mit einem primären umweltbedingten Risiko (Eh) vorliegt.
  • 15 ist eine grafische Darstellung, wobei die Parameter (Fh, κh) und Δh für das Modell n = 2 in EAM der 1870er Jahre bestimmt werden.
  • 16 ist eine grafische Darstellung, welche die Bestimmung des Integrals von OBSR(h, t) = OBS(h, t) ÷ R(h, t) zeigt. Die leeren Symbole stellen Extrapolationen der für die Annäherung verwendeten Werte dar.
  • 17 ist eine grafische Darstellung, welche die Bestimmung von (α – β) aus der Steigung von log2 Δ(OBS·(h, t)) ÷ Δt zeigt. Die verwendeten Werte gelten für EAM, geboren in den 1920er Jahren, Alter 17,5 bis 57,5 Jahre.
  • 18 ist eine schematische Darstellung, die ein Modell für sporadisch auftretenden Colonkrebs für den Fall zeigt, wenn n = 2 und m = 1. Die Initiation ist im Modell als Verlust der Funktion eines/jedes der APC-Allele („of either APC allele"), gefolgt vom Verlust der Heterozygotie des zweiten Allels, dargestellt. Die Promotion erfolgt im Modell als Verlust der Heterozygotie für beliebige Vertreter aus einem Satz von sekundären „Gatekeeper"-Genen. Das primäre genetische Risiko ist in diesem Beispiel als eine ererbte Heterozygotie für ein beliebiges sekundäres „Gatekeeper"-Gen für Colonkrebs definiert.
  • Die 19A und 19B sind grafische Darstellungen, welche den Anteil von EAM, EAF, NEAM und NEAF mit einem primären Risiko für Colonkrebs, Fh, (19A) und die Initiations-Mutationsrate, ri, (19B) als Funktion des Geburtsjahrs zeigen.
  • Die 20A und 20B sind grafische Darstellungen, welche die Promotions-Mutationsrate, rA, (20A) und die Adenom-Wachstumsrate, (α – β), (20B) für EAM, EAF, NEAM und NEAF als Funktion des Geburtsjahrs zeigen.
  • 21 ist ein Diagramm der Promotion für „m" erforderliche Ereignisse.
  • Die 22A und 22B sind Elektropherogramme, welche die Empfindlichkeit des Verfahrens zum Nachweis von ererbten Punktmutationen zeigen. Die konstante denaturierende Kapillar-Elektrophorese („constant denaturing capilary electrophoresis", CDCE) zeigt den Hintergrund (22A) und die Spektren der MNNG-induzierten Mutationen (22B) im APC-Gen in menschlichen MT1- Zellen. Jeder numerierte und mit Buchstaben versehene Peak ist eine einzelne mutierte Sequenz, die isoliert und sequenziert wurde. Obere Abbildung: Die Mutanten a bis n sind alle Transversionen von G/C → T/A im Hintergrund, die durch einen Pfu-DNA-Polymerase-Fehler zustande kommen. Hierdurch entsteht das „Rauschen" aus der PCR. 22B: Die Mutanten 1 bis 15 sind fast alle Transitionen von G/C → A/T (1, 10 und 12 sind Transversionen von G/C → T/A). Die gemessenen Peaks der mutierten Anteile, z.B. in den Peaks a bis n, liegen im Bereich von 0,5 bis 2 × 10–6. Die Anteile der echten Mutanten über diesem Hintergrund werden festgestellt, isoliert und sequenziert, wie für die MNNG-induzierten Mutanten 1 bis 15 zu sehen ist.
  • Die 23A bis 23B sind Elektropherogramme, welche die Isolierung von pBR322 HinfI-Restriktionsspaltungsfragmenten unter Verwendung einer automatischen Fraktionssammlung zeigt. 23A zeigt die Aufzeichnung des Nachweises der Laser-induzierten Fluoreszenz (LIF) bei der Trennung der Fragmente in einer der Kapillaren des Array. Die Fraktionen wurden in den Zeitintervallen gesammelt, die durch die senkrechten Markierungen auf dem Elektropherogramm angegeben sind. 23B zeigt die Aufzeichnungen des LIF-Nachweises der Fraktionen, die aus der Gel-Sammelplatte mit Vertiefungen, wie in 23A verwendet, gewonnen und erneut injiziert wurden. Der außerhalb der Skala liegende Peak entspricht dem Fluorescein, das als innerer Standard eingesetzt wurde. Die gesammelten Fraktionen wurden vor der erneuten Injektion Membranentsalzt.
  • 24 stellt eine Serie von Elektropherogrammen dar, die das CDCE LIF-Ergebnis von Läufen von vier vereinigten („gepoolten") Proben zeigen, die in Tabelle 7 verwendet werden. Eine Sequenz des APC-Exons 15 ist als Beispiel dargestellt. An der linken Seite sieht man die PCR-Primer und den Peak des inneren Standards, gefolgt von dem großen Wildtyp-Peak und danach dem Peak der ererbten Punktmutante. Die Mutation ist eine Transversion von G → T am bp 8634. In dieser Form der Probenpräsentation liegen alle Sequenzen als homodoppelsträngige Form vor, somit liegt eine Mutante als ein einzelner Peak mit einer anderen Schmelztemperatur als der des Wildtyps oder des inneren Standards vor. Dies macht die Reproduzierbarkeit des vorgeschlagenen Tests auf ererbte Punktmutanten deutlich und zeigt die Variation an, die man bei einer großen Anzahl von Proben erwarten kann, die aus der gleichen Gemeinschaft gemischter ethnischer Gruppen stammen (Boston).
  • 25 stellt eine Serie von Elektropherogrammen dar, welche die Ergebnisse von CDCE/hifiPCR-Analysen von gepoolten Proben von Jugendlichen aus zwei ethnischen Gruppen zeigen. Dabei wird gefunden, dass diese im APC-Gen Exon 15 vorliegende Transversion von G → T am bp 8634 in der afrikanisch-amerikanischen Gruppe signifikant häufiger auftritt als in der hispano-amerikanischen Gruppe.
  • Die 26A bis 26C zeigen Elektropherogramme, die bei einer Untersuchung von Blutproben von 446 afrikanisch-amerikanischen Jugendlichen erhalten wurden, die gepoolt und auf ererbte Punktmutationen im Exon 6 und 9 bp von seinen angrenzenden Spleißstellen analysiert wurden. Untersuchungen des PCR-Hintergrunds (26A) zeigten, dass ein einzelnes mutiertes Allel bei Anteilen von 5 × 10–5 oder höher nachgewiesen werden könnte. Das einleitende Scannen, bei dem echte mutierte/Wildtyp-Heterodoppelstränge mit nicht-mutierten Rausch-Peaks gemischt sind, ist in der zweiten Abbildung mit einem quantitativen inneren Kontrollpeak dargestellt (26B). Die Isolierung der rohen Heterodoppelstrang-Probe, gefolgt von einer „high fidelity"-PCR, ergab ein deutliches Elektropherogramm, das ein einziges und nur ein Paar von Peaks enthielt, das als eine Mutante in der ursprünglich gepoolten Probe entstanden sein könnte (26C). Die anschließende Isolierung und Sequenzierung zeigte, dass diese Mutante eine „Wobble"-Transition GTC GCA → GTT GCA (SEQ ID NO: 1 → SEQ ID NO: 2) (Val → Val) ist, die bisher noch nicht beschrieben wurde. Sie lag in etwa 6 × 10–3 der ursprünglichen 669 HPRT-Allele oder etwa vier mutierten Kopien vor. In der hispano-amerikanischen Gruppe (New York City) oder in der gemischten ethnischen Gruppe von 2000 Jugendlichen (Boston) lag sie nicht vor.
  • 27 stellt eine Feinstrukturkarte von ererbten Punktmutationen in den drei Exons des menschlichen Betaglobin-Gens dar. Etwa 10 000 Allele der Hanchinesischen Population wurden durchgemustert.
  • 28 zeigt eine schematische Darstellung einer Mehrkapillar-CDCE-Apparatur mit Fraktionssammler.
  • 29 stellt eine Schmelzkarte des menschlichen Gens der Uracil-DNA-Glykosylase (UNG) dar, welche die Auswahl von Zielsequenzen, die drei Exons überdecken, zeigt. Das Schmelzprofil ist nur für die ersten 7000 Basenpaare (bp) der genomischen UNG-Sequenz dargestellt.
  • 30 erläutert den Entwurf einer synthetischen DNA/RNA-Chimäre (SEQ ID NO: 3), um Codon 12 von rad54 von AAG Lysin zu TAG Stopp umzuwandeln. Die Großbuchstaben stellen DNA-Nucleotide und die Kleinbuchstaben 2'-O-Methyl-RNA-Nucleotide dar.
  • Genaue Beschreibung der Erfindung
  • Hier werden Verfahren zur Identifizierung von ererbten Punktmutationen in einer Zielregion des Genoms in einer großen Population von Individuen und zur Bestimmung, welche ererbten Punktmutationen deletär, schädlich oder nützlich sind, beschrieben. Deletäre Mutationen werden direkt durch ein Erkennungsverfahren identifiziert, wobei der Satz von Punktmutationen verwendet wird, die in einer großen Population von Jugendlichen festgestellt werden. Schädliche Mutationen werden identifiziert, indem der Satz von Punktmutationen, die in einer großen Gruppe von Jugendlichen festgestellt werden, und diejenigen, die in einer großen Gruppe von älteren Individuen der gleichen Population festgestellt werden, miteinander verglichen werden. Nützliche Mutationen werden genauso identifiziert.
  • In der Verwendung hier definiert ein Gen eine DNA-Sequenz, die Proteine, RNAs oder andere physiologisch funktionelle Strukturen codiert, welche deletäre, schädliche oder nützliche Mutationen enthalten, die durch das Vorliegen von Punktmutationen innerhalb der deletären, schädlichen oder nützlichen Mutationen identifiziert werden.
  • Die Zusammenhang zwischen schädlichen Punktmutationen und einer bestimmten Krankheit (z.B. einer tödlichen Krankheit) kann durch ein Verfahren aufgeklärt werden, wobei eine theoretische altersabhängige Abnahme von schädlichen Allelen für alle bestimmten Krankheiten und die festgestellte altersabhängige Abnahme von schädlichen Allelen eines bestimmten Gens miteinander verglichen werden.
  • Hier wird ein Verfahren zur Isolierung oder Identifizierung von ererbten Punktmutationen in einer Zielregion eines Genoms offenbart. Punktmutationen sind Mutationen, bei denen eine kleine Zahl (z.B. 1 bis 25 oder 1 bis 10 oder 1 bis 5 oder ein einzelnes Basenpaar) von Basenpaaren deletiert, addiert oder durch eine andere Base substituiert sind (z.B. Transitionen, Transversionen). Ererbte Punktmutationen sind solche, die im Genom eines Individuums bei der Empfängnis vorliegen. Im Allgemeinen ist die Sequenz der Zielregion aus öffentlichen Datenbanken, z.B. GenBank, bekannt. Geeignete Zielsequenzen können bis zu etwa 3000 Basenpaare (bp) lang sein. Zielsequenzen können aus etwa 80 bis etwa 1000 bp oder etwa 100 bis etwa 500 bp bestehen. Insbesondere bestehen Zielsequenzen aus etwa 100 bp. In einem Verfahren ist die Zielsequenz eine „isomelting"-Domäne. Geeignete Zielregionen können innerhalb des ganzen Genoms gefunden werden. Tatsächlich ist es wünschenswert, alle Punktmutationen im gesamten Genom unter Verwendung der hier beschriebenen Verfahren zu identifizieren. In bestimmten Verfahren ist die Zielregion ein Protein-codierendes Gen oder Genteilstück, oder ein RNA-codierendes Gen oder Genteilstück. Z.B. kann die Zielregion ein Exon oder ein Protein-codierendes Gen, eine regulatorische Region (z.B. Promotor), ein Intron oder ein Teil von einer der vorstehenden Regionen sein. Die Zielregion kann auch den Übergang von einem Exon zu einem Intron eines Gens überspannen. RNA-codierende Gene sind Gene, die RNA-Moleküle codieren, welche nicht zu Proteinen translatiert werden, z.B. Gene, die ribosomale RNAs, Transfer-RNAs und Ribozyme codieren.
  • Das Verfahren zur Isolierung oder Identifizierung von ererbten Punktmutationen in einer Zielregion eines Genoms umfasst die Schritte der Bereitstellung eines Pools von DNA-Fragmenten, die aus einer Population isoliert werden, und der Amplifizierung der Zielregion.
  • In der Verwendung hier bezieht sich eine Population auf die Gruppe von Individuen (z.B. Säugern, Menschen, Homo sapiens), von denen DNA-Proben genommen werden. In bestimmten Ausführungsformen besteht eine Population aus Individuen, die gemeinsame Merkmale aufweisen, z.B. Geschlecht, Rasse, Ethnizität, Alter, Krankheit oder Störung und dergleichen. Z.B. kann eine Population von Menschen eine Probe darstellen, die für alle menschlichen Bewohner der Erde repräsentativ ist, oder sie kann nur Individuen aus der gleichen demographischen Gruppe umfassen, z.B. Individuen der gleichen Rasse und/oder Ethnizität (z.B. Individuen von europäischer Abstammung, afrikanischer Abstammung, asiatischer Abstammung, indischer Abstammung, spanischer Abstammung). Es ist so zu verstehend, dass die Population aus Individuen bestehen kann, die eine Untergruppe einer größeren Population darstellen. Z.B. ist die Population von Han-Chinesen in der Population von Individuen asiatischer Abstammung enthalten.
  • Populationen von Testpersonen bestehen aus Individuen, die eine bestimmte Krankheit oder Störung haben. Populationen von Testpersonen mit frühzeitigem Ausbruch bestehen aus den jüngsten 5 bis 10% von Individuen, bei denen eine Krankheit ausbricht, und Populationen von Testpersonen mit spätem Ausbruch bestehen aus den ältesten 5 bis 10% von Individuen, bei denen eine Krankheit ausbricht. In der Verwendung hier umfasst der Begriff „junge Individuen" Individuen, die als Jugendliche angesehen werden, und der Begriff „ältere Individuen" umfasst die ältesten etwa 5% der Individuen. Z.B. umfasst eine Population junger Menschen Individuen mit einem Alter von 18 Jahren oder jünger, vorzugsweise mit einem Alter von etwa sechs Jahren oder jünger. Eine Population von älteren Menschen umfasst Individuen mit einem Alter von mindestens 90, vorzugsweise mindestens 98 Jahren. Alle Individuen, die nicht jung oder älter sind, wie hier beschrieben, werden als Vertreter mittleren Alters angesehen. Altersspezifische Populationen mittleren Alters bestehen aus Individuen eines gewünschten Alters, z.B. Menschen mit einem Alter, das innerhalb eines gewünschten Intervalls liegt (z.B. eines Intervalls von fünf oder zehn Jahren).
  • Die Zahl von Individuen, die in der Population enthalten sind, kann variieren. Im Allgemeinen besteht die Population aus mindestens 1000 Individuen. Das Verfahren der Erfindung ist gut geeignet, um Punktmutationen, die mit einer geringen Häufigkeit auftreten (z.B. etwa 5 × 10–5), nachzuweisen, und es macht somit die Verwendung einer großen Population möglich. Z.B. kann die Population mindestens etwa 1000 oder mindestens etwa 10 000 Individuen umfassen. In bestimmten Ausführungsformen kann die Population aus zwischen etwa 10 000 und etwa 1 000 000 Individuen bestehen. In einer bevorzugten Ausführungsform besteht die Population aus etwa 100 000 Individuen.
  • Die DNA (Kern-, Mitochondrien-, gepoolt) kann aus jedem Individuum in der Population isoliert und fragmentiert werden, wobei Verfahren eingesetzt werden, die dem Fachmann bekannt sind. Im Allgemeinen wird eine Probe (z.B. eine beliebige DNA-enthaltende biologische Probe, z.B. eine Gewebebiopsie, Vollblut, isolierte Zellen) genommen und die DNA aus den in der Probe enthaltenen Zellen isoliert. DNA kann aus einer Probe aus einem Individuen oder aus gepoolten Proben isoliert werden. Z.B. kann DNA erhalten werden, indem eine Probe von Leukocyten oder eine andere geeignete Gewebeprobe aus jedem Individuen der Population entnommen wird. Proben, welche eine ähnliche Zahl von Zellen enthalten, können gepoolt werden, und die DNA kann hieraus isoliert werden. Auch können mehrere DNA-Proben, die aus Individuen isoliert wurden, vereinigt werden. Zahlreiche geeignete Verfahren zum Isolieren von DNA aus Zellen und/oder Geweben sind verfügbar. Die isolierte DNA wird im Allgemeinen durch Spaltung mit einer oder mehreren geeigneten Restriktionsendonucleasen fragmentiert. Eine beliebige Restriktionsendonuclease kann verwendet werden, die nicht innerhalb der Zielregion der DNA spaltet. Vorzugsweise wird eine Restriktionsendonuclease ausgewählt, welche die DNA mit einer niedrigen Häufigkeit spaltet, z.B. ein Enzym mit einer aus sechs Basenpaaren bestehenden Erkennungsstelle („six-cutter"). Bei „six-cutter"-Enzymen ist die Wahrscheinlichkeit geringer, dass sie eine Zielsequenz spalten, als bei anderen Enzymen, welche die DNA mit einer höheren Häufigkeit spalten (z.B. „four-cutters"), und sie wandeln die genomische DNA zu einem Pool von Fragmenten mit etwa 4000 bp um. Die DNA kann einzeln gespalten und die resultierenden Fragmente vereinigt werden, oder eine vereinigte Probe von DNA kann mit einer geeigneten Restriktionsendonuclease gespalten werden, so dass ein Pool von Fragmenten erzeugt wird.
  • Der Pool von DNA-Fragmenten stellt eine geeignete Matrize zum Amplifizieren der Zielregion des Genoms bereit. Die Zielsequenzen können ohne weitere Bearbeitung des Pools amplifiziert werden, oder der Pool kann so bearbeitet werden, dass die Fragmente, welche die Zielregion enthalten, angereichert werden. Vorzugsweise werden in dem Pool Fragmente angereichert, welche die Zielregion enthalten. Die Anreicherung kann anhand von geeigneten Verfahren erfolgen. Z.B. können, wie hier beschrieben, die DNA-Fragmente mit einer markierten Oligonucleotid-Sonde (z.B. Biotin-markiert) inkubiert werden, die mit der Zielregion oder mit Sequenzen, welche die Zielregion flankieren, unter den für eine Hybridisierung geeigneten Bedingungen hybridisieren, und sodann können die markierten Hybride, die entstehen, isoliert werden (z.B. unter Verwendung von Streptavidin-beschichteten Perlen). Anhand dieses Verfahrens wurden etwa 10 000-fache Anreicherungen erreicht.
  • Die Zielregionen des Pools von DNA-Fragmenten werden in einer „high fidelity"-Polymerase-Kettenreaktion (hifiPCR) unter Bedingungen amplifiziert, die für die Produktion von doppelsträngigen DNA-Produkten geeignet sind, welche eine terminate Hochtemperatur-„isomelting"-Domäne enthalten, die mit einer nachweisbaren Markierung markiert ist. Eine „hifiPCR" ist eine Polymerase-Kettenreaktion, die unter Bedingungen durchgeführt wird, bei denen PCR-induzierte (z.B. Polymerase-induzierte) Mutationen minimal sind (vgl. z.B. US Patent Nr. 5 976 842, dessen gesamte Ausführungen hier durch Bezugnahme eingeschlossen sind). Der hier verwendete Begriff hifiPCR bezieht sich auf eine Polymerase-Kettenreaktion, bei welcher der mutierte Anteil von jeder PCR-induzierten Mutation nicht größer als etwa 10–4 ist. Vorzugsweise ist der mutierte Anteil jeder PCR-induzierten Mutation nicht größer als etwa 5 × 10–5. Eine hifiPCR von Zielregionen kann unter Verwendung von PfuTM Polymerase durchgeführt werden, wobei die Amplifikation auf etwa sechs Verdopplungen beschränkt ist. Wie hier beschrieben ist die Häufigkeit einer PCR-induzierten Mutation an einer beliebigen Base von der Zahl der PCR-Verdopplungen und von der Fehlerrate pro Basenpaar pro Verdopplung abhängig. Somit können geeignete Bedingungen für eine hifiPCR für jede beliebige gewünschte Polymerase und Zielsequenz bestimmt werden.
  • Die Hochtemperatur-„isomelting"-Domäne wird durch einen nachweisbar markierten Primer bereitgestellt, der eine 5' gelegene, aus 40 Basen bestehende nicht-monotone Sequenz mit einer hohen Schmelztemperatur (z.B. eine G/C-reiche Sequenz) und eine aus 20 Basen bestehende, Zielregion-spezifische Sequenz umfasst. Geeignete nachweisbare Markierungen umfassen z.B. ein Radioisotop, eine Affinitätsmarkierung (z.B. Biotin, Avidin), eine Spin-Markierung, eine fluoreszierende Gruppe (z.B. Fluorescein) oder eine chemilumineszierende Gruppe. In einer bevorzugten Ausführungsform ist der Primer am 5'-Ende mit Fluorescein markiert.
  • Die Produkte der hifiPCR, die Wildtyp- oder mutierte (die z.B. eine Punktmutation aufweisen) Zielregionen enthalten, können aufgrund der Unterschiede in der Schmelztemperatur der Wildtyp- und mutierten Zielregionen getrennt werden. Die Produkte, welche mutierte Zielregionen enthalten, können gewonnen werden, wodurch ein sekundärer Pool von DNA hergestellt wird, in dem Zielregionen, welche Punktmutationen enthalten, angereichert sind. Die PCR-Produkte, welche Wildtyp- oder mutierte Zielregionen enthalten, können ohne weitere Bearbeitung getrennt werden. Jedoch ist es bevorzugt, dass die PCR-Produkte bearbeitet werden, so dass vor der Trennung ein Gemisch aus Wildtyp-Homodoppelsträngen und Heterodoppelsträngen, welche Punktmutationen enthalten, erzeugt wird. Ein solches Gemisch kann einfach hergestellt werden, indem z.B. die Produkte der hifiPCR erhitzt werden, wodurch die Produkte geschmolzen werden, wobei einzelsträngige DNAs entstehen. Danach kann das Gemisch abgekühlt werden, so dass das Annealing der einzelsträngigen DNAs ermöglicht wird. Da die Menge von DNA-Strängen mit einer Wildtyp-Zielregion die Menge von DNA-Strängen mit einer mutierten Zielregion deutlich übertrifft, bilden im Wesentlichen alle DNA-Stränge mit einer mutierten Zielregion Heterodoppelstränge mit Wildtypsträngen.
  • Verschiedene Verfahren wurden beschrieben, die dafür geeignet sind, Nucleinsäuren aufgrund von unterschiedlichen Schmelztemperaturen zu trennen, umfassend konstante denaturierende Gel-Kapillar-Elektrophorese (US Patent Nr. 5 633 129, dessen gesamte Beschreibung hier durch Bezugnahme eingeschlossen ist), konstante denaturierende Gel-Elektrophorese, denaturierende Gradienten-Gel-Elektrophorese oder denaturierende Hochleistungs-Flüssigkeits-Chromatographie (Gross, E., et al., Hum. Genet. 105: 72–78, 1999). Vorzugsweise werden die PCR-Produkte, welche Wildtyp- oder mutierte Zielregionen enthalten, oder das daraus hergestellte Gemisch aus Wildtyp-Homodoppelsträngen und Heterodoppelsträngen, die Punktmutationen enthalten, durch konstante denaturierende Gel-Kapillar-Elektrophorese getrennt, und die DNAs, welche mutierte Zielregionen enthalten, werden gewonnen, wodurch ein sekundärer DNA-Pool hergestellt wird.
  • Der sekundäre Pool kann in einer „high fidelity"-PCR unter Bedingungen amplifiziert werden, bei denen nur eine homodoppelsträngige DNA produziert wird, wodurch ein Gemisch aus homodoppelsträngiger DNA, welche die Wildtyp-Zielregion enthält, und homodoppelsträngigen DNAs, welche Zielregionen enthalten, die Punktmutationen umfassen, erzeugt wird. Die homodoppelsträngigen DNAs, welche Zielregionen enthalten, die Punktmutationen umfassen, können aufgrund der unterschiedlichen Schmelztemperaturen der DNAs wie beschrieben aufgetrennt werden, und die aufgetrennten DNAs können gewonnen werden. Gelegentlich kann ein mutierter Homodoppelstrang eine Schmelztemperatur aufweisen, die mit der Schmelztemperatur des Wildtyp-Homodoppelstrangs fast identisch ist. Solche mutierten Homodoppelstränge können nachgewiesen werden, indem die Fraktion des Wildtyp-Homodoppelstrangs gewonnen wird und die Fraktion erhitzt und abgekühlt wird, so dass Heterodoppelstränge entstehen. Die resultierenden Heterodoppelstränge können sodann aufgetrennt und gewonnen werden.
  • Vorzugsweise werden die homodoppelsträngigen oder heterodoppelsträngigen DNAs, welche Zielregionen enthalten, die Punktmutationen umfassen, durch konstante denaturierende Gel-Kapillar-Elektrophorese aufgetrennt und die aufgetrennten DNAs gewonnen. Die gewonnen DNAs können sodann anhand eines beliebigen geeigneten Sequenzierungsverfahrens (z.B. zyklische Sequenzierung) sequenziert werden, um die Punktmutationen zu identifizieren. Sobald diese identifiziert sind, kann die Häufigkeit bestimmt werden, mit der jede ererbte Punktmutation auftritt.
  • Die wie hier beschrieben identifizierten, ererbten Punktmutationen können verwendet werden, um eine quantitative Feinstrukturkarte der Punktmutationen in einem Gen zu erstellen. Eine solche quantitative Karte kann erstellt werden, indem die Häufigkeit bestimmt wird, mit der jede identifizierte Punktmutation in der Population auftritt. Das Verfahren der Erfindung ist für diesen Zweck besonders gut geeignet, da seltene ererbte Punktmutationen in DNA-Pools nachgewiesen werden können, die aus großen Populationen isoliert wurden (z.B. 100 000 oder sogar 1 000 000 Individuen). Selbstverständlich sind die Genauigkeit und der Nutzen einer solchen Karte deutlich größer, wenn sie die Häufigkeit von Mutationen in einer großen Population wiedergibt. Eine Feinstrukturkarte eines Gens kann verwendet werden, um zu bestimmen, ob das Gen schädliche, deletäre oder nützliche (z.B. die Langlebigkeit fördernde) Allele enthält.
  • Außerdem werden Verfahren zur Identifizierung von Genen beschrieben, die ein schädliches Allel enthalten. Wie hier beschrieben sind schädliche Allele solche Allele, welche die Lebenszeit verkürzen. Schädliche Allele umfassen z.B. Allele, die ursächlich für eine Krankheit (z.B. Krebs, Atherosklerose) sind oder die den Ausbruch einer Krankheit beschleunigen, z.B. Punktmutationen, die somatische Mutationsraten erhöhen. Man kann davon ausgehen, dass schädliche Allele in einer Population von älteren Individuen im Vergleich zu einer Population von jungen (jugendlichen) Individuen mit einer verringerten Häufigkeit vorliegen. Somit können Gene, die schädliche Allele enthalten, identifiziert werden, indem die summierte Häufigkeit oder die einzelnen Häufigkeiten von ererbten Punktmutationen, die im Gen einer älteren Population gefunden wird, mit der summierten Häufigkeit oder den einzelnen Häufigkeiten der gleichen ererbten Punktmutationen in einer jungen Population verglichen wird/werden. Das Verfahren umfasst die Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen und in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden. Die Häufigkeiten, mit denen jede Punktmutation in jeder der Populationen auftritt, werden bestimmt. In einem Verfahren wird die Summe der Häufigkeiten (die summierte Häufigkeit) aller ererbten Punktmutationen in einem ausgewählten Gen oder Genteilstück der jungen Population berechnet. Außerdem wird die summierte Häufigkeit aller ererbten Punktmutationen in dem ausgewählten Gen oder Genteilstück der älteren Population berechnet, und sodann werden die Summen miteinander verglichen. Eine signifikante Verringerung der summierten Häufigkeit der ererbten Punktmutationen in einem Gen der älteren Population im Vergleich zur jungen Population zeigt an, dass das ausgewählte Gen ein schädliches Allel enthält. In einem anderen Verfahren wird die Häufigkeit jeder Punktmutation, die in einem ausgewählten Gen oder Genteilstück der jungen Population identifiziert wird, mit der Häufigkeit der gleichen Punktmutation verglichen, die in dem ausgewählten Gen der älteren Population identifiziert wird. Eine signifikante Verringerung der Häufigkeiten von zwei oder mehreren ererbten Punktmutationen in einem Gen der älteren Population zeigt mit einer hohen Wahrscheinlichkeit an, dass das Gen ein schädliche Allel enthält. Eine signifikante Verringerung der Häufigkeit von nur einer ererbten Punktmutation in einem Gen der älteren Population zeigt an, dass das Gen entweder ein schädliche Allel enthält oder an ein nahe gelegenes schädliches Allel gekoppelt ist. Wenn keine signifikanten Unterschiede in der summierten Häufigkeit oder den einzelnen Häufigkeiten der ererbten Punktmutationen festgestellt werden, enthält das Gen keine schädlichen Allele.
  • In der Verwendung hier bedeutet „signifikant" statistisch signifikant. Eine statistische Signifikanz kann bestimmt werden, indem ein geeigneter statistischer Test eingesetzt wird, z.B. Chi-Quadrat-Test („Chi square test") oder Multinominalverteilung, wobei der Test modifiziert wird, um der Tatsache Rechnung zu tragen, dass eine große Zahl von Allelen verglichen wird. Z.B. kann der statistische Test durch Anwendung der Bonferoni-Ungleichheit modifiziert werden.
  • Gene, in denen die Häufigkeit von einer oder mehreren ererbten Punktmutationen in der älteren Population im Vergleich zu einer jungen Population abnimmt, können weiter untersucht werden. Z.B. kann die altersspezifische Abnahme des einen oder der mehreren ererbten Punktmutationen bestimmt werden. Eine altersspezifische Abnahme kann festgestellt werden, indem die Häufigkeit der einen oder mehreren ererbten Punktmutationen in einer oder mehreren altersspezifischen Populationen mittleren Alters bestimmt wird. Die Häufigkeiten der einen oder mehreren ererbten Punktmutationen in der (den) altersspezifischen Population(en) mittleren Alters zeigen zusammen mit den Häufigkeiten in der jungen und älteren Population die altersspezifische Abnahme der einen oder mehreren Punktmutationen. Die bestimmte altersspezifische Abnahme der einen oder mehreren Punktmutationen wird mit der theoretischen altersspezifischen Abnahme von schädlichen Allelen verglichen, welche eine tödliche Krankheit verursachen (jede tödliche Krankheit hat eine theoretische Abnahmerate). Die theoretische altersspezifische Abnahme von schädlichen Allelen, welche eine tödliche Krankheit verursachen, X(h, t) (Gleichung 4), wird wie hier beschrieben berechnet (Beispiel 1). Wenn die bestimmte altersspezifische Abnahmerate der einen oder der mehreren Punktmutationen ähnlich oder im Wesentlichen gleich ist (d.h. nicht statistisch verschieden davon ist) wie die theoretische altersspezifische Abnahme von schädlichen Allelen, die eine bestimmte tödliche Krankheit verursachen, dann besteht eine große Wahrscheinlichkeit, dass das Gen, welches die eine oder mehreren ererbten Punktmutationen enthält, ursächlich für die bestimmte Krankheit ist.
  • Ein Gen, in dem eine oder mehrere Punktmutationen eine altersspezifische Abnahme durchlaufen und bei dem eine hohe Wahrscheinlichkeit besteht, dass es für die bestimmte Krankheit ursächlich ist, kann in einer geeigneten Population von Testpersonen weiter untersucht werden. Im Allgemeinen besteht die Population von Testpersonen aus Individuen verschiedenen Alters, welche die bestimmte Krankheit haben. Die Häufigkeit der einen oder der mehreren Punktmutationen in der Gruppe von Testpersonen wird bestimmt und mit der Häufigkeit der gleichen einen oder mehreren Punktmutationen in der jungen Population verglichen. Eine signifikante Zunahme der Häufigkeit der einen oder mehreren Punktmutationen in der Population von Testpersonen im Vergleich zur jungen Population zeigt an, dass das Gen ein schädliches Allel enthält, welches bei der Krankheit eine ursächliche Rolle spielt.
  • Es gibt Gene, die schädliche Allele enthalten, welche keine Krankheit verursachen, welche jedoch sekundäre Risikofaktoren darstellen, die den Ausbruch einer Krankheit beschleunigen. Solche Gene können eine oder mehrere ererbte Punktmutationen enthalten, die eine altersspezifische Abnahme durchlaufen, wodurch der Ausbruch der bestimmten Krankheit beschleunigt wird. Jedoch wird für diese Mutationen möglicherweise kein signifikanter Zusammenhang mit der Population von Testpersonen festgestellt, die aus Individuen verschiedenen Alters besteht. In einer solchen Situation kann die Häufigkeit der einen oder der mehreren ererbten Punktmutationen in einer Population von Testpersonen mit frühem Ausbruch bestimmt werden und mit der Häufigkeit der gleichen einen oder der mehreren ererbten Punktmutationen in der jungen Population verglichen werden. Eine signifikante Erhöhung der Häufigkeit der einen oder der mehreren Punktmutationen in der Population von Testpersonen mit frühem Ausbruch im Vergleich zur jungen Population zeigt an, dass das Gen ein schädliches Allel enthält, welches einen sekundären Risikofaktor darstellt, der den Ausbruch der Krankheit beschleunigt.
  • Gene, die schädliche Allele enthalten, welche sekundäre Risikofaktoren darstellen, die den Ausbruch einen Krankheit beschleunigen, können auch identifiziert werden, indem die Häufigkeit jeder ererbten Punktmutation bestimmt wird, die in den Genen einer Population mit frühem Ausbruch einer bestimmten Krankheit (Testperson mit frühem Ausbruch) auftritt und die in den Genen einer Population mit spätem Ausbruch der gleichen Krankheit (Testperson mit spätem Ausbruch) auftritt. Die Häufigkeiten jeder ererbten Mutation für ein ausgewähltes Gen der Population von Testpersonen mit frühem Ausbruch werden mit den Häufigkeiten der gleichen Punktmutationen in dem Gen der Population von Testpersonen mit spätem Ausbruch verglichen. Eine signifikante Erhöhung der Häufigkeit von einer oder mehreren ererbten Punktmutationen in der Testperson mit frühem Ausbruch im Vergleich zur Testperson mit spätem Ausbruch zeigt an, dass das Gen ein schädliches Allel enthält, welches sekundäre Risikofaktoren darstellt, die den Ausbruch der Krankheit beschleunigen.
  • Außerdem wird ein Verfahren zur Identifizierung von Genen offenbart, welche ein Allel enthalten, das die Langlebigkeit erhöht. Das Verfahren umfasst die Identifizierung der ererbten Punktmutationen, die in den Genen oder Genteilstücken einer Population von jungen Individuen und im gleichen Gen oder Genteilstück einer Population von älteren Individuen gefunden werden. Die Häufigkeiten, mit denen jede Punktmutation in einem ausgewählten Gen auftritt, wird für jede Population bestimmt. In einem Verfahren wird die Summe der Mutationshäufigkeiten für das ausgewählte Gen in der jungen Population mit der Summe der Mutationshäufigkeiten für das ausgewählte Gen in der älteren Population verglichen. Eine signifikante Erhöhung der Summe der Mutationshäufigkeiten in der älteren Population im Vergleich zur jungen Population zeigt an, dass das ausgewählte Gen Allele enthält, welche die Langlebigkeit erhöhen. In einem weiteren Verfahren wird die Häufigkeit jeder Punktmutation, die in einem ausgewählten Gen in der jungen Population identifiziert wird, mit der Häufigkeit der gleichen Punktmutation, die in dem ausgewählten Gen in der älteren Population identifiziert wird, verglichen. Eine signifikante Erhöhung von zwei oder mehreren Punktmutationen in einem Gen der älteren Population im Vergleich zur jungen Population zeigt an, dass das ausgewählte Gen ein Allel enthält, welches die Langlebigkeit erhöht. In einem weiteren Verfahren wird die Häufigkeit jeder Punktmutation, die in einem ausgewählten Gen in der jungen Population identifiziert wird, mit der Häufigkeit der gleichen Punktmutation, die in dem ausgewählten Gen in der älteren Population identifiziert wird, verglichen. Eine signifikante Erhöhung der Häufigkeit einer Punktmutation in dem Gen der älteren Population im Vergleich zur jungen Population zeigt an, dass das ausgewählte Gen ein Allel enthält, welches die Langlebigkeit erhöht, oder an ein Gen gekoppelt ist, welches die Langlebigkeit erhöht.
  • Außerdem wird ein Verfahren zur Identifizierung von Genen offenbart, welche die Inzidenz einer Krankheit beeinflussen. Das Verfahren umfasst die Identifizierung der ererbten Punktmutationen, die in Genen oder Genteilstücken einer Population von jungen Individuen, welche nicht von der Krankheit betroffen sind, und in den Genen oder Genteilstücken einer Population von Testpersonen gefunden werden, welche die Krankheit haben. Die Häufigkeiten, mit der jede Punktmutation in einem ausgewählten Gen oder Genteilstück auftritt, wird bestimmt und für jede Population summiert. Die summierte Häufigkeit der Punktmutationen in einem ausgewählten Gen oder Genteilstück in der jungen Population wird mit der summierten Häufigkeit der Punktmutationen in dem ausgewählten Gen oder Genteilstück in der Population von Testpersonen verglichen. Eine signifikante Erhöhung der summierten Häufigkeit der Punktmutationen in der Population von Testpersonen im Vergleich zur jungen Population zeigt an, dass das Gen bei der Krankheit eine ursächliche Rolle spielt.
  • Außerdem wird ein Verfahren zur Identifizierung eines Gens offenbart, welches ein deletäres Allel enthält. Deletäre Allele sind Allele, welche die Reproduktion stören. Die Gene werden aufgrund der Häufigkeit von obligatorischen Knock-out- und mutmaßlichen Knock-out-Allelen in einer Population identifiziert. Obligatorische Knock-outs sind Punktmutationen, die notwendigerweise das Gen inaktivieren, z.B. Punktmutationen, die Stopp-Codons oder Rasterverschiebungen („frame shifts") in Exons von Protein-codierenden Genen einführen. Obligatorische Knock-outs können auch in Spleißstellen in Exons oder Introns von Protein-codierenden Genen vorkommen. Mutmaßliche Knock-outs sind Punktmutationen, von denen man erwarten kann, dass sie das Gen inaktivieren. Z.B. kann eine Punktmutation, welche einen Cysteinrest in ein Protein einführt, eine ungeeignete Disulfidbindung bilden und die Faltung verändern oder eine Aggregation des Protein bewirken. Demgemäß kann man davon ausgehen, dass ererbte Punktmutationen, die einen Cysteinrest in ein Protein einführen, mutmaßliche Knock-outs darstellen.
  • In einem Verfahren umfasst das Verfahren zur Identifizierung eines Gens, welches ein deletäres Allel enthält, die Identifizierung der ererbten Punktmutationen, die in dem (den) Exon(s) und Spleißstellen eines Gen einer Population von jungen Individuen auftreten. Die ererbten Punktmutationen, die obligatorische Knock-outs sind, werden durch Inspektion der Sequenzen identifiziert, und die Häufigkeiten, mit denen jede obligatorische Knock-out-Punktmutation auftritt, werden bestimmt. Die Häufigkeiten von allen, in dem Gen identifizierten, obligatorischen Knock-out-Punktmutationen werden summiert. Eine summierte Häufigkeit aller obligatorischen Knock-out-Punktmutationen von weniger als etwa 2% zeigt an, dass das Gen ein deletäres Allel enthält. In einem weiteren Verfahren zeigt eine summierte Häufigkeit aller obligatorischen Knock-out-Punktmutationen von etwa 0,02% bis etwa 2% an, dass das Gen ein rezessives deletäres Allel enthält. In einem weiteren Verfahren zeigt eine summierte Häufigkeit aller obligatorischen Knock-out-Punktmutationen von weniger als etwa 0,02% an, dass das Gen ein dominantes deletäres Allel enthält.
  • In einem anderen Verfahren umfasst das Verfahren zur Identifizierung eines Gens, welches ein deletäres Allel enthält, die Identifizierung der ererbten Punktmutationen in dem (den) Exon(s) und Spleißstellen eines Gen einer Population von jungen Individuen. Die ererbten Punktmutationen, die obligatorische Knock-outs sind, und die ererbten Punktmutationen, die mutmaßliche Knock-outs sind, werden durch Inspektion der Sequenzen identifiziert, und die Häufigkeiten, mit denen jede obligatorische oder mutmaßliche Knock-out-Punktmutation auftritt, werden bestimmt. Die Häufigkeiten von allen, in dem Gen identifizierten Knock-out-Punktmutationen (obligatorischen und mutmaßlichen) werden summiert. Eine summierte Häufigkeit aller Knock-out-Punktmutationen von weniger als etwa 2% zeigt an, dass das Gen ein deletäres Allel enthält. In einem weiteren Verfahren zeigt eine summierte Häufigkeit aller obligatorischen Knock-out-Punktmutationen von etwa 0,02% bis etwa 2% an, dass das Gen ein rezessives deletäres Allel enthält. In einem weiteren Verfahren zeigt eine summierte Häufigkeit aller obligatorischen Knock-out-Punktmutationen von weniger als etwa 0,02% an, dass das Gen ein dominantes deletäres Allel enthält.
  • Außerdem werden isolierte Nucleinsäuren offenbart, die zu einem Strang eines Gens oder Genteilstücks oder Allel oder Teil davon, identifiziert gemäß den hier beschriebenen Verfahren, komplementär sind. Ferner werden isolierte Zielregionen eines Genoms offenbart, welche ererbte Punktmutationen enthalten und welche gemäß den hier beschriebenen Verfahren isoliert werden.
  • Nucleinsäuren, die hier als „isoliert" bezeichnet werden, sind Nucleinsäuren, die von den Nucleinsäuren der genomischen DNA oder der zellulären RNA ihrer ursprünglichen Quelle (z.B. wie sie in Zellen oder in einem Gemisch aus Nucleinsäuren, z.B. einer Bank, vorliegen) abgetrennt wurden, und sie können noch weiter bearbeitet worden sein. „Isolierte" Nucleinsäuren umfassen Nucleinsäuren, die durch die hier beschriebenen Verfahren, durch ähnliche Verfahren oder durch andere geeignete Verfahren erhalten werden, umfassend im Wesentlichen reine Nucleinsäuren, Nucleinsäuren, die durch chemische Synthese produziert werden (Oligonucleotide), die durch Kombinationen von biologischen und chemischen Verfahren isoliert werden, und rekombinante Nucleinsäuren, die isoliert werden.
  • Außerdem können die Nucleinsäuremoleküle am Basenrest, Zuckerrest oder Phosphat-Grundgerüst modifiziert werden, um z.B. die Stabilität, Hybridisierung oder Löslichkeit des Moleküls zu verbessern. Z.B. kann das Desoxyribosephosphat-Grundgerüst der Nucleinsäuren modifiziert werden, um Peptid-Nucleinsäuren zu erzeugen (vgl. Hyrup et al., (1996), Bioorganic & Medicinal Chemistry 4: 5). Die hier verwendeten Begriffe „Peptid-Nucleinsäuren" oder „PNAs" beziehen sich auf Nucleinsäure-Nachahmer („nucleic acid mimics"), z.B. DNA-Nachahmer, in denen das Desoxyribosephosphat-Grundgerüst durch ein Pseudopeptid-Grundgerüst ersetzt ist und nur die vier natürlichen Nucleobasen beibehalten sind. Es wurde gezeigt, dass das neutrale Grundgerüst von PNAs eine spezifische Hybridisierung an DNA und RNA unter Bedingungen geringer Ionenstärke erlaubt. Die Synthese von PNA-Oligomeren kann anhand von herkömmlichen Protokollen der Festphasen-Peptidsynthese erfolgen, wie in Hyrup et al., (1996), vorstehend; Perry-O'Keefe et al., (1996), Proc. Natl. Acad. Sci. USA 93: 14670; beschrieben. PNAs können noch weiter modifiziert werden, um z.B. ihre Stabilität, Spezifität oder zelluläre Aufnahme zu erhöhen, indem lipophile oder andere Helfergruppen an die PNA gekoppelt werden, durch die Bildung von PNA-DNA-Chimären oder durch die Verwendung von Liposomen oder anderen Techniken der Arzneistoff-Verabreichung, die dem Fachmann bekannt sind. Die Synthese von PNA-DNA-Chimären kann durchgeführt werden, wie in Hyrup (1996), vorstehend; Finn et al., (1996), Nucleic Acids Res. 24 (17): 3357–3363; Mag et al., (1989), Nucleic Acids Res. 17: 5973; und Peterser et al., (1975), Bioorganic Med. Chem. Lett. 5: 1119; beschrieben. Andere DNA-Nachahmer können einen Array von Basen umfassen, die an einem festen Träger, z.B. Glas oder Silicon, immobilisiert sind. Die Basen sind in einer Weise angeordnet, dass eine Hybridisierung mit komplementären Nucleinsäuren erfolgen kann.
  • Die Nucleinsäuremoleküle und Fragmente können auch andere angehängte Gruppen, z.B. Peptide (z.B. zum Ansteuern von Wirtszellen-Rezeptoren in vivo), oder Mittel umfassen, welche den Transport durch die Zellmembran (vgl. z.B. Letsinger et al., (1989), Proc. Natl. Acad. Sci. USA 86: 6553–6556; Lemaitre et al., (1987), Proc. Natl. Acad. Sci. USA 84: 648–652; PCT Veröffentlichung Nr. WO88/0918) oder die Blut-Hirn-Schranke erleichtern (vgl. z.B. PCT Veröffentlichung Nr. WO89/10134). Außerdem können Oligonucleotide mit Hybridisierungstimulierenden Spaltungsmitteln (vgl. z.B. Krol et al., (1988), Bio-Techniques 6: 958–976) oder interkalierenden Agenzien (vgl. z.B. Zon, (1988), Pharm. Res. 5: 539–549) modifiziert werden. Weiterhin können die Nucleinsäuren durch eine nachweisbare Markierung modifiziert werden, z.B. ein Radioisotop, eine Spin-Markierung, eine Antigen- oder Enzymmarkierung, eine fluoreszierende oder chemilumineszierende Gruppe und dergleichen.
  • Die Nucleinsäuren können als Sonden verwendet werden, um z.B. das Vorliegen eines deletären Allels nachzuweisen. Sonden können eine geeignete Länge aufweisen, um die Spezifität in einer Hybridisierungreaktion sicherzustellen. Z.B. können die Sonden etwa 15 bis mehrere tausend Nucleotide lang sein. Bevorzugte Sonden sind synthetische Moleküle (z.B. Oligonucleotide), die etwa 15 bis etwa 20 oder 25 Nucleotide lang sind.
  • Außerdem wird ein Array von isolierten Nucleinsäuren wie hier beschrieben offenbart, die an einem festen Träger immobilisiert sind, wobei der Array mindestens etwa 100 verschiedene isolierte Nucleinsäuren aufweist, welche in dem Array an getrennten Stellen plaziert sind, wobei jede der verschiedenen Nucleinsäuren spezifisch mit der Zielregion, dem Gen oder dem Allel hybridisieren kann, die/das eine ererbte Punktmutation enthält. Solche Arrays können anhand geeigneter Verfahren hergestellt werden, z.B. durch das Verfahren, das im US Patent Nr. 5 837 832 beschrieben ist.
  • Die Arrays oder DNA-Chips können als Sonden eingesetzt werden, um schädliche oder deletäre Allele nachzuweisen. Z.B. können Allele, die bei einer tödlichen Krankheit (z.B. Krebs) eine ursächliche Rolle spielen, in Individuen nachgewiesen werden, die keine Symptome der Krankheit zeigen. Ein Individuum, bei dem auf diese Weise eine Diagnose gestellt wird, könnte anschließend mit einer prophylaktischen Therapie beginnen. Die Arrays können eingesetzt werden, um eine chemotherapeutische Behandlung für ein Individuum maßzuschneidern. Z.B. kann ein Array von Sonden, die mit Allelen von xenometabolischen Enzymen (z.B. Cytochrom P450s) hybridisieren, eingesetzt werden, um die Fähigkeit eines Individuums zu bestimmen, bestimmte Arten von Arzneistoffen zu metabolisieren. Demgemäß kann ein Arzneistoff für die Therapie ausgewählt werden, der eine außerordentlich gute Wirksamkeit und minimale Nebenwirkungen bietet. Außerdem können die Arrays für die genetische Beratung eingesetzt werden. Z.B. kann ein Array von Sonden, die mit rezessiven deletären Allelen hybridisieren, dazu verwendet werden, um solche Allele bei einem Mann und einer Frau nachzuweisen, die sich ein Kind wünschen. Wenn sowohl der Mann als auch die Frau ein rezessives deletäres Allel in dem gleichen Gen enthalten, wären 0,25 der durch sie hervorgebrachten befruchteten Eier für das Allel homozygot und möglicherweise nicht lebensfähig. Der gleiche Array kann eingesetzt werden, um befruchtete Eier auszuwählen, die nicht homozygot für ein deletäres Allel sind. Z.B. kann man bei in vitro-befruchteten Eiern zuerst die Furchung zulassen und dann eine einzelne Zelle für eine genetische Analyse aus dem Ei entnehmen. Anschließend können die Eier, die nicht homozygot für ein deletäres Allel sind, ausgewählt und in den Uterus der Frau implantiert werden.
  • Die hier beschriebenen Verfahren können eingesetzt werden, um eine beliebige oder alle deletären, schädlichen oder nützlichen Punktmutationen zu identifizieren, die eine bestimmte Population enthält. Weiterhin kann als Ergebnis der Erfindung ein DNA-Chip oder ein kleiner Satz von DNA-Chips zum Nachweis aller deletären, schädlichen und nützlichen Punktmutationen in allen menschlichen Populationen und Untergruppen, die in Nordamerika, Europa, Asien, Afrika, Südamerika vorkommen, hergestellt werden.
  • Beispiele
  • Beispiel 1
  • Einleitung
  • Für zahlreiche ererbte Mutationen ist bekannt, dass sie eine Krankheit verursachen oder dass sie zur Folge haben, dass Menschen für eine Krankheit anfällig sind. Seit das menschliche Genom kartiert und sequenziert ist, hat die Zahl von Markern dramatisch zugenommen, mit denen ein Abtasten des gesamten Genoms möglich ist, wodurch zahlreiche Regionen, die mit einer Krankheit im Zusammenhang stehen, bestimmt oder durch Ausschluss kartiert werden können (Nelen et al., 1996; Comuzzie et al., 1997; Marshall, 1997). Bisher wurden ungefähr 1339 Gene chromosomal kartiert, die mit einer Krankheit beim Menschen assoziiert sind (Genome Database, Johns Hopkins University). Wenn man jedoch beliebige lange Sequenzen zwischen zwei zufällig ausgewählten Allelen in der menschlichen Population vergleicht, findet man für alle 1000 bp etwa zwei Variationen (Rowen et al., 1997). Somit kann man davon ausgehen, dass in einer großen menschlichen Population beliebige 1000 bp zahlreiche Sequenzen aufweisen, die sich von der Normalsequenz unterscheiden. Einige dieser Sequenzvarianten beeinflussen möglicherweise physiologische Funktionen, z.B. Tumorsuppression, Xenometabolismus, DNA-Reparatur oder Steuerung von Zelltod und Zellteilung.
  • Es erscheint logisch, dass, wenn eine Subpopulation aufgrund einer ererbten Mutation das Risiko hat, auf eine bestimmte Art zu sterben, für die der Rest der Population kein Risiko hat, die altersabhängige Todesrate für diese Subpopulation im Vergleich zum Mittelwert erhöht wäre. Bei einem stetigen Anstieg der altersabhängigen Todesrate kann man erwarten, dass der Anteil der menschlichen Population, der ein Risiko hat, mit zunehmendem Alter abnimmt. Hier betrachten wir ein hypothetisches Tumor-Suppressorgen, in welchem ererbte Gen-inaktivierende Mutationen die Population definieren würden, die ein Risiko für eine letale Krankheit, z.B. Pankreaskrebs, hat. Um die Art und Weise, wie wir unsere altersabhängigen Erwartungen berechnen, verstehen zu können, sind einige Erklärungen erforderlich.
  • Für unsere Bestimmungen haben wir das mehrstufige Modell für die Karzinogenese von Knudson (Knudson, 1971) verwendet, das von Herrero-Jimenez et al. (1998) erweitert wurde. In diesem Modell sind zwei Mutationen, die mit den Raten ri und rj auftreten, in somatischen Zellen erforderlich, um beide Kopien eines ersten „Gatekeeper"-Tumor-Suppressorgens „GK" zu inaktivieren, wobei dies zu einer „initiierten" Zelle führt, die als ein Adenom wächst. Eine inaktivierende Mutation, die in einem ersten „Gatekeeper"-Gen „GK" ererbt ist, würde beinahe sicher schon in jungen Jahren zu der Krankheit führen. Ein Beispiel eines solchen Zusands ist die familiäre adenomatöse Polypose (FAP), wobei Mitglieder der gleichen Familie schon in jungen Jahren aufgrund von ererbten Mutationen, die das eine Allel des Gens der adenomatösen Polypose coli (APC) inaktivieren, Colonkrebs bekommen (Kinzler und Vogelstein, 1996).
  • Wir haben die Hypothese aufgestellt, dass, während die Zellen in einem wachsenden Adenom weiterhin wachsen und absterben, der stochastische Verlust der ererbten Heterozygotie in einem zweiten „Gatekeeper"-Tumor-Suppressorgen „A" schließlich mit der Rate rA auftritt. Dieses dritte somatische genetische Ereignis bringt eine Dreifach-Mutante hervor, die durch schnelles Wachstum und weitere genetische Veränderungen ein letales Karzinom verursacht (vgl. 1). Eine inaktivierende Mutation, die in dem einen Allel des Gens „A", dem zweiten „Gatekeeper", ererbt ist, würde solange zu keiner Krankheit führen, bis die zwei Allele des ersten „Gatekeeper" verloren gegangen sind und das Adenom auf eine Größe gewachsen ist, die den Verlust der Heterozygotie für das Gen „A" in einer beliebigen Adenomzelle wahrscheinlich macht. Bei einem Individuum, das eine solche Mutation in „A" geerbt hat, könnten die drei Rate-begrenzenden Ereignisse eintreten, bevor es aus einem anderen Grund stirbt, dies muss jedoch nicht der Fall sein. Deshalb würde bei einer Subpopulation, die eine Mutation in einem Allel des Gens „A" geerbt hat, ein Risiko für eine Krebserkrankung mit spätem Ausbruch bestehen. Im nachstehenden Beispiel machen Heterozygote im zweiten „Gatekeeper"-Alllel die Subpopulationen mit Risiko für „sporadische" Krebserkrankungen aus (1) (Herrero-Jimenez et al., 1998).
  • Die Identifizierung von Genen, in denen Polymorphismen (üblicherweise definiert als Allele, die in einem zufällig gewählten Anteil, typischerweise 1%, der Population vorliegen) ein genetisches Risiko für eine Krankheit repräsentieren, hat sich zu einem sehr wichtigen Gebiet der Erforschung des menschlichen Genoms entwickelt (Agundez et al., 1997; Daly et al., 1997; Kaiser, 1997). Kandidaten für Gene, in denen inaktivierende Mutationen dazu führen könnten, dass der Betroffene ein erhöhtes Risiko für Krebs hat, umfassen Tumor-Suppressorgene, xenometabolisierende Gene, DNA-Reparatur- und Replikationsgene und Gene, welche die Kinetiken von Zellteilung und Zelltod im normalen und adenomatösen Gewebe beeinflussen. Eine inaktivierende Mutation entweder im ersten oder im zweiten „Gatekeeper"-Gen würde einen primären Risikofaktor für familiäre bzw. sporadische Krebserkrankungen verursachen. Sekundäre Faktoren, die Mutationen beeinflussen, z.B. Mutationsraten oder Zellkinetiken, würden das altersabhängige Risiko jedoch nur bei den Personen erhöhen, die eine Mutation im ersten „Gatekeeper"-Gen „GK" oder im zuveiten „Gatekeeper"-Gen „A" geerbt haben. Germinate Mutationen, die eine sporadische Mortalität mit spätem Eintritt definieren, sind möglicherweise in einer allgemeinen Population weit verbreitet, da sie solange keine letale Wirkung haben, bis Geschwindigkeits-begrenzende Ereignisse auftreten, so dass eine Vererbung der mutierten Allele möglich ist. Ein Beispiel eines Allels, das mit einer spät einsetzenden Mortalität durch die koronare Herzkrankheit im Zusammenhang zu stehend scheint, ist das e4-Allel des Apolipoprotein-E-Gens, für das berichtet wurde, dass es in extrem alten Populationen abnimmt (Kervinen et al., 1994; Schachter et al., 1994).
  • Um zu bestimmen, welche Punktmutationen („Point mutations"), die in der allgemeinen Population weit verbreitet sind, mit einer spät auftretenden Mortalität assoziiert sind, müssen große Populationen untersucht werden, um eine wünschenswerte statistische Genauigkeit zu erreichen. Für solche Bestimmungen sind Verfahren erforderlich, die so kleine Unterschiede wie eine Änderung eines einzelnen Nucleotids in großen Populationen mit vernünftigen Kosten nachweisen können. Verfahren, die zurzeit zum Identifizieren von Punktmutationen (z.B. „Point mutations") verwendet werden, sind: Einzelstrang-Konformations-Polymorphismus- („single strand conformation polymorphism", SSCP) Analyse (Orita et al., 1989), Restriktionsfragment-Längenpolymorphismus- („restriction fragment length polymorphism", RFLP) Analyse (Arnheim et al., 1985), Mikro- und Minisatelliten-Variation (Koreth et al., 1996), von einer Allel-spezifischen Hybridisierung abhängige Verfahren (Shuber et al., 1997), denaturierende Gradienten-Gel-Elektrophorese (DGGE) (Guldberg et al., 1993), DNA-Chips (Chee et al., 1996) und direkte Sequenzierung.
  • Leider ist der Nutzen dieser Verfahren aufgrund der Kosten und des Arbeitsaufwands begrenzt, die erforderlich sind, um jedes Individuum in großen Populationen zu testen. Mit einigen Verfahren, z.B. SSCP und DNA-Chips, nicht jedoch DGGE, würde ein signifikanter Anteil von möglichen Punktmutationen („Point mutations") in einer definierten Sequenz nicht nachgewiesen werden. Im Fall einer direkten Sequenzierung, die jede Punktmutation in einer bestimmten Sequenz nachweisen würde, werden allgemein cDNAs, nicht jedoch genomische Sequenzen, für die Analysen vorgeschlagen. Durch diese Vorgehensweise werden jedoch Punktmutationen („Point mutations") übersehen, welche die normale mRNA-Spleißung blockieren, dies ist ein wichtiger Punkt, da ein signifikanter prozentualer Anteil (20 bis 30%, dies variiert bei verschiedenen Genen) von Punktmutationen, welche ein Gen inaktivieren, innerhalb von Spleißstellen der Introns zu liegen scheint (Kat, 1992).
  • Wir schlagen eine andere Vorgehensweise vor, die auf einem Verfahren beruht, das zur Untersuchung von somatisch-hergeleiteten Punktmutations-Spektren in menschlichen Geweben entwickelt wurde. Es wurde bereits gezeigt, dass dieses Verfahren Mutationen in 100-bp-Sequenzen mit einer Empfindlichkeit von mindestens 10–6 nachweisen kann (Khrapko et al., 1997). Zuerst trennen wir mutierte von nicht-mutierten Sequenzen anhand des unterschiedlichen kooperativen Schmelzverhaltens von doppelsträngigen DNAs (Poland, 1978; Fischer und Lerman, 1983). Durch die Kombination der konstanten denaturierenden Kapillar-Elektrophorese (CDCE) mit der „high fidelity"-DNA-Amplifikation (hifiPCR) (Khrapko et al., 1994; Khrapko et al., 1997) konnten wir jeden beliebigen SNP in Populationen von bis zu 104 Personen in einem einzigen Experiment innerhalb einer definierten Zielsequenz einfach messen. Durch den Vergleich von randomisierten Blutproben aus der allgemeinen US-Bevölkerung von Neugeborenen mit denjenigen, die von der allgemeinen US-Bevölkerung von Hundertjährigen genommen wurden, sollten Punktmutationen („Point mutations") identifiziert werden, da man erwarten kann, dass sie in älteren Populationen deutlich abnehmen. Wenn Populationen von Testpersonen, welche an spezifischen Krankheiten leiden, für die Studie verfügbar sind, kann man davon ausgehen, dass diese identischen Polymorphismen im Vergleich zur Population von Neugeborenen deutlich erhöht sind. (Da wir Punktmutationen („Point mutations") gut unter 1% einfach messen können, bezeichnen wir diese als Punktmutationen und nicht als „Polymorphismus", da dies üblicherweise eine Häufigkeit von größer oder gleich 1% bedeutet).
  • Durch die analytische Vorgehensweise, bei der CDCE und hifiPCR kombiniert werden, können Mutationen, die mit tödlichen Krankheiten assoziiert sind, mit einer Empfindlichkeit und einer statistischen Zuverlässigkeit identifiziert werden, so dass diese Vorgehensweise signifikant wünschenswerter ist als vorgeschlagene massive Resequenzierungs- („resequencing") Strategien. Durch die Untersuchung von allgemeinen Populationen (z.B. gut gemischten Populationen) sollten systematische Fehler verringert werden, z.B. Gründer-Effekte („founder effects"), die in traditionellen Familien-Bindungs-Studien zu finden sind. Im nächsten Abschnitt berechnen wir die erwarteten Unterschiede zwischen Populationen von Neugeborenen, Testpersonen und Hundertjährigen für das hypothetische Beispiel eines Gens, in dem inaktivierende Mutationen einen primären Risikofaktor für Pankreaskrebs darstellen.
  • Analyseverfahren
  • Anteile mit einem Risiko für eine tödliche Krankheit: d.h. das Beispiel Pankreaskrebs
  • Wenn man eine Suche nach mit einer Krankheit zusammenhängenden Punktmutationen („Point mutations") plant, ist es sehr günstig, eine Abschätzung des gesamten Risikoanteils in der allgemeinen Population zu haben. Um solche Abschätzungen zu bekommen, haben wir die Daten für tödliche Krankheiten gesammelt, die in den „Vital Statistics" der Vereinigten Staaten aufgezeichnet sind (Census, 1900–1936; DHHS, 1937–1992). In Kombination mit den Census-Populations-Daten für die meldenden Staaten und Länder konnte wir eine Geburtsjahr-Kohorten- und altersspezifische Funktion, OBS(h, t), berechnen, welche die Anzahl der Todesfälle durch die beobachtete Ursache im Alter von t, geteilt durch die Anzahl der Personen, die im Alter von t noch leben, in einer im Jahr h geborenen Kohorte („cohort") darstellt.
  • Für jedes Geburtsjahr h postulieren wir, dass es einen Anteil der Population, Fh, mit einem während des Lebens vorliegenden Risiko der beobachteten Todesursache gibt. Da unsere Gruppe insbesondere in der Aufklärung von Wechselwirkungen von Gen und Umwelt interessiert ist, wird die Definition des Risikos, Fh, in dem Modell als das Produkt des Anteils von genetisch-empfänglichen Personen, multipliziert mit dem Anteil von Personen mit Umwelt-Exposition, dargestellt: Fh = Fh,genet. × Fh,Umwelt Gleichung 1
  • Wenn jeder dem (den) gleichen Umweltfaktor(en) ausgesetzt ist, dann Fh,Umwelt = 1 und Fh = Fh,genet.
  • Wenn jedoch nur ein Teil der Population exponiert wurde, dann kann man erwarten, dass Fh,genet. größer ist als Fh. Deshalb stellt Fh eine nützliche Bestimmung des niedrigsten möglichen Anteils von Fh,genet. dar. Wir haben mit einer algebraischen Vorgehensweise experimentiert, um Fh und andere Parameter in dem allgemeinen mehrstufigen Modell von 1 zu berechnen. In unserer Formulierung ist P(t) die Wahrscheinlichkeit, an der beobachteten Ursache im Alter von t zu sterben, mit der Maßgabe, dass ein Individuum im Alter von t sowohl das Risiko hat als auch zu diesem Zeitpunkt noch lebt. Todesfälle, die nicht durch die Risikofaktoren für die beobachtete Todesart verursacht werden, werden in unserer Ableitung als „ausgeschieden" bezeichnet (Herrero-Jimenez et al., 1998). Todesfälle, die durch die identischen Risikofaktoren für die beobachtete Todesart verursacht werden, werden durch Darstellung des Anteils der Summe von Todesfällen aufgrund dieser Faktoren der beobachteten Todesart als f angegeben. Wir haben gefunden, dass die Geburtsjahr-Kohorten- und altersspezifische Funktion OBS(h, t) vernünftig angenähert werden kann als:
    Figure 00340001
    wenn die Überlebensraten für die beobachtete Krebserkrankung gering sind.
  • Wir haben gefunden, dass P(t), die altersabhängige Wahrscheinlichkeit der beobachteten Todesart innerhalb der Risikogruppe, durch eine algebraische Gleichung geeignet dargestellt wird, die erstmals von Moolgavkar et al., (1988), vorgeschlagen und von Herrero-Jimenez et al., (1998), etwas erweitert und dann weiter korrigiert wurde (Herrero-Jimenez et al., 1999),
    Figure 00340002
    wobei wir zusätzlich zu den in 1 definierten Größen noch die Folgenden verwenden: a, um das Alter zum Zeitpunkt der Initiation darzustellen, t, um das Alter zum Zeitpunkt des Todes aufgrund der beobachteten Ursache darzustellen, und Na, um die Zahl der Zellen in einem Gewebe, bei dem das Risiko besteht, darzustellen.
  • Wir verwenden X(h, t), um den Anteil der überlebenden allgemeinen Population, bei der noch das Risiko besteht, an Pankreaskrebs zu sterben, als Populationsalter darzustellen:
  • Figure 00340003
  • Eine beliebige ererbte Mutation, welche den Risikoanteil Fh, erzeugt, sollte bezogen auf das jeweilige Alter der Geburtsjahr-Kohorte ausgewählt werden. Das bedeutet, dass bei t = 0, X(h, t) = Fh, und dass, da die Population mit Risiko etwas schneller stirbt als die allgemeine Population, X(h, t) mit steigendem Alter t abnehmen wird.
  • OBS(h, t) und X(h, t) für europäisch-amerikanische Männer, geboren zwischen 1900 und 1909, die an Pankreaskrebs starben, sind in 2A dargestellt. Die Mortalitätsrate ist niedrig, bis sie in den frühen 40ern gleichmäßig ansteigt, beim Alter von 85 ein Maximum erreicht und bei Hundertjährigen auf einen viel niedrigeren Wert sinkt. Der Risikoanteil für die Kohorte, Fh, wird auf 22% berechnet, dies definiert X(h, t) für die Kohorte zum Zeitpunkt der Geburt, wenn t = 0·X(h, t) bleibt bis zum Alter von 60 bei etwa 22%, und nimmt dann ab, bis beim Alter von 100 ein Wert von etwa 4,4% erreicht ist (vgl. 2B). Kurz gesagt, während 22% der Population im Alter von 0 ein Risiko von Pankreaskrebs hatten, hatten nur noch 4,4% der überlebenden Hundertjährigen ein Risiko. Es ist anzumerken, dass nur 3,3% der in den Jahren 1900 bis 1909 geborenen Population tatsächlich an Pankreaskrebs starben. Eine der Stärken bei Verwendung von OBS(h, t) zur Berechnung von F(h) besteht darin, dass der Wert nicht von dem tatsächlichen Anteil einer Geburts-Kohorte, die an der beobachteten Krankheit stirbt, abhängt. F(h) definiert den Anteil einer Geburtsjahr-Kohorte, der in einer imaginären Welt, in der Pankreaskrebs die einzige Todesart darstellen würde, an Pankreaskrebs sterben würde, d.h. F(h) ist der Anteil der Kohortenpopulation, der möglicherweise an Pankreaskrebs sterben könnte.
  • 2.2. Verteilung von inaktivierenden und stillen Mutationen in Genen
  • In dem Beispiel von Pankreaskrebs beträgt Fh, das aus den Werten von 2A und Gleichung 2 hergeleitet ist, etwa 0,22. Dies legt nahe, dass mindestens 22% der Population ein mit der Pankreaskrebs-Krankheit zusammenhängendes Gen enthalten (monogene Hypothese). Diese Allelvarianten können aus Rasterverschiebungen, Stopp-Codons, Veränderungen von Spleißstellen, inaktivierenden Nonsense-Mutationen, großen Additionen oder Deletionen bestehen. Punktmutationen wären in allen diesen Klassen vertreten, mit Ausnahme von großen Additionen und Deletionen. Zusätzlich zu exprimierten Mutationen würde man erwarten, einen Satz von stillen (kryptischen) Mutationen zu sehen, hauptsächlich von der Art einer Fehlsinn- oder „Wobble"-Mutation, wenn sie in Exons liegen, jedoch von allen Arten, wenn sie in Introns liegen.
  • Man kann erwarten, dass die numerische Verteilung von Allelvarianten aus einigen wenigen Punktmutationen (z.B. Polymorphismen), die mit großen Häufigkeiten in der Population vorliegen, und zahlreichen anderen Punktmutationen besteht, die mit niedrigeren Häufigkeiten vorliegen. Diese quantitative Verteilung von Mutationen über eine DNA-Sequenz muss auch berücksichtigt werden, wenn man Untersuchungen von Punktmutationen in Populationen plant.
  • Um uns mit einer solchen Verteilung von bekannten seltenen Punktmutationen vertraut zu machen, die ein typisches menschliches Gen inaktivieren, untersuchten wir den Satz aller solchen bekannten Mutationen, die das Hprt-Gen inaktivieren (in Exons und benachbarten Spleißstellen), in menschlichen Zellen. Mutationen in diesem Gen und DNA-vermittelte Transformationen wurden in den frühen 1960er Jahren von Szybalska und Szybalski (1962) untersucht. Etwa ein Dutzend „Hot-Spots" wurden gefunden, die für etwa 50% aller Hprt-Mutationen verantwortlich sind (Kat, 1992; Kat et al., 1993). Der Anteil von einzelnen Mutationen reicht von etwa 0,1% bis zu über 10% der gesamten beobachteten Mutationen, von denen jede das Hprt-Gen inaktiviert. Wenn wir dieses Beispiel auf die Punktmutationen anwenden, die das Risiko von Pankreaskrebs erzeugen, würden wir erwarten, dass mindestens 22% der Population eine solche inaktivierende Mutation in dem einen Allel des Gens enthalten würden. Dagegen würden wir erwarten, die Mutation in nur 11% der Population als einen „Hot-Spot" zu finden, wenn wir die Sequenzen von Exons und Spleißstellen untersuchen würden. Wenn man davon ausgeht, dass diese in zehn verschiedenen Punktmutationen zu finden sind, wurde eine durchschnittliche Punktmutation in etwa 1,1% der Population von Neugeborenen zu erwarten sein. Zusammen mit diesen „Hot-Spots", welche das Gen inaktivieren, würden mehrere Mutationen auftreten, die keine Wirkung auf die Genexpression haben (stille oder kryptische Mutationen).
  • Stille ererbte Punktmutationen in der allgemeinen Population wurden im APC-Gen durch zahlreiche Labors festgestellt (Fodde et al., 1992; Nagase et al., 1992; Powell et al., 1992; Dobbie et al., 1994; Groden et al., 1991). Wir haben diese Veröffentlichungen gesammelt und stellen zusammenfassend fest, dass es 15 stille polymorphe Mutationen gibt, die über die cDNA des APC-Gens verteilt sind. Die Häufigkeiten von jedem SNP liegen im Bereich von 1 bis 40% aller sequenzierten Allele.
  • Mit unserer vorgeschlagenen technologischen Vorgehensweise könnten unter Verwendung von 10 000 gemischten Blutproben seltene Punktmutationen, die mit einer so geringen Häufigkeit wie 0,05% auftreten, mit einer vernünftigen Genauigkeit beobachtet werden. Ein solches Ergebnis würde durch zehn Individuen zustand kommen, die ein mutiertes Allel enthalten, wobei die 95-%-Vertrauensgrenzen bei einer solchen Erwartung zwischen 5 und 18 liegen. In einem Gen, bei dem Mutationen zu einem erhöhten Risiko führen können, mit einem Alter von mehr als 50 Jahren durch Krebs, Diabetes oder Atherosklerose zu sterben, kann man erwarten, dass in Neugeborenen einzelne stille Punktmutationen etwa mit gleichen Anteilen vorliegen wie inaktivierende Polymorphismen. Man kann davon ausgehen, dass sich diese Anteile von stillen Punktmutationen in Populationen von Testpersonen und von Hundertjährigen nicht ändern.
  • 2.3. Einzelne genetische Risikofaktoren: monogene Krankheiten
  • Einige Krankheitsrisiken sind durch die Vererbung einer inaktivierenden Mutation eines/jedes der Allele („of either allele") von einem einzigen und nur einem Gen definiert. Wir bezeichnen dies als monogene Risiken und in unserer Formel: Fh = Fgenet. × FUmwelt Ein Beispiel wurde in 1 erläutert, wobei Gen-„A"-Heterozygote die Subpopulation mit Risiko für einen sporadischen Krebstyp darstellen. Alle Gen-inaktivierenden Punktmutationen („Point mutations") im Gen „A" zum Zeitpunkt der Geburt, würden zur Bestimmung von Fh beitragen, des Risikoanteils unter den Neugeborenen. Unter Verwendung des Ausgangswerts, der durch die Bestimmung von Fh erhalten wurde, und der Werte von X(h, t) aus 2B errechneten wir die erwartete Zahl von seltenen Punktmutationen („Point mutations") als Funktion des Alters in zufällig ausgewählten Populationen von 10 000 Personen.
  • Population von Neugeborenen, geboren im Jahr 1998,
    X(h, t) = X(1998, 0) = Fh = 0,22
    Von 10 000 Individuen wurden Proben genommen.
    Von 2200 Individuen würde man erwarten, dass sie ein mit einer Krankheit zusammenhängendes Allel enthalten.
    Von 1100 Individuen würde man erwarten, dass sie einen nachweisbaren, mit einer Krankheit zusammenhängenden Polymorphismus in den Exons und Spleißstellen des Gens enthalten.
    110 Individuen würden einen bestimmten nachweisbaren inaktivierenden Polymorphismus mit einer durchschnittlichen Allel-Häufigkeit von 5,5 × 10–3 enthalten.
    110 Individuen würden einen bestimmten stillen Polymorphismus mit einer durchschnittlichen Allel-Häufigkeit von 5,5 × 10–3 enthalten.
  • Population von Testpersonen, X = 1
    Von 10 000 Individuen wurden Proben genommen; von allen würde man erwarten, dass sie ein mit einer Krankheit zusammenhängendes Allel enthalten.
    Von 5000 Individuen würde man erwarten, dass sie einen nachweisbaren, mit einer Krankheit zusammenhängenden Polymorphismus in den Exons und Spleißstellen des Gens enthalten.
    500 Individuen würden einen bestimmten nachweisbaren inaktivierenden Polymorphismus mit einer durchschnittlichen Allel-Häufigkeit von 2,5 × 10–2 enthalten.
    110 Individuen würden einen bestimmten stillen Polymorphismus mit einer durchschnittlichen Allel-Häufigkeit von 5,5 × 10–3 enthalten.
  • Population von Hundertjährigen, X(h, t) = X(1895, 100+) = 0,044
    Von 10 000 Individuen wurden Proben genommen.
    Von 440 Individuen würde man erwarten, dass sie ein mit einer Krankheit zusammenhängendes Allel enthalten.
    Von 220 Individuen würde man erwarten, dass sie einen nachweisbaren, mit einer Krankheit zusammenhängenden Polymorphismus in den Exons und Spleißstellen des Gens enthalten.
    22 Individuen würden einen bestimmten nachweisbaren inaktivierenden Polymorphismus mit einer durchschnittlichen Allel-Häufigkeit von 1,1 × 10–3 enthalten.
    110 Individuen würden einen bestimmten stillen Polymorphismus mit einer durchschnittlichen Allel-Häufigkeit von 5,5 × 10–3 enthalten.
  • 2.4. Mehrere unabhängige genetische Risikofaktoren: multigene Krankheit
  • Eine einzelne Krankheit kann auch als Ergebnis von ererbten Mutationen an einem beliebigen von mehreren unabhängigen Loci entstehen. Zwei Beispiele von Krankheiten, die sich möglicherweise klinisch ähnlich präsentieren, die jedoch tatsächlich aus einer Mutation in einem beliebigen Vertreter von verschiedenen Genen bestehen, sind die autosomal dominante polyzystische Nierendegeneration (ADPKD) (Mochizuki et al., 1996) und die Diabetes mellitus des Pubertätsalters („maturity-onset diabetes of the young") (MODY) (Velho und Froguel, 1997).
  • Wenn inaktivierende Mutationen in einem beliebigen Gen von einem Satz von fünf Genen vorliegen, die unabhängig in der Lage sind, ein Risiko für Pankreaskrebs zu erzeugen, dann kann man davon ausgehen, dass die Häufigkeit dieser mutierten „Hot-Spots" im Vergleich zu dem vorstehend betrachteten monogenen Fall durchschnittlich um einen Faktor von fünf verringert wäre. Wir stellen diesen Fall für ein multigenes Risiko dar durch, Fh = Fh,A ∪ Fh,B ∪ Fh,C ..., wobei Fh,A = Fgenet.„A" × FUmwelt„1", Fh,B = Fgenet.„B" × FUmwelt„2", usw.. Wenn man den Fall eines auf diese Weise definierten Pankreaskrebs-Risikos untersucht, ist zu sehen, dass nun der Nachweis eines mutierten Anteils für eine Probengröße in der Größenordnung von 10 000 so niedrig war wie 0,1%. X(A) bedeutet den überlebenden Anteil mit einem Risiko für eine Krankheit, die durch das Gen „A" vermittelt wird, ein bestimmtes spezifisches Gen der fünf möglichen Gene, „A", „B", „C", „D" und „E", in denen ein ererbtes inaktivierendes Allel ein Risiko für Pankreaskrebs erzeugt. Man kann wie im vorstehenden Beispiel der monogenen Vererbung die erwarteten Werte für Populationen von Neugeborenen, von Testpersonen und von Hundertjährigen berechnen. Wir sparen uns hier die arithmetischen Ausführungen, die Ergebnisse hiervon sind in Tabelle 1 zu finden.
  • 2.5. Mehrere interagierende Risikofaktoren: polygene Krankheit
  • Eine Krankheit kann durch die Kombination von ererbten Mutationen in zwei oder mehreren Genen verursacht werden. Zu solchen Krankheiten scheinen die Schizophrenie (Portin und Alanen, 1997) und der nicht Insulin-abhängige Diabetes mellitus (Galli et al., 1996; Velho und Froguel, 1997) zu zählen. Zur Erläuterung nehmen wir den Fall von zwei getrennten Genen und die Daten für Pankreaskrebs. In unserem Ansatz stellen wir den polygenen Fall durch Fh = Fh,A ∩ Fh,B dar. Das geometrische Mittel des mutierten Anteils aus den Genen „A" und „B" erzeugt zusammen ein Risiko, dargestellt durch F = 0,22, das gerade (0,22)1/2 oder 0,47 beträgt. Deshalb kann man in unserem Beispiel erwarten, dass 47% inaktivierende Polymorphismen in einem der Gene „A" oder „B" enthalten. Die Erwartungen für Neugeborene, Testpersonen und Hundertjährige können sodann wie vorstehend für einen monogenen Risikofaktor heraus gearbeitet werden. Wieder sparen wir uns die arithmetische Darstellung und geben die Ergebnisse in Tabelle 1 wieder.
  • 2.6. Erwartete Werte
  • Um eine Studie von Punktmutationen in der allgemeinen Bevölkerung zu planen, benötigt man Bestimmungen sowohl von den erwarteten Werten als auch von ihrer Streuung für verschiedene mögliche biologische Situationen, wie vorstehend angesprochen. Wir präsentieren in Tabelle 1 unsere Schätzungen der Zahl von Individuen zusammen mit ihren 95-%-Vertrauensgrenzen (±2 Standardabweichungen) in einer Population von 10 000 für die Situationen von monogenen, multigenen und polygenen Risikofaktoren für Pankreaskrebs. Außerdem gibt Tabelle 1 die damit zusammenhängende Allel-Häufigkeit für jeden der Fälle an. Die statistischen Grenzen werden für eine einzige Punktmutation berechnet, die etwa 10% des Satzes von exprimierten (wichtigen) Mutationen umfasst. Die Verwendung mehrerer Punktmutationen in jedem Gen oder der Summe aller Punktmutationen, die altersabhängige Änderungen zeigen, erhöht deutlich die Auflösung der Untersuchungen, wie hier gezeigt wird. Wir verwenden Beispiele von fünf und zwei Risikofaktor-Genen, die an multigenen bzw. polygenen Krankheitsmodellen beteiligt sind.
  • Tabelle 1 Erwartete Zahl von Individuen und damit zusammenhängende Allel-Häufigkeit (AF) für inaktivierende und stille Polymorphismen in den berechneten Situationen von monogenen, mehreren unabhängigen (multigenen Krankheit) und mehreren inaktivierenden (polygene Krankheit) Risikofaktoren bei Pankreaskrebs
    Figure 00400001
  • 2.7. Wirkung der Population-Probengröße
  • Es gibt eine Reihe von Durchfluss-Vorrichtungen, mit denen Blutproben gewonnen und die Zahl von Punktmutationen in der allgemeinen Bevölkerung untersucht werden können. Einige haben vorgeschlagen, dass so wenige wie hundert Spender ausreichen würden, um wichtige Polymorphismen zu definieren. Viele haben vermutet, dass die Zahl 1000 ein Kompromiss sein könnte zwischen der Erkenntnis, dass „größere Proben besser sind", und den praktischen Grenzen, die durch die Kosten der „aufeinanderfolgenden Sequenzierung" sogar in den größten Labors, die an der Sequenzierung des menschlichen Genoms arbeiten, gestellt werden. Um die Überlegungen dieser Beschreibung in diese Diskussion über eine geeignete Probengröße einzubringen, betrachten wir hier die erwarteten Variationen in Experimenten, die 1000 Blutspender umfassen, im Vergleich zu denjenigen, die 10 000 Blutspender umfassen, die aus einer noch viel größeren Population zufällig entnommen werden.
  • Die 3A bis 3F zeigen die erwartete Zahl ±2 SD bei gegebenen Populationsgrößen von 1000 und 10 000 für die hypothetischen Situationen von monogenen, multigenen (n = 5) und polygenen (n = 2) Risiken bei Pankreaskrebs, analysiert für Populationen von 10 000 im vorher gehenden Abschnitt. Es ist klar, dass mit einer Probe von 1000 eine Unterscheidung zwischen Populationen von Neugeborenen, Testpersonen und Hundertjährigen bezüglich eines Polymorphismus, der mit der erwarteten Häufigkeit vorkommt, bei einer 95-%-Vertrauensgrenze von für den Fall der einfachen monogenen Vererbung möglich ist, nicht jedoch für multigene oder polygene Risikofaktoren.
  • Diese Vertrauensgrenzen beziehen sich auf einen einzigen und nur einen SNP, der unter den drei Gruppen verglichen wird. Bei einem Überprüfen von 500 bis 1000 bp der menschlichen DNA kann man von 5 bis 10 getrennten inaktivierenden Punktmutationen („Point mutations") ausgehen, wodurch die Fähigkeit deutlich gesteigert wird, die Beteiligung des Gens an einer tödlichen Krankheit zu erkennen.
  • Eine weitere Überlegung betrifft die Populationsgröße, die erforderlich ist, um schädliche Mutationen zu untersuchen, die auch rezessive deletäre Mutationen sind. In solchen Fällen würde für jedes Gen, das rezessive deletäre Mutationen trägt, die Summe ihrer Häufigkeiten etwa 2% betragen. Etwa 1% würde bei der Durchmusterung von Exons und Spleißstellen eines Protein-codierenden Gens festgestellt werden, und die Häufigkeiten von einzelnen Punktmutationen würden etwa 0,1% oder weniger betragen. In solchen Fällen wären Studien in Populationen von 100 000 oder mehr Individuen erforderlich, um eine statistisch signifikante altersabhängige Abnahme von schädlichen Allelen, die auch rezessive deletäre Allele sind, zu beobachten.
  • 2.8. Kann man 10 000 Proben von Hundertjährigen bekommen?
  • Das historische Profil von noch lebenden Personen mit extrem hohen Alter ist in 4 für die US-Population von europäisch-amerikanischen Frauen (EAF) und Männern (EAM) aus den Jahren 1910 bis 1991 dargestellt (für 1910–1933 haben nur 20–48 US-Staaten Daten an das Sterberegister übermittelt) (Census, 1900–1936; DHHS 1937–1992). Sowohl die männliche als auch die weibliche „100+"-Gruppe nimmt schnell zu, dies zeigt, dass heute mehr als 40 000 Hundertjährige in den Vereinigten Staaten leben.
  • Wie in 2B dargestellt, beträgt der Anteil für das Pankreaskrebs-Risiko bei den europäisch-amerikanischen Männern mit einem Alter von mehr als 100 (X(h, t) = X(1895, 100+) immer noch 0,044. Da noch etwa 5000 solcher Individuen am Leben waren, würden 5000 × 0,044 = 220 dieser Hundertjährigen noch das Risiko haben, an Pankreaskrebs zu sterben.
  • 2.9. Betrachtungen zur Größe von Blutproben
  • Um Häufigkeiten von Allelen in einer Population mit der gewünschten statistischen Genauigkeit zu bestimmen, muss die Zahl der pro Person gewonnenen Zellen groß genug sein, um die numerische Variation zu reduzieren und vernünftige konstante Werte bei allen Proben zu erreichen. Ein μl Blut enthält 1000 bis 5000 Leukocyten (McDonald et al., 1970; Rifkind et al., 1976). Dies ist etwa 10- bis 15-mal mehr als die Mindestzahl von 100 Zellen, die erforderlich sind, um die Variation für ein Allel, das in nur einer Person der gesamten gepoolten Probe vorliegt, auf einen akzeptierbaren Wert von ±20% zu reduzieren. Eine Probengröße, die 1000 Zellen umfasst, ist ausreichend, um die numerische Variation auf weniger als 6,3% zu reduzieren (95-%-Vertrauensgrenze).
  • Man muss nicht für jede DNA-Sequenz, die untersucht werden soll, eine getrennte gemischte Probe von 10 000 oder mehr Blutproben herstellen. Wir haben das Verfahren verbessert, bei dem Biotin-markierte Sonden verwendet werden, um gewünschte Restriktionsfragmente aus menschlichen genomischen DNA-Proben zu isolieren, so dass eine 10 000-fache Reinigung erhalten wird und die restliche DNA-Probe noch für zahlreiche weitere Extraktionen für andere Sequenzen verfügbar bleibt (Li-Sucholeiki und Thilly, 1998, im Druck). Wir schätzen, dass 1-ml-Proben, die mindestens 1 Million Leukocyten (WBCs) enthalten, von jeder von 10 000 Personen genügend Material zur Verfügung stellen würden, um einen Satz von etwa 1 × 106 Sequenzen von jeweils 100 oder mehr bp zu untersuchen. Diese Menge entspricht in etwa derjenigen Menge, die erforderlich ist, um alle Gene des menschlichen Genoms anhand der hier beschriebenen Verfahren zu untersuchen.
  • 2.10. Effekt der Zusammensetzung der Population
  • Bei der Interpretation von Studien über Punktmutationen als Funktion des Alters gibt es zahlreiche Fehlermöglichkeiten. Diese liegen im Allgemeinen außerhalb des Bereich dieses Artikels, betreffen jedoch alle solchen Studien, unabhängig von den verwendeten Analyseverfahren. Z.B. muss man vernünftigerweise annehmen, dass Neugeborene im Jahr 1998 nicht der ethnischen Verteilung von Neugeborenen im Jahr 1898 entsprechen, von denen die Hundertjährigen von 1998 abstammen. Wenn also eine kleine ehemalige Population von Immigranten, die 1% der Neugeborenen ausmachen, eine bestimmte Punktmutation in 50% ihrer Allele enthalten würde, würde es so aussehen, als hätte die Population von Neugeborenen insgesamt einen SNP-Anteil von 0,5%. Wenn man annimmt, dass die Allel-Häufigkeit in der älteren vorhandenen Population sehr gering war (< 10–4), würde ein signifikanter Unterschied zwischen Neugeborenen und Hundertjährigen für diese einzelne Punktmutation zu ersehen sein. Jedoch, und dieser Punkt kann nicht genug betont werden, untersuchen wir mit unserer Vorgehensweise zwei oder mehrere seltene Punktmutationen innerhalb des gleichen Gens. Für eine Folgerung, dass ein Gen eine wichtige Rolle bei der Mortalität spielt, müssen zwei oder mehr verschiedene Punktmutationen in den Neugeborenen/Hundertjährigen abnehmen, umfassend z.B. den Satz aller Nonsense-Punktmutationen.
  • 2.11. Punktmutationen, die mit anderen Risiko-definierenden Polymorphismen gekoppelt sind
  • Kohorten mit einer Krankheit oder einer nicht vorhandenen Krankheit können aus einer allgemeinen oder begrenzten Zahl von Gründern in der Geschichte der menschlichen Populationen hergeleitet werden. Da das ursächliche Allel für eine Krankheit oder für das Fehlen einer Krankheit für zehn oder hunderte von Generationen genetisch gekoppelt bleiben kann (Myant et al., 1997), könnte der Nachweis einer veränderten Allel-Häufigkeit innerhalb der Population von Testpersonen entweder das Vorliegen einer ursächlichen Punktmutation oder das Vorliegen einer Punktmutation („Point mutation"), die an eine extragene ererbte Mutation gekoppelt verbleibt, anzeigen.
  • Wir würden gerne hervorheben, dass die Untersuchung von mehreren Punktmutationen im gleichen Gen eine Unterscheidung zwischen diesen zwei Möglichkeiten erlaubt. Eine Änderung in der Häufigkeit von einer einzelnen Punktmutation („Point mutation") bei Populationen als Ergebnis einer Kopplung kann aus der Kausalität differenziert werden, indem die Häufigkeiten von mehreren Punktmutationen, von denen man erwartet, dass sie die Genfunktion beeinflussen, bei den untersuchten Populationen verglichen werden. Wenn die Häufigkeit von einer einzigen und nur von einer Punktmutation („Point mutation") sich zwischen zwei untersuchten Populationen ändert, dann muss eine Kopplung als die Ursache vermutet werden. Wenn jedoch mehrere inaktivierende Punktmutationen („Point mutations") innerhalb des Gens zwischen zwei Populationen ähnliche Änderungen in der Häufigkeit zeigen, ist die Schlussfolgerung gerechtfertigt, dass das in Frage kommende Gen eine kausale Rolle bei der Mortalität spielt.
  • 3. Diskussion
  • Wir zeigen hier, dass die Verwendung einer Technologie, die für die Mutations-Spektrometrie in menschlichen Geweben entwickelt wurde, für die Aufgabe eingesetzt werden kann, seltene Punktmutationen zu definieren, welche ein Risiko für eine tödliche Krankheit bewirken. Die dadurch gebotenen technischen Fortschritte würden es möglich machen, Sequenzen innerhalb eines beliebigen Gens in Proben zu untersuchen, die von 10 000 und mehr Personen gewonnen wurden.
  • Außerdem wendeten wir unsere kürzliche Erweiterung des mehrstufigen Modells der Karzinogenese von Knudson-Moolgavkar auf die Daten der altersabhängigen Geburtsjahr-Kohorten-abhängigen Mortalität durch Pankreaskrebs an. Dieses Verfahren sollte dazu dienen, Wege zu zeigen, wie die Beobachtung von verringerten Häufigkeiten bestimmter Punktmutationen in älteren Populationen dazu verwendet werden könnte, Genen zu identifizieren, die an der Pathologie von Krebs und anderen altersabhängigen Krankheiten beteiligt sind.
  • Die von uns vorgeschlagene Verwendung von CDCE/hifiPCR in einem methodischen Vergleich von Populationen von Neugeborenen, Testpersonen und extrem alten Menschen lässt erwarten, dass eine Identifizierung von Punktmutationen, die mit Häufigkeiten von weniger als 0,005% auftreten, mit einer vernünftigen Genauigkeit möglich ist, wenn von 100 000 Personen Proben genommen werden. Mehrere Punktmutationen im gleichen Gen, von denen einige in den extrem alten Menschen abnehmen und in den Testpersonen zunehmen, würden eine Hypothese stützen, dass Mutationen in dem Gen selbst eine Subpopulation mit Risiko erzeugen. Andererseits würde eine Abnahme der Häufigkeit von einer einzigen und nur einer Punktmutation in einem Gen in den Populationen von Hundertjährigen, während inaktivierende Polymorphismen unverändert bleiben, eine Kopplung an ein nahe gelegenes Allel vermuten lassen, welches ein Risiko für die beobachtete Krankheit definiert. Ein interessanter Punkt besteht darin, dass ein Labor anhand dieser Technologie Punktmutations-Spektren von Neugeborenen und von Hundertjährigen vergleichen könnte, ohne dass die physiologische Funktion einer untersuchten DNA-Sequenz bekannt sein müsste. Eine Entdeckung von mehreren Punktmutationen, die bei Hundertjährigen abnehmen, würden diese Sequenz als eine Sequenz identifizieren, die ein Gen codiert, welches die Langlebigkeit beeinflusst.
  • Außerdem können die Verfahren auf nicht-tödliche Krankheiten angewendet werden, indem Populationen mit einem Risiko anhand anderer phänotypischer Merkmale identifiziert werden, z.B. von Proteinexpressionsraten oder Enzymaktivitäten. Es ist klar, dass die Bestimmung der genetischen Varianten innerhalb menschlicher Populationen, die das Risiko eines frühen Todes definieren oder die eine Empfindlichkeit gegenüber Umweltchemikalien oder Pharmazeutika vermitteln können, sowohl in der Epidemiologie als auch in der Erforschung von Umwelt- und Gesundheitsthemen eine wichtige Rolle spielen werden.
  • Referenzen, die in Beispiel 1 zitiert sind
    • Agundez, J., Rodriguez, I., Olivera, M., Ladero, J., Garcia, M., Ribera, J. und Benitez, J. (1997) CYP2D6, NAT2 and CYP2E1 genetic polymorphisms in nonagenarians. Age Ageing 26, 147–151.
    • Arnheim, N., Strange, C. und Erlich, H. (1985) Use of pooled DNA samples to detect linkage disequilibrium of polymorphic restriction fragments and human disease: Studies of the HLA class II loci. Proc. Natl. Acad. Sci. USA 82, 6970–6974. Census, U.S. Bureau: Mortality Statistics. US Government Printing Office, Washington, 1900–1936.
    • Chee, M., Yang, R., Hybbell, E., Berno, A., Huang, K., Stern, D., Winkler, J., Lockhart, D., Morris, M. und Fodor, S. (1996) Accessing genetic information with high-density DNA arrays. Science 274, 610–614.
    • Comuzzie, A., Hixson, J., Almasy, L., Mitchell, B., Mahaney, M., Dyer, T., Stern, M., MacCluer, J. und Blangero, J. (1997) A major quantitative trait locus determining serum leptin levels and fat mass is located on human chromosome 2. Nat. Genet. 15, 273–276.
    • Daly, A., Cholerton, S., Armstrong, M. und Idle, J. (1997) Genotyping for polymorphisms in xenobiotic metabolism as a predictor of disease susceptibility. Environ. Health. Perspect. 102, 55–61.
    • DHHS, U.S.: National Center for Health Statistics. In: Services, U.S.D.o.H.a.H. (Ed.), Vital Statistics of the United States. US Government Printing Office, Hyattsville, 1937–1992.
    • Dobbie, Z., Spycher, M., Hurliman, R., Ammann, R., Ammann, T., Roth, J., Muller, A., Muller, H. und Scott, R. (1994) Mutational analysis of the first 14 exons of the adenomatous polyposis coli (APC) gene. Eur. J. Cancer 30A, 1709–1713.
    • Fischer, S. und Lerman, L. (1983) DNA fragments differing by single base-pair substitutions are separated in denaturing gradient gels: Correspondence with melting theory. Proc. Natl. Acad. Sci. USA 80, 1579–1583.
    • Fodde, R., Van der Luijt, R., Wijnen, J., Tops; C., Van den Klift, H., Van Leeuwen-Cornelisse, I., Griffioen, G., Vassen, H. und Kahn, P. (1992) Eight novel inactivating germ line mutations at the APC gene identified by denaturing gradient gel electrophoresis. Genomics 13, 1162–1168.
    • Galli, J., Li, L., Glaser, A., Ostenson, C., Jiao, H., Fakhrai-Rad, H., Jacob, H., Lander, E. und Luthman, H. (1996) Genetic analysis of non-insulin dependent diabetes mellitus in the GK rat. Nat. Genet. 12, 31–37.
    • Groden, J., Thliveris, A., Samowitz, W., Carlson, M., Gelbert, L., Albertsen, H., Joslyn, G., Stevens, J., Spirio, L., Robertson, M. und et, a. (1991) Identification and characterization of the familial adenomatous polyposis coli gene. Cell 66, 589–600.
    • Guldberg, P., Henriksen, K. und Guttler, F. (1993) Molecular analysis of phenylketonuria in Denmark: 99% of the mutations detected by denaturing gradient gel electrophoresis. Genomics 17, 141–146.
    • Herrero-Jimenez, P., Thilly, G., Southam, P., Tomita-Mitchell, A., Morgenthaler, S., Furth, E. und Thilly, W. (1998) Mutation, cell kinetics and subpopulations at risk for colon cancer in the United States. Mutat. Res. 400, 553–578.
    • Hu, G. und Thilly, W. (1994) Evolutionary trail of the mitochondrial genome as based on human 16S rDNA pseudogenes. Gene 147, 197–204.
    • Hu, G. und Thilly, W. (1995) Multi-copy nuclear pseudogenes of mitochondrial DNA reveal recent acute genetic changes in the human genome. Curr. Genet. 28, 410–414.
    • Kaiser, J. (1997) Environment institute lays plans for gene hunt., Science 278, 569–574.
    • Kat, A., 1992,. PhD, MIT.
    • Kat, A., Thilly, W., Fang, W.-H., Longley, M., Li, G. M. und Modrich, P. (1993) An alkylation-tolerant, mutator human cell line is deficient in strand-specific mismatch repair. Proc. Natl. Acad. Sci. USA 90, 6424–6428.
    • Kervinen, K., Savolainen, M., Salokannel, J., Hynninen, A., Heikkinen, J., Ehnholm, C., Koistinen, M. und Kesanierni, Y. (1994) Apolipoprotein E and B polymorphisms-longevity factors assessed in nonagenarians. Atherosclerosis 105, 89–95.
    • Khrapko, K., Coller, H., Andre, P., Li, X., Foret, F., Belenky, A., Karger, B. und Thilly, W. (1997) Mutational spectrometry without phenotypic selection: human mitochondrial DNA. Nucleic Acids Res. 25, 685–693.
    • Khrapko, K., Hanekamp, J., Thilly, W., Belenky, A., Foret, F. und Karger, B. (1994) Constant denaturant capillary electrophoresis (CDCE): a high resolution approach to mutational analysis. Nucleic Acids Res. 22, 364369.
    • Kinzler, K. W. und Vogelstein, B. (1996) Lessons from hereditary colorectal cancer. Cell 87, 159–170.
    • Knudson, A. G. J. (1971) Mutation and cancer. Statistical study of retinoblastoma. Proc. Natl. Acad. Sci. USA 68, 820–823.
    • Koreth, J., O'Leary, J. J. und McGee, J. O. (1996) Microsatellites and PCR genomic analysis. J. Pathol. 178, 239–248.
    • Li-Sucholeiki, X.-C. und Thilly, W. G.: Scanning technology for point mutants within 100-bp sequences in human blood and tissues. Disease Gene Identification: Methods and Protocols, in Methods in Molecular Medicine, 1998, The Humana Press, Inc., Totowa, NJ, im Druck.
    • Marshall, E. (1997) Snipping away at genome patenting. Science 277, 1752–1753.
    • McDonald, G., Dodds, T. und Cruickshank, B., 1970, Atlas of Haematology. E & S Livingstone Limited, London.
    • Mochizuki, T., Wu, G., Hayashi, T., Xenaphontos, S., Veldhuisen, B., Saris, J., Reynolds, D., Cai, Y., Gabow, P., Pierides, A., Kimberling, W., Breuning, M., Deltas, C., Peters, D. und Somlo, S. (1996) PKD2, a gene for polycystic kidney disease that encodes an integral membrane protein. Science 272, 1339–1342.
    • Moolgavkar, S. H., Dewanji, A. und Venzon, D. J. (1988) A stochastic two-stage model for cancer risk assessment. I. The hazard function and the probability of tumor. Risk. Anal. 8, 383–392.
    • Myant, N., Forbes, S., Day, I. und Gallagher, J. (1997) Estimation of the age of the ancestral arginine3500->glutamine mutation in human apoB-100. Genomics 45, 78–87.
    • Nagase, H., Miyoshi, Y., Horii, A., Aoki, T., Petersen, G., Vogelstein, B., Maher, E., Ogawa, M., Maruyama, M., Utsunomiya, J., Baba, S. und Nakamura, Y. (1992) Screening for germ-line mutations in familial adenomatous polypasis patients: 61 new patients and a summary of 150 unrelated patients. Hum. Mutat. 1, 467–73.
    • Nelen, M., Padberg, G., Peeters, E., Lin, A., van den Helm, B., Frants, R., Coulon, V., Goldstein, A., van Reen, M., Easton, D., Eeles, R., Hodgson, S., Mulvihill, J., Murday, V., Tucker, M., Mariman, E., Starink, T., Ponder, B., Ropers, H., Kremer, H., Longy, M. und Eng, C. (1996) Localization of the gene for Cowden disease to chromosome 10q22–23. Nat. Genet. 13, 114–116.
    • Orita, M., Iwahana, H., Kanazawa, H., Hayashi, K. und Sekiya, T. (1989) Detection of polymorphisms of human DNA by gel electrophoresis as single-strand conformation polymorphisms. Proc. Natl. Acad. Sci. USA 86, 2766–2770. Poland, D., 178, Cooperative Equilibria in Physical Chemistry. Oxford University Press, Oxford.
    • Portin, P. und Alanen, A. (1997) A critical review of genetic studies of schizophrenia. II. Molecular genetic studies. Acta. Psychiatr. Scand. 95, 73–80.
    • Powell, S., Zilz, N., Beazer-Barclay, Y., Bryan, T., Hamilton, S., Thibodeau, S., Vogelstein, B. und Kinzler, K. (1992) APC mutations occur early during colorectal tumorigenesis. Nature 359, 235–237.
    • Rifkind, R., Bank, A., Marks, P. und Nossel, H., 1976, Fundamentals of hematology. Year Book Medical Publishers, Chicago.
    • Rowen, L., Mahairas, G. und Hood, L. (1997) Sequencing the human genome. Science 278, 605–607.
    • Schachter, F., Faure-Delanef, L., Guenot, F., Rouger, H., Froguel, P., Lesueur-Ginot, L. und Cohen, D. (1994) Genetic associations with human longevity at the APOE and ACE loci. Nat. Genet. 6, 29–32.
    • Shuber, A., Michalowsky, L., Nass, G., Skoletsky, J., Hire, L., Kotsopoulos, S., Phipps, M., Barberio, D. und Klinger, K. (1997) High throughput parallel analysis of hundreds of patient samples for more than 100 mutations in multiple disease genes. Human Mol. Genet. 6, 337–347.
    • Szybalska, E. H., Szybalski. W., 1962. Genetics of human cell lines, IV. DNA mediated heritable tranformation of a biochemical trait. Proc. Natl. Acad. Sci. 48, 2026–2034.
    • Szybalski, W., 1992. Roots: Use of the HPRT gene and the HAT selection technique in DNA-mediated transformation of mammalian cells: first steps toward developing hybridoma techniques and gene therapy. BioEssays 14, 495–500. Velho, G. and Froguel, P. (1997) Genetic determinants of non-insulin-dependent diabetes mellitus: strategies and recent results. Diabetes Metab. 23, 7–17.
  • Beispiel 2
  • Zusammenfassung
  • Der Zusammenhang zwischen den molekularen Mechanismen der Mutagenese und den tatsächlichen Prozessen, durch welche die meisten Menschen Krebs bekommen, sind bisher noch wenig aufgeklärt. Was fehlt, ist ein auf Physiologie-basierendes, jedoch quantitatives Modell, das die Prozesse der Mutation, des Zellwachstums und Turnovers vereinheitlicht. Außerdem muss ein geeignetes Modell die Heterogenität der Menschen bezüglich ererbter Eigenschaften und Umwelt-Erfahrungen berücksichtigen.
  • Ein solches zusammenhängendes algebraisches Modell für die altersspezifische Inzidenz von Krebs wurde innerhalb der letzten fünfzig Jahren entwickelt. Diese Entwicklung wurde hauptsächlich durch die Bemühungen von Nordling [1], Armitage und Doll [2, 3] und Knudson und Moolgavkar [4] angespornt, durch deren Arbeiten zwei Geschwindigkeits-begrenzende Stufen definiert wurden, die in der experimentellen Karzinogenese als Stufe der Initiation und Stufe der Promotion („Förderung") identifiziert wurden. Nicht abschließend behandelt werden konnte in diesen Untersuchungen die Berücksichtigung der Heterogenität der Population und eine vollständige Beschreibung von Wachstum und genetischer Veränderung während des Wachstums von Adenomen.
  • In einem Versuch, ein einheitliches Modell zu vervollständigen, präsentieren wir hier die ersten Arbeitsschritte, um die essentiellen Parameter des zweistufigen Initiations-Promotions-Modells anhand von Colonkrebs als Beispiel explizit zu berechnen. Unter Verwendung der öffentlichen Aufzeichnungen seit den 1930er Jahren bis heute berechnen wir zuerst den Anteil mit einem primären Risiko für jede Geburtsjahr-Kohorte und beachten dabei die historischen Veränderungen. Dann berechnen wir das Produkt von Raten für „n" Initiations-Mutationen, das Produkt von Raten für „m" Promotions-Mutationen und die durchschnittliche Wachstumsrate der intermediären adenomatösen Kolonien, aus denen Colonkarzinome entstehen.
  • Es zeigt sich, dass der Anteil der Population mit einem primären Risiko für ein Colonkrebs-Risiko für die Geburtsjahr-Kohorten von 1860 bis 1930 historisch unverändert bei etwa 42% lag. Das galt für jede der vier Kohorten, die wir untersuchten (europäische und afrikanische Amerikaner beiderlei Geschlechts). Außerdem zeigen die Daten einen historischen Anstieg der Initiations-Mutationsraten für die männlichen Kohorten und der Promotions-Mutationsraten für die weiblichen Kohorten an. Interessanterweise stimmen die berechneten Raten für die Initiations-Mutationen mit den Mutationsraten überein, die aus Beobachtungen von Mutationen in peripheren Blutzellen von Personen unterschiedlichen Alters erhalten wurden. Die Adenom-Wachstumsraten unterschieden sich signifikant zwischen den Geschlechtern, waren jedoch historisch im Wesentlichen invariant.
  • Außerdem hat uns das Modell in seiner gegenwärtigen Form in die Lage versetzt, die Rate von LOH oder LOI in Adenomen zu berechnen, die zu den hohen LOH/LOI-Anteilen in Tumoren führt. Jedoch konnten wir nicht die Zahl der Ereignisse, „m", bestimmen, die während der Promotion erforderlich sind.
  • Einleitung
  • Die Mortalitätsraten von Colonkrebs sind sehr niedrig, sie steigen jedoch von der Kindheit bis zu einem Alter von etwa 60 exponentiell an. Die Raten nehmen von einem Alter von 60 bis 85 schnell und etwa linear zu, erreichen bei einem Alter von etwa 90 ein Maximum und nehmen bei einem Alter von 100 bis 104 signifikant ab. Dies gilt sowohl für Männer als auch für Frauen sowie für Personen mit europäischer (5A und 5B) oder mit nicht-europäischer Abstammung (6A und 6B; hauptsächlich afrikanische Amerikaner), aufgezeichnet als Todesfälle durch Darmkrebs in den Vereinigten Staaten von 1930 bis heute.
  • Auf der Suche nach einem quantitativen Modell, mit dem diesen Beobachtungen Rechnung getragen werden kann, postulieren wir, dass ein sporadischer Colonkrebs in einer Subpopulation mit „primärem" Risiko als Ergebnis von ererbten und/oder Umwelt-Risikofaktoren zustande kommt. In dieser Subpopulation wenden wir die Konzepte eines dreistufigen Karzinogenese-Prozesses an: Initiation, Promotion und Progression. Die Initiation ist im Modell als die Akkumulation von „n" genetischen Ereignissen in einer beliebigen normalen Zelle dargestellt, wodurch die erste Zelle eines Adenoms entsteht. In dem weiter lebenden, langsam wachsenden Adenom, stellen wir im Modell die Promotion als die Erfassung von „m" genetischen Ereignissen dar, die eine beliebige Adenomzelle zu einer Krebszelle transformieren. Von der Progression wird angenommen, dass sie weniger als drei Jahren dauert, wobei sie im Modell in Null Jahren auftritt. Somit wird die Tatsache, dass die Colonkrebsraten bis zum späten mittleren Alter niedrig sind, als die Zeit interpretiert, die für ein langsam wachsendes Adenom erforderlich ist, damit eine einzige Zelle das (die) für das Wachstum als Karzinom erforderliche(n) genetische(n) Ereignis(se) durchmachen kann. Die Latenzzeit bis zum Ausbruch der Krankheit wäre die durchschnittliche Zeit, die für ein Adenom erforderlich ist, um ein Karzinom zu erzeugen.
  • Der gleichmäßige Anstieg der Krebsraten von der Kindheit bei zu einem Alter von 80 wird als eine natürliche Zunahme der Zahl von initiierten Zellen als Funktion des Alters von der Geburt an angesehen. Der frühe exponentielle Anstieg wird als ein Ergebnis sowohl des exponentiellen Anstiegs von Parenchymzellen von der Kindheit bis zur Pubertät als auch des exponentiellen Anstiegs der Zahl von Adenomzellen mit der Zeit interpretiert. Der lineare Anstieg auf hohe Krebsraten wird als ein Ergebnis eines linearen Anstiegs der initiierten Zellen als eine Funktion des Alters nach der Pubertät und eine Folge der konstanten Zahl von Stammzellen in Erwachsenen angesehen. Diese Konzepte wurden zwar von uns etwas erweitert [5], stellen jedoch herkömmliche Verfahren in der Tradition der quantitativen Modelle des Karzinogenese-Prozesses dar.
  • Wir wichen von früheren Arbeiten ab, indem wir das Maximum der altersspezifischen Krebsmortalitätsraten verwendeten. Dieses offensichtliche Maximum in der Krebsmortalitätsrate im Alter wurde schon am Anfang festgestellt, wurde jedoch als ein Fehler bei der Diagnose und/oder den Meldungen bei den Älteren fallen gelassen [1 bis 4]. Cook, Doll und Fillingham [8] haben sich jedoch genau überlegt, dass ein echtes Maximum in der altersabhängigen Mortalitätsrate zu erwarten wäre, wenn bei einer bestimmten Subpopulation ein Risiko bestände. Aufgrund des Krebsrisikos würde eine solche Subpopulation eine höhere Todesrate insgesamt aufweisen als eine Subpopulation, bei der kein Risiko für Krebs vorläge. Wenn man Kohorten nach dem Geburtsjahr bilden würde, gäbe es einen kleineren Rest-Risikoanteil, und somit würde die beobachtete Krebsmortalitätsrate in der überlebenden Population ein Maximum erreichen und abnehmen. Außerdem sahen sie es als möglich an, dass das offensichtliche Maximum und die anschließende Abnahme durch Fehler bei der Diagnose oder den Meldungen zustande kam, sie merkten jedoch an, dass „die visuelle Inspektion der grafischen Darstellungen zeigt, dass, wenn eine Abweichung vorliegt, dies üblicherweise innerhalb des ganzen untersuchten Altersbereichs auftritt, wobei kein Zusammenhang zwischen dem Ausmaß der Abweichung nach unten und der Schwierigkeit der Diagnose gefunden wurde...".
  • Wir kehrten zu dieser Frage zurück, wobei uns jedoch ein viel größerer Datensatz vorlag, der eine Analyse einer Geburtsjahr-Kohorten-spezifischen Altersabhängigkeit der aufgezeichneten Krebsmortalität für die gesamte amerikanische Population von europäischer und afrikanischer Abstammung über einen Zeitraum von mehr als 60 Jahren möglich machte [9, 10]. Wir haben den Vorteil, dass wir die Mortalitätsraten bei den extrem alten Menschen der letzten Jahrzehnte auswerten können, da in dieser Zeit seit Beginn der staatlich geförderten Gesundheitsvorsorge für ältere Menschen die Anzahl der ungewissen Todesursachen abgenommen hat. Diese kürzlichen Daten bestätigen die Vermutung von Cook et al., dass es bei den Krebstodesraten ein echtes Maximum gibt. Wir haben auf dieser Bestätigung aufgebaut und ein verständlicheres Modell für altersspezifische Krebsmortalitätsraten in menschlichen Populationen hergeleitet.
  • Wir beziehen uns insbesondere auf die Tatsache, dass die Mortalitätsraten von der Wirksamkeit einer Behandlung und der Genauigkeit der Diagnosen nach dem Tod abhängen. Den ersten Punkt haben wir analysiert, indem wir die historischen Veränderungen in den gemeldeten Überlebensraten für Colonkrebs untersucht haben. Hinsichtlich einer Unterbewertung („underreporting") ist es tatsächlich so, dass im frühen 20. Jahrhundert zahlreiche Todesfälle von sehr alten Menschen als Todesfälle durch „hohes Alter" oder „Senilität" gemeldet wurden. Jedoch hat der Anteil der Todesfälle insgesamt mit solchen nicht-informativen Diagnosen bei den extrem alten Menschen in diesem Jahrhundert stetig abgenommen [9, 10]. Wie im Fall der Überlebensraten haben wir historische Aufzeichnungen über die Zahl von nicht-informativen Diagnosen verwendet, um das Ausmaß der Unterbewertung („underreporting") für jede Alters- und Geburtsjahr-Kohorte abzuschätzen. Außerdem haben wir die Vorteile, dass wir die genetischen Veränderungen, die beim Menschen zu Krebs führen, jetzt besser verstehen können. Wir sind davon überzeugt, dass die somatischen genetischen Beweise für ein Modell sprechen, in dem der Verlust von zwei aktiven APC-Allelen für die Initiation der meisten sporadischen Colonkrebserkrankungen ausreichend und erforderlich ist [7, 11]. Jedoch gilt unser hergeleitetes Modell allgemein für „n" Initiations-Mutationen, so dass ein einfaches Testen von anderen Hypothesen möglich ist. Seltsamerweise scheinen zahlreiche Mutationen, die in malignen Tumoren festgestellt wurden, z.B. in den ras-Proto-Onkogenen oder im TP53-Gen, nicht Teil der Initiations- oder Promotions-Prozesse zu sein, da sie in Sektoren, nicht jedoch in der Gesamtheit von Tumoren, in denen sie gemessen werden, auftreten. Die Tatsache, dass diese Mutationen nicht in jeder Karzinomzelle vorliegen, legt nahe, dass sie nicht zu den Rate-begrenzenten Schritten in normalen Gewebezellen oder Adenomen zählen, welche die altersspezifischen Mortalitätsraten definieren, wie hier im Modell dargestellt. Diese post-adenomatösen Mutationen können als wichtige Schritte in der Tumorprogression angesehen werden, die, für unsere Zwecke, als ein relativ schneller Prozess von weniger als drei Jahren Dauer angesehen wird.
  • Beim Erstellen unseres quantitativen Modells für die Promotion haben wir auch die Tatsache berücksichtigt, dass frühe Colonkarzinome und Adenome einen deutlichen Verlust von Heterozygotie (LOH) für informative Loci auf allen Chromosomen aufweisen, im Durchschnitt 22% [12 bis 17]. In einer einzelnen Studie wurde gefunden, dass der Verlust der genomischen Prägung („genomic imprinting") (LOI) bei colorektalen Krebserkrankungen für einen einzelnen Marker 44% beträgt [18]. Wir setzten unser Modell für „m" Promotions-Mutationen ein, um plausible Mechanismen zu erkunden, welche diesen hohen LOH- und LOI-Anteilen Rechnung tragen.
  • Wir haben die meisten mathematischen Ableitungen in einem Anhang angegeben, wir haben jedoch nicht gezögert, die algebraischen Formeln, die für das Verständnis der Logik des Modells erforderlich sind, zusammen mit den Erklärungen ihrer physikalischen Bedeutung zu präsentieren. Die primären Datensätze, aus denen alle unsere Berechnungen hervorgehen, sind anhand unserer Webseite hhtp://cehs4.mit.edu für die Verwendung durch alle Forscher verfügbar.
  • Material: Populationsdaten und bekannte physiologische Parameter
  • 1. Primäre Populationsdatensätze
  • A. Daten zur Mortalität
  • Die jährlichen altersspezifischen Mortalitätsdaten für die US-Population wurden vom „US Department of Health and Human Services" (Vital Statistics of the United States, 1937–1992 [9] und „US Bureau of the Census" (Mortality Statistics, 1900–1936) [10], erhalten. Die Populationsdaten wurden vom „Duke Center for Demographic Studies" für die Jahre 1950 bis 1992 zur Verfügung gestellt. Für frühere Jahre leiteten wir die Populationsschätzungen direkt von Census-Zählungen für diejenigen Staaten und Länder her, welche die Werte an die nationalen Sterberegister meldeten. Durch Kombination dieser Datensätze wurde es möglich, die altersspezifische Mortalitätsrate für jedes Geburtsjahr, (h), zu berechnen, die mit OBS(h, t) für „beobachtete" („OBServed") Colonkrebs-Mortalitätsrate bezeichnet wird.
  • Figure 00540001
  • In den 5A, 5B, 6A und 6B sind die Aufzeichnungen der altersspezifischen Colonkrebs-Mortalität für die Geburtsjahre zwischen 1840 und 1930 für europäische bzw. nicht-europäische Amerikaner zusammengestellt. Die Daten der altersspezifischen Mortalität wurden in Gruppen mit 5-Jahres-Intervallen eingeteilt, 0–4, 5–9, ..., 90–94, 95–99, 100+. Das durchschnittliche Alter für diese Gruppen beträgt etwa 2,5, 7,5, ..., 97,5 und 102,5, und es steht in unserer Verwendung hier für diese Altersstufen. Um die Präsentation der Daten zu vereinfachen, haben wird die Todesfälle und Populationen von Individuen, die im gleichen Jahrzehnt geboren sind, summiert. Die 1830er stehen für Personen, die in den Jahren 1830 bis 1839 geboren sind, usw..
  • Darmkrebs-Aufzeichnungen gibt es seit dem Jahr 1930, Aufzeichnungen für Colonkrebs dagegen erst seit dem Jahr 1958, als eine spezifische Diagnose möglich wurde. Wir verwendeten diese Daten, um eine Näherung der Colonkrebs-Todesfälle zu bestimmen; Todesfälle durch Krebs des Dünndarms machten nur 3% der Gesamtzahl der Todesfälle durch Darmkrebs in dem Zeitraum aus, in dem Colonkrebs spezifisch aufgezeichnet wurde [9].
  • Die Populationszahlen für Individuen, die als „nicht-weiß" beschrieben werden, würden Personen mit indianischer und asiatischer Abstammung sowie mit afrikanischer Abstammung umfassen. Jedoch bezog sich dieser Begriff in den demographischen Aufzeichnungen der Vereinigten Staaten während des Zeitraums, als der Begriff „nicht-weiß" verwendete wurde, zu mehr als 75% auf Individuen afrikanischer Abstammung [9].
  • B. Überlebensdaten und Schätzungen
  • Für jede Geburtsjahr-Kohorte h und jedes Alter t innerhalb jeder Kohorte gibt es eine damit zusammenhängende, relative 5-Jahre-Überlebensrate für Colonkrebs S(h, t). S(h, t) stellt die Wahrscheinlichkeit dar, die Ursachen zu überleben, die mit Colonkrebs im Zusammenhang stehen.
  • Figure 00540002
  • Hier verwendeten wir die relative Überlebensrate und nicht die beobachtete Überlebensrate, wobei berücksichtigt wird, dass Individuen, bei denen die Diagnose Colonkrebs gestellt worden war, innerhalb des 5-Jahres-Zeitraums nach der Diagnose an einer anderen, nicht damit zusammenhängenden Todesart gestorben sein könnten.
  • Natürlich haben Verbesserungen in der Diagnose und Therapie von Colonkrebs zu einem historisch steigenden Wert von S(h, t) beigetragen. Eine wichtige Komplikation besteht jedoch darin, dass im Alter von über 75 eine geringere Wahrscheinlichkeit besteht, dass eine frühe Diagnose gestellt wird und/oder dass rigorose Therapieformen angewendet werden. Leider ist der Datensatz für diese Werte unvollständig, weshalb unsere Betrachtungen mit einigen Näherungen fortgesetzt werden.
  • Eisenberg et al. [19] haben die altersspezifischen relativen Überlebensraten für die Jahre 1935 bis 1959 im Staat Connecticut sowohl für Männer als auch für Frauen bis zum Alter von 65 bzw. 74 zusammengefasst und für das Alter über 75 geschätzt. Die NCl Monographie Nr., 6 [20] fasst ähnliche relative Überlebensraten für 1950 bis 1957 sowohl für Männer als auch für Frauen zusammen, umfassend einen großen Satz aus Krankenhausregistern und außerdem relative Überlebensraten für unbehandelte Individuen. Mit dem „Cancer Patient Survival Report Number 5" [21] wurde diese Arbeit noch auf den Zeitraum von 1950 bis 1972 erweitert, umfassend Überlebensraten für Patienten sowohl europäischer als auch afrikanischer Abstammung. In Gloeckler et al. [22] sind ähnlich die relativen Überlebensraten für den Zeitraum von 1973 bis 1975, bezogen auf Alter, Geschlecht und Rasse, angegeben. Schließlich sind in den „SEER Cancer Statistics Reviews" [23–25] die relativen 5-Jahres-Überlebensraten für 1983 bis 1991 zusammengestellt. Beart et al. [26] haben die altersspezifischen Überlebensraten für das Jahr 1983 registriert, wobei jedoch Geschlecht und Rasse nicht angegeben wurden. Die Schätzungen von Beart der gesamt Überlebensraten für die frühen 1980er Jahre waren etwa 10% niedriger als die von SEER [26] mitgeteilten Werte. Folglich haben wir uns entschieden, für die 1980er Jahre die von SEER angegebenen Überlebensraten, verringert um 5%, zu verwenden, um den Mittelwert aus SEER und Beart et al. darzustellen.
  • Die angegebenen Überlebensraten galten nicht für diejenigen Todesfälle von Individuen, bei denen die Diagnose Krebs erstmals zum Todeszeitpunkt gestellt wurde. Der Prozentsatz von „Inzidenzen bei Autopsie" beträgt für die 1990er Jahre 1 bis 2% [persönliche Mitteilungen, L. A. G. Ries, SEER]. Für die Diagnosejahre 1935 bis 1979 betrug der Prozentsatz von „Inzidenzen bei Autopsie" für den Staat Connecticut im Allgemeinen 1 bis 3%, wobei jedoch gezeigt wurde, dass er als Funktion des Alters ansteigt [27].
  • Die Überlebensraten sind zwischen einem Alter von 40 und 75 in den letzten Jahrzehnten konstant [22–25]. Jedoch erweiterte Beart [26] die Überlebensdaten bis zu einem Alter von 80 Jahren und fand, dass die Überlebensraten im Alter von 70 bis 79 und über 80 signifikant abnahmen. Die Überlebensraten scheinen im extrem hohen Alter sogar noch weiter abzunehmen, wenn Colonkrebs häufig in einem fortgeschrittenen Stadium nachgewiesen wird. Bei Personen mit einem Alter über 80 Jahren wurden nur 2,4% aller Colontumoren durch Operation und Chemotherapie behandelt, im Vergleich zu 26,3% der Personen, die unter 50 Jahre alt waren [26]. Als Schätzung verwenden wir für Hundertjährige eine Überlebensrate von 3 bis 4%, die Überlebensrate für unbehandelte Tumoren für 75+-Jährige [20]. Wir interpolieren zwischen dieser Schätzung und den anderen Daten, um die Näherung für das Überleben in einem beliebigen, nicht spezifizierten Alter zu bestimmen.
  • Die 7A und 7B erläutern diese Punkte für europäisch-amerikanische Frauen, die zwischen den 1840er und 1930er Jahren geboren sind. Die in 7A für das Jahr der Diagnose angegebenen Daten sind in 7B in altersspezifische relative Überlebenswerte umgewandelt. Wenn Werte unbekannt waren, wurden Schätzungen interpoliert. Die für den Altersbereich „unter 45" und „über 75" angegebenen Überlebensraten sind beim Alter von 40 bzw. 80 aufgetragen, da es sich hierbei ungefähr um die Durchschnittsalter der Individuen handelt, die in diesen Kohorten an Colonkrebs sterben. S(h, t) nimmt mit der historischen Zeit ständig zu, so dass ein konstanter, altersspezifischer Anstieg in S(h, t) für eine beliebige bestimmte Geburtsjahr-Kohorte erhalten wird, jedoch nimmt der Wert im extrem hohen Alter immer noch ab.
  • In Tabelle 2 sind die relativen Überlebensraten, bezogen auf das Jahr der Diagnose, zusammengefasst, wobei Durchschnittswerte für diejenigen Jahre verwendet werden, für die mehr als ein Wert verfügbar war. Die Durchschnittswerte wurden gemäß der Zahl der in jeder Studie untersuchten Patienten gewichtet. Um relative Überlebensraten für nicht-europäische Amerikaner abzuschätzen, bezogen wir uns auf den Datensatz der Überlebensraten von afrikanischen Amerikanern für die 1950er bis 1990er Jahre, da afrikanische Amerikaner mehr als 75% der nichteuropäischen Population ausmachten. Für die Kohorten von Nicht-Europäern der 1940er und 1930er Jahre wurden Schätzungen interpoliert, wobei angenommen wurde, dass die Änderung in der Überlebensrate für europäische Amerikaner zur Änderung in der Überlebensrate für nicht-europäische Amerikaner während dieses Zeitraums proportional war. Jedoch durften Schätzungen nicht unter den Wert der gemeldeten Überlebensraten für unbehandelte Individuen fallen [20]. Tabelle 2 Zusammenfassung der relativen Überlebensraten, bezogen auf das Jahr der Diagnose
    Figure 00570001
    • * Angegeben als Andere und Unbehandelte [20]
  • C. Aufzeichnung von Daten: Schätzungen des Fehlers
  • Es ist offensichtlich, dass der Zähler, der in Gleichung 5 OBS(h, t) definiert, durch die Wahrscheinlichkeit beeinflusst wird, dass eine tatsächliche Colonkrebs-Mortalität als solche registriert wird. Genauso ist es offensichtlich, dass es keine Aufzeichnungen einer unzulänglichen Diagnose per se gibt. In unserem früheren Versuch [5] befassten wir uns mit diesem Problem hinsichtlich der Vollständigkeit der Mortalitätsaufzeichnungen für die extrem alten Personen und fanden, dass wir unsere Schätzung der Mortalität in einem gewissen Ausmaß verbessern konnten, indem wird die Zahl der Todesfälle in einer Kohorte ohne adäquate Diagnose als Funktion des Alters betrachteten. Z.B. stellten wir bei Hundertjährigen fest, dass diese Zahl in den 1930er Jahren für europäisch-amerikanische Männer etwa 20% betrug, in den 1950er Jahren jedoch auf weniger als 5% abnahm [5]. So haben wir die historischen Aufzeichnungen auf die Zahl von Todesfällen mit einer ungewissen oder nicht aufgezeichneten Diagnose für alle Alter, Geschlechter und ethnische Gruppen für jede Geburtsjahr-Kohorte untersucht. Durch diese Daten wird eine Matrix für jede demographische Gruppe erstellt, welche eine obere Schätzung der Wahrscheinlichkeit einer genauen Aufzeichnung der Todesursache als Funktion R(h, t) definiert.
  • Figure 00580001
  • 8 zeigt den prozentualen Anteil aller Todesfälle mit unbestimmter Diagnose, aufgetragen als Funktion des Geburtsjahrs für verschiedene Altersgruppen europäisch-amerikanischer Männer. Die Annahme hier besteht darin, dass der prozentuale Anteil von Colonkrebs-Todesfällen an allen Todesfällen mit nicht aufgezeichneter Diagnose etwa gleich ist wie der prozentuale Anteil von Colonkrebsfällen an allen Todesfällen mit aufgezeichneter Diagnose.
  • Wenn man diese Annahme verwendet, wird der Anteil der echten Colonkrebs-Mortalität immer noch zu niedrig geschätzt. Da bei etwa 50% der gegenwärtigen Todesfälle als Todesursachen kardiovaskuläre oder zerebrovaskuläre Ursachen angegeben werden, würden geringfügig zu hoch geschätzte Werte dieser Diagnosen dazu führen, dass die Mortalität durch andere spezifische Krankheiten deutlich zu niedrig geschätzt wird.
  • Weiterhin kann es auch sein, dass eine Diagnose von Colonkrebs ein Fehler ist, insbesondere, wenn eine Tumormasse im Colon einen sekundären Tumor aus einem anderen Organ darstellt. Diese Art von Fehler wurde in verschiedenen Studien angesprochen, in denen pathologische Proben überprüft wurden. Tatsächlich wurde gefunden, dass der Colonkrebs in Totenscheinen etwas zu hoch angegeben ist, dies beruht hauptsächlich darauf, dass in den Werten auch ein Teil von rektalen Tumoren enthalten ist [28].
  • D. Mortalitäts-Daten, angepasst an historische und altersspezifische Überlebens-Wahrscheinlichkeit und Fehler bei der Meldung: Definition von OBS·(h, t)
  • Anhand dieser verfügbaren Daten können wir nun unsere Schätzungen der tatsächlichen Raten des Auftretens von Colonkrebs verbessern. Wir sind überzeugt, dass der berichtigte Datensatz ausreichend genau ist, um die mathematischen Analysen, die wir verwenden, durchführen zu können. Unsere Modelle sind jedoch ausführlich und erlauben es, den Effekt von Fehlern in den Überlebensdaten oder den aufgezeichneten Daten bei Schätzung von Parametern zu untersuchen.
  • In den 9A, 9B, 10A und 10B wurden die Daten der 5A, 5B, 6A und 6B umgearbeitet, wobei alle unsere Schätzungen von S(h, t) und R(h, t) zusammen mit OBS(h, t) verwendet wurden, um eine neue Funktion OBS·(h, t) zu definieren. OBS·(h, t) = OBS(h, t) ÷ [R(h, t)(1 – S(h, t))] (Gleichung 8)
  • Diese Figuren stellen unsere besten Schätzungen dar, wie die Mortalitätsraten durch Colonkrebs in einer Welt mit genauer Diagnose und Aufzeichnung, jedoch mit keinerlei Therapie aussehen würde. In gewissem Sinn handelt es sich um eine Rekonstruktion von „Inzidenz"-Daten in einer Welt mit genauer Diagnose, jedoch ohne wirksame Therapie.
  • Ein Beispiel dafür, wie wichtig der Überlebens- und Melde-Fehler ist, kann festgestellt werden, indem die Funktion OBS(1880er, t) für die Kohorte EAM von 5A mit der Funktion OBSμ(1880er, t) für die gleiche Kohorte in 9A verglichen wird. Im ersten Fall scheint OBS·(h, t) ein stabiles maximale Plateau beim Alter von 90 zu erreichen, dagegen zeigt OBS·(h, t) im letzteren Fall ein klares Maximum, das bis zum Alter von 102,5 abnimmt. Ein ähnlicher Effekt kann festgestellt werden, indem OBS(1870er, t) mit OBS·(1870er, t) innerhalb der Kohorte NEAF verglichen wird.
  • E. Bekannte physiologische Parameter
  • Zellkinetische Raten
  • Eines unserer Ziele besteht darin, die Mutationsraten pro Zellteilung aus den Krebsmortalitäts-Daten zu ermitteln. Hierfür benötigen wir Parameter der Zellkinetik. In unserer früheren Arbeit [5] verwendeten wir eine Schätzung von 45 Minuten für die Dauer einer Mitose in vivo. Dies beruhte nicht auf tatsächlichen in vivo- Beobachtungen, sondern auf Beobachtungen der Dauer von Mitosen in vitro. Es hat den Anschein, dass es sich hierbei um eine signifikant zu niedrige Schätzung handelt. Wright [29] berichtet, dass die Dauer einer Mitose für den Dünndarm in vivo 1 bis 1,5 Stunden beträgt. Genauso hat Weinstein [30] gefunden, dass die Mitose-Zeit für das menschliche Jejunum in vivo 1,4 bis 2,2 Stunden beträgt. (Für das normale Colon wurden keine Daten gefunden.) Dies legt nahe, dass wir unsere kinetischen Raten um eine Faktor von 2 zu hoch schätzen. Die Dauer von Mitose und Apoptose kann sich außerdem zwischen normalen Übergangszellen, Adenom- und Karzinomzellen unterscheiden. In unserer Behandlung hier nehmen wir an, dass sie in diesen drei Fällen im Prinzip gleich ist.
  • Jedoch nahmen wir außerdem fälschlicherweise an, dass das Nachweisfenster für eine Mitose, wenn man auf einen Gewebeschnitt auf einem Objektträger schaut, zweimal der Dauer der Mitose entspricht [5], wobei es jedoch tatsächlich einmal der Dauer der Mitose entspricht. Diese zwei Faktoren heben sich glücklicherweise gegenseitig auf, so dass die Werte für die zellkinetischen Parameter in Adenomen und Karzinomen, die wir kürzlich angegeben haben, zufälligerweise korrekt sind. Unsere Schätzung der Zellteilungsrate in Colonadenomen, α, beträgt neun Teilungen pro Jahr, und die Zellteilungsrate in frühen Colonkarzinomen, αc, beträgt etwa 29. Wir finden, dass die Absterberate von Zellen in Colonadenomen, β, und frühen Karzinomen, βc, etwa gleich ist, β ≈ βc ≈ 9. Wir mussten einen Fehler korrigieren, wenn wir die Teilungs- und Absterberate von normalem Colonepithel, t, schätzten. Nur die Hälfte der Zellen würde eine Teilung durchlaufen, da die eine Hälfte aus sich nicht teilenden terminalen Zellen besteht. Die tatsächliche Schätzung hierfür wäre zweimal so hoch wie unsere frühere Schätzung von 1,5 Teilungen oder absterbenden Zellen pro Jahr [5]. Die Turnover-Rate von normalen Colon-Epithelzellen beträgt somit etwa 3.
  • Zellzahl
  • Um Mutationsraten abzuschätzen, war es außerdem erforderlich, dass wir die Zahl von Colon-Epithelzellen als Funktion des Alters kannten. Wir schätzten, dass das Volumen eines Organs proportional mit der Masse eines durchschnittlichen Individuums zunimmt. Da das Colon annähernd eine zylindrische Röhre ist, folgerten wir, dass die Zahl von Colon-Epithelzellen zur Körpermasse in der Potenz 2/3 proportional ist.
  • Die 11A und 11B zeigen die Massen durchschnittlicher Männer bzw. Frauen als Funktion des Alters. Sowohl bei Männern als auch bei Frauen nimmt die Körpermasse vom Alter von 1,5 Jahren bis zum Alter von 14,5 Jahren bei Frauen und 16,5 Jahren bei Männern exponentiell zu. Eine höhere konstante Rate wird für das Wachstum zwischen der Geburt und dem Alter von 1,5 Jahren erhalten.
  • Aus den 11A und 11B bestimmten wir die Wachstumsraten von Männern und Frauen aus der Steigung des log2 der Masse von durchschnittlichen Individuen für die Altersintervalle 0 bis 1,5 und 1,5 bis 14,5 für Frauen und 1,5 bis 16,5 für Männer. Diese festgestellten Wachstumsraten für die Masse wurden sodann mit 2/3 multipliziert, um unsere Bestimmungen für Wachstumsraten von Colon-Epithelzellen zu erhalten.
  • Figure 00610001
  • Die Zahl von Colon-Epithelzellen als Funktion des Alters, Na, kann somit als eine unstetige Funktion geschrieben werden, die auf der Zahl von Colon-Epithelzellen in einem Erwachsenen beruht, Nmax. Wir erläutern dies anhand der Werte für Männer.
  • Figure 00610002
  • Die Zahl von Colonzellen in einer Frau folgt einer ähnlichen Überlegung. Man sollte außerdem der Tatsache Rechnung tragen, dass das Gewicht einer durchschnittlichen Frau etwa 80% des Gewichtes eines Mannes von 18 Jahren beträgt [31]. Die Bestimmung in Herrero-Jimenez et al. [5] für die Zahl von Zellen in einem Colon, Nmax = 8,5 × 1010 Zellen, machte keine Unterscheidung zwischen den Geschlechtern. Als eine bessere Näherung haben wir hier eine Schätzung von 9,1 × 1010 Colonzellen in einem Colon eines erwachsenen Manns und 7,9 × 1010 Colonzellen in einer erwachsenen Frau genommen.
  • Somatische Mutationsraten in Menschen
  • Wir haben alle veröffentlichten Berichte über den altersspezifischen mutierten Anteil am hprt-Locus in menschlichen peripheren T-Zellen zusammengestellt [32 bis 42]. Beobachtungen mit einer absoluten Clonierungseffizienz von weniger als 20 wurden ausgeschlossen, um diese Form von Fehler zu vermeiden. 12 zeigt diese mutierten Anteile als eine Funktion des Alters. Diese Daten zeigen eine ähnliche Verteilung im Bereich des Mittelwerts für alle Altersgruppen, 0 bis 9, 10 bis 19, usw., bis zum Alter von 75, danach scheint die Zahl von Personen mit relativ hohen mutierten Anteile deutlich abzunehmen. Anhand all dieser Daten vom Alter von 0 bis 75 berechnen wir eine konstante Rate des hprt-Verlusts von 2,1 × 10–7 Mutationen pro Stammzellenjahr oder etwa 0,7 × 10–7 Mutationen pro Stammzellteilung. Bei dieser Schätzung werden für pluripotente Zellen drei Zellteilungen pro Jahr angenommen. In Kulturen menschlicher B-Zellen liegen die beobachteten spontanen Mutationsraten am hprt-Locus im Bereich von 0,5 bis 2,5 × 10–7 Mutationen pro Zellteilung [43 bis 45]. Diese in vivo- und in vitro-Schätzungen zeigen eine vernünftige Übereinstimmung und stellen den Verlust einer aktiven Genkopie durch Punktmutationen und große Deletionen, nicht jedoch durch Rekombinationen, dar.
  • Zwei Bestimmungen von LOH-Raten in Menschen unterscheiden sich signifikant. Grist et al. [6] berichteten, dass die Summe aller Wege für den Verlust von Heterozygotie des HLA-A-Locus in peripheren T-Zell-Vorläufern etwa 6,6 × 10–7 Ereignisse pro Zellenjahr oder 2,2 × 10–7 pro Stammzellteilung betrug. Dagegen berichten Fuller et al. [46] und Jass et al. [47] über Beobachtungen, die es uns möglich machen, die Raten des unikryptischen LOH im Colon auf etwa 2 × 10–5 Ereignisse pro Stammzellenjahr oder auf etwa 7 × 10–6 LOH Ereignisse pro Colon-Stammzellen-Teilung zu berechnen, dies ist etwa 30-mal höher als die LOH-Raten, die in Blutzellen zu sehen sind. Als der LOH-Test wurde ein Krypto-negativer Phänotyp für die O-Acetylierung von Sialinsäuren, vermutlich durch den Verlust eines aktiven Allels der O-Acetylat-Transferase, verwendet.
  • Verfahren: Logische und mathematische Vorgehensweisen
  • A. Zahl von Subpopulationen mit Risiko
  • Die Daten der 5A, 5B, 6A und 6B umfassen alle aufgezeichneten Todesfälle durch Darmkrebs, die wir als eine Näherung an Colonkrebs verwenden. Wenn man das Überleben und die Unterbewertung („underreporting") betrachtet, wie in der 9A, 9B, 10A und 10B, geht hieraus klar hervor, dass diese Funktionen im hohen Alter ein Maximum erreichen. Diese wiederholte Feststellung stimmt mit der Erwartung überein, dass in einer Population nur ein gewisser Anteil während des Lebens das Risiko für Colonkrebs hat. Obwohl wir wissen, dass es auch andere Erklärungen für ein solches Maximum gegen kann, bauen wir unsere Analyse darauf auf, dass die Subpopulation mit der Annahme eines Risikos Gültigkeit hat, und wir berücksichtigen dabei, dass menschliche Populationen einen hohen Grad an genetischer Heterogenität zeigen.
  • Diese Daten trennen jedoch nicht die Todesfälle in Familien mit familiärer adenomatöser Polypose coli (FAPC) von Todesfällen in Familien mit einem hereditären Nicht-Polypose Colonkrebs (HNPCC oder Lynch-Syndrom) oder von Todesfällen durch einen „sporadischen" Colonkrebs. „Sporadische" Krebserkrankungen selbst werden nicht differenziert hinsichtlich der Möglichkeit, dass es unabhängige Wege von genetischen Veränderungen gibt, die zu mehreren unterschiedlichen Arten eines „sporadischen" Colonkrebses führen können.
  • Wir postulieren, dass es mehrere Wege geben könnte, um einen Krebs in einem bestimmten Organ entstehen zu lassen. Das Potential für solche Wege und das Durchlaufen solcher Wege würde durch unbekannte, jedoch bestimmbare Allele von Tumor-Suppressorgenen oder Genen bestimmt werden, welche die Raten genetischer Veränderungen und zellkinetische Raten in normalen Geweben und präneoplstischen Kolonien (Adenomen) bewirken. Diese Allelle wären in der ganzen Population verteilt. Es gibt Krebserkrankungen von Organen, für die eine solche Behandlung, bei der man mehrere Wege annimmt, offensichtlich erforderlich ist. In 13 zeigen wir OBS(h, t) für Todesfälle durch Hodenkrebs, wobei zwei Populationen ganz offensichtlich sind, hierzu zählen die eine Gruppe, in der alle Todesfälle im Alter zwischen 15 und 50 Jahren auftreten, und eine zweite Gruppe, in der Todesfälle ab einem Alter von 50 festgestellt werden. In den Mortalitätsdaten sind die Todesfälle aus mehreren unabhängigen Wegen gezwungenermaßen zusammengefasst.
  • Um mit dem Entwirren der vorliegenden Mortalitätsdaten für Colonkrebs zu beginnen, stellen wir fest, dass es zwar zahlreiche mögliche Wege zu einem tödlichen Colonkrebs bei einem bestimmten Individuum gibt, dass jedoch der Tod nur durch einen einzigen verursacht werden kann.
  • Somit können wir die Bedingung machen, dass die Zahl von Colonkrebs-Todesfällen die Summe der Todesfälle sein muss, die durch jeden der möglichen mehreren Wege verursacht werden. OBS(h, t) = OBS1(h, t) + OBS2(h, t) + OBS3(h, t) + ... (Gleichung 10)
  • Im Fall von Colonkrebs wissen wir, dass die Mortalität aus FAPC- und HNPCC-Familien zahlenmäßig klein ist und früher im Leben auftritt als die „sporadische(n)" Form(en) der Krankheit. Bisher vernachlässigen wir ihre tatsächliche, aber zahlenmäßig geringe Beteiligung an der gesamten Colonkrebs-Mortalität.
  • Bei etwa 80% der colorektalen Adenome in FAPC-Individuen wurde gefunden, dass ein operatives APC-Allel fehlt. Es scheint somit, dass „sporadische" Colonkrebserkrankungen einen gemeinsamen Initiations-Weg aufweisen, den Verlust der zwei ererbten operativen Allele des Tumor-Suppressorgens APC [7].
  • Außerdem ist es verlockend anzunehmen, dass die genetische(n) Veränderung(en), die für die Promotion einer „sporadischen" Colon-Adenomzellen zur Entstehung einer Karzinomzelle erforderlich ist (sind), für alle Individuen die gleichen wären, jedoch gibt es für diese Annahme keinerlei Beweise, und sie ist für die Analysen, die nachstehend versucht werden, nicht erforderlich.
  • Annahme einer einzelnen Subpopulation mit Risiko
  • Für diese Punkte behandeln wir die Colonkrebs-Mortalitätsdaten anfangs so, als ob es nur einen einzigen und nur einen Weg zum Colonkrebs gäbe. Wenn es mehrere Wege zum „sporadischen" Krebs gibt, sind unsere Ableitungen von Parametern, z.B. die Zahl von Mutationen, die zur Initiation und Promotion erforderlich sind, ihre Raten und die Wachstumsrate von Adenomen, notgedrungen ein gewichteter Durchschnitt der mehreren Wege.
  • B. Größen von Subpopulationen mit Risiko
  • 1. Primäre im Vergleich zu sekundären Risikofaktoren
  • Hier ist für den Begriff „primäres Risiko" eine sorgfältige Definition erforderlich. Wir stellen uns vor, dass es Personen gibt, die aufgrund ihrer genetischen Vererbung und der Umwelt-Erfahrung ein Risiko haben, durch einen sporadischen Colonkrebs zu sterben. Es ist möglich, dass die gesamte Population das gleiche genetische Risiko, jedoch nicht die gleiche Umwelt-Erfahrung hat. Umgekehrt ist es möglich, dass alle Personen zwar eine gemeinsame Umwelt-Erfahrung haben, dass jedoch nur ein Anteil davon einen ererbten Risikofaktor enthält. Das Schlüsselpostulat besteht darin, dass Personen, die diese primären Risikofaktoren nicht erben und nicht diese Umwelt-Erfahrung machen, in ihrem ganzen Leben, sagen wir in 125 Jahren, keinen Colonkrebs entwickeln können. Bisher wurden die primären genetischen und Umwelt-Risikofaktoren für den sporadischen Colonkrebs noch nicht identifiziert und sind somit hypothetisch. (Die primären genetischen Risikofaktoren für zwei Formen des familiären Colonkrebses, FAPC und Lynch-Syndrom (HNPCC), sind ein inaktives Allel des APC-Gens bzw. eines Fehlpaarungs-Reparatur-Gens) [48, 49].
  • Man kann erwarten, dass es innerhalb von Subpopulationen mit primärem Risiko Variationen in den Mutationsraten und zellkinetischen Raten gibt. Wenn ein ererbter Zustand oder eine Umwelt-Erfahrung das erwartete Alter zum Todeszeitpunkt im Vergleich zu allen Personen mit einem primären Risiko herabsetzt, definieren wir dies als einen sekundären Risikofaktor. Z.B. kann man davon ausgehen, dass Personen mit Mutationsraten, die nur zweimal höher sind als der Durchschnitt, viel früher in ihrem Leben Krebserkrankungen entwickeln als Personen mit durchschnittlichen Mutationsraten, die zu der Subpopulation mit den gleichen primären Risikofaktoren zählen [5]. Ererbte oder Umwelt-Faktoren, welche die Mutationsraten oder die adenomatöse Wachstumsrate beeinflussen, wären nach dieser Definition sekundäre Risikofaktoren.
  • 2. Algebraische Vorgehensweise zur Definition eines Anteils mit einem primären Risiko
  • Wir suchen einen algebraischen Weg, um den Zusammenhang zwischen der altersspezifischen Colonkrebs-Mortalität für eine beliebige Geburtsjahr-Kohorte, OBS(h, t), und den primären und sekundären, ererbten und Umwelt-Faktoren, von denen man erwarten würde, dass sie sie beeinflussen, auszudrücken.
  • Wir definieren den Anteil einer Population mit primären Risiko innerhalb einer Geburtsjahr-Kohorte als F(h, t), wobei „h" das historische Geburtsjahr und „t" das Alter ist. (Die Berechnung dieser Funktion und ihrer historischen Veränderungen ist ein wichtiges Ziel unseres analytischen Ansatzes.) Die Wechselwirkung von ererbten und Umwelt- primären Risikofaktoren wird dargestellt als: F(h, t) = F(h, t)genet. × F(h, t)Umwelt (Gleichung 11)(14)
  • Wir nehmen an, dass es nur eine geringe historische Variation im Anteil der Population gibt, die primäre genetische Risikofaktoren erbt, d.h. F(h, t)genet. = G ist eine Konstante. Somit wäre jede beliebige tatsächliche Änderung in F(h, t), bezogen auf das Geburtsjahr „h", historischen Änderungen im primären Umwelt-Risikofaktor, F(h, t)Umwelt, zuzuschreiben. Umwelt-Risikofaktoren haben für einige Krebsarten offensichtliche und gut belegte historische Variationen, z.B. Zigarettenrauchen und Lungenkrebs [50]. (Wir vermuten, wollen dies jedoch auch noch formal begründen, dass Zigarettenrauchen einen primären Umwelt-Risikofaktor darstellt.)
  • Da historische Änderungen in Umweltfaktoren selten die gesamte Population gleichzeitig erreichen würden, können primäre Umweltfaktoren innerhalb des Lebens einiger Geburtsjahr-Kohorten signifikant variieren, z.B. Kohorten, für die industriell hergestellte Zigaretten erst ab einem mittleren Alter verfügbar waren. In diesem Stadium der Modellentwicklung behandeln wir F(h, t) jedoch im Fall von Colonkrebs noch als Invariante innerhalb einer Geburtsjahr-Kohorte, so dass: F(h, t)Fh = G × Eh (Gleichung 12)
  • Die Idee eines Anteils der Population mit sowohl ererbten als auch Umwelt-Risikofaktoren für Colonkrebs ist einfach logisch. Dieser Anteil wird durch G Eh repräsentiert. Hieraus folgt jedoch, dass es auch drei andere getrennte Subpopulationen gibt: diejenigen, die keinen der Risikofaktoren haben, (1-G) (1-Eh), diejenigen, die das Umwelt-, nicht jedoch das ererbte Risiko haben, (1-G) Eh und diejenigen, die das ererbte, nicht jedoch das Umwelt-Risiko haben, G (1-Eh). Dieser Punkt wird in einem Venn-Diagramm erläutert, 10. Jede dieser Unter-Anteile hat möglicherweise unterschiedliche altersspezifische Todesraten, wobei wir uns jetzt mit dieser Komplikation befassen.
  • 3. Definition und Zusammenfassung von Ursachen der Mortalität
  • Wir halten es für selbstverständlich, dass die Gesamtzahl von Todesfällen von Personen in einem Altersintervall in einem beliebigen historischen Jahr die Summe der Zahl von Todesfällen aller möglichen Ursachen darstellt. Somit haben wir die gesamte aufgezeichnete Mortalitätsrate, TOT(h, t), als die Summe der Rate der Colonkrebs-Todesfälle, OBS(h, t), der Rate der Todesfälle durch damit zusammenhängende Ursachen, die gemeinsame primäre genetische und/oder Umwelt-Risikofaktoren wie Colonkrebs haben, CON(h, t), und der Rate von Todesfällen durch Ursachen, die von den primären genetischen oder Umwelt-Ursachen von Colonkrebs unabhängig sind, IND(h, t), definiert [5]. Wir haben dieses Konzept dargestellt als: TOT(h, t) = OBS(h, t) + CON(h, t) + IND(h, t) (Gleichung 13)
  • Die historischen Aufzeichnungen definieren Schätzungen von TOT(h, t) und OBS(h, t), wohingegen die Werte von CON(h, t) und IND(h, t) unbekannt sind.
  • Mit dieser Feststellung hängt die Erkenntnis zusammen, dass es für jede dieser Kategorien von Mortalität damit zusammenhängende altersabhängige Wahrscheinlichkeiten gibt. Diese entsprechen nicht einfach den aufgezeichneten Mortalitätshäufigkeiten, dies ist eine Fehlinterpretation, die in Herrero-Jimenez et al. unbeabsichtigt angegeben wird (5). Vielmehr sind diese Wahrscheinlichkeiten abstrakte, altersabhängige Funktionen, die wir hier noch sorgfältiger definieren:
    POBS(h, t) = die Wahrscheinlichkeit, dass eine Person, die im Jahr „h" geboren ist, mit sowohl einem primären genetischen als auch Umwelt-Risiko für Colonkrebs an Colonkrebs im Alter von „t" sterben würde, wenn sie keine Behandlung erhält und keine konkurrierenden Todesarten auftreten (Population mit Risiko: G·Eh, 14).
  • Nicht gemeldete Colonkrebs-Todesfälle sind in dieser Kategorie enthalten.
  • PCON(h, t) = die Wahrscheinlichkeit, dass eine Person, die im Jahr „h" geboren ist, mit einem primären genetischen und/oder einem Umwelt-Risiko für Colonkrebs an einer beliebigen Krankheit, die nicht Colonkrebs ist, die mit einem oder beiden von diesen Risiken in Zusammenhang steht, im Alter von „t" sterben würde, wenn sie keine Behandlung erhält und keine konkurrierenden Todesarten auftreten (Populationen mit Risiko: G·Eh G·Eh und G·Eh, 14).
  • PIND(h, t) = die Wahrscheinlichkeit, dass eine Person, die im Jahr „h" geboren ist, mit weder einem primären genetischen noch mit einem Umwelt-Risiko für Colonkrebs an einer beliebigen anderen Ursache im Alter von „t" sterben würde (alle Populationen mit Risiko: 14).
  • Insbesondere sollte angemerkt werden, dass OBS·(h, t) die beobachtete aufgezeichnete Colonkrebs-Mortalitätsrate für Individuen, die im Jahr „h" geboren sind und die im Alter von „t" noch am Leben sind, in einer abstrakten Welt ohne therapeutische Behandlung darstellt. POBS(h, t) ist die erwartete Colonkrebs-Mortalitätsrate für ein zur Gruppe Fh gehörendes Individuum, das im Alter von „t" noch lebt, wobei es auch keine medizinische Behandlung erhält. OBS·(h, t) wird an Fehlern der Meldungen und Diagnose leiden, die in unserer Verwendung von R(h, t) nicht berücksichtigt werden. Jedoch stellt POBS(h, t), die hergeleitete Mortalitätswahrscheinlichkeit für Personen in der Subpopulation G·Eh, in einer abstrakten Welt, wo S(h, t) = 0, alle Colonkrebs-Todesfälle dar, ob sie genau diagnostiziert und/oder gemeldet wurden oder nicht.
  • Die Größe für die tatsächliche Wahrscheinlichkeit des Todes durch Colonkrebs für eine Person mit Risiko einer Geburtsjahr-Kohorte „h" und einem Alter von „t" wäre die Wahrscheinlichkeit, an Colonkrebs in Abwesenheit einer Behandlung zu sterben, POBS(h, t), multipliziert mit der Wahrscheinlichkeit, dass eine Behandlung nicht erfolgreich war (1 – S(h, t)). Ähnliche Argumente können für die damit zusammenhängenden und unabhängigen Formen der Mortalität eingeführt werden, so dass die Wahrscheinlichkeit, eine „damit zusammenhängende" Krankheit zu überleben, (1 – SCON(h, t) wäre, und die Wahrscheinlichkeit einer „unabhängigen" Todesart wäre (1 – SIND(h, t)).
  • 4. Wahrscheinlichkeit, im Alter von t noch zu leben, PNOT(h, t)
  • Wir nehmen an, dass eine Person mit einem primären Risiko für Colonkrebs an Colonkrebs, einer „damit zusammenhängenden" Krankheit, die durch die ererbten und/oder Umwelt-Risikofaktoren verursacht wird, oder einer Ursache, die von den primären Risikofaktoren für Colonkrebs unabhängig ist, sterben kann. Dadurch können wir einen expliziten Ansatz für die Wahrscheinlichkeit, PNOT(h, t), machen, dass eine Person in der Risikogruppe Fh in einem beliebigen Alter zwischen der Geburt und dem Alter „t" noch nicht an einer beliebigen Ursache gestorben ist.
  • Figure 00670001
  • Dieser Ausdruck ist wichtig, da bei der Betrachtung der Wahrscheinlichkeit eines Todes durch Colonkrebs im Alter von „t" eine erforderliche physische Bestimmung darin besteht, dass das Individuum nicht bereits tot ist. In der Terminologie der Wahrscheinlichkeit und Analyse schreiben wir Gleichungen für die bedingte Wahrscheinlichkeit von Colonkrebs, vorausgesetzt die Tatsache, dass das Individuum nicht tot ist. Bei der Betrachtung der Verringerung der Subpopulation Fh = G·Eh verwenden wir ein Wahrscheinlichkeitsmodell der Probennahme ohne Rückstellung.
  • 5. Beobachtete Colonkrebs-Mortalitätsrate im Alter von „t", OBS(h, t)
  • In Herrero-Jimenez et al. [5] differenzierten wir eine Gleichung, welche die beobachtete Mortalitätsrate, OBS(h, t), betraf, zur erwarteten Mortalitätsrate POBS(h, t). Unser Modell berücksichtigte die Tatsache, dass es noch andere Todesarten außer Colonkrebs geben könnte, die entweder von den ererbten oder von den Umwelt-Risikofaktoren für Colonkrebs abhängen könnten. Die Summe aller Todesfälle durch diese Möglichkeiten in der Gruppe mit Risiko für Colonkrebs wurde in einem früheren Stadium der Modellentwicklung einfach als CON(h, t) dargestellt [5].
  • Jedoch müssen wir unser früheres Modell verbessern und deshalb zwei Änderungen machen. Die erste besteht darin, die nicht gemeldeten Colonkrebs-Todesfälle in die Größe OBS·(h, t) und nicht CON(h, t) aufgrund der Verwendung von R(h, t) mit aufzunehmen. Die zweite bestand darin, zwischen den Krankheiten zu unterscheiden, die sich auf eine, nicht jedoch auf beide der ererbten oder Umwelt-Risikofaktoren beziehen. Um dies zu erreichen, führen wir den Term CON1(h, t), um den ersten Punkt zu berücksichtigen, und die Größe CON2(h, t) ein, um den letzteren Punkt zu berücksichtigen. Wir erläutern diese Risikofaktoren anhand der Bezeichnungen für die Populationen von 14 in Tabelle 3. Tabelle 3 Todesarten, für welche die bezeichneten Subpopulationen ein Risiko haben
    Figure 00680001
    • * Alle Todesarten in entweder CON1 oder CON2 sind im gesamten Satz der damit zusammenhängenden Todesarten, CON, enthalten.
  • Die vollständige Gleichung für OBS(h, t), ergänzt für eine bessere Berücksichtigung der Effekte des Überlebens, S(h, t), des Fehlers der Unterbewertung („underreporting"), R(h, t), und der vier verschiedenen Populationen, wie vorstehend eingeführt (14), kann wie folgt geschrieben werden:
  • Figure 00690001
  • OBS(h, t) ist einfach die Zahl von Personen in einer Geburtsjahr-Kohorte „h", für die angegeben ist, dass sie im Alter von „t" durch Colonkrebs gestorben sind, geteilt durch die Zahl aller Personen in der Kohorte, die in diesem Alter noch am Leben sind.
  • Der Zähler, die Zahl der Todesfälle durch Colonkrebs im Alter von „t", ist das Produkt der Zahl von Personen in der Geburts-Kohorte, Bh, des Anteils mit einem primären Risiko, (G × Eh), des Anteils von Individuen mit Colonkrebs, die nicht überleben, (1 – S(h, t)), des geschätzten Anteils von Colonkrebs-Todesfällen, genau aufgezeichnet, R(h, t), des Anteils von Personen, von denen erwartet wird, dass sie ohne eine Behandlung an Colonkrebs sterben, POBS(h, t), und des Anteils von Personen von (G × Eh), die nicht bereits an einer beliebigen Ursache gestorben sind, PNOT(h, t).
  • Der Nenner, die Zahl der Personen, die im Alter von „t" noch leben, ist das Produkt der Zahl der Personen in der Geburts-Kohorte, Bh, und der Summe der Anteile aller Subpopulationen, die noch leben, ob sie ein Colonkrebs-Risiko haben oder nicht.
  • Da die Größe für die Zahl der Personen, die in eine Kohorte geboren sind, Bh, und die Größe, welche für das Überleben von nicht mit Colonkrebs-Risikofaktoren zusammenhängenden Ursachen steht, e–jP IND(h,t)(1–SIND(h,t)) dt, als Faktoren im Zähler und alle Größen des Nenners vorliegen, heben sie sich auf. Indem als nächstes der Zähler und der Nenner durch e–∫[POBS(h,t)(1–S(h,t)+PONC(h,t)(1–SCON(h,t))]dt geteilt werden, wandeln wir diese Gleichung in eine handlichere Form um:
  • Figure 00700001
  • Die algebraische Elimination der Größe für die Wahrscheinlichkeit von unabhängigen Todesarten ist extrem wichtig, da es keinen befriedigenden Weg gibt, seinen Wert aus öffentlichen Mortalitätsaufzeichnungen zu bestimmen.
  • Jedoch sind die Größen für Todesfälle durch „damit zusammenhängende" Krankheiten, die durch die primären genetischen und/oder Umwelt-Colonkrebs-Risikofaktoren verursacht sind, genauso wenig im staatlichen Gesundheitsregister definiert. Um trotz dieses klaren Fehlens von Daten weiterzukommen, greifen wir auf unsere erste und möglicherweise schlechteste algebraische Näherung zurück.
  • 6. Berücksichtigen von Todesfällen durch Ursachen, die mit primären Risiken zusammenhängen. Die Funktion fh.
  • Wir führen eine neue Größe ein, f(h, t), das Verhältnis von Colonkrebs-Todesfällen zu allen Todesfällen, die tatsächlich durch entweder die ererbten oder die Umwelt-Risikofaktoren für Colonkrebs oder durch beide verursacht werden. Wir wissen eindeutig nicht, was die „damit zusammenhängenden" Krankheiten sind und haben somit keine Möglichkeit zu wissen, was PCON(h, t), PCON1(h, t), PCON2(h, t), SCON(h, t), SCON1(h, t) oder SCON2(h, t) sein könnte. Deshalb sind wir im Moment gezwungen anzunehmen, dass dieser Anteil, f(h, t), für alle Altersstufen in einer Geburtsjahr-Kohorte konstant ist, jedoch unter Geburtsjahr-Kohorten variieren kann. Wir können uns vorstellen, dass CON1 und CON2 andere Formen von Krebs umfassen und dass diese somit eine Altersabhängigkeit und Überlebenswahrscheinlichkeit haben könnten, die zu derjenigen von Colonkrebs ähnlich ist. Jedoch könnte hierin auch ein gewisser Anteil von kardiovaskulären Todesfällen enthalten sein, die auf unbekannten, jedoch gemeinsamen Umwelt-Risikofaktoren beruhen. Insgesamt denken wir, dass diese Näherung nicht entscheidend falsch ist: Die relative altersabhängige Colonkrebs-Mortalität unterscheidet sich nicht deutlich von der Mortalität durch die wichtigsten Todesursachen, wie Gefäßerkrankungen und andere wichtige Krebserkrankungen, beim Menschen.
  • Die Gleichung 17 definiert die Näherung unter Verwendung von f(h, t) im Kontext von Gleichung 16:
  • Figure 00710001
  • Die Näherung von Gleichung 17 verteilt die Effekte unterschiedlicher Todesraten unter den drei Populationen, bei denen kein Risiko für Colonkrebs besteht. Wir erkennen wie bei Eh, dass f(h, t) innerhalb des Lebens der analysierten Geburtsjahr-Kohorten variieren kann. Jedoch müssen wir im Moment damit zufrieden sein, es als einen konstanten gewichteten Durchschnitt für jede Kohorte zu behandeln, so dass f(h, t) ≈ f.
  • Es ist hilfreich, sich daran zu erinnern, dass die Summe aller vier Subpopulations-Anteile der folgenden Gleichung entspricht: [(1 – G) × Eh] + [G × (1 – Eh)] + [(1 – G) × (1 – Eh)] = 1 – (G × Eh) = (1 – Fh) (Gleichung 18)
  • Durch Kombination der Gleichungen 16, 17 und 18 erzeugen wir den relativ einfachen Ausdruck:
    Figure 00720001
    für den alle Werte bekannt sind, mit Ausnahme von Fh, fh und POBS(h, t), die in fetten Buchstaben angegeben sind.
  • 7. Explizite Größe für primäre Risikofaktoren, Fh und fh, für eine bestimmte Zahl von Initiations-Mutationen, „n"
  • In unserer früheren Ausführung bestimmten wir Fh und fh anhand der Maximum-Likelihood-Methode und der darin für OBS(h, t) abgeleiteten allgemeinen Gleichung [5]. Deshalb sahen wir uns gezwungen, Fh und fh unter Verwendung einer algebraischen Formel zu bestimmen, welche drei weitere unbekannte Größen für Mutation und zellkinetische Raten enthielt. Wir waren jedoch mit diesem rechnerischen Zustand nicht zufrieden und erdachten eine Strategie, um die unbekannten Parameter explizit zu berechnen. Wir versuchten somit, explizite Größen für Fh und fh für eine beliebige Zahl von Initiations-Mutationen, „n", abzuleiten. (Diese zwei Größen sind unabhängig von der Zahl von Promotions-Mutationen, „m".)
  • Unsere erste Taktik bestand darin, eine einfachere Funktion für POBS(h, t) einzuführen. Diese Funktion folgte der ursprünglichen Logik von Nordling [1], der feststellte, dass die Altersabhängigkeit von Phänomenen, für die n Mutationen in der gleichen Zelle erforderlich sind, in einer Zellpopulation konstanter Größe als eine Funktion des Alters mit der Potenz (n – 1) steigen würde: Nordling POBS(h, t) = κhtn–1 (Gleichung 20)
  • Hier ist κh eine Konstante, die zu dem Produkt der „n" Mutationsraten und der Zahl der Zellen mit Risiko proportional ist. Hierbei handelt es sich tatsächlich um die Rate der Initiation, eine Tatsache, die wir beim Ableiten von Schätzungen von Initiations-Mutationsraten verwenden werden. Wir modifizierten dieses Modell, indem wir eine Zeitverzögerung (Latenz), Δh, einfügten, die durchschnittliche Verzögerungszeit (Latenzzeit) zwischen der Initiation einer normalen Zelle und der Promotion einer beliebigen Adenomzelle, wodurch eine maligne Form entsteht. Das modifizierte Modell sieht so aus: Modifiziert. Nordling POBS(h, t) = κh(t – Δh)n–1(t > Δh) (Gleichung 21)
  • Durch Einsetzen von Gleichung 21 in Gleichung 19 stellen wir fest, dass es für einen gegebenen Wert von „n" vier unbekannte Parameter gibt: κh, Δh, Fh und fh.
  • Figure 00730001
  • Um einen oder alle vier unbekannten Größen explizit zu lösen, mussten wir vier unabhängige Gleichungen finden. Dies haben wir nun erreicht.
  • B. Parameter, bestimmt durch Ablesen: (Fn κh) und Δh
  • Δh und (Fh κh) wurden für jede Geburtsjahr-Kohorte durch Ablesen aus den Mortalitätsdaten bestimmt, die bezüglich des Überlebens und der Unterbewertung („underreporting") korrigiert waren, OBS·(h, t), wie in den 9A, 9B, 10A und 10B angegeben. Um diese Schätzungen durchzuführen, näherten wir OBS·(h, t) für Werte bis zu dem Alter tmax, wenn OBS·(h, t) ein Maximum erreicht. Die Gleichung ist für eine beliebige Zahl von Initiations-Mutationen, n, geeignet: OBS·(h, t) = FhPOBS(h, t) ≈ Fhκh(t – Δh)n–1(tmax > t > Δh) (Gleichung 23)
  • Diese Formulierung ist im Wesentlichen diejenige, die von Nordling [1] vorgeschlagen wurde, der keine Daten für extrem hohes Alter hatte und deshalb das Maximum nicht erkennen konnte. Z.B. würde, im Fall von n = 2, OBS·(h, t) bis zu t = Δh einen Wert von Null haben und dann linear mit der Steigung (Fh κh) ansteigen. Der Schnittpunkt der Linie mit der x-Achse („x-intercept") ist Δh. Wenn OBS·(h, t) sein Maximum bei tmax erreicht, versagt die Näherung. 15 zeigt die Berechnungen für europäisch-amerikanische Männer, geboren in den 1870er Jahren.
  • Genauso können Δh und (Fh, κh) für alle anderen Werte von n durch einfaches Auftragen von OBS·(h, t) gegen tn–1 durch Ablesen bestimmt werden. Für das allgemeine Modell mit „n" Initiations-Mutationen ist Δh einfach der x-Achse-Schnittpunkt des linearen Teils der Kurve von OBS·(h, t) gegen tn–1. Jedoch können κh und Fh in diesem Stadium nicht explizit bestimmt werden; ihr Produkt, (Fh, κh), wurde explizit definiert für tmax > t > Δh: (Fhκh) ≈ Steigung des linearen Teils von OBS·(h, t) gegen tn–1 (Gleichung 24)
  • 9. Verwendung der Fläche unter OBSR(h, t), um Fh bezüglich fh zu definieren
  • Für die Definition der zwei Unbekannten, Fh und fh, waren zwei weitere unabhängige Gleichungen erforderlich. Die erste wurde durch das Integral der Gleichung OBSR(h, t) gegen t aus t = 0 bis unendlich erhalten, wobei OBSR(h, t) die erwartete Mortalitätsrate darstellt, wenn alle Todesfälle durch Colonkrebs gemeldet wurden. OBSR(h, t) = OBS(h, t) ÷ R(h, t) (Gleichung 25)
  • Wir verwendeten die Funktion OBSR(h, t), da sie einfacher integriert wird. Dieses Integral muss etwa gleich der Fläche sein, die für die Daten von OBSR(h, t) gegen t festgestellt wird, wie in 16 erläutert.
  • Intuitiv erwarteten wir, dass die Fläche, Ah, eine Funktion sein muss der Population mit Risiko, einen Colonkrebs zu bekommen, Fh, und dem Anteil der Population mit Risiko, tatsächlich an Colonkrebs zu sterben, fh, im Gegensatz zu Todesformen, die ererbte oder Umwelt-Risikofaktoren oder beide mit dem Colonkrebs gemeinsam haben. Diese Fläche wäre unabhängig von Faktoren, die den Zeitpunkt beeinflussen würden, wann man Todesfälle erwarten kann, z.B. Überlebensraten, Mutationsraten und zellkinetischen Raten, außerdem der Zahl der Ereignisse, die für Initiation oder Promotion erforderlich sind.
  • Der algebraische Zusammenhang zwischen der Fläche unter OBSR(h, t) und Fh und fh wird in Gleichung 26 gezeigt. Die Ableitung dieser Gleichung über die explizite Integration von Gleichung 25 ist im Anhang dargestellt. Es war erstaunlich, wie einfach dieses Ergebnis war. Insbesondere stellte es eine Definition von Fh als eine explizite Funktion von fh und dem beobachteten Parameter Ah für beliebige untersuchte Kohorten und, in diesem Fall, eine beliebige Form von Krebs oder einer anderen tödlichen Krankheit bereit.
  • Figure 00740001
  • Jedoch haben wir sogar mit dieser geeigneten Funktion noch keinen der unbekannten Größen κh Fh oder fh bestimmt. Durch die Gleichungen 24 und 26 alleine wurden alle drei Terme nicht unabhängig voneinander definiert. Wir hatten drei Unbekannte und nur zwei unabhängige Gleichungen.
  • 10. Verwendung des maximalen Werts von OBS·(h,t), um Fh bezüglich κh und fh zu bestimmen
  • Für unsere letzte Gleichung, die noch erforderlich war, nutzten wir das Merkmal, dass die Mortalitätsfunktion OBS·(h, t) im hohen Alter ein klares Maximum erreichen, wie in den 9A, 9B, 10A und 10B gezeigt wird. Die Ableitung einer kontinuierlichen Funktion ist bei einem Maximum gleich Null. Wenn man die Ableitung von OBS·(h, t) nimmt und sie bei t = tmax, dem Alter, bei dem OBS·(h, t) ein Maximum ist, gleich Null setzt, lösen wir die Größen der anderen Unbekannten für einen beliebigen Wert von n nach Fh auf (die Ableitung findet sich im Anhang). Diese allgemeine Lösung ist als Gleichung 27 dargestellt.
  • Figure 00750001
  • Auf diese Weise haben wir vier unabhängige Gleichungen abgeleitet, indem wir drei getrennte Merkmale der Mortalitätskurven plus die direkte Beobachtung von Δh verwendet haben:
    • 1. die Steigung der (n – 1)-ten Wurzel von OBS·(h, t) für Gleichung 20,
    • 2. den x-Achse-Schnittpunkt der (n – 1)-ten Wurzel OBS·(h, t), direkte Bestimmung von Δh,
    • 3. die Fläche unter OBS·(h, t) für Gleichung 22 und
    • 4. das Maximum von OBS·(h, t) für Gleichung 23.
  • Wenn wir diese Gleichungen zusammennahmen, konnten wir auf diese Weise zwei gewünschte Populations-Risikoparameter, Fh und fh, für eine beliebige Geburtsjahr-Kohorte explizit bestimmen, für die diese vier Merkmale durch die Daten definiert waren. Außerdem lösten wir nach dem physiologischen Parameter κh auf, den wir nachstehend verwenden, um Initiations-Mutationsraten für einen beliebigen Wert von n zu bestimmen. Wir verwendeten keine Maximum-Likelihood-Methoden, um Werte für diese primären Risikofaktoren zu bestimmen. Vielmehr lösten wir nach ihnen explizit auf, nachdem wir die Näherung von Gleichung 17, die fh definiert, eingesetzt haben.
  • Mit dieser Taktik konnten wir die historische Variable Fh zu bestimmen. Hierdurch sollten wir in die Lage versetzt werden, die Wirkung von Umwelt-Veränderungen auf die Gesundheit von Populationen zu skizzieren. Außerdem stellt sie den minimalen Wert für G oder Eh für eine beliebige Geburtsjahr-Kohorte dar, da, wenn Eh = 1, G = Fh, und umgekehrt. Diese beiden Eigenschaften spielen eine wichtige Rolle, wenn man die genetischen und Umwelt-Wechselwirkungen aufklären will, die zu Colonkrebs führen.
  • C. Explizite Größen für sekundäre Risikoparameter: Initiations- und Promotions-Mutationsraten und adenomatöse Wachstumsraten für ein bestimmtes n und m
  • Nachdem wir einen expliziten Weg gefunden haben, um den Anteil einer Geburtsjahr-Kohorte mit Risiko für Colonkrebs zu berechnen, waren wir dafür bereit, algebraische Modelle der Tumor-Initiation und Promotion zu verwenden, um die Werte der Mutations- und zellkinetischen Rate zu errechnen, für die postuliert wurde, dass sie die altersspezifischen Mortalitätsraten bestimmen.
  • 1. Das Produkt von Initiations-Mutationsraten (ri, rj, rk ... rn)
  • Unser Modell für die Initiation mit n > 1 erforderlichen Ereignissen basiert auf dem Modell von Armitage und Doll [2], in dem „n" Ereignisse in einer beliebigen Zelle die erste Zelle eines Adenoms erzeugen würden. Wir haben dieses physiologische Modell jedoch erweitert, um den Turnover von Zellen in normalen Geweben und die Organisation von Geweben als Turnover-Einheiten von konstanter und gleicher Größe, enthaltend Na gesamte Zellen mit einem Alter „a", zu berücksichtigen.
  • Die Na gesamten Zellen umfassen terminale Zellen, Übergangszellen („transition cells") und Stammzellen. Es kann sein, dass initiierte terminate Zellen eine Wahrscheinlichkeit, einen Tumor zu bilden, von Null haben, und dass, wenn dies der Fall ist, die Zahl von Zellen mit Risiko um ½ reduziert wäre. Zurzeit betrachten wir in unserem Modell alle Zellen als Zellen mit Risiko, da bei einer terminalen Zelle des menschlichen Colons mehrere Monate zwischen einer terminalen Teilung und dem programmierten Tod liegen, bei menschlichen Colon-Adenomzellen ist der Zeitraum zwischen den Teilungen kürzer und beträgt etwa 40 Tage. Die Stammzelle und jede Übergangszelle durchläuft t Teilungen pro Jahr und stirbt nicht ab. Die terminalen Zellen „sterben" jeweils t-mal pro Jahr und teilen sich nicht. Der Wert von t wurde auf etwa 3 bestimmt.
  • Wir haben argumentiert [5], dass der wahrscheinlichste Weg, n > 1 Mutationen bei der Tumor-Initiation zu akkumulieren, darin besteht, dass alle außer einer der „n" Mutationen in der Stammzelle erworben werden. Danach füllt die Stammzelle ihre entsprechende Turnover-Einheit mit Zellen, welche die (n – 1) Mutationen enthalten, so dass die n-te Mutation nun in einer beliebigen dieser Zellen stattfinden könnte.
  • Wir stellen die Raten der erforderlichen Initiations-Mutationen als ri rj rk ... rn dar. Der Ausdruck, der die Zahl von neu initiierten Zellen im Jahr „a" beschreibt, ist einfach: Initiierte Zellen im Jahr „a" = nτn(ri rj rk ... rn)Naan–1 (Gleichung 28)für den Fall, in dem die Ordnung (Reihenfolge) der n Mutationen inkonsequent ist. Die Ausdrücke können auch für Modelle abgeleitet werden, in denen eine spezifische Ordnung von einigen oder allen Initiations-Mutationen erforderlich ist.
  • 2. Unterschied in Teilungs- und Absterberaten in Adenomen, (α – β), und die stochastische Extinktion von neu initiierten Zellen
  • Wie von Moolgavkar [51] bereits erkannt und algebraisch behandelt wurde, könnte jede initiierte Zelle sterben, bevor sie sich teilt. Sogar kleine Kolonien haben eine hohe Wahrscheinlichkeit, dass alle Zellen absterben; man würde erwarten, dass nur einige wenige Zellen als Adenome überleben, wenn die Wahrscheinlichkeit der Zellteilung nur minimal größer ist als die Wahrscheinlichkeit des Zelltods. Wenn man eine bestimmte Zellteilungsrate von a Zellteilungen pro Jahr und eine Absterberate, b, für eine initiierte Zelle annimmt, ist die Wahrscheinlichkeit einer Nicht-Extinktion oder des Überlebens (a – β)/α [51]. Somit wäre die Zahl von neu entstehenden und überlebenden Adenomen im Jahr „a":
    Figure 00770001
    für den Fall, dass die Ordnung von Mutationen inkonsequent ist. In dem nachstehend verwendeten Modell für die Promotion haben alle überlebenden Adenome die Eigenschaft, unerbittlich ein letales Karzinom durch Nettowachstum und Mutation hervorzubringen. Es ist zu beachten, dass bestimmt wurde, dass die Werte von α und β etwa 9 Teilungen bzw. „Absterbe-Fälle" pro Jahr betragen [5]. Die unbekannten Größen für die Initiationsrate sind das Produkt der Raten der n Initiations-Mutationen (ri rj rk ... rn) und dem kleinen Unterschied zwischen Teilungs- und Absterberaten in Colon-Andenomen, (α – β).
  • 3. Verwendung des berechneten Werts von κh, um eine unabhängige Gleichung mit zwei unbekannten Größen zu definieren: (ri rj rk ... rn) und (α – β)
  • Die Kombination der Daten von OBS·(h, t) und den Gleichungen 20, 22 und 23 machen eine explizite Bestimmung des unbekannten Parameters für eine beliebige untersuchte Kohorte möglich. κh ist eine jährliche Initiationsrate nach Nordling pro Person, so modifiziert, dass sie den Term von Moolgavkar umfasst, der erforderlich ist, um eine stochastische Extinktion zu überleben. Hier schreiben wir dies für den Fall in jungen Erwachsenen, nachdem Na ein Maximum, Nmax, erreicht hat [5].
  • Figure 00780001
  • Zellteilungs- und „Absterbe"raten können aus richtigen Gewebeproben bestimmt werden: t in normalem Gewebe, und a und b in Adenomen [5]. Jedoch ist ein Wert für die Wachstumsrate eines Adenoms, (α – β), klein, und wir können keine genauen unabhängigen Bestimmungen für die Teilungs- und Absterberaten in vivo bekommen, um diesen Unterschied aus Gewebeproben richtig abzuschätzen.
  • Alle Größen in Gleichung 30 sind bekannt, mit Ausnahme von (ri rj rk ... rn) und (α – β), jedoch können wir eine interessante Eigenschaft von OBS·(h, t) nutzen, um (αβ) explizit zu definieren und daraufhin den Wert von (ri rj rk ... rn) zu bestimmen. Hierfür müssen wir zuerst das Modell von Nordling um die erwartete Mortalität durch die beobachtete („OBServed") Krankheit, POBS(h, t), erweitern, um die Wachstumsrate eines Adenoms zu berechnen.
  • 4. Die erwartete Mortalitätsrate durch die beobachtete („OBServed") Krankheit, POBS(h, t), in der Gruppe mit Risiko, Fh
  • In unserem dreistufigen Karzinogenesemodell nahmen wir an, dass die dritte Stufe, die Progression, schnell erfolgt, wobei in einem Modell effektiv dargestellt werden kann, dass sie in null Jahren erfolgt. Deshalb ist die erwartete Mortalität durch die beobachtete („OBServed") Krankheit einfach gleich der Wahrscheinlichkeit der Initiation im Alter „a" (Gleichung 29) mal der Wahrscheinlichkeit der Promotion, die in einem späteren Alter „t" auftritt.
  • Unser Modell für die zweite Stufe des dreistufigen Karzinogenesemodells, die Promotion, beruht auch auf dem Modell von Armitage und Doll [2], in dem „m" bestimmte Ereignisse in einer beliebigen Zelle des Adenoms die erste Zelle eines Karzinoms erzeugen würden. Zuerst betrachteten wir den einfachsten Fall, bei dem ein einzelnes genetisches Ereignis eine Adenomzelle zu einer Karzinomzelle umwandeln könnte. Unter Verwendung der Poisson-Näherung ist die Wahrscheinlichkeit von mindestens einer Zelle, im Alter „t" in einem Adenom eine Promotion zu durchlaufen, wobei sie im Alter „a" initiiert wurde:
  • Figure 00790001
  • Der Exponentialfunktion stellt die erwartete Zahl von Zellen in dem Adenom dar, welche eine Promotion durchlaufen und die stochastische Extinktion (t – a) Jahre nach der Initiation überlebt haben. Hier stellt rA die Promotions-Mutationsrate pro Zellteilung dar, und (αc – βc) ÷ αc stellt die Wahrscheinlichkeit einer die Promotion durchlaufene („promoted") Zellkolonie dar, welche die stochastische Extinktion überlebt hat, bei gegebenen Zellteilungs- und Absterberaten pro Jahr von αc bzw. βc. Die restlichen Größen in Gleichung 31 beschreiben die Gesamtzahl von Zellteilungen oder Chancen für Promotion, die in dem Adenom erfolgt sind. Wir haben unsere frühere Näherung [5] um die Gesamtzahl von Zellteilungen erweitert, um die Zellteilungen von Zellen noch genauer zu berücksichtigen, die abgestorben sind (die Ableitung findet sich im Anhang). Durch Kombination der Wahrscheinlichkeit der Initiation aus Gleichung 29 mit der Wahrscheinlichkeit der Promotion aus Gleichung 31 folgt, dass die erwartete Mortalität durch die beobachtete Krankheit in der Gruppe mit Risiko ist (im erläuterten Fall m – 1):
  • Figure 00790002
  • Offensichtlich könnte ein Individuum während seines ganzen Lebens mehr als ein Adenom entwickeln, somit müssen wir alle möglichen Adenome berücksichtigen, die in einem beliebigen Alter zwischen der Geburt und „t" initiiert werden, indem wir über alle Alter integrieren. Wir können nun OBS·(h, t) verwenden, um (α – ß) explizit zu definieren und danach den Wert von (ri rj rk ... rn) zu bestimmen.
  • 5. Die Wachstumsrate von Adenomen, (α – β)
  • Wir haben das Konzept einer intermediären Kolonie, eines Adenoms, in das Karzinogenesemodell von Nordling aufgenommen, dadurch konnten wir die erwartete Mortalitätsrate, POBS(h, t) für diejenigen Individuen in der Gruppe mit Risiko in Form der Initiations-Mutationsraten, der Promotions-Mutationsrate und der adenomatösen Wachstumsrate einsetzen. Wir setzen unsere aktualisierte erwartete Mortalität in die Bestimmung für OBS·(h, t) in der jüngeren Population in Gleichung 23 ein und nehmen danach den log2 von der Ableitung davon, dies ergibt eine Linie der Form: log2 d(OBS·(h, t)) ÷ dt = (α – β)t + Konstante (Gleichung 33)(die Ableitung findet sich im Anhang),
    woraus wir einfach die Steigung ablesen können, um eine Schätzung für die zellkinetische Wachstumsrate des Adenoms, (α – β), zu bekommen. Als ein Beispiel zeigt 17 eine Schätzung für EAM, geboren in den 1920er Jahren. Um die Ableitung von OBS·(h, t) aus unseren Mortalitätsdaten abzuschätzen, verwenden wir die Näherung Δ(OBS·(h, t)) ÷ Δt d(OBS·(h, t)) ÷ dt.
  • 6. Explizite Bestimmung des Produkts von Initiations-Mutationsraten, (ri rj rk ... rn)
  • Durch die Bestimmung der Zellwachstumsrate eines Adenoms, (α – β), wurde es möglich, das Produkt der Initiations-Mutationsraten, (ri rj rk .... rn), unter Verwendung des vorher abgeleiteten Wertes von κh und Gleichung 30 zu berechnen. Aus diesem Produkt kann das geometrische Mittel als (ri rj rk .... rn)(1/n) abgeleitet werden. Als nächstes verwenden wir die Näherung der Wachstumsrate eines Adenoms, um die Promotions-Mutationsraten zu bestimmen.
  • 7. Die durchschnittlichen Promotions-Mutationsraten, rA
  • Die Auswertung der durchschnittlichen Promotions-Mutationsrate kann in Form von früher definierten Werten ausgedrückt werden. Der Wert Δh stellte die durchschnittliche Zeit zwischen der Initiation und der Promotion dar. Die kumulative Wahrscheinlichkeit (Summenwahrscheinlichkeit) einer Promotion in einem Adenom erfolgt somit etwa ½ Δh Jahre nach seiner Initiation. Dadurch konnten wir die beobachtete Verzögerung auf die durchschnittliche Promotions-Mutationsrate, rA, und die adenomatöse Wachstumsrate, (α – β), beziehen. Für den Fall von nur einer einzigen erforderlichen Promotions-Mutation, m = 1, ist dies:
    Figure 00800001
    (die Ableitung findet sich im Anhang).
  • Wenn mehrere, und nicht nur ein einziges genetisches Ereignis erforderlich wären, um eine Adenomzelle in eine Karzinomzelle umzuwandeln, m > 1, müssen wir weitere Phänomene betrachten. Nach der Akkumulation jeder neuen Promotions-Mutation würde in dem Adenom eine neue Kolonie von Zellen entstehen, von denen jede diese neue Promotions-Mutation enthält. Wie im Fall einer neu initiierten Zelle muss die neue Kolonie die stochastische Extinktion überleben, so dass eine vollständig die Promotion durchlaufene („promoted") Zelle notwendigerweise „m" mögliche Runden mit Nettowachstum und stochastischer Neuverteilung durchlaufen hätte.
  • Jedes Promotionsereignis könnte entweder die Promotions-Mutationsrate oder die Wachstumsrate der Zellen in dieser neuen Kolonie verändern. Wir können jedoch die Mortalitätsdaten nicht so aufschlüsseln, dass diese Raten für jeden der Schritte der Promotion unabhängig ausgewertet werden können. Immer noch können wir die gesamte Verzögerung zwischen der Initiation und der Promotion, Δh, auf das geometrische Mittel der Promotions-Mutationsrate und der durchschnittlichen adenomatösen Wachstumsrate für diejenigen Zellen beziehen, welche die direkte Abstammung zwischen der ersten Adenomzelle und der ersten Krebszelle darstellten. Die gesamte erwartete Verzögerung zwischen der Initiation und der Promotion, Δh, ist einfach die Summe der Verzögerungen zwischen jedem Promotionsereignis:
    Figure 00810001
    (die Ableitung findet sich im Anhang).
  • Hieraus erhalten wir eine Gleichung für den allgemeinen Fall von „m" Promotions-Mutationen, wobei angenommen wird, dass die Ordnung (Reihenfolge), in der die Promotions-Mutationen auftreten, wichtig ist. Man kann erwarten, dass eine solche Mutation ein früher Schritt der Promotion ist, da sie die Chance erhöhen würde, dass eine Adenomzelle während der Lebenszeit eines Individuums eine vollständige Promotion durchläuft.
  • Wenn die Ordnung (Reihenfolge), in der die „m" Mutationen auftreten, nicht wichtig wäre, dann würde die Verzögerung zwischen der Initiation und der Promotion sein:
  • Figure 00820001
  • In jedem Fall ist der einzige Parameter, der noch unbekannt bleibt, das geometrische Mittel der Promotions-Mutationsrate, rA. Jede dieser Gleichungen reicht aus, um diesen letzten unbekannten Parameter zu bestimmen, wodurch unsere explizite Ableitung aller physiologischen Parameter in dem dreistufigen Karzinogenesemodell, ri, (α – β) und rA, vervollständigt wird.
  • Ergebnisse
  • Zusammenbringen des Modells mit der öffentlichen Aufzeichnung der Colonkrebs-Mortalität
  • A. Beispiel mit n = 2 und m = 1
  • Als erste Demonstration unser algebraischen Darstellung des dreistufigen Karzinogenesemodells nehmen wir den Fall an, in dem n = 2 und m = 1. Wir wählen n = 2 aufgrund der Beobachtungen, dass der Verlust der Funktion von beiden guten Kopien der APC-Allele ausreichend war, um ein Colon-Andenom zu initiieren (18), und dass in unserer früheren Arbeit [5] die Schätzungen für Mutationsraten ähnlich waren wie die Mutationsraten von T-Zell-Vorläuferzellen [6]. Wir zeigen als erstes m = 1, da dies der einfachste Fall ist.
  • In Tabelle 4 und den 19A, 19B, 20A und 20B sind die Ergebnisse für den Fall mit n = 2 und m = 1 zusammengestellt, wobei Herrero-Jimenez et al. [5] erweitert wird, indem Schätzungen für nicht-europäische Amerikaner aufgenommen werden. Die Werte der Initiations-Mutationsrate, ri, sind angegeben, wobei angenommen wird, dass ri = 1/3 rj. Wir beziehen dies auf die Beobachtung von Grist et al. [6], dass die Summe aller Wege („pathways") für den Verlust von Heterozygotie des HLA-A-Locus in T-Zell-Vorläufern etwa 6,6 × 10–7 Ereignisse pro Zelljahr beträgt, im Vergleich zu einer Rate von 2,2 × 10–7 für die Inaktivierung durch Punktmutation durch ein einzelnes Allel des gleichen Gens.
  • Tabelle 4 Zusammenfassungen der Zellkinetiken für Kolonkrebs (wobei angenommen wurde, dass die Mitosezeit 90 Minuten beträgt)
    Figure 00830001
  • Eine umfassende Analyse der Daten für die Geburtsjahr-Kohorten vom Jahr 1910 ab war nicht möglich. Eine Bestimmung von „fh" war für diese Geburtsjahr-Kohorten nicht möglich, da hierfür vernünftige Informationen darüber erforderlich sind, wie die Mortalitätsraten im extrem hohen Alter abnehmen. Wir sind in der Lage, (α – β) für spätere Geburtsjahr-Kohorten festzustellen und dadurch die Promotions-Mutationsrate, rA, zu berechnen. Fh und ri wurden angenähert, indem zur Kenntnis genommen wurde, dass die Steigung der Colonkrebsraten für die späteren Geburtsjahre keine signifikanten Änderungen zeigte (9A, 9B, 10A und 10B), dies legt nahe, dass die Fläche unter den Mortalitätskurven konstant sein würde. Wenn zukünftige Daten zeigen, dass die Fläche sich doch ändert, dann wird dies notwendigerweise auf einem Ergebnis einer Änderung in f, nicht jedoch in Fh, beruhen. Eine Änderung in Fh hätte sowohl die Steigung als auch die Fläche der Funktion der altersspezifischen Colonkrebs-Mortalitätsrate beeinflusst.
  • Genauso konnte (α – β) nicht für die Geburtsjahre von 1880 an sicher bestimmt werden, da für diesen Zweck Daten für ein Altersintervall von 20 bis 60 verwendet werden und wir nur Daten ab dem Meldejahr 1930 und später zur Verfügung hatten. Da dieser Wert für jede Populations-Kohorte unverändert zu sein scheint, wurden andere Parameter bestimmt, wobei angenommen wurde, dass die adenomatöse Wachstumsrate konstant ist.
  • B. Beispiel mit n = 2, jedoch m > 1
  • Zuerst befassten wir uns mit der Hypothese, dass m = 1, da der beobachtete Wert für die Promotions-Mutationsrate ähnlich war wie die Rate des LOH in T-Zell-Vorläufern [5, 6]. Anschließend stellten wir die Hypothese auf, dass das erforderliche Ereignis für die Promotion der Verlust der Heterozygotie für ein beliebiges aus einem nicht-definierten Satz von zweiten „Gatekeeper"-Genen ist, so dass wir den Anteil mit Risiko durch den Anteil der Population definieren konnten, die für mindestens eines der zweiten „Gatekeeper"-Genen heterozygot ist.
  • Jedoch stimmte diese Hypothese nicht mit der nicht in Frage gestellten Tatsache überein, dass Colontumoren einen sehr hohen Anteil (im Durchschnitt 0,22) von LOH und LOI aufweisen, die über alle Chromosomen verteilt sind [12 bis 18]. Deshalb betrachteten wir erneut die Promotionsereignisse bezüglich der Raten von LOH und LOI, die in Colonkarzinomen LOH- und LOI-Anteile von 0,22 ergeben würden.
  • Es gibt etwa 9 × 63 = 567 lineare Zellteilungen zwischen einer ersten Adenom- und einer ersten Karzinomzelle bei Colonkrebs. Die Rate von LOH oder LOI, um einen Anteil von 0,22 nur aus Ereignissen mit adenomatösem Wachstum alleine zu erreichen, wären 0,22/567 = 3,9 × 10–4 LOH- oder LOI-Ereignisse pro Adenomzellteilung.
  • Diese Bestimmung kann bezüglich des genetischen Mittels der Promotions-Mutationsraten für verschiedene Werte von m betrachtet werden. Unsere Berechnungen sind in Tabelle 5 zusammengefasst.
  • Tabelle 5 Berechnete geometrische Mittel von Promotions-Mutationsraten, m = 1 bis 4 Daten für europäisch-amerikanische Frauen, geboren in den 1860er Jahren, (nicht-geordnet = Mutationen können in jeder beliebigen Ordnung (Reihenfolge) auftreten, geordnet = Mutationen müssen in einer bestimmten Ordnung (Reihenfolge) auftreten)
    Figure 00850001
  • Für den Fall von geordneten Promotions-Mutationen ergeben die Werte von m = 3 und 4 Mutationsraten, zwischen denen die LOH/LOI-Rate von 3,9 × 10–4 liegt. Für nicht-geordnete Promotionsereignisse liegt dieser Wert zwischen den Werten für m = 4 und 5. Solche Berechnungen können von Nutzen sein, wenn man die Zahl von LOH- plus LOI-Ereignissen betrachtet, die für eine Tumor-Promotion erforderlich sein könnten, jedoch sollten solche Betrachtungen nicht außer Acht lassen, dass es zurzeit keine Beweise gibt, dass entweder LOH- oder LOI-Ereignisse für die Promotion erforderlich sind.
  • Diskussion
  • Die wichtigsten Schlussfolgerungen
  • Durch die Verwendung der Daten für die Überlebens-Wahrscheinlichkeiten als eine Funktion des Alters und der Geschichte wurde unsere frühere Interpretation, die nur auf Mortalitätsdaten beruhte, erweitert und bestätigt: Es gibt ein echtes Maximum in der altersspezifischen Colonkrebs-Mortalitätsrate für Männer und Frauen sowohl in europäisch- als auch in afrikanisch-amerikanischen Subpopulationen. Diese Interpretation ist für die Entwicklung eines Verfahrens essentiell, mit dem der Anteil von jeder Geburtsjahr-Kohorte mit einem Risiko für Colonkrebs berechnet werden kann.
  • Wir haben ein erweitertes Knudson-Moolgavkar-Modell für Initiation und Promotion entwickelt und verwendet, in dem „n" seltene Ereignisse für die Initiation und „m" für die Promotion erforderlich sind [5]. Damit und mit der Näherung von Gleichung 17, um auch konkurrierende Todesarten zu berücksichtigen, die mit Colonkrebs gemeinsame Umwelt- und/oder genetische Risikofaktoren haben, haben wir Geburtsjahr-Kohorten-spezifische Werte für den Anteil mit einem primären Risiko, das Produkt von Initiations-Mutationsraten, das Produkt von Promotions-Mutationsraten und die durchschnittliche Wachstumsrate der adenomatösen intermediären Kolonie berechnet.
  • Da diese Parameter für jede Geburtsjahr-Kohorte berechnet wurden, können ihre historischen Veränderungen festgestellt werden. Diese können dann ihrerseits auf historische Änderungen in den Lebensgewohnheiten der Menschen und ihrer Umwelt bezogen wurden. Diese Parameter können zwischen den zwei großen demographischen Kohorten verglichen werden, für welche Daten verfügbar sind. Genauso können die Parameter für Männer und für Frauen verglichen werden.
  • Historische Änderungen im Anteil mit Risiko, Fh
  • Der Anteil mit einem primären Risiko von Colonkrebs blieb für die Geburtsjahr-Kohorten der 1860er bis 1940er Jahre im Wesentlichen konstant (19A und 19B). Dies trifft für Männer und Frauen sowohl europäischer als auch afrikanischer Abstammung zu. Dieser Anteil beträgt etwa 0,4. Es ist möglich, dass der Anteil mit Risiko von 0,3 für die Geburtsjahr-Kohorte der 1840er Jahre bis zu den 1870er Jahren auf 0,4 anstieg.
  • Die Konstanz dieses Anteils während eines Zeitraums mit deutlichen Lebensveränderungen in Amerika, bezüglich Ernährungsgewohnheiten, Rauchgewohnheiten, Ausmaß der körperlichen Betätigung, Industrialisierung und Urbanisierung, ist bemerkenswert. Diese Daten legen nahe, dass keine dieser bekannten, die Umwelt betreffenden Veränderungen aufgrund von Umwelt-Risikofaktoren irgend eine Auswirkung auf den Risikoanteil hatte. Man könnte sich vorstellen, dass es ausgleichende Umwelt-Veränderungen gegeben haben könnte, jedoch handeln solche Argumente, wofür die Daten fehlen, dem „Gesetz des geringsten möglichen Einsatzes" („law of parsimony") zuwider. Dabei sollte beachtet werden, dass dieses Ergebnis nicht anzeigt, dass es keine Umweltfaktoren gibt, welche die altersspezifischen Colonkrebsraten beeinflussen. Subpopulationen mit Zuständen, die vom Durchschnitt der Population signifikant abweichen, könnten höhere oder niedrigere Raten aufweisen, abhängig von ihren Umständen.
  • Größenordnung der Population mit Risiko
  • Es versetzt möglicherweise in Erstaunen, dass der Anteil mit Risiko so groß wie 40% ist, während weniger als 5% aller Todesfälle eine Folge von Colonkrebs sind. Dieses Ergebnis betont jedoch die Wichtigkeit und Notwendigkeit, alle anderen, damit zusammenhängenden Todesarten zu berücksichtigen, wenn man den Anteil mit einem primären Risiko für eine beliebige tödliche Krankheit berechnet.
  • Die Schätzung von 0,4 stellt einen minimalen Wert für den Anteil mit einem primären genetischen Risiko dar. Wenn bei allen Personen ein Umweltrisiko bestehen würde, dann wäre der Anteil mit einem primären genetischen Risiko 0,4.
  • Populationsgenetik des primären Risikos für Colonkrebs
  • Fall I: Ein genetisches Risiko wird durch eine dominante Mutation übertragen, welche für die Fortpflanzungsfähigkeit nicht deletär ist
  • In diesem Fall würden Homozyote Rezessive (Wildtyp) null genetisches Risiko haben, jedoch würden Heterozygote und Homozygote Dominante ein gleich großes Risiko haben. Für den Fall eines monogenen Risikos, wobei Heterozygote Dominante und Homozygote Dominante äquivalente Phänotypen aufweisen, nehmen wir an, dass die dominanten und rezessiven Allele in einem Hardy-Weinberg-Gleichgewicht vorliegen. Die Summe der Anteile von von Heterozygoten und Homozygoten Dominanten wäre somit 0,4 = 2pq + q2. „p" ist die Allel-Häufigkeit von rezessiven und „q" von dominanten Allelen, so dass p + q = 1. Bei Auflösung dieser quadratischen Gleichung nach q finden wir q = 0,23 als die einzige physikalisch mögliche Lösung, da q ≤ 1.
  • Somit wäre für den Fall eines dominanten monogenen primären genetischen Risikofaktors die Summe von ererbten Allelen, welche das Risiko codieren, 0,23. Man sollte außerdem die möglichen Werte von q für multigene oder polygenen genetische Risiken betrachten. Für ein multigenes Risiko würde der durchschnittliche Wert von q unter 0,23 liegen, und für ein polygenes Risiko würde der durchschnittliche Wert von q ein Wert der Größenordnung von 0,5 oder darüber sein.
  • Diese Schätzungen liegen im Bereich der Möglichkeiten, wenn bei homozygoten oder heterozygoten Zuständen keine physiologische Wirkung auf die Fortpflanzungsfähigkeit ausgeübt wird. Die physiologische Wirkung wäre auf ein Risiko, im fortgeschrittenen Alter an Colonkrebs zu sterben, begrenzt. Da die durchschnittliche Rate von Genmutationen, die zum Verlust eines Gen führen, etwa 3 × 10–5 pro menschliche Generation beträgt und da es etwa 104 menschliche Generationen gegeben hat, würde man für die Summe eines Satzes von neutralen Allelen für ein einzelnes Gen den akkumulierten Mutanten-Anteil von etwa 0,3 erwarten.
  • Eine Hypothese, dass ein primäres genetisches Risiko für Colonkrebs durch eine beliebige von einem Satz von nicht-deletären dominanten Mutationen in einem oder mehreren Genen definiert ist, ist somit mit dem berechneten primären Risikoanteil von 0,4 nicht unvereinbar. Die physiologische Wirkung einer solchen dominanten Mutation könnte die Initiation, Promotion oder Progression beeinflussen, wobei keine Möglichkeit besteht, anhand der vorliegenden Daten oder dem Verständnis der Karzinogenese zwischen diesen Möglichkeiten zu unterscheiden.
  • Fall II: Ein genetisches Risiko wird durch Homozygotie für eine rezessive Mutation übertragen, welche für die Fortpflanzungsfähigkeit nicht deletär ist
  • In dem Fall, wenn für ein primäres genetisches Risiko für Colonkrebs die Vererbung von zwei rezessiven Allelen für das gleiche Gen erforderlich ist, von dem keines die Fortpflanzungsfähigkeit beeinträchtigt, wäre der Anteil von rezessiven Homozygoten für eine monogene Störung q2 = 0,4 und q = 0,63.
  • Da wir definieren, dass diese rezessiven Allele in homozygoter oder heterozygoter Form keine Wirkung auf die Fortpflanzungsfähigkeit haben, könnten sie in heutigen Populationen einen so hohen Anteil erreicht haben, wenn die Mutationsrate für ein einzelnes Gen etwa zweimal dem Durchschnitt für alle Gen-inaktivierenden Mutationen entsprechen würde oder wenn das Risiko auf verschiedene Gene verteilt wäre. Wie im Fall I konnte man nicht logisch herleiten, welcher Schritt der Karzinogenese durch den rezessiven homozygoten Zustand beeinflusst werden könnte.
  • Fall III: Ein genetisches Risiko wird durch eine rezessive Mutation übertragen welche für die Fortpflanzungsfähiqkeit deletär ist
  • Eine dritte Möglichkeit besteht darin, dass ein Risiko durch einen Satz von Allelen in einem oder mehreren Genen übertragen wird, wobei die Homozygotie für solche Mutationen in Embryonen letal ist oder zumindest die Fortpflanzung verhindert. Wieder nehmen wir an, dass diese Allele im Hardy-Weinberg-Gleichgewicht vorliegen und dass Mutationen, die zum Verlust eines Gens führen, mit einem Durchschnitt von etwa 3 × 10–5 pro Generation auftreten. Aus diesen Annahmen würden wir erwarten, dass die Summe von Anteilen von mutierten Allelen für Heterozygote in einem beliebigen Gen in der Population im Bereich von etwa 0,005 bis 0,03 liegt. Der tatsächliche Wert für ein Gen würde von der Größe des Gens und dem Vorliegen von besonders gekennzeichneten Mutations-„Hot-Spots" abhängen. Um diese zu 0,4 zu summieren, ist offensichtlich ein multigenes Modell erforderlich. 40 getrennte Gene, jeweils bei einem Hardy-Weinberg-Gleichgewichtswert von etwa 1%, würden eine Hypothese darstellen, die mit diesen Berechnungen vereinbar ist.
  • Ein Modell, welches eine polygene Kombination von deletären rezessiven Allelen betrachtet, müsste eine sehr große Zahl von Genen (> 1000) berücksichtigen. Aus dieser Überlegung folgern wir, dass eine Kombination von LOH-Ereignissen während der Promotion, umfassend zwei oder mehr Gene, welche Allele enthalten, die für die Fähigkeit deletär sind, ein unwahrscheinliches Szenario ist. Bei Colonkrebs würde es wohl so sein, dass jedes erforderliche Ereignis, das den Verlust von Heterozygotie umfasst, während der Promotion erfolgen würde, da die Ereignisse der Initiation als Verlust von zwei Wildtyp-APC-Allelen angesehen werden und die Ereignisse der Progression Geschwindigkeits-begrenzend wären. Ein einziger ererbter Zustand von Heterozygotie wäre ausreichend, um ein primäres Risiko auszumachen, da eine beliebige Zahl von erforderlichen LOI-Ereignissen vermutlich dazu führen würde, dass alle Individuen das gleiche Risiko hätten.
  • Zusammenfassend kann man sagen, dass ein Anteil mit einem primären genetischen Risiko von 0,4 oder höher durch mutierte Allele von einem oder ein paar wenigen Genen erzeugt werden könnte, wenn die Fortpflanzungsfähigkeit nicht beeinträchtigt wäre. Jedoch wären vermutlich etwa 40 Gene erforderlich, um einen so hohen Anteil mit einem primären genetischen Risiko zu erzeugen, wenn eine Homozygotie für die mutierten Allele die Fortpflanzung verhindern würde.
  • Im ersten Fall würden die ursprünglichen Allele, die als „Hot-Spot"-Mutationen auftreten, in der Geschichte der Menschheit mehrmals entstanden und fixiert worden sein. Im letzteren Fall würde eine Selektion gegenüber alten deletären Mutationen nur relativ kürzliche Mutationen zurücklassen. In großen Populationen der heutigen Zeit, z.B. denjenigen von Asien, Afrika und Europa, könnte man erwarten, dass diese in einer sehr großen Zahl von Familien verbreitet sind.
  • Die Folgerungen eines minimalen primären genetischen Risikoanteils von 0,4 und die Betrachtung der hier angesprochenen Fälle eignen sich offensichtlich dafür, ein Verfahren zu entwickeln, mit dem das Gen oder die Gene gefunden werden kann/können, das/die hypothetisch solche Risiken enthält/enthalten.
  • Der Faktor, der für die damit zusammenhängenden Risiken steht, fh
  • Wie aus Tabelle 4 ersichtlich ist, steigt fh in der historischen Zeit für drei der vier Kohorten deutlich an und hat in der am wenigsten weit zurückliegenden Kohorte europäisch-amerikanischer Männer, für die fh berechnet werden kann, einen maximalen Wert von 0,24. Die Werte für Männer sind im Allgemeinen höher als die für Frauen.
  • Dieser Faktor steht sowohl für die zu wenigen Diagnosen („underdiagnoses"), die Unterbewertung („underreporting") als auch die Todesfälle von Personen mit Risiko für Colonkrebs durch andere Krankheiten mit gemeinsamen genetischen und/oder Umwelt-Risikofaktor(en). Die zu wenigen Diagnosen und die Unterbewertung („underreporting") sollten von 1930 bis 1992 abgenommen haben. Der steigende Wert von fh ist möglicherweise zum Teil auf diesen Trend zurückzuführen. Andererseits legt der niedrige Wert von fh, der von den in diesem Jahrhundert geborenen Populationen stammt, nahe, dass die genetischen und/oder Umwelt-Risikofaktoren für Colonkrebs für einen signifikanten Anteil von anderen Todesfällen verantwortlich sind. Wenn man davon ausgeht, dass der Colonkrebs etwas weniger als 5% aller Todesfälle ausmacht und dass der Wert von fh etwa 0,2 beträgt, muss man in Betracht ziehen, dass Risiken für Colonkrebs mit sehr vielen aller Todesfälle, nämlich mit 25%, assoziiert sind. Ein so großer Anteil könnte alle Todesfälle durch Krebs umfassen; andererseits könnte es auch sein, dass die genetischen oder Umwelt-Risikofaktoren für Colonkrebs auch zu einem großen Teil der Gefäßkrankheiten beitragen.
  • Wie im Text angemerkt wird, ist fh eine Näherung, zu der wir in Unwissenheit jeglicher Todesarten, die Risiken mit dem Colonkrebs gemeinsam haben, gezwungen waren. Dabei handelt es sich um den unsichersten Teil unseres Modells, wobei dies ein Bereich ist, an dem noch weiter theoretisch gearbeitet werden muss.
  • Mutationsraten in der Initiation
  • Unsere Schätzungen der Rate der ersten Initiations-Mutation für den Zustand n = 2 variieren von 4 bis 8 × 10–8 bei allen vier Geschlechter- und ethnischen Kohorten für die Geburtsjahr-Kohorten von den 1840er bis 1940er Jahren. Diese Schätzungen führten wir durch, indem wir uns auf Grist et al. [6] bezogen, die abschätzten, dass das Verhältnis des Verlusts eines aktiven Gens durch eine primäre Mutation etwa ein Drittel der Rate des Allel-Verlusts durch LOH betrug. Somit wurde n = 3 ri verwendet, um ri zu berechnen, nachdem das Produkt ri rj berechnet worden war. Diese Werte sind deutlich ähnlich wie die beobachteten Raten von spontanen Mutationen für eine Gen-Inaktivierung in einer Kultur menschlichen Zellen, die auf etwa 10–7 pro Zellteilung bestimmt wurden. Sie sind fast identisch mit einem geschätzten Wert von etwa 0,7 × 10–7 pro Stammzellteilung, der von altersabhängigen hprt-mutierten Anteilen in menschlichen peripheren T-Zellen hergeleitet wurde, für die drei Stammzellteilungen pro Jahr angenommen werden (12) [32 bis 42].
  • Wir sind überzeugt, dass diese Werte mit einem Modell des Verlusts des ersten APC-Allels in Colon-Stammzellen mit einer Rate von etwa 7 × 10–8 pro Stammzellteilung und einer Rate von LOH für das zweite Allel mit einer Rate von etwa 2,1 × 10–7 pro Stammzell- oder Übergangszellteilung vereinbar sind.
  • Diese berechneten Werte liegen so nahe bei den beobachteten menschlichen in vivo-Mutations- und LOH-Raten, dass wir n = 2 für die Initiation von Colonkrebs annehmen werden, bis gegenteilige Beweise vorliegen. Die Mutationsrate für europäisch-amerikanische Frauen liegt bei 7 × 10–7, wobei sie mit der historischen Zeit im Wesentlichen unverändert bleibt. Die Daten legen jedoch einen signifikanten Anstieg der Mutationsraten in beiden männlichen Kohorten von einem konstanten Wert von 4 × 10–7 von den 1840er bis zu den 1880er Jahren auf über 6 × 10–7 von den 1840er bis zu den 1940er Jahren nahe. Afrikanisch-amerikanische Frauen zeigen einen stetigen Anstieg von 4 × 10–7 in den 1840er bis 1900er Jahren bis zu der dann erreichten Rate von 7 × 10–7, die bei europäisch-amerikanischen Frauen zu sehen ist.
  • Mutationsraten in der Promotion
  • Wir haben keine Ahnung, wie viele genetische Änderungen für die Promotion bei Colonkrebs erforderlich sind und müssen somit den Wert für das geometrische Mittel der Mutationsraten für m = 1, 2, 3, ,,, als unsere Schätzung von rA betrachten.
  • Diese genetischen Veränderungen könnten Gen-„Aktivierungs"-Fehlsinnmutationen, Gen-inaktivierende Ereignisse, LOH für einen ererbten heterozygoten Zustand oder der Verlust der Prägung („loss of imprinting", LOI) eines Gens durch andere Mechanismen sein. Diese Prozesse könnten Punktmutationen, Rekombinationen, den Verlust von Chromosomen oder von chromosomalen Segmenten umfassen. Wie vorstehend angegeben glauben wir und beziehen uns dabei auf die Populationsgenetik, dass im Fall eines ererbten rezessiven Allels, das für die Fortpflanzungsfähigkeit deletär ist, ein einziges und nur ein LOH-Ereignis in dem ererbten homozygoten Zustand erfolgen könnte.
  • Für den Fall m = 1 beträgt der geschätzte Wert von rA etwa 2 × 10–7 pro Zellteilung für Frauen und 8 × 10–8 für Männer, ein Wert, der durch LOH in menschlichen T-Zellen in vivo oder durch die Gen-Inaktivierung eines etwas größeren als durchschnittlichen Gens angenähert wird. Der Wert ist viel niedriger als die LOH-Rate von Colon-Stammzellen von 7 × 10–6, die von Fuller et al. [46] und Jass et al. [47] hergeleitet wurde. Dabei wird der Fall eines monogenen Zustands betrachtet. Wenn beliebige von mehreren Genen beteiligt sind, dann könnte die Aktivierung von einem beliebigen von mehreren Proto-Onkogenen auch als eine zahlenmäßig vernünftige Hypothese angesehen werden.
  • Für den Fall m > 1 nimmt der geschätzte Wert von rA mit m zu, wie in Tabelle 4 angegeben ist. Wie in unserer früheren Arbeit [5] ist es klar, dass für m = 1 kein Anstieg der Promotions-Mutationsraten über die in normalen menschlichen T-Zellen gesehenen Raten angeführt werden muss, um die altersspezifischen Colonkrebsraten bei Menschen zu erklären. Für m = 2 wäre eine Rekombinationsrate erforderlich, die etwas über 7 × 10–6 liegt.
  • Erstaunlicherweise liegt die historische Schätzung dieser Promotions-Mutation, wobei m = 1 angenommen wird, für sowohl europäisch- als auch afrikanisch-amerikanische Männer deutlich konstant bei etwa 8 × 10–8. Bei sowohl europäisch- als auch afrikanisch-amerikanischen Frauen zeigt sich, dass der Wert vom mittleren neunzehnten Jahrhundert an signifikant angestiegen ist, bis er seit den 1890er Jahren einen konstanten Wert von etwa 2,5 × 10–7 erreicht hat.
  • Die Unterschiede zwischen den Geschlechtern und die Ähnlichkeiten zwischen den ethnischen Gruppen können für uns gewisse Gründe sein, diesen Werten Vertrauen zu schenken. Dies würde zu der Frage führen, welche Umwelt-Veränderungen beginnend in den 1860er Jahren alle Frauen beeinflusst haben, die in den 1890er Jahren abgeschlossen waren, von denen es denkbar wäre, dass sie die Promotions-Mutationsraten beeinflusst haben könnten. Andererseits könnten die Unterschiede, die zwar offensichtlich sind, jedoch auch durch unbekannte Fehler beim Registrieren oder bei der Diagnose entstanden sein, die in irgendeiner Weise geschlechtsspezifisch waren. Aufgrund der ökonomischen Unterschiede in den ethnischen Gruppen würde man jedoch davon ausgehen, dass solche Fehler den Vergleich zwischen ethnischen Gruppen beeinflussen. Solche Unterschiede treten jedoch überhaupt nicht auf.
  • Adenomatöse Wachstumsraten
  • Diese Werte sind im gesamten analysierten historischen Zeitraum außerordentlich konstant und liegen für Männer bei etwa 0,2 und für Frauen bei etwa 0,17. Die geschlechtsspezifischen Unterschiede scheinen echt und über ein Jahrhundert von Geburtsjahr-Kohorten konstant zu sein. Es scheinen keine Unterschiede zwischen den zwei ethnischen Gruppen vorzuliegen. Dies würde zeigen, dass die zahlreichen festgestellten Umwelt-Veränderungen während des Jahrhunderts keine Wirkung auf die adenomatöse Netto-Wachstumsrate hatten.
  • Man sollte beachten, dass diese adenomatösen Netto-Wachstumsraten von 0,2 und 0,17 Verdopplungen pro Jahr bemerkenswert ähnlich sind wie die Netto-Wachstumsraten von Kindern, die etwa 0,16 betragen (11A, 11B). Die Netto-Colonkarzinom-Wachstumsraten sind etwa 20 Verdopplungen pro Jahr, wohingegen dieser Wert mit der Netto-Wachstumsrate des menschlichen Fetus von etwa 54 Verdopplungen pro Jahr verglichen werden kann.
  • Diese Ähnlichkeiten ergeben eine quantitative Basis für die Idee, dass die genetischen Schritte der Karzinogenese umgekehrt wieder die Zustände des fetalen und postnatalen Wachstums herstellen. Diese Idee wird durch den Ausdruck „Onkogenese rekapituliert Ontogenese" zusammengefasst. In diesem Szenario bringen die Mutationen, welche das adenomatöse Wachstum zulassen, die Zelle wieder dazu, dass sie mit den Wachstumsraten von Kindern wächst, während die weitere(n) Änderung(en) dann die noch schnellere Wachstumsrate des fetalen Lebens möglich machen.
  • Man muss anmerken, dass die Beobachtungen von a, b und t in erwachsenen Colons gemacht wurden. Es wäre interessant zu wissen, ob t sich beim neonatalen oder kindlichen Wachstum ändert. Tatsächlich wissen wir an diesem Punkt nicht einmal, ob das kindliche Wachstum einen Anstieg in der Zahl von Stammzellen, einen Anstieg in der Größe von Turnover-Einheiten oder beides umfasst. Die Turnover-Rate in normalen erwachsenen Colons beträgt etwa 3 Teilungen pro Jahr, und in Colonadenomen beträgt sie etwa 9 Teilungen pro Jahr. Jedoch ist die Absterberate in Colonkarzinomen etwa gleich wie in Adenomen und beträgt etwa 9 pro Jahr, während die Teilungsrate auf 29 pro Jahr steigt. (Trotz dieser höheren Teilungsrate sollte man beachten, dass die durchschnittliche Zeit zwischen Teilungen von Karzinomzellen etwa 13 Tage beträgt, viel länger als die Teilungszeiten von einem Tag von Zellen in Kultur.)
  • Hohe LOH- und LOI-Werte in menschlichen Colonkarzinomen
  • Der Anteil von Menschen, welche LOH oder LOI für einen bestimmten Reporter-Locus zeigen, beträgt etwa 0,22. Da dieser hohe Anteil durch ein adenomatöses Wachstum mit der in menschlichen T-Zellen festgestellten LOH-Rate von etwa 2 × 10–7 Mutationen pro Zellteilung nicht erzeugt werden würde, überlegten wir uns, welche Rate von LOH/LOI erforderlich wäre, um einen solchen Anteil zu ergeben. Diese Rate wurde auf etwa 4 × 10–4 pro Zellteilung berechnet. Dabei handelt es sich um eine geschätzte 2000-fach höhere Rate als diejenige, die in normalen menschlichen Lymphoidzellen in vivo und in vitro festgestellt wird, und um eine etwa 60-fach höhere Rate als diejenige, die für Colon-Stammzellen-LOH-Raten bestimmt wird. Eine so hohe Rate würde bedeuten, dass ein Wert von m = 4 LOH/LOI-Ereignissen für die Promotion erforderlich ist (Tabelle 5).
  • Diese Berechnungen ergeben die LOH- oder LOI-Raten pro Zellteilung, wenn alle der in Karzinomen beobachteten LOH und LOI während des Wachstums von Adenomen vorkamen und dadurch eine einzige anfängliche Karzinomzelle entsteht.
  • Auch wenn diese hohe LOH- und LOI-Rate in Colonadenomen auftreten würde, würde hieraus nicht notwendigerweise gefolgert werden können, dass die Zahl von Promotionsereignissen 3 oder 4 betragen würde oder dass LOH oder LOI an der Promotion beteiligt wären. Auch wenn die LOH/LOI-Raten in Adenomen auf 4 × 10–4 ansteigen würden, könnte das erforderliche Promotionsereignis immer noch eine einzige Punktmutation sein, die mit einer Rate von 2 × 10–7 pro Zellteilung auftritt.
  • Hier muss man eine kritische Anmerkung zu einem herkömmlichen Fehler bei diesem Thema von hohen LOH/LOI-Werten in Tumoren machen. Einige Forscher haben nur die Zahl von Netto-Verdopplungen beim adenomatösen Wachstum verwendet, um einen LOH/LOI-Anteil von 0,22 zu erklären. Dies wäre der log2 (Adenom-Zellzahl am Ende der Promotion), der genau oder etwa 17 beträgt. Man benötigt für diese Berechnung jedoch die Gesamtzahl von linearen Teilungen zwischen der ersten Adenom- und der ersten Karzinomzelle. Diese Zahl beträgt etwa 567.
  • Robustheit des Modells
  • Um die Parameter unseres dreistufigen Karzinogenesemodells für mehrere Geburtsjahr-Kohorten zu berechnen, vermieden wir Maximum-Likelihood-Methoden, indem wir mehrere Näherungen herstellten. Uns ist klar, dass diese Näherungen zu einer ungenauen Bestimmung der tatsächlichen Werte geführt haben könnten.
  • Die Überlebensdaten wurden durch Beobachtungen von einer kleinen, möglicherweise nicht repräsentativen Population erhalten [19 bis 26]. Tabelle 6 zeigt die Effekte eines 10%igen Fehlers bei der Abschätzung des relativen Überlebens auf die berechneten Parameter für eine bestimmte Kohorte, die europäisch-amerikanischen Frauen, geboren in den 1880er Jahren. Es ist ersichtlich, dass die Populations-Risikoparameter, Fh und fh, und außerdem die Initiations-Mutationsrate, ri, durch diesen Fehlerbereich nicht ernsthaft beeinflusst werden würden. Dagegen sind die Terme für die adenomatöse Wachstumsrate und Mutation während der Promotion gegenüber dieser Art von Fehler empfindlicher. Außerdem schlossen die registrierten Daten solche Diagnosen von Colonkrebsfällen aus, die erst bei einer Autopsie entdeckt wurden. Dies kommt hauptsächlich bei den älteren Personen vor und kann zu einem großen Fehler im geschätzten Überleben bei den Älteren führen. Tabelle 5 zeigt die Effekte eines 10%igen Fehlers auf die Bestimmung des Überlebens für Individuen, die älter als 75 Jahre sind. Wieder ist ersichtlich, dass die Populations-Risikoparameter Fh und fh durch einen solchen Fehler nicht ernsthaft beeinflusst werden.
  • Tabelle 6 Prozentuale Änderung in den Bestimmungen der Parameter aufgrund von Fehlern in Datensätzen (Daten für europäisch-amerikanische Frauen, geboren in den 1880er Jahren, wurden verwendet)
    Figure 00950001
  • Außerdem testeten wir die Robustheit unserer Vorgehensweise, indem wir bestimmten, wie stark ein Fehler in einer der verschiedenen Beobachtungen, die aus den Mortalitäts-Rohdaten stammten, die Bestimmungen der Parameter beeinflussen würde (Tabelle 6). In diesem Stadium der Modellentwicklung und Verwendung werden wir durch die Ungenauigkeit unserer Bestimmungen der Promotions-Mutationsrate, rA, alarmiert, während uns die Ergebnisse hinsichtlich der Bestimmungen für alle anderen abgeleiteten Parameter eine allgemeine Robustheit anzeigen.
  • Allgemeingültigkeit des Modells für andere Krebsarten
  • Wir begannen mit der Analyse der Daten für andere Krebsarten und fanden, dass die primären Datensätze genauso gut geeignet waren wie diejenigen für Colonkrebs (http://cehs4.mit.edu). Bei Anwendung des allgemeinen Modells wurden vorläufige Schätzungen der adenomatösen Wachstumsraten und Mutationsraten erhalten, die zu den bei Colonkrebs beobachteten Werten ähnlich waren. Jedoch sind in den historischen Auswertungen die Bestimmungen des Anteils mit Risiko für Krebserkrankungen der Lunge, des Magens und des Gehirns nicht konstant, und auch nicht für Leukämie und Lymphome. Der Anteil mit Risiko, Fh, für Magenkrebs, zeigte eine gleichmäßige Abnahme für den untersuchten historischen Zeitraum, während alle anderen eine Zunahme, bezogen auf die Geburtsjahr-Kohorten des frühen bis mittleren neunzehnten Jahrhunderts, zeigten.
  • Die Form der Funktion von OBS(h, t) ist bei verschiedenen Krebsarten deutlich ähnlich, jedoch scheinen einige Krebsarten, wie Hodenkrebs (13), Morbus Hodgkin, Knochenkrebs und Brustkrebs, aus zwei klar getrennten Risikogruppen zu bestehen, so dass ein unabhängiges Modell für jede Gruppe wie in Gleichung 13 erstellt werden muss.
  • Weitere Entwicklung des allgemeinen Modells
  • Das durch die Gleichungen 22 und 34 dargestellte allgemeine Modell führt selbst zu einer weiteren geeigneten Manipulation und Anwendung. Hierzu könnten zählen das Erstellen von Modellen für Krankheiten, z.B. HNPCC, die durch Vererbung einer Heterozygotie für ein rezessives, jedoch kräftiges Mutator-Allel für eines von einem Satz von Genen, die an der Reparatur von Fehlpaarungen beteiligt sind, verursacht werden. Epidemiologen drücken sich mit dem Begriff des „relativen Risikos" aus. Es sollte einfach sein, dieses Konzept mit dem hier entwickelten allgemeinen Modell zu kombinieren. Ein Verhältnis von OBS·(h, t)-Funktionen würde einen Vergleich des „relativen Risikos" zwischen Populationen darstellen, die sich in Mutationsraten, adenomatösen Wachstumsraten usw. unterscheiden. Genauso könnte man nun diese Vorgehensweise verwenden, um ein quantitatives Modell für Wahrscheinlichkeiten von wiederauftretenden Krebserkrankungen bei Personen zu erstellen, die eine erste Krebserkrankung überlebt haben, wobei angenommen wird, dass die therapeutischen Maßnahmen keine Wirkung auf diese Wahrscheinlichkeit haben.
  • Anhang (Beispiel 2)
    Figure 00970001
  • Um eine Integration zu ermöglichen, führen wir die Variable v ein, so dass:
  • Figure 00970002
  • Hierdurch wird es möglich, einen einfacheren Ausdruck zu erzeugen und nach dem bestimmten Integral aufzulösen:
  • Figure 00970003
  • Dieser Ausdruck stellt die Gleichung 26 im Kontext dar: Es ist zu beachten, dass wir durch anfängliches Teilen von OBS(h, t) durch R(h, t) vermieden haben, R(h, t) charakterisieren zu müssen, das selbst nicht explizit integrierbar ist.
  • Die Verwendung des maximalen Werts von OBS·(h, t) zur Definition von Fh bezüglich κh und fh
  • Unsere dritte Gleichung in unserer expliziten Ableitung des Risikoanteils, Fh, stammte aus der Beobachtung, dass die Mortalitätskurven, die an das Überleben und die Unterbewertung („underreporting") abgeglichen wurden, ein Maximum erreichten. Unter Verwendung der Gleichungen 19 und 21 stellen wir fest, dass:
  • Figure 00980001
  • Wenn wir die Ableitung im Alter t = tmax auswerten, wobei die Ableitung von OBS·(h, t) gleich 0 ist, stellen wir fest:
  • Figure 00980002
  • Durch Herauskürzen der gemeinsamen Größen wird dies vereinfacht auf:
  • Figure 00980003
  • Beim Auswerten der Ableitung von I(t) stellen wir fest, dass:
  • Figure 00980004
  • Durch Auflösen nach dem Risikoanteil, Fh, wird Gleichung 27 erzeugt.
  • Figure 00990001
  • Die erwartete Mortalitätsrate aus der beobachteten (OBServed") Krankheit POBS(h, t), in der Risikogruppe, Fh
  • Berechnung der Zahl der gesamten Zellteilungen in einem Adenom, (t – a) Jahre nach seiner Initiation
  • Um die Promotions-Mutationsrate hinsichtlich der Mutationen pro Zellteilung richtig auszuwerten, müssen wir die Gesamtzahl von Zellteilungen kennen, die in einem Adenom zwischen dem Alter bei der Initiation, a, und dem Alter bei der Promotion, t, ablaufen würden.
  • Zuerst betrachten wir die Zahl von Zellen in dem Adenom. Die anfängliche Zellzahl in einem überlebenden Adenom ist nicht eins, sondern α/(α – β). (Dies beruht auf der stochastischen Neuverteilung der überlebenden Zellen von allen initiierten Adenomen auf die überlebenden Adenome [5]). Die Kolonie wächst auch mit einer Rate von (α – β) pro Jahr, so dass die Zahl von Zellen im Adenom nach (t – a) Jahren beträgt:
  • Figure 00990002
  • Da die Teilungs- und Absterberaten eines Adenoms etwa gleich sind [5], können wir ein Jahr in a Zeitabschnitte teilen. Dann können wir eine Gleichung für die Zahl von Zellen in dem Adenom als eine Funktion der Zahl dieser Zeitabschnitte, die abgelaufen sind, δ, schreiben:
  • Figure 01000001
  • Die Zahl der gesamten Zellteilungen, die in dem Adenom stattgefunden haben, kann sodann auf die Zahl der Zellen bezogen werden. Um eine Kolonie mit einer bestimmten Größe zu haben, NAdenom, stellen wir fest, dass (NAdenom ÷ 2) Teilungen innerhalb des letzten Zeitabschnitts von möglichen Teilungen erfolgt sein müssen:
  • Figure 01000002
  • Folglich ist die Gesamtzahl von Zellteilungen die Summe der Zahl von Teilungen, die erforderlich sind, um jede der intermediären Größen des Adenoms bis zum letzten Zeitabschnitt, δ, anzugeben:
  • Figure 01000003
  • Diese Summierung kann explizit aufgelöst werden als:
  • Figure 01000004
  • Wir finden tatsächlich, dass wir, wenn wir das Integral anstelle der vorstehenden Summierung nehmen, eine verlässliche und leichter zu merkende Bestimmung erhalten:
  • Figure 01000005
  • Schließlich stellen wir fest, dass für jede Teilung bei jeder der zwei Tochterzellen die Promotions-Mutation stattfinden kann. Deshalb ist die Zahl der Möglichkeiten für eine Promotion nach (t – a) Jahren gerade zweimal die Gesamtzahl der Teilungen:
    Figure 01010001
    wie in Gleichung 21 eingesetzt.
  • Die Wachstumsrate von Adenomen, (α – β)
  • Um die Initiations- und Promotions-Mutationsraten zu bestimmen (Gleichungen 26, 30), müssen wir die durchschnittliche Wachstumsrate eines Adenoms kennen. Während die Teilungs- und Absterberaten, α bzw. β, in vivo bestimmt werden können, träfe dies auf die Differenz (α – β) nicht zu, da sie zu klein ist, um mit einer geeigneten Genauigkeit bestimmt zu werden. Die adenomatöse Wachstumsrate kann jedoch aus den Mortalitätskurven direkt bestimmt werden. Wir werden dies erläutern, indem wir den Fall (n = 2, m = 1) nehmen. Die berechnete adenomatöse Wachstumsrate ist für alle anderen Fälle etwa gleich.
  • Für Altersstufen unter 54 Jahren können wir die angepasst beobachtete Mortalitätsrate OBS·(h, t) als: OBS·(h, t) = OBS(h, t) ÷ [R(h, t)(1 – S(h, t))] ≈ FhPOBS(h, t)bestimmen, wobei
  • Figure 01010002
  • Als eine erste Näherung nehmen wir eine konstante Zahl von Zellen im Zielgewebe an. Der Klarheit halber fassen wir diejenigen Parameter, die nicht mit dem Alter variieren, in eine Gruppe zusammen (z.B. Fh ist in C1 enthalten):
  • Figure 01010003
  • Um dieses Integral lösen zu können, stellen wir fest, dass ex ≈ 1 + x, wenn x klein ist. Dies ergibt:
    Figure 01020001
    wobei wir die zwei Konstanten kombinierten, C1 C2 = C. Wenn wir nun die Ableitung von OBS·(h, t) nehmen, stellen wir fest:
  • Figure 01020002
  • Der log2 von dOBS·(h, t) ÷ dt ist eine Funktion von t, deren Steigung die adenomatöse Wachstumsrate, α – β, darstellt:
  • Figure 01020003
  • Diese Näherung ist nur dann gültig, wenn 2(α–β)t >> 1, also muss man beim Bestimmen der adenomatösen Wachstumsrate sorgfältig beachten, dass man nicht Daten von Altersgruppen unter dem Alter von 14 Jahren verwendet.
  • Genauso näherten wir die adenomatöse Wachstumsrate, indem wir die Anstiege der Zellzahlen während der Kindheit berücksichtigten. Wenn wir die Ableitung von OBS·(h, t) unter Verwendung der Daten für t > 17,5 berechnen, sehen wir, dass:
  • Figure 01020004
  • Der log2 dieser Funktion, aufgetragen gegen t, ist auch eine gerade Linie, wie in 18 dargestellt. Die Steigung dieser Funktion ist (α – β).
  • Die durchschnittlichen Promotions-Mutationsraten, rA, (m = 1)
  • Beim Berechnen der Promotions-Mutationsrate, rA, für den Fall, dass nur eine einzige Mutation für die Promotion einer Adenomzelle erforderlich war, verwendeten wir die Näherung, dass die kumulative Wahrscheinlichkeit nach Δh Jahren ½ wäre, wobei Δh die durchschnittliche Zeit zwischen der Initiation und der Promotion darstellt. Unter Verwendung von Gleichung 21 bedeutet dies:
  • Figure 01030001
  • Jedoch gilt die Annahme, dass die kumulative Wahrscheinlichkeit zu der durchschnittlichen Zeit zwischen der Initiation und der Promotion etwa ½ ist, nur dann, wenn die Verteilung für die Wahrscheinlichkeit der Promotion durch eine normale Verteilung angenähert werden kann. Wenn (α – β) ansteigt, kann die tatsächliche Verteilung nicht länger als eine normale Verteilung angenähert werden. In diesem Fall können wir die exakte Berechnung einsetzen, um den erwarteten Wert für die Zeit zwischen der Initiation und der Promotion zu bestimmen. Der erwartete Wert für eine kontinuierliche Zufallsgröße, in unserem Fall die Zeit zwischen der Initiation und der Promotion, t – a, ist wie folgt definiert:
  • Figure 01030002
  • Wir rechnen die erwartete Zeit zwischen der Initiation und der Promotion wie folgt aus:
    Figure 01030003
    wobei Ei die exponentielle Integralfunktion darstellt. Anhand eines Computerprogramms, z.B. MathematicaTM (ExplntegralEi Funktion) oder MatlabTM (Expint Funktion), kann man die exponentielle Integralfunktion berechnen.
  • Die durchschnittlichen Promotions-Mutationsraten, rA, m > 1
  • Wenn in einer Zelle in einem Adenom die erste Promotions-Mutation erfolgt ist, kann sich diese Zelle teilen und zu einer eigenen Kolonie von Zellen werden, die nun eine bestimmte Promotions-Mutation enthalten. Eine Zelle in dieser Kolonie ist ein Ziel für ein zweites Promotionsereignis, wodurch eine neue Kolonie innerhalb des Adenoms erzeugt wird, die nun aus Zellen mit zwei Promotions-Mutationen besteht. Dieser Prozess setzt sich so lange fort, bis in einer Zelle alle erforderlichen „m" Promotions-Mutationen stattgefunden haben, durch die eine Karzinomzelle erzeugt wird (21). Wie es bei einer neu initiierten Zelle der Fall war, müssen wir die Möglichkeit in Betracht ziehen, dass eine beliebige Zelle, in der eine neue Promotions-Mutation stattfindet, eine stochastische Extinktion durchläuft, bevor sie sich zu einer Kolonie entwickelt.
  • Das Adenom selbst würde sich somit als ein Gemisch von Kolonien von Zellen darstellen, die Null oder mehr der Promotionsereignisse enthalten, und die Verzögerung beim Anstieg der Mortalitätskurven, Δh, ist nun die Summe der durchschnittlichen Zeit zwischen jedem Promotionsereignis.
  • Figure 01040001
  • 16. Diagramm der Promotion für „m" erforderliche Ereignisse
  • Aus 16 folgt die Wahrscheinlichkeit einer Promotion im Alter „t" einfach als: Wahrscheinlichkeit einer ersten Promotions-Mutation bei Alter (a < t1 < t) × Wahrscheinlichkeit einer zweiten Promotions-Mutation bei Alter (t1 < t2 < t) × ... × Wahrscheinlichkeit einer (m – 1)-ten Promotions-Mutation bei Alter (tm–2 < tm–1 < t) × Wahrscheinlichkeit einer m-ten Promotions-Mutation im Alter t
  • Explizit ist dies:
    Figure 01050001
    wobei die erste Promotions-Mutation in einem beliebigen Alter, t1, zwischen der Initiation und dem Absterben auftritt, die zweite Promotions-Mutation in einem beliebigen Alter, t2, zwischen der ersten Mutation und dem Absterben auftritt, die dritte Promotions-Mutation in einem beliebigen Alter, t3, zwischen der zweiten Mutation und dem Absterben auftritt, usw. bis zur letzten Promotions-Mutation, die im Alter t auftreten muss. Wieder stellen wir fest, dass es „m" Zielallele für das erste Promotionsereignis, (m – 1) für das zweite Promotionsereignis usw. gibt.
  • Wir haben vorausgesetzt, dass der Erfolgen eines neuen Promotionsereignisses entweder die zellkinetischen Raten, αx und βx, oder die Promotions-Mutationsrate, rx, für diese Zelle verändert. Es ist uns zwar nicht möglich, jede zellkinetische Rate und Promotions-Mutationsrate unabhängig für jeden Schritt zu bestimmen, wir könnten uns jedoch vorstellen, dass es eine durchschnittliche Promotions-Mutationsrate, rA, und eine durchschnittliche zellkinetische Wachstumsrate, α – β, gibt, welche einen ähnlichen Prozess von „m" Promotions-Mutationen beschreibt, so dass die gesamte Verzögerung des Beginns der Krankheit äquivalent ist. Die Wahrscheinlichkeit einer Promotion liegt nun in der einfacheren Form vor:
  • Figure 01060001
  • Wir können nun die durchschnittliche Promotions-Mutationsrate mit Bezug auf die erwartete Zeit zwischen jedem Paar von aufeinanderfolgenden Ereignissen explizit bestimmen. Hier lösen wir nach der durchschnittlichen, zwischen jedem Promotionsereignis liegenden Zeit, Δx, auf. Wieder verwenden wir die Näherung, dass die durchschnittliche Zeit etwa einer kumulativen Wahrscheinlichkeit für diese Promotions-Mutation von 0,5 entspricht:
  • Figure 01070001
  • Die insgesamt erwartete Verzögerung zwischen der Initiation und der Promotion, Δh, ist einfach die Summe der Verzögerungen zwischen jeder Promotions-Mutation.
  • Für m > 1:
  • Figure 01070002
  • Hieraus erhalten wir eine Gleichung für die Verzögerung in dem allgemeinen Fall von „m" Promotions-Mutationen, wobei angenommen wird, dass die Ordnung (Reihenfolge), in der die Promotions-Mutationen erfolgen, inkonsequent ist.
  • Wenn wir statt dessen annehmen, dass jede der Promotions-Mutationen entweder zu einer erhöhten Zellwachstumsrate oder zu einer erhöhten Mutationsrate pro Zelljahr führt, dann würde eine bestimmte Ordnung (Reihenfolge) für die „m" erforderlichen Promotions-Mutationen vorliegen, welche für die frühe Promotion des Tumors günstig wäre. Wir könnten annehmen, dass, wenn die bestimmten deletären Mutationen nicht früh in der Ordnung (Reihenfolge) der „m" Mutationen auftreten, dann das Individuum nicht alle der notwendigen Promotions-Mutationen in seiner Lebenszeit akkumulieren würde. Unter Verwendung der gleichen Logik wie vorstehend können wir die Verzögerung zwischen der Initiation und der Promotion explizit berechnen, wenn die „m" Mutationen in einer bestimmten Ordnung (Reihenfolge) erfolgen mussten:
  • Figure 01080001
  • Durch diese Gleichungen können wir die durchschnittliche Promotions-Mutationsrate für den Fall, wobei die „m" Promotions-Mutationen in einer vollständig ungeordneten Art und Weise erfolgen, und für den Fall bestimmen, wobei die „m" Promotions-Mutationen einer bestimmten Ordnung (Reihenfolge) folgen müssen. Natürlich ist es möglich, dass nur einige der Promotions-Mutationen in einer Ordnung (Reihenfolge) erfolgen müssen. Für diesen Fall, wobei die „m" Mutationen nur teilweise geordnet sind, würden diese Gleichungen den möglichen Bereich für die durchschnittliche Promotions-Mutationsrate beschreiben.
  • Referenzen, die in Beispiel 2 zitiert sind
    • [1] Nordling, C. O. (1953) A new theory on the cancer-inducing mechanism, Brit. J. Cancer, 7, 68–72.
    • [2] Armitage, P., und R. Doll (1954) The age distribution of cancer and a multi-stage theory of carcinogenesis, Brit. J. Cancer, 8(1), 1–12.
    • [3] Armitage, P., und R. Doll (1957) A two-stage theory of carcinogenesis in relation to the age distribution of human cancer, Brit. J. Cancer, 9(2), 161–169.
    • [4] Moolgavkar, S. H., und E. G. Luebeck (1992) Multistage carcinogenesis: Population-based model for colon cancer, JNCI, 84(8), 610–618.
    • [5] Herrero-Jimenez P., G. Thilly, P. J. Southam, A. Tomita-Mitchell, S. Morgenthaler, E. E. Furth und W. G. Thilly (1998) Mutation, cell kinetics, and subpopulations at risk for colon cancer in the United States. Mut. Res., 400(1–2), 553–787.
    • [6] Grist, S. A., M. McCarron, A. Kutlaca, D. R. Turner und A. A. Morley (1992) in vivo human somatic mutation: Frequency and spectrum with age, Mut. Res., 266(2), 189–196.
    • [7] Powell, S. M., N. Zilz, Y. Beazer-Barclay, T. M. Bryan, S. R. Hamilton, S. N. Thibodeau, B. Vogelstein und K. W. Kinzler (1992) APC mutations occur early during colorectal tumorigenesis, Nature, 359(6392), 235–237.
    • [8] Cook, P. J., R. Doll und S. A. Fillingham (1969) A mathematical model for the age distribution of cancer in man, Int. J. Cancer, 4(1), 93–112.
    • [9] U.S. Department of Health and Human Services, Vital Statistics of the United States, (1937–1992), Band II-Morality Part A, US Government Printing Office, Hyattsvile, Maryland.
    • [10] U.S. Bureau of the Census, Mortality Statistics, (1900–1936), Special Reports, Washington Government Printing Office.
    • [11] Levy, D., K. J. Smith, Y. Beazer-Barclay, S. R. Hamilton, B. Vogelstein und K. W. Kinzler (1994) Inactivation of both APC alleles in human and mouse tumors, Cancer Research, 54(22), 5953–5958.
    • [12] Vogelstein, B., E. R. Fearon, S. E. Kern, S. R. Hamilton, A. C. Preisinger, Y. Nakamura und R. White (1989) Allelotype of Colorectal Carcinomas, Science, 244, 207–211.
    • [13] Vogelstein, B., E. R. Fearon, S. R. Hamilton, S. E. Kern, A. C. Preisinger, M. Leppert, Y. Nakamura, R. White, A. M. Smits und J. L. Bos (1988) Genetic alteratians during colorectal-tumor development, N. Engl. J. Med., 319(9), 525–32.
    • [14] Garcia-Patino, E., B. Gomendia, M. Lieonart, J. M. Silva, J. M. Garcia, M. Provencio, R. Cubedo, P. España, S. Ramón y Cajal und F. Bonilla (1998) Loss of Heterozygosity in the Region Including the BRCA1 Gene on 17q in Colon Cancer, Cancer Genet. Cytogenet., 104, 119–123.
    • [15] Resta, N., C. Simone, C. Mareni, M. Montera, M. Gentile, F. Susca, R. Gristina, S. Pozzi, L. Bertario, P. Bufo, N. Carlomagno, M. Ingrosso, F. P. Rossini, R. Tenconi und G. Guanti (1998) STK11 Mutations in Peutz-Jeghers Syndrome and Sporadic Colon Cancer, Cancer Research, 58, 4799–4801.
    • [16] Uhrhammer, N., J. Bay, D. Pernin, P. Rio, M. Grancho, F. Kwiatkowski, S. Gosse-Brun, A. Daver und Y. Bignon (1999) Loss of heterozygosity at the ATM locus in colorectal carcinoma, Oncol. Rep., 6(3), 655–658.
    • [17] Ragnarsson, G., G. Eiriksdottir, J. Th. Johannsdottir, J. G. Jonasson, V. Egilsson und S. Ingvarsson (1999) Loss of Heterozygosity at Chromosome 1p in Different Solid Tumours: Association with Survival, Br. J. Cancer, 79(9/10), 1468–1474.
    • [18] Cui, H., I. L. Horon, R. Ohlsson, S. R. Hamilton und A. P. Feinberg (1998) Lass of imprinting in normal tissue of colorectal cancer patients with microsatellite instability, Nat. Medicine, 4(11), 1276–1280.
    • [19] Eisenberg, H., P. D. Sullivan und R. R. Connelly, Cancer in Connecticut: Survival Experience, 1935–1962, Hartford, Conn., Connecticut State Department of Health, 1968.
    • [20] Cutler, S. J. und F. Ederer (Hrsg), End Results and Mortality Trends in Cancer; NCI Monograph No. 6, National Cancer Institute, Bethesda, MD, © 1961.
    • [21] Axtell, L. M., A. J. Asire und M. H. Myers (Hrsg), Cancer Patient Survival; Report Number 5, National Cancer Institute, Bethesda, MD, © 1976.
    • [22] Ries, L. A. G., E. S. Pollack und J. L. Yaung Jr. (1983) Cancer Patient Survival: Surveillance, Epidemiology, and End Results Program, 1973–79, JNCI, 70(4), 693–707.
    • [23] Miller, B. A., L. A. G. Ries, B. F. Hankey, C. L. Kosary, A. Harras, S. S. Devesa und B. K. Edwards (Hrsg), SEER Cancer Statistics Review: 1973–1990, National Cancer Institute, Bethesda, MD, © 1993.
    • [24] Ries, L. A. G., C. L. Kosary, B. F. Hankey, B. A. Miller, A. Harras und B. K. Edwards (Hrsg), SEER Cancer Statistics Review: 1973–1994, National Cancer Institute, Bethesda, MD, © 1997.
    • [25] Ries, L. A. G., C. L. Kosary, B. F. Hankey, B. A. Miller, L. Ciegg und B. K. Edwards (Hrsg), SEER Cancer Statistics Review: 1973–1996, National Cancer Institute, Bethesda, MD, © 1999.
    • [26] Beart, R. W., G. D. Steele Jr., H. R. Menck, J. S. Chmiel, K. F. Ocwieja und D. P. Winchester (1995) Management and survival of patients with adenocarcinoma of the colon and rectum: A national survey of the Commission on Cancer, J. Amer. Coll. Surg., 181, 225–236.
    • [27] Heston, J. F., J. B. Kelly, J. W. Meigs, J. T. Flannery, M. M. Cusano und J. L. Young Jr. (Hrsg), Forty-five years of Cancer Incidence in Connecticut: 1935–79, National Cancer Institute, Bethesda, MD, © 1986.
    • [28] Percy, C., E. Stanek III und Ries, L. A. G., Cancer Mortality in the U.S., 1950–1957, Appendix III, National Cancer Institute, Bethesda, MD, © 1982.
    • [29] Wright, N., A. Watson, A. Morley, D. Appleton, J. Marks und A. Douglas (1973) The cell cycle time in the flat (aviollous) mucosa of the human small intestine, Gut, 14, 603–606.
    • [30] Weinstein, W. M., G. N. Tygat, M. Chen und P. R. Band (1973) In vivo studies of cell proliferation and kinetics in the human jejunal mucosa, Gastroenterology, 64, A137/820.
    • [31] Hamill, P. V., T. A. Drizd, C. L. Johnson, R. B. Reed, A. F. Roche und W. M. Moore (1979) Physical Growth: National Center for Health Statistics percentiles, Am. J. Clin. Nutr., 32(3), 607–629.
    • [32] Bigbee, W. L., J. C. Fuscoe, S. G. Grant, I. M. Jones, A. E. Gorvad, K. Harrington-Brock, C. L. Strout, C. B. Thomas und M. M. Moore (1998) Human in vivo somatic mutation measured at two loci: individuals with stably elevated background erythrocyte glycophorin A (gpa) variant frequencies exhibit normal T-lymphocyte hprt mutant frequencies, Mut. Res., 397(2), 119–36.
    • [33] Branda, R. F., L. M. Sullivan, J. P. O'Neill, M. T. Falta, J. A. Nicklas, B. Hirsch, P. M. Vacek und R. J. Albertini (1993) Measurement of HPRT mutant frequencies in T-lymphocytes from healthy human populations, Mut. Res., 285(2), 267–79.
    • [34] Davies, M. J., D. P. Lovell und D. Anderson (1992) Thiogeranine-resistant mutant frequency in T-lymphocytes from a healthy human population, Mut. Res., 265(2), 165–71.
    • [35] Finette. B. A., L. M. Sullivan, J. P. O'Neill, J. A. Nicklas, P. M. Vacek und R. J. Albertini (1994) Determination of hprt mutant frequencies in T-lymphocytes from a healthy pediatric population: statistical comparison between newborn, children and adult mutant frequencies, cloning efficiency and age, Mut. Res., 308(2), 223–31.
    • [36] Henderson, L., H. Cole, J. Cole, S. E. James und M. Green (1986) Detection of somatic mutations in man: evaluation of the mictrotitre cloning assay for T-lymphocytes, Mutagenesis, 1(3), 195–200.
    • [37] Hirai, Y., Y. Kusunoki, S. Kyoizumi, A. A. Awa, D. J. Pawel, N. Nakamura und M. Akiyama (1995) Mutant frequency at the HPRT locus in peripheral blood T-lymphocytes of aromic bomb survivors, Mut. Res, 329(2), 183–96.
    • [38] Hou, S. M., S. Falt und A. M. Steen (1995) Hprt mutant frequency and GSTMI genotype in non-smoking healthy individuals, Environ. Mol. Mutagen., 25(2), 97–105.
    • [39] Huttner, E., B. Holzapfel und S. Kropf (1995) Frequency of HPRT mutant lymphocytes in a human control population as determined by the T-cell cloning procedure, Mut. Res, 348(2), 83–91.
    • [40] Liu, Y., G. Cortopassi, H. Steingrimsdottir, A. P. Waugh, D. M. Beare, M. H. Green, D. R. Robinson und J. Cole (1997) Correlated mutagenesis of bcl2 and hprt loci in blood lymphocytes, Environ. Mol. Mutagen., 29(1), 36–45.
    • [41] McGinniss, M. J., M. T. Falta, L. M. Sullivan und R. J. Albertini (1990) In vivo hprt mutant frequencies in T-cells of normal human newborns, Mut. Res., 240(2), 117–26.
    • [42] Tates, A. D., F. J. van Dam, H. van Mossel, H. Shoemaker, J. C. Thijssen, V. M. Woldring, A. H. Zwinderman und A. T. Natarajan (1991) Use of the clonal assay for the measurement of frequencies of HPRT mutants in T-lymphocytes from five control populations, Mut. Res., 253(2), 199–213.
    • [43] Gennett, I. N., und W. G. Thilly (1988) Mapping large spontaneous deletion endpoints in the human HPRT gene, Mut. Res., 201(1), 149–60.
    • [44] Oller, A. R., und W. G. Thilly (1992) Mutational spectra in human B-cells. Spontaneous, oxygen and hydrogen peroxide-induced mutations at the hprt gene. J. Mol. Biol., 228(3), 813–26.
    • [45] Chen, J., und W. G. Thilly (1996) Mutational spectra vary with exposure conditions: benzo[a]pyrene in human cells, Mut. Res., 357(1–2), 209–17.
    • [46] Fuller, C. E., R. P. Davies, G. T. Williams, und E. D. Williams (1990) Crypt restricted heterogeneity of goblet cell mucus glycoprotein in histologically normal human colonic mucosa: a potential marker of somatic mutation, Br. J. Cancer, 61, 382–384.
    • [47] Jass, J. R., und S. Edgar (1994) Unicryptal loss of heterozygosity in hereditary non-polyposis colorectal cancer, Pathology, 26, 414–417.
    • [48] Kinzler, K. W., M. C. Nilbert, L. K. Su, B. Vogelstein, T. M. Bryan, D. B. Levy, K. J. Smith, A. C. Preisinger, P. Hedge, und D. McKechnie (1991), Identification of FAP locus genes from chromosome 5q21, Science, 23(5020), 661–5.
    • [49] Leach, F. S., N. C. Nicolaides, N. Papadopoulos, B. Liu, J. Jen, R. Parsons, P. Peltomaki, P. Sistonen, L. A. Aaltonen, und M. Nystrom-Lahti (1993) Mutations of a mutS homolog in hereditary nonpolyposis colorectal cancer, Cell, 75(6), 1215–25.
    • [50] Harris, J. E. (1983) Cigarette smoking among successive birth cohorts of men and women in the United States during 1900–80, JNCI 71(3), 474–478.
    • [51] Moolgavkar, S. H., E. G. Luebeck, M. de Gunst, R. E. Port, und M. Schwarz (1990) Quantitative analysis of enzyme-altered foci in rat hepatocarcinogenesis experiment – I. Single agent regimen, Carcinogenesis, 11(8), 1271–1278.
  • Beispiel 3
  • Identifizierung von ererbten Punktmutationen
  • Stand der Technik und Bedeutung
  • In diesem Abschnitt sind konkurrierende technologische Vorgehensweisen zur Identifizierung von Punktmutationen („Point mutations") (z.B. einzelnen Nucleotid-Polymorphismen) und seltenen Punktmutationen („Point mutations"), die in menschlichen Populationen enthalten sind, zusammengestellt. „SNP" beinhaltet die allgemein gebräuchliche Definition von ererbten Punktmutationen, die in 1% oder mehr der Bevölkerung vorliegen (Brookes, 1999). Mit „seltenen Punktmutationen" („rare Point mutations") sind alle Punktmutationen gemeint, die bei Allel-Anteilen von weniger als 1% vorliegen. Wir haben bisher aus theoretischen Gründen so argumentiert, dass es erforderlich wäre, Punktmutationen („Point mutations") bei einem Anteil von weniger als 1% aufzudecken, um Gene zu identifizieren, die Allele enthalten, welche in erwachsenen Menschen für die Fortpflanzungsfähigkeit deletär oder somatisch schädlich sind (Tomita-Mitchell et al., 1999). Aufgrund früherer Feststellungen von Populationsgenetikern glauben wir, dass es sowohl geeignet als auch erforderlich ist, große Proben von Querschnitten der ethnischen Gruppen, aus denen die amerikanische Bevölkerung besteht, durchzumustern.
  • Bedeutung von ererbten Mutationen beim Menschen
  • Entdeckung von deletären Allelen
  • Ein allgemeiner Vorschlag könnte sein, dass man anhand einer echten Feinstrukturkarte von ererbten menschlichen Punktmutationen eine Klassifizierung jedes kartierten Gens hinsichtlich des Vorliegens oder der Abwesenheit von dominanten oder rezessiven deletären obligatorischen Knock-out-Mutationen durchführen kann. Bisher sind obligatorische Knock-out-Allele auf Stopp-Codons und Rasterverschiebungs-Mutationen beschränkt. Jedoch sollte es durch die immer bessere Aufklärung von Gen-inaktivierenden Spleißstellen-Mutationen möglich werden, diese als obligatorische Knock-outs zu verwenden. Genauso sollte es durch eine bessere Aufklärung der Protein-Strukturmotive, welche die Funktion eines Genprodukts inaktivieren, in naher Zukunft möglich werden, bestimmte Fehlsinnmutationen als mögliche, wenn nicht obligatorische, Knock-out-Mutationen zu erkennen. Diese Informationen würden möglicherweise auch den Grundstock dafür legen, dass man den Anteil des gesamten menschlichen genomischen Komplements, welcher solche deletären Allele enthält, bestimmen kann.
  • Untersuchungen der Reproduktion beim Menschen zeigen, dass etwa 0,75 aller befruchteten Eizellen beim Menschen vor der Geburt zugrunde gehen, viele davon werden vor der Einnistung oder in frühen Stadien nach der Einnistung, von der Mutter unerkannt, abgestoßen. Etwa 0,30 sind einer Aneuploidie oder Chromosomenaberrationen zuzuschreiben. Somit gehen 0,45 aller befruchteten Eizellen beim Menschen aufgrund unbekannter Ursachen verloren (Liber und Thilly, 1983). Wir haben die theoretische Möglichkeit untersucht, dass alle oder ein signifikanter Anteil dieser abgehenden Feten auf dominante deletäre Allele oder Homozygotie für rezessive deletäre Allele zurückzuführen sind/ist.
  • Dominante deletäre Allele scheinen mit einem Anteil von 3 × 10–5 pro Gen mit Risiko zu entstehen (Cavalli-Sforza, 1971). Somit wären (0,4 /3 × 10–5) = 15 000 solcher dominanten deletären Allele erforderlich, um dem gesamten Anteil der zugrunde gegangenen Feten von 0,45 Rechnung zu tragen. Man geht davon aus, dass rezessive deletäre Allele in 1,33% der Bevölkerung enthalten sind. Im Durchschnitt ergibt dies für jedes Gen mit Risiko, unter der Voraussetzung einer Vorwärts-Mutationsrate für Genverlust von 3 × 10–5 (Berechnung des Hardy-Weinberg-Gleichgewichts), dass die Zahl solcher Gene, die rezessive deletäre Allele enthalten, (4 × 0,45)/(0,0133) 2 = 10 130 betragen würde, die für den gesamten Anteil der abgegangenen Feten von 0,45 verantwortlich wären.
  • Es ist nicht unvernünftig sich zu überlegen, dass alle oder ein großer Teil der wirklich abgegangenen Feten durch eine Kombination von weniger als 10 000 rezessive und weniger als 15 000 dominante deletäre Allele enthaltenden Genen zustande kommen, zusätzlich zu dem Anteil, der durch Aneuploidie oder Chromosomenaberrationen verursacht wird, wie von Zellgenetikern schon ausführlich beschrieben wurde. Algebraisch wird die Summe der Zahl von Genen, die entweder rezessive, NR, oder deletäre, ND, Allele enthalten, auf die geschätzte obere Grenze des Aborts von Feten bezogen: 3 × 10–5 ND + 4,4 × 10–5 NR = 0,45.
  • Natürlich erhält man, wenn man alle zugrunde gehenden Feten ererbten deletären Allelen zuschreibt, eine obere Schätzung ihrer Anzahl. Diese Schätzungen beziehen sich jedoch auf Schätzungen der Zahl von essentiellen Genen in Hefe, Zebrafisch und Mäusen, die bei der heutigen Zählung im Bereich von 5000 bis 15 000 liegen.
  • Diese Überlegungen haben auch für die Betrachtung der asymptomatischen Infertilität klinische Bedeutung. Es ist möglich, dass bei einem signifikanten Anteil von infertilen Paaren ohne klinische Zeichen einer reproduktiven Dysfunktion gefunden wird, dass sie mehrere Zustände einer sich komplementierenden Heterozygotie enthalten. Wenn z.B. ein Paar für zwei identische rezessive deletäre Allele heterozygot wäre, dann wären 7/16 ihrer befruchteten Eizellen letal. Wenn sie für drei identische rezessive Allele heterozygot wären, dann wären 46/64 ihrer befruchteten Eizellen letal usw..
  • Diese „Fermi-Berechnung" ist deshalb von praktischem Wert, da sie nahelegt, dass das Scannen aller exprimierten Gene im menschlichen Genom weniger als 10 000 Gene aufdecken würde, welche rezessive deletäre Allele enthalten, und weniger als 15 000, welche dominante deletäre Allele enthalten. Wenn man von 50 000 solcher exprimierten menschlichen Gene ausgeht, kommt man auf erwartete Anteile von weniger als 20% bzw. 30%. Für einen vorgeschlagenen zufälligen Satz von 15 Genen könnten wir somit erwarten, dass drei oder weniger einen Satz von obligatorischen Knock-out-Allelen zeigen, wobei sich die Anteile auf etwa 0,3 summieren, dies lässt den Schluss zu, dass ein solches Gen rezessive deletäre Allele enthält. Genauso erwarten wir fünf oder mehr, die keine obligatorischen Knock-out-Allele zeigen, dies lässt den Schluss zu, dass ein solches Gen dominante deletäre Allele enthält. Wenn wir 100 000 zufällige Gene annehmen, werden diese Schätzungen entsprechend niedriger. Wir haben jedoch keinen zufälligen Satz von Genen ausgewählt. Wir schlagen vor, 13 Gene zu untersuchen, deren Genprodukte als Bestandteile der Kern-DNA-Reparatur-Komplexe identifiziert wurden. Da man erwartet, dass obligatorische Knock-outs solcher Gene möglicherweise dominante deletäre Allele und sicherlich rezessive deletäre Allele sind, gehen wir davon aus, dass einige dieser Gene obligatorische Knock-outs enthalten, die sich auf 0,5% oder weniger summieren, und dass einige, bis zu unseren Nachweisgrenzen, keine solchen Allele zeigen (vgl. Tabelle 8, Untersuchungen).
  • Entdeckung von somatisch schädlichen Allelen
  • Hieraus folgt, dass eine solche Feinstrukturkarte, die von jugendlichen Populationen erstellt wird, somatisch schädliche Allele enthalten würde, z.B. diejenigen, die somatische Mutationsraten erhöhen und das Auftreten von Krebs oder Atherosklerose beschleunigen würden. Untersuchungen, mit denen solche Allele entdeckt werden können, würden weitere Analyse von Populationen von Testpersonen mit spezifischen Krankheiten oder von extrem alten Populationen, in denen die Träger durch eine frühe Mortalität reduziert wurden, umfassen. Jedoch würde die vorgeschlagene Untersuchung in jugendlichen Populationen einen erforderlichen ersten Schritt bei solchen Auswertungen darstellen.
  • Entdeckung von Allelen, die für ethnische Subpopulationen spezifisch sind
  • Es ist klar, dass ererbte Polymorphismen in Anteilen von größer als 1% bei den wichtigsten demographischen Gruppen der Welt variieren, und man kann vernünftigerweise davon ausgehen, dass solche wichtigen Variationen auch für deletäre Allele vorliegen, die in Anteilen von weniger als 1% auftreten. Wir haben bereits ein solches Beispiel im Exon 6 des HPRT-Gens gefunden. Wir konzentrieren uns anfangs auf eine große ethnisch gemischte Probe von 50 000 Jugendlichen, wodurch wir in die Lage versetzt werden, jedes beliebige Allel bis zu einem Allel-Anteil von etwa 5 × 10–5 zu identifizieren. Diese Strategie dient dazu, die Zahl der obligatorischen Knock-out-Allele in der anfänglichen Probe zu erhöhen und damit den Grundstein für weitere Studien zu legen, die sich mit bestimmten demographischen Gruppen befassen.
  • Verfahrenstechnischer Hintergrund: Hochauflösende Mutations-Spektrometrie
  • Die hier beschriebene Vorgehensweise stellt eine deutliche und signifikante Verbesserung gegenüber vorliegenden oder sogar gegenüber vorgeschlagenen Strategien dar. Das hier beschriebene Verfahren ist extrem effizient, eine Mutation zu entdecken und die Häufigkeit abzuschätzen, da hiermit gepoolte genomische DNA von hunderttausend oder sogar einer Million Individuen analysiert werden kann. Dies steht im Gegensatz zu anderen, zurzeit eingesetzten Verfahren, bei denen jedes Individuum oder kleine Pools von höchstens etwa einem Dutzend Individuen getestet werden muss bzw. müssen (Trulzsch et al., 1999). Da die Kosten pro Individuum nicht gerade gering sind, hat dies zur Folge, dass die Entdeckung von Mutationen in großen Populationen sehr teuer ist, und diese Untersuchungen sind erforderlich, um Punktmutationen, die mit einer geringen Häufigkeit auftreten, mit einer geeigneten statistischen Genauigkeit zu bestimmen (Hagmann, 1999).
  • Es gibt zwei alternative Vorgehensweisen für die Verwendung von großen gepoolten Proben, die durch eine hochauflösende Mutations-Spektrometrie analysiert werden, wie hier vorgeschlagen wird.
  • Die erste besteht darin, Megabasen von genomischer DNA aus einer begrenzten Zahl von Individuen zu sequenzieren. Dabei handelt es sich um die Resequenzierungsstrategie, die von mehreren privaten Firmen und verschiedenen NIH- oder DOE-geförderten Universitätslaboratorien und Human-Genom-Zentren angewendet wird. Diese Vorgehensweise wurde durch den Aufbau von Forschungseinrichtungen zur Sequenzierung des menschlichen Genoms möglich gemacht. Ein hoher Durchsatz war natürlich definiert als die Länge von DNA-Sequenzen, die pro Jahr sequenziert werden konnten. Die Kosten pro Basenpaar wird bei dieser Vorgehensweise zurzeit auf etwa 20 Cent geschätzt. Jedoch schätzen wir und auch Wirtschaftsanalysten, dass vernünftige Verbesserungen in der Bearbeitung der Proben und eine Vergrößerung des Maßstabs auf die Analyse von Tausenden von Spenderproben die Kosten auf etwa 2 Cent pro Basenpaar senken würden.
  • Somit würde es bei den zurzeit veranschlagten Aufwendungen etwa 500 Millionen Dollar an NIH-Förderungsmitteln kosten, um 2,5 Billionen Basenpaare zu untersuchen. Das hier beschriebene Verfahren wird weniger als drei Millionen Dollar kosten. Ferner konzentrieren wir uns auf Exons und Spleißstellen, in denen die meisten deletären Mutationen erwartet werden. Bei der Resequenzierung des Genoms machen diese Sequenzen selten mehr als 5% der Länge der sequenzierten DNA aus, wodurch sich die relativen Kosten zur Identifizierung von ererbten deletären Allelen in einem beliebigen Gen erhöhen. Leider kann man nicht einmal bei Verwendung von tausend Blutproben rezessive deletäre Mutationen nachweisen, z.B. viele von solchen, die cystische Fibrose auslösen, und von solchen, von denen man annimmt, dass sie mehrere tausend Formen des Aborts von Feten verursachen. Dies liegt daran, dass man davon ausgeht, dass die Summe der Anteile solcher deletären Allele etwa 1,33% beträgt, da die einzelnen Allele bei Anteilen im Bereich von 0,3% bis 0,003% erwartet werden. Die Untersuchung von 100 000 Allelen sollte ein lohnendes Bild dieser Allele ergeben, und unsere ersten Studien von einigen wenigen tausend Individuen sprechen für diese Erwartung (Tomita-Mitchell et al., 1999). Da die Kosten pro Individuum nicht gerade gering sind, sind die üblichen Verfahren zur Aufdeckung von Mutationen in großen Populationen sehr teuer. Wir argumentieren, dass unsere Studien erforderlich sind, um Punktmutationen, die mit einer geringen Häufigkeit auftreten, mit einer geeigneten statistischen Genauigkeit zu bestimmen (Hagmann, 1999).
  • Das zweite als Alternative (zur Verwendung der hochauflösenden Mutations-Spektroskopie bei einer großen gepoolten Probe) einzusetzende Verfahren ist die Verwendung von Mikroarrays von kurzen DNA-Sequenzen (DNA-Chips), die entwickelt wurden, um eine oder alle Punktmutationen in einer bestimmten DNA-Sequenz nachzuweisen. Theoretisch könnten sich diese auf eine Probe einer 100-bp-Sequenz konzentrieren, um eine beliebige der 300 einzelnen Basenpaar-Substitutionen und 200 einzelnen Basenpaar-Additionen oder Deletionen nachzuweisen. In der Praxis hat sich jedoch gezeigt, dass bei Verwendung von bis zu 16 Mer (16 Nucleotiden) nur etwas mehr als die Hälfte aller Punktmutationen auf diese Weise nachgewiesen wird und dass der Nachweis von Varianten bei Anteilen von weniger als 10% unter Verwendung dieser Technologie noch nicht machbar ist (Paul Berg, Standard University, persönliche Mitteilung). Wenn wir uns die Kosten jedes „Chips" und die Tatsache, dass für jede Sequenz, die gescannt werden soll, ein Chip hergestellt werden muss, und außerdem die Notwendigkeit, von jeder Person DNA-Proben der Blutzellen herzustellen und zu analysieren, vor Augen führen, glauben wir nicht, dass es ohne eine wirklich massive Investition möglich sein wird, deletäre ererbte Punktmutationen innerhalb einer großen Zahl von Genen und Personen auf diese Weise zu identifizieren.
  • Kurz gesagt scheint, vorausgesetzt man hat ein Verfahren zur Hand, mit dem man die Anteile mit der gewünschten Empfindlichkeit genau messen kann, die Verwendung großer gepoolter Proben ein guter Weg zu sein, um die Art und die zahlenmäßige Verteilung von ererbten Punktmutationen in menschlichen Populationen zu bestimmen. Für die von uns vorgeschlagene Vorgehensweise unter Verwendung der konstanten denaturierenden Gel-Kapillar-Elektrophorese („constant denaturating gel capillary electrophoresis", CDCE) zur Trennung von mutierten und Wildtyp-Sequenzen vor einer DNA-Amplifikation wurde bereits gezeigt, dass sie die erforderliche Empfindlichkeit besitzt. Wenn man weiterhin Zielsequenzen mit Größen von 80 bis 120 Basenpaaren verwendet, werden 100% aller untersuchten Punktmutationen als mutierte/Wildtyp-Heterodoppelstränge von den Wildtyp-Homodoppelsträngen abgetrennt (Mickey et al., 1995, Khrapko et al., 1998).
  • Man sollte beachten, dass die Trennung von Wildtyp-Homodoppelsträngen von Mutanten-enthaltenden Heterodoppelsträngen, die wir anhand der konstanten denaturierenden Gel-Kapillar-Elektrophorese durchführen, auch durch HPLC und auf ähnliche Weise vorher bestimmte Temperaturbedingungen erreicht werden kann. Die physikalisch-chemischen Grundlagen der Trennung von Mutanten sind ähnlich wie bei der CDCE: teilweise geschmolzene Heterodoppelstrangmoleküle, die eine mutierte Sequenz enthalten, werden in Säulen im Vergleich zu Wildtyp-Homodoppelsträngen verlangsamt. Andererseits können zahlreiche, jedoch nicht alle einzelnen Nucleotidänderungen auch anhand der Geschwindigkeits-Variationen durch Einzelstrang-Polymorphismus in der Kapillar-Elektrophorese (CE-SSCP) nachgewiesen werden (Gonen et al., 1999).
  • Das von uns vorgeschlagene Verfahren zur Trennung von Mutanten umfasst die konstante denaturierende Kapillar-Elektrophorese (CDCE), mit der somatisch hergeleitete Punktmutationsspektren in menschlichen Geweben untersucht werden (Khrapko et al., 1994; Khrapko et al., 1997; Li-Sucholeiki et al., 1999). Es wurde gezeigt, dass das Verfahren in Kombination mit einer „high fidelity"-DNA-Amplifikation Mutationen in 100-bp-Sequenzen mit einer Empfindlichkeit von mindestens 10–6 in Proben aus verschiedenen menschlichen Organen nachweisen kann (Khrapko et al., 1997, 1998).
  • CDCE beruht auf Mobilitätsunterschieden zwischen teilweise denaturierten doppelsträngigen DNA-Fragmenten. Diese Mobilitätsunterschiede kommen durch ein unterschiedliches kooperatives Schmelzverhalten bei Wildtyp-Homodoppelsträngen und den verschiedenen Heterodoppelsträngen zustande, die zwischen den hauptsächlich vorliegenden Wildtyp-Sequenzen und den als Minderheit vorliegenden mutierten Sequenzen in einer komplexen Probe, z.B. den hier vorgeschlagenen gepoolten Blutproben, gebildet werden (Thilly, 1985). Die durch die Kapillar-Elektrophorese erreichte hohe Auflösung und außerdem der Ausschluss von Artefakten, die durch die Wechselwirkung von DNA mit herkömmlichen vernetzten Polyacrylamid-Gelen zustande kommen, ergaben ein Verfahren, mit dem seltene Mutanten in komplexen Proben nachgewiesen werden können (Khrapko et al., 1994; Khrapko et al., 1997; Salas-Solano et al., 1998; Muller et al., 1998; Pennisi, 1999).
  • Automatisierte Verfahren: Kapillar-Trennsysteme bieten den Vorteil, dass die folgenden Vorgänge vollständig automatisiert werden können: Auftragen der Proben, Trennung, Fraktionssammlung und anschließende DNA-Amplifikation von ausgewählten Sammlungen. Die Probeninjektion und das Auswechseln von Polymer-Trennmatrizes erfolgen in Kapillar-Array-Vorrichtungen automatisiert, so dass die Sequenzierung im großen Maßstab durchgeführt werden kann, wie es zur Bestimmung des menschlichen Genoms erforderlich ist (Mullikin und McMurragy, 1999). In dieser Beschreibung führen wir unser bereits entwickeltes Peak- oder Probensammelsystem ein, das mit einer automatisierten PCR gekoppelt ist.
  • Rolle von rad54 in der homologen Rekombination
  • Ein langfristiges Ziel besteht darin zu bestimmen, ob die Allele, von denen man annimmt, dass es sich um dominante oder rezessive deletäre und/oder schädliche Allele handelt, die durch die Forschung aufgedeckt wurden, tatsächlich einer menschlichen Zelle einen Mutator-Phänotyp verleihen. Unsere Vorgehensweise besteht darin, Zelllinien, die an den genetischen Loci, welche als mögliche menschliche Mutator-Allele identifiziert wurden, heterozygot und/oder homozygot sind, zu erzeugen und ihre spontanen Mutations- und mitotischen Rekombinationsraten in den HPRT- und TK-Loci zu bestimmen.
  • Ein unmittelbares Ziel besteht darin, die relative Wirksamkeit von zwei Protokollen für Genersatz („gene replacement") zu bestimmen, die in späteren Experimenten eingesetzt werden können. Der genetische Locus, den wir für diese Arbeit ausgewählt haben, ist rad54, der eine zentrale Rolle in der homologen Rekombination und Reparatur von DNA-Doppelstrangbrüchen zu spielen scheint. Wir stellen die Hypothese auf, dass Mutationen in rad54 dazu führen, dass in der Zelle eine höhere spontane Mutationsrate vorliegt und dass sie gegenüber Agenzien, z.B. ionisierender Strahlung, bezüglich Mutation überempfindlich wird.
  • In S. cerevisiae gibt es mindestens neun verschiedene Proteine in der rad52-Epistasis-Gruppe, die an der homologen Rekombination beteiligt ist, welche die Reparatur von Doppelstrangbrüchen beeinflusst (Haber, 1995; Bai und Symington, 1996; Baumann und West, 1998). Für verschieden Vertreter hiervon wurden Homologe bei Säugern identifiziert, einschließlich rad54 (Kanaar und Hoeijmakers, 1997). In der Maus führt die Unterbrechung von rad54 zu einer erhöhten Empfindlichkeit gegenüber Strahlung und zu einer verringerten homologen Rekombination (Essers et al., 1997). Aus diesen Experimenten lernen wir, dass rad54 kein essentielles Gen ist; dies ist wichtig, da hierdurch gezeigt wird, dass ein Knock-out in menschlichen Lymphoblastenzellen nicht letal sein sollte. Das menschliche Homolog ist funktionell, denn es vervollständigt eine Reparatur-defekte rad54-Hefemutante (Kanaar et al., 1996). Das Protein ist eine von doppelsträngiger DNA abhängige ATPase, wobei seine genaue Funktion in der Rekombination jedoch noch nicht geklärt wurde (Swagemakers et al., 1998). Es gibt Hinweise, dass rad54-Änderungen möglicherweise an der Karzinogenese beteiligt sind. Bei 132 untersuchten primären Tumoren wurden mehrere Mutationen in rad54 identifiziert; diese umfassen GGA → AGA (Gly → Arg) in einem Brusttumor, CCT → CAT (Pro → His) in einem Colonkrebs und GTG → GAG (Val → Glu) am Codon 444 in einem Lymphom (Matsuda et al., 1999). Die Mutation im Colonkrebs war eindeutig somatischer Herkunft, da das umgebende Gewebe die Wildtyp-Sequenz aufwies. Die Beobachtung, dass eine rad54-Mutation in 1/24 der untersuchten Lymphome auftrat, hat eine wichtige Auswirkung auf unsere vorgeschlagene Studie, da sie zeigt, dass unsere Arbeit auf lymphoblastenartige Zellen angewendet werden kann.
  • Die Bedeutung der vorgeschlagenen Arbeit besteht darin, dass wir die Wirkung von Punktmutationen („Point mutations") und seltenen Punktmutationen („Point mutations") bestimmen, die tatsächlich in den menschlichen Populationen gefunden werden, von welchen Proben genommen werden, um den Zustand bezüglich Mutationen in menschlichen Zellen zu bestimmen. Diese Betonung der Untersuchung des Phänotyps und die Fokussierung auf DNA-Reparatur-Gene erfolgten als Reaktion auf die Kritiken der Prüfer.
  • Studien
  • Für die hier vorgeschlagenen Studien ist eine Empfindlichkeit von nur 5 × 10–5 erforderlich, um fünf oder mehr ererbte Punktmutationen in 100 000 Allelen nachzuweisen. Diese Empfindlichkeit ist möglich, da wir die Pfu-DNA-Polymerase unter Bedingungen verwenden, unter denen der PCR-Fehler etwa 6 × 10–7 Fehler pro Baseneinbau beträgt, und da wir unsere anfängliche PCR-Amplifikation auf fünf Verdopplungen begrenzen (Andre et al., 1997). Hierdurch wird das Rauschen aufgrund der PCR im Hintergrund auf etwa 6 × 10–7 × 5 = 3 × 10–6 Mutationen pro Basenpaar begrenzt, bevor die Trennung von mutierten und Wildtyp-Sequenzen erfolgt. Der Nachweis an der Kapillare wird anhand einer Laser-induzierten Fluoreszenz aus einem Fluorescein-markierten PCR-Primer durchgeführt, der auch als eine Hoch-Schmelztemperatur-Klammer („clamp") dient, die für die CDCE-Trennung erforderlich ist. Sobald wir geringe Anteile von Punktmutationen in einfachen Rekonstruktionsexperimenten nachweisen konnten, machten wir uns daran, ein Verfahren zu entwickeln, mit dem echte menschliche Zellen und Geweben bearbeitet werden konnten. Da die mutierten Anteile so klein waren, mussten wir mit Zellzahlen im Überschuss von 109 oder mehr als 6 mg genomischer DNA beginnen.
  • Das von uns entwickelte Verfahren umfasst die Isolierung der Gesamt-DNA (bis zu 10 mg) durch einfache Spaltung mit Proteinase K, SDS und RNase, gefolgt von einer Zentrifugation und Ethanol-Fällung. Dies ergibt in einem Protokoll mit wiederholten Extraktionen eine Ausbeute von mehr als 90%. Wir spalten diese DNA-Masse mit einem Paar von Restriktionsenzymen, wodurch ein Fragment freigesetzt wird, welches unsere gewünschten Sequenzen enthält. Wir hybridisieren einen Überschuss an Biotin-markierten Sonden mit den beiden Watson-Crick-Strängen der gewünschten Sequenzen. Hierdurch ist es möglich, die Hybride unter Verwendung von Streptavidin-beschichteten Glasperlen mit einer besonders niedrigen Affinität für eine unspezifische DNA-Bindung von der Gesamt-DNA abzutrennen. Anschließend werden sie anhand von hifiPCR amplifiziert. Ein sehr wichtiges Merkmal dieses Verfahrens besteht darin, dass es uns in die Lage versetzt, mehrere tausend DNA-Sequenzen aus den gesamten gepoolten Proben zu entnehmen, da die DNA, die beim Waschen der Perlen entfernt wird, wieder zur ursprünglichen Probe zugefügt wird. Nach der Elution von den Streptavidin-beschichteten Perlen gewinnen wir mehr als 70% unserer ursprünglichen Kopienzahl. Die Anreicherung für ein Einzelkopie-Kern-Gen war 10 000-fach, dies wurde durch Vergleich mit mitochondrialen Multikopie-Sequenzen bestimmt. Die Sequenz, die wir für diese Entwicklung verwendeten, war eine 255-bp-Sequenz des menschlichen APC-Gens, cDNA bp 8429 bis 8683. Sie diente als ein Beispiel einer Kern-Sequenz mit nebeneinander liegenden Hoch- und Niedertemperatur-„isomelting"-Domänen. Mutationen werden in einer 104-bp-Sequenz zwischen bp 8560 und 8663 in der niedrig schmelzenden Domäne nachgewiesen. Unsere derzeitige Nachweisgrenze dieser APC-Genmutationen in menschlichen Zellen und Gewebeproben beträgt 10–6 (22A und 22B).
  • Es gibt optimierte Verfahren für eine kontrollierte Polymerisation von linearem Polyacrylamid (Goetzinger et al., 1998). Anhand einer Emulsions-Polymerisation kann lineares Polyacrylamid (LPA) mit definierter Kettenlänge für einen beliebigen Typ von DNA-Trennung maßgeschneidert und in Pulverform unbegrenzt gelagert werden. Z.B. sind lange Ketten (10 bis 17 MDa oder größer) alleine oder in Kombination mit kurzen Ketten (50 bis 250 kDa) vorteilhaft für die Sequenzierung langer DNA-Leselängen (Salas-Solano et al., 1998; Zhou et al., 1999; Carrilho et al., 1996), während ein Polymer mittlerer Größe (etwa 1 MDa) für die Trennung von kurzen (100 bis 500 bp) dsDNA-Fragmenten geeignet ist (Berka et al., 1995). Dadurch, dass es möglich ist, eine Vielzahl von Molekülmassen von LPA herzustellen, kann man die Zusammensetzungen für die verschiedensten gewünschten Aufgaben optimieren (z.B. PCR-Produkt-Analyse, CDCE, Sequenzierung).
  • Mitochondriale Mutationen
  • Außerdem haben wir die Mutationsspektren in der mitochondrialen Sequenz von bp 10 030 bis 10 130 in zahlreichen Geweben, Tumoren und menschlichen Zellen in Kultur gemessen. Diese Aufgabe war wesentlich einfacher als die vorstehend beschriebenen Untersuchungen der Kern-DNA, da es pro Zelle etwa 400 und nicht nur zwei Genkopien gab und eine anfängliche Isolierung der gewünschten Sequenz nicht erforderlich war. Bei diesen Untersuchungen konnten wir jedoch wesentliche Erfahrungen sammeln, wie man mit DNA aus menschlichem Blut und Organen arbeitet. Wir entdeckten in allen Proben den gleichen Satz von 17 mitochondrialen „Hot-Spot"-Mutationen, dies zeigt einen allgemeinen Prozess von menschlichen mitochondrialen Punktmutationen an. Die festgestellten Mutationen bestanden hauptsächlich aus beiden Arten von Transitionsmutationen mit zwei Transversionen. Für diese Beobachtungen war eine Empfindlichkeitsgrenze von 10–6 erforderlich. Mutationen wurden in beiden „Watson-Crick"-Strängen gezeigt, dies ist ein erforderlicher Schritt, um Fehlpaarungs-Zwischenprodukte oder DNA-Schäden, die fälschlicherweise als Mutationen angesehen werden, auszuschließen (Khrapko et al., 1997; Coller et al., 1998). Diese Forschung machte unsere Fähigkeit deutlich, seltene Mutationen zu bestimmen, wobei bis zu 20 getrennte Mutationen in einer einzelnen 100-bp-Zielsequenz gefunden wurden. Diese Untersuchungen bestätigen die Tatsache, dass Punktmutationen im menschlichen Genom bis hinunter zu einer Häufigkeit von 10–6 nachgewiesen, isoliert und sequenziert werden können und wurden.
  • Untersuchung von 1000 gepoolten Blutproben
  • Wir wählten drei etwa 100-bp-Sequenzen aus dem großen Exon 15 des APC-Gens, eine aus Exon 8 des TP53-Gens und sechs aus den Exons 2, 3, 5, 6, 8 und 9 des HPRT-Gens und eine mitochondriale DNA-Sequenz aus. Wir definierten die Bedingungen für „high fidelity"-PCR und CDCE-Trennung. Außerdem stellten wir für jede Sequenz innere Standards her.
  • In unserem ersten Versuch sammelten wir zwei getrennte Gruppen von Blutproben von 1000 Jugendlichen aus dem Boston Lead Laboratory. Wir erzeugten zwei getrennte gepoolte Proben von jedem separaten Satz von Jugendlichen. Diese vier gepoolten Proben, zwei unabhängig voneinander konstruierte gepoolte Duplikat-Proben aus jedem der zwei separaten Sätze von Jugendlichen, wurden auf die zehn Kern-DNA-Sequenzen und die eine mitochondriale DNA-Sequenz getestet. Die Ergebnisse sind in Tabelle 1 zusammengefasst (vgl. nächste Seite).
  • In den gescannten Kern-Sequenzen wurden sechs ererbte Punktmutationen aufgedeckt, und in der mitochondrialen Sequenz wurde eine gefunden. Zwei hochvererbte mutierte Anteile wurden in einer Sequenz des Exons 15 des APC-Gens (11%) und in der mitochondrialen Sequenz (18%) gefunden. Vier getrennte Mutationen wurden in Exon 9 von HPRT gefunden, jedoch noch nicht sequenziert, die jeweils bei mutierten Anteilen zwischen 10–3 und 10–2 vorlagen. Da insgesamt 4000 Allele auf die autosomalen Gene APC und TP53 gescannt wurden, zeigte das Fehlen eines Signals an, dass in diesen Proben bei einem Niveau von 2,5 × 10–4 keine ererbten Mutationen vorlagen. Da HPRT X-gekoppelt vorliegt, wurden etwa 3000 Allele in diesen Geschlechts-gemischten Sätzen gescannt. Eine einzige Mutante in Exon 3 von HPRT wurde später auf Personen afrikanisch-amerikanischer Abstammung zurückverfolgt.
  • Tabelle 7 Ergebnisse des Scannens von zehn Kern- und einer mitochondrialen 100-bp-Sequenzen auf ererbte Punktmutationen durch CDCE/hifiPCR in zwei getrennten gepoolten Blutproben, die jeweils von 1000 Jugendlichen stammten
    Figure 01260001
  • Wir sahen diese ersten Beobachtungen als wichtig an, nicht nur für die beobachteten Mutanten, sondern auch für den Anteil von 100-bp-Sequenzen, die KEINE ererbten Punktmutationen enthielten. In 7 von 10 Kern-Sequenzen waren bei Anteilen von 3,3 × 10–4 keine ererbten Punktmutationen vorhanden. Dies war extrem signifikant, da es zeigt, dass die Entdeckung von einzelnen rezessiven deletären Allelen, von denen erwartet wird, dass sie bei Anteilen ab etwa 3 × 10–3 auftreten, nicht durch das Vorliegen einer großen Zahl von nicht-deletären Allelen behindert wäre.
  • In 24 zeigen wir die Art von Reproduzierbarkeit, die für alle elf Sequenzen festgestellt wurde, die unter Verwendung einer Sequenz aus Exon 15 des APC-Gens als Beispiel gescannt wurden. Hier ist ein CDCE-Lauf dargestellt, in dem die mutierten Sequenzen als Homodoppelstränge direkt vor der Peak-Isolierung für die Sequenzierung laufen gelassen werden. Durch Verwendung des inneren Standards, der in das ursprüngliche Sequenzisolat eingeführt wird, war es möglich, Schätzungen der ursprünglichen mutierten Anteile zu erhalten.
  • In unseren ersten direkten Untersuchungen von möglichen ethnischen Unterschieden hinsichtlich seltener ererbter Punktmutationen untersuchten wir fast 1900 Allele von Jugendlichen afrikanisch-amerikanischer und hispanisch-amerikanischer Abstammung. Diese Proben kamen vom New York Lead Laboratory. Wie aus 24 ersichtlich ist, wurde in der afrikanisch-amerikanischen Gruppe eine ererbte Mutation gefunden, die in der hispanisch-amerikanischen Gruppe nicht vorlag.
  • Manchmal stiften unsere CDCE-Rohdaten Verwirrung, und vernünftige Gutachter wollen herausfinden, was wir wirklich sehen, wenn wir unsere genetischen Proben anfangs mit Fluoreszenz-markierten „Clamp"-Sequenzen als Primer amplifizieren. Die Schritte sind in 24 dargestellt. Zuerst stellen wir sicher, dass kein signifikantes PCR-„Rauschen" („noise") in der Probe vorliegt, indem wir DNA aus einer menschlichen TK6-Zelle durch etwa 30 Verdopplungen amplifizieren.
  • Vorbereitende Daten aus dem MIT-Shanghai Cell Biology Institute Consortium
  • Die Beobachtungen des Konsortiums bestätigten die Feststellung, dass die Zahl von einzelnen Punktmutationen in einer beliebigen 100-bp-Sequenz, die bei Anteilen von entweder > 2,5 × 10–4 oder von > 10–4 entstanden, „wenige und weit dazwischen" waren. Dieses Ergebnis ist extrem wichtig, da es zeigt, dass sowohl nicht-deletäre als auch rezessive deletäre Allele in großen gepoolten Proben wie vorgeschlagen einfach erkannt werden sollten.
  • Gepoolte Proben von 5000 Han-chinesischen Jugendlichen oder 10 000 Allele für autosomale Gene wurden erhalten. Die Empfindlichkeit des Verfahrens ist so groß, dass sogar eine einzelne punktmutierte Sequenz nachgewiesen werden könnte. In 27 sind die Ergebnisse für das Betaglobin-Gen als die mutierten Anteile für die beobachteten Mutationen dargestellt, die an ihren Sequenzpositionen in den Genen aufgetragen sind. Eine ähnliche quantitative Verteilung wurde für das größere α-1-Antichymotrypsin-Gen festgestellt.
  • In einem Parallelversuch wurden etwa 41 STS als Beispiel von Sequenzen gescannt, bei denen man nicht erwartet, dass Mutationen hierin die Fortpflanzungsfähigkeit beeinflussen. Hier wurde bereits vom MIT-Whitehead Institute Genome Center gefunden, dass diese Sequenzen in den mehreren Dutzend gescannten Sequenzen Punktmutationen mit 25% oder mehr enthalten. Anhand der Vorgehensweise mit gepoolten Proben wurden weitere 21 Punktmutationen (1% oder höher) gefunden, wobei jedoch nur drei Mutationen im Häufigkeitsbereich von 0,01 bis 0,001 lagen. Auch diese Daten sprechen für die Beobachtungen, dass die Zahl von seltenen ererbten Punktmutationen klein ist.
  • Aufklärung, welche Gene obligatorische Knock-out-Allele bei solchen Anteilen aufweisen, dass hieraus die Wichtigkeit dieser Gene zur Bestimmung der Fortpflanzungsfähigkeit gefolgert werden kann
  • Identifizierung und Bedeutung des Anteils von gescannten Genen, die entweder dominante oder rezessive deletäre Allele enthalten
  • Einige Berichte haben die Vermutung ausgedrückt, dass die meisten Mutationen, die Erbkrankheiten verursachen, Fehlsinnmutationen sind. Dies ist sicherlich für die Sichelzellenanämie und verschiedene andere Störungen richtig, unsere Erfahrungen mit APC- und HPRT-Mutationen führten jedoch zu der Annahme, dass ein signifikanter Anteil von rezessiven oder dominanten deletären Mutationen Rasterverschiebungen oder Stopp-Codons sein würden. Mehr als 5000 aufgezeichnete Punktmutationen wurden untersucht und bei mehr als 40% wurde gefunden, dass es sich um obligatorische Knock-out- (OKO-) Mutationen handelt. Hier in Tabelle 8 haben wir die Ergebnisse für die Gene mit den meisten berichteten individuellen Mutationen zusammengestellt. Es ist ersichtlich, dass OKOs ein allgemeines Merkmal von Mutationen sind, welche eine Erbkrankheit verursachen. Ihr Vorliegen in zwei oder mehr getrennten Knock-out-Allelen, jeweils bei Anteilen von weniger als 1%, würde die Folgerung erlauben, dass das Gen von Interesse rezessive deletäre Allele enthält.
  • Tabelle 8 Ergebnisse einer Untersuchung von Genen und ererbten Mutationen in der „Human Genome Mutation Database", wobei geklärt wird, welcher Anteil der Erbkrankheit obligatorischen Knock-out-Mutationen zuzuschreiben ist (R. Wasserkort, MIT)
    Figure 01280001
  • Figure 01290001
  • Zitierte Veröffentlichungen
    • André, P, Kim, A, Khrapko, K, und Thilly, WG (1997) Fidelity and mutational spectra of Pfu DNA polymerase on a human mitochondrial DNA sequence. Genome Research, 7: 843–852.
    • Berka, J.; Pariat, Y. F.; Muller, O.; Hebenbrock, K.; Heiger, D. N.; Foret, F.; Karger, B. L. Sequence dependent migration behavior of double-stranded DNA in capillary electrophoresis. Electrophoresis 1995, 16, 377–388.
    • Brookes, A. J. (1999) The essence of Point mutations. Gene, 234, 177–186.
    • Carrilho, E.; Ruiz-Martinez, M. C.; Berka, J.; Smirnov, I.; Goetzinger, W.; Miller, A. W.; Brady, D.; Karger, B. L. Rapid DNA sequencing of more than 1000 bases per run by capillary electrophoresis using replaceable linear polyacrylamide solutions. Anal Chem 1996, 68, 3305–3313.
    • Cha, RS, und Thilly, WG (1995) Specificity, Efficiency, and Fidelity of PCR. PCR Primer a Laboratory Manual, Cold Spring Harbor Laboratory Press, pp. 37–51.
    • Chuang, Y.-Y., Q. Chen and H. L. Liber. (1999) Radiation-Induced Mutations At The Autosomal Thymidine Kinase Locus Are Not Elevated In P53-Null Cells. Cancer Research, 59: 3073–3076.
    • Coller, HA, Khrapko, K, Torres, A, Frampton, MW, Utell, M. J, und Thilly, WG (1998) Mitochondrial mutational spectra in smokers and nonsmokers mutational spectra of a 100 base pair mitochondrial DNA target sequence in bronchial epithelial cells: A comparison of smoking and nonsmoking twins. Cancer Research, 58: 1268–1277.
    • Goetzinger, W.; Kotler, L.; Carrilho, E.; Ruiz-Martinez, M. C.; Salas-Solano, O.; Karger, B. L. Characterization of high molecular mass linear polyacrylamide powder prepared by emulsion polymerization as a replaceable polymer matrix for DNA sequencing by capillary electrophoresis. Electrophoresis 1998, 19, 242–248.
    • Hanekamp, JS, André, P, Coller, H. A, Li, X-C, Thilly, WG, und Khrapko, K (1995) A protocol for constant denaturant capillary electrophoresis (CDCE): Mutant DNA sequence detection. Mutation Detection Visby Sweden, Laboratory Protocols, Hrsg.: Ulf Landegren & Arild Lagerkvist, Kapitel 8: 38–41.
    • Herrero-Jimenez, P., G. Thilly, P. J. Southam, A. Tomita-Mitchell, E. E. Furth, S. Morgenthaler und W. G. Thilly. 1998. Mutation, cell kinetics and subpopulations at risk for colon cancer in the United States. Mutation Research, 404: 553–578.
    • Khrapko, K, Hanekamp, JS, Thilly, WG, Belenkii, A, Foret, F, und Karger, BL (1994) Constant denaturant capillary electrophoresis (CDCE): a high resolution approach to mutational analysis. Nucleic Acid Research, 22: 364–369.
    • Khrapko, K, André, P, Cha, R, Hu, G, und Thilly, WG (1994) Mutational spectrometry: means and ends. Progress in Nucleic Acid Research and Molecular Biology, Hrsg. K. Moldave, 49: 285–312.
    • Khrapko, K, Coller, H, André, P, Li, X–C, Foret, F, Belinky, A, Karger, BL, und Thilly, WG (1997) Mutational spectrometry without phenotypic selection: Human mitochondrial DNA. Nucleic Acid Research, 25: 685–693.
    • Khrapko, K, Coller, HA, André, PC, Li, X-C, Hanekamp, JS, und Thilly, WG (1997) Mitochondrial mutational spectra in human cells and tissues. PNAS, 94: 13798–13803.
    • Khrapko, K, Thilly, WG, van Orsouw, NJ, Zhang, X, Coller, HA, Peris, TT, Upton, M, Vijg, J, und Wei, JY (1999) Cell-by-cell scanning of whole mitochondrial genomes in aged human heart reveals a significant fraction of myocytes with clonally expanded deletions. Nucleic Acids Research, 27: 2434–2441.
    • Kleparnik, K.; Foret, F.; Berka, J.; Goetzinger, W.; Miller, A. W.; Karger, B. L. The use of elevated column temperature to extend DNA sequencing read lengths in capillary electrophoresis with replaceable polymer matrices. Electrophoresis 1996, 17, 1860–1866.
    • Kumar, R, Hanekamp, JS, Louhelainen, J, Burvall, K, Onfelt, A, Hemminki, K, und Thilly, WG (1995) Separation of transforming amino acid-substituting mutations in codon 12, 13 and 61 of the N-Ras gene by constant denaturant capillary electrophoresis (CDCE). Carcinoeenesis, 16: 2667–2673.
    • Li, X-C, und Thilly, WG (1997) Use of wide-bore capillaries in constant denaturant capillary electrophoresis. Electrophoresis, 17: 1884–1889.
    • Li-Sucholeiki, X.-C., und Thilly, W. G. (1999). Scanning technology for point mutants within 100-bp sequences in human blood and tissues. Disease Identification: Methods and Protocols (Wlaker J., Hrsg.) The Human Press, Totowa, NJ, im Druck.
    • Li-Sucholeiki, X-C, und Thilly, WG (1999) A sensitive scanning technology for low frequency nuclear point mutations in human genomic DNA. NAR, (submitted).
    • Li-Sucholeiki, X-C, Khrapko, K, Andre, PC, Marcelino, LA, Karger, BL, and Thilly, WG (1999) Applications of CDCE/hifi PCR to human genetic analysis. Electrophoresis, 20: 1224–1232.
    • Lippert, M. J., Q. Chen und H. L. Liber. (1998) Increased transcription decreases the spontaneous mutation rate at the thymidine kinase locus in human cells. Mutation Research, 401: 1–10.
    • Miller, A. W.; Karger, B. L. (1999) ABC, an expert system for long read base-calling in DNA sequencing. In Vorbereitung.
    • Minarik, M.; Foret, F.; Karger, B. L. Fraction collection in micropreparative capillary zone electrophoresis and capillary isoelectric focusing. Electrophoresis, in press, 1999.
    • Muller, O.; Foret, F.; Karger, B. L. Design of a high-precision fraction collector for capillary electrophoresis. Anal Chem 1995, 67, 2974–2980.
    • Mullikin J. C. und McMurragy, A. A. (1999) Sequencing the genome, Fast. Science 283, 1867–1868.
    • Muth, J.; Williams, P. M.; Williams, S. J.; Brown, M. D.; Wallace, D. C.; Karger, B. L. Fast capillary electrophoresis-laser induced fluorescence analysis of ligase chain reaction products: human mitochondrial DNA point mutations causing Leber's hereditary optic neuropathy. Electrophoresis 1996, 17, 1875–1883.
    • Perls, TT (1997). Centenarians prove the compression of morbidity hypothesis, but what about the rest of us who are genetically less fortunate? Med. Hypotheses, 49: 405–407.
    • Piggee, C. A.; Muth, J.; Carrilho, E.; Karger, B. L. Capillary electrophoresis for the detection of known point mutations by single-nucleotide primer extension and laser-induced fluorescence detection. J Chromatogr A 1997, 781, 367–375.
    • Ruiz-Martinez, M. C.; Carrilho, E.; Berka, J.; Kieleczawa, J.; Miller, A. W.; Foret, F.; Carson, S.; Karger, B. L. DNA sequencing by capillary electrophoresis using short oligonucleotide primer libraries. Biotechniques 1996, 20, 1058–1064, 1066–1059.
    • Ruiz-Martinez, M. C.; Salas-Solano, O.; Carrilho, F.; Kotler, L.; Karger, B. L. A sample purification method for rugged and high-performance DNA sequencing by capillary electrophoresis using replaceable polymer solutions. A. Development of the cleanup protocol. Anal Chem 1998, 70, 1516–1527.
    • Salas-Solano, O.; Carrilho, F.; Kotler, L.; Miller, A. W.; Goetzinger, W.; Sosic, Z.; Karger, B. L. Routine DNA sequencing of 1000 bases in less than one hour by capillary electrophoresis with replaceable linear polyacrylamide solutions. Anal Chem 1998, 70, 3996–4003.
    • Salas-Solano, O.; Ruit-Martinez, M. C.; Carrilho, E.; Kotler, L.; Karger, B. L. A sample purification method for rugged and high-performance DNA sequencing by capillary electrophoresis using replaceable polymer solutions. B. Quantitative determination of the role of sample matrix components on sequeuncing analysis. Anal Chem 1998, 70, 1528–1535.
    • Sosic, Z.; Salas-Solano, O.; Zhou, H.; Miller, A. W.; Karger, B. L. (1999) A multicapillary array instrument for sequencing 1000 bases in less than one hour by capillary electrophoresis. In Vorbereitung.
    • Tomita-Mitchell, A, Muniappan, BP, Herrero-Jimenez, P, Zarbl, H, und Thilly, WG (1998) Single nucleotide polymorphism spectra in newborns and centenarians: identification of genes coding for risk of mortal disease. Gene, 223: 381–391.
    • Xia, F., S. A. Amundson, J. A. Nickoloff und H. L. Liber. (1994) Different recombinational repair capacities in closely related human lymphoblastoid cell lines with different mutational responses to X-irradiation. Molec. Cell. Biol., 14: 5850–5857.
    • Zhou, H.; Miller, A. W.; Sasic, Z; Barron, A. E.; Buchholz, B.; Kotler, L.; Karger, B. L.; DNA sequencing up to 1300 bases in two hours by capillary electrophoresis with mixed replaceable linear polyacrylamide solutions. Eingereicht, 1999.
  • Studien zu einer im Voraus durchgeführten Optimierung
  • Die folgende Beschreibung von Elementen eines Hochdurchsatz-Labors für die Entdeckung von Punktmutationen soll zeigen, dass die Angaben der vorliegenden Beschreibung im Voraus entsprechend angepasst werden können, so dass sie für die gesamten oder einen großen Teil der Gene im menschlichen Genom eingesetzt werden können.
  • Optimierung der CDCE
  • Um die höchste Anreicherung von mutierten Heterodoppelsträngen und außerdem die höchste Auflösung für die Trennung von mutierten Homodoppelsträngen sicherzustellen, müssen die Bedingungen der CDCE für jedes Ziel optimiert werden. Die optimalen CDCE-Bedingungen zum Gewinnen von SNP-enthaltenden Heterodoppelsträngen sollten es möglich machen, alle Heterodoppelstränge in einer einzigen Fraktion, gut vom Wildtyp-Homodoppelstrang getrennt, vereinigt zu erhalten, während die optimalen Bedingungen für die Isolierung von SNP-enthaltenden Homodoppelsträngen zur größten Auflösung bei den beobachteten Homodoppelstrang-Peaks führen sollten. Die PCR-Produkte, die unter den optimierten Bedingungen amplifiziert werden, werden als Testproben für die CDCE-Optimierung eingesetzt. Die Optimierung erfolgt unter Verwendung der gleichen 24-Kapillar-Array-CDCE-Vorrichtung. Im ersten Lauf wird, indem an jeder Säule die Temperatur unabhängig gesteuert wird, ein Temperaturbereich von 11°C in ansteigenden Schritten von 1°C getestet, wobei der Bereich (Tm – 6°C) bis (Tm + 5°C) abdeckt. Danach wird die optimale Temperatur durch einen zweiten Mehrkappillar-Lauf unter Verwendung von Temperatursteigerungen von 0,2°C noch genauer eingestellt. Für diejenigen Zielsequenzen, bei denen eine hochauflösende Trennung durch Variieren der CDCE-Temperatur nicht erreicht werden kann, werden niedrigere elektrische Feldstärken und/oder eine lineare Polyacrylamid-Matrix mit steigenden Salzkonzentrationen verwendet, um die Auflösung zu verbessern (Khrapko et al., 1996).
  • Die Auswertung der Daten zum Selektieren der optimalen Temperatur erfolgt automatisch anhand einer Software, mit der die erforderlichen Messungen von Auflösung und Peakform durchgeführt werden.
  • Die Optimierung von PCR und CDCE wird beim MIT durchgeführt. Die optimierten Bedingungen für jede Zielsequenz werden für die Anreicherung und Isolierung von SNPs und seltenen SNPs im Karger Laboratory verwendet.
  • Beispiel 4
  • Entwicklungsdesign und Methoden
  • Anreicherung von Mutanten
  • Die Zielsequenzen, die aus der gepoolten genomischen DNA-Probe durch hifiPCR amplifiziert wurden, werden auf einer CDCE laufen gelassen, um den schnell wandernden Wildtyp-Homodoppelstrang von den langsamer wandernden mutierten Heterodoppelsträngen bei der optimalen Temperatur zu trennen. Die mutierten Heterodoppelstränge, die Punktmutationen enthalten, werden bei jeder Säule in einer einzigen Fraktion gesammelt und auf diese Weise, bezogen auf die Wildtyp-Sequenz, angereichert.
  • Die quantitative Anreicherung der mutierten Fraktion in einer gepoolten genomischen DNA ist der entscheidende Schritt für die Fähigkeit von CDCE-hifiPCR, mit geringer Häufigkeit auftretende Mutationen nachzuweisen (Khrapko et al., 1997a). Zuerst werden wir die Kopienzahl der Zielsequenz quantitativ bestimmen, die aus der gepoolten DNA-Probe angereichert wurde, welche 100 000 Allele enthält, wobei eine kompetitive PCR unter Verwendung der gleichen zwei künstlichen Mutanten wie bei der PCR- und CDCE-Optimierung eingesetzt wird (Khrapko et al., 1997a). Basierend auf der gemessenen Ziel-Kopienzahl werden die zwei Mutanten bei einem mutierten Anteil von 0,05% zugegeben, um als innere Standards zu dienen. Die gemischte Probe wird durch sechs Verdopplungen amplifiziert (um das PCR-Rauschen zu minimieren), gekocht und erneut einem Annealing („reannealing") unterworfen, so dass Heterodoppelstränge gebildet werden, und sodann wird sie auf der CDCE-Apparatur laufen gelassen, um die Heterodoppelstränge anzureichern.
  • In diesem Fall werden zwei Reihen einer herkömmlichen Platte mit 96 Vertiefungen für die Sammlung verwendet. Während der Trennung wird das Signal in jeder Kapillare überwacht, um die Austrittzeit („exit time") der Wildtyp-DNA aus den Kapillaren nachzuweisen. Dieser Nachweis erfolgt automatisch, ohne dass von Hand darauf geachtet werden muss. Zu dem Zeitpunkt, an dem das Programm bestimmt, dass der breiter gewordene Schwanz-Abschnitt des Wildtyp-Peaks in einer bestimmten Kapillare eine bestimmte Fraktion des Peak-Maximums erreicht hat, wird der elektrische Strom in dieser Kapillare durch die vom Computer gesteuerten Relais unterbrochen. Sobald der Strom zu allen Kapillaren gestoppt wurde (die Zonen werden in verschiedenen Kapillaren zu unterschiedlichen Zeiten eluieren, und deshalb wird die Zeit, wenn der Stopp erfolgt, für die Säulen jeweils verschieden sein), werden die Enden der Kapillaren in die nächste Reihe der Vertiefungen auf der Sammelplatte weiterbewegt und alle DNA-Fragmente hinter der Wildtyp-Zone werden gesammelt. Die Diffusion der DNA aus der Kapillare während der Zeit, wenn der Strom gestoppt ist, spielt keine Rolle, da dieser Schritt schnell erfolgt (in Sekunden) und die Diffusion durch die viskose Siebmatrix nur minimal ist.
  • Es kann sein, dass mehrere Wiederholungen von hifiPCR und CDCE erforderlich sind, um die Mutanten ausreichend für den nächsten Schritt anzureichern und zu amplifizieren, in welchem die einzelnen Mutanten dann isoliert werden. Die Zahl der Wiederholungen wird dadurch bestimmt, ob die Peaks, die den inneren Standards entsprechen, in der CDCE-Datenaufzeichnung bei einem Signal-zu-Rauschen-Verhältnis oberhalb einer vorher definierten Ansprechschwelle sichtbar sind. Die automatische Abwicklung bezüglich der Entscheidung einer ausreichenden Anreicherung wird unterstützt durch eine auf dem ABC-Expertensytem basierende Software, die in dem Karger Laboratory (Northeastern University, Boston, MA) als eine Grundlage für die DNA-Sequenzierung entwickelt wurde. Die Handhabung der Proben erfolgt auf einer Roboter-Arbeitsstation.
  • Isolierung von einzelnen Mutanten
  • Nach der Anreicherung von Heterodoppelsträngen müssen die Mutanten isoliert, quantitativ bestimmt und sequenziert werden. Die vereinigte mutierte Fraktion aus dem vorherigen Schritt wird unter Verwendung von nur einigen wenigen PCR-Zyklen amplifiziert, so dass Express-Primer noch in den letzten Reaktionsgemischen vorliegen, wodurch die Bildung von Heterodoppelsträngen verhindert wird. Die resultierenden mutierten Homodoppelstränge werden sodann durch CDCE mit Fraktionssammlung in einer Gelplatte mit mehreren Vertiefungen („multiwell gel plate") isoliert (wieder bei einem vorher bestimmten Temperaturoptimum). Wie vorher erwähnt wird die Position der Fraktionen auf der Sammelplatte automatisch mit dem Nachweissignal aus dem LIF-Detektor korreliert. Die Häufigkeit einer Mutante in der ursprünglichen Probe wird gemessen, indem die Peakfläche der Mutante mit den Peakflächen der inneren Standards verglichen wird, die im ersten CDCE-Schritt zugegeben werden. Trotz der hohen Auflösung von CDCE wird es zweifellos noch Proben geben, bei denen mehr als ein mutierter Homodoppelstrang gemeinsam laufen. Die großen Homodoppelstrang-Peaks werden auf versteckte Peaks getestet, indem eine Schmelzung und ein erneutes Annealing mit anschließender CDCE durchgeführt werden. Durch das Vorliegen mehrerer Peaks bei der CDCE wird eine vorher versteckte Mutante gezeigt.
  • Bei Durchführung der Multikapillar-CDCE werden die gesammelten Fraktionen durch einen Roboter verarbeitet, und die Trennmatrix wird nach jedem Lauf ersetzt. Da sowohl die Injektions- als auch die Sammel-Enden der Anordnung (Array) von Kapillaren frei sein müssen, kann nicht die bei der DNA-Sequenzierung herkömmliche Art zum Matrixersatz verwendet werden (dabei ist die Durchgangsöffnung permanent mit dem Nachweis-Ende der Kapillaren verbunden). Zu Beginn des Forschungsprojekts wird die Matrix von Hand durch eine Spritze ersetzt, die mit einer Teflonschlauchverbindung ausgestattet ist. In einem späteren Stadium wird in alle Kapillaren eine feinmechanisch hergestellte Matrixersatz-Auslassvorrichtung für einen automatischen Matrixersatz eingebaut. Durch diese Vorrichtung wird dann die Matrix aus der Mitte jeder Kapillare in der Anordnung anhand einer Flüssigkeitsinjektion ersetzt. Eine Software wird entwickelt, mit der die Datenanalyse für die Fraktions-sammelnde Apparatur automatisiert werden kann. Anhand des Programms kann das Bedienungspersonal unter Verwendung der Fluoreszenzaufzeichnungen aus den zwei Nachweisfenstern an der Anordnung (Array) der Kapillaren rasch die gesammelten Fraktionen lokalisieren, welche bestimmte Peaks enthalten. Außerdem generiert das Programm Berichte der Aufzeichnungsprofile. Im ersten Jahr der vorgeschlagenen Arbeit soll diese Software durch ein vollständig automatisiertes Verfahren ergänzt werden, wobei die Aufzeichnungen aus den zwei Nachweisfenstern unter Verwendung von Kreuzkorrelation oder Dynamischer Zeitanpassung („dynamic time warping") ausgerichtet werden (Malmquist und Danielsson, 1994; Nielson et al., 1999), worauf der Peak-Nachweis folgt (Dyson, 1990).
  • Sequenzierung von isolierten Mutanten
  • Nach dem letzten CDCE-Schritt werden die Mutanten aus der Multiwell-Agarose-Gel-Platte automatisch zu einer Roboter-Arbeitsstation mit einem eingebauten Thermozykler für die zyklische Sequenzierung pipettiert. Da nur kurze DNA-Stücke (< 1000 bp) sequenziert werden, wird kein Reinigungsschritt zur Entsalzung eingesetzt. Die Proben werden einfach zehnfach mit Wasser verdünnt und elektrokinetisch injiziert. Wir werden einen automatischen Kapillar-Array-Sequenzer mit Säulenlängen von jeweils etwa 20 cm konstruieren, da nur 100 bis 200 Basen sequenziert werden müssen. Die Apparatur wird ähnlich sein wie eine Vorrichtung, die bereits für eine de novo Sequenzierung langer Stücke („de novo long read sequencing") unter Verwendung eines aus 48 Kapillaren bestehenden Arrays gebaut wurde. Sie wird einen „Line-Generator" mit einer Powell-Linse enthalten, um eine gleichmäßig Beleuchtung aller Kapillaren zu gewährleisten. Der Nachweis wird anhand einer CCD-Kamera erfolgen. Diese Apparatur kann einfach auf eine größere Zahl von Kapillaren erweitert werden, wenn dies erforderlich ist. Die Apparatur wird für die zahlreichen Sequenzen geeignet sein, die in diesem Projekt bestimmt werden sollen.
  • Die Sequenzierungsstrategie wird anhand der „Energy-Transfer Dye-Terminator"-Chemie durchgeführt. Jede isolierte Mutante wird amplifiziert, und beide Stränge werden sequenziert. Für den einen Strang wird ein Primer verwendet, der sich an eine hochschmelzende Domäne („Clamp")-Sequenz anlagert. Für den anderen Strang wird der Primer verwendet, der in der hifiPCR eingesetzt wurde. Zusammen mit der Sequenzierung der mutierten Stränge werden auch geeigneten Kontrollen durchgeführt, umfassend eine in bestimmten Abständen durchgeführte Sequenzierung von Standard-DNA-Sequenzen. „Base Calling" wird anhand des ABC-Expertensystems durchgeführt, das für die Sequenzierung des menschlichen Genoms entwickelt wurde (Miller und Karger, 1999). Die Anreicherung, Isolierung und Sequenzierung von Mutanten wird an der Northeastern University durchgeführt werden.
  • Software und Informatik
  • Eine kundenspezifische Software wird für die Datenerfassung, Steuerung der Apparatur und Analyse der Elektrophoresedaten erforderlich sein. Außerdem wird eine weitere Software erforderlich sein, um die Vorgänge im Labor zu koordinieren, die Informationen zusammenzufassen und die Ergebnisse des Projekts zugänglich zu machen. Es wird erforderlich sein, die Aktivitäten für Tausende von PCRs, CDCE-Elekropherogrammen, gepoolten Fraktionen und DNA-Sequenzierungsproben, die im Verlauf der Arbeit generiert werden, zu verfolgen und zu koordinieren. Anfangs können für diese Funktionen billige kommerzielle Datenbanken und Internet-Entwicklungstools verwendet werden, schließlich wird jedoch eventuell ein kommerzielles Informationsverwaltungssystems für das Labor (LIMS) erforderlich sein, wenn eine größere Zahl von Genen untersucht werden soll. Die Entwicklung und Wartung dieses zu entwickelnden Datenverwaltungssystems wird während der gesamten Dauer des Projekts von entscheidender Bedeutung sein, da die Datenmenge multiplikativ ansteigt und die Vielfalt der Analysen zunimmt.
  • Anhand der aus dieser Arbeit hervorgehenden Informationen bezüglich Mutationen kann dann eine wertvolle Datenbank erstellt werden, die sowohl Sequenzinformationen als auch ausführliche Kommentare enthält, entsprechend dem Modell anderer genetischer Datenbanken (Brown, 1999). Dies kann auch Auswirkungen auf bestehende öffentliche Datenarchive („repositories") (Burks, 1999) haben, da ihre Zahl und Inhalte innerhalb der nächsten paar Jahre noch deutlich zunehmen werden. In diesen Resourcen werden Informationen über Punktmutationen in einem sehr wesentlichen Umfang enthalten sein, die durch die beschriebenen Verfahren erhalten werden, die dann dafür verwendet werden, um unsere Ergebnisse zu bestätigen. Sogar unabhängig von Mutationsdatenbanken können Sequenzdatenbanken eingesetzt werden, um Mutationen für diesen Zweck nachzuweisen, indem Fehlpaarungen in überlappenden Sequenzen aufgedeckt werden, die von verschiedenen genetischen Linien stammen (Taillon-Miller et al., 1998; Picoult-Newberg et al., 1999). Außerdem können die Datenbanken noch für eine Routineüberwachung eingesetzt werden, um zusätzliche Gene zu identifizieren, die an der DNA-Replikation, Reparatur und Rekombination beteiligt sind, und sie können dafür verwendet werden, die Informationen über bekannte Gene auf den neuesten Stand zu bringen. Diese Arbeiten der Datenbanken werden hauptsächlich anhand von Sequenzanalyse- und Datenerfassungs-Software-Programmen durchgeführt, die bereits für die Öffentlichkeit zugänglich sind (Altshul et al., 1997; Pruitt, 1998; Kuehl et al., 1999).
  • Proben
  • Sammeln von Blutproben von einer großen Zahl von jugendlichen Amerikanern
  • Unsere erste große Probe wird aus allen intakten Proben aus einem großen Blei-Testlabor („lead testing laboratory") für Kinder in New York City plus einem bereits in Boston gesammelten Satz bestehen. Wir gehen davon aus, dass wir hieraus und von einer Reihe weiterer Blei-Testlabors eine ausreichend große Zahl von Proben aus den wichtigsten ethnischen Gruppen bekommen, um getrennte gepoolte Proben zu erzeugen. Wir erwarten, dass Untersuchungen dieser verschiedenen Gruppen zeigen werden, dass sie eine Reihe von idiosynkratischen Punktmutationen enthalten, wodurch die Zahl von beobachteten obligatorischen Knock-out-Mutationen erhöht und eine eindeutige Bestimmung, ob ein Gen rezessive oder dominante deletäre Allele enthält, möglich gemacht wird.
  • Man kann davon ausgehen, dass der Vergleich verschiedener ethnischer Gruppen dazu führt, dass die Zahl von unterschiedlichen ererbten Allelen, die für jedes Gen beobachtet werden, zunimmt. Wir erwarten z.B., dass wir verschiedene Sätze von rezessiven deletären Allelen für Gene, die ins Hardy-Weinberg-Gleichgewicht gekommen sind, in asiatischen Populationen, nicht jedoch in afrikanischen Populationen feststellen werden. Einige Allele sind möglicherweise identisch, jedoch kann man davon ausgehen, dass mehrere in einem Satz von sechs bis zehn variieren.
  • Auswahl von Genen und Definition von Zielsequenzen für einleitende Studien
  • Wir waren an Mutationen interessiert, die während der DNA-Reparaturprozesse in mehreren Jahren erzeugt werden, und wir haben ein spezielles Interesse daran, die Arten von SNPs zu bestimmen, die in Genen vorliegen, welche an der DNA-Reparatur beim Menschen beteiligt sind. Wir schlagen vor, anfangs einen Satz von Gene zu untersuchen, die dafür bekannt sind, dass sie an der DNA-Reparatur und Rekombination beteiligt sind. Man würde sich vorstellen, dass solche Gene essentiell sind. Sie könnten dominante deletäre Allele enthalten, wenn dies jedoch nicht der Fall ist, müssen sie rezessive deletäre Allele enthalten. Das Auffinden von Beweisen von ererbten nicht-deletären Variationen in diesen Allelen könnte zu einem besseren Verständnis von Variationen der Mutationsraten bei den Menschen beitragen. Zusammengenommen weisen diese Ergebnisse auf einen multigenen Satz von Faktoren hin, welche primäre physiologische Prozesse, DNA-Reparatur und Rekombination stören oder verändern könnten.
  • Wir haben 13 Gene ausgewählt, die für Fehlpaarungs-, Basenexzisions- und Nucleotidexzisions-Reparatur und außerdem DNA-Rekombination essentiell sind (Tabelle 9) (Sancar, 1995; Nelson et al., 1996; Acharya et al., 1996; Plug et al., 1997; laccarino et al., 1998; Jeggo, 1998; Kolodner und Marsischky, 1999; Arbel et al., 1999; Zhong et al., 1999). cDNAs wurden für jedes dieser Gene bestimmt, außerdem sind für das Jahr 2000, wenn ein großer Teil der Sequenzierung des menschlichen Genoms abgeschlossen sein wird, die vollständigen Sequenzen für alle ausgewählten Gene zu erwarten, wodurch wir dann in die Lage versetzt werden, die Exons und Spleißstellen zu definieren. Wir schlagen vor, als innere Kontrolle für den Nachweis von nicht-deletären und rezessiven deletären Allelen zwei Haushaltsgene, Alpha-1-Antichymotrypsin (AACT) bzw. Adeninphosphoribosyl-Transferase (APRT) zu untersuchen, die beide weder an der DNA-Reparatur noch an der Rekombination beteiligt sind. AACT ist ein Plasma-Protease-Inhibitor, der in der Leber synthetisiert wird, und die Störungen, die durch Mutationen in diesem Gen verursacht werden, werden in autosomal-dominanter Weise vererbt. Mehrere Polymorphismen dieses Gens wurden beschrieben, und Träger solcher Polymorphismen zeigen eine erhöhte Empfänglichkeit gegenüber der Alzheimer-Krankheit (Kamhoh et al., 1995) oder der Parkinson-Krankheit (Yamamoto et al., 1997). Das APRT-Gen wird als ein Kontrollgen untersucht werden, von dem angenommen wird, dass es nur nicht-deletäre Allele enthält. Patienten mit einem kompletten Mangel an APRT scheiden im Urin Harngries aus, der aus Steinen von 2,8-Dihydroadenin (DHA) besteht, sie haben jedoch keine Hyperurikämie oder Gicht. Bereits neun Allelvarianten des APRT-Gens sind bekannt (vgl. APRT Eingabe in der OMIM Datenbank).
  • Wir werden die Schmelzkarten (Beispiel in 29 dargestellt) und Restriktionskarten für alle 15 Gene bestimmen, die in Tabelle 3 angegeben sind. Hierdurch werden dann die Zielsequenzen definiert, umfassend codierende Sequenzen und angrenzende Spleißstellen in Form eines Satzes von etwa 100-bp-„isomelting"-Domänen, die durch geeignete Restriktionsstellen begrenzt sind. Durch diese Vorgehensweise können etwa 98% des menschlichen Genoms getestet werden, wie durch computergestütztes Scannen von 0,5 Megabasen durch Schmelztemperatur-Berechnungen abgeschätzt wird. Danach können dann Restriktionsenzyme, Sequenzen von biotinylierten Sonden und PCR-Primer bestimmt und getestet werden.
  • Tabelle 9 Liste von Genen, die untersucht werden sollen. Diese Liste stellt nur eine Untergruppe aller Gene dar, die an der DNA-Reparatur und Rekombination beteiligt sind. Eine Liste mit im Wesentlichen allen Genen, die zur Zeit bekannt sind (oder von denen vermutet wird), dass sie an der DNA-Reparatur oder Rekombination beteiligt sind, wurde zusammengestellt und enthält mehr als 100 Einträge. Eine Untergruppe musste ausgewählt werden, da die Untersuchung aller Gene im Rahmen dieser Beschreibung nicht machbar ist. Die anderen Gene sind jedoch weiterhin für zukünftige Arbeiten von Interesse.
    Figure 01410001
  • Figure 01420001
  • Herstellung von Blutproben
  • Heparinisierte Blutproben von etwa zwei oder mehreren ml werden uns geliefert werden, die seit der Entnahme für die Bleibestimmung gefroren gelagert worden waren. Wir werden jede Probe schnell auftauen, jede Probe mit der Pipette kräftig mischen, jeweils 0,25 ml der Proben in zwei getrennte Röhrchen geben und den Rest von bis zu 2 ml in –135°C-Gefriergläschen geben, die unmittelbar darauf wieder eingelagert werden. Auf diese Weise wird jede einzelne Blutprobe getrennt aufbewahrt und kann in Zukunft verwendet werden, um z.B. Bindungshypothesen zu testen. Da wir DNA aus Vollblut extrahieren, ist die Gesamtzahl der Leukocyten („white blood cell", WBC) der relevante Parameter, um Variationen von Probe zu Probe zu untersuchen. Die Referenzbereiche der automatisierten Hämatologie (95% Vertrauensgrenzen) vom „MIT Medical Department Laboratory" betragen 4,8 bis 10,8 Millionen WBC/ml, für pädiatrische Proben gilt ein Wert von etwa 8 Millionen pro ml. Somit liegt die durchschnittliche Zahl von WBC/ml in fünf getrennten Proben in der Nähe von 8 × 106. Bei unserer Nachweisgrenze von fünf identischen mutierten Allelen pro 100 000 in der Probe vorliegenden Allelen scheint es vernünftig zu sein, beim Abschätzen der Allel-Häufigkeit eine Variation aufgrund der durchschnittlichen Zahl von WBC pro fünf Spendern zu vernachlässigen. Keine Schlussfolgerung in dieser Arbeit würde darauf beruhen, zu versuchen, einen Allel-Anteil von 5/100 000 von 10/100 000 zu unterscheiden.
  • Die zwei 0,25 ml Vollblut-Aliquots enthalten jeweils etwa 2 000 000 WBC oder etwa vier Millionen Allele für autosomale Gene. Wir werden 1000 Blutproben gleichzeitig vereinigen, um zwei unabhängige doppelte gepoolte Blutproben zu erhalten, die jeweils 2000 Allele enthalten. Blutproben, die zur gleichen ethnischen Gruppe gehören, werden gemeinsam gepoolt. Auf diese Weise werden 50 solcher gepoolten Proben, jeweils in doppelter Ausführung, aus den 50 000 Blutproben erzeugt. Jede gepoolte Probe wird etwa 2 × 109 WBC enthalten. Wir werden die genomische DNA aus den doppelten 50 Proben extrahieren, die jeweils aus 1000 Spendern gepoolt wurden, wobei ein Protokoll zur Isolierung von genomischer DNA verwendet wird, bei dem die DNA weder Phenol noch Anionen-Austauscherharzen ausgesetzt wird (Khrapko et al., 1997). Die Blutzellen werden ausgefällt und durch Zentrifugation und Resuspension in TE-Puffer (50 mM Tris-HCl, pH 8,0, 10 mM EDTA) gewaschen. Die genomische DNA wird aus den Blutzellen durch Spaltung mit Proteinase K (1 mg/ml) und SDS (0,5%) bei 50°C drei Stunden, RNase A (0,1 mg/ml) bei 37°C eine Stunde, und anschließende Zentrifugation und Ethanol-Fällung isoliert. Dieses Protokoll stellt üblicherweise eine Ausbeute an genomischer DNA von mehr als 90% aus 105 bis 109 gezüchteten Zellen oder mg bis g Gewebe bereit (Khrapko et al., 1997; Li-Sucholeiki et al., 1999). Das UV-Absorptionsverhältnis von A260/A280 beträgt typischerweise 1,5 bis 1,8. Die isolierte genomische DNA kann einfach durch Restriktionsendonucleasen gespalten werden. Diese genomischen DNA-Proben werden getrennt bei –135°C gehalten, um gegebenenfalls Unterproben zu erzeugen. Dadurch wird es uns möglich, über Sätze von Proben aus jeder ethnischen Gruppe und Sätze von unbekannter ethnischer Abstammung zu verfügen. Aliquots der 50 genomischen DNA-Proben, jeweils in doppelter Ausführung, werden gepoolt, um eine endgültige gepoolte Original-(„Master-") DNA-Probe zu erzeugen, die 100 000 Allele enthält. Die Vereinigung der Proben und die Isolierung der DNA werden beim MIT durchgeführt werden.
  • Definition von Einheitsprozessen für einzelne Zielsequenzen
  • In dieser einleitenden Untersuchung von 15 Genen setzen wir voraus, dass bis zu 150 Zielsequenzen, die jeweils aus etwa 100 bp bestehen, bearbeitet werden.
  • Wir optimieren die Bedingungen von „high fidelity"-PCR und CDCE für jede Zielsequenz unter Verwendung einer automatisierten 24-Kapillar-Array-CDCE-Apparatur und eines Temperaturgradienten-Thermozyklers in einer Platte mit 96 Vertiefungen in Kombination mit einer Roboter-Arbeitsstation fürs Pipettieren. Die definierten Bedingungen werden dann für die automatisierten Einheitsprozesse für Hochdurchsatz-Anreicherung und Isolierung von SNPs und seltenen SNPs in den 15 Genen verwendet. Die PCR-Optimierung erfolgt in drei Schritten wie vorher beschrieben. Im ersten Schritt wenden wir unsere Standard-hifiPCR-Bedingungen auf alle Zielsequenzen an. Der einzige PCR-Parameter, der in diesem Schritt für jede Zielsequenz eingestellt wird, ist die Reannealing-Temperatur, die auf etwa 5°C niedriger gesetzt wird als die Schmelztemperatur der einzelnen Primerpaare. Bei Zielsequenzen, die mit einer hohen Effizienz (3 50% pro Zyklus) und einer geringen unspezifischen Amplifikation und mit wenig Nebenprodukten (1% der gewünschten Produkte) amplifiziert werden können, gehen wir direkt zur CDCE-Optimierung über.
  • Die Standard hifiPCR wird in 20 bis 30 l unter Verwendung der nativen Pyrococcus furiosus (Pfu)-DNA-Polymerase mit einer assoziierten 3' → 5'-Exonucleaseaktivität und dem Temperaturgradient-Thermozykler in einer Platte mit 96 Vertiefungen durchgeführt. Etwa 50 ng der aus TK6-Zellen isolierten genomischen DNA werden mit zwei künstlichen Mutanten für jede Zielsequenz, bei einem mutierten Anteil von über 10%, gemischt, die als Matrize verwendet werden. Das Standard-PCR-Gemisch enthält 20 mM Tris-HCl (pH 8,0), 2 mM MgCl2, 10 mM KCl, 6 mM (NH4)2SO4, 0,1% Triton X-100, 0,1 mg/ml BSA, 0,1 mM dNTPs, 0,2 M jedes Primers, 0,1 U/l Pfu.
  • Die Zielsequenzen, welche im ersten Schritt keine zufriedenstellenden PCR-Produkte enthalten, werden einem zweiten Optimierungsschritt unterworfen. In diesem Schritt werden verschiedene Reannealing-Temperaturen und Reannealing-Zeiten getestet, um die Effizienz oder Spezifität der PCR zu verbessern. Einige Sequenzen weisen möglicherweise eine große Menge an Nebenprodukten auf, die aus unvollständigen oder exonucleolytisch prozessierten Produkten bestehen, denen ein bis mehrere Nucleotide fehlen. Die Bildung dieser Nebenprodukte ist üblicherweise sequenzabhängig und hängt mit den Eigenschaften der Polymerase zusammen. Unsere bisherigen Erfahrungen haben gezeigt, dass die Mehrheit dieser Nebenprodukte signifikant reduziert werden kann, indem die PCR-Endprodukte 15 Min. bei 45°C oder zusammen mit einer kleinen Menge frischer Pfu zehn Minuten bei 72°C inkubiert werden (Khrapko et al., 1997; Li-Sucholeiki et al., 1999).
  • In unseren einleitenden Punktmutationsstudien haben wir alle 11 Zielsequenzen unter den Standard-PCR-Bedingungen erfolgreich amplifiziert, nachdem wir die Reannealing-Temperatur und Zeit eingestellt oder einen nach der PCR erfolgten Inkubationsschritt durchgeführt hatten. Somit gehen wir davon aus, dass die optimalen PCR-Bedingungen für den Großteil der 150 Zielsequenzen in diesem Schritt bestimmt werden können. Für die restlichen Zielsequenzen, bei denen dies nicht funktioniert, gehen wir zum dritten Optimierungsschritt über. In diesem Schritt werden die Komponenten des PCR-Gemisches verändert, z.B. die Konzentrationen des Magnesiums, der dNTPs und/oder der Primer. Wenn dies versagt, werden wir schließlich die Primer neu gestalten und den Optimierungsprozess wiederholen. Eine Software für die Datenauswertung soll während des ersten Jahrs im Karger Laboratory entwickelt werden, die eine schnelle halbautomatische Auswertung der Peaks der PCR-Produkte auf der CDCE unterstützen soll. Diese Software wird auch den PCR-Optimierungsprozess beschleunigen, insbesondere die Schritte zwei und drei.
  • Die CDCE-Bedingungen für die jeweiligen Zielsequenzen werden unter Verwendung der 24-Kapillar-Array-CDCE-Apparatur wie vorstehend optimiert. Die optimalen CDCE-Bedingungen zum Sammeln von Punktmutation-enthaltenden Heterodoppelsträngen sollten es möglich machen, dass alle Heterodoppelstränge in einer einzelnen Fraktion gesammelt werden, die von dem Wildtyp-Homodoppelstrang gut getrennt ist, während die optimalen Bedingungen zur Isolierung von Punktmutation-enthaltenden Homodoppelsträngen die beste Auflösung zwischen den beobachteten Homodoppelstrang-Peaks bereitstellen sollte. Diese optimalen Bedingungen werden bestimmt, indem zuerst die Testproben bei verschiedenen Trenntemperaturen laufen gelassen werden, und indem dann die elektrische Feldstärke erniedrigt wird und/oder eine lineare Polyacrylamid-Matrix mit hohen Salzkonzentrationen eingesetzt wird (Khrapko et al., 1996). Obwohl ein Erniedrigen der Feldstärke die Trennzeit verlängern wird, wird dies keine Rolle spielen, da diejenigen Sequenzen, die eine niedrige Feldstärke benötigen, zusammen unter Verwendung der 12-Kapillar-Array-CDCE-Apparatur bearbeitet werden können, die mit einem automatischen Fraktionssammelsystem verbunden ist. Die Auswertung der Daten, um das Temperaturoptimum auszuwählen, wird durch eine Software automatisiert, wobei die erforderlichen Messungen zur Auflösung und Peakform durchgeführt werden.
  • Isolierung einzelner Zielsequenzen aus der gepoolten DNA-Probe
  • In einer gepoolten Probe wird ein Zellzahl von etwa 1000 Zellen pro Spenderprobe erforderlich sein, um bei der Punktmutations-Analyse jeder Zielsequenz jegliche signifikante Variation aufgrund der Zellzahl auszuschließen. Somit wäre die Gesamtzahl von WBC in der gepoolten Probe, die 50 000 Spender umfasst, 5 × 107 Zellen, dies entspricht 300 g genomischer DNA. Eine solche große Menge von genomischer DNA kann nicht direkt einer routinemäßigen hifiPCR unterworfen werden. Außerdem werden wir zu diesem Zeitpunkt nur 2 × 106 WBC (oder 0,25 ml Blut) von jedem Donor vereinigen. Somit könnte man denken, dass unsere gepoolten Blutproben Material enthalten, um nur 2000 DNA-Sequenzen oder etwa 20 Gene untersuchen zu können, dies ist sicherlich nicht genug für den vorgeschlagenen Satz von Genen plus die zukünftigen Identifizierungen von Punktmutationen.
  • Um diese Probleme zu lösen, werden wir einzelne Zielsequenzen aus der gepoolten genomischen DNA-Probe anreichern, wobei wir unsere kürzlich entwickelte Technologie einsetzen, die auf einer Sequenz-spezifischen Hybridisierung, gekoppelt mit immobilisierenden Biotin-Streptavidin-Systemen, beruht (Li-Sucholeiki et al., 1999). Dieser Anreicherungsschritt kann nicht nur die Größe der DNA-Probe signifikant reduzieren, so dass die anschließende PCR möglich wird, sondern er versetzt uns außerdem in die Lage, mehrere Zielsequenzen aus der gleichen genomischen DNA-Probe zu isolieren, wodurch die Zahl der Sequenzen, die untersucht werden können, entscheidend erhöht wird.
  • In diesem Verfahren wird die gepoolte genomische DNA-Probe zuerst mit geeigneten Restriktionsendonucleasen gespalten, um das DNA-Fragment, welches die Zielsequenz enthält, freizusetzen. Danach wird die gespaltene DNA gleichzeitig mit einem Überschuss von Biotin-markierten Oligo-DNA-Sonden hybridisiert, die zu den Watson-Crick-Strängen der Zielsequenz komplementär sind, die im Restriktionsfragment enthalten ist. Danach werden die Hybride durch Streptavidin-beschichtete Mikrokügelchen immobilisiert. Alternativ kann die Hybridisierung mit biotinylierten Sonden durchgeführt werden, die vorher an den Streptavidin-beschichteten Perlen immobilisiert wurden. In beiden Fällen werden die Perlen mit dem gebundenen Hybrid von der gesamten DNA-Lösung abgetrennt, indem eine Zentrifugation durchgeführt oder ein Magnetfeld angelegt wird, wenn die Perlen paramagnetische Eigenschaften haben. Die Perlen werden unter stringenten Bedingungen gewaschen, um unspezifisch gebundene Stoffe zu entfernen. Die Waschlösungen werden mit der gesamten DNA-Lösung vereinigt. Die Sondengebundene Zielsequenz wird durch Erhitzen aus den Perlen in entionisiertes H2O eluiert. Das Elutionsprodukt kann direkt durch hifiPCR amplifiziert werden. Wir haben dieses Verfahren angewendet, um ein gespaltenes APC-Gen-Fragment anzureichern. Dabei wurde für diese Zielsequenz eine 10 000-fache Anreicherung und eine Ausbeute von über 70% erreicht (Li-Sucholeiki et al., 1999).
  • Um mehrere Zielsequenzen aus der gleichen genomischen DNA-Probe anzureichern, werden unterschiedliche Typen von Streptavidin-beschichteten Perlen, die jeweils ein getrenntes Paar von Sonden für eine unterschiedliche Zielsequenz enthalten, verwendet, um mit der genomischen DNA in der gleichen Reaktion zu hybridisieren. Nach der Hybridisierung werden die unterschiedlichen Typen von Perlen erst von der DNA-Lösung und danach voneinander getrennt. Nach dem Waschen werden die einzelnen Zielsequenzen von jedem Typ von Perlen getrennt eluiert. Diese Prozedur kann für die gleiche Gesamt-DNA-Lösung wiederholt werden, um einen anderen Satz von Zielsequenzen anzureichern. Wir haben gezeigt, dass paramagnetische Perlen und nicht-magnetische Perlen zusammen verwendet werden können, um vier verschiedene Zielsequenzen aus der gleichen genomischen DNA-Probe anzureichern (Li-Sucholeiki et al., nicht veröffentlichte Ergebnisse).
  • Die Strategie für die Restriktionsspaltung der gepoolten genomischen DNA-Probe besteht zu diesem Zeitpunkt darin, eine „6-Cutter"-Restriktionsendonuclease zu wählen, um die genomische DNA mit hohem Molekulargewicht zu einem reproduzierbaren Satz von Fragmenten mit einer Länge von durchschnittlich etwa 4000 bp zu spalten. Während wir theoretisch zwar einen beliebigen „6-Cutter" wählen könnten, kann es auch sein, dass wir in einem solchen Schritt eine gewünschte Sequenz spalten. Wir benötigen 140 bp, die intakt sind, um eine gewünschte Sequenz von 100 bp nach der Restriktionsspaltung zu amplifizieren. Nach dem Zufall wird eine beliebige 140-bp-Sequenz in 140/4096 = 3,4% der Zeit gespalten. Jedoch sagt das Murphy-Gesetz voraus, dass eine gewisse, sehr wichtige Sequenz schließlich zerstört wird, egal welcher „6-Cutter" gewählt wird. Deshalb werden wir bei den zwei Original-Aliquot-Proben zwei getrennte „6-Cutter" einsetzen und die Proben danach parallel verarbeitet. Die Wahrscheinlichkeit, dass beide Endonucleasen eine bestimmte 140-bp-Sequenz spalten, beträgt nur 0,001168. Aufgrund unserer vorläufigen Ergebnisse können wir im Prinzip bis zu 1000 getrennte Sequenzen aus jedem Original-Aliquot isolieren, das durchschnittlich 1000 Zellen von jedem Spender enthält. Somit würden die durchschnittlich 2 × 106 WBC, die von jedem Donor erhalten werden, eine Untersuchung von bis zu 2 Millionen getrennten 100-bp-Sequenzen oder von bis zu 100 000 Genen möglich machen. Die Isolierung von einzelnen Zielsequenzen wird beim MIT durchgeführt werden.
  • Begrenzte Amplifizierung, Kopplung von „Clamp"- und Fluorescein-Markierung
  • Die Zielsequenz in der Ziel-angereicherten Probe wird durch eine hifiPCR unter Verwendung von Pfu-Polymerase und Primern, welche die Zielsequenz flankieren, amplifiziert. Der eine Primer hat einfach eine Länge von 20 bp. Der andere Primer besteht aus 60 Basenpaaren, umfassend eine aus 20 bp bestehende Ziel-spezifische Sequenz und eine aus 40 bp bestehende nicht-monotone GC-Sequenz. Dieser Primer ist 5' mit einem Fluorescein-Molekül markiert. Somit werden die PCR-Produkt-Moleküle die gewünschte 100-bp-Zielsequenz in einem doppelsträngigen Molekül zusammen mit einer angrenzenden Hoch-Schmelztemperatur-Domäne oder „Clamp" enthalten, die erforderlich ist, um eine Trennung aufgrund von Unterschieden in Schmelztemperaturen in der gewünschten Niedertemperatur-Domäne zu erreichen. Die Fluorescein-Markierung macht es möglich, die Zahl der Moleküle in einem CDCE-Peak anhand des Nachweises der Laser-induzierten Fluoreszenz zu messen.
  • Da durch die PCR, auch dann, wenn man sie mit anderen „high fidelity"-Bedingungen unter Verwendung der pfu-DNA-Polymerase durchführt, in den Produktmolekülen Mutationen erzeugt werden, muss sorgfältig darauf geachtet werden, dass diese durch PCR erzeugten Mutanten nicht die Beobachtung und die zahlenmäßige Bestimmung von Punktmutation-enthaltenden Sequenzen stören. Der durch PCR induzierte, mutierte Anteil, PCRmf, ist das Produkt der Zahl von PCR-Verdopplungen, d, der Zahl von Basenpaaren in der Zielsequenz, b, und der Fehlerrate in Form von Mutationen pro Basenpaar pro Verdopplung, f, (Keohavong und Thilly, 1988). PCRmf = b × f × d
  • Für die Pfu-DNA-Polymerase unter unseren Bedingungen ist f = 6 × 10–7, und unsere Zielsequenz beträgt 100 bp. Wenn wir also etwa 64 × oder 6 Verdopplungen (etwa 9 Zyklen) amplifizieren würden, könnten wir davon ausgehen, dass (100)(6 × 10–7)(6) = 36 × 10–5 der Produkte Mutationen enthalten würden, die durch die PCR induziert wurden. Diese Pfu-induzierten Mutationen sind über 10 einzelne „Hot-Spot"- Mutationen allgemein verteilt, wobei jede Mutation, bei den 6 vorgeschlagenen Verdopplungen, bei einem mutierten Anteil von etwa 3,6 × 105 vorliegt (Andre et al., 1997). Da sogar ein einzelner spezifischer SNP in 100 000 Allelen einen mutierten Anteil von 5 × 10–5 hätte, würde er als ein deutlicher Peak, der vom PCR-„Rauschen" getrennt ist, festgestellt werden. Eine Punktmutation, die in 0,1% aller Personen vorliegt, würde 10-mal vertreten sein und einen mutierten Anteil von 50 × 10–5 erzeugen, dies würde als eine deutliche Erhöhung über dem PCR-„Rauschen" erscheinen.
  • Für eine genaue quantitative Bestimmung aller Allel-Anteile der SNPs und besonders der seltenen Punktmutationen werden wir die zwei künstlichen Mutanten vor der PCR, bei einem bekannten mutierten Anteil von 5 × 10–4, in die Ziel-angereicherte Probe einführen, die dann als innerer Standards dienen (Khrapko et al., 1997). Durch den ersten hifiPCR-Schritt mit 6 Verdopplungen werden 6 × 109 Kopien (= 60 × 100 000 Allele × 1000 Kopien/Allel) von fluoreszierend markierten Zielsequenzen erzeugt. Die PCR-Probe wird gekocht und einem Reannealing unterworfen, um alle Punktmutation-enthaltenden mutierten Sequenzen zu Mutante/Wildtyp-Heterodoppelsträngen umzuwandeln. Dieser hifiPCR-Schritt wird beim MIT durchgeführt werden.
  • Identifizierung von Punktmutationen und seltenen Punktmutationen unter Verwendung von automatisierten Einheitsprozessen
  • Etwa 10% der PCR-Produkt-Probe (etwa 6 × 108 Kopien) wird auf CDCE bei einer geeigneten Bedingung getrennt, und die Heterodoppelstränge werden in einer einzelnen Fraktion, getrennt vom Wildtyp-Homodoppelstrang, gesammelt. Wir gehen davon aus, dass die Mutanten durch diese erste CDCE-Sammlung im Bezug auf die Wildtyp-Sequenzen 20-fach angereichert werden. Die Heterodoppelstrang-Fraktion wird durch hifiPCR amplifiziert. Eine zweite Heterodoppelstrang-Gewinnung durch CDCE und hifiPCR wird durchgeführt, um die Mutanten noch weiter etwa um das 5-Fache anzureichern. Nachdem die vorstehenden Verfahren durchgeführt wurden, werden seltene Punktmutationen, die anfänglich bei einem Allel-Anteil von 5 × 10–5 vorlagen, jetzt in den PCR-Produkten bei einem Anteil von 5 × 10–3 vorliegen, dies kann auf CDCE sichtbar gemacht werden. Der anfängliche Allel-Anteil eines SNP kann durch Vergleich mit dem inneren Standard bestimmt werden (Khrapko et al., 1997). Einzelne SNP-enthaltende Peaks werden isoliert, amplifiziert, um große Zahlen von markierten Molekülen zu erzeugen, auf Homogenität untersucht (keine Peaks, die unter großen Peaks versteckt sind) und schließlich sequenziert.
  • Die Anreicherung und Isolierung von Mutanten erfolgt mit der 12-Kapillar-Array-CDCE-Apparatur, die mit einer automatischen Fraktionssammlung für jede Säule ausgestattet ist, die ihrerseits mit einem automatischen System verbunden ist, das die Sammlung zur hifiPCR weiterleitet. Die Temperatur für jede Säule wird auf die optimierte Bedingung eingestellt, die für jede Zielsequenz vorher bestimmt wurde. Dieses System, mit dem 12 verschiedene Zielsequenzen gleichzeitig bearbeitet werden können, ist für unseren Hochdurchsatz unabdingbar. Die Sequenzierung der isolierten Mutanten wird unter Verwendung der 8-Kapillar-Array-CE-Apparatur durchgeführt.
  • Tests auf systematische Fehler
  • Wir betonen hier erneut, dass jede beliebige Punktmutation und alle seltenen Punktmutationen, die in einer beliebigen gepoolten Probe identifiziert wurden, erneut getestet werden, indem getrennte Watson-Crick-Stränge verwendet werden. Dies ist in jedem Test auf Mutationen mit geringer Häufigkeit erforderlich, da sie durch Fehlpaarungs-Zwischenprodukte in solchen Zellen zustande kommen können, in denen zum Zeitpunkt der Probennahme eine DNA-Synthese stattfindet, oder die als beschädigte Stellen der DNA vorliegen könnten, die während der PCR zu Mutationen umgewandelt wurden. Diese Arten von Fehlen erzeugen eine asymmetrische Verteilung einer offensichtlichen Mutation auf den gegenüberliegenden DNA-Strängen an der gleichen Position. Echte Mutationen erzeugen symmetrische und komplementierende Mutationen. Wir führten diesen Kontrollschritt in unsere Untersuchungen der mitochondrialen Mutation ein und fanden zwei Beispiele, die Fehlpaarungs-Zwischenprodukten in schnell wachsenden Zellen in Kultur zuzuschreiben waren (Khrapko et al., 1997). Soweit wir wissen, wird dieser essentielle Kontrollschritt ausschließlich in unserem Labor durchgeführt.
  • Aufklärung, welche Gene obligatorische Knock-out-Allele bei Anteilen aufweisen, welche die Wichtigkeit solcher Gene bei der Bestimmung der Fortpflanzungsfähigkeit anzeigen
  • Identifizierung und Bedeutung des Anteils von gescannten Genen, die entweder dominante oder rezessive deletäre Allele enthalten
  • Wir gehen davon aus, dass, wenn ein Gen nur nicht-deletäre Allele enthält, einige obligatorische Knock-out-Allele in dem Satz von ererbten Mutationen bei Allel-Anteilen von größer als 1% mit einer Summe von etwa 10% vorliegen werden. Wenn ein Gen rezessive deletäre Allele enthält, erwarten wir, dass die festgestellte Summe der obligatorischen Knock-out-Allele bei etwa 0,7% oder so liegt. Wenn ein Gen dominante deletäre Allele enthält, erwarten wir, dass in keiner ethnischen Gruppe obligatorische Knock-out-Allele bei einem Allel-Anteil von 5/100 000, unserer Nachweisgrenze, zu sehen sind. Die Bestimmung einer reproduzierbaren Feinkarte, wie sie von uns vorgeschlagen wird, wird für verschiedene Wissenschaftler unterschiedliche Bedeutung haben. Sie kann die erste quantitative Verteilung von seltenen ererbten Allelen angeben. Sie kann einen gewissen Hinweis darauf geben, welche Gene im DNA-Replikationskomplex dominante oder rezessive deletäre Allele enthalten. Die Beobachtung von Fehlsinnmutationen in diesen Genen weist möglicherweise darauf hin, dass sie an Mutator-Syndromen beteiligt sind, welche die spontane Rate von somatischen Mutationen erhöhen. Von solchen Bedingungen kann man erwarten, dass sie das Auftreten von Krebs oder Atherosklerose beschleunigen, d.h. sie würden schädliche Allele darstellen.
  • Wir werden ein leicht zugängliches Web-File von unseren Daten erstellen, sobald wir sie haben, außerdem werden wir unsere Beobachtungen in den angegebenen Fachzeitschriften für die Öffentlichkeit zugänglich machen. Unser Datensatz wird Links zu Strukturinformationen und außerdem genomischen Sequenzen für jedes Gen enthalten.
  • Zitierte Literatur
    • Acharya, S., T. Wilson, et al. (1996). "hMSH2 forms specific mispair-binding complexes with hMSH3 and hMSH6." Proc Natl Acad Sci USA 93(24): 13629–34.
    • Altschul, S. F., Madden, T. L., Schaffer, A. A., Zhang, J., Zhang, Z., Miller, W., und Lipman, D. J. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25, 3389–3402 (1997).
    • Amundson, S. A., F. Xia, K. Wolfson und H. L. Liber (1993). Different cytotoxic and mutagenic responses induced by X-rays in two human lymphoblastoid cell lines derived from a single donor. Mutation Res., 286: 233–241.
    • Aparicio, O. M., D. M. Weinstein, et al. (1997). "Components and dynamics of DNA replication complexes in S. cerevisiae: redistribution of MCM proteins and Cdc45p during S phase." Cell 91(1): 59–69.
    • Arbel, A., D. Zenvirth, et al. (1999). "Sister chromatid-based DNA repair is mediated by RAD54, not by DMC1 or TID1." Embo J 18(9): 2648–2658.
    • Arnheim, N.; Strange, C.; Erlich, H. Use of pooled DNA samples to detect linkage disequilibrium of polymorphic restriction fragments and human disease: studies of the HLA class II loci. Proc. Natl. Acad. Sci. USA 1985, 82, 6970–6974.
    • Bai Y und Symington L. S (1996) Genes Dev. 10: 2025–37.
    • Baker, T. A. und S. P. Bell (1998). "Polymerases and the replisome: machines within machines." Cell 92(3): 295–305.
    • Baumann P und West SC (1998) Trends Biochem Sci 23: 247–51
    • Behr, S., Matzig, M., Levin, A., Eickhoff, H., und Heller, C. A fully automated multicapillary electrophoresis device for DNA analysis. Electrophoresis 20, 1492–1507 (1999).
    • Berka, J.; Pariat, Y. F.; Muller, O.; Hebenbrock, K; Heiger, D. N.; Foret, F.; Karger, B. L. Sequence dependent migration behavior of double-stranded DNA in capillary electrophoresis. Electrophoresis 1995, 16, 377–388.
    • Bosserhoff, A. K.; Seegers, S.; Hellerbrand, C.; Scholmertch, J.; Butttner, R. Rapid genetic screening for hemochromatosis using automated SSCP-based capillary electrophoresis (SSCP-CE). Biotechniques 1999, 26, 1106–1110.
    • Brown, S. M. Snapping up SNPs. BioTechniques 26, 1090–1094 (1999).
    • Burks, C. Molecular biology database list. Nucleic Acids Res. 27, 1–9 (1999).
    • Cargill, M.; Altshuler, D.; Ireland, J.; Sklar, P.; Ardlie, K.; Patil, N.; Lane, C. R; Lim, E. P.; Kalayanaraman, N.; Nemesh, J.; Ziaugra, L.; Friedland, L.; Rolfe, A.; Warrington, J.; Lipshutz, A.; Daley, G. Q.; Lander, E. S. Characterization of single-nucleotide polymarphisms in coding regions of human genes. Nat. Genet. 1999, 22, 231–238.
    • Carrilho, E.; Ruiz-Martinez, M. C.; Berka, J.; Smirnov, I.; Goetzinger, W.; Miller, A. W.; Brady, D.; Karger, B. L. Rapid DNA Sequencing of More Than 1,000 Bases per Run by Capillary electrophoresis Using Replaceable Linear Palyacrylamide Solutions. Anal. Chem. 1996, 68, 3305–3313.
    • Chee, M.; Yang, R.; Hubbell, E.; Berno, A.; Huang, X. C.; Stern, D.; Winkler, J.; Lockhart, D. J.; Morris, M. S.; Fodor, S. P. Accessing genetic information with high-density DNA arrays. Science 1996, 274, 610–614.
    • Chuang, Y.-Y., Q. Chen und H. L. Liber. (1999) Radiation-Induced Mutations At The Autosamal Thymidine Kinase Locus Are Not Elevated In P53-Null Cells. Cancer Research, 59: 3073–6.
    • Cohen, A. S.; Najarian, D. R.; Paulus, A.; Guttman, A.; Smith, J. A.; Karger, B. L. Rapid Separation and Purification of Oligonucleotides by High-Performance Capillary Gel Electrophoresis. Proc. Natl. Acad. Sci. 1988B, 85, 9660–9663.
    • Cohen, A. S.; Najarian, D.; Smith, J. A.; Karger, B. L. Rapid Separation of DNA Restriction Fragments Using Capillary Electrophoresis. J. Chromatog. 1988A, 458, 323–333.
    • Cole-Strauss, A, Yoon, K, Xiang, Y, Byrne, BC, Rice, MC, Gryn, J, Hollaman, WK, Kmiec, EB. (1996) Correction of the mutation responsible for sickle cell anemia by an RNA-DNA oligonucleotide. Science. 273: 1386–9.
    • Consortium of Pharmaceutical Companies and the Wellcome Trust Fund Creation of Public Database of Gene Markers; 1999, http://webseiver1.wellcome.ac.uk/en/1/awtprere10499n123.html.
    • Dyson, N. Chromatographic integration methods. The Bath Press, Bath, U.K., 1990.
    • Essers J, Hendricks RW, Swagemakers SMA, Troelestra C, de Wit J, Bootsma D, Hoeijmakers, JHJ, Kanaar R (1997). Disruption of mouse rad54 reduces ionizing radiation resistance and homologous recombination. Cell 89: 195–204.
    • Essers, J., Hendricks, RW, Swagemakers, SMA, Trolestra, C, de Wit, J, Bootsma, D, Hoeijmakers, JHJ and Kanaar, R, Disruption of mouse rad54 reduces ionizing radiation resistance and homologous recombination. Cell 89: 195–204 1997
    • Furth, E. E., W. G. Thilly, B. W. Penman, H. L. Liber und W. M. Rand (1981). Quantitative assay for mutation in diploid human lymphoblasts using microtiter plates. Analyt. Biochem., 110: 1–8.
    • Gennett, I. N. und Thilly, W. G. mapping large spontaneaus deletion endpoints in the human HPRT gene. Mutat. Res., 1988, 201: 149–160.
    • Gilles, P. N.; Wu, D. J.; Foster, C. B.; Dillon, P. J.; Chanock, S. J. Single nucleotide polymorphic discrimination by an electronic dot blot assay on semiconductor microchips. Nat. Biotechnol. 1999, 17, 365–370.
    • Giordano M, Oefner PJ, Underhill PA, Cavalli Sforza LL, Tosi R, Richiardi PM. Identification by denaturing high-performance liquid chromatography of numerous polymorphisms in a candidate region for multiple sclerosis susceptibility. Genomics 1999 Mar 15; 56(3): 247–53.
    • Goetzinger, W.; Kotler, L.; Carrilho, E.; Ruiz-Martinez, M. C.; Salas-Solano, O.; Karger, B. L. Characterization of High Molecular Mass Linear Polyacrylamide Powder Prepared by Emulsion Polymerization as a Replaceable Polymer Matrix for DNA Sequencing by Capillary Electrophoresis. Electrophoresis 1998, 19, 242–248.
    • Griffin, T. J.; Hall, J. G.; Prudent, J. R.; Smith, L. M. Direct genetic analysis by matrix-assisted laser desorption/ionization mass spectrometry. Proc. Natl. Acad. Sci. USA 1999, 96, 6301–6306.
    • Guldberg, P.; Guttler, F. A simple method for identification of point mutations using denaturing gradient gel electrophoresis. Nucl. Acids Res. 1993, 21, 2261–2262.
    • Haber, J. Bioessays 17: 609–20, 1995; Bai, Y. und Symington, LS 1946, Genes Dev. 10: 2025–7; Baumann P und West, SC, 1998, Trends Biochem. Sci. 23: 247–51
    • Hacia, J. G.; Fan, J. B.; Ryder, O.; Jin, L.; Edgemon, K.; Ghandour, G.; Mayer, R. A.; Sun, B.; Hsie, L.; Robbins, C. M.; Brody, L. C.; Wang, D.; Lander, E. S.; Lipshutz, R.; Fodor, S. P.; Collins, F. S. Determination of ancestral alleles for human single-nucleotide polymorphisms using high-density oligonucleotide arrays. Nat. Genet. 1999, 22, 164–167.
    • Hagmann, M. Human genome. A good SNP may be hard to find. Science 1999, 285, 21–22.
    • Head, S. R.; Parikh, K.; Rogers, Y. H.; Bishai, W.; Goelet, P.; Boyce-Jacino, M. T. Solid-phase sequence scanning for drug resistance detection in tuberculosis. Mol. Cell. Probes 1999, 13, 81–87.
    • Heiger, D. N.; Cohen, A. S.; Karger, B. L. Separation of DNA Restriction Fragments by High Performance Capillary Electrophoresis with Low and Zero Crosslinked Polyacrylamide Using Continuous and Pulsed Electric Fields. J. Chromatog. 1990, 516, 33–48.
    • Heller, C. Separation of double-stranded and single-stranded DNA in polymer solutions: II. Separation, peak width and resolution. Electrophoresis 1999, 20, 1976–1986. High-Performance Capillary Electrophoresis (Khaledi, M. G., Ed.); John Wiley & Sons: N.Y., 1998.
    • HLA class II loci. Proc Natl Acad Sci USA 1985 Oct; 82(20): 6970–4.
    • Huang, D., H. Pospiech, et al. (1999). "Structural organisation and splice variants of the POLEI gene encoding the catalytic subunit of human DNA polymerase epsilon." Biochem J 339(Pt 3): 651–65.
    • Hyseq Polymorphism Discovery Program; 1999; http://www.hyseq.com/products/ppoly.html.
    • Incyte Pharmacogenetics Program; 1999; http://www.incyte.com/products/genetics/index.html.
    • Innis, M. A.; Gelfand, D. H. In PCR Protocols: A Guide of Methods and Applications; Academic Press, 1990, S. 3–11.
    • Johnson, R. E., S. Prakash, et al. (1999). "Efficient bypass of a thymine-thymine dimer by yeast DNA polymerase, Poleta." Science 283(5404): 1001–4.
    • Kamboh, M. I.; Sanghera, D. K; Ferrell, R. E.; DeKosky, S. T.: APOE*4-associated Alzheimer's disease risk is modified by alpha-1-antichymotrypsin polymorphism. Nature Genet. 10: 486–488, 1995.
    • Kanaar, R und Hoeijmakers, JHJ 1997 Genes Function 1: 165–74
    • Kanaar, R, Trolestra, C, Swagemakers, SMA, Essers, J, Smit, B, Franssen, J–H, Pastink, A, Bezzubova, OY, Buerstedde, J–M, Clever, B, Heyer, W–D, und Hoeijmakers, JHT, Curr. Biol. 6: 828–38, 1996
    • Kat, A. Ph. D. Thesis, MIT, Cambridge, 1992.
    • Khrapko, K.; Hanekamp, F. S.; Thilly, W. G.; Belenkii, A.; Foret, F.; Karger, B. L. Constant denaturant capillary electrophoresis (CDCE): a high resolution approach to mutational analysis. Nucl. Acids Res. 1994, 22, 364–369.
    • Khrapko, K.; Coller, H.; Andre, P.; Li, X. C.; Foret, F.; Belenky, A.; Karger, B. L.; Thilly, W. G. Mutational spectrometry without phenotypic selection: human mitochondrial DNA. Nucl. Acids Res. 1997, 25, 685–693.
    • Kleparnik, K.; Foret, F.; Berka, J.; Goetzinger, W.; Miller, A. W.; Karger, B. L. The Use of Elevated Column Temperature to Extend DNA Sequencing Read Lengths in Capillary Electrophoresis with Replaceable Polymer Matrices. Electrophoresis 1996, 17,
    • Kolodner, R. D. und G. T. Marsischky (1999). "Eukaryotic DNA mismatch repair." Curr Opin Genet Dev 9(1): 89–96.
    • Jeggo, P. A. (1998). "DNA breakage and repair." Adv Genet 38: 185–218.
    • Koreth, J.; O'Leary, J. J.; J, O. D. M. Microsatellites and PCR genomic analysis. J. Parhol. 1996, 178, 239–248.
    • Kren BT. Cole-Strauss A. Kmiec EB. Steer CJ. (1997). Targeted nucleotide exchange in the alkaline phosphatase gene of HuH-7 cells mediated by a chimeric RNA/DNA oligonucleotide. Hepatology. 25: 1462–8.
    • Kuehl, P. M., Weisemann, J. M., Touchman, J. W., Green, E. D., und Boguski, M. S. An effective approach for analyzing "prefinished" genomic sequence data. Genome Res. 9, 189–194 (1999).
    • Iaccarino, I., G. Marra, et al. (1998). "hMSH2 and hMSH6 play distinct roles in mismatch binding and contribute differently to the ATPase activity of hMutSalpha." Embo J 17(9): 2677–86.
    • Larsen, L. A.; Christiansen, M.; Vuust, J.; Andersen, P. S. High-throughput single-strand conformation polymorphism analysis by automated capillary electrophoresis: robust multiplex analysis and pattern-based identification of allelic variants. Hum. Mutat. 1999, 13, 318–327.
    • Li, J.; Butler, J. M.; Tan, Y.; Lin, H.; Royer, S.; Ohler, L.; Shaler, T. A.; Hunter, J. M.; Pollart, D. J.; Monforte, J. A.; Becker, C. H. Single nucleotide polymorphism determination using primer extension and time-of-flight mass spectrometry. Electrophoresis 1999, 20, 1258–1265.
    • Li, X–C, und Thilly, WG (1997) Use of wide-bore capillaries in constant denaturant capillary electrophoresis. Electrophoresis, 17: 1884–1889.
    • Li-Sucholeiki, X–C, und Thilly, WG (1999) A sensitive scanning technology for low frequency nuclear point mutations in human genomic DNA. NAR, (submitted). Li-Sucholeiki, X. C.; Khrapko, K.; Andre, P. C.; Marcelino, L. A.; Karger, B. L.; Thilly, W. G. Applications of constant denaturant capillary electrophoresis/high-fidelity polymerase chain reaction to human genetic analysis. Electrophoresis 1999, 20: 1224–1232.
    • Liber, Howard L., D. W. Yandell und J. B. Little (1989). A comparison of mutation induction at the tk and hgprt loci in human lymphoblastoid cells; quantitative differences are due to an additional class of mutations at the autosomal tk locus. Mutaton Res., 216: 9–17.
    • Lippert, M. J., Q. Chen und H. L. Liber. (1998) Increased transcription decreases the spontaneous mutation rate at the thymidine kinase locus in human cells. Mutation Research, 401: 1–10.
    • Malmquist, G., und Danielsson, R. Alignment of chromatographic profiles for principal component analysis: a prerequisite for fingerprinting methods." J. Chromatogr. A 687, 71–88 (1994).
    • Masood, E. As consortium plans free SNP map of human genome. Nature 1999, 398, 545–546.
    • Matsuda, M, Miyagiwa, M, Takahashi, M, Fukuda, T, Kataoka, T, Asahara, T, Inui, H, Watatani, M, Yasutomi, N, Dohi, K und Kamiya, K Mutations in the rad54 recombination gene in primary cancers. Oncogene 18: 3427–30, 1999
    • Mickey G, Sim J, Durand J, Wills C. Use of denaturing gradient electrophoresis to determine the distributions of polymorphisms in entire genes in natural populations., Biochim Biophys Acta 1995: 123–31.
    • Miller, A. W., und Karger, B. L. ABC, an expert system for base-calling in DNA sequencing. In Vorbereitung (1999).
    • Muller, O.; Minarik, M.; Foret, F. Ultrafast DNA analysis by capillary electropharesis/laser-induced fluorescence detection. Electrophoresis 1998, 19, 1436–1444.
    • Muth, J.; Williams, P. M.; Williams, S. J.; Brown, M. D.; Wallace, D. C.; Karger, B. L. Fast capillary electrophoresis-laser induced fluorescence analysis of ligase chain reaction products: human mitochondrial DNA point mutations causing Leber's hereditary optic neuropathy. Electrophoresis 1996, 17, 1875–1883.
    • Nelson, J. R., C. W. Lawrence, et al. (1996). "Thymine-thymine dimer bypass by yeast DNA polymerase zeta." Science 272(5268): 1646–9.
    • Nielsen, N.-P. V., Smedsgaard, J., und Frisvad, J. C. Full second-order chromatographic/spectrometric data matrices for automated sample identification and component analysis by non-data-reducing image analysis. Anal. Chem. 71, 727–735 (1999).
    • Nikolopoulos, C. Expert systems. Marcell Dekker, New York, 1997.
    • Oller, A. R. und Thilly, W. G. (1992) Mutational spectra in human B-cells, spontaneous, oxygen and hydrogen peroxide-inducedmutations at the hprt gene. J. Mol. Biol. 1993, 228, 813–826.
    • Orita, M.; Suzuki, Y.; Sekiya, T.; Hayashi, K. Rapid and sensitive detection of point mutations and DNA polymorphisms using the polymerase chain reaction. Genomics 1989, 5, 874–819.
    • Pennisi, E. Academic sequencers challenge Celera in a sprint to the finish. Science 1999, 283, 1822–1823.
    • Picoult-Newberg, L., Ideker, T. E., Pohl, M. G., Taylor, S. L., Donaldson, M. A., Nickerson, D. A., und Boyce-Jacino, M. Mining SNPs from EST databases. Genome Res. 9, 167–174 (1999).
    • Piggee, C. A.; Muth, J.; Carrilho, F.; Karger, B. L. Capillary electraphoresis for the detection of known point mutations by single-nucleotide primer extension and laser-induced fluorescence detection. J. Chromatogr. A 1997, 781, 367–375.
    • Plug, A. W., A. H. Peters, et al. (1997). "ATM and RPA in meiotic chromosome synapsis and recombination." Nat Genet 17(4): 457–61.
    • Powell, I. Design of a laser line expander. Appl. Optics 1987, 26, 3705–3709.
    • Pruitt, K. D. WebWise: guide to The Institute for Genomic Research web site. Genome Res. 8, 1000–1004 (1998).
    • Rasio D, Murakumo Y, Bobbins D, Roth T, Silver A, Negrini M, Schmidt C, Burczak J, Fishel R, Croce CM (1997). Characterization of the human homologue of rad54: A gene located on chromosome lp32 at a region of high loss of heterozygosity in breast tumors. Cancer res. 57: 2378–2383.
    • Rose, S. Genetic Microsystems, Persönliche Mitteilung.
    • Roux, K. H. Optimization and troubleshooting in PCR. PCR Methods Appl. 2995, 4, 185–294.
    • Ruiz-Martinez, M. C.; Berka, J.; Belenkii, A.; Foret, F.; Miller, A. W.; Karger, B. L. DNA Sequencing by Capillary Electrophoresis with Replaceable Linear Polyacrylamide and Laser-Induced Fluarescence Detection. Anal. Chem. 1993, 65, 2851–2858.
    • Ruiz-Martinez, M. C.; SalasSolano, O.; Carrilho, E.; Kotler, L.; Karger, B. L. A sample purification method for rugged and high-performance DNA sequencing by capillary electropharesis using replaceable polymer solutions. A. Development of the cleanup protocol. Anal. Chem. 1998, 70, 1516–1527.
    • Salas-Solano, O.; Carrilho, E.; Kotler, L.; Miller, A.; Goetzinger, W.; Sosic, Z.; Karger, B. L. Routine DNA Sequencing of 1000 Bases in Less than One Hour by Capillary Electrophoresis with Replaceable Linear Polyacrylamide Solutions. Anal. Chem. 1998, 70, 3996–4403.
    • Salas-Solano, O.; Ruiz-Martinez, M. C.; Carrilho, E.; Kotler, L.; Karger, B. L. A sample purification method for rugged and high performance DNA sequencing by capillary electrophoresis using replaceable polymer solutions. B. Quantitative determination of the role of sample matrix components on sequencing analysis. Anal. Chem. 1998, 70, 1528–1535.
    • Sancar, A. (1995). "DNA repair in humans." Annu Rev Genet 29: 69–105.
    • Sequenom Industrial Genomics: Products. Technology Overview; 1999; http://www.sequenom.com/tech/tech.html.
    • Shimkets, R. A.; Lowe, D. G.; Tai, J. T.; Sehl, P.; Jin, H.; Yang, R; Predki, P. F.; Rothberg, B. E.; Murtha, M. T.; Roth, M. E.; Shenoy, S. G.; Windemuth, A.; Simpson, J. W.; Simons, J. F.; Daley, M. P.; Gold, S. A.; McKenna, M. P.; Hillan, K.; Went, G. T.; Rothberg, J. M. Gene expression analysis by transcript profiling coupled to a gene database query. Nat. Biotechnol. 1999, 17, 798–843.
    • Shuber, A. P.; Michalowsky, L. A.; Nass, G. S.; Skoletsky, J.; Hire, L. M.; Kotsopoulos, S. K.; Phipps, M. F.; Barberio, D. M.; Klinger, K. W. High throughput parallel analysis of hundreds of patient samples for more than 100 mutations in multiple disease genes. Hum. Mol. Genet. 1997, 6, 337–347.
    • Sosic, Z.; Salas-Solano, O.; Zhou, H.; Miller, A. W.; Karger, B. L. A multicapillary array instrument with automated sample preparation for sequencing 1000 bases in less than one hour by capillary electrophoresis. In Vorbereitung, 1999.
    • Struelens, M. J.; De Gheldre, Y.; Deplano, A. Comparative and library epidemiological typing systems: outbreak investigations versus surveillance systems. Infect Control Hosp. Epidemiol. 1998, 19, 565–569.
    • Swagemakers, SMA, Essers, J, de Wit, J, Hoeijmakers, JHJ, Kanaar, R, (1998) The human rad54 recombinational DNA repair protein is a double-stranded DNA-dependent ATPase JBC 273: 28292–7.)
    • Swerdlow, H.; Jones, B. J.; Wittwer, C. T. Fully automated DNA reaction and analysis in a fluidic capillary instrument. Anal. Chem. 1997, 69, 848–855.
    • Taillon-Miller, P., Gu, Z., Li, Q., Hillier, L., und Kwok, P.-Y. Overlapping genomic sequences: a treasure trove of single-nucleotide polymorphisms. Genome Res. 8, 748–754 (1998).
    • Tormita-Mitchell, A.; Muniappan, B. P.; Henero-Jimenez, P.; Zarbl, H.; Thilly, W. G. Single nucleotide polymorphism spectra in newborns and centenarians: identification of genes coding for rise of mortal disease. Gene 1998, 223: 381–391.
    • Trulzsch, B.; Krohn, K.; Wonerow, P.; Paschke, R. DGGE is more sensitive for the detection of somatic point mutations than direct sequencing. Biotechniques 1999, 27, 265–268.
    • Ueno, K., und Yeung, E. S. Simultaneous monitoring of DNA fragments separated by electrophoresis in a multiplexed array of 100 capillaries. Anal. Chem. 66, 1424–1431 (1994).
    • Venter, J. C.; Adams, M. D.; Sutton, G. G.; Kerlavage, A. R; Smith, H. O.; Hunkapiller, M. Shotgun sequencing of the human genome. Science 1998, 280, 1401–1542.
    • Waga, S. and B. Stillman (1998). "The DNA replication fork in eukaryotic cells." Annu Rev Biochem 67: 721–51.
    • Xia, F., S. A. Amundson, J. A. Nickoloff und H. L. Liber. (1994) Different recombinational repair capacities in closely related human lymphoblastoid cell lines with different mutational responses to X-irradiation. Molec. Cell. Biol., 14: 5850–5857.
    • Yamamoto, M.; Kondo, I.; Ogawa, N.; Asanuma, M.; Yamashita, Y.; Mizuno, Y.: Genetic association between susceptibility to Parkinson's disease and alpha-1-antichymotrypsin polymorphism. Brain Res. 759: 153–155, 1997.
    • Yoon K. Cole-Strauss A. Kmiec EB. (1996). Targeted gene correction of episomal DNA in mammalian cells mediated by a chimeric RNA.DNA oligonucleotide. Proc. Natl. Acad. Sci. (USA) 93: 2071–6.
    • Yunis, I.; Salazar, M.; Yunis, E. J. HLA-DR generic typing by AFLP. Tissue Antigens 1991, 38, 78–88.
    • Yuzhakov, A., J. Turner, et al. (1996). "Replisome assembly reveals the basis for asymmetric function in leading and lagging strand replication." Cell 86(6): 877–86.
    • Zhong Q, Chen CF, Li S, Chen Y, Wang CC, Xiao J, Chen PL, Sharp ZD und Lee WH. (1999) Association of BRCA1 with the hRADS-hMre11-p95 complex and the DNA damage response. Science, 285: 747–50.
    • Zhou, H.; Miller, A. W.; Sosic, Z.; Barron, A. F.; Buchholz, B.; Kotler, L.; Karger, B. L. Anal, Chem., Eingereicht, 1999.
    • Zlotkin, T., G. Kaufmann, et al. (1996). "DMA polymerase epsilon may be dispensable for SV40- but not cellular- DNA replication." Embo J 15(9): 2298–305.
  • Während die vorliegende Erfindung insbesondere mit Bezug auf bevorzugte Ausführungsformen gezeigt und beschrieben wurde, wird es für den Fachmann offensichtlich sein, dass verschiedene Änderungen in Form und Einzelheiten hier durchgeführt werden können, ohne vom Umfang der Erfindung abzuweichen, der durch die beigefügten Patentansprüche angegeben ist.

Claims (2)

  1. Verfahren zur Identifizierung von Genen, welche ein Allel enthalten, das die Langlebigkeit erhöht, umfassend: (a) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden; (b) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von älteren Individuen gefunden werden, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechung der Summe der Häufigkeiten aller Punktmutationen, welche für jedes Gen oder Segment identifiziert werden; (c) Vergleich der summierten Häufigkeit der Punktmutationen, welche in einem ausgewählten Gen oder Genteilstück der jungen Population gefunden werden, wie in (a) berechnet, mit der summierten Häufigkeit der Punktmutationen, welche im gleichen Gen oder Genteilstück der älteren Population gefunden werden, wie in (b) berechnet, wobei eine signifikante Erhöhung der summierten Häufigkeit der Punktmutationen in der älteren Population anzeigt, dass das ausgewählte Gen ein Allel oder Allele enthält, welche die Langlebigkeit erhöhen.
  2. Verfahren zur Identifizierung von Genen, welche ein Allel enthalten, das die Langlebigkeit erhöht, oder welche an ein Gen gekoppelt sind, das Langlebigkeit erhöht, umfassend: (a) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von jungen Individuen gefunden werden, welche nicht von einer Krankheit betroffen sind, Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechnung der Summe der Häufigkeiten aller Punktmutationen, welche in jedem Gen oder Segment davon identifiziert werden; (b) Bestimmung der Punktmutationen, welche in den Genen oder Genteilstücken einer Population von Testpersonen gefunden werden, welche die Krankheit hat, und Bestimmung der Häufigkeiten, mit denen jede Punktmutation auftritt, und Berechung der Summe der Häufigkeiten aller Punktmutationen, welche in jedem Gen oder Segment davon identifiziert werden; (c) Vergleich der summierten Häufigkeit der Punktmutationen, welche in einem ausgewählten Gen oder Genteilstück der jungen Population identifiziert werden, wie in (a) bestimmt, mit der summierten Häufigkeit der Punktmutationen, welche in dem ausgewählten Gen der Population von Testpersonen gefunden werden, wie in (b) bestimmt, wobei eine signifikante Erhöhung der summierten Häufigkeit der Punktmutationen in der jungen Population anzeigt, dass das ausgewählte Gen ein Allel enthält, das Langlebigkeit erhöht, oder an ein Gen gekoppelt ist, welches Langlebigkeit erhöht.
DE69928688T 1998-12-09 1999-12-09 Verfahren zur identifizierung von punkt mutationen in einem genom Expired - Fee Related DE69928688T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11145798P 1998-12-09 1998-12-09
US111457P 1998-12-09
PCT/US1999/029379 WO2000034652A2 (en) 1998-12-09 1999-12-09 Methods of identifying point mutations in a genome

Publications (2)

Publication Number Publication Date
DE69928688D1 DE69928688D1 (de) 2006-01-05
DE69928688T2 true DE69928688T2 (de) 2006-08-24

Family

ID=22338669

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69928688T Expired - Fee Related DE69928688T2 (de) 1998-12-09 1999-12-09 Verfahren zur identifizierung von punkt mutationen in einem genom

Country Status (7)

Country Link
EP (1) EP1137811B1 (de)
JP (1) JP2002531147A (de)
AT (1) ATE311475T1 (de)
AU (1) AU3118600A (de)
CA (1) CA2354322A1 (de)
DE (1) DE69928688T2 (de)
WO (1) WO2000034652A2 (de)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6455692B1 (en) 1998-08-04 2002-09-24 Transgenomic, Inc. Method of concentrating polynucleotides using MIPC
US6994962B1 (en) 1998-12-09 2006-02-07 Massachusetts Institute Of Technology Methods of identifying point mutations in a genome
US7807447B1 (en) 2000-08-25 2010-10-05 Merck Sharp & Dohme Corp. Compositions and methods for exon profiling
US20020132244A1 (en) 2000-09-27 2002-09-19 Xiao-Cheng Li-Sucholeiki Methods for detecting rare polymorphic variants in genomic DNA sequences
JP2002153299A (ja) * 2000-11-22 2002-05-28 Sumikin Bioscience Kk ヒト補体活性化レクチンRaRFの構成成分MASP−1の遺伝子多型
ATE510025T1 (de) * 2005-12-13 2011-06-15 Inst Curie Verfahren für die detektion von mutationen in nukleinsaüren, und die anwendung in der diagnose von genetischen krankheiten und krebs
SI1996728T1 (sl) 2006-02-28 2011-10-28 Univ Louisville Res Found Prepoznavanje kromosomskih nenormalnosti pri zarodku s pomočjo dvojnih mononukleotidnih polimorfizmov
US8609338B2 (en) 2006-02-28 2013-12-17 University Of Louisville Research Foundation, Inc. Detecting fetal chromosomal abnormalities using tandem single nucleotide polymorphisms
US20100184044A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
US20150362491A1 (en) * 2013-01-14 2015-12-17 The General Hospital Corporation Methods and assays relating to rnf216
JP6700376B2 (ja) * 2015-07-29 2020-05-27 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 有意性が未知のバリアントに優先順位をつけるシステム及び方法
US11978535B2 (en) * 2017-02-01 2024-05-07 The Translational Genomics Research Institute Methods of detecting somatic and germline variants in impure tumors
CN114517223B (zh) * 2020-11-20 2023-09-12 福建和瑞基因科技有限公司 一种用于筛选snp位点的方法及其应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633129A (en) * 1989-07-13 1997-05-27 Massachusetts Institute Of Technology Electrophoretic detection and separation of mutant DNA using replaceable polymer matrices
US5045450A (en) * 1989-07-13 1991-09-03 Massachusetts Institute Of Technology Determination of a mutational spectrum

Also Published As

Publication number Publication date
AU3118600A (en) 2000-06-26
WO2000034652A8 (en) 2000-08-24
CA2354322A1 (en) 2000-06-15
EP1137811B1 (de) 2005-11-30
EP1137811A2 (de) 2001-10-04
ATE311475T1 (de) 2005-12-15
DE69928688D1 (de) 2006-01-05
WO2000034652A3 (en) 2000-11-09
JP2002531147A (ja) 2002-09-24
WO2000034652A2 (en) 2000-06-15

Similar Documents

Publication Publication Date Title
US6994962B1 (en) Methods of identifying point mutations in a genome
DE69432225T2 (de) Molekulare diagnose von familiärer adenomatöser polyposis
Khanna et al. Multiplex PCR/LDR for detection of K-ras mutations in primary colon tumors
Liu et al. Copy number gain at Xp22. 31 includes complex duplication rearrangements and recurrent triplications
Gille et al. Genomic deletions of MSH2 and MLH1 in colorectal cancer families detected by a novel mutation detection approach
Wen et al. Comparison of TP53 mutations identified by oligonucleotide microarray and conventional DNA sequence analysis
Ewald et al. Genomic rearrangements in BRCA1 and BRCA2: A literature review
DE69929542T2 (de) Komplexitätsmanagement und analyse genomischer dna
DE69928688T2 (de) Verfahren zur identifizierung von punkt mutationen in einem genom
Phylipsen et al. Fine‐tiling array CGH to improve diagnostics for α‐and β‐thalassemia rearrangements
DE60014067T2 (de) Zusammensetzungen und verfahren zur genetischen analyse
Vaughn et al. High-resolution melting analysis for detection of internal tandem duplications
Kashyap et al. DNA profiling technologies in forensic analysis
Svidnicki et al. Screening of genetic alterations related to non-syndromic hearing loss using MassARRAY iPLEX® technology
EP0869188A2 (de) Verfahren zum Nachweis von Mikrosatelliten-Instabilität zur Tumordiagnostik
Madel et al. TriXY—Homogeneous genetic sexing of highly degraded forensic samples including hair shafts
Goswami et al. An overview of molecular genetic diagnosis techniques
Tomita-Mitchell et al. Single nucleotide polymorphism spectra in newborns and centenarians: identification of genes coding for rise of mortal disease
Otto et al. The ‘flap’endonuclease gene FEN1 is excluded as a candidate gene implicated in the CAG repeat expansion underlying Huntington disease
US20200199648A1 (en) Easy one-step amplification and labeling (eosal)
White et al. Detecting copy number changes in genomic DNA: MAPH and MLPA
EP1798291A1 (de) Verfahren für die Detektion von Mutationen in Nukleinsaüre, und die Anwendung in Diagnose von genetischer Krankheit und Krebs
Kurzawski et al. DNA and RNA analyses in detection of genetic predisposition to cancer
Uehara et al. SNP array screening of cryptic genomic imbalances in 450 Japanese subjects with intellectual disability and multiple congenital anomalies previously negative for large rearrangements
Danielson et al. Separating human DNA mixtures using denaturing high-performance liquid chromatography

Legal Events

Date Code Title Description
8364 No opposition during term of opposition
8339 Ceased/non-payment of the annual fee