-
HINTERGRUND DER ERFINDUNG
-
Hereditäre (erbliche)
Hämochromatose
(HH) ist eine vererbte Störung
des Eisenmetabolismus, wobei der Körper einen Überschuss an Eisen akkumuliert.
In symptomatischen Individuen führt
dieser Überschuss an
Eisen zu schädlichen
Wirkungen, indem er in einer Reihe von Organen abgelagert wird,
was zu deren Versagen führt,
und in Zirrhose, Diabetes, Sterilität und anderen schweren Krankheiten
resultiert. Das Gen, welches bei dieser Erkrankung defekt ist, wurde
in
US 6,025,130 , veröffentlicht
am 15.02. 2000, offenbart.
-
Feinstrukturkartierung
der Region, der das für
HH verantwortliche Gen, HFE (in manchen Veröffentlichungen als HH oder
HFE bezeichnet), zugeordnet worden war, ermöglicht die Identifizierung
von Kandidatensequenzen, welche das HFE-Gen umfassen, zusammen mit
strukturellen Elementen zur Regulation und Expression, und benachbarte
Gene.
-
Für Feinstrukturkartierung
ist eine Reihe von Techniken verfügbar, umfassend direkte cDNA-Selektion, Exon-Trapping
und Sequenzierung genomischer Proben. Der Ansatz der direkten Selektion
(Lovett et al., Proc. Natl. Acad. Sci. USA 88:9628–9623 (1991))
umfasst die Hybridisierung von cDNA-Fragmenten an genomische DNA.
Diese Technik ist extrem empfindlich und ermöglicht, Abschnitte von seltenen
Transkripten zu isolieren. Bei Exon-Trapping (Church et al., Nature Genetics
6:98–105
(1994)) werden gespleißte
Introns von in vivo exprimierten genomischen DNA-Klonen gewonnen
und Kandidaten-Exons erzeugt, ohne dass irgendwelche Vorabkenntnisse
der Expression des Target-Gens erforderlich sind. Genomische DNA-Sequenzierung
mit hohem Durchsatz, mit Vergleich der Sequenzdaten mit Datenbanken
von exprimierten Sequenzen wurde ebenfalls verwendet, wie etwa bei
der positionellen Klonierung des Werner-Syndrom-Gens (Yu et al.,
Science 277:258–262
(1996)) und bei der Homologieklonierung des zweiten Alzheimer-Krankheit-Gens
auf Chromosom 1 (Levy-Lahad et al., Science 269:973–977 (1995)).
-
HH
wird typischerweise rezessiv vererbt; nach dem derzeitigen Wissensstand
sind Homozygote, die zwei defekte Kopien des Gens haben, am häufigsten
von der Erkrankung betroffen. Zusätzlich sind Heterozygote für das HFE-Gen
anfälliger
für sporadische
Porphyria cutanea tarda und potenziell für andere Störungen (Roberts et al., Lancet
349:321–323
(1997)). Es wird geschätzt,
dass annähernd
10–15%
der Kaukasier eine Kopie der HFE-Genmutation
aufweisen, und dass es in den Vereinigten Staaten etwa eine Million
Homozygote gibt. HH stellt somit eine der häufigsten genetischen Krankheitsmutationen
in kaukasischen Individuen dar. Obwohl HH letztlich Schwächesymptome
erzeugt, ist die Mehrheit der Homozygoten und Heterozygoten nicht diagnostiziert.
-
Der
Bedarf für
eine derartige Diagnostik ist dokumentiert, beispielsweise in Barton,
J.C. et al., Nature Medicine 2:394–395 (1996); Finch, C.A., West.
J. Med. 153:323–325
(1990); McCusick, V., Mendelian Inheritance in Man, Seiten 1882–1887, elfte
Ausgabe (Johns Hopkins University Press, Baltimore (1994)); Report
of a Joint World Health Organization/Hemochromatosis Foundation/French
Hemochromatosis Association Meeting an the Prevention and Control
of Hemochromatosis (1993); Edwards, C.Q. et al., New Engl. J. Med. 328:1616–1620 (1993);
Bacon, B.R., New Engl. J. Med. 326:126–127 (1992); Balan, V., et
al., Gastroenterology 107:453–459
(1994); Phatak, P.D., et al., Arch. Int. Med 154:769–776 (1994).
-
Eine
einzige Mutation im HFE-Gen, bezeichnet als 24d1 in der ebenfalls
anhängigen
U.S.S.N. 08/630,912 , ist
verantwortlich für
die Mehrzahl der Krankheit-verursachenden Chromosomen, welche heutzutage
in der Population vorhanden sind. Diese wird hierin als die "allgemeine" oder "anzestrale" oder "allgemeine anzestrale" Mutation bezeichnet.
Diese Begriffe werden untereinander austauschbar verwendet. Es scheint,
dass etwa 80% bis 90% aller HH-Patienten mindestens eine Kopie der
allgemeinen anzestralen Mutation haben, welche eng verknüpft ist
mit spezifischen Allelen bestimmter genetischer Marker nahe dieses
anzestralen HFE-Gendefekts.
Diese Marker sind, als eine erste Annäherung, in der allelischen
Form, in der sie zum Zeitpunkt, an dem die anzestrale HFE-Mutation
auftrat, vorlagen. Siehe beispielsweise Simon, M., et al., Am. J.
Hum. Genet. 41:89–05
(1987); Jazwinska, E.C., et al., Am. J. Hum. Genet. 53:242–257 (1993);
Jazwinska, E.C., et al., Am. J. Hum. Genet. 56:428–433 (1995);
Worwood, M., et al., Brit. J. Hematol. 86:863–866 (1994); Summers, K.M.,
et al., Am. J. Hum. Genet. 45:41–48 (1989).
-
Verschiedene
polymorphe Marker in der HFE-Region wurden beschrieben, und es wurde
gezeigt, dass sie Allele haben, die mit der HH-Erkrankung assoziiert
sind. Diese Marker umfassen die veröffentlichten Mikrosatellit-Marker
D6S258, D6S306 (Gyapay, G., et al., Nature Genetics 7:246–339 (1994)),
D6S265 (Worwood, M., et al., Brit. J. Hematol. 86:833–846 (1994)),
D6S105 (Jazwinska, E.C., et al., Am. J. Hum. Genet. 53:242–257 (1993));
Jazwinska, E.C., et al., Am. J. Hum. Genet. 56:428–433 (1995)),
D6S1001 (Stone, C., et al., Hum. Molec. Genet. 3:2043–2046 (1994)),
D6S1260 (Raha-Chowdhury et al., Hum. Molec. Genet. 4:1869–1874 (1995)),
sowie zusätzliche
Mikrosatelliten und Einzelnukleotid-Polymorphismus-Marker, welche in der
ebenfalls anhängigen
PCT-Anmeldung
WO 96/06583 offenbart
sind. Zusätzlich
offenbarte
U.S.S.N. 08/630,912 die
zusätzlichen
Marker 24d2 und 24d7.
-
Die
Symptome von HH sind oftmals denen von anderen Zuständen ähnlich,
und die schwerwiegenden Wirkungen der Erkrankung treten oftmals
nicht unmittelbar auf. Demgemäß wäre es wünschenswert,
ein Verfahren bereitzustellen, um Personen zu identifizieren, welche
veranlagt sein könnten,
symptomatisch zu werden, um rechtzeitig einzugreifen, um eine exzessive,
mit Überbeladung
an Eisen assoziierte Gewebeschädigung
zu verhindern. Ein Grund für
das Fehlen einer Frühdiagnose
ist die Unzulänglichkeit
der derzeit verfügbaren
Diagnoseverfahren, festzustellen welche Individuen dem Risiko ausgesetzt
sind, insbesondere während derartige
Individuen vorsymptomatisch sind.
-
Obwohl
Bluteisenparameter als ein Werkzeug zum Screening verwendet werden
können,
verwendet eine bestätigte
Diagnose oftmals eine Leberbiopsie, die unerwünscht invasiv und teuer ist,
und ein Mortalitätsrisiko
beinhaltet. Somit besteht ein klarer Bedarf für die Entwicklung eines kostengünstigen
und nicht-invasiven Diagnosetests für die Detektion von Homozygoten
und Heterozygoten, um eine Diagnose bei symptomatischen Individuen
zu erleichtern, um eine vorsymptomatische Detektion bereitzustellen,
um ein Eingreifen zur Verhinderung von Organschädigung zu lenken, und zur Identifizierung
von heterozygoten Trägern.
-
Weiterhin
besteht ein Bedarf sowohl für
Verfahren zur Feinstrukturkartierung als auch für eine Feinstrukturkarte der
Region des Chromosoms, welcher der HH-Lokus zugeordnet wurde. Diese
und andere Bedürfnisse
werden von der vorliegenden Erfindung angegangen.
-
ZUSAMMENFASSUNG DER ERFINDUNG
-
Ein
Aspekt der Erfindung ist ein Oligonukleotid, welches aus mindestens
8 bis ungefähr
100 aufeinander folgenden Basen aus der Sequenz der SEQ ID NO: 21
oder deren Komplement besteht, einschließlich der polymorphen Stelle
(site) an der Base 35935 der SEQ ID NO: 21 ("polymorphe Stelle C182.1G7").
-
Ein
weiterer Aspekt der Erfindung ist ein Oligonukleotidpaar, welches
aus SEQ ID NO: 40 und SEQ ID NO: 41 besteht, zur Amplifikation einer
Nukleinsäuresequenz
aus SEQ ID NO: 21 oder deren Komplement, welche die polymorphe Stelle
an der Base 35935 der SEQ ID NO: 21 ("polymorphe Stelle C182.1G7") enthält.
-
Ein
weiterer Aspekt der Erfindung ist ein in vitro Verfahren zur Bestimmung
der Anwesenheit oder Abwesenheit der allgemeinen Genmutation der
hereditären
Hämochromatose
(HFE) in einer Probe von DNA oder RNA, welches umfasst:
Untersuchung
der DNA oder RNA auf Anwesenheit oder Abwesenheit eines Haplotyps,
welcher das Allel der SEQ ID NO: 21 oder deren Komplement an der
polymorphen Stelle an der Base 35935 der SEQ ID NO: 21 ("polymorphe Stelle
C182.1G7") enthält,
wobei
die Abwesenheit des Haplotyps die wahrscheinliche Abwesenheit der
HFE-Mutation im Genom anzeigt, aus welchem die Probe erhalten worden
ist, und die Anwesenheit des Haplotyps die wahrscheinliche Anwesenheit
der HFE-Genmutation im Genom anzeigt, aus welchem die Probe erhalten
worden ist.
-
Ein
weiterer Aspekt der Erfindung ist ein in vitro Verfahren zur Bestimmung
der Anwesenheit oder Abwesenheit der allgemeinen Genmutation der
hereditären
Hämochromatose
(HFE) in einer Probe von DNA oder RNA, welches umfasst:
Untersuchung
der DNA oder RNA auf Anwesenheit oder Abwesenheit eines G-Genotyps
an der polymorphen Stelle an der Base 35935 der SEQ ID NO: 21 ("polymorphe Stelle
C182.1G7") oder
eines C-Gentyps an der komplementären Stelle,
wobei die
Abwesenheit des C- oder G-Genotyps an der polymorphen Stelle C182.1G7
die wahrscheinliche Abwesenheit der HFE-Genmutation im Genom anzeigt,
aus welchem die Probe erhalten worden ist, und die Anwesenheit des
C- oder G-Genotyps an der polymorphen Stelle C182.1G7 die wahrscheinliche
Anwesenheit der HFE-Genmutation im Genom anzeigt, aus welchem die
Probe erhalten worden ist.
-
KURZE BESCHREIBUNG DER ZEICHNUNGEN
-
1 zeigt
eine Kombination einer genetischen, physikalischen und transkriptionellen
Karte der HFE-Genregion. Die erste Linie zeigt die relativen Positionen
ausgewählter
genetischer Marker, welche die HFE-Region definieren. Der fette
Balken darunter stellt den YAC-Klon der, der beim direkten Selektionsexperiment
verwendet worden war. Die Anordnung und die Positionen der Bakterienklone,
die beim Exon-Trapping und der Probensequenzierung verwendet wurden,
sind unterhalb des YAC angegeben. Der dünne Balken unter den Bakterienklonen
stellt die annähernden
Positionen einer Untergruppe der exprimierten, dem Contig zugeordneten
Sequenzfragmente dar. Die dickeren Balken zeigen die Position der
klonierten cDNA. Zwei Regionen sind mittels Klammern zusammengefasst:
die Butyrophilin-Genfamilie
(BTF), und die Region, in der eine vollständige genomische Sequenzierung
durchgeführt
wurde.
-
2 ist
eine schematische Darstellung der 250 kb genomischen Sequenz, welche
das HFE-Gen beinhaltet.
Sowohl die Struktur der gesamten cDNA (oben) als auch die, welche
den kodierenden Regionen entspricht (unten), sowie die Richtung
der Transkription sind gezeigt. Die Positionen der Histon-Gene,
des Zink-α2-Glykoprotei-Pseudogens
und der EST sind ebenfalls gezeigt.
-
3 zeigt
ein Alignment der vorhergesagten Aminosäuresequenz der BTF-Proteine,
Sequenzen wurde paarweise ausgerichtet, unter Verwendung von CLUSTAL
W (Thompson et al., Nucleic Acids Res. 22:4673–4680) um die ökonomischste
Anordnung abzuleiten. Die Sterne unter dem Alignment stellen Aminosäuren dar,
die bei allen 6 Proteinen konserviert sind; die "Punkte" stellen konservierte Aminosäureaustausche dar.
Eingerahmt sind die Regionen innerhalb der Proteine, welche drei
konservierten Motiven entsprechen: 1) die B-G Domäne, 2) die
Transmembrandomäne
(TM), und 3) die B30-2 Exondomäne.
-
4, Abbildung (A), zeigt eine Northern
Blot Analyse von repräsentativen
Mitgliedern der zwei Gruppen von BTF-Proteinen, BTF1 und BTF5. BTF1
hybridisierte an alle Gewebe auf dem Blot als ein Haupttranskript
von 2,9 kb und ein Nebentranskript von 5,0 kb. BTF5 hybridisierte
an verschiedene Transkripte im Bereich zwischen 4,0 und 3,1 kb und
zeigte ein ähnliches
Expressionsprofil wie BTF1. Autoradiographie erfolgte wahrend 24
Stunden. Die Hybridisierung von β-Actin
zeigte die Variation an poly(A)+-RNA zwischen den Bahnen. Autoradiographie
erfolgte während
1 Stunde. In Abbildung (B) zeigt RT-PCR Analyse, dass die Expression
beider Gene breit verteilt war. In der Bahn (+) sind cDNA 21 und
44 als positive Kontrollen aufgenommen; die Bahn (–) stellt
die Kontrolle ohne DNA dar. Amplifikation unter Verwendung von Primern
für das
RFP-Gen (Isomura et al., Nucleic Acids Res. 20:5305–5310 (1992))
kontrollierte die Integrität
der cDNA. Alle Erststrang-cDNA wurden auf kontaminierende Amplifikation
von genomischer DNA überprüft, indem
ein identisches Experiment ohne die reverse Transkriptase durchgeführt wurde.
In allen Fällen
wurde keine Amplifikation erhalten (Daten nicht gezeigt).
-
5(A) zeigt ein Alignment der vorhergesagten
Aminosäuresequenz
des RoRet-Gens mit dem 52 kD Ro/SSA Autoantigen-Protein. Die Sterne
unter dem Alignment stellen konservierte Aminosäuren dar; die "Punkte" stellen konservierte
Aminosäureaustausche
dar. Die mutmaßliche
DNA-bindende Cystein-reiche Domäne
und die B30-2 Exondomäne
sind eingerahmt. 5(B) zeigt ein Alignment
der vorhergesagten Aminosäuresequenz
der zwei neuen mutmaßlichen
Natriumphosphat-Transportproteine mit der von NPT1.
-
6, Abbildung (A), zeigt eine Northern
Blot Analyse des RoRet-Gens. Die RoRet-cDNA hybridisierte an 4 unterschiedliche
Transkripte in einem Bereich von 7,1 bis 2,2 kb. Autoradiographie
wurde während
4 Tagen durchgeführt.
Die erneute Hybridisierung des Blots mit einer β-Actin-Sonde zeigte die Variation
an poly(A)+-RNA zwischen den Bahnen. Autoradiographie erfolgte während 1
Stunde. Abbildung (B) zeigt eine RT-PCR Analyse des RoRet-Gens.
In der Bahn (+) befand sich cDNA 27 als positive Kontrolle. Schwache
Amplifikation der korrekten Größe wurde
im Dünndarm,
in der Niere und Leber beobachtet. Die anderen Gewebe sowie die
Kontrollbahn (–)
ohne DNA waren negativ. Die RFP-Primer zeigten die Integrität der cDNA.
Abbildung (C) zeigt eine Northern Blot Analyse von NPT3 und NPT4.
NPT3 wurde in Herz und Muskel in einer sehr großen Menge als ein einziges
7,2 kb Transkript exprimiert. In den anderen Geweben wurden geringere
Mengen gefunden. Das Expressionsmuster von NPT4 war stärker eingeschränkt, es
wurde lediglich in der Leber und der Niere als eine verschmierte
Bande von Transkripten im Bereich von 2,6 bis 1,7 kb gefunden. Abbildung (D)
zeigt eine RT-PCR Analyse der Gene NPT3 und NPT4. In der Bahn (+)
waren die entsprechenden cDNA 22E und 22B als positive Kontrollen
aufgenommen. Das NPT3-Gen wurde in Niere, Leber, Milz und Hoden
als ein PCR-Fragment der richtigen Größe exprimiert. Ein kleineres
Fragment wurde in allen Geweben mit Ausnahme der Leber nachgewiesen.
Die Kontrollbahn (–)
ohne DNA war negativ. NPT4 wurde in Dünndarm, Niere, Leber und Hoden
als ein PCR-Fragment der richtigen Größe exprimiert. Größere und
kleinere Fragmente wurde in allen anderen Geweben mit Ausnahme des
Hirns gefunden. Für
beide Gene können
diese Fragmente unterschiedlicher Größe alternative Spleißvorgänge anzeigen.
Die Kontrollbahn (–)
ohne DNA war negativ. Die RFP-Primer zeigten die Integrität der cDNA.
-
7 zeigt
die Sequenzen von cDNA 21 (BTF1), cDNA 29 (BTF3), cDNA 23 (BTF4),
cDNA 44 (BTF5), cDNA 32 (BTF2), cDNA 27 (RoRet), cDNA 22B (NPT3),
cDNA 22E (NPT4).
-
8 zeigt
die Nukleotidsequenz von annähernd
235 kb in der HFE-Subregion eines nicht betroffenen Individuums.
-
9 zeigt
die Nukleotidsequenz von annähernd
235 kb in der HFE-Subregion eines von HH betroffenen Individuums.
Polymorphe Stellen bei dem von HH betroffenen Individuum, bestimmt
durch Vergleich mit einer Sequenz der entsprechenden Region von
einem nicht durch HH betroffenen Individuum, sind in Tabelle 1 aufgelistet
und beschrieben.
-
AUSFÜHRLICHE BESCHREIBUNG
-
A. Definitionen
-
Abkürzungen
für die
zwanzig natürlich
vorkommenden Aminosäuren
erfolgen nach dem herkömmlichen
Gebrauch. In der hierin verwendeten Polypeptidnotation ist die linke
Richtung die aminoterminale Richtung und die rechte Richtung ist
die carboxyterminale Richtung, in Übereinstimmung mit Standardgebrauch und
Konvention. In ähnlicher
Weise ist, wenn nicht anders angegeben, das linke Ende von einzelsträngigen Polynukleotidsequenzen das
5'-Ende; die linke
Richtung von doppelsträngigen
Polynukleotidsequenzen wird als die 5'-Richtung
bezeichnet. Die Richtung der Hinzufügung von 5' nach 3' von neu entstehenden RNA-Transkripten
wird als die Transkriptionsrichtung bezeichnet; Sequenzregionen
auf dem DNA-Strang mit der gleichen Sequenz wie die RNA, und die
5' vom 5'-Ende des RNA-Transkripts gelegen
sind, werden als "stromaufwärtige Sequenzen" bezeichnet; Sequenzregionen
auf dem DNA-Strang mit der gleichen Sequenz wie die RNA, und die
3' vom 3'-Ende des RNA-Transkripts
gelegen sind, werden als "stromabwärtige Sequenzen" bezeichnet.
-
Der
Begriff "Nukleinsäuren", wie hierin verwendet,
bezeichnet sowohl DNA als auch RNA. "Nukleinsäuresequenz" oder "Polynukleotidsequenz" bezeichnet ein einzel- oder doppelsträngiges Polymer
aus Desoxyribonukleotid- oder Ribonukleotidbasen, gelesen vom 5'- zum 3'-Ende. Er umfasst
sowohl selbstreplizierende Plasmide, infektiöse Polymere von DNA oder RNA
und nicht-funktionelle DNA oder RNA. Es wird verstanden, dass das
Komplement einer erfindungsgemäßen Nukleinsäuresequenz
von der Definition dieser Sequenz umfasst ist.
-
"Nukleinsäuresonden" können DNA-
oder RNA-Fragmente sein. DNA-Fragmente können beispielsweise hergestellt
werden durch Verdau von Plasmid-DNA oder unter Verwendung von PCR,
oder synthetisiert werden, entweder durch das von Beaucage und Carruthers
beschriebene Phosphoramidit-Verfahren, Tetrahedron Lett. 22:1859–1862 (1981),
oder durch das Triester-Verfahren gemäß Matteucci et al., J. Am.
Chem. Soc. 103:3185 (1981). Falls gewünscht, kann danach ein doppelsträngiges Fragment
erhalten werden durch Annealing der chemisch synthetisierten Einzelstränge aneinander
unter geeigneten Bedingungen, oder durch Synthetisieren des komplementären Strangs
unter Verwendung von DNA-Polymerase mit einer geeigneten Primersequenz.
Es wird verstanden, dass wenn eine spezifische Sequenz für eine Nukleinsäuresonde
angegeben ist, der komplementäre
Strang ebenfalls identifiziert und umfasst ist. Der komplementäre Strang
funktioniert in Situationen, bei denen das Target eine doppelsträngige Nukleinsäure ist,
genauso gut.
-
Der
Ausdruck "hybridisiert
selektiv an" bezeichnet
eine Nukleinsäuresonde,
die an eine besondere Target DNA- oder RNA-Sequenz hybridisiert,
mit dieser einen Doppelstrang bildet oder an diese bindet, wenn die
Targetsequenzen in einer Präparation
von gesamter zellulärer DNA
oder RNA vorhanden sind. "Komplementäre" oder "Target" Nukleinsäuresequenzen
bezeichnen diejenigen Nukleinsäuresequenzen,
die selektiv an eine Nukleinsäuresonde
hybridisieren. Geeignete Annealingbedingungen hängen beispielsweise von der Länge einer
Sonde, der Basenzusammensetzung und der Anzahl von Fehlpaarungen
(mismatch) und deren Position auf der Sonde ab, und müssen oftmals
empirisch bestimmt werden. Hinsichtlich Diskussionen für die Konstruktion
von Nukleinsäuresonden
und Annealingbedingungen, siehe beispielsweise Sambrook et al.,
Molecular Cloning: A Laboratory Manual (2. Auflage), Bände 1–3, Cold
Spring Harbor Laboratory (1989), oder Current Protocolls in Molecular
Biology, Hrsg. F. Ausubel et al., Greene Publishing und Wiley-Interscience, New
York (1987).
-
Der
Ausdruck "Nukleinsäuresequenz,
welche kodiert für" bezeichnet eine
Nukleinsäure,
welche die Expression eines spezifischen Proteins oder Peptids dirigiert.
Die Nukleinsäuresequenzen
umfassen sowohl die Sequenz des DNA-Strangs, der zu RNA transkribiert
wird, als auch die RNA-Sequenz, die zu Protein translatiert wird.
Die Nukleinsäuresequenzen
umfassen sowohl die Volllänge-Nukleinsäuresequenzen
sowie die nicht-Volllänge-Sequenzen,
abgeleitet vom Volllänge-Protein.
Des Weiteren wird verstanden, dass die Sequenz die degenerierten
Kodons der nativen Sequenz umfasst, oder Sequenzen, welche eingeführt werden können um
Kodonpräferenz
in einer spezifischen Wirtszelle bereitzustellen.
-
Der
Ausdruck "isoliert" oder "im Wesentlichen rein" bezeichnet Nukleinsäurepräparationen,
denen mindestens ein Protein oder mindestens eine Nukleinsäure fehlt,
das bzw. die normalerweise mit der Nukleinsäure in einer Wirtszelle assoziiert
ist.
-
Der
Ausdruck "Expressionskassette" bezeichnet Nukleotidsequenzen,
welche fähig
sind, die Expression eines Strukturgens in Wirten, die mit derartigen
Sequenzen kompatibel sind, zu beeinflussen. Derartige Kassetten
umfassen mindestens Promotoren und gegebenenfalls Transkriptionsterminationssignale.
Zusätzliche
Faktoren, welche notwendig oder nützlich sind um eine Expression
zu bewirken, können
ebenfalls verwendet werden, wie hierin beschrieben.
-
Der
Begriff "operativ
verknüpft", wie hierin verwendet,
bezeichnet eine Verknüpfung
eines Promotors stromaufwärts
einer DNA-Sequenz derart, so dass der Promotor Transkription der
DNA-Sequenz vermittelt.
-
Der
Begriff "Vektor" bezeichnet virale
Expressionssysteme, autonom selbst-replizierende zirkuläre DNA (Plasmide),
und umfasst sowohl Expressionsplasmide als auch nicht-Expressionsplasmide.
Wenn beschrieben ist, dass ein rekombinanter Mikroorganismus oder
eine Zellkultur einen "Expressionsvektor" beherbergt, umfasst
dies sowohl extrachromosomale zirkuläre DNA als auch DNA, welche
in ein oder mehrere Chromosomen des Wirts eingebaut wurde. Wenn
ein Vektor von einer Wirtszelle beibehalten wird, kann der Vektor entweder
von den Zellen während
der Mitose als eine autonome Struktur stabil repliziert werden,
oder er ist in das Genom des Wirts eingebaut.
-
Der
Begriff "Gen", wie hierin verwendet,
soll eine Nukleinsäuresequenz
bezeichnen, die für
ein Polypeptid kodiert. Diese Definition umfasst verschiedene Sequenzpolymorphismen,
Mutationen und/oder Sequenzvarianten, wobei derartige Änderungen
die Funktion des Genprodukts nicht beeinflussen. Der Begriff "Gen" soll nicht nur kodierende
Sequenzen umfassen, sondern auch regulatorische Regionen, wie etwa
Promotoren, Enhancer und Terminationsregionen. Der Begriff umfasst
des Weiteren alle Introns und anderen DNA-Sequenzen, welche aus dem mRNA-Transkript
heraus gespleißt
werden, zusammen mit Varianten, die aus alternativen Spleißstellen
resultieren.
-
Der
Begriff "Plasmid" bezeichnet ein autonomes,
zirkuläres
DNA-Molekül,
das zur Replikation in einer Zelle fähig ist, und umfasst sowohl
die Expressions- als auch die nicht-Expressionstypen. Wenn beschrieben ist,
dass ein rekombinanter Mikroorganismus oder eine Zellkultur ein "Expressionsplasmid" beherbergt, umfasst
dies sowohl extrachromosomale zirkuläre DNA-Moleküle als auch
DNA, welche in ein oder mehrere Chromosomen des Wirts eingebaut
wurde. Wenn ein Plasmid von einer Wirtszelle beibehalten wird, kann
das Plasmid entweder von den Zellen während der Mitose als eine autonome
Struktur stabil repliziert werden, oder es ist in das Genom des
Wirts eingebaut.
-
Der
Begriff "rekombinates
Protein" oder "rekombinant erzeugtes
Protein" bezeichnet
ein Peptid oder Protein, das erzeugt worden ist unter Verwendung
von nicht nativen Zellen, die keine endogene, zur Expression des
Proteins fähige
DNA-Kopie aufweisen. Die Zellen produzieren das Protein, weil sie
durch die Einbringung der entsprechenden Nukleinsäuresequenz
gentechnisch verändert
worden sind. Das rekombinante Protein wird nicht in Assoziation
mit Protein und anderen subzellulären Komponenten gefunden, mit
denen es normalerweise, in den Zellen, welche das Protein exprimieren,
assoziiert ist. Die Begriffe "Protein" und "Polypeptid" werden hierin untereinander
austauschbar verwendet.
-
Die
nachfolgenden Begriffe werden verwendet um die Sequenzbeziehungen
zwischen zwei oder mehr Nukleinsäuren
oder Polynukleotiden zu beschreiben: "Referenzsequenz", "Vergleichsfenster", "Sequenzidentität", "prozentuale Sequenzidenität" und "wesentliche Identität". Eine "Referenzsequenz" ist eine definierte
Sequenz, welche als Basis für
einen Sequenzvergleich verwendet wird; eine Referenzsequenz kann
ein Teil einer größeren Sequenz
sein, beispielsweise als ein Abschnitt einer Volllänge-cDNA
oder einer in einem Sequenzprotokoll angegebenen Gensequenz, oder
sie kann eine vollständige
cDNA oder Gensequenz umfassen.
-
Ein
optimales Alignment von Sequenzen zum Ausrichten eines Vergleichsfensters
kann beispielsweise durchgeführt
werden mit dem lokalen Homologie-Algorithmus von Smith und Waterman,
Adv. Appl. Math. 2:482 (1981), mit dem Homologie-Alignment-Algorithmus
von Needleman und Wunsch, J. Mol. Biol. 48:443 (1970), mit dem Ähnlichkeitssuche-Verfahren
von Pearson und Lipman, Proc. Natl. Acad. Sci. USA 85:2444 (1988),
oder mit Computerprogrammen dieser Algorithmen (beispielsweise GAP,
BESTFIT, FASTA und TFASTA in dem Wisconsin Genetics Software Package
Release 7.0, Genetics Computer Group, 575 Science Dr., Madison,
WI).
-
Die
Begriffe "wesentliche
Identität" (bzw. "im Wesentlich identisch") oder "wesentliche Sequenzidentität", wie auf Nukleinsäuresequenzen
angewendet und wie hierin verwendet, bezeichnen eine charakteristische Eigenschaft
einer Polynukleotidsequenz, wobei das Polynukleotid eine Sequenz
umfasst, die im Vergleich zu einer Referenzsequenz über ein
Vergleichsfenster von mindestens 20 Nukleotidpositionen, häufig über ein Fenster
von mindestens 25–50
Nukleotiden, eines Sequenzidentität von mindestens 85 Prozent,
bevorzugt eine Sequenzidentität
von mindestens 90 bis 95 Prozent aufweist, wobei der Prozentanteil
der Sequenzidentität
berechnet wird durch Vergleichen der Referenzsequenz mit der Polynukleotidsequenz,
welche Deletionen oder Additionen umfassen kann, die insgesamt 20
Prozent oder weniger der Referenzsequenz über das Vergleichsfenster ausmachen
können.
Die Referenzsequenz kann ein Teil einer größeren Sequenz sein.
-
Wie
auf Polypeptide angewandt bedeuten die Begriffe "wesentliche Identität" (bzw. "im Wesentlich identisch") oder "wesentliche Sequenzidentität", dass zwei Peptidsequenzen,
in einem optimalen Alignment, wie etwa mit den Programmen GAP oder
BESTFIT unter Verwendung von Standardgewichtungen für Lücken (default
dap weights), eine Sequenzidentität von mindestens 80 Prozent,
bevorzugt eine Sequenzidentität
von mindestens 90 Prozent, stärker
bevorzugt eine Sequenzidentität
von mindestens 95 Prozent oder darüber zeigen. "Prozentuale Aminosäureidentität" oder "prozentuale Aminosäuresequenzidentität" bezeichnen einen Vergleich
der Aminosäuren
von zwei Polypeptiden, die in einem optimalen Alignment annähernd den
angegebenen Prozentanteil der gleichen Aminosäuren aufweisen. "95% Aminosäureidentität" bezeichnet beispielsweise
einen Vergleich der Aminosäuren
von zwei Polypeptiden, die in einem optimalen Alignment eine Aminosäureidentität von 95%
aufweisen. Bevorzugt unterscheiden sich Aminosäurepositionen, die nicht identisch sind,
durch konservative Aminosäureaustausche.
Es ist nicht wahrscheinlich, dass beispielsweise der Austausch von
Aminosäuren
mit ähnlichen
chemischen Eigenschaften wie etwa Ladung oder Polarität die Eigenschaften
eines Proteins verändert.
Beispiele umfassen Glutamin gegen Asparagin oder Glutaminsäure gegen Asparaginsäure.
-
Der
Ausdruck "im Wesentlichen
gereinigt" oder "isoliert" bedeutet, wenn er
sich auf ein Peptid oder Protein bezieht, eine chemische Zusammensetzung,
die im Wesentlichen frei von anderen zellulären Komponenten ist. Sie liegt
bevorzugt in einem homogenen Zustand vor, obwohl sie sowohl in trockenem
Zustand als auch als eine wässrige
Lösung
vorliegen kann. Reinheit und Homogenität werden typischerweise bestimmt
unter Verwendung von chemischen Analysetechniken wie etwa Polyacrylamid-Gelelektrophorese
oder Hochleistungs-Flüssigkeitschromatographie.
Ein Protein, das die in einer Präparation
vorwiegende Spezies ist, ist im Wesentlichen gereinigt. Im Allgemeinen
wird ein im Wesentlichen gereinigtes oder isoliertes Protein mehr
als 80% aller in einer Präparation
vorhandenen makromolekularen Spezies ausmachen. Bevorzugt ist das
Protein gereinigt, so dass es mehr als 90% aller vorhandenen makromolekularen
Spezies ausmacht. Stärker
bevorzugt ist das Protein zu mehr als 95% gereinigt, und am meisten
bevorzugt ist das Protein im Wesentlichen zu Homogenität gereinigt,
wobei andere makromolekulare Spezies durch herkömmliche Techniken nicht nachgewiesen
werden.
-
Der
Ausdruck "bindet
spezifisch an einen Antikörper" oder "spezifisch immunreaktiv
mit" bezeichnet, wenn
er sich auf ein Protein oder Peptid bezieht, eine Bindereaktion,
welche determinativ für
die Anwesenheit des Proteins in der Anwesenheit einer heterologen
Population von Proteinen und anderen biologischen Substanzen ist.
Somit binden die spezifizierten Antikörper unter bezeichneten Immunassay-Bedingungen
an ein besonderes Protein und binden nicht in signifikantem Ausmaß an andere,
in der Probe vorhandene Proteine. Spezifische Bindung an einen Antikörper unter
derartigen Bedingungen kann erfordern, dass ein Antikörper hinsichtlich
seiner Spezifität
für ein
besonderes Protein selektiert wird. Eine Reihe von Immunassay-Formaten können verwendet
werden, um Antikörper
zu selektieren, die für
ein besonderes Protein spezifisch immunreaktiv sind. Beispielsweise
werden Festphase-ELISA-Immunassays routinemäßig verwendet, um monoklonale Antikörper zu
selektieren, die für
ein Protein spezifisch immunreaktiv sind. Siehe Harlow und Lane
(1988), Antibodies, a Laboratory Manual, Cold Spring Harbor Publications,
New York, für
eine Beschreibung von Immunassay-Formaten und Bedingungen, die verwendet
werden können,
um spezifische Immunreaktivität
zu bestimmen.
-
Wie
hierin verwendet, bedeutet "EST" (expressed sequence
tag) oder "exprimierter
Sequenzmarker" eine
partielle DNA- oder cDNA-Sequenz von etwa 150 bis 500, stärker bevorzugt
etwa 300 aufeinander folgenden Nukleotiden einer längeren Sequenz,
erhalten aus einer genomischen Bibliothek oder cDNA-Bibliothek,
welche aus einer ausgewählten
Zelle, einem ausgewählten
Zelltyp, Gewebe oder Gewebetyp oder ausgewählten Organismen hergestellt
wurde, wobei die längere
Sequenz einer mRNA oder einem Gen entspricht, die bzw. das in dieser
Bibliothek gefunden wird. Ein EST ist im Allgemeinen DNA. Eine oder
mehrere Bibliotheken, hergestellt aus einem einzigen Gewebetyp,
stellen typischerweise mindestens 3000 unterschiedliche (d.h. einzigartige)
EST bereit, und potenziell den vollständigen Satz aller möglichen
EST, der alle möglichen cDNA
darstellt, z.B. 50.000–100.000
in einem Tier wie etwa einem Menschen (siehe beispielsweise Adams
et al., Science 252:1651–1656
(1991)).
-
"Stringent", wie hierin verwendet,
bezeichnet Hybridisierungs- und Waschbedingungen von 50% Formamid
bei 42°C.
Andere stringente Hybridisierungsbedingungen können ebenfalls ausgewählt werden.
Im Allgemeinen werden stringente Bedingungen derart ausgewählt, so
dass sie in etwa 5°C
niedriger liegen als der thermische Schmelzpunkt (Tm) für die spezifische
Sequenz bei einer definierten Ionenstärke und einem definierten pH-Wert.
Die Tm ist die Temperatur (bei definierter Ionenstärke und
definiertem pH-Wert), bei der 50% der Targetsequenz an eine perfekt
passende Sonde hybridisieren. Stringente Bedingungen werden typischerweise
diejenigen sein, bei denen die Salzkonzentration mindestens etwa
0,02 molar bei pH 7 beträgt
und die Temperatur mindestens etwa 60°C beträgt. Da andere Faktoren die
Stringenz einer Hybridisierung signifikant beeinflussen können, umfassend
unter anderem die Basenzusammensetzung und die Größe der komplementären Stränge, die
Anwesenheit von organischen Lösungsmitteln,
und das Ausmaß der
nicht zusammenpassenden Basen, ist die Kombination der Parameter
wichtiger als die absolute Messung von einem beliebigen davon.
-
B. Transkriptkarte und neue Gene in Nähe von HH
-
Die
vorliegende Erfindung stellt eine Feinstrukturkarte der 1 Megabasen-Region
bereit, welche das HFE-Gen umgibt. Als Teil dieser Karte stellt
die vorliegende Erfindung annähernd
250 kb DNA-Sequenz bereit, wovon etwa 235 kb in 8 bereitgestellt
sind, und acht besonders interessante Loci, entsprechend Kandidatengenen
innerhalb der 1 Megabasen-Region.
Diese Loci sind nützlich
als genetische und physikalische Marker für weitere Kartierungsstudien.
Zusätzlich
sind die acht cDNA-Sequenzen, welche diesen Loci entsprechen, nützlich,
beispielsweise für
die Isolierung anderer Gene in mutmaßlichen Genfamilien, die Identifizierung von
Homologa aus anderen Spezies, und als Sonden für diagnostische Assays. Insbesondere
sind isolierte Nukleinsäuresequenzen
von mindestens 18 Nukleotiden, die im Wesentlichen identisch sind
zu aufeinander folgenden Nukleotiden einer cDNA der Erfindung, nützlich als
PCR-Primer. Typischerweise wird der PCR-Primer als ein Bestandteil
eines Primerpaars in einer PCR-Reaktion verwendet. Isolierte Nukleinsäuresequenzen, die
bevorzugt etwa 18–100
Nukleotide, stärker
bevorzugt mindestens 18 Nukleotide umfassen, im Wesentlichen identisch
zu aufeinander folgenden Nukleotiden einer cDNA der Erfindung, sind
nützlich
für die
Konstruktion von PCR-Primern und Sonden für Hybridisierungsassays. Zusätzlich sind
die von diesen cDNA kodierten Proteine nützlich für die Erzeugung von Antikörpern, zur
Analyse von Genexpression und in diagnostischen Assays, und für die Reinigung
von verwandten Proteinen.
-
Eine
235 kb Sequenz für
die HFE-Subregion innerhalb der kartierten Region von 1 Megabase
ist bereitgestellt. Diese Sequenz kann als eine Referenz bei der
genetischen oder physikalischen Analyse von Deletionen, Substitutionen
und Insertionen in dieser Region dienen. Zusätzlich stellt die Sequenzinformation
eine Quelle für
die weitere Identifizierung von neuen Genen in dieser Region bereit.
-
C. Polymorphe Marker
-
397
Polymorphe Stellen wurden in der Region des HFE-Gens identifiziert.
Diese Polymorphismen sind in Tabelle 1 aufgelistet. Wie nachstehend
beschrieben, wurden diese Polymorphismen identifiziert durch Vergleich
der DNA-Sequenz eines betroffenen Individuums, das für die allgemeine
anzestrale HH-Mutation homozygot ist, mit der eines nicht betroffenen
Individuums, offenbart in der ebenfalls anhängigen
U.S. 08/724,394 .
-
Tabelle
1. Polymorphe Stellen in der HH-Region
-
-
-
-
Tabelle
2. Polymorphe Allelhäufigkeiten
-
-
-
Diese
Polymorphismen stellen als einen Hintergrund Ersatzmarker zur Verwendung
in diagnostischen Assays bereit, um die wahrscheinliche Anwesenheit
der Mutationen 24d1 und/oder 24d2, bevorzugt 24d1 in Homozygoten
oder Heterozygoten zu detektieren. Somit wird beispielsweise DNA
oder RNA aus einem Individuum auf die Anwesenheit oder Abwesenheit
eines durch ein polymorphes Allel von Tabelle 1 definierten Genotyps
untersucht, wobei die Abwesenheit eines durch ein polymorphes Allel
von Tabelle 1 definierten Genotyps als ein Ergebnis die wahrscheinliche
Abwesenheit der HFE-Genmutation
im Genom des Individuums anzeigt, und die Anwesenheit des Genotyps
die wahrscheinliche Anwesenheit der HFE-Genmutation im Genom des
Individuums anzeigt.
-
Diese
Marker können
einzeln, in beliebiger Kombination miteinander oder mit anderen
polymorphen Markern (wie etwa den in der ebenfalls anhängigen PCT-Anmeldung
WO 96/06583 offenbarten)
in diagnostischen Assays für
die wahrscheinliche Anwesenheit der HFE-Genmutation in einem Individuum
verwendet werden. Beispielsweise kann jeder der durch die polymorphen
Stellen von Tabelle 1 definierten Marker in diagnostischen Assays
verwendet werden in Kombination mit 24d1 oder 24d2, oder mindestens
einem der Polymorphismen HHP-1, HHP-19 oder HHP-29, oder der Mikrosatellitenwiederholung-Allele
19O9:205, 18B4:235, 1A2:239, 1E4:271, 24E2:245, 2B8:206, 3321-1:98,
4073-1:182, 4440-1:180,
4440-2:139, 731-1:177, 5091-1:148, 3218-1:221, 4072-2:170, 950-1:142,
950-2:164, 950-3:165, 950-4:128, 950-6:151, 950-8:137, 63-1:151,
63-2:113, 63-3:169, 65-1:206, 65-2:159,
68-1:167, 241-5:108, 241-29:113, 373-8:151 und 373-29:113, D6S258:199,
D6S265:122, D6S105:124, D6S306:238, D6S464:206 und D6S1001:180.
-
Tabelle
2 listet die Häufigkeit
von etwa 100 der durch die identifizierten polymorphen Stellen definierten Allele
auf. Wie aus der Tabelle ersichtlich ist, sind bestimmte dieser
Allele in der allgemeinen Population selten vorhanden. Von den Genotypen,
die durch die in Tabelle 2 aufgelisteten Allele definiert sind,
sind Polymorphismen, welche an Base 35983 auftreten, der Gegenstand
der vorliegenden Erfindung.
-
Es
wird vom Fachmann verstanden werden, dass die durch die polymorphen
Stellen von Tabelle 1 definierten Haplotypen eine Vorhersage über die
wahrscheinliche Anwesenheit der HFE-Genmutation 24d1 ermöglichen,
da sie in einem Homozygoten für
anzestrale HH identifiziert wurden. Somit ist beispielsweise die Wahrscheinlichkeit
für ein
betroffenes Individuum mit mindestens zwei oder mehr beliebigen
der in Tabelle 1 definierten polymorphen Allele größer als
die für
ein nicht betroffenes Individuum. In ähnlicher Weise ist die Wahrscheinlichkeit
für ein
betroffenes Individuum mit mindestens drei oder mehr beliebigen
der in Tabelle 1 definierten polymorphen Allele größer als
die für
ein nicht betroffenes Individuum.
-
Somit
wird beispielsweise in einem diagnostischen Assay auf die wahrscheinliche
Anwesenheit der HFE-Genmutation im Genom des Individuums DNA oder
RNA aus dem Individuum auf die Anwesenheit oder Abwesenheit eines
Haplotyps von Tabelle 1 untersucht, wobei die Abwesenheit eines
Haplotyps von Tabelle 1 als ein Ergebnis die wahrscheinliche Abwesenheit
der HFE-Genmutation im Genom des Individuums anzeigt, und die Anwesenheit
des Haplotyps die wahrscheinliche Anwesenheit der HFE-Genmutation
im Genom des Individuums anzeigt.
-
Die
durch die polymorphen Stellen von Tabelle 1 definierten Marker sind
zusätzlich
nützlich
als Marker für
die genetische Analyse der Vererbung bestimmter HFE-Allele und anderer
Gene, die innerhalb der chromosomalen Region vorhanden sind, welche
der Sequenz von
9 entspricht, umfassend beispielsweise
diejenigen, welche in der ebenfalls anhängigen
U.S.S.N. 08/724,394 offenbart sind.
-
Da
die gesamte Nukleotidsequenz der Region in 9 bereitgestellt
ist, wird für
den Durchschnittsfachmann offensichtlich sein, welche Sequenzen
als Primer oder Sonden zu verwenden sind, um jeden interessierenden
Polymorphismus zu detektieren. Somit umfassen in manchen Ausführungsformen
der Erfindung die erfindungsgemäßen Nukleotidsequenzen
mindestens ein Oligonukleotidpaar, ausgewählt aus der Sequenz von 9 oder
deren Komplement, für
die Amplifikation der polymorphen Stelle bei Base 35983 von Tabelle
1. Des Weiteren ist in manchen Ausführungsformen der Erfindung
eine bevorzugte Hybridisierungssonde ein Oligonukleotid, umfassend
mindestens 8 bis etwa 100 aufeinander folgende Basen aus der Sequenz von 9 oder
dem Komplement der Sequenz, wobei die mindestens 8 bis etwa 100
aufeinander folgenden Basen mindestens die polymorphe Stelle 35983
von Tabelle 1 umfassen.
-
Derartige
isolierte DNA-Sequenzen sind nützlich
als Primer, Sonden, oder als eine Komponente eines Kits in diagnostischen
Assays zur Detektierung der wahrscheinlichen Anwesenheit der HFE-Genmutation
in einem Individuum.
-
D. Screening auf Basis von Nukleinsäure
-
Individuen,
die polymorphe Allele der Erfindung haben, können unter Verwendung einer
Reihe von Techniken, die in der Technik gut bekannt sind, auf dem
Niveau von entweder der DNA, der RNA oder dem Protein detektiert
werden. Die für
die Diagnose verwendete genomische DNA kann aus Körperzellen
erhalten werden, wie etwa denjenigen, welche vorhanden sind in peripherem
Blut, Urin, Speichel, der Wange, chirurgischen Proben und Autopsieproben.
Die DNA kann direkt verwendet werden oder sie kann vor der Mutationsanalyse
in vitro enzymatisch amplifiziert werden durch Verwendung von PCR
(Saiki et al., Science 239:487–491
(1988)) oder andere in vitro Amplifikationsmethoden, wie etwa die
Ligasekettenreaktion (LCR) (Wu und Wallace, Genomics 4:560–569 (1989)), Strangverdrängungsamplifikation
(SDA, strand displacement amplification) (Walker et al., Proc. Natl.
Acad. Sci. USA 89:392–398
(1992)), selbst erhaltende Sequenzreplikation (3SR, self-sustained
sequence replication) (Fahy et al., PCR Methods Appl. 1:25–33 (1992)).
Die Methodik zur Herstellung von Nukleinsäuren in einer Form, welche
für die
Detektion von Mutationen geeignet ist, ist in der Technik gut bekannt.
-
Die
Detektion von Polymorphismen in spezifischen DNA-Sequenzen, wie
etwa in der Region des HFE-Gens, kann durch eine Reihe von Methoden
bewerkstelligt werden, umfassend, aber nicht darauf beschränkt, die
Detektion von Restriktionsfragmentlängen-Polymorphismen auf Basis
von Allel-spezifischer Restriktionsendonuklease-Spaltung (Kan und
Dozy, Lancet 8:910–912
(1978)), Hybridisierung mit Allel-spezifischen Oligonukleotidsonden
(Wallace et al., Nucleic Acids Res. 8:3543–3557 (1978)), umfassend immobilisierte
Oligonukleotide (Saiki et al., Proc. Natl. Acad. Sci. USA 86:6230–6234 (1989))
oder Oligonulkeotid-Anordnungen
(Maskos und Southern, Nucleic Acids Res. 21:2269–2270 (1993)), Allel-spezifische PCR (Newton
et al., Nucleic Acids Res. 17:2503–2516 (1989)), Fehlpaarung-Reparatur-Detektion
(MRD, mismatch-repair detection) (Faham und Cox, Genome Res. 5:474–482 (1995)),
Bindung von MutS-Protein (Wagner et al., Nucleic Acids Res. 23:3944–3948 (1995)),
denaturierende Gradientengelelektrophorese (DGGE) (Fisher und Lerman et
al., Proc. Natl. Acad. Sci. USA 80:1579–1583 (1983)), Einzelstrangkonformation-Polymorphismusdetektion (Orita
et al., Genomics 5:874–879
(1983)), RNAse-Spaltung bei ungepaarten Basenpaaren (Myers et al.,
Science 230:1242 (1985)), chemische (Cotton et al., Proc. Natl.
Acad. Sci. USA 85:4397–4401
(1988)) oder enzymatische (Youll et al., Proc. Natl. Acad. Sci.
USA 92:87–91
(1995)) Spaltung von Heteroduplex-DNA, Methoden auf Basis von Allel-spezifischer
Primerextension (Syvänen
et al., Genomics 8:684–692
(1990)), genetische Bit-Analyse (GBA) (Nikiforov et al., Nucleic
Acids Res. 22:4167–4175
(1994)), den Oligonukleotid-Ligationsassay (OLA) (Landegren et al.,
Science 241:1077 (1988)), die Allel-spezifische Ligationskettenreaktion (LCR)
(Barrany, Proc. Natl. Acad. Sci. USA 88:189–193 (1991)), Lücken-LCR
(gap LCR) (Abravaya et al., Nucleic Acids Res. 23:675–682 (1995)),
radioaktive und/oder fluoreszierende DNA-Sequenzierung unter Verwendung
von in der Technik gut bekannten Standardverfahren, und Peptid-Nukleinsäure (PNA)
Assays (Orum et al., Nucleic Acids Res. 21:5332–5358 (1993); Thiede et al.,
Nucleic Acids Res. 24:983–984
(1998)).
-
Zusätzlich zu
den durch die Polymorphismen der Erfindung definierten Genotypen
können,
wie beschrieben in der ebenfalls anhängigen PCT-Anmeldung
WO 96/35802 , veröffentlicht
am 14. November 1998, Genotypen, gekennzeichnet durch die Anwesenheit
der Allele 19O9:205, 18B4:235, 1A2:239, 1E4:271, 24E2:245, 2B8:206,
3321-1:98 (dort als 3321-1:197 bezeichnet), 4073-1:182, 4440-1:180,
4440-2:139, 731-1:177, 5091-1:148, 3218-1:221, 4072-2:170 (dort als 4072-2:148
bezeichnet), 950-1:142, 950-2:164, 950-3:165, 950-4:128, 950-6:151, 950-8:137,
63-1:151, 63-2:113, 63-3:169, 65-1:206, 65-2:159, 68-1:167, 241-5:108,
241-29:113, 373-8:151 und 373-29:113, die Allele D6S258:199, D6S265:122,
D6S105:124, D6S306:238, D6S464:206 und D6S1001:180, und/oder Allele,
die mit den Einzelbasenpaar-Polymorphismen HHP-1,
HHP-19 oder HHP-29 assoziiert sind, ebenfalls verwendet werden,
um bei der Identifizierung eines Individuums, dessen Genom 24d1
und/oder 24d2 enthält,
beizutragen. Der Untersuchungsschritt kann beispielsweise mittels
eines Verfahrens durchgeführt
werden, welches umfasst das Amplifizieren von DNA oder RNA unter
Verwendung von Oligonukleotidprimern, die den Polymorphismus bei
Base 35983 von Tabelle 1 flankieren, und von Oligonukleotiden, die
24d1 und/oder 24d2 flankieren, Oligonukleotidprimern, die mindestens
einen der Basenpaar-Polymorphismen HHP-1, HHP-19 und HHP-29 flankieren, Oligonukleotidprimern,
die mindestens eines der Mikrosatellitenwiederholung-Allele flankieren,
oder Oligonukleotidprimern für
eine beliebige Kombination von Polymorphismen oder Mikrosatellitenwiederholung-Allelen
davon.
-
Oligonukleotide,
die für
diagnostische Assays nützlich
sind, haben typischerweise eine Länge von mindestens 8 aufeinander
folgenden Nukleotiden, und können
eine Länge
von mehr als 18 Nukleotiden bis zu mehr als 100 aufeinander folgenden
Nukleotiden oder darüber
aufweisen. Derartige Oligonukleotide können entweder von der genomischen
DNA von 8 oder 9 abgeleitet
werden, oder von davon abgeleiteten cDNA-Sequenzen, oder sie können synthetisiert
werden.
-
Zusätzlich sind
die Proteine, welche von derartigen cDNA kodiert werden, nützlich für die Erzeugung von
Antikörpern,
zur Analyse von Genexpression und in diagnostischen Assays, und
für die
Reinigung von verwandten Proteinen.
-
E. Allgemeine Verfahren
-
Die
Nukleinsäurezusammensetzungen
dieser Erfindung, ob RNA, cDNA, genomische DNA oder. eine Hybride
der verschiedenen Kombinationen, können von natürlichen
Quellen, umfassend klonierte DNA, isoliert werden, oder in vitro
synthetisiert werden. Die beanspruchten Nukleinsäuren können in transformierten oder transfizierten
ganzen Zellen vorhanden sein, in einem transformierten oder transfizierten
Zelllysat, oder in einer partiell gereinigten oder im Wesentlichen
reinen Form vorliegen.
-
Techniken
für die
Nukleinsäuremanipulation
der erfindungsgemäßen Nukleinsauresequenzen,
wie etwa Subklonierung von Nukleinsäuresequenzen, die für Polypeptide
kodieren, in Expressionsvektoren, Markierung von Sonden, DNA-Hybridisierung
und dergleichen, sind allgemein beschrieben in Sambrook et al.,
Molecular Cloning: A Laboratory Manual (2. Auflage), Bände 1–3, Cold
Spring Harbor Laboratory, Cold Spring Harbor, New York (1989), das
durch Bezugnahme hierin aufgenommen ist. Dieses Handbuch wird nachstehend
hierin als "Sambrook
et al." bezeichnet.
-
Es
gibt verschiedene Methoden zur Isolation der erfindungsgemäßen Nukleinsauresequenzen.
DNA wird beispielsweise von einer genomischen Bibliothek oder einer
cDNA-Bibliothek isoliert, unter Verwendung von markierten Oligonukleotidsonden
mit Sequenzen, die komplementär
zu den hierin offenbarten Sequenzen sind. Derartige Sonden können in
Hybridisierungsassays direkt verwendet werden. Alternativ können Sonden zur
Verwendung in Amplifikationstechniken wie etwa PCR konstruiert werden.
-
Um
eine cDNA-Bibliothek herzustellen, wird RNA aus Gewebe wie etwa
dem Herz oder dem Pankreas, bevorzugt einem Gewebe bei dem Expression
des Gens oder der Genfamilie wahrscheinlich stattfindet, isoliert.
Aus der RNA wird cDNA hergestellt und in einen rekombinanten Vektor
ligiert. Für
Propagation, Screening und Klonierung wird der Vektor in einen rekombinanten
Wirt transfiziert. Verfahren zur Herstellung und für das Screening
von cDNA-Bibliotheken sind gut bekannt. Siehe Gubler, U., und Hofmann,
B.J., Gene 25:263–289
(1983) und Sambrook et al.
-
Für beispielsweise
eine genomische Bibliothek wird die DNA von Gewebe extrahiert und
entweder mechanisch geschert oder enzymatisch verdaut, so dass Fragmente
von etwa 12 bis 20 kb erhalten werden. Die Fragmente werden danach
durch Gradientenzentrifugation von unerwünschten Größen abgetrennt, und in Bakteriophage
lambda Vektoren eingebaut. Diese Vektoren und Phagen werden in vitro
verpackt, wie in Sambrook et al. beschrieben. Rekombinante Phagen
werden durch Plaquehybridisierung analysiert, wie beschrieben in
Benton und Davies, Science 196:180–182 (1977). Koloniehybridisierung
wird durchgeführt,
wie allgemein beschrieben in M. Grunstein et al., Proc. Natl. Acad.
Sci. USA 72:3961–3965
(1975).
-
Interessierende
DNA wird entweder in cDNA-Bibliotheken oder in genomischen Bibliotheken
identifiziert, da sie, beispielsweise in Southern Blots, mit Nukleinsäuresonden
hybridisieren kann, und diese DNA-Regionen werden durch Standardmethoden,
die dem Fachmann bekannt sind, isoliert. Siehe Sambrook et al.
-
Bei
PCR-Techniken werden Oligonukleotidprimer, welche zu den zwei 3'-Grenzen der zu amplifizierenden
DNA-Region komplementär
sind, synthetisiert. Die Polymerasekettenreaktion wird danach unter
Verwendung der zwei Primer durchgeführt. Siehe PCR Protocols: a
Guide to Methods and Applications (Hrsg. Innis, M., Gelfand, D.,
Sninsky, J., und White, T.), Academic Press, San Diego (1990). Primer
können,
je nach Wunsch, ausgewählt
werden um die gesamten, für
eine interessierende Volllängensequenz
kodierenden Regionen zu amplifizieren, oder um kleinere DNA-Abschnitte
zu amplifizieren.
-
PCR
kann in einer Reihe von Protokollen verwendet werden, um cDNA zu
isolieren, die für
eine interessierende Sequenz kodieren. In diesen Protokollen werden
geeignete Primer und Sonden zur Amplifikation von DNA, welche für eine interessierende
Sequenz kodiert, aus einer Analyse der hierin aufgelisteten DNA-Sequenzen
geschaffen. Sobald derartige Regionen PCR-amplifiziert vorliegen,
können
sie sequenziert werden und von der erhaltenen Sequenz können Oligonukleotidsonden
hergestellt werden.
-
Oligonukleotide
zur Verwendung als Primer oder Sonden werden chemisch synthetisiert,
gemäß dem von
Beaucage, S.L., und Carruthers, M.H. zuerst beschriebenen Festphase-Phosphoramidit-Triester-Verfahren,
Tetrahedron Lett. 22(20):1859–1862
(1981), unter Verwendung eines automatisierten Synthesizers, wie beschrieben
in Neadham-VanDevanter, D.R., et al., Nucleic Acids Res. 12:6159–6168 (1984).
Die Reinigung von Oligonukleotiden erfolgt entweder durch native
Acrylamid-Gelelektrophorese oder durch Anionenaustausch-HPLC, wie beschrieben
in Pearson, J.D., und Regnier, F.E., J. Chrom. 255:137–149 (1983).
Die Sequenz des synthetischen Oligonukleotids kann verifiziert werden
unter Verwendung des chemischen Abbauverfahrens von Maxam, A.M.,
und Gilbert, W., in Methods in Enzymology 65:499–560 (1980), Hrsg. Grossman, L.,
und Moldave, D., Academic Press, New York.
-
Diese
Erfindung umfasst auch diagnostische Kits zur Detektion von DNA
oder RNA, welche den Polymorphismus bei Base 35983 von Tabelle 1
umfasst, in Gewebe- oder Blutproben, wobei die Kits Nukleinsäuresonden,
wie hierin beschrieben, und Instruktionsmaterial umfassen. Das Kit
kann auch zusätzliche
Komponenten umfassen, wie etwa markierte Verbindungen, wie hierin
beschrieben, zur Identifizierung von doppelsträngigen Nukleinsäuren.
-
Die
nachfolgenden Beispiele sind bereitgestellt, um die Erfindung zu
veranschaulichen, aber nicht um ihren Umfang zu beschränken. Weitere
Varianten der Erfindung werden für
den Durchschnittsfachmann offensichtlich sein und sind von den beigefügten Ansprüchen umfasst.
-
F. EXPERIMENTELLE BEISPIELE
-
Sequenzierung von 235 kb von einem homozygoten
anzestralen (betroffenen) Individuum
-
In
diesen Studien wurde die gesamte genomische Sequenz von einem durch
HH betroffenen Individuum für
eine Region bestimmt, entsprechend einer 235.033 bp Region, welche
das HFE-Gen zwischen den flankierenden Markern D6S2238 und D6S2241
umgibt. Die Sequenz wurde abgeleitet aus einer humanen lymphoblastoiden
Zelllinie, HC14, welche für
die anzestrale HH-Mutation und Region homozygot ist. Die Sequenz
des anzestralen Chromosoms (
9) wurde
verglichen mit der Sequenz der Region in einem nicht betroffenen
Individuum (
8), die in der ebenfalls anhängigen
U.S.S.N. 08/724,394 offenbart
ist, um polymorphe Stellen zu identifizieren. Eine Subgruppe der
derart definierten polymorphen Allele wurde weiter untersucht, um
ihre Häufigkeit
in einer Kollektion von nach dem Zufallsprinzip ausgewählten Individuen
zu bestimmen.
-
Die
Zelllinie HC14 wurde am 25. Juni 1997 bei der ATCC hinterlegt, und
trägt die
Bezeichnung ATCC CRL-12371.
-
a. Screening von Cosmid-Bibliotheken
-
Die
Strategie und Methodik zur Sequenzierung der genomischen DNA des
betroffenen Individuums war im Wesentlichen, wie in der ebenfalls
anhängigen
U.S.S.N. 08/724,394 beschrieben:
Grundlegend wurde eine Cosmid-Bibliothek konstruiert unter Verwendung
von DNA mit hohem Molekulargewicht aus HC14 Zellen. Die Bibliothek
wurde im Vektor Supercos (Stratagene, La Jolla, CA) konstruiert.
Kolonien wurden unter Verwendung von Standardtechniken auf Biotrans
Nylonfilter (ICN) repliziert. Sonden von genomischen Subklonen,
welche bei der Erzeugung der Sequenz der nicht-betroffenen, in
08/724,394 offenbarten
Sequenz verwendet worden waren, wurden mittels Gelelektrophorese
und Elektroporation isoliert. Subklone wurden in einem Abstand von
annähernd
20 kb über
die gesamte 235 kb Region ausgewählt.
Die DNA wurde markiert durch Einbau von 32P dCTP mittels des Randomprimer-Markierungsansatzes.
Positiv hybridisierende Klone wurden mittels eines sekundären Screeningschritts
zur Reinheit isoliert. Die Enden von Cosmidinserts wurden sequenziert,
um zu bestimmen, ob eine vollständige
Abdeckung erhalten worden war, und welche Klone einen minimalen
Weg von Cosmiden durch die 235 kb Region bilden.
-
b. Sequenzierung von Proben
-
Ein
Minimalsatz von Cosmidklonen, der ausgewählt worden war um die 235 kb
Region abzudecken, wurde mit dem Qiagen Maxi-Prep System präpariert.
Zehn Mikrogramm DNA aus jeder Cosmidpräparation wurden in einem Heat
Systems Sonicator XL beschallt, und die Enden wurden mit Klenow
(USB) und T4-DNA-Polymerase (USB) repariert. Die gescherten Fragmente
wurden auf einem 0,7% Agarosegel auf zwischen drei und vier Kilobasen
größenselektiert
und danach an BstXI-Linker (Invitrogen) ligiert. Die Ligationen wurden
auf einem 0,7% Agarosegel Gel-gereinigt und in einen pSP72-Derivat
Plasmidvektor kloniert. Die resultierenden Plasmide wurden in elektrokompetente
DH5α-Zellen
transformiert und auf LB-Carbenicillin-Platten
plattiert. Es wurde eine ausreichende Anzahl an Kolonien gepickt
um eine 15-fache Klonabdeckung zu erreichen. Die geeignete Anzahl
an Kolonien zur Erzeugung einer einfachen Sequenzabdeckung wurde
durch die nachfolgende Gleichung berechnet: Anzahl an Kolonien =
Größe des Bakterienklons
(in kb)/mittlere Sequenzleselänge
(0,4 kb). Diese Kolonien wurden in der 96-Well Qiagen REAL und mit
dem 5' nach 3' DNA Prep Kit präpariert,
und unter Verwendung von ABI Dye Terminator Srandardprotokollen
mit Oligo MAP1 AGCT End-sequenziert. MAP1 war CGTTAGAACGCGGCTACAAT.
-
c. Genomische Sequenzierung
-
Die
MAP1-Sequenzen von den Cosmidklonen HC182, HC187, HC189, HC195,
HC199, HC200, HC201, HC206, HC207 und HC212 wurden mit dem Staden-Package
(erhältlich
von Roger Staden, MRC) zu Contigs zusammengesetzt. Ein Minimalsatz
an 3 kb Klonen wurde ausgewählt
zur Sequenzierung mit Oligo-markiertem MAP2, das am entgegen gesetzten
Ende des Plasmidvektors sitzt. Die Sequenz von MAP2 war GCCGATTCATTAATGCAGGT.
Die MAP2-Sequenzen wurden zusammen mit den MAP1-Sequenzen in die Staden-Datenbank
eingegeben, um einen Tiling Path von 3 kb Klonen über die
Region hinweg zu erzeugen. Die 3 kb Plasmidbibliotheken wurden gleichzeitig
im 96-Well-Format in pox38UR (erhältlich von C. Martin, Lawrence
Berkeley Laboratories) transformiert. Die Transformanten wurden
danach im 96-Well-Format mit JGM (Strathman et al., P.N.A.S. 88:1247–1250 (1991))
gekreuzt. Alle Kreuzungen der 3 kb Klone innerhalb des Tiling Path
wurden auf LB-Carbenicillin-Kanamycin-Platten
ausgestrichen und eine Zufallsauswahl von 12 Kolonien pro 3 kb Klon
wurde im AGCT-System präpariert.
Die Oligos -21: CTGTAAAACGACGGCCAGTC und REV: GCAGGAAACAGCTATGACC
wurden verwendet um von beiden Enden des Transposons weg zu sequenzieren.
Jeder 3 kb Klon wurde zusammen mit der Endsequenzinformation von
allen Cosmidklonen in der Region zusammengesetzt.
-
Bei
manchen Regionen war die Abdeckung der genomischen Sequenz durch
Cosmide unvollständig. Alle
Lücken
in der Sequenz wurden aufgefüllt
unter Verwendung von PCR-Standardtechniken,
um genomische DNA in diesen Regionen zu amplifizieren, und von ABI
Dye Terminator-Standardchemie, um die Amplifikationsprodukte zu
sequenzieren.
-
d. Identifizierung von polymorphen Stellen
-
Die
zusammengesetzte Sequenz der Cosmidklone zusammen mit der PCR-amplifizierten
genomischen DNA wurde unter Verwendung des Algorithmus FASTA mit
der genomischen Sequenz des nicht betroffenen Individuums verglichen.
Den sequenzierten Regionen wurden numerische Werte von 1 bis 235.303
zugeordnet, wobei Base 1 das erste C im CA-Repeat von D6S2238 bezeichnet,
und Base 235.303 das letzte T im GT-Repeat von D6S2241 der nicht
betroffenen Sequenz ist (8). Tabelle
1 listet die Unterschiede zwischen den zwei verglichenen Sequenzen
auf. Es ist zu bemerken, dass die früher offenbarten (Feder et al., Nature
Genetics 13:399–408
(1996)) polymorphen Stellen D6S2238 (Base 1), D6S2241 (Base 235.032),
24d1 (Base 41.316) und D6S2239 (Base 84.841) nicht in die Liste
von neuen Polymorphismen aufgenommen sind, obwohl sie als Referenz
in einer Fußnote
zu der Tabelle angegeben sind und in der anzestralen Sequenz beobachtet
wurden. In der Tabelle bezeichnet ein Einzelbasenaustausch wie etwa
C-T ein C in der nicht betroffenen Sequenz an der angegebenen Basenposition,
das als ein T an der entsprechenden Position in der betroffenen
Sequenz auftrat. In ähnlicher
Weise ist eine Insertion einer oder mehrerer Basen, wie etwa TTT
in der betroffenen Sequenz, als "TTT
INS" zwischen den
angegebenen Basen der nicht betroffenen Sequenz dargestellt. Eine
in der betroffenen Sequenz auftretende Deletion einer oder mehrerer
Basen, wie etwa AAA DEL ist dargestellt als die Deletion der angegebenen
Basen in der nicht betroffenen Sequenz.
-
e. Charakterisierung seltener Polymorphismen
-
In
dieser Studie wurden etwa 100 der Polymorphismen von Tabelle 1 zur
weiteren Charakterisierung willkürlich
ausgewählt.
Allelfrequenzen in der allgemeinen Population wurden geschätzt durch
OLA-Analyse unter Verwendung einer Population von nach dem Zufallsprinzip
ausgewählten
DNA (der "CEPH" Kollektion, J. Dausset
et al., Genomics 6(3):575–577
(1990)). Diese Ergebnisse sind in Tabelle 2 bereitgestellt.
-
Ein
Einzelbasenpaarunterschied, der bei Base 35.983 auftritt und als
C182.1G7T/C bezeichnet wird (ein A nach G Austausch auf dem Gegenstrang)
war im anzestralen Chromosom vorhanden und in den nach dem Zufallsprinzip
ausgewählten
DNA selten. Dieser Austausch trat in einer nicht kodierenden Region
des Hämochromatose-Gens
nahe Exon 7 annähernd
5,3 kb entfernt von der 24d1 Mutation (Cys282Tyr) auf. OLA wurde
verwendet um 90 Hdmochromatose-Patienten im Hinblick auf den C182.1G7T/C
Basenpaaraustausch zu genotypisieren. Die Häufigkeit bei den Patienten,
dass C an dieser Position vorlag, betrug 79,4%, im Vergleich zu
5% bei den nach dem Zufallsprinzip ausgewählten DNA.
-
Fünfundachtzig
der 90 untersuchten Patienten hatten identische 24d1 und C182.1G7T/C
Gentypen. Vier der restlichen 5 Patienten waren homozygot an 24d1
und heterozygot an C182.1G7T/C; einer war heterozygot an 24d1 und
homozygot an C182.1G7T/C. Die für
diese Analyse verwendeten Primer waren wie folgt.
-
PCR
Primer für
die Detektion:
182.1G7.F 5'-GCATCAGCGATTAACTTCTAC-3'
182.1G7.R 5'-TTGCATTGTGGTGAAATCAGGG-3'
-
Für den Detektionsassay
waren die verwendeten biotinylierten Primer wie folgt.
182.1G7.C
5'-(b)CTGAGTAATTGTTTAAGGTGC-3'
182.1G7.T 5'-(b)CTGAGTAATTGTTTAAGGTGT-3'
-
Der
verwendete phosphorylierte Digoxigenin-markierte Primer war:
182.1G7.D
5'-(p)AGAAGAGATAGATATGGTGG-3'
-
Das
vorstehende seltene Allel ist als ein Marker für 24d1 zu verwenden, und ist
besonders nützlich
in Screening-Assays auf die wahrscheinliche Anwesenheit von 24d1
und/oder 24d2.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-