-
Die
Erfindung betrifft die Bestimmung von genetischen Faktoren, welche
mit der psychiatrischen Gesundheit verbunden sind, unter besonderem
Bezug auf ein humanes Gen oder Gene, welches bzw. welche zu der
Manifestation einer bipolaren Störung
bzw. einer manisch-depressiven Krankheit in betroffenen Individuen beiträgt oder
dafür verantwortlich
ist. Die Erfindung stellt insbesondere, wenngleich nicht ausschließlich, ein Verfahren
zum Identifizieren und Charakterisieren solch eines Gens oder solcher
Gene des humanen Chromosoms 18 bereit. Die Erfindung betrifft auch
Verfahren zum Bestimmen der genetischen Anfälligkeit eines Individuums
für eine
bipolare Störung.
Mit bipolaren Störungen
sind die folgenden Erkrankungen gemeint, wie sie in "Diagnostic and Statistical
Manual of Mental Disorders",
Version 4 (DSM-IV) Taxonomie (DSM-IV-Codes in Klammern) definiert
sind: – Gemütskrankheiten
(296.XX, 300.4, 311, 301.13, 295.70), Schizophrenie und verwandte
Erkrankungen (295.XX, 297.1, 298.8, 297.3, 298.9), Angsterkrankungen
(300.XX, 309.81, 308.3), Anpassungsstörungen (309.XX) und Persönlichkeitserkrankungen
(Codes 301.XX).
-
Die
erfindungsgemäßen Verfahren
werden insbesondere im Verhältnis
mit genetischen Faktoren veranschaulicht, welche mit einer Familie
von Gemütserkrankungen
verbunden sind, welche als Spektrum der bipolaren Erkrankungen (BP)
bzw. der manisch-depressiven Erkrankungen bekannt sind.
-
Eine
bipolare Erkrankung (BP) ist eine schwere psychiatrische Erkrankung,
welche gekennzeichnet ist durch Störungen des Gemüts, welche
von einem extremen Zustand der Hochstimmung (Manie) bis zu einem schweren
Zustand der Dysphorie (Depression) reichen. Es sind zwei Arten einer
bipolaren Erkrankung beschrieben worden: BP-Erkrankung Typ I (BPI)
ist gekennzeichnet durch hauptsächlich
depressive Abschnitte, welche sich mit Phasen der Manie abwechseln,
und BP-Erkrankung Typ II (BPII), welche durch hauptsächliche depressive
Abschnitte gekennzeichnet ist, welche sich mit Phasen der Hypomanie
abwechseln. Verwandte von BP-Probanden weisen ein verstärktes Risiko
für BP,
für eine monopolare
Erkrankung (Patienten, welche nur depressive Abschnitte erleben;
UP), für
Zyklothymie (geringere Depression und Hypomanie-Abschnitte; CY)
ebenso wie für
schizoaffektive Psychosen des manischen (SAm) und des depressiven
(SAd) Typs. Basierend auf diesen Beobachtungen werden, BP, CY, UP
und SA als Erkrankungen des BP-Spektrums bezeichnet. Die Beteiligung
von genetischen Faktoren bei der Äthiologie von Erkrankungen
des BP-Spektrums wurde durch Familien-, Zwillings- und Adoptionsuntersuchungen
nahegelegt (Tsuang und Faraone (1990), „The Genetics of Mood Disorders", Baltimore, The
John Hopkins University Press). Jedoch ist das genaue Muster der Weitergabe
unbekannt. In einigen Untersuchungen stützt eine komplexe Spaltungsanalyse
die Existenz eines einzelnen Hauptlokus für BP (Spence et al., (1995),
Am J. Med. Genet (Neuropsych. Genet.) 60 S.370-376). Andere Wissenschaftler
schlagen ein Modell mit einem Anfälligkeitsschwellenwert vor,
wobei sich die Anfälligkeit,
die Erkankung zu entwickeln, aus der additiven Kombination von mehreren
genetischen Effekten und Umwelteffekten ergibt (McGuffin et al.,
(1994), „Affective
Disorders"; Seminars
in Psychiatric Genetics Gaskell, London S. 110-127).
-
Aufgrund
des komplexen Vererbungsmodus werden bei Familien, bei welchen eine
BP-Erkrankung gemäß den Mendelschen
Gesetzen übertragen
zu werden scheint, Strategien mit parametrischer und nicht parametrischer
Verbindung angewendet. Frühe
Befunde über
die Verbindung auf den Chromosomen 11p15 (Egeland et al. (1987),
Nature 325 S. 783-787) und Xq27-q28
(Mendlewicz et al. (1987) The Lancet 1 S. 1230-1232; Baron et al.
(1987) Nature 326 S. 289-292) sind kontrovers und konnten anfänglich nicht
wiederholt werden (Kelsoe et al. (1989) Nature 242 S. 238-243; Baron
et al. (1993) Nature Genet 3 S. 49-55). Mit der Entwicklung einer
humanen genetischen Karte, welche mit höchst polymorphen Markern gesättigt ist,
und der kontinuierlichen Entwicklung von Datenanalysenverfahren
wurden zahlreiche neue Verbindungsuntersuchungen gestartet. In mehreren
Untersuchungen wurde ein Anhaltspunkt oder die Andeutung eines Anhaltspunktes für eine Verbindung
mit bestimmten Regionen auf den Chromosomen 4, 12, 18, 21 und X
gefunden (Blackwood et al. (1996) Nature Genetics 12 S. 427-430,
Craddock et al. (1994) Brit J. Psychiatry 164 S. 355-358, Berretini
et al. (1994), Proc Natl Acad Sci USA 91 S. 5918-5921, Straub et
al. (1994) Nature Genetics 8 S. 291-296 und Pekkarinen et al. (1995)
Genome Research 5 S. 105-115). Um die Validität der Ergebnisse der gemeldeten
Verbindungen zu untersuchen, müssen
diese Befunde in anderen unabhängigen
Untersuchungen wiederholt werden.
-
Kürzlich ist
die Verbindung einer bipolaren Störung mit der perizentrometrischen
Region auf dem Chromosom 18 beschrieben worden (Berrettini et al.
1994). Es wurde auch über
ein Ringchromosom 18 mit Bruchpunkten und deletierten Regionen bei
18pter-p11 und 18q23-qter bei drei nicht verwandten Patienten mit einer
BP-Erkrankung oder verwandten Syndromen berichtet (Craddock et al.,
1994). Die Verbindung mit dem Chromosom 18p wurde von Stine et al.
(1995) Am. J. Hum. Genet. 57 S. 1348-1394 wiederholt, welche auch einen
hinweisenden Anhaltspunkt auf einen Lokus auf 18q21.2-q21.32 in
der gleichen Studie berichteten. Interessanterweise beobachteten
Stine et al. einen "parent-of-origin"-Effekt: Das Anzeichen
der Verbindung war in den väterlichen
Ahnen bzw. Abkömmlingen
am stärksten,
wobei der Vater des Probanden oder einer der Blutsverwandten des
Vaters des Probanden betroffen ist.
-
In
einer unabhängigen
Wiederholungsstudie untersuchten die Erfinder der vorliegenden Erfindung
die Verbindung mit Markern des Chromosoms 18 in 10 belgischen Familien
mit einem bipolaren Probanden. Um die ursächlichen Gene zu lokalisieren,
wurde in diesen Familien die Verbindungsanalyse oder die Wahrscheinlichkeitsmethode
verwendet. Dieses Verfahren untersucht innerhalb einer Familie die
Segregation eines definierten Erkrankungsphänotyps mit der Segregation
von polymorphen genetischen Markern, welche im humanen Genom verteilt
sind. Es wird das Wahrscheinlichsverhältnis der Beobachtung einer
Cosegregation der Erkrankung und eines genetischen Markers hinsichtlich
Verbindung versus keine Verbindung berechnet, und der log dieses
Verhältnisses
oder der log der Wahrscheinlichkeit ist die LOD-Score-Statistik
z. Ein LOD-Score von 3 (oder Wahrscheinlichkeitsverhältnis von
1000 oder größer) wird
als signifikanter statistischer Hinweis für eine Verbindung angenommen.
Bei der Studie der Erfinder wurde kein Hinweis auf eine Verbindung
mit den perizentrometrischen Regionen gefunden, jedoch wurde in
einer der Familien, in MAD31, einer belgischen Familie mit einem
BPII-Probanden, die Andeutung einer Verbindung mit den bei 18q21.33-q23
lokalisierten Markern gefunden (De Bruyn et al. (1996) Biol Psychiatry
39 S. 679-688). Eine Multipoint-Verbindungsanalyse ergab in dem
Zwischenraum zwischen den STR („Short Tandem Repeats")-Polymorphismen D18S51 und D18S61 den höchsten LOD-Score,
wobei ein maximaler Multipoint-LOD-Score +1.34 betrug. Simulationsstudien
zeigten, dass dieser LOD-Score innerhalb des Bereichs dessen liegt,
was bei der für
diese Familie verfügbaren
Information für
einen bestimmten verbundenen Marker erwartet werden kann. Ebenso
wies eine Paaranalyse betroffener Blutsverwandter die Null-Hypothese
der Nichtverbindung für
mehrere der untersuchten Marker auch zurück. Zwei andere Gruppen fanden
auch einen Anhaltspunkt für
eine Verbindung einer bipolaren Störung mit 18q (Freimer et al.
(1996) Nature Genetics 12 S. 436-441, Coon et al. (1996) Biol Psychiatry
39 S. 689-696). Obwohl die Kandidatenregionen in den unterschiedlichen
Studien nicht vollständig überlappen,
deuten sie alle auf das Vorliegen eines Anfälligkeitslokus bei 18q21-q23
hin.
-
Die
Erfinder haben nun weitere Untersuchungen in der Chromosomenregion
18q in der Familie MAD31 durchgeführt. Durch eine Analyse der
Cosegregation der bipolaren Störung
bei MAD31 mit 12 polymorphen STR-Markern, welche zuvor zwischen
die zuvor erwähnten
Markern D18S51 und D18S61 örtlich festgelegt
wurden, und einer anschließenden
LOD-Score-Analyse wie oben beschrieben, haben die Erfinder die Kandidatenregion
von Chromosom 18 weiter verfeinert, in welcher ein Gen, verbunden
mit Gemütserkrankungen
wie etwa Erkrankungen des bipolaren Spektrums lokalisiert sein kann,
und haben eine physische Karte konstruiert. Die fragliche Region
kann somit verwendet werden, um ein Gen oder Gene, welche die psychiatrische
Gesundheit oder das Gemüt
beeinflussen, zu lokalisieren, zu isolieren und zu sequenzieren.
-
Die
Erfinder haben auch eine YAC (künstliches
Hefechromosom, „yeast
artifical chromosome")-Contig-Karte
der Kandidatenregion konstruiert, um die relative Anordnung der
12 STR-Marker zu bestimmen, kartiert durch eine Cosegregationsanalyse,
und sie haben 7 Klone aus der YAC-Bibliothek identifiziert, welche
die Kandidatenregion beinhalten.
-
Im
Verfahren zur Identifizierung und Charakterisierung des relevanten
Gens oder der Gene kann eine Anzahl von Verfahren mit den identifizierten
YAC- Klonen, und,
falls geeignet, mit der DNA eines Individuums durchgeführt werden,
welches von einer hierin definierten bipolaren Erkrankung betroffen
ist. Beispielsweise haben die Erfinder YAC-Klone verwendet, welche
die interessierende Region im Chromosom 18 umfassen, um durch CAG-
oder CTG-Fragmentation
neue Gene zu identifizieren, welche möglicherweise an der Manifestation
von Gemütserkrankungen
oder verwandten Erkrankungen beteiligt sind.
-
Es
können
mit den YAC-Klonen auch andere Verfahren durchgeführt werden,
um die Kandidatengene wie oben beschrieben zu identifizieren.
-
Wenn
die Kandidatengene einmal identifiziert worden sind, ist es möglich, die
Anfälligkeit
eines Individuums für
eine bipolare Störung
durch Nachweisen des Vorliegens eines Polymorphismus zu bewerten,
welcher mit einer bipolaren Erkrankung verbunden ist, in solchen
Genen.
-
Entsprechend
betrifft ein erster Aspekt der vorliegenden Erfindung die Verwendung
einer 8.9 cM-Region des humanen Chromosoms 18q, welche zwischen
den polymorphen Markern D18S68 und D18S979 angeordnet ist, oder
eines Fragments davon, zur Identifizierung zumindest von einem humanen
Gen, einschließlich
mutierter oder polymorpher Varianten davon, welches zur Manifestation
einer bipolaren Störung
wie oben definiert beiträgt.
Wie unten beschrieben wird, haben die Erfinder der vorliegenden
Erfindung diese Kandidatenregion von Chromosom 18q für solch
ein Gen durch eine Analyse der Cosegregation einer bipolaren Störung in
der Familie MAD31 mit 12 polymorphen STR-Markern, welche zuvor zwischen
D18S51 und D18S61 räumlich
angeordnet wurden, und einer nachfolgenden LOD-Score-Analyse identifiziert.
-
In
einem zweiten Aspekt umfasst die Erfindung einen YAC-Klon, welcher
einen Teil des humanen Chromosoms 18q umfasst, welcher zwischen
den polymorphen Markern D18S68 und D18S979 angeordnet ist, zum Identifizieren
von zumindest einem humanen Gen, einschließlich mutierter oder polymorpher
Varianten davon, welches mit Gemütserkrankungen
oder verwandten Erkrankungen wie oben definiert verbunden ist.
-
Bestimmte
YACs, welche die Kandidatenregion abdecken, welche erfindungsgemäß verwendet
werden können,
sind 961_h_9, 942_c_3, 766_f_12, 731_c_7, 907_e_1, 752-g-8 und 717_d_3,
wobei bevorzugte YACs 961_h_9, 766_f_12 und 907_e_1 sind, da diese
einen minimalen Abdeckungspfad über
die Kandidatenregion aufweisen. Zur Verwendung geeignete YAC-Klone
sind diejenigen, welche ein artifizielles Chromosom aufweisen, welches
die verfeinerte Kandidatenregion zwischen D18S68 und D18S979 umfasst.
-
Es
gibt eine Vielzahl von Verfahren, welche auf die Kandidatenregionen
von Chromsom 18q wie oben definiert angewendet werden können, ob
es in einem YAC vorliegt oder nicht, um ein Kandidatengen oder Kandidatengene
zu identifizieren, welche mit Gemütserkrankungen oder verwandten
Erkrankungen verbunden sind. Es ist beispielsweise zuvor demonstriert
worden, dass eine offensichtliche Verbindung zwischen dem Vorliegen
von Trinukleotid-Repeat-Expansionen
(TRE) im humanen Genom und dem Phänomen der Voraussicht von Gemütserkrankungen
existiert (Lindblad et al. (1995), Neurobiology of Disease 2: 55-62
und O'Donovan et
al. (1995), Nature Genetics 10: 380-381).
-
Entsprechend
umfasst ein dritter Aspekt der vorliegenden Erfindung ein Verfahren
zum Identifizieren zumindest von einem humanen Gen, einschließlich mutierter
oder polymorpher Varianten davon, welches mit einer Gemütserkrankung
oder einer verwandten Erkrankung wie hierin definiert verbunden
ist, welches Nachweisen von Nukleotid-Triplet-Repeats in der humanen
Region des Chromosoms 18q umfasst, welche zwischen den polymorphen
Markern D18S68 und D18S979 angeordnet ist.
-
Ein
alternatives Verfahren zum Identifizieren des Gens oder der Gene
umfasst Fragmentieren eines YAC-Klons, welcher einen Teil des humanen
Chromosoms 18q umfasst, welcher zwischen den polymorphen Markern
D18S68 und D18S979 angeordnet ist, beispielsweise einen oder mehrere
der sieben zuvor genannten YAC-Klone, und Nachweisen von allen Nukleotid-Triplet-Repeats
in den Fragmenten. Nukleotidsäuresonden,
welche mindestens 5 und bevorzugt mindestens 10 CTG- und/oder CAG-Triplet-Repeats
umfassen, sind bei entsprechender Markierung geeignete Mittel zum
Nachweis. Trinukleotid-Repeats können
auch bestimmt werden unter Verwendung des bekannten RED („repeat
expansion detection")-Systems
(Shalling et al. (1993), Nature Genetics 4, S. 135– 139).
-
Wie
hierin unten ausführlich
beschrieben wird, haben die Erfinder, um Kandidatengene mit den
Triplet-Repeats zu identifizieren, eine direkte CAG- oder CTG-Fragmentierung
der YACs 961_h_9, 766_f_12 und 907_e_1 durchgeführt, welche einen Teil des
humanen Chromosoms 18q umfassen, welcher zwischen den polymorphen
Markern D18S60 und D18S61 angeordnet ist, und sie haben eine Anzahl
von Sequenzen mit CAG- oder CTG-Repeats identifiziert, deren anormale
Expansion in die genetische Anfälligkeit
für eine
Gemütserkrankung
oder eine verwandte Erkrankung verwickelt ist. Diese Nukleotidsequenzen
sind in den 15a, 16a, 17a und 18a gezeigt.
-
Die
Kenntnis der oben beschriebenen Sequenzen kann verwendet werden,
um Assays zu konzipieren, um die genetische Anfälligkeit eines Individuums
für eine
bipolare Störung
zu bestimmen.
-
Entsprechend
stellt ein weiterer Aspekt der Erfindung ein Verfahren zur Bestimmung
der Anfälligkeit eines
Individuums für
eine bipolare Störung
bereit, welches die Schritte umfasst:
- a) Erhalten
einer DNA-Probe von dem Individuum,
- b) Bereitstellen von Primern, welche für die Amplifikation einer Nukleotidsequenz
geeignet sind, welche in einer der in den 15a, 16a, 17a oder 18a gezeigten Nukleotidsequenzen enthalten ist,
worin die Primer die in der Sequenz gezeigten Trinukleotid-Repeats
flankieren,
- c) Einsetzen der Primer bei der DNA-Probe und Durchführen einer
Amplifikationsreaktion,
- d) Durchführen
der gleichen Amplifikationsreaktion mit einer DNA-Probe eines Kontrollindividuums
und
- e) Vergleichen der Ergebnisse der Amplifikationsreaktion des
Individuums und der des Kontrollindividuums,
worin das
Vorliegen eines amplifizierten Fragments von dem Individuum, welches
größer ist
das des Kontrollindividuums, ein Anzeichen für das Vorliegen einer Anfälligkeit
für eine
bipolare Störung
des Individuums ist.
-
Mit
Kontrollindividuum ist ein Individuum gemeint, welches nicht von
einer biplaren Störung
betroffen ist und welches keine familiäre Anamnese von Gemüts erkrankungen
oder verwandten Erkrankungen aufweist.
-
Bevorzugte
Primer zur Verwendung in diesem Verfahren sind diejenigen, welche
in der 15b, 16b, 17b oder 18b gezeigt
sind, jedoch können
andere geeignete Primer verwendet werden.
-
Weitere
Ausführungsformen
der vorliegenden Erfindung betreffen Verfahren zum Identifizieren
des relevanten Gens oder der Gene, welche Subklonieren von YAC-DNA
wie oben definiert in Vektoren wie etwa BAC- (künstliches Bakterienchromosom, „bacterial
artificial chromosome")
oder PAC- (künstliches
P1- oder Phagenchromosom) oder Cosmid-Vektoren wie etwa Exon-Trap-Cosmidvektoren
umfasst. Der Ausgangspunkt für
solche Verfahren ist die Konstruktion einer Contig-Karte der Region
des humanen Chromsoms 18q zwischen den polymorphen Markern D18S68
und D18S979. Zu diesem Zweck haben die Erfinder der vorliegenden
Erfindung die Endregionen des Fragments der humanen DNA in jedem
der sieben zuvor genannten YAC-Klone sequenziert und diese Sequenzen
sind hierin offenbart. Nach dem Subklonieren der YAC-DNA in andere
Vektoren, wie oben beschrieben, können Sonden konstruiert werden,
welche diese Endsequenzen oder Teile davon umfassen, insbesondere
die in den 1 bis 11 hierin
gezeigten Sequenzen, zusammen mit beliebigen bekannten sequenzierten
Tag-Stellen (STS) in dieser Region, wie in dem hierin gezeigten YAC-Klon-Contig
beschrieben, welche verwendet werden können, um Überlappungen zwischen den Subklonen
und einer Contig-Karte nachzuweisen, konstruiert werden. Auch die
bekannten Sequenzen in dem aktuellen YAC-Contig können für die Herstellung
von Contig-Karten-Subklonen verwendet werden.
-
Ein
Weg, auf welchem ein Gen oder Gene identifiziert werden kann bzw.
können,
welches bzw. welche mit einer bipolaren Störung verbunden ist, ist die
Verwendung der bekannten Technik des Exon-Trapping.
-
Dies
ist ein artifizieler RNA-Splicing-Assay, am häufigsten in gegenwärtigen Protokollen
eines spezialisierten Exon-Trap-Cosmidvektors verwendet. Der Vektor
enthält
ein künstliches
Minigen, welches aus einem Segment des SV40-Genoms besteht, enthaltend
einen Replikationsursprung und eine starke Promotorsequenz, zwei
Splicing-kompetente Exons, getrennt durch ein Intron, welches eine
multiple Klonierungsstelle enthält,
und eine SV40-Polyadenylierungsstelle.
-
Die
YAC-DNA wird in den Exon-Trap-Vektor subkloniert und die rekombinante
DNA wird in einen Stamm von Säugerzellen
transfiziert. Die Transkription von dem SV40-Promotor ergibt ein
RNA-Transkript, welches normalerweise splict und die zwei Exons
des Minigens umfasst. Wenn die klonierte DNA selbst ein funktionelles
Exon umfasst, kann es zu den in dem Vektor-Minigen vorliegenden
Exons gesplict werden. Unter Verwendung einer reversen Transkriptase
kann eine cDNA-Kopie hergestellt werden und unter Verwendung von
spezifischen PCR-Primern können
die Splicing-Ereignisse identifiziert werden, welche die Exons der
insertierten DNA betreffen. Solch ein Verfahren kann codierende
Regionen in der YAC-DNA identifizieren, welche mit den äquivalenten
Regionen von DNA von einer Person, welche von einer Gemütserkankung
oder einer verwandten Erkrankung betroffen ist, verglichen werden
kann, um das relevante Gen zu identifizieren.
-
Entsprechend
umfasst ein weiterer Aspekt der Erfindung ein Verfahren zum Identifizieren
von mindestens einem humanen Gen, einschließlich mutierter Varianten und
Polymorphismen davon, welches mit einer bipolaren Störung verbunden
ist, worin das Verfahren die Schritte umfasst:
- (a)
Transfizieren von Säugerzellen
mit einem Exon-Trap-Cosmidvektor, hergestellt und kartiert wie oben
beschrieben,
- (b) Kultivieren der Säugerzellen
in einem geeigneten Medium,
- (c) Isolieren von RNA-Transkripten, welche von dem SV40-Promotor
exprimiert werden,
- (d) Herstellen von cDNA von solchen RNA-Transkripten,
- (e) Identifizieren von Splicing-Ereignissen, welche die Exons
der in den Exon-Trap-Vektor
subklonierten DNA betreffen, um die Positionen der codierenden Regionen
in der subklonierten DNA zu identifizieren,
- (f) Nachweisen von Unterschieden zwischen den codierenden Regionen
und äquivalenten
Regionen in der DNA eines Individuums, welches unter der bipolaren
Störung
leidet, und
- (g) Identifizieren des Gens oder von mutierten oder polymorphen
Varianten davon, welches mit der bipolaren Störung verbunden ist.
-
Als
eine Alternative zum Exon-Trapping kann die YAC-DNA in BAC-, PAC-, Cosmid-
oder andere Vektoren subkloniert werden und wie oben beschrieben
kann eine Contig-Karte konstruiert werden. Es sind verschiedene
bekannte Verfahren verfügbar,
durch welche die Position von relevanten Genen der subklonierten DNA
wie folgt ermittelt werden kann:
- (a) cDNA-Selektion
oder Capture (auch direkte Selektion und cDNA-Selektion genannt): Dieses Verfahren betrifft
die Bildung von Heteroduplexen aus genomischer DNA/cDNA durch Hybridisieren
einer klonierten cDNA (z.B. ein Insert einer YAC-DNA) mit einem
komplexen Gemisch von cDNAs, wie etwa den Inserts von allen cDNA
Klonen von einer speziellen cDNA-Bibliothek (z.B. Gehirn). Verwandte
Sequenzen hybridisieren und können
in nachfolgenden Schritten unter Verwendung von Biotin-Streptavidin-Capture
und PCR (oder verwandte Verfahren) angereichert werden;
- (b) Hybridisierung von mRNA/cDNA: Ein genomischer Klon (z.B.
ein Insert eines speziellen Cosmids) kann mit einem Northern Blot
von mRNA von einem Panel von Kulturzelllinien oder gegen geeignete
cDNA-Bibliotheken (z.B. Gehirn) hybridisiert werden. Ein positives
Signal kann das Vorliegen eines Gens innerhalb des klonierten Fragments
anzeigen;
- (c) CpG-Insel-Identifizierung: CpG- oder HTF-Inseln sind kurze
(etwa 1 kb) hypomethylierte GC-reiche (> 60%) Sequenzen, welche oft an den 5'-Enden von Genen
zu finden sind. CpG-Inseln weisen oft Restriktionsstellen für mehrere
selten schneidende Restriktionsenzyme auf. Ein Cluster von selten
schneidenden Restriktionsstellen weist auf eine CpG-Insel und somit
auf ein mögliches
Gen hin. CpG-Inseln können
durch Hybridisierung eines DNA-Klons mit Southern Blots von genomischer
DNA, welche mit selten schneidenden Enzymen verdaut wurde, oder
durch Insel-Rescue-PCR (Isolierung von CpG-Inseln von YACs durch Amplifizieren
von Sequenzen zwischen den Inseln und benachbarten Alu-Repeats)
nachgewiesen werden;
- (d) Zoo-Blotting: Hybridisierung eines DNA-Klons (z.B. das Insert
eines speziellen Cosmids) mit verringerter Stringenz gegen einen
Southern Blot von genomischen DNA-Proben von einer Vielzahl von
tierischen Spezies. Der Nachweis von Hybridisierungssignalen kann
konservierte Sequenzen anzeigen, welche auf ein mögliches
Gen hinweisen.
-
Entsprechend
umfasst ein weiterer Aspekt der Erfindung ein Verfahren zum Identifizieren
von mindestens einem humanen Gen, einschließlich mutierter und polymorpher
Varianten davon, welches mit einer bipolaren Erkrankung verbunden
ist, welches die Schritte umfasst:
- (a) Subklonieren
der YAC-DNA, wie oben beschrieben, in einen Cosmid-, BAC-, PAC-
oder anderen Vektor;
- (b) Verwenden der in einer der 1-11 gezeigten
Nukleotidsequenzen oder einer beliebigen anderen bekannten, mit
einem Tag versehenen Stelle (STS) in dieser Region, wie bei dem
hierin beschrieben YAC-Klon-Contig, oder eines Teils davon, welcher
aus nicht weniger als 14 benachbarten Basen besteht, oder dem Komplement
davon, um Überlappungen
zwischen den Subklonen nachzuweisen und eine Karte davon zu erstellen;
- (c) Identifizieren der Position der Gene innerhalb der subklonierten
DNA durch eines oder mehrere von CpG-Inselidentifizierung, Zoo-Blooting,
Hybridisierung der subklonierten DNA mit einer cDNA-Bibliothek oder
einem Northern Blot von mRNA von einem Panel von Kulturzelllinien;
- (d) Nachweisen von Unterschieden zwischen den Genen und einer äquivalenten
Region der DNA eines Individuums, welches unter einer bipolaren
Störung
leidet, und
- (e) Identifizieren des Gens, welches mit der bipolaren Störung verbunden
ist.
-
Wenn
die klonierte YAC-DNA sequenziert ist, kann eine Computeranalyse
verwendet werden, um das Vorhandensein von relevanten Genen zu ermitteln.
Es können
Verfahren wie etwa eine Homologiesuche und eine Exon-Vorhersage
verwendet werden.
-
Wenn
ein Kandidatengen einmal entsprechend den erfindungsgemäßen Verfahren
isoliert worden ist, können
zwischen dem Gen von einem normalen Individuum und einem Individuum,
welches von einer Erkrankung des bipolaren Spektrums betroffen ist,
ausführlichere
Vergleiche durchgeführt
werden. Beispielsweise gibt es zwei Verfahren, welche als "Mutationstest" beschrieben werden,
bei welchen eine Mutation oder ein Polymorphismus in einer DNA-Sequenz
identifiziert werden kann. In dem ersten Verfahren kann die DNA-Probe
untersucht werden im Hinblick auf das Vorhandensein oder Fehlen
einer spezifischen Mutation, dies erfordert jedoch Kenntnis darüber, welcher
Art die Mutation sein könnte.
In dem zweiten Verfahren wird eine DNA-Probe im Hinblick auf eine
beliebige Abweichung von einer Kontroll (normalen)-DNA gescreent.
Dieses letztere Verfahren ist bei der Identifizierung von Kandidatengenen,
bei welchen eine Mutation nicht im Voraus identifiziert wird, nützlicher.
-
Außerdem können weiterhin
die folgenden Verfahren angewendet werden, um ein Gen durch die
oben beschriebenen Verfahren zu identifizieren, um Unterschiede
zwischen Genen von normalen oder gesunden Individuen und denjenigen
Individuen, welche von einer bipolaren Störung betroffen sind, zu identifizieren:
- (a) Southern Blotting-Verfahren: Ein Klon wird
hybridisiert mit Nylonmembranen, welche genomische DNA von Patienten
und gesunden Individuen enthalten, welche mit unterschiedlichen
Restriktionsenzymen verdaut wurde. Unter Verwendung eines Protokolls
mit radioaktiver Markierung können
große
Unterschiede zwischen Patienten und gesunden Individuen sichtbar
gemacht werden;
- (b) Heteroduplexmobilität
in Polyacrylamidgelen: Dieses Verfahren basiert auf der Tatsache,
dass die Mobilität
von Heteroduplexen in nicht denaturierenden Polyacrylamidgelen geringer
ist als die Mobilität
von Homoduplexen. Es ist am effektivsten für Fragmente unter 200 Basenpaare;
- (c) Einzelstrang-Konformations-Polymorphismus-Analyse (SSCP
oder SSCA, „single-stranded
conformational polymorphism analysis"): Einzelsträngige DNA faltet sich unter
Bildung von komplexen Strukturen, welche durch schwache intramolekulare
Bindungen stabilisiert sind, zusammen. Die elektrophoretischen Mobilitäten dieser
Strukturen auf nicht denaturierenden Polyacrylamidgelen hängen von
ihren Kettenlängen und
ihrer Konformation ab;
- (d) chemische Spaltung von Fehlpaarungen (CCM, "chemical cleavage
of mismatches"):
Eine radiomarkierte Sonde wird mit der Test-DNA hybridisiert und
Fehlpaarungen werden durch eine Reihe von chemischen Reaktionen
nachgewiesen, welche einen Strang der DNA an der Stelle der Fehlpaarung
spalten. Dies ist ein sehr sensitives Verfahren und kann auf Proben
mit einer Länge
bis zu einem Bereich von Kilobasen angewendet werden;
- (e) enzymatische Spaltung von Fehlpaarungen: Der Assay ist ähnlich wie
die CCM, jedoch wird die Spaltung durch bestimmte Bakteriophagenenzyme
durchgeführt;
- (f) denaturierende Gradientengelelektrophorese: bei diesem Verfahren
werden DNA-Duplexe gezwungen, durch ein elektrophoretisches Gel
zu migrieren, in welchem ein Gradient von steigenden Mengen eines
denaturierenden Mittels (chemisch oder Temperatur) vorliegt. Die
Migration dauert an, bis die DNA-Duplexe eine
Position auf dem Gel erreichen, an welcher die Stränge schmlzen
und sich trennen, wonach die denaturierte DNA nicht viel weiter
migriert. Ein Unterschied von einem einzelnen Basenpaar zwischen
einem normalen und einem mutierten DNA-Duplex ist ausreichend, um
eine Migration an unterschiedliche Positionen in dem Gel zu bewirken;
- (g) direkte DNA-Sequenzierung.
-
Es
ist verständlich,
dass hinsichtlich der hierin beschriebenen Verfahren bei dem Schritt
Nachweisen von Unterschieden zwischen den codierenden Regionen von
dem YAC und der DNA eines von einer bipolaren Störung betroffenen Individuums
das Individuum irgend jemand mit einer Erkrankung sein kann und
nicht notwendigerweise ein Mitglied der Familie MAD31 sein muss.
-
In
dem folgenden Bericht der Versuche erfolgt eine Bezugnahme auf die
folgenden Figuren:
-
1 zeigt
eine Sequenz von Nukleotiden, welche die Endsequenz des linken Arms
von YAC 766_f_12 ist;
-
2 zeigt
eine Nukleotidsequenz, welche eine Endesequenz des rechten Arms
von YAC 766_f_12 ist;
-
3 zeigt
eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von
YAC 717_d_3 ist;
-
4 zeigt
eine Nukleotidsequenz, welche eine Endesequenz des rechten Arms
von YAC 717_d_3 ist;
-
5 zeigt
eine Nukleotidsequenz, welche eine Endsequenz des rechten Arms von
YAC 731_c_7 ist;
-
6 zeigt
eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von
YAC 752_g_8 ist;
-
7 zeigt
eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von
YAC 942_c_3 ist;
-
8 zeigt
eine Nukleotidsequenz, welche eine Endsequenz des rechten Arms von
YAC 942_c_3 ist;
-
9 zeigt
eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von
YAC 961_h_9 ist;
-
10 zeigt eine Nukleotidsequenz, welche eine Endsequenz
eines rechten Arms von YAC 961_h_9 ist;
-
11 zeigt eine Nukleotidsequenz, welche eine Endsequenz
des linken Arms von YAC 907_e_1 ist;
-
12 zeigt einen Stammbaum der Familie MAD31;
-
13 zeigt die Haplotyp-Analyse der Familie MAD13.
Betroffene Individuen sind durch gefüllte Karos dargestellt, offene
Karos stellen Individuen dar, welche bei der letzten psychiatrischen
Bewertung asymptomatisch waren. Dunkle graue Balken repräsentieren
Marker, bei welchen nicht abgeleitet werden kann, ob sie rekombinant
sind; und
-
14 zeigt die YAC-Contig-Karte der Region des humanen
Chromosoms 18 zwischen den polymorphen Markern D18560 und D18561.
Schwarze Linien repräsentieren
positive Treffer. Die YACs sind nicht maßstabsgetreu gezeichnet.
-
15 zeigt (a) ein CAG-Repeat (fett) und
die umgebende Nukleotidsequenz, isoliert vom YAC 961_h_9. Die kursive
Sequenz stammt von dem End-Rescue
des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des
Ausmaßes
der Trinukleotid-Repeats in der Sequenz verwendet werden können.
-
16 zeigt (a) ein CAG-Repeat (fett) und
die umgebende Nukleotidsequenz, isoliert vom YAC 766_f_12. Die kursive
Sequenz stammt von dem End-Rescue
des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des
Ausmaßes
der Trinukleotid-Repeats in der Sequenz verwendet werden können.
-
17 zeigt (a) ein CAG-Repeat (fett) und
die umgebende Nukleotid sequenz, isoliert von YAC 766_f_12. Die kursive
Sequenz stammt von dem End-Rescue
des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des
Ausmaßes
der Trinukleotid-Repeats in der Sequenz verwendet werden können.
-
18 zeigt (a) ein CAG-Repeat (fett) und
die umgebende Nukleotidsequenz, isoliert von YAC 907_e_1. Die kursive
Sequenz stammt von dem End-Rescue
des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des
Ausmaßes
der Trinukleotid-Repeats in der Sequenz verwendet werden können.
-
Versuch 1
-
(a) Familiendaten
-
Klinische
Diagnosen in MAD31, einer belgischen Familie mit einem BPII-Probanden, wurden
ausführlich
von De Bruyn et al., 1996, beschrieben. In dieser Studie wurden
nur die 15 Familienmitglieder für
eine zusätzliche
Genotypisierung ausgewählt,
welche bei einer Verbindungsanalyse aussagefähig waren. Die unterschiedlichen
klinischen Diagnosen in der Familie waren wie folgt: 1 BPI, 2 BPII,
2UP, 4 depressive Haupterkrankung (MDD, „major depressive disorder"), 1 SAm und 1 SAd.
-
Der
Stammbaum der Familie MAD31 ist in 12 gezeigt.
-
(b) Genotypisierung der
Familienmitglieder
-
Alle
genetischen Marker für
kurze Tandemrepeats (STR, "short
tandem repeats")
sind Di- oder Tetranukleotid-Repeat-Polymorphismen. Die Information
betreffend die in dieser Untersuchung verwendeten genetischen Marker
wurde von mehreren Quellen des Internets erhalten: Genome DataBase
(GDB, http://gdbww.gdb.org/), GenBank (http://www.ncbi.nlm.nih.gov/),
Cooperative Human Linkage Center (CHLC, http://www.chlc.org/), Eccles
Institute of Human Genetics (EIHG, http://www.genetics.utah.edu/)
und Généthon (http://www.genethon.fr/).
Es wurde eine Standard-PCR in einem Volumen von 25 μl durchgeführt, enthaltend 100
ng genomische DNA, 200 mM von jedem dNTP, 1,25 mM MgCl2,
30 pmol von jedem Primer und 0,2 Unit Goldstar DNA-Polymerase (Eurogentec).
Ein Primer wurde vor der PCR mit [gamma-32P]ATP
und T4-Polynukleotidkinase
am Ende markiert. Nach einem anfänglichen
Denaturierungsschritt bei 94 °C
für 2 min
wurden 27 Zyklen bei 94 °C
für 1 min
durchgeführt,
bei der passenden Annealingtemperatur für 1,5 min, und eine Extension
bei 72 °C
für 2 min.
Schließlich
wurde ein zusätzlicher
Verlängerungsschritt
bei 72 °C
für 5 min
durchgeführt.
Die PCR-Produkte wurden durch Elektrophorese auf einem 6%-igen denaturierenden
Polyacrylamidgel und durch Exposition gegenüber einem röntgenempfindlichen Film durchgeführt. Erfolgreich
analysierte STSs, STRs und ESTs, welche die verfeinerte Kandidatenregion
abdecken, werden hierin nachfolgend detailliert beschrieben.
-
(c) Lod-Score-Analyse
-
Zweipunkt-Lod-Scores
wurden für
drei unterschiedliche Erkrankungsmodelle unter Verwendung von Fastlink
2.2. (Cottingham et al., 1993) berechnet. Bei allen Modellen wurde
eine Frequenz des Erkrankungsgens von 1 % und eine Phänokopierate
von 1/1000 verwendet. Modell 1 umfasste alle Patienten und nicht
betroffene Individuen, wobei die letzteren Individuen in Abhängigkeit
von ihrem Alter bei der Untersuchung einer Erkrankungspenetranzklasse
zugeordnet wurden. Die 9 altersabhängigen Penetranzklassen, wie
von De Bruyn et al. (1996) beschrieben, wurden mit einem Faktor
0,7 multipliziert, entsprechend einer Verringerung der maximalen
Penetranz von 99% auf 70% bei Individuen, welche älter sind
als 60 Jahre (Ott, 1991). Modell 2 ist ähnlich wie Modell 1, jedoch
wurden die Patienten einem diagnostischen Stabilitäts-Score
zugeordnet, berechnet aufgrund von klinischen Daten wie etwa der
Anzahl der Anfälle,
der Anzahl der Symptome während des
schlimmsten Anfalls und der Behandlungsgeschichte (Rice et al.,
1987, De Bruyn et al., 1996). Modell 3 ist wie Modell 1, umfasst
jedoch nur Patienten.
-
(d) Konstruktion der YAC-Contig-Protokolle
-
Das
Anziehen der YACs und die Extraktion der YAC-DNA wurde gemäß Standardverfahren
durchgeführt
(Silverman, 1995). Für
die Konstruktion des YAC-Contig,
welches die Kandidationregion des Chromosoms 18q umfasst, basieren
die Daten der physikalischen Karte auf mit einem Tag markierten
Sequenzstellen (STS, „sequence
tagged sites") (Hudson
et al., 1995), wozu die Internetseite des Whitehead Institute (WI) (http://www-genome.wi.mit.edu/)
konsultiert wurde. CEPH Mega-YACs wurden von dem YAC-Screening-Zentrum
Leiden (YSCL, Niederlande) und von CEPH (Paris, Frankreich) erhalten.
Die YACs wurden bezüglich des Vorhandenseins
von STSs und STRs untersucht, welche zuvor zwischen D18S51 und D18S61
lokalisiert wurden, durch Touchdown-PCR-Amplifikation. Die Information über die
STSs/STRs wurde von den Internetseiten von WI, GDB, Généthon,
CHLC und GenBank erhalten. 30 PCR-Zyklen bestanden aus: Denaturierung
bei 94 °C
für 1 min,
Annealing (2 Zyklen für
jede Temperatur), beginnend bei 65 °C und zunehmend auf 51 °C für 1,5 min
und Verlängerung
bei 72 °C
für 2 min.
Diesen folgten 10 Zyklen mit Denaturierung bei 94 °C für 1 min, Annealing
bei 50 °C
für 1,5
min und Verlängerung
bei 72 °C
für 2 min
gefolgt. Ein abschließender
Verlängerungsschritt
wurde für
10 min bei 72 °C
durchgeführt.
Die amplifizierten Produkte wurden durch Elektrophorese auf einem
1%-igen TBE-Agarosegel
und Ethidiumbromidfärbung
sichtbar gemacht.
-
(e) Ordnen der STR-Marker
-
12
STR-Marker, zuvor zwischen D18S51 und D18S61 lokalisiert, wurden
im Hinblick auf eine Cosegregation mit einer bipolaren Störung in
der Familie MAD31 untersucht. Die elterlichen Haplotypen wurden
rekonstruiert durch die Genotypinformation der Geschwister in der
Familie MAD31 und Minimieren der Anzahl der positiven Rekombinanten.
Das Ergebnis dieser Analyse ist in 13 gezeigt.
Der Vater war im Hinblick auf 3 Marker nicht informativ, die Mutter
war im Hinblick auf 5 Marker nicht informativ. Die Haplotypen in
der Familie MAD31 deuteten die folgende Ordnung der analysierten
STR-Marker an: cen-[S51-S68-S346]-[S55-S969-S1113-S483-S465]-[S876-S477]-S979-[S466-S817-S61]-tel.
Die Ordnung der Marker relativ zueinander zwischen den Klammern
konnte von unseren Haplotypdaten nicht abgeleitet werden. Die Markerordnung
in der Familie MAD31 wurde verglichen mit der Markerordnung, welche
unter Verwendung von unterschiedlichen Kartierungstechniken erhalten
wurde und die Ergebnisse sind in Tabelle 1 unten gezeigt.
-
Tabelle
1: Vergleich der Ordnung der Marker innerhalb der Kandidatenregion
18q für
eine bipolare Störung
zwischen mehreren Karten.
-
- *Ordnung gemäß den Haplotypisierungsergebnissen
in der Familie MAD31.
- (–)
Marker ist proximal von D18S68 lokalisiert.
-
D18S68,
welcher allen drei Karten gemeinsam war, wurde als der Kartenankerpunkt
genommen, und die genetische Distanz der anderen Marker relativ
zu D18S68 ist in cM oder cR angegeben. Die Ordnung der Marker stimmt
gut mit der Ordnung der Marker auf der kürzlich veröffentlichten Strahlungshybridkarte
von Chromosom 18 (Giacolone et al., 1996, Genomics 37:9-18) und
mit der WI YAC-Contig-Karte
(http://www-genome.wi.mit.edu/) überein.
Jedoch wurden einige wenige Abweichungen von anderen Karten beobachtet.
Die einzige Abweichung von der genetische Karte von Généthon ist
die umgekehrte Reihenfolge von D18S465 und D18S477. Zwei Abweichungen
wurden im Hinblick auf die Marshfield-Karte beobachtet (http://www.marshmed.org/genetics/).
Die Erfinder der vorliegenden Erfindung kartierten D18S346 oberhalb
von D18S55, basierend auf maternalen Haplotypen, aber auf den Marshfield-Karten
ist D18S346 zwischen D18S483 und D18S979 lokalisiert. Die Erfinder
platzierten auch D18S817 unterhalb von D18S979, jedoch auf der Marshfield-Karte
ist dieser Marker zwischen D18S465 und D18S477 lokalisiert. Jedoch
stimmt die Lokalisierung von D18S346 und D18S817 mit der Strahlungshybridkarte
des Chromosoms 18 von Giacolone et al. (1996) überein. Eine Abweichung wurde
auch beobachtet von der WI-Strahlungshybridkarte
(http://www-genome.wi.mit.edu/), in welcher D18S68 unterhalb von
D18S465 lokalisiert war. Die Erfinder ebenso wie andere Karten platzierten
diesen Marker jedoch oberhalb von D18S55.
-
(f) Lod-Score-Analyse
und Verfeinerung der Kandidatenregion
-
Eine
Lod-Score-Analyse ergab mit allen Markern positive Ergebnisse, was
die vorherige Beobachtung bestätigt,
dass 18q21.33-q23 in eine BP-Erkrankung verwickelt ist, zumindest
in der Familie MAD31 (De Bruyn et al., 1996). Eine Zusammenfassung
der Statistik der Lod-Score-Analyse von allen Modellen ist in Tabelle
2 unten angegeben.
-
Tabelle
2: Zusammenfassende Statistik der Zweipunkt-Lod-Scores in MAD31.
-
- D18S55, S18S483, D18S465 und D18S466 waren nicht aussagefähig.
-
Der
höchste
Zweipunkt-Lod-Score (+2.01 bei θ =
0.0) wurde mit den Markern D18S1113, D18S876 und D18S477 gemäß Modell
1 in Abwesenheit von Rekombinanten erhalten (Tabelle 2). Im Modell
1 werden alle Individuen mit einer Erkrankung des BP-Spektrums als
betroffen betrachtet und tragen vollständig zu der Verbindungsanalyse
bei. Vor der Feinkartierung war die Kandidatenregion von D18S51
und D18S61 flankiert, welche durch eine genetische Distanz von 15.2
cM auf der Marshfield-Karte oder 13.1 cM auf der Généthon-Karte
getrennt sind. Die informativen Rekombinanten mit D18S51 und D18S61
wurden in zwei betroffenen Individuen (II.10 und II.11 in 13) beobachtet. Da jedoch keine anderen Marker
innerhalb der Kandidatenregion untersucht wurden, war nicht bekannt,
ob diese Individuen tatsächlich
eine Region enthalten, welche aufgrund der Herkunft identisch (IBD, "identical-by-descent") war. Die zusätzlichen
Daten der genetischen Kartierung zeigen nun, dass alle betroffenen
Individuen Allele bei D18S969, D18S1113, D18S876 und D18S477 teilen
(13, Haplotyp in der Box). Auch die Allele der
Marker D18S483 und D18S465 sind wahrscheinlich IDB, aber diese Marker
waren in dem betroffenen Elternteil I.1 nicht aufschlussreich. Obligate
Rekombinanten wurden mit den STR-Markern D18S68, D18S346, D18S979
und D18S817 beobachtet (Tabelle 2, 13).
Da Abweichungen bei den Lokalisierungen von D18S346 und D18S817
zwischen den unterschiedlichen Karten beobachtet wurden, verwendeten
die Erfinder der vorliegenden Erfindung D18S68 und D18S979, um die
Kandidatenregion für
eine BP-Erkrankung neu zu definieren. Die genetische Distanz zwischen
diesen zwei Markern beträgt
8.9 cM, bezogen auf die genetische Marshfield-Karte (http.//www.marshmed.org/genetics/).
-
(g) Konstruktion des YAC-Contigs
-
In Übereinstimmung
mit der integrierten WI-Karte sind in der anfänglichen Kandidatenregion 56
CEPH Mega-YACs lokalisiert, welche zwischen D18S51 und D18S61 enthalten
sind (Chumakov et al. (1995) Nature 377, Ergänzungsband, De Bruyn et al.
(1996)). Von diesen YACs wurden diejenigen ausgewählt, welche
in der Region zwischen D18S60 und D18S61 lokalisiert waren. D18S51
ist auf der WI-Karte nicht dargestellt, ist jedoch gemäß der genetischen
Marshfield-Karte (http.//www.marshmed.org/genetics/) nahe D18S60
lokalisiert. Um die Anzahl der potenziellen chimären YACs zu begrenzen, wurden
diejenigen YACs eliminiert, welche auch für andere STSs als denjenigen
auf Chromosom 18 positiv waren. Als solche wurden 25 YACs ausgewählt (siehe 14) und in einem Contig platziert, auf Basis des
YAC-Contig-Kartierungsverfahrens, d.h. Sequenzen von mit einem Tag
versehenen Sequenzstellen (STSs), einfachen Tandem-Repeats (STRs)
und exprimierten sequenzierten Tags (ESTs), welche bekanntermaßen zwischen D18S60
und D18S61 liegen, wurden durch PCR der DNA von den YAC-Klonen amplifiziert.
Die verwendeten STS-, STR- und EST-Sequenzen werden hierin nachfolgend
beschrieben. Positive YAC-Klone wurden in einer YAC-Contig-Karte
zusammengefasst (14).
-
In
dem YAC-Contig verblieben drei Lücken,
wovon eine in der verfeinerten Kandidatenregion zwischen D18S876
und GCT3G01 lokalisiert war. Um die Lücke zwischen D18S876 und GCT3G01
zu schließen,
wurden 14 YAC-Klone weiter analysiert (Tabelle 3). Es wurden die
Endfragmente der YAC-Klone 766_f_12 (SV11R), 752_g_8 (SV31L), 942_c_3
(SV10R) erhalten und sequenziert (siehe unten). Es wurden Primer
von diesen drei Sequenzen ausgewählt
und die DNA von jedem der 14 YAC-Klone wurde durch PCR amplifiziert. Wie
in Tabelle 3 gezeigt, wurden Überlappungen
zwischen 7 YAC-Klonen an der Centromerstelle x und zwischen 2 YAC-Klonen
an der Telomerstelle (717_d_3 und 907_e_1) Überlappungen.
-
Der
abschließende
YAC-Contig ist in 14 gezeigt. In der Figur sind
nur die YAC-Klone gezeigt, welche eindeutige Treffer mit den STSs,
STRs und ESTs des Chromosoms 18 ergaben. In wenigen Fällen wurden auch
schwache positive Signale mit einigen der YAC-Klone erhalten, welche
wahrscheinlich falsch-positive Ergebnisse darstellen. Jedoch beeinflussten
diese Signale den Abgleich der YAC-Klone in dem Contig nicht. Obwohl alle
YACs, welche bekanntermaßen
in der Region kartiert sind, ebenso wie alle verfügbaren STSs/STRs getestet
wurden, war anfänglich
die Lücke
in dem YAC-Contig nicht geschlossen. Jedoch wurde dies nachfolgend
errreicht durch Bestimmen der Endsequenzen der 8 ausgewählten YACs
(siehe unten). Die Reihenfolge der Marker, bereitgestellt durch
die YAC-Contig-Karte,
ist in vollständiger Übereinstimmung
mit der Reihenfolge der Marker, welche durch die WI-Karte bereitgestellt
wird, welche die Information von der genetischen Karte, der Strahlungshybridkarte
und der STS-YAC-Contig-Karte ergänzt
(Hudson et al., 1995). Die YAC-Contig-Karte bestätigt auch die Reihenfolge der
STR-Marker, welche durch die Haplotypanalyse der Familie MAD31 nahegelegt
war. Außerdem
stellt die YAC-Contig-Karte zusätzliche
Informationen über
die relative Reihenfolge der STR-Marker bereit. Beispielsweise liegt
D18S55 in YAC 931_g_10, jedoch nicht in 931_f_1 vor (14), wobei D18S55 von der Gruppe [S55-S969-S1113-S483-S465]
getrennt ist, welche durch die Haplotypanalyse in der Familie MAD31
erhalten wurde. Die centromere Lokalisierung von D18S55 wird definiert durch
den STS/STR-Gehalt der umgebenden YACs (14).
Wenn wir die Haplotypdaten und die YAC-Contig-Karte kombinieren,
wird die folgende Reihenfolge der STR-Marker erhalten: cen-[S51-S68-S346]-S55-[S969-S1113]-[S483-S465]-S876-S477-S979-S466-[S817-S61]-tel.
-
Von
den 25 YAC-Klonen, welche den vollständigen Contig umspannen, wurden
7 YAC-Klone ausgewählt,
um den minimalen Weg der Anornung ("tiling path") zu identifizieren (Tabelle 4). Diese
7 YAC-Klone decken die gesamte verfeinerte Region des Chromosoms
18 ab. Außerdem
sollten die YAC-Klone bevorzugt nicht chimär sein, d.h. sie sollten nur
Fragmente des humanen Chromosoms 18 enthalten. Um eine Untersuchung
im Hinblick auf das Vorliegen von Chimären durchzuführen, wurden
beide Enden dieser YACs subkloniert und sequenziert (siehe unten).
Für jede
der Sequenzen wurden Primer erhalten und DNA aus einem monochromosomalen
Kartierungspanel wurde durch PCR unter Verwendung dieser Primer
amplifiziert. Wie hierin nachfolgen angegeben wird, enthielten einige
der YAC-Klone Fragmente von anderen Chromosomen abgesehen vom humanen
Chromosom 18.
-
Dann
wurden drei YAC-Klone ausgewählt,
welche den minimalen Weg der Anornung umfassten (Tabelle 5). Wie
durch eine Pulsfeld-Gelelektrophorese ermittelt wurde, waren diese
drei YAC-Klone stabil und ihre Größen stimmten gut mit den veröffentlichten
Größen überein.
Diese YAC-Klone wurden in andere Hefe-Wirtsstämmen für eine Restriktionskartierung übertragen
und sind Gegenstand einer weiteren Subklonierung.
-
Beschreibung
der erfolgreich analysierten STSs, STRs und ESTs, welche die verfeinerte
Kandidatenregion abdecken.
-
Erklärungen:
-
- • STS
("Sequence Tagged
Site"): mit einem
Sequenz-Tag versehene Stelle
- • STR
(„Simple
Tandem Repeat"):
einfaches Tandem-Repeat
- • EST
(„Expressed
Sequence Tag"):
Exprimiertes Sequenz-Tag
-
Diese
Marker werden von dem Centromer zum Telomer hin angeordnet. Es sind
nur die Marker angegeben, welche effektiv untersucht wurden und
welche auf den YACs funktionierten.
-
Liste:
-
1. D18S60:
-
- Datenbank ID: AFM178XE3 (auch als 178xe3, Z16781, D18S60
bekannt)
- Quelle: J Weissenbach, Genethon: "genetically mapped polymorphic STSs"
- Chromosom: Chr18
- Primer:
- Links = CCTGGCTCACCTGGCA
- Rechts = TTGTAGCATCGTTGTAATGTTCC
- Produktlänge
= 157
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z16781
- Beschreibung: H. sapiens (D18S60) DNA-Segment mit (CA)-Repeat;
- Klon
- Suche nach GDB-Eintrag
-
2. WI-9222:
-
- Datenbank ID: UTR-03540 (auch als G06101, D18S1033, 9222,
X63657 bekannt)
- Quelle: WICGR: Primer von Genbank-Sequenzen
- Chromosom: Chr18
- Primer:
- Links = GATCCCATAAAGCTACGAGGG
- Rechts = GAGTCTAAAGACAAGAAAGCATTGC
- Produktlänge
= 99
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: X63657
- Beschreibung: H. sapiens fvt1 mRNA
- Suche nach GDB-Eintrag
-
3. WI-7336:
-
- Datenbank ID: UTR-04664 (auch als PI5, G00-679-135, G06527,
7336, U04313 bekannt)
- Quelle: WICGR: Primer von Genbank-Sequenzen
- Chromosom: Chr18
- Primer:
- Links = AGACATTCTCGCTTCCCTGA
- Rechts = AATTTTGACCCCTTATGGGC
- Produktlänge
= 332
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G06527
- Beschreibung: WICGR: Statistische genomweite STSs
-
4. WI-8145:
-
- Datenbank ID: EST 102441 (auch als D18S1234, G00-677-827,
G06845, 8145, T49159 bekannt)
- Quelle: WICGR: STSs von dbEST-Sequenzen
- Chromosom: Chr18
- Primer:
- Links = GAAATGCACATAACATATATTTGCC
- Rechts = TGCTCACTGCCTATTTAATGTAGC
- Produktlänge
= 184
-
Überblick
der vollständigen
Sequenz
-
- Linker und rechter Primer
- PCR-Bedingungen
- Genbank ID: T49159
- Beschreibung: yb09e07.s1; Homo sapiens cDNA-Klon 70692 3' ähnlich wie gb:J02685
- UNiGene-Cluster-Beschreibung: Humane mRNA für Arg-Serpin (Plasminogen-Aktivator 2, PAI-2),
Suche nach GDB-Eintrag
-
5. WI-7061:
-
- Datenbank ID: UTR-02902 (auch als PAI2, G00-678-979, G06377,
7061, M18082 bekannt)
- Quelle: WICGR: Primer von Datenbank-Sequenzen
- Chromosom: Chr18
- Primer:
- Links = TGCTCTTCTGAACAACTTCTGC
- Rechts = ATAGAAGGGCATGGAGGGAT
- Produktlänge
= 338
-
Überblick
der vollständigen
Sequenz
-
- PCR-Bedingungen
- Genbank ID: G06377
- Beschreibung: WICGR: Statistische genomweite STSs
-
6. D18S68:
-
- Datenbank ID: AFM248YB9 (auch als 248yb9, Z17122, D18S68
bekannt)
- J Weissenbach, Genethon: "genetically
mapped polymorphic STSs"
- Chromosom: Chr18
- Primer:
- Links = ATGGGAGACGTAATACACCC
- Rechts = ATGCTGCTGGTCTGAGG
- Produktlänge
= 285
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z17122
- Beschreibung: H. sapiens (D18S68) DNA-Segment mit (CA)-Repeat;
- Klon
-
7. WI-3170:
-
- Datenbank ID: MR3726 (auch als D18S1037, G04207, HALd22f2,
3170 bekannt)
- Quelle: WICGR: Statistische genomweite STSs
- Chromosom: Chr18
- Primer:
- Links = TGTGCTACTGATTAAGGTAAAGGC
- Rechts = TGCTTCTTCAATTTGTAGAGTTGG
- Produktlänge
= 156
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G04207
- Beschreibung: WICGR: Statistische genomweite STSs
-
8. WI-5654:
-
- Datenbank ID: MR10908 (auch als D18S1259, G00-678-695, G05278,
5654 bekannt)
- Quelle: WICGR: Statistische genomweite STSs
- Chromosom: Chr18
- Primer:
- Links = CTTAATGAAAACAATGCCAGAGC
- Rechts = TGCAAAATGTGGAATAATCTGG
- Produktlänge
= 149
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G05278
- Beschreibung: WICGR: Statistische genomweite STSs
-
9. WI-5654:
-
- Datenbank ID: AFM122XC1 (auch als 122xc1, Z16621, D18S55,
GC378-D18S55 bekannt)
- Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = GGGAAGTCAAATGCAAAATC
- Rechts = AGCTTCTGAGTAATCTTATGCTGTG
- Produktlänge
= 143
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z16621
- Beschreibung: H. sapiens (D18S55) DNA-Fragment mit (CA)-Repeat;
- Klon
-
10. D18S969:
-
- Datenbank ID: GATA-P18099 (auch als G08003, CHLC.GATA69F01,
CHLC.GATA69F01.P18099 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats;
- Chromosom: Chr18
- Primer:
- Links = AACAAGTGTGTATGGGGGTG
- Rechts = CATATTCACCCAGTTTGTTGC
- Produktlänge
= 365
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G08003
- Beschreibung: Human STS CHLC.GATA69F01.P18099 KLon GATA69F01.
-
11. D18S1113:
-
- Datenbank ID: AFM200VG9 (auch als D18S1113, 200vg9, w2403
bekannt)
- Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = GTTGACTCAAGTCCAAACCTG
- Rechts = CAAAGACATTGTAGACGTTCTCTG
- Produktlänge
= 207
-
Überblick
der vollständigen
Sequenz
-
12. D18S868:
-
- Datenbank ID: GATA-D18S868 (auch als G09150, CHLC.GATA3E12,
CHCL.GATA3E12.496. CHLC.496, D18S868 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = AGCCAATACCTTGTAGTAAATATCC
- Rechts = GATTCTCCAGACAAATAATCCC
- Produktlänge
= 189
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G09150
- Beschreibung: Human STS CHLC.GATA3E12. P6553 KLon GATA3E12.
-
13. WI-9959:
-
- Datenbank ID: MR12816 (auch als D18S1251, G00-678-524, G05488,
9959 bekannt)
- Quelle: WICGR: Statistische genomweite STSs
- Chromosom: Chr18
- Primer:
- Links = TGCCAACAGCAGTCAAGC
- Rechts = AGCACCTGCAGCAGTAATAGC
- Produktlänge
= 110
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G05488
- Beschreibung: WICGR: Statistische genomweite STSs;
- Suche nach Datenbank-Eintrag
-
14. D18S537:
-
- Datenbank ID: CHLC.GATA2E06.13 (auch als CHLC.13, GATA2E06,
D18S537, GATA-D18S537 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = TCCATCTATCTTTGATGTATCTATG
- Rechts = AGTTAGCAGACTATGTTAATCAGGA
- Produktlänge
= 191
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G07990
- Beschreibung: Human STS CHLC.GATA2E06.P6006 KLon GATA2E06.
- Suche nach Datenbank-Eintrag
-
15. D18S483:
-
- Datenbank ID: AFM324WC9 (auch als 324wc9, Z24399, D18S483
bekannt)
- Quelle: J. Weissenbach, Genethon: Genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = TTCTGCACAATTTCAATAGATTC
- Rechts = GAACTGAGCAAACGAGTATGA
- Produktlänge
= 214
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z24399
- Beschreibung: H. sapiens (D18S483) DNA-Segment mit (CA)-Repeat;
- KLon
- Suche nach Datenbank-Eintrag
-
16. D18S483:
-
- Datenbank ID: AFM250YH1 (auch als 260yh1, Z23850, D18S465
bekannt)
- Quelle: J. Weissenbach, Genethon: Genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = ATATTCCCCTATGGAAGTACAG
- Rechts = AAAGTTAATTTTCAGGCACTCT
- Produktlänge
= 232
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z23850
- Beschreibung: H. sapiens (D18S465) DNA-Segment mit (CA)-Repeat;
- KLon
- Suche nach Datenbank-Eintrag
-
17. D18S968:
-
- Datenbank ID: GATA-P34272 (auch als G10262, CHLC.GATA117C05,
CHLC.GATA117C05.P34272 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = GAAATTAACCAGACACTCCTAACC
- Rechts = CTTAGAATTGCCTTTGCTGC
- Produktlänge
= 147
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G10262
- Beschreibung: Human STS CHLC.GATA117C05.P34272 Klon GATA117C05.
-
18. GATA-P6051
-
- Datenbank ID: GATA-P6051 (auch als CHLC.GATA3E08, CHLC.GATA3E08.P6051
bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = GCAACAACCCTAATGAGTATACG
- Rechts = GAGTCTCACCAGGGCTTACA
- Produktlänge
= 149
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G09104
- Beschreibung: Human STS CHLC.GATA3E08.P6051 Klon GATA3E08.
-
19. D18S537:
-
- Datenbank ID: GATA-D18S875 (auch als G08001, CHLC.GATA52H04,
D18S875 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = TCCTCTCATCTCGGATATGG
- Rechts = AAGGCTTTCAGACTTACACTGG
- Produktlänge
= 394
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G08001
- Beschreibung: Human STS CHLC.GATA52H04.P16177 Klon GATA52H04.
- Suche nach Datenbank-Eintrag
-
20. WI-2620:
-
- Datenbank ID: MR1436 (auch als G03602, D18S890, HHAa12h3,
2620 bekannt)
- Quelle: WICGR: Statistische genomweite STSs
- Chromosom: Chr18
- Primer:
- Links = TCTCCAAGCTATTGATTGGATAA
- Rechts = TTAAGAGCCAATTTATATAAAAGCAGC
- Produktlänge
= 177
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G03602
- Beschreibung: WICGR: Statistische genomweite STSs;
- Suche nach Datenbank-Eintrag
-
21. WI-4211:
-
- Datenbank ID: MR6638 (auch als G03617, D18S980, 4211 bekannt)
- Quelle: WICGR: Statistische genomweite STSs
- Chromosom: Chr18
- Primer:
- Links = ATGCTTCAGGATGACGTAATACA
- Rechts = AAATTCTCGCTGATTGGAGG
- Produktlänge
= 113
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G03617
- Beschreibung: WICGR: Statistische genomweite STSs;
- Suche nach Datenbank-Eintrag
-
22. D18S876:
-
- Datenbank ID: GATA-D18S876 (auch als G09963, CHLC.GATA61E10,
D18S876 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = TCAAACTTATAACTGCAGAGAACG
- Rechts = ATGGTAAACCCTCCCCATTA
- Produktlänge
= 171
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G09963
- Beschreibung: Human STS CHLC.GATA61E10.P17745 Klon GATA61E10.
- Suche nach Datenbank-Eintrag
-
23. GCT3G01:
-
- Datenbank ID: GCT-P10825 (auch als G09484, CHLC.GCT3G01,
CHLC.GCT3G01.P10825 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = CTTTGCAATCTTAGTTAATTGGC
- Rechts = GAACTATGATATGGAGTAACAGCG
- Produktlänge
= 128
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G09484
- Beschreibung: Human STS CHLC.GCT3G01.P10825 Klon GCT3G01.
-
24. WI-528:
-
- Datenbank ID: MR232 (auch als G03589, 582, D18S828 bekannt)
- Quelle: WICGR: Statistische genomweite STSs
- Chromosom: Chr18
- Primer:
- Links = TTCTGCCTTTCCTGACTGTC
- Rechts = TGTTTCCCATGTCTTGATGA
- Produktlänge
= 211
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G03589
- Beschreibung: WICGR: Statistische genomweite STSs;
- Suche nach Datenbank-Eintrag
-
25. WI-1783:
-
- Datenbank ID: MR432 (auch als G03587, _shu_31.Seq, 1783,
D18S824 bekannt)
- Quelle: WICGR: Statistische genomweite STSs
- Chromosom: Chr18
- Primer:
- Links = CCAGTAATTAGACATTGACAGGTTC
- Rechts = TTTTACTAGACAGGCTTGATAAACAA
- Produktlänge
= 305
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G03587
- Beschreibung: WICGR: Statistische genomweite STSs;
- Suche nach Datenbank-Eintrag
-
26. D18S477:
-
- Datenbank ID: AFM301XF5 (auch als 301xf5, Z24212, D18S477
bekannt)
- Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = GGACATCCTTGATTTGCTCATAA
- Rechts = GATTGACTGAAAACAGGCACAT
- Produktlänge
= 243
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z24212
- Beschreibung: H. sapiens (D18S477) DNA-SEgment mit (CA)-Repeat;
- KLon
- Suche nach GDB-Eintrag
-
27. D18S979:
-
- Datenbank ID: GATA-P28080 (auch als G08015, CHLC.GATA92C08,
CHLC.GATA92C08.P28080 bekannt)
- Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
- Chromosom: Chr18
- Primer:
- Links = AGCTTGCAGATAGCCTGCTA
- Rechts = TACGGTAGGTAGGTAGATAGATTCG
- Produktlänge
= 155
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G08015
- Beschreibung: Human STS CHLC.GATA92C08.P28080 Klon GATA92C08.
-
28. WI-9340:
-
- Datenbank ID: UTR-05134 (auch als G06102, D18S1034, 9340,
X60221 bekannt)
- Quelle: WICGR: Primer von Genbank-Sequenzen
- Chromosom: Chr18
- Primer:
- Links = TGAGAGAACGAAATCTCTATCGG
- Rechts = AGGCAGCAAGTTTTTATAAAGGC
- Produktlänge
= 115
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: G06102
- Beschreibung: WICGR: statistische genomweite STSs;
- Suche nach GDB-Eintrag
-
29. D18S466:
-
- Datenbank ID: AFM094YE5 (auch als 094ye5, Z23354, D18S466
bekannt)
- Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = ACACTGTAGCAGAGGCTTGACC
- Rechts = AGGCCAAGTTATGTGCCACC
- Produktlänge
= 214
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z23354
- Beschreibung: H. sapiens (D18S466) DNA-SEgment mit (CA)-Repeat;
- KLon
- Suche nach GDB-Eintrag
-
30. D18S1092:
-
- Datenbank ID: AFMA112WE9 (auch als D18S1092, w5374, a112we9
bekannt)
- Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = CTCTCAAAGTAAGAGCGATGTTGTA
- Rechts = CCGAAGTAGAAAATCTTGGCA
- Produktlänge
= 163
-
Überblick
der vollständigen
Sequenz
-
-
31. D18S61:
-
- Datenbank ID: AFM193YF8 (auch als 193yf8, Z16834, D18S61
bekannt)
- Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe
STSs
- Chromosom: Chr18
- Primer:
- Links = ATTTCTAAGAGGACTCCCAAACT
- Rechts = ATATTTTGAAACTCAGGAGCAT
- Produktlänge
= 174
-
Überblick
der vollständigen
Sequenz
-
- Genbank ID: Z16834
- Beschreibung: H. sapiens (D18S61) DNA-SEgment mit (CA)-Repeat;
- KLon
- Suche nach GDB-Eintrag
-
Marker (STRs), welche
zum verfeinern der Kandidatenregion verwendet wurden.
-
Unten
sind die Marker gezeigt, welche in der Familie MAD31 zum verfeinern
der Kandidatenregion verwendet wurden. Die meisten dieser Marker
sindbereits oben beschrieben und werden deshalb nur namentlich erwähnt. Die
Information für
die weiteren Marker ist hier angebenen.
-
Die
Daten wurden bereits für
D18S68, D18S55, D18S969, D18S1113, D18S483, D18S465, D18S876, D18S477,
D18S979, D18S466, D18S61 gezeigt.
-
Neue Daten:
-
1. D18S51:
-
- Andere Namen: UT574, (D18S379)
- Primersequenzen: UT574a GAGCCATGTTCATGCCACTG
- UT574b CAAACCCGACTACCAGCAAC DNA-Sequenz:
- Genbank-ID: L18333
-
2. D18S346:
-
- Andere Namen: UT575
- Primerpaare: Primer A: TGGAGGTTGCAATGAGCTG
- Primer B: CATGCACACCTAATTGGCG
- Genbank-ID: L26588
-
3. D18S817:
-
- Andere Namen: UT6365
- Primerpaare: primer A: GCAAAGCAGAAGTGAGCATG
- Primer B: TAGGACTACAGGCGTGTGC DNA-Sequenz:
- Genbank-ID: L30552
-
Charakterisierung der
YACs.
-
Es
wurden (YACs ausgewählt,
welche die Kandidatenregion umfassen und die Lücke flankieren. Diese YACy
wurden weiter charakterisiert durch Bestimmung der Endsequenzen
durch das Protokoll für
inverse PCR.
Ausgewählte
YACy: 961_h_9, 942_c_3, 766_f_12, 731_c_7, 907_e_1, 752_g_8, 717_d_3,
745_d_2
-
Neue
STSs, basierend aus Endsequenzen (solange nichts anderes angegeben
ist, wurden die STSs auf ainem monochromosomalen Kartierungspanel
untersucht, um die Chimären
der Yacs zu identifizieren; wenn die Stränge einen anderen Treffer als
Chromosom 19q – chimäres YAC
ergaben, dann ist dies im Text unten angegeben):
-
1. SV32L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 745_d_3.
- Primer A: GTTATTACAATGTCACCCTCATT
- Primer B: ACATCTGTAAGAGCTTCACAAACA DNA-Sequenz:
- Amplifizierte Sequenzlänge:
107 Basenpaare (bp)
-
Dieses
STS weist keinen klaren Treffer auf dem monochromosomalen Kartierungspanel
auf.
-
2. SV32R
-
- Abgeleitet von der Endsequenz des rechten Arms des YACs
745_d_3.
- Primer A: ACGTTTCTCAATTGTTTAGTC
- Primer B: TGTCTTGGCATTATTTTTAC DNA-Sequenz:
- Amplifizierte Sequenzlänge:
127 bp
-
Dieses
STS weist keinen klaren Treffer auf dem monochromosomalen Kartierungspanel
auf.
-
3. SV11L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 766_f_12.
- Primer A: CTATGCTCTGATCTTTGTTACTTT
- Primer B: ATTAACGGGAAAGAATGGTAT DNA-Sequenz:
- Amplifizierte Sequenzlänge:
118 bp
-
Dieses
STS weist einen Treffer mit Chromosom 18 auf und muss zwischen CHLC.GATA-p6051
und D18S968 lokalisiert sein.
-
4. SV11R
-
- Abgeleitet von der Endsequenz des rechten Arms des YACs
766_f_12.
- Primer A: AAGGTATATTATTTGTGTCG
- Primer B: AAACTTTTCTTAACCTCATA DNA-Sequenz:
- Amplifizierte Sequenzlänge:
119 bp
-
Dieses
STS weist einen Treffer mit Chromosom 18 auf und muss zwischen D18S876
und GCT3G01 lokalisiert sein.
-
5. SV34L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 717_d_3.
- Primer A: TCTACACATATGGGAAAGCAGGAA
- Primer B: GCTGGTGGTTTTGGAGGTAGG DNA-Sequenz:
- Amplifizierte Sequenzlänge:
98 bp
-
Dieses
STS weist einen Treffer mit Chromosom 18 auf.
-
6. SV34R
-
- Abgeleitet von der Endsequenz des rechten Arms des YACs
717_d_3.
- Primer A: ATAAGAGACCAGAATGTGATA
- Primer B: TCTTTGGAGGAGGGTAGTC DNA-Sequenz:
- Amplifizierte Sequenzlänge:
244 bp
-
Dieses
STS weist einen Treffer mit Chromosom 1 auf, deshalb ist YAC 717_d_3
chimär.
-
7. SV25L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 731_c_7.
- Primer A: AAATCTCTTAAGCTCATGCTAGTG
- Primer B: CCTGCCTACCAGCCTGTC DNA-Sequenz:
- Amplifizierte Sequenzlänge:
72 bp
-
Dieses
STS weist keine klaren Treffer auf dem monochromosomalen Kartierungspanel
auf
-
8. SV25R
-
- Abgeleitet von der Endsequenz des rechten Arms des YACs
731_c_7.
- Primer A: TGGGGTGCGCTGTGTTGT
- Primer B: GAGATTTCATGCATTCCTGTAAGA DNA-Sequenz:
- Amplifizierte Sequenzlänge:
136 bp
-
Dieses
STS weist einen Treffer mit Chromosom 7 auf, deshalb ist YAC 731_c_7
chimär.
-
9. SV31L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 752_g_8.
- Primer A: GAGGCACAGCTTACCAGTTCA
- Primer B: ATTCATTTTCTCATTTTATCC DNA-Sequenz:
- Amplifizierte Sequenzlänge:
178 bp
-
Dieses
STS weist einen Treffer mit Chromosom 18 auf und muss zwischen D18S876
und GCT3G01 lokalisiert sein.
-
10. SV31R
-
- Abgeleitet von der Endsequenz des rechten Arms des YACs
752_g_8.
- Primer A: CAAGATTATGCCTCAACT
- Primer B: TAAGCTCATAATCTCTGGA DNA-Sequenz:
- Amplifizierte Sequenzlänge:
131 bp
-
Dieses
STS weist keine klaren Treffer auf dem monochromosomalen Kartierungspanel
auf und gibt keine Information bezüglich der chimären Eigenschaft
des YACs.
-
11. SV10L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 942_c_3.
- Primer A TCACTTGGTTGGTTAACATTACT
- Primer B: TAGAAAAACAGTTGCATTTGATAT DNA-Sequenz:
- Amplifizierte Sequenzlänge:
130 bp
-
Dieses
STS weist einen Treffer mit Chromosom 18 auf und muss zwischen CHLC.GATA-p6051
und D18S968 lokalisiert sein.
-
12. SV10R
-
- Abgeleitet von der Endsequenz des rechten Arms des YACs
942_c_3.
- Primer A: AACCCAAGGGAGCACAACTG
- Primer B: GGCAATAGGCTTTCCAACAT DNA-Sequenz:
- Amplifizierte Sequenzlänge:
135 bp
-
Dieses
STS weist einen Treffer mit Chromosom 18 auf und muss zwischen D18S876
und GCT3G01 lokalisiert sein.
-
13. SV6L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 961_h_9.
-
Es
wurde kein Primer hergestellt, da diese Sequenz identisch ist mit
einem bekannten STR-Marker D18S42, welcher tatsächlich in dieser Region kartiert
ist.
-
- Primer A:
- Primer B: DNA-Sequenz:
- Amplifizierte Sequenzlänge:
130 bp
-
SV6L
erkennt D18S42, weshalb es zwischen WI-7336 und WI-8145 lokalisiert
sein muss.
-
14. SV6R
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 961_h_9.
- Primer A: TTGTGGAATGGCTAAGT
- Primer B: GAAAGTATCAAGGCAGTG DNA-Sequenz:
- Amplifizierte Sequenzlänge:
122 bp
-
SV6R
amplifiziert ein Segment auf dem Chromosom 18. Dieses Segment muss
zwischen WI-2620 und WI-4211 lokalisiert sein.
-
15. SV26L
-
- Abgeleitet von der Endsequenz des linken Arms des YACs 907_e_1.
- Primer A: TATTTGGTTTGTTTGCTGAGGT
- Primer B: CAAGAAGGATGGATACAAACAAG DNA-Sequenz:
- Amplifizierte Sequenzlänge:
154 bp
-
Dieses
STS weist einen Treffer mit Chromosom 13, deshalb ist YAC 907_e_1
chimär.
-
16. SV26R
-
- Abgeleitet von der Endsequenz des rechten Arms des YACs
907_e_1.
- Primer A: CGCTATGCATGGATTTA
- Primer B: GCTGAATTTAGGATGTAA DNA-Sequenz:
- Amplifizierte Sequenzlänge:
90 bp
-
Keine
klaren Treffer auf dem monochromosomalen Kartierungspanel: keine
Information betreffend die chimären
Eigenschaften an dieser Seite des YAC.
-
Untersuchung
der 3-End-Sequenzen, welche die Lücke in weiteren YACs flankieren:
STS-Marker WI-4211, D18S876 und GCT3G01 sind auch in Tabelle 3 unten
gezeigt, um YACs auf gegenüberliegenden
Seiten der Lücke
deutlicher zu identifizieren.
-
-
- +: positiver Treffer/–:
kein Treffer/?: 2 Fälle
wurden beobachtet, bei welchen ein positiver Treffer erwartet wurde (aufgrund
der angenommenen Reihenfolge der Marker), jedoch nicht beobachtet
wurde. Die Gründe
hierfür sind
nicht klar.
-
YAC
745.d.2 wurde von der weiteren Analyse ausgenommen, da kein klarer
Treffer mit Chromosom 18 vorlag. Von den verbleibenden 7 eines monochromosomalen
Kartierungspanels wurde nachgewiesen, dass 3 chimär waren
und dass 4 nicht chimär
waren, wie in Tabelle 4 unten gezeigt wird.
-
-
Bei
den nicht chimären
YACs wurde das STS, basierend auf der Endsequenz, welche die Lücke flankiert
(10R, 11R, 31L) bei 14 YACs untersucht, welche die Lücke flankieren. Überlappungen
zwischen YACs auf gegenüberliegenden
Seiten der Lücke
wurden demonstriert: z.B. die "11R"-Endsequenz (766_f_12)
weist YAC 766_f_12 und YAC 907_e_1 nach. Es wurden dann YACs ausgewählt, welche
den minimalen Anordnungsweg umfassen: Tabelle
5
-
Diese
drei YACs waren stabil, wie durch PFGE bestimmt wurde, und ihre
Größen entsprachen
ungefähr
den veröffentlichten
Größen. Diese
YACs wurden für
eine Restriktionskartierung in andere Hefe-Wirtsstämme übertragen.
-
Versuch 2
-
Konstruktion eines Fragmentationsvektors:
-
Ein
EcoRI/SalI-Fragment von 4,5 kb von pBLC8.1 (Lewis et al., 1992),
welches eine Lysin-2- und eine Telomersequenz trägt, wurde gerichtet in GEM3zf(–) kloniert,
welcher mit ECORI/SalI verdaut war. Anschließend wurde eine End-Rescue-Stelle
in die EcoRI-Stelle ligiert. Hierzu wurden zwei Oligonukleotide
(Strang 1: 5'-TTCGGATCCGGTACCATCGAT-3' und Strang 2: 3'-GCCTAGGCCATGGTAGCTATT-5') in eine partiell (dATP)
gefüllte
EcoRI-Stelle ligiert, um den Vektor pDF1 zu erzeugen. Es wurden
Fragmentationsvektoren mit Triplet-Repeat, konstruiert durch Klonieren
eines 21 bp- und 30 bp-CAG/CTG-Adapters
in die mit Klenow aufgefüllte
PstI-Stelle von pDF1. Eine Transformation und Selektion ergab einen
(CAG)7- und einen (CTG)10-Fragmentationsvektor
mit der Orientierung der Repeat-Sequenz von 5' nach 3' bezogen auf das Telomer.
-
Transformation von Hefe:
-
Ein
linearisierter (verdaut mit SalI) Vektor wurde verwendet, um die
YAC-Klone 961_h_9,
766_f_12 oder 907_e_1 unter Verwendung des LiAc-Verfahrens zu transformieren.
Nach der Transformation wurden die YAC-Klone auf SDLys–-Platten ausplattiert,
um bezäglich
des Vorliegens des Fragmentationsvektors zu selektieren. Nach 2-3
Tagen wurden Kolonien in Kopien auf SDLys–-Trp–-Ura–-
und SDLys–-Trp–-Ura+-Platten ausplattiert. Kolonien, welche
auf den SDLys–-Trp–-Ura+-Platten,
nicht aber auf den SDLys–-Trp–-Ura–-Platten wuchsen,
enthielten die fragmentierten YACs.
-
Analyse der fragmentierten
YACs:
-
Aus
den Klonen mit dem korrekten Phänotyp
isolierte Hefe-DNA wurde analysiert durch Pulsfeld-Elektrophorese
(PFGE), gefolgt von Blotting und Hybridisierung mit dem Lys-2-Gen,
und die Größen der
fragmentierten YACs wurden durch Vergleich mit DNA-Standards von
bekannter Länge
abgeschätzt.
-
End-Rescue:
-
Fragmentierte
YACs, charakterisiert durch eine mit anderen fragmentierten YACs
gemeinsame Größe, was
das Vorliegen eines Haupt-CAG- oder CTG-Triplet-Repeats andeutet, wurden mit
einem der Enzyme aus der End-Rescue-Stelle verdaut, ligiert und für eine Transformation
in E.coli verwendet. Nach dem Wachstum der transformierten Bakterien
wurde die Plasmid-DNA isoliert und die Enden der fragmentierten
YACs, entsprechend einer der Sequenzen, welche die isolierten Trinukleotid-Repeats
flankieren, wurden sequenziert.
-
Die
Sequenzierung ergab, dass fragmentierte YACs mit einer gleichen
Länge alle
an der gleichen Stelle fragmentiert waren. Es wurde eine BLAST-Suche
in der GenBank-Datenbank mit den identifizierten Sequenzen durchgeführt, um
eine Homologie mit bekannten Sequenzen zu identifizieren. Die komplette
Sequenz, umfassend die CAG- oder CTG-Repeats der fragmentierten
YACs, wurde durch Cosmid-Sequenzierung erhalten, wobei sequenzspezifische
Primer und Splice-Primer
verwendet wurden, wie zuvor beschrieben (Fuentes et al., 1992, Hum.
Genet. 101: 346-350), oder durch Verwendung des "Genome-Walker"-Kits (Clontech Laboratories, Palo Alto,
USA), von Siebert et al., Nucleic Acid Res (1995) 23(6): 1087-1088
und von Siebert et al. (1995), CLONTECHniques X(II): 1-3 beschrieben.
-
Ergebnisse:
-
Ein
YAC 961.h.9-Klon wurde mit dem (CAG)7- oder
(CTG)10-Fragmentationsvektor transformiert.
Der CTG-Vektor offenbarte nicht das Vorliegen von irgendeinem CTG-Repeat.
Die Analyse von zwölf
(CAG)7-fragmentierten YACs zeigte, dass
fünf dieser
YACs die gleiche Größe von ungefähr 100 kb
aufwiesen. Es wurde ein End-Rescue mit EcoRI durchgeführt und
die Sequenzierung von drei dieser Fragmente ergab, dass sie alle die
in 15 kursiv gezeigte terminale Sequenz
teilten. Eine BLAST-Suche in der GenBank-Datenbank mit dieser Sequenz
zeigte das Vorhandensein einer Sequenzhomologie mit dem CAP2-Gen
(GenBank Accession Nr: L40377). Die in 15a gezeigte
Sequenz, welche das CAG-Repeat umfasst, wurde sowohl durch Cosmid-Sequenzierung
als auch Genome-Walker-Sequenzierung erhalten. Die Sequenz wurde
mittels STS-Gehalt-Kartierung
zwischen den Markern D18S68 und WI-3170 kartiert.
-
Ein
YAC 766-f-12 wurde unter Verwendung des (CAG)- oder (CTG)10-Fragmentationsvektors
fragmentiert. Erneut offenbarte der (CTG)10-Vektor
nicht das Vorhandensein von irgendeinem CTG-Repeat. Eine Analyse
von zwanzig (CAG)7-fragmentierten YACs zeigte
das Vorhandensein von zwei Gruppen von Fragmenten mit der gleichen
Größe: fünf mit ungefähr 650 kb
und zwei mit ungefähr
50 kb.
-
Unter
Verwendung von EcoRI wurde mit vier der fragmentierten YACs von
650 kb ein End Rescue durchgeführt.
Die Sequenzierung bestätigte,
dass sie alle identische 3'-Termini
teilten, charakterisiert durch die kursiven Buchstaben in 16a gezeigte Sequenz. Eine BLAST-Suche zeigte
eine Homologie dieser Sequenz mit der Alu-Repeat-Sequenzfamilie.
Die in 16a gezeigte, das CAG-Repeat
umfassende Sequenz wurde durch Cosmid-Sequenzierung erhalten. Die
Sequenz wurde mittels STS-Gehalt-Kartierung zwischen den Markern
WI-2620 und WI-4211
auf der YAC-Contig-Karte kartiert. Mit den zwei Fragmenten von 50
kb wurde ebenso ein End-Rescue durchgeführt. Die Sequenzierung ergab
die in kursiven Buchstaben in 17a gezeigte
Sequenz. Eine BLAST-Suche ergab keine Sequenzhomologie mit irgendeiner
bekannten Sequenz. Eine Cosmid-Sequenzierung
ermöglichte
die Identifizierung der volständigen
Sequenz, die die CAG-Repeats umfasst, welche in 17a gezeigt ist. Die Sequenz wurde mittels STS-Gehalt-Kartierung
zwischen den Markern D18S968 und D18S875 auf der YAC-Contig-Karte
kartiert.
-
Ein
YAC 907-e-1-Klon wurde mit dem (CAG)7- oder
(CTG)10-Fragmentationsvektor transformiert.
Der (CAG)7-Vektor offenbarte nicht das Vorhandensein
von irgendeinem CAG-Repeat. Die Analyse von sechsundzwanzig (CTG)10-fragmentierten
YACs ergab, dass 21 von ihnen die gleiche Größe von ungefähr 900 kb
aufwiesen. Mit KpnI wurde mit drei fragmentierten YACs dieser Größe ein End-Rescue
durchgeführt.
Die Sequenzierung ergab die in kursiven Buchstaben in 18a gezeigte Nukleotidsequenz. Eine BLAST-Suche
zeigte das Vorhandensein einer Homologie dieser Sequenz mit dem
GCT3G01-Marker (GenBank Accession Nr: G09484). Die das CTG-Repeat
umfassende Sequenz wurde von der GenBank-Datenbank erhalten. Die
Sequenz wurde zwischen den Markern 10R und WI-528 kartiert.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-