DE69834831T2

DE69834831T2 - Gen, das im zusammenhang steht mit gemütskrankheiten

Info

Publication number: DE69834831T2
Application number: DE69834831T
Authority: DE
Inventors: Christine Van Broeckhoven; Peter Raeymaekers; Jurgen Del-Favero
Original assignee: Vlaams Instituut voor Biotechnologie VIB
Current assignee: Vlaams Instituut voor Biotechnologie VIB
Priority date: 1997-12-18
Filing date: 1998-12-17
Publication date: 2007-02-01
Anticipated expiration: 2018-12-18
Also published as: WO1999032643A3; ES2262256T3; CA2314437A1; DE69834831D1; HUP0100409A3; WO1999032643A2; ATE329044T1; AU2514999A; TR200001965T2; HUP0100409A2; EP1038015B1; GB9726804D0; BG104533A; JP2001526897A; EP1038015A2; PL341814A1

Description

Die Erfindung betrifft die Bestimmung von genetischen Faktoren, welche mit der psychiatrischen Gesundheit verbunden sind, unter besonderem Bezug auf ein humanes Gen oder Gene, welches bzw. welche zu der Manifestation einer bipolaren Störung bzw. einer manisch-depressiven Krankheit in betroffenen Individuen beiträgt oder dafür verantwortlich ist. Die Erfindung stellt insbesondere, wenngleich nicht ausschließlich, ein Verfahren zum Identifizieren und Charakterisieren solch eines Gens oder solcher Gene des humanen Chromosoms 18 bereit. Die Erfindung betrifft auch Verfahren zum Bestimmen der genetischen Anfälligkeit eines Individuums für eine bipolare Störung. Mit bipolaren Störungen sind die folgenden Erkrankungen gemeint, wie sie in "Diagnostic and Statistical Manual of Mental Disorders", Version 4 (DSM-IV) Taxonomie (DSM-IV-Codes in Klammern) definiert sind: – Gemütskrankheiten (296.XX, 300.4, 311, 301.13, 295.70), Schizophrenie und verwandte Erkrankungen (295.XX, 297.1, 298.8, 297.3, 298.9), Angsterkrankungen (300.XX, 309.81, 308.3), Anpassungsstörungen (309.XX) und Persönlichkeitserkrankungen (Codes 301.XX).
Die erfindungsgemäßen Verfahren werden insbesondere im Verhältnis mit genetischen Faktoren veranschaulicht, welche mit einer Familie von Gemütserkrankungen verbunden sind, welche als Spektrum der bipolaren Erkrankungen (BP) bzw. der manisch-depressiven Erkrankungen bekannt sind.
Eine bipolare Erkrankung (BP) ist eine schwere psychiatrische Erkrankung, welche gekennzeichnet ist durch Störungen des Gemüts, welche von einem extremen Zustand der Hochstimmung (Manie) bis zu einem schweren Zustand der Dysphorie (Depression) reichen. Es sind zwei Arten einer bipolaren Erkrankung beschrieben worden: BP-Erkrankung Typ I (BPI) ist gekennzeichnet durch hauptsächlich depressive Abschnitte, welche sich mit Phasen der Manie abwechseln, und BP-Erkrankung Typ II (BPII), welche durch hauptsächliche depressive Abschnitte gekennzeichnet ist, welche sich mit Phasen der Hypomanie abwechseln. Verwandte von BP-Probanden weisen ein verstärktes Risiko für BP, für eine monopolare Erkrankung (Patienten, welche nur depressive Abschnitte erleben; UP), für Zyklothymie (geringere Depression und Hypomanie-Abschnitte; CY) ebenso wie für schizoaffektive Psychosen des manischen (SAm) und des depressiven (SAd) Typs. Basierend auf diesen Beobachtungen werden, BP, CY, UP und SA als Erkrankungen des BP-Spektrums bezeichnet. Die Beteiligung von genetischen Faktoren bei der Äthiologie von Erkrankungen des BP-Spektrums wurde durch Familien-, Zwillings- und Adoptionsuntersuchungen nahegelegt (Tsuang und Faraone (1990), „The Genetics of Mood Disorders", Baltimore, The John Hopkins University Press). Jedoch ist das genaue Muster der Weitergabe unbekannt. In einigen Untersuchungen stützt eine komplexe Spaltungsanalyse die Existenz eines einzelnen Hauptlokus für BP (Spence et al., (1995), Am J. Med. Genet (Neuropsych. Genet.) 60 S.370-376). Andere Wissenschaftler schlagen ein Modell mit einem Anfälligkeitsschwellenwert vor, wobei sich die Anfälligkeit, die Erkankung zu entwickeln, aus der additiven Kombination von mehreren genetischen Effekten und Umwelteffekten ergibt (McGuffin et al., (1994), „Affective Disorders"; Seminars in Psychiatric Genetics Gaskell, London S. 110-127).
Aufgrund des komplexen Vererbungsmodus werden bei Familien, bei welchen eine BP-Erkrankung gemäß den Mendelschen Gesetzen übertragen zu werden scheint, Strategien mit parametrischer und nicht parametrischer Verbindung angewendet. Frühe Befunde über die Verbindung auf den Chromosomen 11p15 (Egeland et al. (1987), Nature 325 S. 783-787) und Xq27-q28 (Mendlewicz et al. (1987) The Lancet 1 S. 1230-1232; Baron et al. (1987) Nature 326 S. 289-292) sind kontrovers und konnten anfänglich nicht wiederholt werden (Kelsoe et al. (1989) Nature 242 S. 238-243; Baron et al. (1993) Nature Genet 3 S. 49-55). Mit der Entwicklung einer humanen genetischen Karte, welche mit höchst polymorphen Markern gesättigt ist, und der kontinuierlichen Entwicklung von Datenanalysenverfahren wurden zahlreiche neue Verbindungsuntersuchungen gestartet. In mehreren Untersuchungen wurde ein Anhaltspunkt oder die Andeutung eines Anhaltspunktes für eine Verbindung mit bestimmten Regionen auf den Chromosomen 4, 12, 18, 21 und X gefunden (Blackwood et al. (1996) Nature Genetics 12 S. 427-430, Craddock et al. (1994) Brit J. Psychiatry 164 S. 355-358, Berretini et al. (1994), Proc Natl Acad Sci USA 91 S. 5918-5921, Straub et al. (1994) Nature Genetics 8 S. 291-296 und Pekkarinen et al. (1995) Genome Research 5 S. 105-115). Um die Validität der Ergebnisse der gemeldeten Verbindungen zu untersuchen, müssen diese Befunde in anderen unabhängigen Untersuchungen wiederholt werden.
Kürzlich ist die Verbindung einer bipolaren Störung mit der perizentrometrischen Region auf dem Chromosom 18 beschrieben worden (Berrettini et al. 1994). Es wurde auch über ein Ringchromosom 18 mit Bruchpunkten und deletierten Regionen bei 18pter-p11 und 18q23-qter bei drei nicht verwandten Patienten mit einer BP-Erkrankung oder verwandten Syndromen berichtet (Craddock et al., 1994). Die Verbindung mit dem Chromosom 18p wurde von Stine et al. (1995) Am. J. Hum. Genet. 57 S. 1348-1394 wiederholt, welche auch einen hinweisenden Anhaltspunkt auf einen Lokus auf 18q21.2-q21.32 in der gleichen Studie berichteten. Interessanterweise beobachteten Stine et al. einen "parent-of-origin"-Effekt: Das Anzeichen der Verbindung war in den väterlichen Ahnen bzw. Abkömmlingen am stärksten, wobei der Vater des Probanden oder einer der Blutsverwandten des Vaters des Probanden betroffen ist.
In einer unabhängigen Wiederholungsstudie untersuchten die Erfinder der vorliegenden Erfindung die Verbindung mit Markern des Chromosoms 18 in 10 belgischen Familien mit einem bipolaren Probanden. Um die ursächlichen Gene zu lokalisieren, wurde in diesen Familien die Verbindungsanalyse oder die Wahrscheinlichkeitsmethode verwendet. Dieses Verfahren untersucht innerhalb einer Familie die Segregation eines definierten Erkrankungsphänotyps mit der Segregation von polymorphen genetischen Markern, welche im humanen Genom verteilt sind. Es wird das Wahrscheinlichsverhältnis der Beobachtung einer Cosegregation der Erkrankung und eines genetischen Markers hinsichtlich Verbindung versus keine Verbindung berechnet, und der log dieses Verhältnisses oder der log der Wahrscheinlichkeit ist die LOD-Score-Statistik z. Ein LOD-Score von 3 (oder Wahrscheinlichkeitsverhältnis von 1000 oder größer) wird als signifikanter statistischer Hinweis für eine Verbindung angenommen. Bei der Studie der Erfinder wurde kein Hinweis auf eine Verbindung mit den perizentrometrischen Regionen gefunden, jedoch wurde in einer der Familien, in MAD31, einer belgischen Familie mit einem BPII-Probanden, die Andeutung einer Verbindung mit den bei 18q21.33-q23 lokalisierten Markern gefunden (De Bruyn et al. (1996) Biol Psychiatry 39 S. 679-688). Eine Multipoint-Verbindungsanalyse ergab in dem Zwischenraum zwischen den STR („Short Tandem Repeats")-Polymorphismen D18S51 und D18S61 den höchsten LOD-Score, wobei ein maximaler Multipoint-LOD-Score +1.34 betrug. Simulationsstudien zeigten, dass dieser LOD-Score innerhalb des Bereichs dessen liegt, was bei der für diese Familie verfügbaren Information für einen bestimmten verbundenen Marker erwartet werden kann. Ebenso wies eine Paaranalyse betroffener Blutsverwandter die Null-Hypothese der Nichtverbindung für mehrere der untersuchten Marker auch zurück. Zwei andere Gruppen fanden auch einen Anhaltspunkt für eine Verbindung einer bipolaren Störung mit 18q (Freimer et al. (1996) Nature Genetics 12 S. 436-441, Coon et al. (1996) Biol Psychiatry 39 S. 689-696). Obwohl die Kandidatenregionen in den unterschiedlichen Studien nicht vollständig überlappen, deuten sie alle auf das Vorliegen eines Anfälligkeitslokus bei 18q21-q23 hin.
Die Erfinder haben nun weitere Untersuchungen in der Chromosomenregion 18q in der Familie MAD31 durchgeführt. Durch eine Analyse der Cosegregation der bipolaren Störung bei MAD31 mit 12 polymorphen STR-Markern, welche zuvor zwischen die zuvor erwähnten Markern D18S51 und D18S61 örtlich festgelegt wurden, und einer anschließenden LOD-Score-Analyse wie oben beschrieben, haben die Erfinder die Kandidatenregion von Chromosom 18 weiter verfeinert, in welcher ein Gen, verbunden mit Gemütserkrankungen wie etwa Erkrankungen des bipolaren Spektrums lokalisiert sein kann, und haben eine physische Karte konstruiert. Die fragliche Region kann somit verwendet werden, um ein Gen oder Gene, welche die psychiatrische Gesundheit oder das Gemüt beeinflussen, zu lokalisieren, zu isolieren und zu sequenzieren.
Die Erfinder haben auch eine YAC (künstliches Hefechromosom, „yeast artifical chromosome")-Contig-Karte der Kandidatenregion konstruiert, um die relative Anordnung der 12 STR-Marker zu bestimmen, kartiert durch eine Cosegregationsanalyse, und sie haben 7 Klone aus der YAC-Bibliothek identifiziert, welche die Kandidatenregion beinhalten.
Im Verfahren zur Identifizierung und Charakterisierung des relevanten Gens oder der Gene kann eine Anzahl von Verfahren mit den identifizierten YAC- Klonen, und, falls geeignet, mit der DNA eines Individuums durchgeführt werden, welches von einer hierin definierten bipolaren Erkrankung betroffen ist. Beispielsweise haben die Erfinder YAC-Klone verwendet, welche die interessierende Region im Chromosom 18 umfassen, um durch CAG- oder CTG-Fragmentation neue Gene zu identifizieren, welche möglicherweise an der Manifestation von Gemütserkrankungen oder verwandten Erkrankungen beteiligt sind.
Es können mit den YAC-Klonen auch andere Verfahren durchgeführt werden, um die Kandidatengene wie oben beschrieben zu identifizieren.
Wenn die Kandidatengene einmal identifiziert worden sind, ist es möglich, die Anfälligkeit eines Individuums für eine bipolare Störung durch Nachweisen des Vorliegens eines Polymorphismus zu bewerten, welcher mit einer bipolaren Erkrankung verbunden ist, in solchen Genen.
Entsprechend betrifft ein erster Aspekt der vorliegenden Erfindung die Verwendung einer 8.9 cM-Region des humanen Chromosoms 18q, welche zwischen den polymorphen Markern D18S68 und D18S979 angeordnet ist, oder eines Fragments davon, zur Identifizierung zumindest von einem humanen Gen, einschließlich mutierter oder polymorpher Varianten davon, welches zur Manifestation einer bipolaren Störung wie oben definiert beiträgt. Wie unten beschrieben wird, haben die Erfinder der vorliegenden Erfindung diese Kandidatenregion von Chromosom 18q für solch ein Gen durch eine Analyse der Cosegregation einer bipolaren Störung in der Familie MAD31 mit 12 polymorphen STR-Markern, welche zuvor zwischen D18S51 und D18S61 räumlich angeordnet wurden, und einer nachfolgenden LOD-Score-Analyse identifiziert.
In einem zweiten Aspekt umfasst die Erfindung einen YAC-Klon, welcher einen Teil des humanen Chromosoms 18q umfasst, welcher zwischen den polymorphen Markern D18S68 und D18S979 angeordnet ist, zum Identifizieren von zumindest einem humanen Gen, einschließlich mutierter oder polymorpher Varianten davon, welches mit Gemütserkrankungen oder verwandten Erkrankungen wie oben definiert verbunden ist.
Bestimmte YACs, welche die Kandidatenregion abdecken, welche erfindungsgemäß verwendet werden können, sind 961_h_9, 942_c_3, 766_f_12, 731_c_7, 907_e_1, 752-g-8 und 717_d_3, wobei bevorzugte YACs 961_h_9, 766_f_12 und 907_e_1 sind, da diese einen minimalen Abdeckungspfad über die Kandidatenregion aufweisen. Zur Verwendung geeignete YAC-Klone sind diejenigen, welche ein artifizielles Chromosom aufweisen, welches die verfeinerte Kandidatenregion zwischen D18S68 und D18S979 umfasst.
Es gibt eine Vielzahl von Verfahren, welche auf die Kandidatenregionen von Chromsom 18q wie oben definiert angewendet werden können, ob es in einem YAC vorliegt oder nicht, um ein Kandidatengen oder Kandidatengene zu identifizieren, welche mit Gemütserkrankungen oder verwandten Erkrankungen verbunden sind. Es ist beispielsweise zuvor demonstriert worden, dass eine offensichtliche Verbindung zwischen dem Vorliegen von Trinukleotid-Repeat-Expansionen (TRE) im humanen Genom und dem Phänomen der Voraussicht von Gemütserkrankungen existiert (Lindblad et al. (1995), Neurobiology of Disease 2: 55-62 und O'Donovan et al. (1995), Nature Genetics 10: 380-381).
Entsprechend umfasst ein dritter Aspekt der vorliegenden Erfindung ein Verfahren zum Identifizieren zumindest von einem humanen Gen, einschließlich mutierter oder polymorpher Varianten davon, welches mit einer Gemütserkrankung oder einer verwandten Erkrankung wie hierin definiert verbunden ist, welches Nachweisen von Nukleotid-Triplet-Repeats in der humanen Region des Chromosoms 18q umfasst, welche zwischen den polymorphen Markern D18S68 und D18S979 angeordnet ist.
Ein alternatives Verfahren zum Identifizieren des Gens oder der Gene umfasst Fragmentieren eines YAC-Klons, welcher einen Teil des humanen Chromosoms 18q umfasst, welcher zwischen den polymorphen Markern D18S68 und D18S979 angeordnet ist, beispielsweise einen oder mehrere der sieben zuvor genannten YAC-Klone, und Nachweisen von allen Nukleotid-Triplet-Repeats in den Fragmenten. Nukleotidsäuresonden, welche mindestens 5 und bevorzugt mindestens 10 CTG- und/oder CAG-Triplet-Repeats umfassen, sind bei entsprechender Markierung geeignete Mittel zum Nachweis. Trinukleotid-Repeats können auch bestimmt werden unter Verwendung des bekannten RED („repeat expansion detection")-Systems (Shalling et al. (1993), Nature Genetics 4, S. 135– 139).
Wie hierin unten ausführlich beschrieben wird, haben die Erfinder, um Kandidatengene mit den Triplet-Repeats zu identifizieren, eine direkte CAG- oder CTG-Fragmentierung der YACs 961_h_9, 766_f_12 und 907_e_1 durchgeführt, welche einen Teil des humanen Chromosoms 18q umfassen, welcher zwischen den polymorphen Markern D18S60 und D18S61 angeordnet ist, und sie haben eine Anzahl von Sequenzen mit CAG- oder CTG-Repeats identifiziert, deren anormale Expansion in die genetische Anfälligkeit für eine Gemütserkrankung oder eine verwandte Erkrankung verwickelt ist. Diese Nukleotidsequenzen sind in den 15a, 16a, 17a und 18a gezeigt.
Die Kenntnis der oben beschriebenen Sequenzen kann verwendet werden, um Assays zu konzipieren, um die genetische Anfälligkeit eines Individuums für eine bipolare Störung zu bestimmen.
Entsprechend stellt ein weiterer Aspekt der Erfindung ein Verfahren zur Bestimmung der Anfälligkeit eines Individuums für eine bipolare Störung bereit, welches die Schritte umfasst:

a) Erhalten einer DNA-Probe von dem Individuum,
b) Bereitstellen von Primern, welche für die Amplifikation einer Nukleotidsequenz geeignet sind, welche in einer der in den 15a, 16a, 17a oder 18a gezeigten Nukleotidsequenzen enthalten ist, worin die Primer die in der Sequenz gezeigten Trinukleotid-Repeats flankieren,
c) Einsetzen der Primer bei der DNA-Probe und Durchführen einer Amplifikationsreaktion,
d) Durchführen der gleichen Amplifikationsreaktion mit einer DNA-Probe eines Kontrollindividuums und
e) Vergleichen der Ergebnisse der Amplifikationsreaktion des Individuums und der des Kontrollindividuums,

Mit Kontrollindividuum ist ein Individuum gemeint, welches nicht von einer biplaren Störung betroffen ist und welches keine familiäre Anamnese von Gemüts erkrankungen oder verwandten Erkrankungen aufweist.
Bevorzugte Primer zur Verwendung in diesem Verfahren sind diejenigen, welche in der 15b, 16b, 17b oder 18b gezeigt sind, jedoch können andere geeignete Primer verwendet werden.
Weitere Ausführungsformen der vorliegenden Erfindung betreffen Verfahren zum Identifizieren des relevanten Gens oder der Gene, welche Subklonieren von YAC-DNA wie oben definiert in Vektoren wie etwa BAC- (künstliches Bakterienchromosom, „bacterial artificial chromosome") oder PAC- (künstliches P1- oder Phagenchromosom) oder Cosmid-Vektoren wie etwa Exon-Trap-Cosmidvektoren umfasst. Der Ausgangspunkt für solche Verfahren ist die Konstruktion einer Contig-Karte der Region des humanen Chromsoms 18q zwischen den polymorphen Markern D18S68 und D18S979. Zu diesem Zweck haben die Erfinder der vorliegenden Erfindung die Endregionen des Fragments der humanen DNA in jedem der sieben zuvor genannten YAC-Klone sequenziert und diese Sequenzen sind hierin offenbart. Nach dem Subklonieren der YAC-DNA in andere Vektoren, wie oben beschrieben, können Sonden konstruiert werden, welche diese Endsequenzen oder Teile davon umfassen, insbesondere die in den 1 bis 11 hierin gezeigten Sequenzen, zusammen mit beliebigen bekannten sequenzierten Tag-Stellen (STS) in dieser Region, wie in dem hierin gezeigten YAC-Klon-Contig beschrieben, welche verwendet werden können, um Überlappungen zwischen den Subklonen und einer Contig-Karte nachzuweisen, konstruiert werden. Auch die bekannten Sequenzen in dem aktuellen YAC-Contig können für die Herstellung von Contig-Karten-Subklonen verwendet werden.
Ein Weg, auf welchem ein Gen oder Gene identifiziert werden kann bzw. können, welches bzw. welche mit einer bipolaren Störung verbunden ist, ist die Verwendung der bekannten Technik des Exon-Trapping.
Dies ist ein artifizieler RNA-Splicing-Assay, am häufigsten in gegenwärtigen Protokollen eines spezialisierten Exon-Trap-Cosmidvektors verwendet. Der Vektor enthält ein künstliches Minigen, welches aus einem Segment des SV40-Genoms besteht, enthaltend einen Replikationsursprung und eine starke Promotorsequenz, zwei Splicing-kompetente Exons, getrennt durch ein Intron, welches eine multiple Klonierungsstelle enthält, und eine SV40-Polyadenylierungsstelle.
Die YAC-DNA wird in den Exon-Trap-Vektor subkloniert und die rekombinante DNA wird in einen Stamm von Säugerzellen transfiziert. Die Transkription von dem SV40-Promotor ergibt ein RNA-Transkript, welches normalerweise splict und die zwei Exons des Minigens umfasst. Wenn die klonierte DNA selbst ein funktionelles Exon umfasst, kann es zu den in dem Vektor-Minigen vorliegenden Exons gesplict werden. Unter Verwendung einer reversen Transkriptase kann eine cDNA-Kopie hergestellt werden und unter Verwendung von spezifischen PCR-Primern können die Splicing-Ereignisse identifiziert werden, welche die Exons der insertierten DNA betreffen. Solch ein Verfahren kann codierende Regionen in der YAC-DNA identifizieren, welche mit den äquivalenten Regionen von DNA von einer Person, welche von einer Gemütserkankung oder einer verwandten Erkrankung betroffen ist, verglichen werden kann, um das relevante Gen zu identifizieren.
Entsprechend umfasst ein weiterer Aspekt der Erfindung ein Verfahren zum Identifizieren von mindestens einem humanen Gen, einschließlich mutierter Varianten und Polymorphismen davon, welches mit einer bipolaren Störung verbunden ist, worin das Verfahren die Schritte umfasst:

(a) Transfizieren von Säugerzellen mit einem Exon-Trap-Cosmidvektor, hergestellt und kartiert wie oben beschrieben,
(b) Kultivieren der Säugerzellen in einem geeigneten Medium,
(c) Isolieren von RNA-Transkripten, welche von dem SV40-Promotor exprimiert werden,
(d) Herstellen von cDNA von solchen RNA-Transkripten,
(e) Identifizieren von Splicing-Ereignissen, welche die Exons der in den Exon-Trap-Vektor subklonierten DNA betreffen, um die Positionen der codierenden Regionen in der subklonierten DNA zu identifizieren,
(f) Nachweisen von Unterschieden zwischen den codierenden Regionen und äquivalenten Regionen in der DNA eines Individuums, welches unter der bipolaren Störung leidet, und
(g) Identifizieren des Gens oder von mutierten oder polymorphen Varianten davon, welches mit der bipolaren Störung verbunden ist.

Als eine Alternative zum Exon-Trapping kann die YAC-DNA in BAC-, PAC-, Cosmid- oder andere Vektoren subkloniert werden und wie oben beschrieben kann eine Contig-Karte konstruiert werden. Es sind verschiedene bekannte Verfahren verfügbar, durch welche die Position von relevanten Genen der subklonierten DNA wie folgt ermittelt werden kann:

(a) cDNA-Selektion oder Capture (auch direkte Selektion und cDNA-Selektion genannt): Dieses Verfahren betrifft die Bildung von Heteroduplexen aus genomischer DNA/cDNA durch Hybridisieren einer klonierten cDNA (z.B. ein Insert einer YAC-DNA) mit einem komplexen Gemisch von cDNAs, wie etwa den Inserts von allen cDNA Klonen von einer speziellen cDNA-Bibliothek (z.B. Gehirn). Verwandte Sequenzen hybridisieren und können in nachfolgenden Schritten unter Verwendung von Biotin-Streptavidin-Capture und PCR (oder verwandte Verfahren) angereichert werden;
(b) Hybridisierung von mRNA/cDNA: Ein genomischer Klon (z.B. ein Insert eines speziellen Cosmids) kann mit einem Northern Blot von mRNA von einem Panel von Kulturzelllinien oder gegen geeignete cDNA-Bibliotheken (z.B. Gehirn) hybridisiert werden. Ein positives Signal kann das Vorliegen eines Gens innerhalb des klonierten Fragments anzeigen;
(c) CpG-Insel-Identifizierung: CpG- oder HTF-Inseln sind kurze (etwa 1 kb) hypomethylierte GC-reiche (> 60%) Sequenzen, welche oft an den 5'-Enden von Genen zu finden sind. CpG-Inseln weisen oft Restriktionsstellen für mehrere selten schneidende Restriktionsenzyme auf. Ein Cluster von selten schneidenden Restriktionsstellen weist auf eine CpG-Insel und somit auf ein mögliches Gen hin. CpG-Inseln können durch Hybridisierung eines DNA-Klons mit Southern Blots von genomischer DNA, welche mit selten schneidenden Enzymen verdaut wurde, oder durch Insel-Rescue-PCR (Isolierung von CpG-Inseln von YACs durch Amplifizieren von Sequenzen zwischen den Inseln und benachbarten Alu-Repeats) nachgewiesen werden;
(d) Zoo-Blotting: Hybridisierung eines DNA-Klons (z.B. das Insert eines speziellen Cosmids) mit verringerter Stringenz gegen einen Southern Blot von genomischen DNA-Proben von einer Vielzahl von tierischen Spezies. Der Nachweis von Hybridisierungssignalen kann konservierte Sequenzen anzeigen, welche auf ein mögliches Gen hinweisen.

Entsprechend umfasst ein weiterer Aspekt der Erfindung ein Verfahren zum Identifizieren von mindestens einem humanen Gen, einschließlich mutierter und polymorpher Varianten davon, welches mit einer bipolaren Erkrankung verbunden ist, welches die Schritte umfasst:

(a) Subklonieren der YAC-DNA, wie oben beschrieben, in einen Cosmid-, BAC-, PAC- oder anderen Vektor;
(b) Verwenden der in einer der 1-11 gezeigten Nukleotidsequenzen oder einer beliebigen anderen bekannten, mit einem Tag versehenen Stelle (STS) in dieser Region, wie bei dem hierin beschrieben YAC-Klon-Contig, oder eines Teils davon, welcher aus nicht weniger als 14 benachbarten Basen besteht, oder dem Komplement davon, um Überlappungen zwischen den Subklonen nachzuweisen und eine Karte davon zu erstellen;
(c) Identifizieren der Position der Gene innerhalb der subklonierten DNA durch eines oder mehrere von CpG-Inselidentifizierung, Zoo-Blooting, Hybridisierung der subklonierten DNA mit einer cDNA-Bibliothek oder einem Northern Blot von mRNA von einem Panel von Kulturzelllinien;
(d) Nachweisen von Unterschieden zwischen den Genen und einer äquivalenten Region der DNA eines Individuums, welches unter einer bipolaren Störung leidet, und
(e) Identifizieren des Gens, welches mit der bipolaren Störung verbunden ist.

Wenn die klonierte YAC-DNA sequenziert ist, kann eine Computeranalyse verwendet werden, um das Vorhandensein von relevanten Genen zu ermitteln. Es können Verfahren wie etwa eine Homologiesuche und eine Exon-Vorhersage verwendet werden.
Wenn ein Kandidatengen einmal entsprechend den erfindungsgemäßen Verfahren isoliert worden ist, können zwischen dem Gen von einem normalen Individuum und einem Individuum, welches von einer Erkrankung des bipolaren Spektrums betroffen ist, ausführlichere Vergleiche durchgeführt werden. Beispielsweise gibt es zwei Verfahren, welche als "Mutationstest" beschrieben werden, bei welchen eine Mutation oder ein Polymorphismus in einer DNA-Sequenz identifiziert werden kann. In dem ersten Verfahren kann die DNA-Probe untersucht werden im Hinblick auf das Vorhandensein oder Fehlen einer spezifischen Mutation, dies erfordert jedoch Kenntnis darüber, welcher Art die Mutation sein könnte. In dem zweiten Verfahren wird eine DNA-Probe im Hinblick auf eine beliebige Abweichung von einer Kontroll (normalen)-DNA gescreent. Dieses letztere Verfahren ist bei der Identifizierung von Kandidatengenen, bei welchen eine Mutation nicht im Voraus identifiziert wird, nützlicher.
Außerdem können weiterhin die folgenden Verfahren angewendet werden, um ein Gen durch die oben beschriebenen Verfahren zu identifizieren, um Unterschiede zwischen Genen von normalen oder gesunden Individuen und denjenigen Individuen, welche von einer bipolaren Störung betroffen sind, zu identifizieren:

(a) Southern Blotting-Verfahren: Ein Klon wird hybridisiert mit Nylonmembranen, welche genomische DNA von Patienten und gesunden Individuen enthalten, welche mit unterschiedlichen Restriktionsenzymen verdaut wurde. Unter Verwendung eines Protokolls mit radioaktiver Markierung können große Unterschiede zwischen Patienten und gesunden Individuen sichtbar gemacht werden;
(b) Heteroduplexmobilität in Polyacrylamidgelen: Dieses Verfahren basiert auf der Tatsache, dass die Mobilität von Heteroduplexen in nicht denaturierenden Polyacrylamidgelen geringer ist als die Mobilität von Homoduplexen. Es ist am effektivsten für Fragmente unter 200 Basenpaare;
(c) Einzelstrang-Konformations-Polymorphismus-Analyse (SSCP oder SSCA, „single-stranded conformational polymorphism analysis"): Einzelsträngige DNA faltet sich unter Bildung von komplexen Strukturen, welche durch schwache intramolekulare Bindungen stabilisiert sind, zusammen. Die elektrophoretischen Mobilitäten dieser Strukturen auf nicht denaturierenden Polyacrylamidgelen hängen von ihren Kettenlängen und ihrer Konformation ab;
(d) chemische Spaltung von Fehlpaarungen (CCM, "chemical cleavage of mismatches"): Eine radiomarkierte Sonde wird mit der Test-DNA hybridisiert und Fehlpaarungen werden durch eine Reihe von chemischen Reaktionen nachgewiesen, welche einen Strang der DNA an der Stelle der Fehlpaarung spalten. Dies ist ein sehr sensitives Verfahren und kann auf Proben mit einer Länge bis zu einem Bereich von Kilobasen angewendet werden;
(e) enzymatische Spaltung von Fehlpaarungen: Der Assay ist ähnlich wie die CCM, jedoch wird die Spaltung durch bestimmte Bakteriophagenenzyme durchgeführt;
(f) denaturierende Gradientengelelektrophorese: bei diesem Verfahren werden DNA-Duplexe gezwungen, durch ein elektrophoretisches Gel zu migrieren, in welchem ein Gradient von steigenden Mengen eines denaturierenden Mittels (chemisch oder Temperatur) vorliegt. Die Migration dauert an, bis die DNA-Duplexe eine Position auf dem Gel erreichen, an welcher die Stränge schmlzen und sich trennen, wonach die denaturierte DNA nicht viel weiter migriert. Ein Unterschied von einem einzelnen Basenpaar zwischen einem normalen und einem mutierten DNA-Duplex ist ausreichend, um eine Migration an unterschiedliche Positionen in dem Gel zu bewirken;
(g) direkte DNA-Sequenzierung.

Es ist verständlich, dass hinsichtlich der hierin beschriebenen Verfahren bei dem Schritt Nachweisen von Unterschieden zwischen den codierenden Regionen von dem YAC und der DNA eines von einer bipolaren Störung betroffenen Individuums das Individuum irgend jemand mit einer Erkrankung sein kann und nicht notwendigerweise ein Mitglied der Familie MAD31 sein muss.
In dem folgenden Bericht der Versuche erfolgt eine Bezugnahme auf die folgenden Figuren:
1 zeigt eine Sequenz von Nukleotiden, welche die Endsequenz des linken Arms von YAC 766_f_12 ist;
2 zeigt eine Nukleotidsequenz, welche eine Endesequenz des rechten Arms von YAC 766_f_12 ist;
3 zeigt eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von YAC 717_d_3 ist;
4 zeigt eine Nukleotidsequenz, welche eine Endesequenz des rechten Arms von YAC 717_d_3 ist;
5 zeigt eine Nukleotidsequenz, welche eine Endsequenz des rechten Arms von YAC 731_c_7 ist;
6 zeigt eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von YAC 752_g_8 ist;
7 zeigt eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von YAC 942_c_3 ist;
8 zeigt eine Nukleotidsequenz, welche eine Endsequenz des rechten Arms von YAC 942_c_3 ist;
9 zeigt eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von YAC 961_h_9 ist;
10 zeigt eine Nukleotidsequenz, welche eine Endsequenz eines rechten Arms von YAC 961_h_9 ist;
11 zeigt eine Nukleotidsequenz, welche eine Endsequenz des linken Arms von YAC 907_e_1 ist;
12 zeigt einen Stammbaum der Familie MAD31;
13 zeigt die Haplotyp-Analyse der Familie MAD13. Betroffene Individuen sind durch gefüllte Karos dargestellt, offene Karos stellen Individuen dar, welche bei der letzten psychiatrischen Bewertung asymptomatisch waren. Dunkle graue Balken repräsentieren Marker, bei welchen nicht abgeleitet werden kann, ob sie rekombinant sind; und
14 zeigt die YAC-Contig-Karte der Region des humanen Chromosoms 18 zwischen den polymorphen Markern D18560 und D18561. Schwarze Linien repräsentieren positive Treffer. Die YACs sind nicht maßstabsgetreu gezeichnet.
15 zeigt (a) ein CAG-Repeat (fett) und die umgebende Nukleotidsequenz, isoliert vom YAC 961_h_9. Die kursive Sequenz stammt von dem End-Rescue des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des Ausmaßes der Trinukleotid-Repeats in der Sequenz verwendet werden können.
16 zeigt (a) ein CAG-Repeat (fett) und die umgebende Nukleotidsequenz, isoliert vom YAC 766_f_12. Die kursive Sequenz stammt von dem End-Rescue des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des Ausmaßes der Trinukleotid-Repeats in der Sequenz verwendet werden können.
17 zeigt (a) ein CAG-Repeat (fett) und die umgebende Nukleotid sequenz, isoliert von YAC 766_f_12. Die kursive Sequenz stammt von dem End-Rescue des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des Ausmaßes der Trinukleotid-Repeats in der Sequenz verwendet werden können.
18 zeigt (a) ein CAG-Repeat (fett) und die umgebende Nukleotidsequenz, isoliert von YAC 907_e_1. Die kursive Sequenz stammt von dem End-Rescue des fragmentierten YACs. (b) PCR-Primer, welche zur Bestimmung des Ausmaßes der Trinukleotid-Repeats in der Sequenz verwendet werden können.
Versuch 1
(a) Familiendaten
Klinische Diagnosen in MAD31, einer belgischen Familie mit einem BPII-Probanden, wurden ausführlich von De Bruyn et al., 1996, beschrieben. In dieser Studie wurden nur die 15 Familienmitglieder für eine zusätzliche Genotypisierung ausgewählt, welche bei einer Verbindungsanalyse aussagefähig waren. Die unterschiedlichen klinischen Diagnosen in der Familie waren wie folgt: 1 BPI, 2 BPII, 2UP, 4 depressive Haupterkrankung (MDD, „major depressive disorder"), 1 SAm und 1 SAd.
Der Stammbaum der Familie MAD31 ist in 12 gezeigt.
(b) Genotypisierung der Familienmitglieder
Alle genetischen Marker für kurze Tandemrepeats (STR, "short tandem repeats") sind Di- oder Tetranukleotid-Repeat-Polymorphismen. Die Information betreffend die in dieser Untersuchung verwendeten genetischen Marker wurde von mehreren Quellen des Internets erhalten: Genome DataBase (GDB, http://gdbww.gdb.org/), GenBank (http://www.ncbi.nlm.nih.gov/), Cooperative Human Linkage Center (CHLC, http://www.chlc.org/), Eccles Institute of Human Genetics (EIHG, http://www.genetics.utah.edu/) und Généthon (http://www.genethon.fr/). Es wurde eine Standard-PCR in einem Volumen von 25 μl durchgeführt, enthaltend 100 ng genomische DNA, 200 mM von jedem dNTP, 1,25 mM MgCl₂, 30 pmol von jedem Primer und 0,2 Unit Goldstar DNA-Polymerase (Eurogentec). Ein Primer wurde vor der PCR mit [gamma-³²P]ATP und T4-Polynukleotidkinase am Ende markiert. Nach einem anfänglichen Denaturierungsschritt bei 94 °C für 2 min wurden 27 Zyklen bei 94 °C für 1 min durchgeführt, bei der passenden Annealingtemperatur für 1,5 min, und eine Extension bei 72 °C für 2 min. Schließlich wurde ein zusätzlicher Verlängerungsschritt bei 72 °C für 5 min durchgeführt. Die PCR-Produkte wurden durch Elektrophorese auf einem 6%-igen denaturierenden Polyacrylamidgel und durch Exposition gegenüber einem röntgenempfindlichen Film durchgeführt. Erfolgreich analysierte STSs, STRs und ESTs, welche die verfeinerte Kandidatenregion abdecken, werden hierin nachfolgend detailliert beschrieben.
(c) Lod-Score-Analyse
Zweipunkt-Lod-Scores wurden für drei unterschiedliche Erkrankungsmodelle unter Verwendung von Fastlink 2.2. (Cottingham et al., 1993) berechnet. Bei allen Modellen wurde eine Frequenz des Erkrankungsgens von 1 % und eine Phänokopierate von 1/1000 verwendet. Modell 1 umfasste alle Patienten und nicht betroffene Individuen, wobei die letzteren Individuen in Abhängigkeit von ihrem Alter bei der Untersuchung einer Erkrankungspenetranzklasse zugeordnet wurden. Die 9 altersabhängigen Penetranzklassen, wie von De Bruyn et al. (1996) beschrieben, wurden mit einem Faktor 0,7 multipliziert, entsprechend einer Verringerung der maximalen Penetranz von 99% auf 70% bei Individuen, welche älter sind als 60 Jahre (Ott, 1991). Modell 2 ist ähnlich wie Modell 1, jedoch wurden die Patienten einem diagnostischen Stabilitäts-Score zugeordnet, berechnet aufgrund von klinischen Daten wie etwa der Anzahl der Anfälle, der Anzahl der Symptome während des schlimmsten Anfalls und der Behandlungsgeschichte (Rice et al., 1987, De Bruyn et al., 1996). Modell 3 ist wie Modell 1, umfasst jedoch nur Patienten.
(d) Konstruktion der YAC-Contig-Protokolle
Das Anziehen der YACs und die Extraktion der YAC-DNA wurde gemäß Standardverfahren durchgeführt (Silverman, 1995). Für die Konstruktion des YAC-Contig, welches die Kandidationregion des Chromosoms 18q umfasst, basieren die Daten der physikalischen Karte auf mit einem Tag markierten Sequenzstellen (STS, „sequence tagged sites") (Hudson et al., 1995), wozu die Internetseite des Whitehead Institute (WI) (http://www-genome.wi.mit.edu/) konsultiert wurde. CEPH Mega-YACs wurden von dem YAC-Screening-Zentrum Leiden (YSCL, Niederlande) und von CEPH (Paris, Frankreich) erhalten. Die YACs wurden bezüglich des Vorhandenseins von STSs und STRs untersucht, welche zuvor zwischen D18S51 und D18S61 lokalisiert wurden, durch Touchdown-PCR-Amplifikation. Die Information über die STSs/STRs wurde von den Internetseiten von WI, GDB, Généthon, CHLC und GenBank erhalten. 30 PCR-Zyklen bestanden aus: Denaturierung bei 94 °C für 1 min, Annealing (2 Zyklen für jede Temperatur), beginnend bei 65 °C und zunehmend auf 51 °C für 1,5 min und Verlängerung bei 72 °C für 2 min. Diesen folgten 10 Zyklen mit Denaturierung bei 94 °C für 1 min, Annealing bei 50 °C für 1,5 min und Verlängerung bei 72 °C für 2 min gefolgt. Ein abschließender Verlängerungsschritt wurde für 10 min bei 72 °C durchgeführt. Die amplifizierten Produkte wurden durch Elektrophorese auf einem 1%-igen TBE-Agarosegel und Ethidiumbromidfärbung sichtbar gemacht.
(e) Ordnen der STR-Marker
12 STR-Marker, zuvor zwischen D18S51 und D18S61 lokalisiert, wurden im Hinblick auf eine Cosegregation mit einer bipolaren Störung in der Familie MAD31 untersucht. Die elterlichen Haplotypen wurden rekonstruiert durch die Genotypinformation der Geschwister in der Familie MAD31 und Minimieren der Anzahl der positiven Rekombinanten. Das Ergebnis dieser Analyse ist in 13 gezeigt. Der Vater war im Hinblick auf 3 Marker nicht informativ, die Mutter war im Hinblick auf 5 Marker nicht informativ. Die Haplotypen in der Familie MAD31 deuteten die folgende Ordnung der analysierten STR-Marker an: cen-[S51-S68-S346]-[S55-S969-S1113-S483-S465]-[S876-S477]-S979-[S466-S817-S61]-tel. Die Ordnung der Marker relativ zueinander zwischen den Klammern konnte von unseren Haplotypdaten nicht abgeleitet werden. Die Markerordnung in der Familie MAD31 wurde verglichen mit der Markerordnung, welche unter Verwendung von unterschiedlichen Kartierungstechniken erhalten wurde und die Ergebnisse sind in Tabelle 1 unten gezeigt.
Tabelle 1: Vergleich der Ordnung der Marker innerhalb der Kandidatenregion 18q für eine bipolare Störung zwischen mehreren Karten.

*Ordnung gemäß den Haplotypisierungsergebnissen in der Familie MAD31.
(–) Marker ist proximal von D18S68 lokalisiert.

D18S68, welcher allen drei Karten gemeinsam war, wurde als der Kartenankerpunkt genommen, und die genetische Distanz der anderen Marker relativ zu D18S68 ist in cM oder cR angegeben. Die Ordnung der Marker stimmt gut mit der Ordnung der Marker auf der kürzlich veröffentlichten Strahlungshybridkarte von Chromosom 18 (Giacolone et al., 1996, Genomics 37:9-18) und mit der WI YAC-Contig-Karte (http://www-genome.wi.mit.edu/) überein. Jedoch wurden einige wenige Abweichungen von anderen Karten beobachtet. Die einzige Abweichung von der genetische Karte von Généthon ist die umgekehrte Reihenfolge von D18S465 und D18S477. Zwei Abweichungen wurden im Hinblick auf die Marshfield-Karte beobachtet (http://www.marshmed.org/genetics/). Die Erfinder der vorliegenden Erfindung kartierten D18S346 oberhalb von D18S55, basierend auf maternalen Haplotypen, aber auf den Marshfield-Karten ist D18S346 zwischen D18S483 und D18S979 lokalisiert. Die Erfinder platzierten auch D18S817 unterhalb von D18S979, jedoch auf der Marshfield-Karte ist dieser Marker zwischen D18S465 und D18S477 lokalisiert. Jedoch stimmt die Lokalisierung von D18S346 und D18S817 mit der Strahlungshybridkarte des Chromosoms 18 von Giacolone et al. (1996) überein. Eine Abweichung wurde auch beobachtet von der WI-Strahlungshybridkarte (http://www-genome.wi.mit.edu/), in welcher D18S68 unterhalb von D18S465 lokalisiert war. Die Erfinder ebenso wie andere Karten platzierten diesen Marker jedoch oberhalb von D18S55.
(f) Lod-Score-Analyse und Verfeinerung der Kandidatenregion
Eine Lod-Score-Analyse ergab mit allen Markern positive Ergebnisse, was die vorherige Beobachtung bestätigt, dass 18q21.33-q23 in eine BP-Erkrankung verwickelt ist, zumindest in der Familie MAD31 (De Bruyn et al., 1996). Eine Zusammenfassung der Statistik der Lod-Score-Analyse von allen Modellen ist in Tabelle 2 unten angegeben.
Tabelle 2: Zusammenfassende Statistik der Zweipunkt-Lod-Scores in MAD31.

D18S55, S18S483, D18S465 und D18S466 waren nicht aussagefähig.

Der höchste Zweipunkt-Lod-Score (+2.01 bei θ = 0.0) wurde mit den Markern D18S1113, D18S876 und D18S477 gemäß Modell 1 in Abwesenheit von Rekombinanten erhalten (Tabelle 2). Im Modell 1 werden alle Individuen mit einer Erkrankung des BP-Spektrums als betroffen betrachtet und tragen vollständig zu der Verbindungsanalyse bei. Vor der Feinkartierung war die Kandidatenregion von D18S51 und D18S61 flankiert, welche durch eine genetische Distanz von 15.2 cM auf der Marshfield-Karte oder 13.1 cM auf der Généthon-Karte getrennt sind. Die informativen Rekombinanten mit D18S51 und D18S61 wurden in zwei betroffenen Individuen (II.10 und II.11 in 13) beobachtet. Da jedoch keine anderen Marker innerhalb der Kandidatenregion untersucht wurden, war nicht bekannt, ob diese Individuen tatsächlich eine Region enthalten, welche aufgrund der Herkunft identisch (IBD, "identical-by-descent") war. Die zusätzlichen Daten der genetischen Kartierung zeigen nun, dass alle betroffenen Individuen Allele bei D18S969, D18S1113, D18S876 und D18S477 teilen (13, Haplotyp in der Box). Auch die Allele der Marker D18S483 und D18S465 sind wahrscheinlich IDB, aber diese Marker waren in dem betroffenen Elternteil I.1 nicht aufschlussreich. Obligate Rekombinanten wurden mit den STR-Markern D18S68, D18S346, D18S979 und D18S817 beobachtet (Tabelle 2, 13). Da Abweichungen bei den Lokalisierungen von D18S346 und D18S817 zwischen den unterschiedlichen Karten beobachtet wurden, verwendeten die Erfinder der vorliegenden Erfindung D18S68 und D18S979, um die Kandidatenregion für eine BP-Erkrankung neu zu definieren. Die genetische Distanz zwischen diesen zwei Markern beträgt 8.9 cM, bezogen auf die genetische Marshfield-Karte (http.//www.marshmed.org/genetics/).
(g) Konstruktion des YAC-Contigs
In Übereinstimmung mit der integrierten WI-Karte sind in der anfänglichen Kandidatenregion 56 CEPH Mega-YACs lokalisiert, welche zwischen D18S51 und D18S61 enthalten sind (Chumakov et al. (1995) Nature 377, Ergänzungsband, De Bruyn et al. (1996)). Von diesen YACs wurden diejenigen ausgewählt, welche in der Region zwischen D18S60 und D18S61 lokalisiert waren. D18S51 ist auf der WI-Karte nicht dargestellt, ist jedoch gemäß der genetischen Marshfield-Karte (http.//www.marshmed.org/genetics/) nahe D18S60 lokalisiert. Um die Anzahl der potenziellen chimären YACs zu begrenzen, wurden diejenigen YACs eliminiert, welche auch für andere STSs als denjenigen auf Chromosom 18 positiv waren. Als solche wurden 25 YACs ausgewählt (siehe 14) und in einem Contig platziert, auf Basis des YAC-Contig-Kartierungsverfahrens, d.h. Sequenzen von mit einem Tag versehenen Sequenzstellen (STSs), einfachen Tandem-Repeats (STRs) und exprimierten sequenzierten Tags (ESTs), welche bekanntermaßen zwischen D18S60 und D18S61 liegen, wurden durch PCR der DNA von den YAC-Klonen amplifiziert. Die verwendeten STS-, STR- und EST-Sequenzen werden hierin nachfolgend beschrieben. Positive YAC-Klone wurden in einer YAC-Contig-Karte zusammengefasst (14).
In dem YAC-Contig verblieben drei Lücken, wovon eine in der verfeinerten Kandidatenregion zwischen D18S876 und GCT3G01 lokalisiert war. Um die Lücke zwischen D18S876 und GCT3G01 zu schließen, wurden 14 YAC-Klone weiter analysiert (Tabelle 3). Es wurden die Endfragmente der YAC-Klone 766_f_12 (SV11R), 752_g_8 (SV31L), 942_c_3 (SV10R) erhalten und sequenziert (siehe unten). Es wurden Primer von diesen drei Sequenzen ausgewählt und die DNA von jedem der 14 YAC-Klone wurde durch PCR amplifiziert. Wie in Tabelle 3 gezeigt, wurden Überlappungen zwischen 7 YAC-Klonen an der Centromerstelle x und zwischen 2 YAC-Klonen an der Telomerstelle (717_d_3 und 907_e_1) Überlappungen.
Der abschließende YAC-Contig ist in 14 gezeigt. In der Figur sind nur die YAC-Klone gezeigt, welche eindeutige Treffer mit den STSs, STRs und ESTs des Chromosoms 18 ergaben. In wenigen Fällen wurden auch schwache positive Signale mit einigen der YAC-Klone erhalten, welche wahrscheinlich falsch-positive Ergebnisse darstellen. Jedoch beeinflussten diese Signale den Abgleich der YAC-Klone in dem Contig nicht. Obwohl alle YACs, welche bekanntermaßen in der Region kartiert sind, ebenso wie alle verfügbaren STSs/STRs getestet wurden, war anfänglich die Lücke in dem YAC-Contig nicht geschlossen. Jedoch wurde dies nachfolgend errreicht durch Bestimmen der Endsequenzen der 8 ausgewählten YACs (siehe unten). Die Reihenfolge der Marker, bereitgestellt durch die YAC-Contig-Karte, ist in vollständiger Übereinstimmung mit der Reihenfolge der Marker, welche durch die WI-Karte bereitgestellt wird, welche die Information von der genetischen Karte, der Strahlungshybridkarte und der STS-YAC-Contig-Karte ergänzt (Hudson et al., 1995). Die YAC-Contig-Karte bestätigt auch die Reihenfolge der STR-Marker, welche durch die Haplotypanalyse der Familie MAD31 nahegelegt war. Außerdem stellt die YAC-Contig-Karte zusätzliche Informationen über die relative Reihenfolge der STR-Marker bereit. Beispielsweise liegt D18S55 in YAC 931_g_10, jedoch nicht in 931_f_1 vor (14), wobei D18S55 von der Gruppe [S55-S969-S1113-S483-S465] getrennt ist, welche durch die Haplotypanalyse in der Familie MAD31 erhalten wurde. Die centromere Lokalisierung von D18S55 wird definiert durch den STS/STR-Gehalt der umgebenden YACs (14). Wenn wir die Haplotypdaten und die YAC-Contig-Karte kombinieren, wird die folgende Reihenfolge der STR-Marker erhalten: cen-[S51-S68-S346]-S55-[S969-S1113]-[S483-S465]-S876-S477-S979-S466-[S817-S61]-tel.
Von den 25 YAC-Klonen, welche den vollständigen Contig umspannen, wurden 7 YAC-Klone ausgewählt, um den minimalen Weg der Anornung ("tiling path") zu identifizieren (Tabelle 4). Diese 7 YAC-Klone decken die gesamte verfeinerte Region des Chromosoms 18 ab. Außerdem sollten die YAC-Klone bevorzugt nicht chimär sein, d.h. sie sollten nur Fragmente des humanen Chromosoms 18 enthalten. Um eine Untersuchung im Hinblick auf das Vorliegen von Chimären durchzuführen, wurden beide Enden dieser YACs subkloniert und sequenziert (siehe unten). Für jede der Sequenzen wurden Primer erhalten und DNA aus einem monochromosomalen Kartierungspanel wurde durch PCR unter Verwendung dieser Primer amplifiziert. Wie hierin nachfolgen angegeben wird, enthielten einige der YAC-Klone Fragmente von anderen Chromosomen abgesehen vom humanen Chromosom 18.
Dann wurden drei YAC-Klone ausgewählt, welche den minimalen Weg der Anornung umfassten (Tabelle 5). Wie durch eine Pulsfeld-Gelelektrophorese ermittelt wurde, waren diese drei YAC-Klone stabil und ihre Größen stimmten gut mit den veröffentlichten Größen überein. Diese YAC-Klone wurden in andere Hefe-Wirtsstämmen für eine Restriktionskartierung übertragen und sind Gegenstand einer weiteren Subklonierung.
Beschreibung der erfolgreich analysierten STSs, STRs und ESTs, welche die verfeinerte Kandidatenregion abdecken.
Erklärungen:

• STS ("Sequence Tagged Site"): mit einem Sequenz-Tag versehene Stelle
• STR („Simple Tandem Repeat"): einfaches Tandem-Repeat
• EST („Expressed Sequence Tag"): Exprimiertes Sequenz-Tag

Diese Marker werden von dem Centromer zum Telomer hin angeordnet. Es sind nur die Marker angegeben, welche effektiv untersucht wurden und welche auf den YACs funktionierten.
Liste:
1. D18S60:

Datenbank ID: AFM178XE3 (auch als 178xe3, Z16781, D18S60 bekannt)
Quelle: J Weissenbach, Genethon: "genetically mapped polymorphic STSs"
Chromosom: Chr18
Primer:
Links = CCTGGCTCACCTGGCA
Rechts = TTGTAGCATCGTTGTAATGTTCC
Produktlänge = 157

Überblick der vollständigen Sequenz

Genbank ID: Z16781
Beschreibung: H. sapiens (D18S60) DNA-Segment mit (CA)-Repeat;
Klon
Suche nach GDB-Eintrag

2. WI-9222:

Datenbank ID: UTR-03540 (auch als G06101, D18S1033, 9222, X63657 bekannt)
Quelle: WICGR: Primer von Genbank-Sequenzen
Chromosom: Chr18
Primer:
Links = GATCCCATAAAGCTACGAGGG
Rechts = GAGTCTAAAGACAAGAAAGCATTGC
Produktlänge = 99

Überblick der vollständigen Sequenz

Genbank ID: X63657
Beschreibung: H. sapiens fvt1 mRNA
Suche nach GDB-Eintrag

3. WI-7336:

Datenbank ID: UTR-04664 (auch als PI5, G00-679-135, G06527, 7336, U04313 bekannt)
Quelle: WICGR: Primer von Genbank-Sequenzen
Chromosom: Chr18
Primer:
Links = AGACATTCTCGCTTCCCTGA
Rechts = AATTTTGACCCCTTATGGGC
Produktlänge = 332

Überblick der vollständigen Sequenz

Genbank ID: G06527
Beschreibung: WICGR: Statistische genomweite STSs

4. WI-8145:

Datenbank ID: EST 102441 (auch als D18S1234, G00-677-827, G06845, 8145, T49159 bekannt)
Quelle: WICGR: STSs von dbEST-Sequenzen
Chromosom: Chr18
Primer:
Links = GAAATGCACATAACATATATTTGCC
Rechts = TGCTCACTGCCTATTTAATGTAGC
Produktlänge = 184

Überblick der vollständigen Sequenz

Linker und rechter Primer
PCR-Bedingungen
Genbank ID: T49159
Beschreibung: yb09e07.s1; Homo sapiens cDNA-Klon 70692 3' ähnlich wie gb:J02685
UNiGene-Cluster-Beschreibung: Humane mRNA für Arg-Serpin (Plasminogen-Aktivator 2, PAI-2), Suche nach GDB-Eintrag

5. WI-7061:

Datenbank ID: UTR-02902 (auch als PAI2, G00-678-979, G06377, 7061, M18082 bekannt)
Quelle: WICGR: Primer von Datenbank-Sequenzen
Chromosom: Chr18
Primer:
Links = TGCTCTTCTGAACAACTTCTGC
Rechts = ATAGAAGGGCATGGAGGGAT
Produktlänge = 338

Überblick der vollständigen Sequenz

PCR-Bedingungen
Genbank ID: G06377
Beschreibung: WICGR: Statistische genomweite STSs

6. D18S68:

Datenbank ID: AFM248YB9 (auch als 248yb9, Z17122, D18S68 bekannt)
J Weissenbach, Genethon: "genetically mapped polymorphic STSs"
Chromosom: Chr18
Primer:
Links = ATGGGAGACGTAATACACCC
Rechts = ATGCTGCTGGTCTGAGG
Produktlänge = 285

Überblick der vollständigen Sequenz

Genbank ID: Z17122
Beschreibung: H. sapiens (D18S68) DNA-Segment mit (CA)-Repeat;
Klon

7. WI-3170:

Datenbank ID: MR3726 (auch als D18S1037, G04207, HALd22f2, 3170 bekannt)
Quelle: WICGR: Statistische genomweite STSs
Chromosom: Chr18
Primer:
Links = TGTGCTACTGATTAAGGTAAAGGC
Rechts = TGCTTCTTCAATTTGTAGAGTTGG
Produktlänge = 156

Überblick der vollständigen Sequenz

Genbank ID: G04207
Beschreibung: WICGR: Statistische genomweite STSs

8. WI-5654:

Datenbank ID: MR10908 (auch als D18S1259, G00-678-695, G05278, 5654 bekannt)
Quelle: WICGR: Statistische genomweite STSs
Chromosom: Chr18
Primer:
Links = CTTAATGAAAACAATGCCAGAGC
Rechts = TGCAAAATGTGGAATAATCTGG
Produktlänge = 149

Überblick der vollständigen Sequenz

Genbank ID: G05278
Beschreibung: WICGR: Statistische genomweite STSs

9. WI-5654:

Datenbank ID: AFM122XC1 (auch als 122xc1, Z16621, D18S55, GC378-D18S55 bekannt)
Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = GGGAAGTCAAATGCAAAATC
Rechts = AGCTTCTGAGTAATCTTATGCTGTG
Produktlänge = 143

Überblick der vollständigen Sequenz

Genbank ID: Z16621
Beschreibung: H. sapiens (D18S55) DNA-Fragment mit (CA)-Repeat;
Klon

10. D18S969:

Datenbank ID: GATA-P18099 (auch als G08003, CHLC.GATA69F01, CHLC.GATA69F01.P18099 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats;
Chromosom: Chr18
Primer:
Links = AACAAGTGTGTATGGGGGTG
Rechts = CATATTCACCCAGTTTGTTGC
Produktlänge = 365

Überblick der vollständigen Sequenz

Genbank ID: G08003
Beschreibung: Human STS CHLC.GATA69F01.P18099 KLon GATA69F01.

11. D18S1113:

Datenbank ID: AFM200VG9 (auch als D18S1113, 200vg9, w2403 bekannt)
Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = GTTGACTCAAGTCCAAACCTG
Rechts = CAAAGACATTGTAGACGTTCTCTG
Produktlänge = 207

Überblick der vollständigen Sequenz
12. D18S868:

Datenbank ID: GATA-D18S868 (auch als G09150, CHLC.GATA3E12, CHCL.GATA3E12.496. CHLC.496, D18S868 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = AGCCAATACCTTGTAGTAAATATCC
Rechts = GATTCTCCAGACAAATAATCCC
Produktlänge = 189

Überblick der vollständigen Sequenz

Genbank ID: G09150
Beschreibung: Human STS CHLC.GATA3E12. P6553 KLon GATA3E12.

13. WI-9959:

Datenbank ID: MR12816 (auch als D18S1251, G00-678-524, G05488, 9959 bekannt)
Quelle: WICGR: Statistische genomweite STSs
Chromosom: Chr18
Primer:
Links = TGCCAACAGCAGTCAAGC
Rechts = AGCACCTGCAGCAGTAATAGC
Produktlänge = 110

Überblick der vollständigen Sequenz

Genbank ID: G05488
Beschreibung: WICGR: Statistische genomweite STSs;
Suche nach Datenbank-Eintrag

14. D18S537:

Datenbank ID: CHLC.GATA2E06.13 (auch als CHLC.13, GATA2E06, D18S537, GATA-D18S537 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = TCCATCTATCTTTGATGTATCTATG
Rechts = AGTTAGCAGACTATGTTAATCAGGA
Produktlänge = 191

Überblick der vollständigen Sequenz

Genbank ID: G07990
Beschreibung: Human STS CHLC.GATA2E06.P6006 KLon GATA2E06.
Suche nach Datenbank-Eintrag

15. D18S483:

Datenbank ID: AFM324WC9 (auch als 324wc9, Z24399, D18S483 bekannt)
Quelle: J. Weissenbach, Genethon: Genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = TTCTGCACAATTTCAATAGATTC
Rechts = GAACTGAGCAAACGAGTATGA
Produktlänge = 214

Überblick der vollständigen Sequenz

Genbank ID: Z24399
Beschreibung: H. sapiens (D18S483) DNA-Segment mit (CA)-Repeat;
KLon
Suche nach Datenbank-Eintrag

16. D18S483:

Datenbank ID: AFM250YH1 (auch als 260yh1, Z23850, D18S465 bekannt)
Quelle: J. Weissenbach, Genethon: Genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = ATATTCCCCTATGGAAGTACAG
Rechts = AAAGTTAATTTTCAGGCACTCT
Produktlänge = 232

Überblick der vollständigen Sequenz

Genbank ID: Z23850
Beschreibung: H. sapiens (D18S465) DNA-Segment mit (CA)-Repeat;
KLon
Suche nach Datenbank-Eintrag

17. D18S968:

Datenbank ID: GATA-P34272 (auch als G10262, CHLC.GATA117C05, CHLC.GATA117C05.P34272 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = GAAATTAACCAGACACTCCTAACC
Rechts = CTTAGAATTGCCTTTGCTGC
Produktlänge = 147

Überblick der vollständigen Sequenz

Genbank ID: G10262
Beschreibung: Human STS CHLC.GATA117C05.P34272 Klon GATA117C05.

18. GATA-P6051

Datenbank ID: GATA-P6051 (auch als CHLC.GATA3E08, CHLC.GATA3E08.P6051 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = GCAACAACCCTAATGAGTATACG
Rechts = GAGTCTCACCAGGGCTTACA
Produktlänge = 149

Überblick der vollständigen Sequenz

Genbank ID: G09104
Beschreibung: Human STS CHLC.GATA3E08.P6051 Klon GATA3E08.

19. D18S537:

Datenbank ID: GATA-D18S875 (auch als G08001, CHLC.GATA52H04, D18S875 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = TCCTCTCATCTCGGATATGG
Rechts = AAGGCTTTCAGACTTACACTGG
Produktlänge = 394

Überblick der vollständigen Sequenz

Genbank ID: G08001
Beschreibung: Human STS CHLC.GATA52H04.P16177 Klon GATA52H04.
Suche nach Datenbank-Eintrag

20. WI-2620:

Datenbank ID: MR1436 (auch als G03602, D18S890, HHAa12h3, 2620 bekannt)
Quelle: WICGR: Statistische genomweite STSs
Chromosom: Chr18
Primer:
Links = TCTCCAAGCTATTGATTGGATAA
Rechts = TTAAGAGCCAATTTATATAAAAGCAGC
Produktlänge = 177

Überblick der vollständigen Sequenz

Genbank ID: G03602
Beschreibung: WICGR: Statistische genomweite STSs;
Suche nach Datenbank-Eintrag

21. WI-4211:

Datenbank ID: MR6638 (auch als G03617, D18S980, 4211 bekannt)
Quelle: WICGR: Statistische genomweite STSs
Chromosom: Chr18
Primer:
Links = ATGCTTCAGGATGACGTAATACA
Rechts = AAATTCTCGCTGATTGGAGG
Produktlänge = 113

Überblick der vollständigen Sequenz

Genbank ID: G03617
Beschreibung: WICGR: Statistische genomweite STSs;
Suche nach Datenbank-Eintrag

22. D18S876:

Datenbank ID: GATA-D18S876 (auch als G09963, CHLC.GATA61E10, D18S876 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = TCAAACTTATAACTGCAGAGAACG
Rechts = ATGGTAAACCCTCCCCATTA
Produktlänge = 171

Überblick der vollständigen Sequenz

Genbank ID: G09963
Beschreibung: Human STS CHLC.GATA61E10.P17745 Klon GATA61E10.
Suche nach Datenbank-Eintrag

23. GCT3G01:

Datenbank ID: GCT-P10825 (auch als G09484, CHLC.GCT3G01, CHLC.GCT3G01.P10825 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = CTTTGCAATCTTAGTTAATTGGC
Rechts = GAACTATGATATGGAGTAACAGCG
Produktlänge = 128

Überblick der vollständigen Sequenz

Genbank ID: G09484
Beschreibung: Human STS CHLC.GCT3G01.P10825 Klon GCT3G01.

24. WI-528:

Datenbank ID: MR232 (auch als G03589, 582, D18S828 bekannt)
Quelle: WICGR: Statistische genomweite STSs
Chromosom: Chr18
Primer:
Links = TTCTGCCTTTCCTGACTGTC
Rechts = TGTTTCCCATGTCTTGATGA
Produktlänge = 211

Überblick der vollständigen Sequenz

Genbank ID: G03589
Beschreibung: WICGR: Statistische genomweite STSs;
Suche nach Datenbank-Eintrag

25. WI-1783:

Datenbank ID: MR432 (auch als G03587, _shu_31.Seq, 1783, D18S824 bekannt)
Quelle: WICGR: Statistische genomweite STSs
Chromosom: Chr18
Primer:
Links = CCAGTAATTAGACATTGACAGGTTC
Rechts = TTTTACTAGACAGGCTTGATAAACAA
Produktlänge = 305

Überblick der vollständigen Sequenz

Genbank ID: G03587
Beschreibung: WICGR: Statistische genomweite STSs;
Suche nach Datenbank-Eintrag

26. D18S477:

Datenbank ID: AFM301XF5 (auch als 301xf5, Z24212, D18S477 bekannt)
Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = GGACATCCTTGATTTGCTCATAA
Rechts = GATTGACTGAAAACAGGCACAT
Produktlänge = 243

Überblick der vollständigen Sequenz

Genbank ID: Z24212
Beschreibung: H. sapiens (D18S477) DNA-SEgment mit (CA)-Repeat;
KLon
Suche nach GDB-Eintrag

27. D18S979:

Datenbank ID: GATA-P28080 (auch als G08015, CHLC.GATA92C08, CHLC.GATA92C08.P28080 bekannt)
Quelle: CHLC: genetisch kartierte polymorphe Tetranukleotid-Repeats
Chromosom: Chr18
Primer:
Links = AGCTTGCAGATAGCCTGCTA
Rechts = TACGGTAGGTAGGTAGATAGATTCG
Produktlänge = 155

Überblick der vollständigen Sequenz

Genbank ID: G08015
Beschreibung: Human STS CHLC.GATA92C08.P28080 Klon GATA92C08.

28. WI-9340:

Datenbank ID: UTR-05134 (auch als G06102, D18S1034, 9340, X60221 bekannt)
Quelle: WICGR: Primer von Genbank-Sequenzen
Chromosom: Chr18
Primer:
Links = TGAGAGAACGAAATCTCTATCGG
Rechts = AGGCAGCAAGTTTTTATAAAGGC
Produktlänge = 115

Überblick der vollständigen Sequenz

Genbank ID: G06102
Beschreibung: WICGR: statistische genomweite STSs;
Suche nach GDB-Eintrag

29. D18S466:

Datenbank ID: AFM094YE5 (auch als 094ye5, Z23354, D18S466 bekannt)
Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = ACACTGTAGCAGAGGCTTGACC
Rechts = AGGCCAAGTTATGTGCCACC
Produktlänge = 214

Überblick der vollständigen Sequenz

Genbank ID: Z23354
Beschreibung: H. sapiens (D18S466) DNA-SEgment mit (CA)-Repeat;
KLon
Suche nach GDB-Eintrag

30. D18S1092:

Datenbank ID: AFMA112WE9 (auch als D18S1092, w5374, a112we9 bekannt)
Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = CTCTCAAAGTAAGAGCGATGTTGTA
Rechts = CCGAAGTAGAAAATCTTGGCA
Produktlänge = 163

Überblick der vollständigen Sequenz

Suche nach GDB-Eintrag

31. D18S61:

Datenbank ID: AFM193YF8 (auch als 193yf8, Z16834, D18S61 bekannt)
Quelle: J. Weissenbach, Genethon: genetisch kartierte polymorphe STSs
Chromosom: Chr18
Primer:
Links = ATTTCTAAGAGGACTCCCAAACT
Rechts = ATATTTTGAAACTCAGGAGCAT
Produktlänge = 174

Überblick der vollständigen Sequenz

Genbank ID: Z16834
Beschreibung: H. sapiens (D18S61) DNA-SEgment mit (CA)-Repeat;
KLon
Suche nach GDB-Eintrag

Marker (STRs), welche zum verfeinern der Kandidatenregion verwendet wurden.
Unten sind die Marker gezeigt, welche in der Familie MAD31 zum verfeinern der Kandidatenregion verwendet wurden. Die meisten dieser Marker sindbereits oben beschrieben und werden deshalb nur namentlich erwähnt. Die Information für die weiteren Marker ist hier angebenen.
Die Daten wurden bereits für D18S68, D18S55, D18S969, D18S1113, D18S483, D18S465, D18S876, D18S477, D18S979, D18S466, D18S61 gezeigt.
Neue Daten:
1. D18S51:

Andere Namen: UT574, (D18S379)
Primersequenzen: UT574a GAGCCATGTTCATGCCACTG
UT574b CAAACCCGACTACCAGCAAC DNA-Sequenz:
Genbank-ID: L18333

2. D18S346:

Andere Namen: UT575
Primerpaare: Primer A: TGGAGGTTGCAATGAGCTG
Primer B: CATGCACACCTAATTGGCG
Genbank-ID: L26588

3. D18S817:

Andere Namen: UT6365
Primerpaare: primer A: GCAAAGCAGAAGTGAGCATG
Primer B: TAGGACTACAGGCGTGTGC DNA-Sequenz:
Genbank-ID: L30552

Charakterisierung der YACs.
Es wurden (YACs ausgewählt, welche die Kandidatenregion umfassen und die Lücke flankieren. Diese YACy wurden weiter charakterisiert durch Bestimmung der Endsequenzen durch das Protokoll für inverse PCR.
Ausgewählte YACy: 961_h_9, 942_c_3, 766_f_12, 731_c_7, 907_e_1, 752_g_8, 717_d_3, 745_d_2
Neue STSs, basierend aus Endsequenzen (solange nichts anderes angegeben ist, wurden die STSs auf ainem monochromosomalen Kartierungspanel untersucht, um die Chimären der Yacs zu identifizieren; wenn die Stränge einen anderen Treffer als Chromosom 19q – chimäres YAC ergaben, dann ist dies im Text unten angegeben):
1. SV32L

Abgeleitet von der Endsequenz des linken Arms des YACs 745_d_3.
Primer A: GTTATTACAATGTCACCCTCATT
Primer B: ACATCTGTAAGAGCTTCACAAACA DNA-Sequenz:
Amplifizierte Sequenzlänge: 107 Basenpaare (bp)

Dieses STS weist keinen klaren Treffer auf dem monochromosomalen Kartierungspanel auf.
2. SV32R

Abgeleitet von der Endsequenz des rechten Arms des YACs 745_d_3.
Primer A: ACGTTTCTCAATTGTTTAGTC
Primer B: TGTCTTGGCATTATTTTTAC DNA-Sequenz:
Amplifizierte Sequenzlänge: 127 bp

Dieses STS weist keinen klaren Treffer auf dem monochromosomalen Kartierungspanel auf.
3. SV11L

Abgeleitet von der Endsequenz des linken Arms des YACs 766_f_12.
Primer A: CTATGCTCTGATCTTTGTTACTTT
Primer B: ATTAACGGGAAAGAATGGTAT DNA-Sequenz:
Amplifizierte Sequenzlänge: 118 bp

Dieses STS weist einen Treffer mit Chromosom 18 auf und muss zwischen CHLC.GATA-p6051 und D18S968 lokalisiert sein.
4. SV11R

Abgeleitet von der Endsequenz des rechten Arms des YACs 766_f_12.
Primer A: AAGGTATATTATTTGTGTCG
Primer B: AAACTTTTCTTAACCTCATA DNA-Sequenz:
Amplifizierte Sequenzlänge: 119 bp

Dieses STS weist einen Treffer mit Chromosom 18 auf und muss zwischen D18S876 und GCT3G01 lokalisiert sein.
5. SV34L

Abgeleitet von der Endsequenz des linken Arms des YACs 717_d_3.
Primer A: TCTACACATATGGGAAAGCAGGAA
Primer B: GCTGGTGGTTTTGGAGGTAGG DNA-Sequenz:
Amplifizierte Sequenzlänge: 98 bp

Dieses STS weist einen Treffer mit Chromosom 18 auf.
6. SV34R

Abgeleitet von der Endsequenz des rechten Arms des YACs 717_d_3.
Primer A: ATAAGAGACCAGAATGTGATA
Primer B: TCTTTGGAGGAGGGTAGTC DNA-Sequenz:
Amplifizierte Sequenzlänge: 244 bp

Dieses STS weist einen Treffer mit Chromosom 1 auf, deshalb ist YAC 717_d_3 chimär.
7. SV25L

Abgeleitet von der Endsequenz des linken Arms des YACs 731_c_7.
Primer A: AAATCTCTTAAGCTCATGCTAGTG
Primer B: CCTGCCTACCAGCCTGTC DNA-Sequenz:
Amplifizierte Sequenzlänge: 72 bp

Dieses STS weist keine klaren Treffer auf dem monochromosomalen Kartierungspanel auf
8. SV25R

Abgeleitet von der Endsequenz des rechten Arms des YACs 731_c_7.
Primer A: TGGGGTGCGCTGTGTTGT
Primer B: GAGATTTCATGCATTCCTGTAAGA DNA-Sequenz:
Amplifizierte Sequenzlänge: 136 bp

Dieses STS weist einen Treffer mit Chromosom 7 auf, deshalb ist YAC 731_c_7 chimär.
9. SV31L

Abgeleitet von der Endsequenz des linken Arms des YACs 752_g_8.
Primer A: GAGGCACAGCTTACCAGTTCA
Primer B: ATTCATTTTCTCATTTTATCC DNA-Sequenz:
Amplifizierte Sequenzlänge: 178 bp

Dieses STS weist einen Treffer mit Chromosom 18 auf und muss zwischen D18S876 und GCT3G01 lokalisiert sein.
10. SV31R

Abgeleitet von der Endsequenz des rechten Arms des YACs 752_g_8.
Primer A: CAAGATTATGCCTCAACT
Primer B: TAAGCTCATAATCTCTGGA DNA-Sequenz:
Amplifizierte Sequenzlänge: 131 bp

Dieses STS weist keine klaren Treffer auf dem monochromosomalen Kartierungspanel auf und gibt keine Information bezüglich der chimären Eigenschaft des YACs.
11. SV10L

Abgeleitet von der Endsequenz des linken Arms des YACs 942_c_3.
Primer A TCACTTGGTTGGTTAACATTACT
Primer B: TAGAAAAACAGTTGCATTTGATAT DNA-Sequenz:
Amplifizierte Sequenzlänge: 130 bp

Dieses STS weist einen Treffer mit Chromosom 18 auf und muss zwischen CHLC.GATA-p6051 und D18S968 lokalisiert sein.
12. SV10R

Abgeleitet von der Endsequenz des rechten Arms des YACs 942_c_3.
Primer A: AACCCAAGGGAGCACAACTG
Primer B: GGCAATAGGCTTTCCAACAT DNA-Sequenz:
Amplifizierte Sequenzlänge: 135 bp

Dieses STS weist einen Treffer mit Chromosom 18 auf und muss zwischen D18S876 und GCT3G01 lokalisiert sein.
13. SV6L

Abgeleitet von der Endsequenz des linken Arms des YACs 961_h_9.

Es wurde kein Primer hergestellt, da diese Sequenz identisch ist mit einem bekannten STR-Marker D18S42, welcher tatsächlich in dieser Region kartiert ist.

Primer A:
Primer B: DNA-Sequenz:
Amplifizierte Sequenzlänge: 130 bp

SV6L erkennt D18S42, weshalb es zwischen WI-7336 und WI-8145 lokalisiert sein muss.
14. SV6R

Abgeleitet von der Endsequenz des linken Arms des YACs 961_h_9.
Primer A: TTGTGGAATGGCTAAGT
Primer B: GAAAGTATCAAGGCAGTG DNA-Sequenz:
Amplifizierte Sequenzlänge: 122 bp

SV6R amplifiziert ein Segment auf dem Chromosom 18. Dieses Segment muss zwischen WI-2620 und WI-4211 lokalisiert sein.
15. SV26L

Abgeleitet von der Endsequenz des linken Arms des YACs 907_e_1.
Primer A: TATTTGGTTTGTTTGCTGAGGT
Primer B: CAAGAAGGATGGATACAAACAAG DNA-Sequenz:
Amplifizierte Sequenzlänge: 154 bp

Dieses STS weist einen Treffer mit Chromosom 13, deshalb ist YAC 907_e_1 chimär.
16. SV26R

Abgeleitet von der Endsequenz des rechten Arms des YACs 907_e_1.
Primer A: CGCTATGCATGGATTTA
Primer B: GCTGAATTTAGGATGTAA DNA-Sequenz:
Amplifizierte Sequenzlänge: 90 bp

Keine klaren Treffer auf dem monochromosomalen Kartierungspanel: keine Information betreffend die chimären Eigenschaften an dieser Seite des YAC.
Untersuchung der 3-End-Sequenzen, welche die Lücke in weiteren YACs flankieren: STS-Marker WI-4211, D18S876 und GCT3G01 sind auch in Tabelle 3 unten gezeigt, um YACs auf gegenüberliegenden Seiten der Lücke deutlicher zu identifizieren.

+: positiver Treffer/–: kein Treffer/?: 2 Fälle wurden beobachtet, bei welchen ein positiver Treffer erwartet wurde (aufgrund der angenommenen Reihenfolge der Marker), jedoch nicht beobachtet wurde. Die Gründe hierfür sind nicht klar.

YAC 745.d.2 wurde von der weiteren Analyse ausgenommen, da kein klarer Treffer mit Chromosom 18 vorlag. Von den verbleibenden 7 eines monochromosomalen Kartierungspanels wurde nachgewiesen, dass 3 chimär waren und dass 4 nicht chimär waren, wie in Tabelle 4 unten gezeigt wird.
Tabelle 4
Bei den nicht chimären YACs wurde das STS, basierend auf der Endsequenz, welche die Lücke flankiert (10R, 11R, 31L) bei 14 YACs untersucht, welche die Lücke flankieren. Überlappungen zwischen YACs auf gegenüberliegenden Seiten der Lücke wurden demonstriert: z.B. die "11R"-Endsequenz (766_f_12) weist YAC 766_f_12 und YAC 907_e_1 nach. Es wurden dann YACs ausgewählt, welche den minimalen Anordnungsweg umfassen: Tabelle 5
Diese drei YACs waren stabil, wie durch PFGE bestimmt wurde, und ihre Größen entsprachen ungefähr den veröffentlichten Größen. Diese YACs wurden für eine Restriktionskartierung in andere Hefe-Wirtsstämme übertragen.
Versuch 2
Konstruktion eines Fragmentationsvektors:
Ein EcoRI/SalI-Fragment von 4,5 kb von pBLC8.1 (Lewis et al., 1992), welches eine Lysin-2- und eine Telomersequenz trägt, wurde gerichtet in GEM3zf(–) kloniert, welcher mit ECORI/SalI verdaut war. Anschließend wurde eine End-Rescue-Stelle in die EcoRI-Stelle ligiert. Hierzu wurden zwei Oligonukleotide (Strang 1: 5'-TTCGGATCCGGTACCATCGAT-3' und Strang 2: 3'-GCCTAGGCCATGGTAGCTATT-5') in eine partiell (dATP) gefüllte EcoRI-Stelle ligiert, um den Vektor pDF1 zu erzeugen. Es wurden Fragmentationsvektoren mit Triplet-Repeat, konstruiert durch Klonieren eines 21 bp- und 30 bp-CAG/CTG-Adapters in die mit Klenow aufgefüllte PstI-Stelle von pDF1. Eine Transformation und Selektion ergab einen (CAG)₇- und einen (CTG)₁₀-Fragmentationsvektor mit der Orientierung der Repeat-Sequenz von 5' nach 3' bezogen auf das Telomer.
Transformation von Hefe:
Ein linearisierter (verdaut mit SalI) Vektor wurde verwendet, um die YAC-Klone 961_h_9, 766_f_12 oder 907_e_1 unter Verwendung des LiAc-Verfahrens zu transformieren. Nach der Transformation wurden die YAC-Klone auf SDLys^–-Platten ausplattiert, um bezäglich des Vorliegens des Fragmentationsvektors zu selektieren. Nach 2-3 Tagen wurden Kolonien in Kopien auf SDLys^–-Trp^–-Ura^–- und SDLys^–-Trp^–-Ura⁺-Platten ausplattiert. Kolonien, welche auf den SDLys^–-Trp^–-Ura⁺-Platten, nicht aber auf den SDLys^–-Trp^–-Ura^–-Platten wuchsen, enthielten die fragmentierten YACs.
Analyse der fragmentierten YACs:
Aus den Klonen mit dem korrekten Phänotyp isolierte Hefe-DNA wurde analysiert durch Pulsfeld-Elektrophorese (PFGE), gefolgt von Blotting und Hybridisierung mit dem Lys-2-Gen, und die Größen der fragmentierten YACs wurden durch Vergleich mit DNA-Standards von bekannter Länge abgeschätzt.
End-Rescue:
Fragmentierte YACs, charakterisiert durch eine mit anderen fragmentierten YACs gemeinsame Größe, was das Vorliegen eines Haupt-CAG- oder CTG-Triplet-Repeats andeutet, wurden mit einem der Enzyme aus der End-Rescue-Stelle verdaut, ligiert und für eine Transformation in E.coli verwendet. Nach dem Wachstum der transformierten Bakterien wurde die Plasmid-DNA isoliert und die Enden der fragmentierten YACs, entsprechend einer der Sequenzen, welche die isolierten Trinukleotid-Repeats flankieren, wurden sequenziert.
Die Sequenzierung ergab, dass fragmentierte YACs mit einer gleichen Länge alle an der gleichen Stelle fragmentiert waren. Es wurde eine BLAST-Suche in der GenBank-Datenbank mit den identifizierten Sequenzen durchgeführt, um eine Homologie mit bekannten Sequenzen zu identifizieren. Die komplette Sequenz, umfassend die CAG- oder CTG-Repeats der fragmentierten YACs, wurde durch Cosmid-Sequenzierung erhalten, wobei sequenzspezifische Primer und Splice-Primer verwendet wurden, wie zuvor beschrieben (Fuentes et al., 1992, Hum. Genet. 101: 346-350), oder durch Verwendung des "Genome-Walker"-Kits (Clontech Laboratories, Palo Alto, USA), von Siebert et al., Nucleic Acid Res (1995) 23(6): 1087-1088 und von Siebert et al. (1995), CLONTECHniques X(II): 1-3 beschrieben.
Ergebnisse:
Ein YAC 961.h.9-Klon wurde mit dem (CAG)₇- oder (CTG)₁₀-Fragmentationsvektor transformiert. Der CTG-Vektor offenbarte nicht das Vorliegen von irgendeinem CTG-Repeat. Die Analyse von zwölf (CAG)₇-fragmentierten YACs zeigte, dass fünf dieser YACs die gleiche Größe von ungefähr 100 kb aufwiesen. Es wurde ein End-Rescue mit EcoRI durchgeführt und die Sequenzierung von drei dieser Fragmente ergab, dass sie alle die in 15 kursiv gezeigte terminale Sequenz teilten. Eine BLAST-Suche in der GenBank-Datenbank mit dieser Sequenz zeigte das Vorhandensein einer Sequenzhomologie mit dem CAP2-Gen (GenBank Accession Nr: L40377). Die in 15a gezeigte Sequenz, welche das CAG-Repeat umfasst, wurde sowohl durch Cosmid-Sequenzierung als auch Genome-Walker-Sequenzierung erhalten. Die Sequenz wurde mittels STS-Gehalt-Kartierung zwischen den Markern D18S68 und WI-3170 kartiert.
Ein YAC 766-f-12 wurde unter Verwendung des (CAG)- oder (CTG)₁₀-Fragmentationsvektors fragmentiert. Erneut offenbarte der (CTG)₁₀-Vektor nicht das Vorhandensein von irgendeinem CTG-Repeat. Eine Analyse von zwanzig (CAG)₇-fragmentierten YACs zeigte das Vorhandensein von zwei Gruppen von Fragmenten mit der gleichen Größe: fünf mit ungefähr 650 kb und zwei mit ungefähr 50 kb.
Unter Verwendung von EcoRI wurde mit vier der fragmentierten YACs von 650 kb ein End Rescue durchgeführt. Die Sequenzierung bestätigte, dass sie alle identische 3'-Termini teilten, charakterisiert durch die kursiven Buchstaben in 16a gezeigte Sequenz. Eine BLAST-Suche zeigte eine Homologie dieser Sequenz mit der Alu-Repeat-Sequenzfamilie. Die in 16a gezeigte, das CAG-Repeat umfassende Sequenz wurde durch Cosmid-Sequenzierung erhalten. Die Sequenz wurde mittels STS-Gehalt-Kartierung zwischen den Markern WI-2620 und WI-4211 auf der YAC-Contig-Karte kartiert. Mit den zwei Fragmenten von 50 kb wurde ebenso ein End-Rescue durchgeführt. Die Sequenzierung ergab die in kursiven Buchstaben in 17a gezeigte Sequenz. Eine BLAST-Suche ergab keine Sequenzhomologie mit irgendeiner bekannten Sequenz. Eine Cosmid-Sequenzierung ermöglichte die Identifizierung der volständigen Sequenz, die die CAG-Repeats umfasst, welche in 17a gezeigt ist. Die Sequenz wurde mittels STS-Gehalt-Kartierung zwischen den Markern D18S968 und D18S875 auf der YAC-Contig-Karte kartiert.
Ein YAC 907-e-1-Klon wurde mit dem (CAG)₇- oder (CTG)₁₀-Fragmentationsvektor transformiert. Der (CAG)₇-Vektor offenbarte nicht das Vorhandensein von irgendeinem CAG-Repeat. Die Analyse von sechsundzwanzig (CTG)₁₀-fragmentierten YACs ergab, dass 21 von ihnen die gleiche Größe von ungefähr 900 kb aufwiesen. Mit KpnI wurde mit drei fragmentierten YACs dieser Größe ein End-Rescue durchgeführt. Die Sequenzierung ergab die in kursiven Buchstaben in 18a gezeigte Nukleotidsequenz. Eine BLAST-Suche zeigte das Vorhandensein einer Homologie dieser Sequenz mit dem GCT3G01-Marker (GenBank Accession Nr: G09484). Die das CTG-Repeat umfassende Sequenz wurde von der GenBank-Datenbank erhalten. Die Sequenz wurde zwischen den Markern 10R und WI-528 kartiert.
SEQUENZPROTOKOLL

Claims

Verfahren zum Bestimmen der Anfälligkeit eines Individuums für eine bipolare Störung, worin das Verfahren Analysieren einer von dem Individuum erhaltenen DNA-Probe bezüglich des Vorliegens eines DNA-Polymorphismus, welcher mit einer bipolaren Störung in Zusammenhang steht, in einer Region des humanen Chromosoms 18q, welche zwischen den polymorphen Markern D18S68 und D18S979 angeordnet ist, umfasst.
Verfahren nach Anspruch 1, worin der DNA-Polymorphismus eine Trinukleotid-Repeat-Expansion ist.
Verfahren nach Anspruch 2, worin die Trinukleotid-Repeat-Expansion in einer Nukleotidsequenz enthalten ist, welche sich von der in einer der 15a, 16a, 17a oder 18a gezeigten Nukleotidsequenzen nur in der Trinukleotid-Repeat-Expansion unterscheidet.
Verfahren nach Anspruch 2 oder 3, welches die Schritte umfasst: a) Erhalten einer DNA-Probe von dem Individuum; b) Bereitstellen von Primern, welche für die Amplifikation einer Nukleotidsequenz geeignet sind, welche in einer der 15a, 16a, 17a oder 18a gezeigten Nukleotidsequenzen enthalten ist, worin die Primer die in der Sequenz gezeigten Trinukleotid-Repeats flankieren; c) Einsetzen der Primer bei der DNA-Probe und Durchführen einer Amplifikationsreaktion; d) Durchführen der gleichen Amplifikationsreaktion mit einer DNA-Probe eines Kontrollindividuums; und e) Vergleichen der Ergebnisse der Amplifikationsreaktion des Individuums und der des Kontrollindividuums; worin das Vorliegen eines amplifizierten Fragments von dem Individuum, welches größer ist als das des Kontrollindividuums, ein Anzeichen für das Vorliegen einer Anfälligkeit für eine bipolare Störung des Individuums ist.
Verfahren nach Anspruch 4, worin die zu amplifizierende Nukleotidsequenz in der in 15a gezeigten Sequenz enthalten ist, und worin die Primer die in 15b gezeigten Sequenzen aufweisen.
Verfahren nach Anspruch 4, worin die zu amplifizierende Nukleotidsequenz in der in 16a gezeigten Sequenz enthalten ist, und worin die Primer die in 16b gezeigten Sequenzen aufweisen.
Verfahren nach Anspruch 4, worin die zu amplifizierende Nukleotidsequenz in der in 17a gezeigten Sequenz enthalten ist, und worin die Primer die in 17b gezeigten Sequenzen aufweisen.
Verfahren nach Anspruch 4, worin die zu amplifizierende Nukleotidsequenz in der in 18a gezeigten Sequenz enthalten ist, und worin die Primer die in 18b gezeigten Sequenzen aufweisen.
Verwendung einer Region des humanen Chromosoms 18q, welche zwischen den polymorphen Marken D18S68 und D18S979 angeordnet ist, oder eines Fragments davon zum Identifizieren zumindest eines humanen Gens, einschließlich mutierter oder polymorpher Varianten davon, welches zur Manifestation einer bipolaren Störung beiträgt.
Verwendung nach Anspruch 9, worin der Anteil des humanen Chromosoms 18q in einem YAC-Klon vorliegt.
Verwendung nach Anspruch 10, worin der YAC-Klon ein Klon des CEPH Mega-YACs ist, welcher ausgewählt ist aus 961_h_9, 942_c_3, 766_f_12, 731_c_7, 907_e_1, 752_g_8 oder 717_d_3.
Verwendung nach Anspruch 10, worin der YAC-Klon 961_h_9, 766_f_12 oder 907_e_1 ist.
Verwendung nach einem der Ansprüche 9 bis 12, worin die bipolare Störung ausgewählt ist aus der Taxonomie des diagnostischen und statistischen Handbuch psychischer Erkrankungen („Diagnostic and Statistical Manual of Mental Disorders"), Version 4 (DSM-IV), und Gemütskrankheiten (296.XX, 300.4, 311, 301, 13, 295.70), Schizophrenie und verwandte Erkrankungen (295, 297.1, 298.9, 297.3, 298.9), Angsterkrankungen (300.XX, 309.81, 308.3), Anpassungsstörungen (309, XX) und Persönlichkeitsstörungen (Code 301.XX) umfasst.
Verwendung nach einem der Ansprüche 10 bis 12, worin das zumindest eine humane Gen, einschließlich mutierter oder polymorpher Varianten davon, welches zur Manifestation einer bipolaren Störung beiträgt, durch ein Verfahren identifiziert wird, welches die Schritte umfasst: (a) Subklonieren eines YAC-Klons, wie in einem der Ansprüche 10 bis 12 beschrieben, in Exon-Trap-Vektoren; (b) Transfizieren von Säugerzellen mit einem in Schritt (a) hergestellten Exon-Trap-Vektor; (c) Kultivieren der Säugerzellen in einem geeigneten Medium; (d) Isolieren von RNA-Transkripten, welche von einem SV40-Promotor exprimiert werden; (e) Herstellen von cDNA von solchen RNA-Transkripten; (f) Identifizieren von Spleiß-Ereignissen, welche die Exons der in den gemäß Schritt (a) in den Exon-Trap-Vektor subklonierten DNA betreffen, um die Positionen der codierenden Regionen in der subklonierten DNA zu identifizieren; (g) Nachweisen von Unterschieden zwischen den codierenden Regionen und äquivalenten Regionen in der DNA eines Individuums, welches unter der bipolaren Störung leidet; und (h) Identifizieren des Gens oder von mutierten oder polymorphen Varianten davon, welches bzw. welche zu der Manifestation der bipolaren Störung beiträgt bzw. beitragen.
Verwendung nach einem der Ansprüche 10 bis 12, worin das zumindest eine humane Gen, einschließlich mutierter oder polymorpher Varianten davon, welches zu der Manifestation einer bipolaren Störung beiträgt, durch ein Verfahren identifiziert wird, welches die Schritte umfasst: (a) Subklonieren eines YAC-Klons, wie in einem der Ansprüche 10 bis 12 beschrieben, in einen Cosmid-, BAC-, PAC- oder einen anderen Vektor; (b) Verwenden der in einer der 1 bis 11 gezeigten Nukleotidsequenzen oder einer beliebigen anderen bekannten, mit einem Tag versehenen Sequenz aus dem in 14 gezeigten YAC-Contig, oder eines Teils davon, welcher aus nicht weniger als 14 benachbarten Basen besteht, oder dem Komplement davon, um Überlappungen zwischen den Subklonen nachzuweisen und eine Karte davon zu erstellen; (c) Identifizieren der Positionen der Gene in der subklonierten DNA durch eines oder mehrere von CpG-Insel-Identifizierung, Zoo-Blotting, Hybridisierung der subklonierten DNA mit einer cDNA-Bibliothek oder einen Northern-Blot von mRNA aus einem Panel von Kulturzelllinien; (d) Nachweisen von Unterschieden zwischen den Genen und äquivalenten Regionen der DNA von einem Individuum, welches unter einer bipolaren Störung leidet; und (e) Identifizieren des Gens, welches, wenn es fehlerhaft ist, zu der Manifestation einer bipolaren Störung beiträgt.