CA2348657C - Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante - Google Patents

Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante Download PDF

Info

Publication number
CA2348657C
CA2348657C CA2348657A CA2348657A CA2348657C CA 2348657 C CA2348657 C CA 2348657C CA 2348657 A CA2348657 A CA 2348657A CA 2348657 A CA2348657 A CA 2348657A CA 2348657 C CA2348657 C CA 2348657C
Authority
CA
Canada
Prior art keywords
sequence
seq
dna
exon
amplification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CA2348657A
Other languages
English (en)
Other versions
CA2348657A1 (fr
Inventor
Jean Weissenbach
Jamile Hazan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Original Assignee
Centre National de la Recherche Scientifique CNRS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National de la Recherche Scientifique CNRS filed Critical Centre National de la Recherche Scientifique CNRS
Priority to CA2848454A priority Critical patent/CA2848454C/fr
Publication of CA2348657A1 publication Critical patent/CA2348657A1/fr
Application granted granted Critical
Publication of CA2348657C publication Critical patent/CA2348657C/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, et certaines de ses mutations responsables de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux treansgéniques ainsi que des méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.

Description

CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE
SPASTIQUE AUTOSOMIQUE DOMINANTE.
L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, responsable de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques ainsi que des méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé
chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.
Les paraplégies spastiques familiales (PSF) sont des affections dégénératives du système nerveux central caractérisées par une spasticité bilatérale et progressive des membres inférieurs. Elles se manifestent cliniquement par des difficultés de la marche pouvant évoluer en une paralysie totale des deux jambes. La physiopathologie de cet ensemble de "maladies est à ce jour peu documentée ; toutefois, les données anatomopathologiques permettent de conclure que l'atteinte est limitée aux faisceaux pyramidaux responsables de la motricité volontaire dans la moelle épinière (Reid, 1997). Il existe différentes formes cliniques et génétiques de PSF. On distingue cliniquement les PSF dites pures correspondant à une spasticité isolée des membres inférieurs, des PSF complexes pour lesquelles la spasticité des jambes est associée à d'autres manifestations cliniques de type neurologique ou non (Bruyn et al., 1991). D'un point de vue génétique, les PSF peuvent être transmises selon le mode autosomique dominant (PSF-AD), autosomique récessif (PSF-AR) ou lié au chromosome X (PSF-X). La forme pure de PSF qui est le plus souvent transmise selon le mode autosomique dominant demeure la plus fréquente (environ 80 % des PSF) (Reid, 1997). L'incidence des PSF qui reste difficile à estimer en raison des rares études épidémiologiques et de l'importante variabilité clinique varie de 0,9:
100 000 au Danemark, 3 à 9,6: 100 000 dans certaines régions d'Espagne (Polo et al.,1991) ou 14: 100 000 en Norvège (Skre, 1974) (environ 3: 100 000 en France).
En plus de cette grande variabilité clinique qui est observée non seulement entre les différentes familles mais aussi entre différents membres atteints d'une même famille, les PSF se caractérisent également par une importante hétérogénéité
génétique. Dans le cas des PSF-AD, quatre loci ont été identifiés à ce jour sur les
2 chromosomes 14 (locus SPG3) (Hazan et al., 1993), 2 (locus SPG4) (Hazan et al., 1994 ; Hentali et al., 1994), 15 (locus SPG6) (Fink et al., 1995) et 8 (locus SPG8) (Hedera et al., 1999). L'étude d'un grand nombre de familles présentant une PSF-AD a montré que le gène porté par le chromosome 2 est un locus majoritaire de cette forme de la maladie, retrouvé dans 40 à 50 h des familles analysées (The Hereditary Spastic Paraplegia Working Group, 1996 ; Durr et al., 1996). Un phénomène d'anticipation a été observé dans certaines familles de PSF liée au locus SPG4 ; ce phénomène a par la suite été associé à l'expansion d'une répétition (CAG)n mise en évidence dans 6 familles danoises (Nielsen et al., 1997) par la technique de RED (pour Rapid Expansion Detection). Cette expansion n'a cependant jamais pu être confirmée dans aucune des familles testées par cette même méthode ni par la recherche systématique de séquences de type (CAG)n dans les cartes physiques composées de clones YAC
(pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosome) (Hazan et al., Genomics, 60 (3), 309-19, 1999).
A ce jour, trois gènes responsables de deux formes de PSF-X et d'une forme de PSF-AR ont été identifiés. Des mutations dans le gène, codant pour une molécule d'adhérence cellulaire spécifique des neurones, L1-CAM (pour L1 Cell Adhesion Molecule), et localisé en Xq28 (locus SPG1) causent une forme complexe de PSF
(Jouet et al., 1994) dans laquelle la spasticité est associée à un retard mental, alors que des mutations dans le gène PLP (pour ProteoLipid Protein) situé en Xq21 (locus SPG2), codant pour une molécule constitutive de la couche de myéline, sont à
l'origine de formes pures et complexes de PSF-X (Saugier-Veber, P. et al., 1994). Plus récemment des mutations dans un gène localisé en 16q24.3 (locus SPG7), qui code pour la paraplegin, une ATPase mitochondriale de la famille protéique des AAA
(pour ATPases Associated with diverse cellular Activities ) (Confalonieri et al., 1995) ont été associées à des formes complexes et pures de PSF-AR (Casari et al., 1998).

Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caractériser le gène responsable de la forme la plus fréquente de PSF-AD. L'identification de ce gène devrait en particulier permettre, outre la possibilité d'un test de dépistage anténatal chez les familles concernées, de mieux comprendre certains des mécanismes moléculaires engendrant ces dégénérescences spécifiques de faisceaux nerveux de la moelle épinière, voire d'apporter des éléments de réponse quant à un traitement thérapeutique des malades.
Ceci est justement l'objet de la présente invention.
3 Après avoir délimité l'intervalle de localisation entre les marqueurs génétiques D2S352 et D2S2347 par l'étude des évènements de recombinaison dans les familles de PSF liées au locus SPG4, les inventeurs ont établi un contig de E3ACs recouvrant une distance physique évaluée à environ 1,5 Mb et entrepris une stratégie de clonage positionnel basée sur le séquençage de l'intervalle SPG4 afin d'identifier de façon exhaustive tous les gènes localisés dans la région candidate. L'analyse de la séquence des deux BACs, D (b336P14) et G (B763N4), a révélé la présence d'un gène composé
de 17 exons, s'étendant sur une distance d'environ 100 kb, et présentant une homologie avec les gènes codant pour des protéines de la famille des AAA. La comparaison de la séquence de ce gène entre les individus sains et atteints des familles de PSF-AD a permis de mettre en évidence différentes mutations chez les patients.
L'invention a ainsi pour objet l'identification et la caractérisation du gène (ou SPAST) codant pour un nouveau membre nucléaire de la famille des AAA, responsable de la forme la plus fréquente de PSF-AD.
Sous un premier aspect, la présente invention a pour objet un acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 35, 40, 45, 50, 75, 100 ou nucléotides consécutifs, d'une séquence choisie parmi le groupe comprenant :
- la séquence SEQ ID No. 1, séquence génomique du gène SPG4 humain ;
- les séquences nucléiques homologues ou variantes de l'acide nucléique de séquence SEQ ID No. 1;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
La présente invention concerne, bien entendu, aussi bien les séquences ADN
qu'ARN ainsi que les séquences qui s'hybrident avec elles, de même que les ADNs double brin correspondants.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entendra désigner aussi bien un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou de synthèse, comportant ou non des nucléotides non naturels, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique. On entend par fragment d'ADN
et/ou
4 d'ARN naturel isolé, ou de synthèse, comportant ou non des nucléotides non naturels, un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment, un segment ou une région d'un acide nucléique.
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à-dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié.
Par séquence nucléique homologue , on entendra désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique, et/ou une mutation, notamment ponctuelle, et dont la séquence nucléique présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence nucléique de référence.
Par pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à
comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Les comparaisons de séquences entre deux séquences d'acide nucléique ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L'alignement optimal des séquences pour la comparaison peut être réalisé, outre manuellement, au moyen de l'algorithme d'homologie locale de Smith et Waterman (1981) [Ad. App. Math. 2:482], au moyen de l'algorithme d'homologie locale de Neddleman et Wunsch (1970) [J. Mol. Biol.
48:443], au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988) [Proc. Natl. Acad. Sci. USA 85:2444], au moyen de logiciels informatiques utilisant ces algorithmes (GAP, BESTFIT, FASTA et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI, ou encore par les logiciels de comparaison BLAST N ou BLAST P).
Le pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés est déterminé en comparant ces deux séquences alignées de manière optimale par fenêtre de comparaison dans laquelle la région de la séquence d'acide nucléique ou d'acides aminés à comparer peut comprendre des additions ou des délétions par rapport à la séquence de référence pour un alignement optimal entre ces deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre de positions identiques pour lesquelles le nucléotide ou le résidu d'acide aminé
est
5 identique entre les deux séquences, en divisant ce nombre de positions identiques par le nombre total de positions dans la fenêtre de comparaison et en multipliant le résultat obtenu par 100 pour obtenir le pourcentage d'identité entre ces deux séquences.
Par exemple, on pourra utiliser le programme BLAST, BLAST 2 sequences (Tatusova et al., "Blast 2 sequences - a new tool for comparing protein and nudeotide sequences", FEMS Microbiol. Lett. 174:247-250) les paramètres utilisés étant ceux donnés par défaut (en particulier pour les paramètres open gap penaltie : 5, et extension gap penaltie : 2 ; la matrice choisie étant par exemple la matrice BLOSUM 62 proposée par le programme), le pourcentage d'identité entre les deux séquences à
comparer étant calculé directement par le programme.
H s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec une des séquences de l'invention. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 80 %, de préférence 90 % ou 95 % d'identité après alignement entre l'une des deux séquences et la séquence complémentaire de l'autre.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN
complémentaires.
A titre illustra , des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits ci-dessus, sont avantageusement les suivantes.
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42 C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCI + 0,015 M
citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardfs, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i.e. : 42 C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20 C en 2 x SSC +2 % SDS, 1 lavage de 20 minutes à 20 C
en 0,1 x SSC + 0,1 % SOS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 %
SDS
6 pendant 30 minutes à 60 C pour une sonde de taille> 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de taille définie, seront adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et al., 1989.
Par séquence nucléique variante ou acide nucléique varianb> d'une séquence nucléique de référence, on entendra désigner l'ensemble des séquences nucléiques correspondant à des variants alléliques, c'est-à-dire des variations individuelles de la séquence nucléique de référence. Ces séquences mutées naturelles correspondent à des polymorphismes présents chez les mammifères, en particulier chez l'être humain et, notamment, à des polymorphismes pouvant conduire à la survenue et/ou au développement de pathologie.
Si les séquences selon l'invention concernent les séquences normales, elles concernent également les séquences mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10 % de mutations par rapport à la séquence normale.
En particulier, les séquences nucléiques variantes comprendront toute séquence d'au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 50, 100 ou 200 nucléotides consécutifs, d'une séquence polymorphique de la séquence génomique du gène SPG4 humain de séquence SEQ ID No. 1, et dont la séquence d'acide nucléique présente par rapport à la séquence SEQ ID No. 1 au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidu d'acide aminé. Dans le cas présent, les séquences nucléiques variantes présentant au moins une mutation seront ici liées aux pathologies de type PSF-AD liées au locus SPG4.
De préférence, la présente invention concerne des séquences nucléiques mutées dans lesquelles les mutations conduisent à une modification de la séquence d'acides aminés du polypeptide codé par la séquence normale.
On entendra également désigner par séquences nucléiques variantes tout ARN
ou ADNc résultant d'une mutation d'un site d'épissage de la séquence nucléique génomique SEQ ID No. 1.
De préférence, l'invention concerne un acide nucléique purifié ou isolé du gène =
SPG4 selon l'invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No.
72, la séquence SEQ ID No. 106 ou la séquence d'au moins 15, de préférence 20, 25,
7 30, 35, 40, 45, 50, 75, 100 ou 200 nucléotides consécutifs de la séquence SEQ
ID
No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
b) les séquences nucléiques homologues ou variantes des séquences SEQ ID No.
1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et c) la séquence complémentaire ou la séquence de l'ARN correspondant aux séquences telles que définies en a) et b), de préférence à l'exception de l'acide nucléique identifié dans la banque de données GenBank sous le numéro d'accession AB029006.
L'acide nucléique dont la séquence est divulguée dans la banque de données GenBank sous le numéro d'accession AB029006, correspond à la séquence de l'un des 100 ADNc issus d'une banque d'ARNm de cerveau humain identifiée par le Kazusa DNA Research Institute au Japon (Kikuno et al., DNA Resarch, 6, 197-205, 1999).
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une séquence d'au moins nucléotides consécutifs, de préférence 20, 25, 30, 50 ou 75 nucléotides consécutifs du fragment nt 714-809, extrémités incluses, de la séquence SEQ ID No. 2, de sa séquence complémentaire ou de la séquence de son ARN correspondant.
L'invention concerne de préférence un acide nucléique purifié ou isolé selon la présente invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe suivant :
- la séquence SEQ ID No. 1;
- la séquence SEQ ID No. 2, séquence de l'ADNc codant pour la spastin humaine ;
- les séquences SEQ ID No. 72 et SEQ ID No. 106, la séquence SEQ ID No. 72 représentant la séquence de l'ADNc incomplet codant pour la spastin murine représentée à la figure 5, ligne "Mouse" et la SEQ ID No. 106 sa séquence complète ;
- les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une mutation correspondant à
un polymorphisme naturel chez l'Homme, notamment dont la position et la nature sont identifiées dans le tableau 5.
8 PCT/FRO0/02433 Les amorces ou sondes, caractérisées en ce qu'elles comprennent une séquence d'un acide nucléique selon l'invention, font également partie de l'invention.
La présente invention concerne ainsi l'ensemble des amorces qui peuvent être déduites des séquences nucléotidiques de l'invention et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques de l'invention, en particulier les séquences mutées, en utilisant notamment une méthode d'amplification telle que la méthode PCR, ou une méthode apparentée.
La présente invention concerne également l'ensemble des sondes qui peuvent être déduites des séquences nucléotidiques de l'invention, notamment des séquences capables de s'hybrider avec elles, et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques, en particulier de discriminer les séquences normales des séquences mutées.
La présente invention concerne en particulier les sondes ou amorces de séquences choisies parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce, pour la détection, l'identification, le dosage ou l'amplification de séquence d'acide nucléique.
Selon l'invention, les polynucléotides pouvant être utilisés comme sonde ou comme amorce dans des procédés de détection, d'identification, de dosage ou d'amplification de séquence nucléique, présenteront une taille minimale de 15 bases, de préférence de 20 bases, ou mieux de 25 à 30 bases.
L'ensemble des sondes et amorces selon l'invention pourront être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable.
Les séquences de polynucléotides selon l'invention non marquées peuvent être utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 35S, le 3H ou le 1251. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents
9 luminescents tels que les agents radioluminescents, chémiluminescents, bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR
(réaction en chaîne à la polymérase) (Erlich, 1989; Innis et al., 1990, et Rolfs et al., 1991). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la technique décrite dans le brevet américain U.S. N 4,683,202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquencés. La spécificité de l'amplification peut être contrôlée en utilisant comme amorce les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés. Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entendra désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription reverse. Il existe actuellement de très nombreux procédés permettant cette amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. en 1989, la technique 3SR (Self-Sustained Sequence Replication) décrite par Guatelli et ai en 1990, la technique NASI3A (Nudeic Acid Sequence Based Amplification) décrite par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable, la technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la technique CPR (Cycling Probe Reaction) décrite par Duck et al. en 1990, la technique Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilisera avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à
La technique d'hybridation de sondes peut être réalisée de manières diverses (Matthews et al., 1988). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde.
Après Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sonde de capture. Dans ce cas, Les séquences selon la présente invention de site accepteur ou donneur Sous un autre aspect, l'invention comprend une méthode pour le criblage de banques d'ADNc ou d'ADN génomique, ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en oeuvre une séquence Parmi ces méthodes, on peut citer notamment :
- le criblage de banques d'ADNc et le clonage des ADNc isolés (Sambrook et al., 1989; Suggs et al., 1981 ; Woo et al., 1979), à l'aide des séquences nucléiques selon l'invention ;
- le criblage de banques génomiques, par exemple de BACs (Chumakov et al., 1992;
Chumakov et al., 1995) et éventuellement une analyse génétique en FISH (Cherif et al., 1990) à l'aide de séquences selon l'invention, permettant l'isolement et la localisation chromosomique, puis le séquençage complet du gène SPG4 codant pour la spastin.
En particulier, ces méthodes selon l'invention pourront être mises en oeuvre pour l'identification et ainsi l'obtention de la séquence génomique ou de l'ADNc du gène SPG4 chez d'autres mammifères, notamment la souris.
Ces méthodes de criblage et/ou de clonage comprendront en particulier une étape d'hybridation d'un acide nucléique selon l'invention avec un acide nucléique contenu dans une banque génomique ou d'ADNc.
L'invention comprend aussi une méthode d'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4 de séquence SEQ ID No. 1, caractérisée en ce qu'elle met en oeuvre un acide nucléique selon l'invention.
Les outils informatiques à la disposition de l'homme du métier lui permettent aisément d'identifier à partir des séquences nucléiques génomiques selon l'invention les boîtes régulatrices promotrices nécessaires et suffisantes au contrôle de l'expression génique, notamment les boîtes TATA, CCAAT, GC, ainsi que les séquences régulatrices stimulatrices ( enhancer ) ou inhibitrices ( silencers ) qui contrôlent en GIS l'expression des gènes selon l'invention ; parmi ces séquences régulatrices, il convient de citer l'IRE, MRE, CRE.
L'invention concerne également des méthodes pour l'identification de mutations portées par le gène SPG4 humain caractérisées en ce qu'elles mettent en oeuvre une séquence nucléique selon l'invention, notamment de mutations responsables de la paraplégie spastique familiale autosomique dominante.
Ces méthodes d'identification de ces mutations comprendront en particulier les étapes suivantes : (i) isolement de l'ADN à partir da l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARNm de l'échantillon biologique ; (ii) amplification spécifique de l'ADN cible susceptible de présenter une mutation à l'aide d'amorces selon l'invention ; (iii) analyse des produits d'amplification, notamment la taille et/ou la séquence des produits d'amplification, par rapport à une séquence de référence.
Par méthodes d'identification de mutation selon l'invention, on entend également désigner une méthode permettant d'obtenir l'acide nucléique sur lequel a été identifiée ladite mutation.
Font également partie de l'invention, les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention présentant des mutations susceptibles de modifier l'expression de la protéine correspondante.
Les acides nucléiques caractérisés en ce qu'ils sont susceptibles d'être obtenus par une des méthodes précédentes selon l'invention, ou les acides nucléiques capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 80 % entre une des deux séquences et la séquence complémentaire de l'autre) avec lesdits acides nucléiques, font partie de l'invention, notamment les acides nucléiques variants ou homologues, en particulier les séquences nucléiques de variants alléliques du gène SPG4 de séquence SEQ ID No. 1 ou de son ADNc de séquence SEQ ID
No. 2, ainsi que les séquences génomiques des gènes homologues d'autres mammifères tels que la souris.
Dans la présente description, on entendra désigner par "Spg4" le gène de souris homologue au gène humain SPG4.
L'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce pour le criblage de banque génomique ou d'ADNc fait bien entendu partie de l'objet de la présente invention.
Sous un autre aspect, l'invention comprend un polypeptide purifié ou isolé
codé
par un acide nucléique selon l'invention, de préférence à l'exception du peptide de 584 acides aminés dont la séquence est identifiée dans la banque de données GenBank sous le numéro d'accession AB029006.
Dans la présente description, on utilisera le terme polypeptide pour désigner également une protéine ou un peptide.
De préférence, la présente invention concerne un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la séquence SEQ ID No. 3, correspondant à la spastin humaine codée par la séquence SEQ ID No. 2 de l'ADNc du gène SPG4 humain ;

- la séquence SEQ ID No. 73, correspondant à un fragment de la spastin murine codée par la séquence SEQ ID No. 72 de l'ADNc incomplet du gène Spg4 de souris, la séquence SEQ ID No. 73 est représentée à la figure 4A, ligne "SPAST_MOUSE" ;
- la séquence SEQ ID No. 107, correspondant à la spastin mutine codée par la séquence SEQ ID No. 106 de l'ADNc complet du gène Spg4 de souris ;
- les séquences de polypeptides homologues et variants du polypeptide de séquence SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107 ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 3, la séquence SEQ ID No. 73, la séquence SEQ ID No.

107 ou la séquence d'au moins 10 acides aminés consécutifs d'une de ces séquences ; et b) les séquences homologues ou variantes des séquences SEQ ID No. 3, SEQ ID
No.
73 ou SEQ ID No; 107.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend la séquence d'au moins 8, de préférence d'au moins 10, 15, 20 ou 30 acides aminés consécutifs de la séquence du fragment aa 197-228, extrémités incluses, de la séquence SEQ ID No. 3.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la séquence SEQ ID No. 3, la séquence SEQ ID No. 73 et la séquence SEQ ID
No.
107, lesquelles séquences portant au moins une des mutations correspondant à
un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
Il doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement. En effet, l'invention concerne les peptides obtenus par purification à partir de sources naturelles, ou bien obtenus par recombinaison génétique, ou encore par synthèse chimique et pouvant alors comporter des amino-acides non naturels. La production d'un polypeptide recombinant, qui peut être réalisée en utilisant l'une des séquences nudéotidiques selon l'invention est particulièrement avantageuse car elle permet d'obtenir un niveau de pureté accrue du polypeptide désiré.
Par polypeptide homologue, on entendra désigner les polypeptides présentant certaines modifications par rapport au polypeptide de référence, comme en particulier une ou plusieurs délétions, troncations, un allongement, une fusion chimérique, et/ou une ou plusieurs substitutions, et dont la séquence d'acides aminés présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence d'acides aminés de référence.
Par polypeptide variant (ou variant protéique), on entendra désigner l'ensemble des polypeptides codés par les séquences nucléiques variantes telles que précedemment définies.
En particulier, les polypeptides variants comprendront tout polypeptide codé
par la séquence génomique mutée du gène SPG4 de séquence SEQ ID No. 1, et dont la séquence d'acides aminés présente au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidus d'acides aminés par rapport à la séquence SEQ ID No. 3. Dans le cas présent, les polypeptides variants présentant au moins une mutation seront liés aux pathologies de type PSF-AD.
On entendra également désigner par polypeptide variant tout polypeptide résultant de mutation d'un site d'épissage dans la séquence nucléique génomique SEQ ID No. 1.
L'invention comprend également les vecteurs de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'invention.
Les vecteurs selon l'invention, caractérisés en ce qu'ils comportent les éléments permettant l'expression et/ou la sécrétion desdites séquences dans une cellule hôte, ou encore une séquence d'adressage cellulaire, font également partie de l'invention.
Les vecteurs caractérisés en ce qu'ils comportent une séquence de promoteur et/ou de régulateur selon l'invention, font également partie de l'invention.
Lesdits vecteurs comporteront de préférence un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Ils doivent pouvoir être maintenus de façon stable dans la cellule et peuvent éventuellement posséder des signaux particuliers spécifiant la sécrétion de la protéine traduite.
Ces différents signaux de contrôle sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences d'acide nucléique selon l'invention peuvent être 5 insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi.
Parmi les systèmes à réplication autonome, on utilisera de préférence en fonction de la cellule hôte, des systèmes de type plasmidique ou viral, les vecteurs viraux pouvant notamment être des adénovirus (Perricaudet et al., 1992), des
10 rétrovirus, des lentivirus, des poxvirus ou des virus herpétiques (Epstein et al., 1992).
L'homme du métier connaît les technologies utilisables pour chacun de ces systèmes.
Lorsque l'on souhaitera l'intégration de la séquence dans les chromosomes de la cellule hôte, on pourra utiliser par exemple des systèmes de type plasmidique ou viral ; de tels virus seront, par exemple, les rétrovirus (Temin, 1986), ou les AAV
15 (Carter, 1993).
Parmi les vecteurs non viraux, on préfère les polynucléotides nus tels que l'ADN
nu ou l'ARN nu selon la technique développée par la société VICAL, les chromosomes artificiels de levure (YAC, yeast artificiel chromosome) pour l'expression dans la levure, les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour l'expression dans les cellules murines et de manière préférée les chromosomes artificiels d'homme (HAC, human artificiel chromosome) pour l'expression dans les cellules humaines.
De tels vecteurs seront préparés selon les méthodes couramment utilisées par l'homme du métier, et les clones en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple la lipofection, l'électroporation, le choc thermique.
L'invention comprend en outre les cellules hôtes, notamment les cellules eucaryotes et procaryotes, transformées par les vecteurs selon l'invention ainsi que les animaux transgéniques, excepté l'Homme, comprenant une desdites cellules transformées selon l'invention.
Parmi les cellules utilisables à ces fins, on peut citer bien entendu les cellules bactériennes (Olins et Lee, 1993), mais également les cellules de levure (Buckholz, 1993), de même que les cellules animales, en particulier les cultures de cellules de mammifères (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster chinois (CHO), mais également les cellules d'insectes dans lesquelles on peut utiliser des procédés mettant en oeuvre des baculovirus par exemple (Luckow, 1993). Un hôte cellulaire préféré pour l'expression des protéines de l'invention est constitué par les cellules CHO.
Parmi les mammifères selon l'invention, on préférera des animaux tels que les souris, les rats ou les lapins, exprimant un polypeptide selon l'invention.
Parmi les mammifères selon l'invention, on préférera également ceux comprenant une cellule transformée caractérisée en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations correspondant à un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention.
Parmi les mammifères selon l'invention, on préférera également des animaux tels que les souris, les rats ou les lapins, caractérisés en ce que le gène codant pour la =
spastin selon l'invention, n'est pas fonctionnel ou est invalidé.
Parmi les modèles animaux plus particulièrement intéressants ici, on trouve notamment :
- les animaux transgéniques présentant au moins dans une de leurs deux séquences alléliques du gène SPG4, une au moins des mutations dont la position et la nature sont identifiées au tableau 5 ou identifiées par une méthode selon la présente invention. Ces animaux transgéniques sont obtenus par exemple par recombinaison homologue sur cellules souches embryonnaires, transfert de ces cellules souches à
des embryons, sélection des chimères affectées au niveau des lignées reproductrices, et croissance desdites chimères ;
- les animaux (de préférence souris) transgéniques surexprimant le gène SPG4 dans lequel pourra être introduite une desdites mutations selon l'invention. Les souris sont obtenues par exemple par transfection de copie de ce gène sous contrôle d'un promoteur fort de nature ubiquitaire, ou sélectif d'un type de tissu, ou après transcription virale ;
- les animaux (de préférence souris) transgéniques rendus déficients pour le gène SPG4 selon l'invention, par inactivation à l'aide du système LOXP/CRE
recombinase (Rohlmann et al., 1996) ou de tout autre système d'inactivation de l'expression de ce gène.
Les cellules et mammifères selon l'invention sont utilisables dans une méthode de production d'un polypeptide selon l'invention, comme décrit ci-dessous, et peuvent également servir à titre de modèle d'analyse et pour le criblage de banque d'ADN
(génomique ou d'ADNc).
Les cellules ou mammifères transformés tels que décrits précédemment peuvent être ainsi utilisées à titre de modèles afin d'étudier les interactions entre les polypeptides selon l'invention, et les composés chimiques ou protéiques, impliqués directement ou indirectement dans les activités des polypeptides selon l'invention, ceci afin d'étudier les différents mécanismes et interactions mis en jeu.
Surtout, ils peuvent être utilisés pour la Sélection de produits interagissant avec les polypeptides selon l'invention, notamment la spastin humaine de séquence SEQ ID
No. 3 ou ses variants selon l'invention, à titre de cofacteur, ou d'inhibiteur, notamment compétitif, ou encore ayant une activité agoniste ou antagoniste de l'activité
des polypeptides selon l'invention. De préférence, on utilisera lesdites cellules transformées ou animaux transgéniques à titre de modèle permettant, notamment, la sélection de produits permettant de lutter contre la pathologie liée au gène mentionnée ci-dessus.
L'invention concerne également l'utilisation de cellule, de mammifère ou de polypeptide selon l'invention pour le criblage de composé chimique ou biochimique pouvant interagir directement ou indirectement avec les polypeptides selon l'invention, et/ou capable de moduler l'expression ou l'activité de ces polypeptides.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention pour la synthèse de polypeptides recombinants.
La méthode de production d'un polypeptide de l'invention sous forme recombinante est elle-même comprise dans la présente invention, et se caractérise en ce que l'on cultive les cellules transformées, notamment les cellules ou mammifères de la présente invention, dans des conditions permettant l'expression d'un polypeptide recombinant codé par une séquence d'acide nucléique selon l'invention, et que l'on récupère ledit polypeptide recombinant.
Les polypeptides recombinants, caractérisés en ce qu'ils sont susceptibles d'être obtenus par ladite méthode de production, font également partie de l'invention.
Les polypeptides recombinants obtenus comme indiqué ci-dessus, peuvent aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent présenter ou non la structure tertiaire naturelle.
Ces polypeptides peuvent être produits à partir des séquences d'acide nucléique définies ci-dessus, selon les techniques de production de polypeptides recombinants connues de l'homme du métier. Dans ce cas, la séquence d'acide nucléique utilisée est placée sous le contrôle de signaux permettant son expression dans un hôte cellulaire.
Un système efficace de production d'un polypeptide recombinant nécessite de disposer d'un vecteur et d'une cellule hôte selon l'invention.
Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nuc.léotidique transfectée.
Les procédés de purification de polypeptide recombinant utilisés sont connus de l'homme du métier. Le polypeptide recombinant peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps monoclonaux ou polyclonaux spécifiques, etc..
Les polypeptides selon la présente invention peuvent être obtenus par synthèse chimique et ce en utilisant l'une des nombreuses synthèses peptidiques connues, par exemple les techniques mettant en oeuvre des phases solides ou des techniques utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique.
La technique de synthèse en phase solide est bien connue de l'homme du métier. Voir notamment Stewart et al. (1984) et Bodansky (1984).
Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondants sont également compris dans l'invention.
Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'invention, font partie de l'invention.
Des anticorps polyclonaux spécifiques peuvent être obtenus à partir d'un sérum d'un animal immunisé contre les polypeptides selon l'invention, notamment produit par recombinaison génétique ou par synthèse peptidique, selon les modes opératoires usuels.
On notera notamment l'intérêt d'anticorps reconnaissant de façon spécifique certains polypeptides, variants, ou leurs fragments immunogènes, selon l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridomes décrite par Kôhler et Milstein, 1975.

Les anticorps selon l'invention sont, par exemple, des anticorps chimériques, des anticorps humanisés, des fragments Fab ou F(abl2 Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués afin d'obtenir un signal détectable et/ou quantifiable.
L'invention concerne également des méthodes pour la détection et/ou la purification d'un polypeptide selon l'invention, caractérisées en ce qu'elles mettent en oeuvre un anticorps selon l'invention.
L'invention comprend en outre des polypeptides purifiés, caractérisés en ce qu'ils sont obtenus par une méthode selon l'invention.
Par ailleurs, outre leur utilisation pour la purification des polypeptides, les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent également être utilisés pour la détection de ces polypeptides dans un échantillon biologique.
Ils constituent ainsi un moyen d'analyse immunocytochimique ou immuno-histochimique de l'expression des polypeptides selon l'invention, notamment le polypeptide de séquence SEQ ID No. 3 ou l'un de ses variants, sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immuno-conjugués enzymatiques.
Ils pourront permettre notamment de mettre en évidence une expression anormale de ces polypeptides dans les tissus ou prélèvements biologiques, ce qui les rend utiles pour le suivi de l'évolution de la maladie et le diagnostic moléculaire.
Plus généralement, les anticorps de l'invention peuvent être avantageusement mis en oeuvre dans toute situation où l'expression d'un polypeptide selon l'invention, normal ou muté, doit être observée.
Font également partie de l'invention, les méthodes de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou de toute anomalie génétique du gène SPG4 selon l'invention, caractérisées en ce qu'elles mettent en oeuvre une séquence d'acide nucléique ou un anticorps selon l'invention.
La présente invention comprend ainsi une méthode de diagnostic génotypique de la pathologie associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention.
De préférence, l'invention concerne une méthode de diagnostic génotypique de la maladie associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisé en ce qu'il comporte les étapes suivantes :

a) le cas échéant isolement de l'ADN génomique à partir de l'échantillon biologique à
analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ;
b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'invention ;
5 c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
L'invention comprend également une méthode de diagnostic de la maladie associée à une expression anormale d'un polypeptide codé par le gène SPG4, notamment le polypeptide de séquence SEQ ID No. 3, caractérisée en ce que l'on met 10 en contact un ou des anticorps selon l'invention avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
Ces méthodes visent par exemple les méthodes de diagnostic de la PSF-AD
15 associée à la présence de mutation dans le gène SPG4 selon l'invention, notamment anténatal, en déterminant à partir d'un prélèvement biologique du patient la présence de mutations dans au moins une des séquences décrites précédemment. Les séquences d'acides nucléiques analysées pourront aussi bien être de l'ADN
génomique, de l'ADNc, ou de l'ARNm.
20 Des acides nucléiques ou anticorps basés sur la présente invention pourront également être utilisés pour permettre un diagnostic positif chez un malade ou un diagnostic pré-symptomatique chez un sujet à risque, notamment avec antécédent familial.
Les méthodes permettant de mettre en évidence une mutation dans un gène par rapport au gène sauvage sont, bien entendu, très nombreuses. On peut essentiellement les diviser en deux grandes catégories. Le premier type de méthode est celui dans lequel la présence d'une mutation est détectée par comparaison de la séquence mutée avec la séquence correspondante sauvage, et le second type est celui dans lequel la présence de la mutation est détectée de façon indirecte, par exemple par évidence de mésappariements dus à la présence de la mutation.
Ces méthodes peuvent mettre en oeuvre les sondes et amorces de la présente invention décrites. Il s'agit généralement de séquences nucléiques d'hybridation purifiées comprenant au moins 15 nucléotides, de préférence 20, 25 ou 30 nucléotides, caractérisées en ce qu'elles peuvent s'hybrider spécifiquement avec une séquence nucléique selon l'invention.

De préférence, les conditions d'hybridation spécifiques sont telles que celles définies précédemment ou dans les exemples. La longueur de ces séquences nucléiques d'hybridation peut varier de 15, 20 ou 30 à 200 nucléotides, particulièrement de 20 à 50 nucléotides.
Parmi les méthodes de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou d'une anomalie génétique, on préfère les méthodes comprenant au moins une étape d'amplification dite par PCR (réaction en chaîne par la polymérase) ou par PCR-like de la séquence cible selon l'invention susceptible de présenter une anomalie à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Les produits amplifiés pourront être traités à l'aide d'enzyme de restriction appropriée avant de procéder à la détection ou au dosage du produit ciblé.
Les mutations du gène SPG4 selon l'invention, peuvent être responsables de différentes modifications de son produit de traduction, modifications utilisables pour une approche diagnostique. En effet, les modifications d'antigénicité liées à
ces mutations peuvent permettre la mise au point d'anticorps spécifiques. La discrimination du produit de gène muté peut être réalisée par ces méthodes. Toutes ces modifications peuvent être utilisées dans une approche diagnostique grâce à plusieurs méthodes bien connues basées sur l'utilisation d'anticorps mono- ou polyclonaux reconnaissant le polypeptide normal ou des variants mutés, comme par exemple par RIA ou par ELISA.
Ainsi, l'invention a également pour objet une trousse ou nécessaire pour le diagnostic, notamment pour le diagnostic de la PSF-AD associée à la présence de mutation dans le gène SPG4 selon l'invention, caractérisée en ce qu'elle comprend au moins un composé choisi parmi le groupe de composés suivant :
a) un acide nucléique, notamment comme amorce ou sonde, selon la présente invention ; et b) un anticorps selon l'invention.
Sous un autre aspect, l'invention comprend une méthode de sélection d'un composé chimique ou biochimique capable de prévenir et/ou de traiter la PSF-AD
associée au gène SPG4, caractérisée en ce que l'on met en uvre une séquence d'acide nucléique selon l'invention, un polypeptide selon l'invention, un vecteur selon l'invention, une cellule selon l'invention, un mammifère selon l'invention ou un anticorps selon l'invention.

Sont également comprises dans l'invention, les méthodes de sélection de composés chimiques ou biochimiques capables d'interagir directement ou indirectement avec des polypeptides selon l'invention ou avec les acides nucléiques selon l'invention, eVou permettant de moduler l'expression ou l'activité de ces polypeptides, caractérisées en ce qu'elles comprennent la mise en contact d'un polypeptide selon l'invention, d'une cellule transformée selon l'invention, ou d'un mammifère selon l'invention, avec un composé candidat et, la détection d'une modification de l'activité dudit polypeptide.
Par exemple, mais sans s'y limiter, on peut citer une méthode d'identification de molécules capables d'interagir avec un polypeptide selon l'invention en utilisant un système de double hybride bactérien ou levure tel que le Matchmaker Two Hybrid System eselon les instructions du manuel accompagnant le Matchmaker Two Hybrid System 21batalogue N K1604-1, Clontech).
Les acides nucléiques codant pour des protéines interagissant avec les séquences promotrices eVou régulatrices du gène SPG4 selon l'invention, peuvent être criblés et/ou sélectionnés en utilisant un système de simple hybride tel que celui décrit dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech (Catalog N K1603-).
Sous un autre aspect, l'invention comprend l'utilisation d'acide nucléique ou de polypeptide selon l'invention, d'un vecteur selon l'invention, d'une cellule selon l'invention, ou d'un mammifère selon l'invention, pour l'étude de l'expression ou de l'activité du gène SPG4.
D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples et les figures dont les légendes sont représentées ci-après.
LEGENDES DES FIGURES
FIGURES 1A, 18 et 1C : Carte physique de l'intervalle SPG4 et organisation génomique de SPG4.
FIGURE 1A : La région candidate de 1,5 Mb est délimitée par les marqueurs génétiques D2S352 et D2S2347 indiqués en caractères gras. La position des marqueurs polymorphes et autres STSs est, indiquée en caractères standards alors que la position des ESTs est indiquée en italique. Les clones de BAC
constituant la carte de préséquençage sont représentés par des rectangles dont le nom figure au-.

dessus et la taille précise du clone au-dessous si celle-ci a pu être déterminée. Le nom des BACs A, B, C, ... est suivi d'une parenthèse contenant le nom du clone précédé
d'un b si le clone est issu de la banque de BACs CITB_978_SKB ou d'un B
si celui-ci provient de la banque RPCI-11.
FIGURE 1B : Représentation schématique du gène SPG4 qui chevauche les BACs D (b336P14) et G (B563N4). Les exons sont figurés comme des rectangles noirs avec leur nom au-dessus.
FIGURE 1C : Les cinq mutations identifiées dans sept familles de PSF-AD liées au locus SPG4 sont positionnées dans les exons 7, 11, 13 et dans le site accepteur d'épissage de l'intron 15.
FIGURE 2 : Séquence nucléique et protéique de l'ADNc SPG4 et de la spastin.
Les 17 barres verticales avec un nombre situé au-dessous représentent les jonctions entre les différents exons. Le codon ATG initiateur est localisé en position nt 126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des mutations identifiées à ce jour, dont la perte de l'exon 16, sont indiquées en italique (nt 1210, nt 1468, nt 1520, nt 1620 et pour la perte de l'exon 16: nt 1813-1853).
Le site de polyadénylation est en italique et souligné. Le signal de localisation nucléaire (NLS) putatif, RGKKK, ainsi que les trois domaines conservés prédits par l'analyse dans la base de données ProDom sont respectivement localisés aux positions aa7-11 (NLS), aa342-409 (domaine 92), aa411-509 (domaine 179) et aa512-599 (domaine 6226).
Les quatre motifs prédits par la comparaison de séquence dans la base de données Prosite sont : deux motifs leucine zippers aux positions aa50-78 et aa508-529, le site de fixation de l'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine de dimérisation helix-loop-helix aux positions aa478-486. Les motifs A et B de Walker, GPPGNGKT et IIFIDE , ainsi que le consensus minimal des AAA sont soulignés.
FIGURES 3A et 3B Caractérisation d'une mutation d'un site d'épissage chez les individus atteints de trois familles de PSF-AD liée au locus SPG4.
FIGURE 3A: Amplification par PCR du fragment IV de l'ADNc SPG4 à partir d'ADNc de lymphoblastes : puits IVI, marqueur de taille VII (Boehringer) ;
puits 1, membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ;
puits 3, membre non atteint de la famille 5330 ; puits 4, patient de la famille 5330 ;
puits 5, patient de la famille 5226; puits 6, témoin négatif (ADN génomique humain).
FIGURE 3B: Graphe de séquence de la mutation du site accepteur d'épissage de l'intron 15.

WO 01/18198 PCT/F'R00/02433 Séquence génomique de l'individu contrôle en haut et d'un patient de la famille 2992 en bas. L'astérisque à la position nt 1813-4 indique un polymorphisme A->C qui touche un nucléotide non conservé du site accepteur d'épissage de l'intron 15 chez le patient.
FIGURES 4A et 4B: Les homologies de la spastin.
Les résidus identiques sont respectivement surlignés en grisé.
FIGURE 4A : Alignement multiple créé par CLUSTAL W de huit protéines issues de divers organismes et présentant une forte homologie de séquence avec les spastin humaine et murine (SEQ ID No. 73).
FIGURE 4B : Alignement par CLUSTAL W des métalloprotéases de levure AFG3, RCA1 et YME1, et des paraplegin et spastin humaines.
FIGURE 5: Alignement par BLASTN des séquences nucléiques de l'ADNc SPG4 et de son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadénylation de l'ADNc murin est souligné et en italique. Le codon STOP est localisé en position nt dans l'ADNc murin et en position nt 1974-1976 dans l'ADNc humain.
FIGURES 6A, 6B et 6C : Analyse par PCR de l'expression de SPG4 et de son orthologue murin Spg4.
FIGURE 6A: Collection d'ADNc provenant de multiples tissus de souris.
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau ;
puits 3, rate ; puits 4, poumon ; puits 5, foie ; puits 6, muscle squelettique ; puits 7, rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7; puits 10, embryon de 11 jours El 1 ; puits 11, embryon de 15 jours El 5 ; puits 12, embryon de 17 jours El 7 ; puits 13, témoin négatif (ADN génomique de souris).
FIGURE 6G: Collection d'ADNc provenant de multiples tissus humains.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancréas ; puits 7, placenta ; puits 8, muscle squelettique ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).
FIGURE 6C : Collection d'ADNc provenant de multiples tissus de foetus humain.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique ; puits 7, rate ; puits 8, thymus ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).

EXEMPLES
Exemple 1: Matériels et méthodes 1) Sous-clonage et séquençage de la région candidate Douze BACs provenant de deux banques génomiques humaines, = 5 CITB_978_SKB (commercialisées par Research Genetics) et RPCI-11 (Osoegawa et ai, 1998), et recouvrant l'intervalle SPG4 ont été sélectionnés pour être séquencés (Hazan et al., Genomics, 60 (3), 309-19, 1999). 40 pg de l'ADN de chaque BAC a été
digéré partiellement par l'enzyme de restriction CviJI (CHIMERx) et séparé par électrophorèse sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les 10 tailles varient autour de 3, 5 et 10 kb ont été éluées avec la 13-agarase (Biolabs) et liguées à un vecteur plasmide pBAM3 préalablement digéré par Smal et déphosphorylé dans un rapport de 1Xinsert pour 5Xvecteur. Des bactéries E.
coui DH1013 électrocompétentes (GIBCO-BRL) ont été transformées par électroporation avec les différentes ligations. Environ 1000 à 1500 sous-clones par BAC (8 à

15 génomes équivalents) composés de 20 % de clones avec inserts à 10 kb, 40 % de clones avec inserts à 5 kb et 40 % de clones avec inserts à 3 kb ont été
isolés. Les extrémités des inserts de ces clones ont été séquencées sur un séquenceur automatique LICOR 4200N. Pour chaque BAC, les séquences furent assemblées en un TM
squelette constitué de plusieurs contigs à l'aide des logiciels Phred et Phraples trous 20 entre chaque contig furent séquencés avec des dideoxynudéotides marqués sur un TM
séquenceur ABI 377 (PE-Applied Biosystems). Les exons contenus dans ces contigs nt de séquence ont été prédits par les programmes informatiques GRAIL II, GENSCAPF,*
FGENEfret GenierLes séquences furent également comparées dans les bases de données nucléiques et protéiques de l'EMBL et de GenBank avec les programmes 25 BLASTN et BLASTX. La détermination des séquences promotrices fut réalisée par les TM
programmes informatiques TSSG et TSSW. Les résultats de toutes ces analyses de TM
séquences furent visualisés par le programme d'annotation de séquence Genotator.
2) Clonage de l'ADNc L'ADNc du gène SPG4 a été isolé par des expériences de RACE-PCR en 5' et 3' sur des ARN polyA+ de cerveau foetal, cerveau adulte et foie adulte à
l'aide du kit d'amplification d'ADNc MarathonICIontech), selon les instructions du fournisseur. Une première PCR, suivie d'une PCR interne furent effectuées avec différents couples d'amorces dont les séquences sont indiquées sur le tableau 1 ci-après :
=

Tableau 1 Amorces utilisées pour les RACE-PCR et les amplifications d'ADNc Amorce Séquence (5'-3') Position en 5' couple/ PCR Taille du produit SPA 5RACE5 CGGAGCTCCTCTTGGCTGCCATG (SEQ ID No.4) nt 405 SPA_5RACE6 AGAAGCGCTGGCAGAGCCACACGAAG (SEQ ID No.5) nt 372 SPA_5RACE7 AAGGCGACCAAACGCAGCAGCGCGAAG (SEQ ID No.6) nt 331 SPA_3RACE1 AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550 SPA_3RACE2 TGGTTATGGCCAAGGACCGCTTACAAC (SEQ ID No.8) nt 689 SPA_3RACE3 CAAACGGACGTCTATAATGACAGTAC (SEQ ID No.9) nt 747 SPA_3RACE4 TTAGGAATGTGGACAGCAACCTTGC (SEQ ID No.10) nt 1075 SPA 3RACE5 CTTCTCTGAGGCCTGAGTTGTTCAC (SEQ ID No.11) nt 1207 SPA_3RACE6 TGCTAGAATGACTGATGGATACTCAGG (SEQ ID No.12) nt 1736 SPA_3RACE7 AGATGCAGCACTGGGTCCTATCCG (SEQ ID No.13) nt.1787 SPA_3RACE8 ATGAACGTCATCGGCTACAGAAACAG (SEQ ID No.14) nt 2037 SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No 15) nt 45 b+m 655 pb SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) nt 700 SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No.17) nt 106 c+n 543 pb SPA Dn CTAGCTCTTTCACACTGTTC (SEQ ID No.18) nt 649 SPA_Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) nt 487 d+n 746 pb SPA Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) nt 1233 SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No.21) nt 532 SPA_An TGCCAAGTCTTGACCAGC (SEQ ID No.22) nt 1175 SPA Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) nt 1036 a+m 763 pb SPA_Bm CAGTGCTGCATCTTTTGCC (SEQ ID No.24) nt 1799 SPA_Bb TAGGAATGTGGACAGCAACC (SEQ ID No.25) nt 1076 SPA_Bn AAAGCTGTTAGGTCACTTCC (SEQ ID No.26) nt 1780 SPA Ca TGGAGATGACAGAGTAC'TTG (SEQ ID No.27) nt 1550 a+m 766 pb SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) nt 2316 SPA_Cb ATGAGGCTGMTCAGGCG (SEQ ID No.29) nt 1603 TM
Les produits de RACE-PCR ont été clonés avec le kit TA-cloning (Invitrogen) et les clones correspondants ont été séquences sur un ABI 377 (PE-Applied Biosystems).
La séquence du transcrit SPG4 a été vérifiée par le séquençage de produits de PCR
amplifiés à partir d'une population d'ADNc provenant des lymphoblastes de 6 individus sains.
3) Détection des mutations Les ARNs totaux ont été extraits de lignées de lymphoblastes d'un individu atteint par famille étudiée et de 6 individus témoins à l'aide du kit RNA

(bioprobe System). La synthèse de l'ADNc a été réalisée sur 500 ng à 1 pg d'ARN
avec 100 pmoles d'amorces hexamères aléatoires (Pharmacia) et 200 unités de TM
reverse transcriptase Superscript Il (Gibco BRL) dans des conditions standards.
Quatre amplifications par PCR, générant des fragments chevauchants qui recouvrent la totalité de la phase ouverte de lecture de SPG4, ont été réalisées sur les ADNc des patients et contrôles. Le fragment I fut amplifié avec les amorces SPA_Db/SPA_Dm, 25 pendant 50 sec, à l'exception du fragment 1 : 58 C pendant 50 sec) et d'élongation (72 C pendant 1 min), suivis d'une dernière étape d'élongation (5 min à 72 C).
Les produits de PCR sont séquencés sur un séquenceur automatique ABI 377 (PE-Applied Biosystems) avec les amorces SPA_Dc/SPA_Dn, SPA Ac/SPA An, SPA_Bb/SPA_Bn et SPA_Cb/SPA_Cm pour les fragments I, Il, 1H et IV respectivement 30 Les mutations furent également recherchées ou confirmées par séquençage des 17 exons prédits du gène SPG4 chez les patients et contrôles. Chaque exon fut amplifié avec le couple correspondant d'amorces a+m (cf. tableau 2 ci-après), à
l'exception de l'exon 1 (gSPAex1c/gSPAex1m), et des exons 10, 11 et 12 qui furent co-amplifiés avec les couples d'amorces gSPAex10a/gSPAex12m et 35 gSPAex11a/gSPAex12m.

Tableau 2 Amorces de PCR pour l'amplification et le séquençage des exons Exon Taille du produit Programme de PCR Amorce Séquence (5'-3') (SEQ id Nos. ; 30 à 71) 1 1048 pb 0 gSPAex1c GTGAGCCGAACTGCACATTG
gSPAex1m CAAAGTCGACAGCTACAGTGC
g SPAex1d GGAACTGTAGTTGAGTGGGA
gSPAex1n AGATGAGGCTCCGACCTAC
2 624 pb 3 gSPAex2a AATGCCACACTTGTAATCTC
gSPAex2m TGTGAATATATCATAATTTGGG
gSPAex2b TACAGCAGTTCTCATGATG
3 812 pb 1 gSPAex3a GACCAAATTGGTGCATGCATG
gSPAex3m ACATTTCCAATACATCCCAC
4 379 pb 3 gSPAex4a ATTTGTCATTTCACATGCAC
gSPAex4m TTAGAATGACTATACCTGAC
gSPAex4n TCAGGTTAAGTAAGACTC
830 pb 4 gSPAex5a TTCCTATCTACCTAGTGAC
gSPAex5m TTTTATAGCAAGTTGCCCTG
gSPAex5b CCTATGAAGATCCTGGTAC
6 484 pb 3 gSPAex6a TGTCATGATTCTAACAAGGG
gSPAex6m TCTATTTCACTCCTGACATG
7 420 pb 2 gSPAex7a GTCATAGGGCTTAGGCTTC
gSPAex7m ATCATACTACCCACTTTTCC
8 647 pb 3 gSPAex8a TGTTTGGGAAGATGCTACTG
gSPAex8m CTACTGAAGATAACGTACATG
9 1268 pb 1 gSPAex9a CATTGATTGCCATGTATTGG
gSPAex9m AGAAGGCCAGAAATACTCAG
gSPAex9b GTACTTAAATCGGTAAATATGG
10-1 1061 pb 4 gSPAex10a CTCAAGTCTTAGGAATGCAG
111 gSPAex10b GCACTTAACCAGGCTGTATG
12_I 551 pb 3 gSPAex1la CTCAGATGACTCACATAGC
gSPAex12m CTTTACTAGACTAATTCTCCTG

13 1361 pb 4 gSPAex13a CAGATTCAAGAAGACAGATC
gSPAex13m GCAATAATTCACCACACTTG
gSPAex13n GGTAGTTCTTGTT1-CTGCTC
14 985 pb 4 gSPAex14a CAAGTGTGGTGAATTATTGC
gSPAexl4m GAGCTGAAAAGTATTCAGC
gSPAex14n TGCAAAGGACATAGCCAGTG
15 1076 pb 1 gSPAex15a AGCCTCTGGAGATAGTATGC
gSPAex15m CTAGAACAGGGGTCACAGTC
gSPAex15n TTGGACTTCTTAAACTTC
16 1404 pb 4 gSPAex16a GCAGTATGCAAGAAATTGAAC
gSPAex16m GGCCTGTAATTTTCTTCTG
gSPAex16b GTACTGAATAGATACATGTAG
17 445 pb 3 gSPAex17a GTGTAGCAGATCAACATAG
gSPAex17m CATCTTCAAGTTTGGTGCAC
Hormis l'exon 1, amplifié à l'aide du kit Advantage CC genomic PCR kir = (Clontech) selon les instructions du fournisseur, quatre programmes de PCR
légèrement différents (1,2, 3 et 4) furent utilisés pour amplifier les exons de SPG4 (voir tableau 2). Les amplifications furent toutes effectuées dans un volume de 50 pl contenant 100 ng d'ADN génomique, 50 pmoles de chaque amorce, 250 pM de dNTPs, 1X de tampon Takara et 1 unité de Taq polyrnérase Takara La Taq (Shuzo Co.). Les réactions de PCR ont été réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 94 C après une première étape de dénaturation de 5 min à
96 C. Les échantillons sont par la suite soumis à 30 cycles de dénaturation (94 C
pendant 40 sec), d'hybridation (prog. 1: 60 C pendant 50 sec; prog. 2, 58 C
pendant 50 sec, prog. 3 et 4 : 55 C pendant 50 sec) et d'élongation (prog. 1 et 4: 72 C pendant 1 min, prog. 2 et 3 : 72 C pendant 40 sec), suivis d'une dernière étape d'élongation (10 min à 72 C). Le séquençage de ces produits de PCR a été réalisé sur un séquenceur ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les amorces internes notées c< b et n (voir tableau 2).
4) Caractérisation de SPG4 Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux correspondent à l'orthologue murin de SPG4, ont été isolés par le consortium IMAGE
et séquencés au laboratoire sur un séquenceur ABI 377 (PE-Applied Biosystems).
Afin d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les collections d'ADNc de différents tissus humains foetaux et adultes, ainsi que de tissus 5 de souris (panels MTC, Clontech) ont été testées par PCR selon le protocole du fournisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le couple SPA_Ca /spam (spam : 5'-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de souris. Les conditions de PCR sont celles utilisées pour l'amplification de SPG4 à partir d'ADNc de lignées de lymphoblastes (cf. Détection des mutations), excepté
que les 10 échantillons ont été soumis à 32 cycles pour les ADNc issus de tissus adultes humains et de tissus murins, et à 28 cycles pour les ADNc issus de tissus foetaux. Les produits d'amplification ont migré par électrophorèse sur des gels d'agarose 2 h.
5) Analyse histologique d'une biopsie musculaire d'un patient Les analyses histologiques et histo-enzymatiques ont été réalisées à partir 15 d'une biopsie musculaire d'un patient issu d'une famille liée au locus SPG4 selon les techniques standards décrites dans Casari et al., 1998.
6) Numéros d'accession dans les bases de données publiques L'ADNc SPG4 (ou SPAST) et la séquence protéique déduite, GenBank/EMBL
AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gène 20 SPG4 (ou SPAST), GenBank/EMBL AJ246003.
Exemple 2 : Analyse de la séquence de l'intervalle SPG4 L'analyse des évènements de recombinaison a permis de réduire la région candidate SPG4 à un intervalle génétique de 0 cM entre les marqueurs D2S352 et D2S2347 (19, 20). Une carte de préséquençage de l'intervalle SPG4 composée de 25 BACs a été construite (Hazan et al., sous presse dans Genomics) ; la région candidate couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, s'étendant sur l'intervalle SPG4 à l'exception d'un unique trou de 4 kb entre les clones A et E, ont été sélectionnés pour être séquencés (Fig. 1A). Sept de ces BACs (A, B, C, D, E, F et G), couvrant approximativement 70 % de la région d'intérêt, ont déjà été
30 séquencés. Les séquences de ces 7 BACs ont été comparées à celles des bases de données nucléiques et protéiques, et analysées avec quatre programmes de prédiction d'exons. Ces analyses de séquences préliminaires ont permis de mettre en évidence 14 unités de transcription potentielles, dont trois correspondant aux gènes codant pour la xanthine deshydrogénase, la stéroïde 5a-réductase 2 et une protéine liant le TGFp.
Sur les 14 gènes détectés par l'analyse de séquence, 9 avaient été
préalablement identifiés dans les bases de données d'EST (pour Expressed Sequence Tag ) et localisés au sein de l'intervalle SPG4 (Hazan et al., sous presse dans Genomics) ; les gènes restants n'ont pu être identifiés qu'en séquençant la région candidate.
L'un de ces 5 nouveaux gènes présentait une homologie en 3' de sa région codante avec les 5 gènes codant pour la famille protéique des AAA (Confalonieri et al., 1995). Des analyses de séquence plus approfondies ont montré que ce gène, nommé SPG4 (ou SPAST), était composé de 17 exons et s'étendait sur une région d'environ 90 kb, couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1B). Les trois premiers exons prédits de ce gène furent identifiés dans le BAC D par deux des quatre programmes de prédiction d'exons utilisés, GRAIL II et GENSCAN ; ils présentent une forte homologie avec un EST de blastocyste de souris, AA560327. Les 14 derniers exons se trouvent dans le BAC G. La séquence protéique déduite des exons 7 à
17 est significativement homologue à une sous-classe de la famille des AAA, comportant les protéines de levure Yta6p (Schnall et al., 1994), TBP6 (Schnall et al., 1994) et End 13, ainsi que la protéine de souris SKD1 (Perier et al., 1994).
Sur les quatre programmes de prédiction d'exons, FGENEH semble le plus fiable et le plus puissant, permettant la détection de la plupart des gènes=
de cette région chromosomique en 2p21-p22. Cette constatation s'applique également au gène SPG4 pour lequel 15 exons ont pu être mis en évidence par ce programme quand seuls 4, 9 ou 11 exons ont pu respectivement être localisés par les programmes Genie, GRAIL II et GENSCAN. L'organisation génomique de ce gène (Fig. 1B) a pu être confirmée par la suite grâce à la détermination de la séquence de l'ADNc SPG4.
Les jonctions introns/exons sont représentées sur le tableau 3 ci-après : la taille des exons varie de 41 pb (exon 16) à 1,410 kb (exon 17), celle des introns variant de 140 pb (intron 11) à 23,247 kb (intron 1).

Tableau 3 Organisation intron/exon du gène SPG4 c>
, Exon/ Taille de l'exon Position Site accepteur d'épissage Site donneur d'épissage Taille de l'intron ce intron (pb) sur l'ADNc (SEQ ID No. 74 à 89) (SEQ ID Nos. 90 à 105) (pb) cc TGAGAAAG/gtaactagggggctgg 23 247 2 87 541 attttttattttaaag/CAGGACAG
AGGACAAG/gtaagattgtatttgt 1 943 3 84 628 aatttttttctttcag/GTGAACAG
ACTTCTAG/gtatcaattaatgtat 9 190 4 96 712 cttctctgttgcatag/AGAAGATG
CCAGTCAG/gtgggtttaggttaac 15 745 P
5 188 808 actttttccttgtcag/AAAGTGGA
CTCATAAG/gtattctgggacagta 876 6 134 996 ttttgtatcctttaag/GGTACTCC
GTGGACAA/gtaagttttgccatct 283 .
, aggtcttgtttcttag/TGGAACAG GGCCTGAG/gtaagaactttatatt 10 735 , , agtatatattttttag/TTGTTCAC CAATGCTG/gtaagggttctcttca 1 385 .
, N) cttgtgatttttaaag/GCTAAAGC CAAAATAC/gtgagtgctctgtttc 8 083 taatgcttettag/GTGGGAGA TTTTATAG/gtaagaacatattttc 238
11 92 1 447 cttgtatttcctctag/ATGAAGTT TTGATGGT/gtaagtgttgattatg 140
12 80 1 539 gatffittgcttgtag/GTACAGTC GTTCTCAG/gtagggagatttatat 4 715
13 43 1 619 ggattattatttag/GCGTTTCA ATGAGGAG/gtatgtatctgtgttt 1 389 ' , 14 80 1 662 ttttaatatttttcag/ACAAGACT CTTGCTAG/gtgagtaatttggatt 1 521 tccttcccttcctcag/AATGACTG TATCCGAG/gtaggtatacaagagc 2 210 mo el ..i cttttatgttttacag/AACTAAAA CCAGTGAG/gtatagtattttacaa 7 115 , x 17 1 410 1 854 ctttttaaaaatctag/ATGAGAAA

.e.
c.à
r.à
Les séquences des exons et des introns sont respectivement indiquées en majuscules et minuscules.
:

Exemple 3: Identification de l'ADNc SPG4 Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent réalisées sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal, afin de caractériser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donné des produits d'amplification se terminant à la position nt 263 de l'ADNc SPG4 (Fig. 2), ce qui était probablement dû au contenu riche en GC de la région 5' du transcrit (90 % de GC dans les 60 pb précédant la position nt 263). Quatre produits de PCR chevauchants, recouvrant la totalité de la région codante, ont été amplifiés à partir des ADNc issus des lymphoblastes de six individus contrôles et séquencés intégralement dans le but de vérifier la séquence du transcrit SPG4. L'alignement des séquences de tous les produits de PCR et RACE-PCR a permis de reconstituer une séquence de 3263 pb comprenant une phase ouverte de lecture de 1848 pb précédée par une région 5' non traduite (5' UTR
pour 5' UnTranslated Region ) de 125 pb et suivie par une région 3' UTR de 1290 pb incluant un site de polyadénylation entre les positions nt 3227-3232, - 35 pb en amont de la queue polyA (Fig. 2). La comparaison de la séquence de l'ADNc SPG4 avec les banques de données d'ESTs a permis de détecter une homologie significative avec 6 ESTs humains dont l'EST N47973 qui contient une région 3' non codante plus étendue (+ 180 pb) comprenant un deuxième site de polyadénylation. Le site d'initiation de la traduction a été identifié par la présence d'une séquence consensus de Kosak (CTGTGAatgA) définie comme un contexte adéquat à l'initiation de la traduction attendu qu'une purine est localisée 3 nt en amont de l'ATG initiateur, lui-même précédé
d'un codon STOP. La séquence de l'ADNc de 3263 pb est identique à la séquence transcrite déduite des 17 exons du gène SPG4. L'analyse de la séquence de la région 5' à l'aide des programmes informatiques TSSG et TSSW suggère la présence d'une séquence promotrice de type TATA box située 43 pb en amont de la position nt 1 de l'exon 1.
Exemple 4: Mutations dans le crène SPG4 Des mutations hétérozygotes ont été recherchées dans l'ADNc SPG4 provenant de lymphoblastes de 14 patients issus de familles liées au locus SPG4 (1 individu atteint par famille). Quatre fragments de PCR chevauchants I, Il, III et IV recouvrant la phase ouverte de lecture de l'ADNc SPG4 ont été amplifiés et séquencés chez les 14 patients ainsi que chez 6 individus sains contrôles. L'électrophorèse sur gel agarose du fragment de PCR IV a montré trois bandes d'intensité égale chez 3 patients des familles 2992, 5226 et 5330 provenant de la même région de Suisse, ce qui suggérait une microdélétion ou une mutation d'un site d'épissage ; les deux bandes supplémentaires n'étaient pas _ présentes chez 2 individus sains issus des familles 2992 et 5330 (Fig. 3A). La séquence génomique de l'exon 16 a révélé une mutation hétérozygote A->G du site accepteur d'épissage (AG) de l'intron 15 chez les individus atteints de ces trois familles (Fig. 3B) ;
cette mutation engendre la perte de l'exon 16 suivie d'un décalage de la phase de lecture dans le transcrit anormal. Aucun des membres sains incluant maris et épouses ne porte cette mutation du site d'épissage. L'identification de la même mutation chez tous les membres atteints de ces trois familles suisses démontre l'existence d'un ancêtre commun, ce qui avait été préalablement suggéré par l'étude des haplotypes.
Trois mutations ponctuelles 1210C->G, 14683->A et 1620C->T qui introduisent des substitutions d'un acide aminé dans la séquence protéique (8362C, C448Y et R499C) ont été respectivement mises en évidence par le séquençage des fragments de PCR III et IV chez les individus atteints des familles 624, 4014 et 618. Ces trois substitutions impliquent toutes un résidu cystéine, induisant la perte ou l'insertion d'une cystéine dans la séquence protéique. Une délétion de 1 pb, 1520delT, qui crée l'apparition d'un codon STOP induisant une protéine tronquée composée de 465 acides aminés (aa) a été détectée chez les individus atteints de la famille A. Aucune des cinq mutations résumées dans le tableau 4 ci-après n'a été trouvée chez les individus contrôles testés, qu'ils appartiennent à la fratrie saine ou aux conjoints des sept familles analysées ici. Ces cinq mutations affectent de façon importante la séquence protéique dans un domaine très conservé, ou cassette AAA (Beyer, 1997), qui est composé
de plusieurs motifs protéiques supposés être responsables de l'activité ATPase chez tous les membres de la famille des AAA.

oe Tableau 400 Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé b Conséquence 624 exon 7 1 210 Ci-> G S362C faux sens 4 014 exon 11 1 468 Gi-> A C448Y faux sens(71 a, A exon 11 1 520 delT 466STOPcodon non sens o 618 exon 13 R499C faux sens (71 2 992 intron 15 A aa564 aa576 (PTC+7 aa) perte de l'exon 16+ décalage 1 813-2a1-> g 226 intron 15 A aa5641-> aa576 (PTC+7 aa) perte de l'exon 16+ décalage 1 813-2a1-> g 5 330 intron 15 perte de l'exon 16+ décalage A aa5641-> aa576 (PTC+7 aa) 1 813-2a1-> g a Les positions en nt font référence à la séquence de l'ADNc SPG4.
Les positions en aa font référence à la séquence de la spastin.
Les bases des exons sont indiquées en majuscules, celles des introns en minuscules.

PTC+7 aa = "premature termination codon" à 7 aa en aval de l'exon 16.
b.1 En addition à ces cinq mutations décrites précédemment, des recherches de mutations hétérozygotes réalisées sur des patients atteints de PSF-AD issus de 36 autres familles ont permis de mettre en évidence 34 autres mutations altérant ou susceptibles d'altérer le produit d'expression du gène SPG4.
Les caractéristiques de ces 34 autres mutations sont résumées dans le tableau ci-après dans lequel ont été également insérées les cinq premières mutations précédemment citées.

Tableau 5 Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé Conséquence , 1210 Ci--G S362C faux sens 624 exon 7 1233 G F4A G37OR faux sens 6958 exon 8 F381C faux sens 2 1267 T F--)G
14 exon 8 N386K faux sens 1002 exon 8 1283 Ti-->G K388R faux sens 027 exon 8 1288 AI-4G L426V faux sens 019 exon 10 1401 C1->G C448Y faux sens 4014 exon 11 1468 G1-9A R460L faux sens 148 exon 11 1504 G i->T R499C faux sens 618 exon 13 1620 CI-41' D555N faux sens 636 exon 15 1788 Gi->A. A556V faux sens 627 exon 15 1792 Ci->T
.
702 C F--)T -Q193 STOP non sens 2971 exon 3 3655 exon 5 873 Ai->T IC229STOP non sens ' 1010 exon 5 907 Ci->A S261STOP non sens Y269STOP non sens 3938 exon 5 932 CI-)G R431STOP non sens 6922 exon 10 1416 C1->T R431STOP non sens , 616 exon 10 1416 Ci->T R562STOP non sens 605 exon 15 1809 Ci->T
030 exon 2 578-579insA -PTC + 2 aa décalage + non sens _ 615 exon 5 852de11 1 PTC + 18 aa décalage + non sens 042 exon 5 882-883insA PTC + 12 aa décalage + non sens 032 exon 5 906delT PTC + 17 aa décalage + non sens 189 exon 9 1299deIG PTC +3 aa décalage + non sens 3686 exon 9 1340de15 PTC + 35 aa décalage + non sens 625 exon 9 1340de15 PTC +35 aa décalage + non sens A exon 11 1520delT PTC +7 aa décalage + non sens 115 exon 12 1574deIGG PTC + 2 aa décalage + non sens 3266 exon 13 1634de122 PTC + 18 aa décalage + non sens 149 exon 14 1684-1685insIT PTC + 9 aa décalage + non sens 645 exon 14 1685de14 PTC +7 aa , décalage + non sens 808-2 ai-4g ?
029 intron 4 ? mutation site d'épissage 1129+2 t i->g 162 intron 6 ? mutation site d'épissage t i->
125 intron 7 1223+1 g ? mutation site d'épissage 143 intron 8 1299+1 gi-4a (PTC + 6 aa) mutation site d'épissage 1620 intron 11 1538+5 g i->a ? perte de l'exon 11 + décalage 1006 intron 11 1538+3 del4 ? mutation site d'épissage 1605 intron 13 1661+1 g He ? mutation site d'épissage 1012 intron 13 1662-2 ai-->t ? mutation site d'épissage 1626 intron 15 1812+1 gi-4a. A aa5641-4 aa576 (PTC+7 aa) mutation site d'épissage 2992 intron 15 de l'exon 16 +
décalaRe 1813-2 a F--->g A aa564 F4 aa576 (PTC+7 aa) ` neite -5226 intron 15 perte de l'exon 16 +
décalage 1813-2 ai-4g à W564 I-4 aa576 (Frrc+7 aa) 5330 intron 15perte de l'exon 16 + décalage 1611 intron 16 1813-2 a 1-4g ? mutation site d'épissage 1853+1 gi->a a Les positions en nt font référence à la séquence de l'ADNc SPG4. b Les positions en aa font référence à la séquence de la spastin. Les bases des exons sont indiquées en majuscules, celles des introns en minuscules.
PTC+n aa - "premature tennination codon" à n acide aminé en aval de la mutation.

38 =
Exemple 5: Analyse de la séquence protéique de la spastin La phase ouverte de lecture de SPG4 code pour une protéine de 616 aa que nous avons nommée spastin et dont le poids moléculaire est d'environ 67,2 kDaltons (kD). La comparaison de cette séquence en acides aminés dans les bases de données protéiques à l'aide des programmes BLAST a permis de mettre en évidence une zone de forte homologie avec plusieurs membres de la famille des AAA à l'extrémité C-terminale de la spastin. Les motifs types de la famille des AAA, englobés dans la cassette AAA, sont localisés entre les positions aa342 et aa599 (voir Fig. 2) d'après les comparaisons de séquence dans les bases de données de domaines protéiques ProDom et Prositeni.
Les trois domaines types conservés, dont les motifs A et B de Walker ainsi que le motif consensus minimal des protéines AAA sont respectivement situés éu sein de la cassette AAA aux positions aa382-389, aa437-442 et aa480-498 (Fig. 2). Le motif A de Walker, GPPGNGKT appelé également p-loop (ou boucle-p) qui correspond au domaine de fixation de l'ATP et le motif B IIFIDE sont très conservés entre tous les membres de la famille des AAA incluant la spastin.
La comparaison des cassettes AAA présentes dans 150 protéines de cette famille d'ATPase issues d'organismes très éloignés dans l'évolution a permis de classifier cet ensemble de protéines en plusieurs sous-groupes, en fonction du nombre de cassettes AAA identifiés (1 ou 2) et des homologies de séquence entre ces différentes cassettes (Beyer, 1997). Parmi toutes les protéines de la famille des AAA, la spastin présente une plus forte homologie avec une sous-classe particulière des AAA, et plus spécifiquement avec les protéines suivantes dont la plupart ont été identifiées grâce au séquençage complet du génome de l'organisme considéré : deux protéines de Caenorhabditis elegans 016299 et Q18128, deux sous-unités du protéasome 26S de Saccharomyces cerevisiae Yta6p (Q02845) et TBP6 (P40328) (Schnall et al., 1994), une sous-unité du protéasome de Schizosaccharomyces pombe (043078), les protéines SAP1 (P39955) et END13 (P52917) de S. cerevisiae et la protéine murine SK01 (P46467) (Perier et ai, 1994).
L'alignement multiple de ces 8 protéines avec la spastin est représenté sur la Fig. 4A. Sur les 257 acides aminés englobant la cassette AAA (positions aa342-599), la spastin présente une identité de séquence de 52 %, 51 % et 50 % avec la protéine de levure Yta6p (Q02845), la protéine de nématode 016299 et la protéine de levure TBP6 (P40328) respectivement Des résultats similaires ont été obtenus par l'analyse de la séquence protéique de la spastin dans la base de données ProDom= qui a montré
l'existence de trois domaines d'homologie (nommés 92, 179 et 6226 et correspondant aux positions aa342-409, aa411-509 et aa512-599) trouvés dans les sous-unités putatives du protéasome 26S

de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus souvent des motifs de type leucine-zipper dont deux ont pu être détectés dans la séquence protéique de la spastin aux positions aa50-78 et aa508-529 par l'analyse de la séquence dans la base de données Prosite (voir Fig. 2). Cette analyse a également pu prédire la présence d'un motif de dimérisation de type hélice-boucle-hélice ( helix-loop-helix ) situé entre les positions aa478 et aa486.
La comparaison de la séquence protéique de la spastin avec celles des métalloprotéases mitochondriales comme les protéines de levure AFG3, RCA1 et YME1, ainsi que la paraplegin qui est impliquée dans une forme rare de PSF-AR montre que l'homologie entre ces cinq membres de la famille des AAA est limitée à la région de =
257aa englobant la cassette AAA (Fig. 4B). Dans cette région, l'identité de séquence entre la spastin et la paraplegin n'est que de 29 % alors que la paraplegin et la protéine de levure AFG3 sont identiques à 57 % sur cette même portion de la séquence protéique.
Cette comparaison de séquence suggère que la spastin n'appartient pas au même sous-groupe des AAA que la paraplegin et autres métalloprotéases mitochondriales.
De plus, "TM
l'analyse informatique de la séquence de la spastin avec le programme PSORT II
qui permet de prédire la localisation sub-cellulaire des protéines semble indiquer que le spastin est une protéine nucléaire. Un éventuel signal de localisation nucléaire (NLS pour Nuclear Localization Signal ), RGKKK, a été mis en évidence entre les positions aa7 et aal 1 alors qu'aucun peptide signal caractéristique d'un import dans la mitochondrie n'a .= pu être décelé, contrairement à ce qui avait été observé pour la paraplegin.
Exemple 6: Profils d'expression de SPG4 et de son ortholonue murin Soo4 La comparaison de la séquence nucléique de SPG4 dans les banques de données d'EST a permis de détecter plusieurs ESTs humains, murins et de rat présentant une forte homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de souris correspondant à deux des ESTs murins, AA560327 et AA107866, ont été obtenus du consortium IMAGE et séquencés intégralement. L'assemblage des séquences de ces clones d'ADNc a permis de reconstituer une séquence consensus de 1689 pb incluant une phase ouverte de lecture incomplète de 1514 pb. La comparaison entre l'ADNc SPG4 humain et cet ADNc de souris a montré qu'il manque au transcrit murin environ 460 pb à
l'extrémité 5' dont le codon d'initiation de la traduction. La phase de lecture ouverte de souris est suivie d'une région 3' non codante (3' UTR) de 175 pb contenant un Site de polyadénylation situé à ¨20 pb en amont de la queue polyA (Fig. 5). La séquence nucléique de SPG4 et la séquence protéique de la spastin humaine présentent respectivement une identité de 89 % (entre les positions nt 460 et nt 1982) et de 96 %

(entre les positions aa113 et aa616) avec les séquences de l'ADNc et de la protéine déduite de la souris. Ce degré important d'homologie permet d'affirmer que ce transcrit de souris correspond à l'orthologue murin de SPG4, qui a été donc baptisé Spg4.
L'hybridation de northem blots comprenant les ARNm de divers tissus humains et 5 murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donné de résultats probants excepté une très faible bande correspondant à un transcrit de 2,5 kb dans le testicule de souris après 10 jours d'exposition. En raison du faible niveau .d'expression de ce gène, les profils d'expression de SPG4 et Spg4 ont été déterminés par des expériences de PCR sur des collections d'ADNc normalisées provenant de divers tissus 10 adultes et foetaux (voir Fig. 6A à 6C). Le gène murin Spg4 est exprimé
de façon ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de l'embryon de souris (Fig. 6A). Une plus forte expression de Spg4 a été
détectée dans le foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de l'embryon.
L'expression précoce de Spg4 au cours du développement embryonnaire a été
confirmée
15 par la présence d'ESTs provenant de banques d'ADNc de blastocyste, d'embryon E8 et de carcinome embryonnaire dans les banques de données publiques d'ESTs. Le gène humain SPG4 est lui aussi exprimé de façon ubiquitaire dans les tissus adultes (Fig. 6B) et foetaux (Fig. 8C), avec une expression peut-être plus marquée dans le cerveau foetal.
Exemple 7: Pas de défaut de la phosphorvlation oxvdative dans la PSF-AD liée au locus Afin de déterminer si des mutations de la spastin induisaient un défaut de la phosphorylation oxydative (OXPHOS) dans la mitochondrie, à l'image de ce qui avait été
observé pour la paraplegin, une biopsie musculaire a été réalisée sur un patient d'une des familles de PSF-AD liée au locus SPG4. Les analyses morphologiques et histo-25 enzymatiques de cette biopsie de muscle n'ont pas révélé de fibre musculaire de type RRF (pour ragged red fibers ), caractéristique des défauts OXPHOS dans la mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales ainsi quels prédiction d'une localisation nucléaire de la spastin semblent indiquer que la PSF-AD liée au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par opposition à
30 la PSF-AR liée au locus SPG7.
Par une approche de clonage positionne' basée sur le séquençage d'une région de 1,5 Mb, nous avons identifié le gène SPG4 (ou SPAST) responsable de la forme la plus fréquente de PSF-AD, préalablement localisé sur les bandes chromosomiques 2p21-35 p22. Trente-neuf mutations altérant ou susceptibles d'altérer le produit du gène, nommé

spastin, ont pu être détectées chez les individus atteints de quarante-et-une familles de PSF-AD présentant une liaison au locus SPG4. La spastin est un nouveau membre de la famille des protéines AAA, dont la localisation semble être nucléaire et qui présente une forte homologie avec les sous-unités du protéasome 26S de levure. En dépit d'une grande homologie restreinte à un domaine de 230 à 250 aa, dite cassette AAA, les nombreux membres de cette famille protéique peuvent participer à des mécanismes cellulaires très variés comme le transport de protéines au sein de vésicules, la régulation du cycle cellulaire, la biogénèse dei organelles, le contrôle de la transcription.....
Toutefois, tous ces mécanismes cellulaires impliquent l'assemblage, la fonction ou la dégradation de complexes protéiques, ce qui suggère que les membres de la famille des AAA sont des protéines dites chaperons .

Références Barany, F., (1991), Proc. Natl. Acad. Sci. USA, 88, 189-193.
Beyer, A. Sequence analysis of the AAA protein family. Protein Sci. 6, 2043-2058 (1997).
=
Bodansky M., Principles of peptide synthesis, (1984).
Bruyn, R.P.M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-Lorrain) in Handbook of clinical neurology Vol. 15 (ed. de Jong, J.M.B.V.) 301-318 (Elsevier Science Publishers B.V., 1991).
Buckholz, R.G. Curr. Op. Biotechnology 4: 538-542, 1993.
Burg, J.L. et al. (1996), Mol. and Cell. Probes, 10, 257-271.
Carter, B.J. Curr. Op. Biotechnology 3: 533-539, 1993.
Casari, G. et al. Spastic paraplegia and OXPHOS impeirment caused by mutations in Paraplegin, a nuclear-encoded mitochondrie! metalloprotease. Cell 93, 973-983 (1998).
Cherif D., Julier, C., Delattre, O., Derré, J., Lathrop, G.M., and Berger, R.
Proc. Natl.
Acad. Sci. USA. 87 : 6639-6643, 1990.
Chu, B.C.F. et al. (1986), Nucleic Acids Res., 14, 5591-5603.
Chumakov, I., Rigault, P., Guillou, S., Ougen, P., Billault, A., Guasconi, G., Gervy, P., Le Chumakov, I.M., Rigault, P., Le Gall, I., et al. Nature 377: 175-183, 1995.
Confalonieri, F. & Duguet, M. A 200-amino acid ATPase module in search of a basic function. BioEssays 17, 639-650 (1995).
Duck, P. et al. (1990), Biotechniques, 9, 142-147.
Durr, A. et al. Phenotype of autosomal spastic paraplegia linked to chromosome 2. Brain 119, 1487-1496 (1996).
Edwards, C.P., and Aruffo, A. Curr. Op. Biotechnology 4: 558-563, 1993.
Epstein, A. Médecine/Sciences 8: 902-911, 1992.
Erlich, HA., (1989), New York : Stockton Press.
Guatelli J.C. et al. Proc. Natl. Acad. Sci. USA 87: 1874-1878, 1990 et al.
Gel! 85 : 281-290, 1996.
Fink, J.K. et al. Autosomel dominant familial spastic paraplegia : tight linkage to chromosome 15q. Am. J. Hum. Genet. 56, 188-192 (1995).
Hazan, J., Lamy, C., Melki, J., Munnich, A., de Recondo, J., & Weissenbach, J.
Autosomal dominant familial spastic paraplegia is genetically heterogeneous and one locus maps to chromosome 14q. Nature Genet. 5, 163-167 (1993).
Hazan, J. et al. Linkage of a new locus for autosomal dominant familial spastic paraplegia to chromosome 2p. Hum. Mol. Genet. 3, 1569-1573 (1994).

Hedera, P. et al. Novel locus for autosomal dominant hereditary spastic paraplegia, on chromosome 8q. Am. J. Hum. Genet. 64, 563-569 (1999).
Heinzlef, O. et al. Mapping of a complic,ated familial spastic paraplegia to locus SPG4 on chromosome 2p. J. Med. Genet. 35, 89-93 (1998).
Hentati, A. et al. Linkage of a locus for autosomal dominant familial spastic paraplegia to chromosome 2p markers. Hum. Mol. Genet 3, 1867-1871 (1994).
The Hereditary Spastic Paraplegia Working Group. Hereditary spastic paraplegia :
advances in genetic research. Neurology ste, 1507-1514(1996).
lnnis, M.A. et al. (1990), Academic Press.
Jouet, M. et al. X-linked spastic paraplegia (SPG1), MASA syndrome and X-linked hydrocephalus result from mutations in the L1 gene. Nature Genet. 7, 402-407 (1994).
Kievitis, T. et al. (1991), J. Virol. Methods, 35, 273-286.
Ktihler et Milstein. Nature 256, 495-497, 1975.
Kwoh, D.Y. et al. (1989), Proc. Natl. Acad. Sci. USA, 86, 1173-1177.
Landegren U., Kaiser R., Sanders J. & Hood L. Science 241 : 1077-1080, 1988.
Lizardi, P.M. et al. (1988), Bio/technology, 6, 1197-1202.
Luckow, V.A. (1993), Curr. Op. Biotechnology 4, 564-572.
Matthews, J.A. et al. (1988), Anal. Biochem., 169: 1-25.
Miele, E.A. et al. (1983), J. Mol. Biol., 171 : 281-295.
Nielsen, J.E. et al. GAG repeat expansion in autosomal dominant pure spastic paraplegia linked to chromosome 2p21-24. Hum. Mol. Genet. 6, 1811-1816 (1997).
Olins, P.O., and Lee, S.C. Curr. Op. Biotechnology 4: 520-525, 1993.
Osoegawa, K. et al. An improved approach for construction of bacterial artificial chromosome libraries. Genomics 52, 1-8 (1998).
Perier, F. et al. Identification of a novel mammalian member of the NSF/CDC48p/Pas1p/TBP-1 family through heterologous expression in yeast. FEBS
lett.
351, 286-290 (1994).
Perricaudet, M., Stratford-Perricaudet, L. and Briand, P. La Recherche 23 :
471-473, 1992.
Polo, J.M., Calleja, J., Combarros, O. & Berciano, J. Hereditary ataxias and paraplegias in Cantabria, Spain. An epidemiological and clinical study. Brain 114, 855-866 (1991).
Reid, E. Pure hereditary spastic paraplegia. J. Med. Genet. 34, 499-503(1997).

Rohlmann, A., Gotthardt, M., VVillnow, T.E., Hammer, R.E., and Herz, J. Nature Biotech.
14: 1562-1565, 1996.
Rolfs, A. et al. (1991), Berlin : Springer-Verlag.

PCT/F'R00/02433 Sambrook, J., Fritsch, E.F., and Maniatis, T. Molecular cloning : a laboratory manual.
Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher disease are allelic disorders at the proteolipid protein locus. Nature Genet. 6, 257-262 (1994).
Schnall, R. et al. Identification of a set of yeast genes c,oding for a novel family of putative ATPases with high similarity to constituents of the 26S protease complex.
Yeast 10, 1141-1155 (1994).
Scott, W.K. et al. Locus heterogeneity, anticipation, and reduction of the chromosome 2p minimal candidate region in autosomal dominant familial spastic paraplegia.
Neurogenetics 1, 95-102 (1997).
Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.
Segev, D., (1992), Kessler C. Springer Verlag, Berlin, New-York, 197-205.
Skre, H. Hereditary spastic paraplegia in Western Norway. Clin. Genet. 6, 165-183 (1974).
Stone, B.B. et al. (1996). Mol. and Cell'. Probes, 10 : 359-370.
Stewart J.M. et Yound J.D., solid phase peptides synthesis, Pierce Chem.
Company, Rockford, 111, 2ème éd., (1984).
Suggs S.V., Wallace R.B., Hirose T., Kawashima E.H. and ltakura K. PNAS 78 :

6617, 1981.
Temin, H.M. Retrovirus vectors for gene transfer. In Kucherlapati R., ed. Gene Transfer, =
New York, Plenum Press, 149-187, 1986.
Walker G.T., Fraiser M.S., Schram J.L., Little M.C., Nadeau J.G., & Malinowski D.P.
Nudeic Acids Res. 20 : 1691-1696, 1992.
Werderlin, L. Hereditary ataxias. Occurence and clinical features. Acta Neurol. Scand. 73 (Suppl. 106) (1986).
Woo S.L.C. Methods Enzymol. 68: 389, 1979.

LISTE DE SÉQUENCES
<110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - CNRS
<120> CLONAGE, EXPRESSION ET CARACTÉRISATION DU GENE SPG4 RESPONSABLE DE LA FORME LA PLUS FRÉQUENTE DE PARAPLÉGIE
SPASTIQUE AUTOSOMIQUE DOMINANTE
<130> 7091-514ca CC/LM
<140> PCT/FRO0/02433 <141> 2000-09-04 <150> FR 99 11097 <151> 1999-09-03 <160> 107 <170> PatentIn Vers. 2.0 <210> 1 <211> 110000 <212> ADN
<213> Homo sapiens <220>
<221> exon <222> (9932)...(10471) <220>
<221> intron <222> (10472)¨(33718) <220>
<221> exon <222> (33719)...(33805) <220>
<221> intron <222> (33806)...(35748) <220>
<221> exon <222> (35749)...(35832) <220>
<221> intron <222> (35833)...(45022) <220>
<221> exon <222> (45023)...(45118) <220>
<221> intron <222> (45119)...(60863) <220>
<221> exon <222> (60864)...(61051) <220>
<221> intron <222> (61052)...(61927) <220>
<221> exon <222> (61928)...(62061) <220>
<221> intron <222> (62062)...(62344) <220>
<221> exon <222> (62345)...(62438) <220>
<221> intron <222> (62439)...(73173) <220>
<221> exon <222> (73174)...(73248) <220>
<221> intron <222> (73249)...(74633) <220>
<221> exon <222> (74634)...(74705) <220>

<221> intron <222> (74706)...(82788) <220>
<221> exon <222> (82789)...(82864) <220>
<221> intron <222> (82865)...(83102) <220>
<221> exon <222> (83103)...(83194) <220>
<221> intron <222> (83195)...(83334) <220>
<221> exon <222> (83335)...(83414) <220>
<221> intron <222> (83415)¨(88129) <220>
<221> exon <222> (88130)¨(88172) <220>
<221> intron <222> (88173)...(89561) <220>
<221> exon <222> (89562)...(89641) <220>
<221> intron <222> (89642)...(91162) <220>
<221> exon <222> (91163)...(91233) <220>
<221> intron <222> (91234)...(93443) <220>
<221> exon <222> (93444)...(93484) <220>
<221> intron <222> (93485)...(100599) <220>
<221> exon <222> (100600)...(102009) <400> 1 taactgactc tgctgtgttt ccttggcatt atagctaatc aaattgagca ggtcaggtaa cagtttatac ttacacctac tatttcaaaa ccatgagctc attcacattt tcactgaagt aacaaatcct ccataaacta gaaaatctca aactggtgac tgggagtttt ggttttgttt ttttgttgtt ttattttatt ttattttatt ttctagatgg agtcttgctc tgttgcccag gctggaatgc aatggcatga tctcagctca ctgcaacctc cacctttcgg gttcaagcaa tcctcctgcc tcaatcttcc aagtagctgg gactacagga atgagctgcc gcacctggcc tggtttgttt gtttttaaat tttgaggcca ggtgcagtgg cccatatctg tgatcccagc actttgggag accaaggcag gccgattact tgaggtcagg agttcaagac cagccaggcc aacatggtaa aaccatgtcg ctactaaaaa cacaaaaatt aggccgggca cggtggctca cgtctataat cccagcactt tgggaggcca aggtgagtgg atcacctgag gtcaggaggt caagaccagc ctggcaaaca tggtgaaacc ccgtctctat taaaaataca aaaattagcc gggtgtggtg gcgggcacct gtaatcccag ctattgggga ggctgaggca ggagaatcgc ttgaacctgg gaggtggagg ttgcagtgag tcgagatggt gccactgacc tccagcctgg gcaataagag cgagacgcca tctcaaaaat atataaataa ataaataaaa atacaaaaag tagctaggct ttgtggcagg cacctgtagt cccagctact taggaggctg aggcaggaga attgcttgaa cccaggaggc ggaggttgca gtgagccaag attgtgccac tgcgttccag cctgggtgac agagcaagac tccttctcaa aaataaataa ataaataaat aaataaataa 1020 ataaataaaa ttttgagctg ggcatgaaag ctgaggcagg aggatccctt gagcccagca gtttgagacc ccagtgagct ataattctga cactgcactt cagcctggct gacagaggga 1140 gaccgtgtat ctaaaaagaa taaaataaca atgatttttg agccaataac tcttagccaa 1200 tagatttcac ataaaaattt agaattctgg tttctcttga aaaattaaaa aaatctgaca 1260 atgttaagct tcacattcct gaaaggcaaa aatcagtgga agctagctgg gtgctgtggc tcacgcctat aaacccagtg ctttgggagg ctagggtaag tggattggtt gagtccagga 1380 gtttgagatc agcctggcca acacagtcaa accccatctc tacaaaacat acaaaaatta 1440 gctgggatat ggtggtgtgc acttgtggtc ccaactactc aggaggctga ggcaggagga 1500 ccacttgagc cctggaggtt gagggggcag tgagccatga ttgtgccact gcactccagc 1560 ctggacgaca gagagacatt gtctcaaaaa gaaaaaaaaa aatcagctca gtgggagctg 1620 agtaacagct gtcctgttca attacaggat gcaactcttt agcttctcat agtttccatc 1680 attcacatca tacatgcatt tttgcatgcc acacaaccca cacatggaac ccatatatgt 1740 tatatgcctg accactgttg ctattggaag ttttggccac tgcattaaac tataaactcc atcttattaa tcctgacacc ccacttattg cctgatatat tgtccgtttc ttaatatcta 1860 ttcatagaac aaatgaatga ataatatgtg ccacattgtg gactcaattc agggagatga cA 02348657 2001-11-07 ctaatcattc acaattatgt ttttccttct taatacagag attggataat aattccccaa 1980 ttgttacttc tctcatccct cccctccaac catatctttt catttgtttt tcttatttta 2040 ggttttctgc ctttttcaaa atcagccatt tcctcactgg actctacatg tgccattttt 2100 tttttttttt ttttactaat ttttttagtt gaaaagaggt ccttaatatc tgtcattggt 2160 ccacacttga aatctagaat ctctcgaatt gaaggtctga agagttcctt agaaggcaag 2220 tagggccgaa atatccaaaa aaaactattt gatggtaggc actgtggtaa ataaatatgg 2280 gttaaagtga taaagtgacc gaatgtcctg gattagttag cacagtacct agctccttct ttttgtcctt gtgaaactgt ctcagattcc attcaagatt aagtgtcctg aaagttctta 2400 caagctgaaa actgggaggc tctcacactg taggtagaat ggctagcagg gttgggatct catctaggca cattgcagaa ccagggtaac accaaggcat tatttttttt ctttctttac 2520 ttttcttctt tttttttaga gacagggtct cattatgtta cccaggctgg attccaattc ctgagctcaa gtgatcctcc tgagtagctg ggacttcagg tgtgcaccgc tgtgtctgaa 2640 ggcactgttt tttttgtttt ttttgttttt tttgacacaa atttaggaag atgttaattc 2700 acaacagtct tgagactgag atataattcc aaggagcaga agatgtgagt ttagagcact 2760 aaaaaatgag attccagtag agtcagaaat ctgaaatggc attacagata taagagacaa 2820 aaacaaaatg tattgagctc tgtcatgttg caggcatcat gatggaggtt ttagatgtac 2880 tctttcattt tgtaattttt atagaggaat taactagaat agcaacccca gtcccactaa 2940 ctctaaatcc catattttta ccatacaaaa aaagagcaaa agtgcagaaa agcacagtca 3000 atattaagta caaccagata gcagagactc agtaaatggg aggccggagg cccgaaaccc aacataatgc ccatgaatga aagcccatca cttgcgcttc aggggctaac aatatactta 3120 tttcataatt aaaatagaaa cagactatgt aaaaatatta ttcttgagat cccagatttt 3180 taccttaaat tactgaggca gtaagtgtaa ttaactaata tgtgatgttg ggcaaataac agactcttag agccccaaat tctttatttt aaaaaactga ggccagatga ggtggcttac acatgtaatc ccagcactgg ggatgccaaa gcaggcagat cacttgagct tgagcttagg agtttgagat cagcctgggc aacacggtta agacctcatc tctaaacaaa atacaaaaat 3420 tagccaaaca tggtggtgtg cacctgtgtt cctggctact caggaggctg aggtggaagg 3480 atcgcttgag cccgagaggt tgagggtgca gtgagccatg atcttgccat tgcactctac actctagtct gggtgacaga gtgagactct gtcttggggg aaaacaaaag agatgataat 3600 gcttaactga agtagcaata ttttaaaaag gcactaaaag ttcatctgct tagttcagaa tatgggttcg ataaatatta gcaagtagta gtagtcatca tcatcactgt cactgctgtt ctctccttaa acttaagcat gttttttgtt tttttgagac agtgtctcac tctgtcaccc 3780 aagctggagt tcagtggtgt gatcttggct cactccaacc tctgcctccc aggttcaagt 3840 gattctcctg tctcaccctc ccaagtagct gggaccacag acacgtacca caaccacacc 3900 cagctaattt ttcgtatttt tggtagaggt ggggtttcac catgttggcc aggctggtct 3960 tgaactcctg acctcaagtg atccacctgt ctcggcctcc caaagtgctg ggattacagg 4020 cgttagccac agcatccagc cttaagcatg ttaattaagt ttttataatt cagcaaaatg 4080 gttggaaaat gctgtcttaa atgagatgct taagctgccg tctgaacatg aggtagaagg 4140 aaattctaca cataatcatt gtgctaaatt acttgcaaag atggccacaa caattcctcc 4200 tatcctcata tatatgcccc tttgcaatgt gactttgcta cttctctatc aagatgtgga 4260 gcttattttc ccatatattg cactagagtt ggccttctga cttgctttga caatggaatg 4320 tagtacaaat gacactgtgc aactttggat tttaggtttc gagagaactt acaccttcca 4380 ctcacactct cttggaaacc agatgcaatg taaagaagtc agggctatcc tgctagagac 4440 atatgtccca gctaatagcc acaatcaacc tctgaacata tgaatgaggc tagctaggcc 4500 atacagccat tcggtcaagc catcagatga ctacatccac aggaatgatc cacaggcaag 4560 gccatcagaa gaaccatcca gctgaactta ccccaaattg ctgagtcaca aagttgtgtg 4620 taaataaatg tctgctatct taagccagtg agttttggag tggtatatta catagcatca 4680 gaaatctaac acaatcatta tgtttgaatc atttttcaaa tttctcatat ttattaaatg 4740 agtaccataa gcaaggtgtc aggctggatg caaaaagtga ggcaaaatgt ataaagtgtg 4800 accactgcct tcagtaagtt tacaatctat atcaagaggt gatgaagtgt ttaaataatc 4860 atcctgcagg gcaatatagt ataagagcca cagagtaaca caaccatatt gtcataacaa 4920 ctgaaaaaca agatcatttc tgctggaggt gataatggaa taatttatca agaatataac 4980 agagctggac gcggtggctc acacctgtaa tcccagcact ttgggaggcc aaggaaggtg 5040 gatcacaagg tcaggagttc gagaccatcc tggctaacac gatgaacccg tctctactaa 5100 aaatacaaga aattagccgg gcgtggtggc acgcgtctgt agtcgcagct actcaggagg ctgaggcagg agaaccactt gaacatggga agcagaggtt gcattgagct gagatcgtgc 5220 catggcactc cagcctgggt gacagagtga gactcagtct caaaaaaaaa aaaaaaaaaa 5280 cA 02348657 2001-11-07 aaaatataac attagaggta agtcttgaag gactttgaca gtggaagtag gaggcgaggc cattctaagt gaatgaaaaa tgacaggaga gtaattgtag tcctggaaaa gagcaaagta 5400 ggtacagacc aacagtctat attagctaga gtatagtgaa agtgcagagg aaatgtcgga 5460 gaaccattct ttattcaaaa actatcttcc tcatggccaa gcatagtggc tcatgcctgt 5520 aatcccagca ttttgggagg tcaaggtgag tggatcactt gagctcagga attcaagacc 5580 atctggggca acatagtgag acctcatctc aactaaaaaa caaaaaattc agacagatgc 5640 agtggctcac acctgtaatc ccagaacttt ggtaggctga ggcgggcgga tcacgaggtc 5700 aggagatcaa gaccctcctg gacaacatgg agaaacccca tctctattaa aaatacaaaa 5760 ttagctgggc atggtggcac atccctgtaa tcccagctac tcgggaggct gaggcaggag 5820 aatcgcttga accagggagt cggaggttgc agtgagccga gatcgcacca ctgcactcca 5880 gtctggcgac agagcgagac tccatcttaa aaaataaata aattttaaaa aaaactaccc 5940 cagcatggtg gtgcatgcct gtagtcccag ttactcagga ggctgaggca agagggtggt ttgagccagg gaggtcaagg ctgcagtgag ctctgatggc gccactgtac tccagcttgg 6060 gtgacagagt gagaccttgt ctcaaaaaca aaaacaaaaa caaaaaacca acaaatctcc 6120 ttgttagtat catggtgagt aaaaaataaa ataaaaatag aaataaactg aacatggtgg 6180 ctcatgcctg taatcctagc actttggaag gctgaagtgg gaggattgct tgagggctgg agttcaaaac tggcttgggc aacacggtga gagagacctt gtctctacaa aagaactttt aaaacaaaaa atagataatt taaaaaaatt aaaaaaaaca aaaaataaaa aaataatcaa 6360 gtatcaactt gattccaggc actgcttact actctagtgt tatactgtag atgtggaagc 6420 tgagtaactc atccaagatc accgaaagtg atggaacaca gatctaaatg caaccagtct 6480 gactccagga ccatttaacc attctactat tgggccctat cttggctaag ttagaaagta 6540 agttactttc tttagtggta aagactggag ggataacagg gaagatagtt atttaagaaa aaaaactggc atcaaactaa atatccatca atagttgaac agtaaaatag gttgtggtaa 6660 attcatataa tggaatacta tatagcagtg aaaatgtacc acagttatag aaatcaacag 6720 ggaggaattt caacacttaa ttattaagta ggtagccagg catagcggtt tatgcctgta atcccagcac tttgggagac caagacagga ggattacttg agcccagggg ttcgagatca acctgggcaa cagtgagact ccatctctat tttcttaaaa taaaataaat gaaattttaa 6900 aaattttgag gagggaaagc aaacaaggga tacttgaaat atgattacat ttccataaag 6960 tcaaagtgag gcaaaatcat acaagacatt gtttagaaat acataaatac actgcaaact aaaaatgaga cactagaatg attaatataa aattcaggat agtggcttcc tctagaggaa 7080 gagacaagac attgagatta gggaggagct cacagagtgc ttcgaggagt tggttacatt catttttctt aaatggaatg ctgcttatta tttttcttta aattgtgcat ttaagtaaca 7200 cacttcttgt ttatatgata tatgtataaa tgtaattttt ttttttgaga tggagtttcg 7260 ctcttgttgc ccaggctgga gtgcaatggc actatcttgg ctcactgcaa cctccacttc ctgggttcaa gtgattctcc tgcctcagcc tcccgagtag ctgggattac aggcatgcgc caccatgccc ggctagtttt gtatttttaa tagagaaagg gtttctccat gttggtcagg 7440 ctggtctcga actcccgacc tcaggtgatc cgcctgcctt ggcctcccaa agtgttggga 7500 ttacaggtgt gagccaccgt gccaggccct gaatcagatt taaaagaggg catttcatta 7560 aaaaaaattt tttgttgttt gcttttgaga cagagtctcg ctctgtcgcc caggctgcag 7620 tgcattggca tgatcttggc tcaccgcggc ctcagcctcc caggttcaag tgattctcct 7680 gcctcagcct cgcactagtt gagattacag gaatgcacca ccaccacagg aatgcacctg tctaactttt gtatttttag tatagaggga gttttgccat gttagccagg ctgctcttga 7800 actcctgacc tccggtgatc tgctcgcctc ggctcccaaa gttctgggat tacaggcgtg 7860 agccaccaca cccggccgaa agagggcatt tcagaatgag ggtctagcat aagcacagag 7920 aagggggagc aataagaggg aaacagggag taggtcattt ttgcaatagc ctgtgacatt tgtagggcag tactggcggg gaataattaa gtaaaattgg ctggtgctgt ggctcatgcc tgtaatccca gcactttggg aggccgaggc gggcaggttg cttgagccca ggaattcaag 8100 accaacctgg gaaacatagc aagaccctgt ctcaacaaaa aagtaaaaaa attagctggg 8160 ggcgcgatgg ggtggctcat gcctgtaatc ccaacacttt ggaaggctga ggcaggcgga 8220 ttgcttgagc ccaggagttg gagaccagcc tgggcaacat ggtgaaaccc tggctctata aagaatacaa aaattagtcg ggcccagtgg cgtgtgcctg tgatcccagc tactcgggag 8340 gctgaggtgg aaggatcacc tgagccaggg aggtggaggt tgcagtgagt catgttgttt gcgccactgc actccagcct gggcaatgga gtgaaaccct gtccaaaaaa taaaaaaata aagctgtggc agaatgtgga gattcttgga agctggaagc tctcatgggg catttggaaa 8520 cctcacattg taaataacgg agtcttttta tcagtttggc ttccttagtt ttaggaaaca 8580 agaaataatt atggctaact caagtaaaaa gagaaagaga agagaaaaaa gacgtggaga cA 02348657 2001-11-07 tagagagaga gggagagaga ggaaaagacg aaaggaagga agggggaaag gagagaggaa gagagaaaca gagaaacaga ctgattagtg tattggatag attacataac caagtgacca gtcaggaacc cagcagctct gggggagctc aatgtgatgc attgataaac ccgctcttaa 8820 gagcactcgt ttccagttac tttctattcg gtgggtctcc agccaagatt ccaggtccca ggagaatctg actgacctag tgtttgcttc cgcctttgcg gtctgggttc tgtgcttgca 8940 gctcattaga atacagggag cagagacaag caggtagttt cccaaaggaa gggatgctga 9000 gtagattaaa aaaaaagtgt agattcttca gtaaactatg ggatggtaac tatgcaaaac ctaagatttc ccttattcaa ataaattatc tttcatatta gacatctaaa tatgcactaa 9120 tttagttaaa cccctgggtt agttgatctc atcacactga gctaacattt ttgttgctgt tgtttgcagt gacctgaagt ttcttatctt cacaattgct ttcctctcaa ataattccca 9240 gattttaaat ttttatttta ttttttctgg agacggagtc tcgctctgtc gcccaggctg 9300 gagtgcagtg gcgcgatctc agctcacttg cagcctctgc ctcccgagtt caagcgattc tccggcctta gccttccaac cagctgggac tacaggcgcg cgcccccacg cccggctaat ttaattccca gattgatatc cattgcttct gagatgggcc aattatcctt cggagaagac ttaggtcgcc tggcagaaaa agatgaaaga aatctaagaa aacgacgaca ctgagagagg 9540 agcctagcga accagcagag cgaccccaag ccgcaattcc cccttccgtg gatcgattac gaaggcttcc tggcaggagc tctccagggc tgccgacgtg agccgaactg cacattggga 9660 actgtagttg agtgggaaag ccgagaggcg ggggccgcac acgcgtacag gggccccggt caacaaagac gcgccgtgcg cgcgcgcgcc ggagaaaaac acgggaagac gtgcgcgtgc 9780 gcggccgccg ctgggagcca ccaggcggcg gagaggacag cgacaggaag ggaggggccc gagccaccga ctgcaggagg agaaggggtt gtgctcctgg ccgaggaagg agaaaggggc ggggccggcg ggcagcgtgc ggcagtgcgg agctcctgag accggcgggc acacgggggt ctgtggcccc cgccgtagca gtggctgccg ccgtcgcttg gttcccgtcg gtctgcggga 10020 ggcgggttat ggcggcggcg gcagtgagag ctgtgaatga attctccggg tggacgaggg 10080 aagaagaaag gctccggcgg cgccagcaac ccggtgcctc ccaggcctcc gcccccttgc 10140 ctggcccccg cccctcccgc cgccgggccg gcccctccgc ccgagtcgcc gcataagcgg 10200 aacctgtact atttctccta cccgctgttt gtaggcttcg cgctgctgcg tttggtcgcc 10260 ttccacctgg ggctcctctt cgtgtggctc tgccagcgct tctcccgcgc cctcatggca 10320 gccaagagga gctccggggc cgcgccagca cctgcctcgg cctcggcccc ggcgccggtg 10380 ccgggcggcg aggccgagcg cgtccgagtc ttccacaaac aggccttcga gtacatctcc 10440 attgccctgc gcatcgatga ggatgagaaa ggtaactagg gggctggggg agggggcggc 10500 ggcgccggga agaaggcggt ggggtcgccg ggggagggca acacctgcgt cccttttctg 10560 cgggagggga cggtgcaccc ccggaattga tatgccccgg gagactgctt tcccgtaggt 10620 cggagcctca tcttctagta ttcttaaaac ctctcccctt tcagggcact gtagctgtcg 10680 actttgtttc agacaccagc cttcccccac acttctgcat gacccaggtc actatgagac 10740 acccagacgt gttgatgaca gtgacatttg tcctagagtg accacactga tcctttctag 10800 cactgtgaag agtgtgcagc ttcctctgaa ccaaggtttc caaaaggttt tgatattgaa 10860 gaagcagtgc cgccttactg gcttttaatg aaagcagagt attgtagtgt cagaaaaaaa 10920 gaacaaatgg tgacaatttt gaaagaaata gctgcatatg actgcagttg aatttgcatc 10980 attttaatca agataatcat tttatcagta caacgattcc tgaatacttt ttcaatgaag 11040 ttatatttag cataaaactt ttccccctgt tgctttgatt ttaattaaaa cagtattcca 11100 aagtagcctt taatttccaa gttgaaatgt ttgatgaatg gattgcgtaa acttaaacat 11160 accactttac agtaaaacct aaaacaacta tgtatgtttc tgaatgaaag caaggatact 11220 acatctttcg ggtttctttt aagctaactt tttttttttt ttgagacgga atctcgccct 11280 gtcgcccaag ctggagtgca atggtgcagt ctcggctcac tgcaacctcc gactccctgg 11340 ttccagcgat tctcctgcct cagcctcccg agtagctggg attacaggca cgcaccacca 11400 cgcctggcta atttttgtat ttttagtaga gtagggattt caccatgttg gccaggatgg 11460 tctccatctc ctgacctcgt gatcgggtcg cctcggcctc ccaaagtgct ggtaatacag 11520 gcatgagcca ccgcgcctgg ccttaagcta acatttttta ttatatgtgc caggcattgt 11580 gctattagct ttgcatgtgt tatctttttt ctttttaaaa aaaatagcaa ccatcccaga 11640 ccatgaaaag tgttatttaa tcctcacaat aactttgtga gatgaaggta ttattggtat 11700 cagcatttta gagatgaaga aaatgaggcc caaaagataa aggaggttat tccaaacctg 11760 tgctaataat gaaatttctt ttatggaaaa taagtgaaat taggagaagt ctaactttta 11820 caattctccc cttttatcct tacttccagt atgctgagat cttgcttctc cctctgccaa 11880 aaacacccac ttttctacca cacctcaatt agatactcac ttgcattgtc cattagtgaa 11940 aacagaaaca atctgcactt cattcatagt gtctgtctct actgccaact ccaaaaactg 12000 cA 02348657 2001-11-07 ttctagaatt tcaatcttgt tgaaacctgt ttcctttgtg gggcctggga gtgggaagtg 12060 ggatataagg aaagaggcag ttattcattg ttttggacag taaggaaaga gtgacggtta 12120 agagaggtca aggagggtgt taacatttaa gaatactatg tgtttgtaga aggaaatttt 12180 ttgttaactg ctccattctt tttttttttt ttttttgaga tggagtctcc ctgtgtcacc 12240 cagactggag tgcagtggcg tgatctcagc ttactgcaac ctctgcctcc cagacgcagg 12300 cgattctctt gcctcagtct cccgagtagc tggaaccaca ggtgcgccct atcacggctg 12360 gctaattttt tgtattttta gtagagatgg tgtttcacca tgttggccag actggtcacg 12420 aactcctgac ctcaggtgat tcgcctgcct cgaccttcca agtgcttgga ttacaggtgt 12480 cagccactgt gcccacccag caagctccat tctttatcac ctcttaagaa catccaggat 12540 cccttgggga gaattaaaac ggttgcaaag ttttagaata gaggaacatg tttaagcgta 12600 gatcattttt tgggccagtc atggtggctc acgcgtgtaa tcccaacact ttgggaggcc 12660 ggggcgggtg gatcatgagg tcaagagttt gagaccatcc tggccaacat ggtgaaatcc 12720 catctctact aaaaatacaa aaattagctg ggcatggtga cacatgcctg tagtcccagc 12780 tactcaggag gctgaggcaa gagaagtgct tgaacctgga aggtggaggt tgcagtgagc 12840 cgagatcgtg ccactacact ccagcctggg cggcagagca agactccgtc ttgaaaaaaa 12900 aaagtaggtc atttttggct gggcacggtg gctcatgcct gtaattccag cactttggga 12960 ggctgaggtg ggtggattgc ttgagcccag gagtttgaga ccagcctggg caacatagtg 13020 aaaccctgtc tttgtgaaaa atacaaagat tagctaggcg cagtggcaaa tgcctgtagt 13080 cccagctact tggggggctg aggtaggagg atcacttgag ctcaggttgt tcaggctgca 13140 atgagctgag atcgtgcaac tgcactccga actgggtgac aggagtaaaa ctgtctcaaa 13200 aaaaaaaaaa aaaaaaacca aaaaaaaaaa aactgtttta attgttttat ttaggaagag 13260 aaagtcagaa catgcaagga aatttttttt atttgtttat ttttgagacg gagtctcgct 13320 cagttgccca ggctggagtg caatggtatg atcttggctc actgcaacct ctgcctcccg 13380 gattcaagcg attctcctgc ctcagcctcc tgagcagctg ggattacagg tgtatgccac 13440 cacgcccagc taatttttgt gtttttagta gagatggggt tccaccatgt tggccaggct 13500 ggtttcgagc tcctgacctc aagtgaaccg ccctccttgg cctcccaaag tgctgggatt 13560 acaggtgtga gccgcggtga ccgaccacaa ggaaatttta gttaacactg ttggttgatg 13620 ggagttggga ggtaggataa aaggagaaat taaggaaaac ctaggcatga aaaataaaag 13680 accctgagct cttagatttg aagaaatagc agttccatgt gaggaataag tggaagaaat 13740 agaattcaga cctcaggtct caggctggtg acttaaatct ttcagtatca catatatgaa 13800 tatatctatt atacttaaat cctcctaaac atttttattt ttcagttgga tatattaaat 13860 atataaaaat aattatttaa tttattttag agacagtgtt tcactctctt acccaagctg 13920 gagtggaatg tgatcatagc tcactgcagc ctcaaggctc attcctaggc ttaagtgatc 13980 ctcttttttt tttttttgct agagatagga tcttgttatg ttagccaggc tggagaaatt 14040 tcaacaatat tttgaacaat aaaaaaaaaa taaattaggt tttattgtaa agtggtatgt 14100 ttaagtttac gccattctcc tgcgtaatgc atatttcata ctcttcctac tgataatgtt 14160 tctgttcaca actttttctt tatattttga tttcttttct cttttctttt tttttttttt 14220 tgagacagag cctcgctttg tcgcccaggc tagagtgcag tggcgcgatc tcggctcact 14280 gctagctccg cctcccgggt tcacgccatt ctcctgcctc agcttcccga gtagctggga 14340 ctacaggcgc ccgccaccat gcccagctaa ttttttgtat ttttagtaga gacggggttt 14400 cactgtgtta gccaggatgg tctcgatctc ctgacctcgt gatccacccg cctcggcctc 14460 ccaaagtgct gggattacag gcgtgagcca ccgcgcccgg cacatatttt gatttctaat 14520 gtggacatca gaatgggctg ttgacagctc tttttttttt ttttgaggca gagtctcgct 14580 tcttcaccca ggctggagtg caatggcgcg atctcagctc actgcaacct ccacctccca 14640 ggttcaagcg attctcctgc ctcagcctcc ccagtaactg ggattacagg catgtgccac 14700 cccacaccca gccaattttt gtatttttag tagagacagc atttcaccat gttggccagg 14760 ctgttctcga actcctggcc tcaagtgatc cactcgcctt ggcctcacaa actgctagga 14820 ttacaggtgt gagccaccgt gcccagcctt gacaggtctt tagtttgatt ttagttcaac 14880 aactgatgcc gtaatatgcc aaattaaatt agttcagact gaaacggatt acttaaagat 14940 tcattttcct ttaaaaatga agtaaaactt tagccggatg tggtggcggg tgtgtgtaat 15000 cccagctact cgggagggtg aggcaggaga atcgcttgaa cccaggaggt ggaggttgca 15060 gtgagctgag atctcaccca ttgcactcct gcctgggtga gaagagtgag actccatcaa 15120 aaaaaaaaaa aaaggctggg catggtggct caagccgggt gcagtggccc atgcctgtta 15180 tcccagcact ttgggaggca gaggcaggcg gatcacttgt agtcagaagt tcgcgaccag 15240 cctggccaac atattagtga aaccccgtct ctactaaaaa tacaaaaatt agctgggcat 15300 agtggtgcac gcctgtagtc ccgggtactt gggacgctga cgcaggacaa ttgcttgaac 15360 cA 02348657 2001-11-07 tccagaggtg gagattgcgg tgggccaaga tcacgccact gcacgccagc ctgggcaaca 15420 gagcaagact ccatctctca aaaaaaaaaa aaaaagaaaa ctgagtttat attgttatgg 15480 ttcttatcta tcttaaattt tttctttagg agattgaata tttttgtact ttagtcttaa 15540 tccagtggtt gaaagagagt gcacttttga agtctgcctc ttggctgtcc ttgacaacac 15600 aaaccttagt tccaagagaa tgtaattctt cctctttctc agtgcttcaa aatatatatg 15660 atcaaataga aacgagttga ataggcagtc tcttcaaagg tttcctaact ctgtggttaa 15720 ctatcaagga gctggtaata tcatgcactg ccattccctt ggcaacatga cttatctttt 15780 tttttttttt ttcttttttg agacagagtc ttgctctgtc acccaggctg gagtgcagtg 15840 gcgagatctc agctcgctgc aagccccgcc tcccacgttc acgccatttt cctgcctcag 15900 cctcccaagt agctgggact acaggcgcct gccatcacac ctggctaatt ttttttgtat 15960 tttttagtag agacggggtt tcaccgtgtt agccagtacg gtctcgatct cctgtcctcg 16020 tgatccgccc accttggcct cccaaagtgt tgggattaca ggtgtgagcc actgcgcctg 16080 gcctacttat cttctaattt aactgaaaac caatttattt gattcagtga aatggcatca 16140 aactgtagta gtgttaattg aaatatttgg taccttgaaa tgttaaatgc caaattaaat 16200 ctcattttaa tgaaatctcg tgtaaatgtg ttttatatgg tgactatgtt tattctgaat 16260 tttattctta tggcatacta aaaaaaaaaa aaattttttt ttttttttgt aatggagtct 16320 tgctctgtca cccacgctgg agtgcagtgg cgcaatctcg gttcactgta acctccacct 16380 cccgggttca agcgattctc ctgcctcagt ctcccgagta gctggtacta caggcgtgca 16440 ccactatgcc tggctaatat ttttgtattt ttaggagaga cagggtttca ccatgttggt 16500 caggctgatc tcgaactcct gacctgaagt gatccgcctg cctcagcctc ccaaagtgct 16560 gggattacag gtatgaccca ctgcacccaa cccatactca aatttgacac tgaattttca 16620 taaaggcctt aatttatctg aaaccaaact atttcaaaag aggaatagca cagcaaattc 16680 tgttgactta atgagaggat atgtgaagtc tatttattaa agcaaatatt aattggaggc 16740 cagttaattt gtacagctct gcattttaga tatttgagaa atatttattt cctctccagt 16800 gagatgtgtt aaaacattag ttatgtgatt aacaaatatg tgtacatacg tatatatgta 16860 catacacatt ttgagacagg gccttggtct gttgttcagg ctggagtgca atgacaccat 16920 cttagctcat tgaagcttca gcctcgcagg ctcaatcgat ccacccacct cagcctccct 16980 agtagctggg tctacagaca tataccacca tgcttggctg attttttaat tttttgtaga 17040 gatggtgatc ttgccctgtt gactaagttg gtaaatattt taattgttga actttcttgg 17100 aagactgaaa acctgtgata gccattttat ataaggagaa gctgaagttc aaagagtaga 17160 ctcatagcag aaacaaaaat agaatttaag tgaatggact caaaatattg tactttttac 17220 tttatactgc aggtttttat gttgtaatgc tggtaatgag ctccttggaa tatttggagg 17280 aaaagagaag gttgtaataa tggttctttg gatttactag aacatatcat gttctgcatg 17340 gctcctgtgg gtagacaagc cggaaatctc ctgggtaaca caatggtgga ggttctctag 17400 gtgacgtttg atttctcaag tacataggac taaacagaaa aggcctagta tgttatatga 17460 atgagagatc aagtttctca ggatattcta gggctaaagg atcaggcatc gaagacagaa 17520 attgtctaaa taaaattttt tctattcata gttttaaagg gctaaagggt caggcattga 17580 agacagaaat tgtctaagta aaatattttt ctgttcatag ttttaagctg tgtatatgtg 17640 catgtgtgta tttaaaataa cttcgtcaat gaaaagagtc aaactctgta aaatatttga 17700 agagatttat tctgagccaa atatgagtga ccagtggccc atgacacagc cccagtagat 17760 actaagaaca tctgtccaag gtggtcaggc tatagcttga ttttatacac tttagggaga 17820 cataagacgt cagttaaaca tgtaagatgt acattggttc catctggaaa ggcaggaaaa 17880 ctagaagttg gggaggcttc caggtcgtag gcagattcaa agattttctg attggcaatt 17940 ggtcaaaaga gcttatctaa agtcctggaa tccatagaag ggagtgtctg gtttaaaata 18000 ataggttgta gctaccaagg tttttattgt acagatgaag cctccaggta gcaggcttca 18060 gagagaatac attgtaaatg tttcttatga gactttaaaa ggtggcagac tcttaagtta 18120 attttctcct ggttcaggta aaagacttgg aaagggaaag gattctctac agaacgtaaa 18180 ttttccccac aagagaaagc tttgcagggc catttcagaa tatgtcaaag aaatataatt 18240 tagggtaaaa tacttcaatt tgttttattt atttatttat tttttgagac agagtctcgc 18300 tctgttgccc aggctggagt gcagtggcat gatctcggct cactgcaagc tccgcctcct 18360 gtgttcacgc cgttctcctg cctcagcctc ctgagtagct gggactacag gcgctggcca 18420 ccatgcccag ctattttttt tgtattttta gtagagacgg gatttcacca tgttggccag 18480 gatggtctcg atctcttgac ctcgtgattc acccgcctcg gcctcccaaa gtgctgggat 18540 tacaggcgtg agccactgtg cccggcctca aaatacttca atttctttca tggcctgcta 18600 tctgacgtga tgctgtacta gagtcaggct gggaatttgg cgtcttattg ctacaaaaca 18660 tcttaatatc tctgttttaa tgttaatgct gatcagttgt ccctgaattc caaagggaag 18720 _ cA 02348657 2001-11-07 agggtatatg agtcatgtcc aacccccact tctcattatg gcctgaacta gttttttagg 18780 ttaactttgg aatgcctttg gcaaggggag ggtccatgag tcagttgggg gtcttagagt 18840 tttatttttt gcttaccggt ttataaaaag ttaatgaaaa ttatcatatt tcataattct 18900 atataattca atattgtact ttatttaaaa ctcacgtata aaatagctgt ccatatctgt 18960 tttcagaaga tgaggatgga gggtagaaat cagaagtgtc agatttggta attttcttac 19020 actgctgaaa acctatacct accactttga aaggattaat ttcagacttg ctttctttgg 19080 gcctaatgat tctactttga agtttctctg attaaactaa ggaataaatc tgataaatgg 19140 acattcagat gataccatac ttttccaaaa gataacattg cttttgatta catatgcaat 19200 aaacatttca cattttttct caagattatt tactggcatc tgcaccaaag acacaaaaaa 19260 gcagccactg ttaaggactt tatcccttgt tctgttttta gctggtttgt tgttgtattt 19320 ttcctcatgt tgaatacagt taaaccctat taaactggat tccccatatt actgttagtt 19380 gtcctgatga caattaagga tagttagtaa atggatattg aatcatttta tttttttagt 19440 agtgatggcg tttcgctgtg ttggccaggt tggtctcgaa ctcctggcct caagtgatct 19500 gcctgtgttg gcccctcaaa gtgttaggat tacaggcgtg agccactgca cctggctgga 19560 tattgaatta ttgaagaagg atgttcccta acacttcctg cctcttttcc gctgtcttac 19620 tctctctgtt ccacccagta gtagttgggt ttttgatgtc tggcaaagta tagattgtct 19680 actcttctat attagttttc ttcactcttt tttttaaaaa tgtttttaaa gcaagataga 19740 gacagggtct tgccgtattg cccaggctgg tcttgaactc ctgagctcaa gcaatcctcc 19800 cacctcaccc cataaagtgc ggagattaca ggcatgagcc accatgcctg gccagttttc 19860 ttcactcttg acctataata gtcctgcaaa gccagtgaag ctgttaatat gctgacgtag 19920 cctttttttc tctcgtttgt gaattattaa caatccictga tcttacacat catatacaat 19980 aaaacatctt tgaacactgt cacatctcag cagctcattc tggttaatga ggaaagaaaa 20040 atgtcaaaat ctgtgatttt cttagaggtt attaaatgtt ttacagctat gtagatattc 20100 tgtagacttg ctgtacttac ttacataact tttctgctct tctgcagagg gagagaatta 20160 acttcataag tgggctttgt caatgccctc cagtcagcga tctccaggaa caaacttatc 20220 tatggttgag caagtggggt ttattaccca ctgtagccag ggagaacaca catatgtaat 20280 aaccatggta tgtcatagta aagggtgtta ggaagatagg atttgggctc gtttatttgg 20340 tgattttaag gagggtttaa agaagcaggg ttttgctctg atttggatgc taccaggagc 20400 tgcgaataat tctatgaata aatatcataa aacctatcta gaagaaaaga ctagagtgag 20460 gtctaaagct gtagtagtta aaaagcaaag gtcactcctt atctggaaaa ggggaatatt 20520 tggtatttca tggtttagac agtgttcagt gttcatgttt tgcctgtgtt tagacataat 20580 tgtagagtgg tcttgttcca ccgtggtcac agagtggcat tatttcatgc tgatattctg 20640 taagtgccag gtcaaatacc aaggtttagc tgatagtagt aggccagctc ctggatgtaa 20700 taagctgttt ttctctttct cagctttttt ttttgttgtt ttttttttaa aatagagtct 20760 ggctctgtca cccaggctgg agttcagtgg gggcaatctc agctcactgc agcctctgcc 20820 tcctggattc aagcgactct cctgcctcag cctcccaact agctggaatt acaggcgcaa 20880 gtcaccacac ccggctaatt tttgtatttt tagtagagac ggggtttcac catgttgagc 20940 aggctggtct cgaactccgg acctcaagca atccatctgc ctcagcctcc caaagtgctg 21000 agattacagg catgagtcac tgcacctggc ctgtttctta gatttgaggg tcaactttta 21060 cccttttcga actgtggggc ttcttatgga aattgacatt taagtcctga ccatatagga 21120 tcttgggcaa gttacttaac tatgtatgct gagatgtttt tttaaatgct tagtgcttgc 21180 acataatagg tactcagtaa atgagaacta ttattataaa atcaatagta cttttaagat 21240 tacagctaga ggttatgtta gaacattgtt aactcttcgt actagtttct gttacacttt 21300 ttaggatgca gtagcagcat aaacgagata tggggaagaa cgagaggtat ttaaacagtg 21360 atataggccg ggcgtggtgg ctcacgcttg taatcccagc actttgggag gctgaggtgg 21420 gcagattacg aggtcaggag attgagacca tcctggctaa cacggtgaaa ccccatctct 21480 actaaaaata caaaaacaaa attagccggg cgtggtagtg ggcgcctgta atcccagcta 21540 tttgggaggc tgaggcagga gagtggcgag aacccaggag acagagcttg cagtgagccg 21600 agatcgcgcc actgcacccc agcctgggcc acagagcgag actctgtctc aaaaaaaaaa 21660 aaaaaaaaaa attaaaacaa aaatatttgt gttaattgtg atgacaaaaa aaaaaaaaga 21720 gatggaagtc tctccctaac ctcactcctc atttagtgtc atggcttttt tctttttttt 21780 tttttttttt ttgagacaaa gcctcactct gtcacccagg ctggactgca gtggtgcaat 21840 ctcagctcac tgcaggctct gcctcccaga ttcaagcaat tctcctgcct cagcctcaca 21900 agtagatggg actacaggca catggcacca tgcccagcta attttttgtg tagtttttag 21960 tagagacagg gtttcactat gttggccagg ctggtctcga actcctgagc tcaagtgatc 22020 ccccctcctt ggcctcccaa agtgctggga ttacaggcgt gagccctgct cccagactcc 22080 cA 02348657 2001-11-07 tggctttttt tttttttttt aatgaaaaat tcaaaatgct cttttttttt tttttttttt 22140 tttgagacag agtctcgctc tgtcgcccag gctgaagtgc agtggtgtga tctcggctca 22200 ctgcaacctc tgcctcccag gttgaagtga ttctcctgcc tcagcctctc gaacagctga 22260 gattacaggt acgcgccacc acgcctggct aatttttgta tttttaatag agatggggtt 22320 ttgtcatgtt gtccaggcta gccttgaact cctcgcctcg tgtgatccac ctgccttggc 22380 ctcccaaagt gctaggatta taggcgtgag tcgctgcacc tggccacaga aattttttga 22440 agaagataaa taaggtgaca tttttaaggg tcaaagaaaa tgtcaaaaac tagaatgatg 22500 tctttacata gggtttaaaa ctttccaaat taacagggaa aataattctt taccttgaaa 22560 ataaatgttt gctagtgaaa gcaaatacaa tctttttact aaatgtttta ttaaattttt 22620 ttttcttgta gacacagggt cctactgtat tacccaggct ggtcttgaat gcctggcctc 22680 aagcaatcct cctacctcag tcttccaaag tgctgggact acagacatga gccatcacac 22740 tgggtctttt ttaccaaatt atagtagaaa gcactttttc tctaatggtg aactatgaga 22800 gaattaatca ggggctatta gtaattcatc cctgaattaa tcagtgatta taatgctttg 22860 tggtccatgt agtttgctgg ggattaacac accatgaaag tctaccagga gatttttttt 22920 tttctttgag aacaggggcc ataatcagta gtccttaaat gaaatggact attcccattt 22980 cattatatgt tgcctaggct ggactcgagc tccttggctt aagtgatctt cccacttcag 23040 actctcaagc agctgggact ataggtgtgt gccaccatac ctggcttaat tgagtgtttg 23100 ttttttgttt ttttttctga gacagagtct cgttgtgtcg cccaggctag agtgcagtgg 23160 cacaatctcg gctcactgca acctctgttt cccaggttca aacgattctc ctgcctcagc 23220 ctcccaagta gctgggatta caggcgcctg ccaccatgcc tggctaattt ttgtattttt 23280 agtagagatg gggtttcacc atcttggcca ggctgatctc gaactcttga cctcatgatc 23340 cacacacctt ggcctcccaa agtgctggga ttataggcgt gagccaccgc gcccggcttt 23400 aattgagatt tttagatatc tattactctg ctaattttgt cacttgcaag ttgccatcag 23460 aaaattgtag gaaaatggat atatttgttc cttggaatgg tttgtgtgag aatacttaag 23520 gattaaatag ataagtaaaa ctggtgggct ttatataaca tagatgagca aatgtcagga 23580 acatacaact gtgcacacag ttcaggagaa ggaggattta agttaatcaa caaatttact 23640 aagtataata aagatactaa aagtagtgtt tccataccac tttattactt aaagtatcat 23700 catataccct attttatatg atttttgcca caagtcagag ttaggtaaaa gaaatacttg 23760 cttttcaggt aaggagtttg acgcccagac agattaactg acttttccaa aatcatattg 23820 ctattaaatg gtggaacaag gacttaaatc tttgccttct aactcacata cttgcaaaca 23880 catatcctct cactctaccc caagctaccc atgttttgac ccttcttgtg gcaatctggg 23940 tctcactaat atttgaaaga aaacgtacag tagataattt gcaagttaat ctgttacgca 24000 tatctcttac ctctatttaa agatgaatat cagcatttct gttgtttcta cagtaacata 24060 ctaaaaaata atgcagtcca ggtgcagtgg ctcacacgtg taatcctagc acttttggaa 24120 gttgaggcag gaggatcact tgaagccagg agttcgagac tagcctgggt atgcaagacc 24180 ccatttctgt tttttttttt tgtttgtttt gttttgtttt gttttgtttt tttgagacgg 24240 agtctcgctc tgtcgcccag gctggagtgc agtggcggga tctcggctca ctgcaagctc 24300 cgcctcccgg gttcacgcca ttctcctgcc tcagcctccc aagtagctgg gactacaggc 24360 gcccgccact acgcccggct aattttttgt atttttagta gagacggggt ttcaccgttt 24420 tagccgggat ggtctcgatc tcctgacctc gtgatcccca tttctttttc actgcaacct 24480 ttgcctccca ggttcaagtg attgtcgtgc ctcagcctcc caagtagctt gggattacag 24540 gcatgtgcca ccatgcctgg ctaatttttg tattttttgg tagagatgga gtttctggcc 24600 aagctggcca ggctggtctc gaacgcctag cctcaagtga tctaccctcc ttagcctccc 24660 aaagtgctgg gattacaggt gtgagccact gtgcccggcc ccatttctac aacaattaaa 24720 aaatattagc ccagtgtagt ggtgcatgtc tctagtccca gctactcaga aggctgaagt 24780 gaaaggattg cttgagccca gaatttcaag gctacagtga gctatgataa tggcattgca 24840 ctccagcttg ggtgacagag tgagaccctg tctctaaaaa atgaagtaaa atagtgcaca 24900 agtatagaac ttgaaaatct tccttaacct taccataagg gaaatgatta ctaataagtt 24960 tcttaacttt ttgtacttac ataaacataa atattcatca gagaaaaaaa tatgcaaaac 25020 aatttgcaat ctttttcact taccatattt tggaattttt ttcatttcaa tatatttgat 25080 cttccttgtg ttttttcagt ttgtttgttt ttgtcaccca ggttggagtg aagtggtaag 25140 aacatggctt attgcagcct caatctcctg ctcccattca gcccctcaag tagctgggac 25200 tacaggtaca tgtcaccacg cccggctaat ttttattttt attttggtag agatggggtt 25260 tcaccatgtt gcccaggctg atcttgaatt cctgggctca agtgacccgc ccacctcagc 25320 ctcccgaagt gttgagagaa caggtgtgaa ccaccatgct ccacctctta gtctttacaa 25380 tctgcaaaac ctcataagtg gctaatagag gaatatagta aagcaaaggg ggatatcact 25440 cA 02348657 2001-11-07 gattagaact gtgtttttag gctgggtgcg gtggctcacg cctgtaatcg caacattttg 25500 ggaggctaag tgggagtatc acttgagccc gggagttcaa gaccagcctg ggcaatatag 25560 tgagagaccc tgtctttaga aaaaaattaa ccaggtgtgg tggtgcacac ctgtggtccc 25620 agctattcaa gaggctgagg tgggagaatc gcttaagcct aggaggcgga ggttgcagtg 25680 agatcatacc actgctctct agcatgggtg acagagcgag acccagtcta aaaaaaaaag 25740 tattttttcg tttttttcca actcatgtac acccgccacc ccacccctgc tttttttttt 25800 tctgacattg ggtcttgctc tgtcacccag gctagagtgc agtagcacaa tcaactcact 25860 gcagcctcct cttcctggac tcaagcagtc ctaccacctc agcctcccaa gtagctggga 25920 ccacaggtgt gcaccatcat gcctggctaa tttttgtact ttttgtagag atagggtttc 25980 accatgtggt tcaccatctc taactcctgg gctcagtcag tccacttttg cctcggcatg 26040 agccactgtg tgcagcccac gttttttatt aatggatatt tggattgttt ccatctattg 26100 tgaataatgt ggctatgaac attggtctaa atatctgttt aagtcccggc tttcaatact 26160 tttggatata tacctaggag tagaattact gaattatatg gtaactttct gtttaaattt 26220 ttgaactgcc aacctgtttt ccataggggc tgcaccattt tgcattccca ccagcagtgt 26280 acaagggttc cagtttctcc acatttgtta tttttcattt tttaaaataa tagtcatcct 26340 aaagggtatg aagtggtatc tcgttgtgat tttgatttgc atgtattttt ctaatgactt 26400 atgatgctca gcattttgtc atgtacttat gtaccatttg tgtatcttct ttggaaaaat 26460 gtctattaat gttcttttcc cattttttaa ttgggttgtt tttatgttta tcaattttgt 26520 aaacatttta agctctgcag cataactact caaccctgtc acatggtaag attgacccag 26580 taaaacttta tgtacaaaaa taggcagctt actagattta atcttagtcc atagtttgct 26640 aaggcatgca ttagataatg tagttacact attggctaat aatttaaact acaagtggtt 26700 gtaagtttct gccacccaaa ttctttcttg atttgatgta gtctggttgg ttgaatttga 26760 gtgttatatg gggtcataga gttaaaagag aaatgtctat gagaaactag ggactgttgg 26820 gagctaatgt taaaggattt tggaggcctt ttgtgcactg gagaccattg gaagattgga 26880 ttttctgcta taaatgtatc taaaggataa tcagtgtaag ttatgggctg tagtttgcca 26940 acccctacat taagggattg aaataatttg aatatgggtt tcagttcttg tatggtctgg 27000 ctcagttctt tttttttttt tttttttttt tttttttttg agatggagtc tcactctgtt 27060 gcccaagctg cagtgccatg gcacgatctc agctcgctgc aacctccgcc tcctggcttc 27120 aagtgattct cctgcctcag cctccagagt agctaggact acaggcacgt gccaccacat 27180 ctggctaatt tttttttttt tcaagacaga gtttcgctct tgtcacccag cctggagtgc 27240 aatggcacga tcttggctca ccgcagcctc cgcctcctgg gttcaagtga ttctcctgcc 27300 tcagcctccc aaatagctga ggcaacaggc gtgcgccacc acgcctagct aatttttctg 27360 tttttagtag agatggggtt tcaccatctt ggccaggctg gtctcgaact cctgatctca 27420 tgatccaccc gcctcagcct cccaaagtgc tgggattaca ggcgtgagcc acctcacctg 27480 gcgttttttt gtgtgtgttt tcagtagaga tggggcttca ctgtattagc cagaatggtc 27540 ttgatctcct gacctcgtga ttcacctgcc tcagcctccc aaagtgctgg aattataggc 27600 atgagccacc acgcctggct gtggctcagt tcttaactgt tcattcattc agggtcccag 27660 ccaaaatctt ttgccacagc ttctcctggg catgctctga aattcatttt ttgtctgttt 27720 agttgcatga gtccactgaa agctttgctt attttctcca ccactttcag agttcacagt 27780 cacttcaagt agacgaggtc aggagatcga gaccatcctg gccaacatgg tgaaaccccg 27840 tctctactaa aaatacaaaa cttagctggg cgtggtagcg tgtgcctgta gtcccagcta 27900 ctcaggaggc tgaggcagga aaattgcttg aacccgagag gcagaggttg cagtaagccg 27960 agatcatacc atttcactcc agcctgggcg acagagtgag acactgtcaa aaaaaaaaaa 28020 aaaaaaaaaa aggaaagaaa agtgctccaa atgctgggct catctctgct ggcttctctc 28080 ctttttatat ttcgataatt tttaaaataa taaccatcct aatgggcttg atatggtccc 28140 tcctttctaa attttggtaa ttttcattgt tttggaaact cactaatccc ttcaaacaga 28200 tgtttttaaa actttttttc tagttctctc tctttttttt tttttttttt tttttgagac 28260 agggtctctc tcagtggtgc gacctccctt actgcaacct ctccctcctg ggttcaagca 28320 gcgattctcc tgcctcagcc tcccaaatag ctgggagtac aggcacccac ccccacgccc 28380 agctaatgtt tgtattttta gtagagattg ggtttcatca tgttggccag gctggtctcg 28440 aactcctgac cccaggtgat ccgcctgcct cagccttcca aagtgctggg attacagcca 28500 tgagccaccg cacctggctc tagttctctt ctaatcttac tatagtaatc aaaattttag 28560 tgctgatgtt ataatccaag cccaaatgga tattcttata cattaaatgt tggaatatca 28620 tgtttgttaa aaatcagatc tgctgggcac ggtggctcaa tgcctgttat cccagcactt 28680 tgggaggccg aggcaggtgg atcccctgag atcaggagtt cgagaccagc ctgaccaaca 28740 tggagaaact ccgtctctac taaaaataca aaattagccg ggcgtggtgg cacgtgcctt 28800 _ cA 02348657 2001-11-07 tcatcccagc tacttgggag gctgaggcag aagaattgct tgaacctgtg aggcggaggt 28860 tccagggagc tgagatcgtg ccattgtact ccagcctggg caacaagagc gaaattccat 28920 ctcaaaaaaa aaaaatcaga tctgtcccta tggttttatc ttcactgcat gtcatatata 28980 aatggaagca tgtagtatgt agccttttgt gtctcgcttc tctccctttg cataatattt 29040 ttgagattta tcccttttcc tacatatgtc agtagtttgt ttctttttaa tgctgaatag 29100 tattccacgt gtggagatac cacaatttgt tactccattc actaaatgat ttgggttgtt 29160 tcctgttttt gttattgttg ttgttgttgt ttaattaatt aattaatttt ttttttgaga 29220 tggagtcttg ctctgttgcc caggctagag tgcagtggcg caatcacagc tcactgcaac 29280 ctctgcctcc ccggttcaag tgattctcct gcctcagcct cccaagtagc tgtgattaca 29340 ggtgcccgcc accacaacca gctaattttt gtatttttag tagagatggg atttcaccat 29400 gttggccagg ctggtcttga actcttccct ccttggtctc ccaaaatgct gggattacag 29460 gtgtgagcca ccatgcccat cctcctgttt ttaaatttta tgaataaagg tactgtaaat 29520 tcatgtacag gtcttagaag tttgcatttt tcttgggtaa atatgtagaa gaagagattg 29580 ttgactcatg tggtaaatat atgtttaatg tcataagaaa ctaccaaact gtttttccaa 29640 ctgggtgcca ttttgtttcc taccagcaaa cataatgaaa ggtccattac cctttgtctc 29700 gtaatatttt ggtattttta tgttcttttg tttttttgcc attcaaaatt gggtgcattg 29760 ttgtatcttt ggattttaat ttgtacttcc ctaacaacta atgatgtgga gcatcttttt 29820 atacgcttac ttgccaatta tgtcttaatt ctttggcaat acttatattt gactctgcct 29880 actatatata tatatatata tatttttatg ctatatatag agtatatata tttttatact 29940 atatatattt atatatacta tatatattta tatatactat atatatatat atatatatat 30000 atattttttt ttttttttga gatgaagtca tgctctgttg accaggctgg atgcagtggc 30060 atgatcttgg cttaccgcaa cctcaacctc tgcctcccag gttcaagtga ttctcctgcc 30120 tcagcttcct gagtagctgg gactacagac acatgccacc atgcccggct aatttttgta 30180 tttttagtag aggtggagtt tcgccatgtt gtccaggctg gtcttcaact cctgacctca 30240 ggtgatccac ccgcttcagc ctcccaaaag tgctgggatt acaggcatga cccaccgtgc 30300 ccagctggaa taagcaatct taaaaagcag tttgttgatt tctggtgaat agagaaaatg 30360 tgacaaacta tgactcaata gtttcatttc ttttttgttt gtttgtttgt ttttttgaga 30420 cagagtcttg ctctgtcacc caggctggcg tgcagtggct cactgcaagc tctgcttcct 30480 gggttcacgc cattctcctg cctcagcctc cggagtagct gggactacag gcgcccgcca 30540 ccatgcctgg ctaatttgtt ttttgtattt ttagtagaga cagggtttca ctgtgttagc 30600 caggatggtc tcgatctcct gacctcgtga tccacccgtc tcggcctccc aaagtgctgg 30660 gattacaggc atgagccacc gcccctggcc tacttttatt tcttaagcat atatcttaaa 30720 gaaactgcag gtatgcatta ggggacaggt agaaaaatgt tacagcattg tttgaaatgt 30780 tgaaaaactg gaaacaacct caatatctta ataatagaaa aaatggttga ggctggctgt 30840 ggtggttcat gcctgtaatc ctagcacttt tggaggctga ggcgggcgga tcacctgagg 30900 tcgggagttt gagtccagcc tggccaacat ggtgaaaccc cgtctctact aaaaatacaa 30960 aaaattaggc aggtgtggtg gtgcacacct gtaatcccag ctacttggga ggctgaggca 31020 caagaatcac ttgagcctgg gaaatggagg ttgtagtgag ccgagatcat gcctactgca 31080 ctccagcctg ggcaatagag tgagactccg tctcaaaaaa aaaaaaaaaa aaaaaaaggg 31140 aaggagcatg ggaatgggaa gaggcactaa aaaaggaact tcttttgtat ctgttacatt 31200 gtactcattt tgtttttaaa attttaagcc aaatatgaca ttgttatcac ttttgttgcc 31260 actcagaata caagtgctat tacactattt tctataattt tccctttttc aaactaaaaa 31320 acaaaaatac atgtaaacag gtgttttctt tatggaaaac aggaaggtga gcatccaaat 31380 aattttagtt aatttataac aaactcttaa taatttcttt ttcttcttct tctttttttt 31440 tttttttttt tgagtcaggg tcttgctctt ttgctcaggt tagagtgcaa tggtacaatc 31500 tggtacaatc acatcttagt gcaacttcta cctcttcagc tcaagtgacc tctctcctca 31560 gtcccccaag tagatgggac cacagatgtg tatccccaat catggttaat ttttaaattt 31620 tttggtagag ataaaatctc accatgttgc ccaagctggg cttgagctcc tgggctcaag 31680 cagtcctcct gccttggcct cccaaagtgc tgggattata ggcgtgagca aactgtgccc 31740 agtcttcata aacttttctt tacatgtcct tatcaagtac tttttgagca cctactgtca 31800 accagccgta gtatataata ctgataattc tataacataa gaaattgacc tgtttaaggg 31860 gatgaatatg gttagttatt ttcagggtga agaaacagaa gaatcgggga ggtagtacat 31920 agtcataagg agacggcatt tcttagtcac tttgtgtggt gtttataata agacttcatg 31980 tggccaggtg cggtggctcg tgagcgcctg taatcccagc actttgggag gccgaggtgg 32040 gaggatcaca acaaggtcag gagatcgaga ctatcctgaa caacatggtg aaaccccgtc 32100 tctactaaaa atacaaaaat tagctgggtg tggtggcacg tgcctgtaac cccagctact 32160 cA 02348657 2001-11-07 cgggaggctg aggcaggaga atcgcttgaa ccagggagtc ggaggttgca gtgaaccaag 32220 atcgtgccac tgcactgcag cctgggctac agagagagac tccatctaaa taaataaata 32280 aataaataaa taaatagact tcgtctgttt catcaagagt cattgtatta tattgatttt 32340 gaaatttcaa ataataataa ggaatagtat ggaaattttt gtttgattaa atggggacat 32400 gaggccaggt gtggtcactc aggcttgtaa tcccagcact tcgggagacc agggcaggag 32460 gattacttga gcctaggagt tcaagaccag cctgggcaac atggcaagac cctatctcta 32520 caaaagaaat acacaaaaat tagctaagtg tggtggcaca tgcctgtagt cttagctact 32580 cgggaggcca agggaagagg atggatcact tgagcccagg agttggaggg tgcagtgagc 32640 taggattgtg cccctgcact ctagtgtggg tgacagcaag actctgttta aaaaaaaaaa 32700 aaaatgaggc cgggcgcggt ggctcacctc tgtaatctga gcactttgag aggccaaggc 32760 gggtggatca cctgagttca agatcagcct ggccaacatg gtgaaaaccc cgtctttata 32820 cttaaattac aaagattagc tgggtgtgat ggtgcacacc tgtaacccca gctactccag 32880 aggctgagac agcagaatcg cttgaacccg ggagggggag gttgcaatga gccgagattg 32940 caccactgca ctccagccta ggtgacagag caagactctg tctcaaaaaa aaaagaaaaa 33000 aagtctaaga agttaatttt cattcagaca aatgttcaaa aataatagaa ataaaacaaa 33060 aaattaattt tcaaatatgt gatttgagta taacgatcac tttacagaag ttattctaca 33120 tactttttga ttatgctgag tttttaggtc cttttaaagc ttaacttgta tcaggaatta 33180 atgttttaaa ctagttgttg ggttcaaaga aaatagaaat gtgttattaa atgccacact 33240 tgtaatctca tacagcagtt ctcatgatgc aatcaattgt taaataaaaa cttcctctag 33300 agaggaggta cccagcaatg aacacattat atcagatttg aatatgagat taaacaatgc 33360 tttttgtttc attgttattg aaatcatatt tgtatttttc aaaagtatat atacttaaaa 33420 attcctaaat aaaatgtctt tctgtaatac agcattttag gttataagga tcaataccat 33480 gggctgataa gcaaaatagg actcacggcc ccaaaatgtt gataaacatc atgaccatat 33540 tccccataat ggagttacat atacacatta caatgataaa aatactaaga agttatatag 33600 taatgtttct cagacttgtt cacaaccctg ttttttatgt attacctctc aaaagcatga 33660 tttgcaatat ttagtgtact cttcatacga tctatacaaa taatttttta ttttaaagca 33720 ggacagaagg agcaagctgt ggaatggtat aagaaaggta ttgaagaact ggaaaaagga 33780 atagctgtta tagttacagg acaaggtaag attgtatttg tttatagcca tcccaaatta 33840 tgatatattc acatgattgt ccagatttca gatctattta tttatttatt tatttttctt 33900 tctttctttt cttttctttt cttttttttt tttttttttg agacagggtc tttcctctgt 33960 tacccaggct ggagtgcagt gatgtgatca tagctcactg caacctcaaa cttctgggct 34020 caagtgatcc tcctgcctct gcttcccatg tagctgggac cacaggcgca cactaccata 34080 cttagctaat tattattatt attattatta ttattattac tagtttttga gacagagtct 34140 cgctcttttg cccaggctgt agtgcaatgg tgcaatctcg gctcactgca atctccgcct 34200 cccggattca ggctatttat tctcctgcct gagactcctg agtagctggg attacaggtg 34260 catgccaccg tgcccagcta atttttgtat ttttagtgaa gatggggttt tgccacgttg 34320 gccaggctgg tttcgaactc ctgatctcaa gtgatctgcc cacctcagcc tcccaaagtg 34380 gtgggagtac aggcatgagc cactgtgggc cacacttagc taattaaaaa aaattttttt 34440 gtagagacag ggtctcactg tgtttctgtg actgatctta aacttctggc ctcaagtgat 34500 cctcctgcct cagctttcca aagttgtggg attacaggca tgagccactg tacccagcca 34560 gattgtattt atcttaataa atgtatttgg gccaggcaca gtggctcatg cctgtaatcc 34620 cagcactttg ggaggccgag gtgggcgaat cacctgggat caggagttcg agaccagcct 34680 gatcaacatg gagaaaccct gtctctacta aaaattcaaa attagccagg cgtggtgtcg 34740 cgcacctgta attgcagcta cttgggaggc tgaggcagga gaattgcttg gacccaggag 34800 gcggaggttg tggtaagcca agatcgcgcc attgcactcc agcctgggca acaagagtga 34860 aactctgtct cagaaagaaa gaaaagcaaa acagtatttc atttaattaa aaatgccttg 34920 tattatacca gtaagagtaa aaaacaattt aattaaagta tgatatatgc tcttttcatc 34980 acttagaatt tgaattttaa tcttattgaa gaggctgttt tagttttatt tagatatggt 35040 tataacaaca atattaatat ctgtgaccaa attggtgcat gcatgggcaa tgaaaagcta 35100 tgttgtgact gcagcatggt ggatagcatt agtaagttag cattggttgt aaaatgaatc 35160 ccaatttcaa agattttgaa acgtggggaa aaaatatttt agaccccatg aaataagacc 35220 tgaaatctat gaaataccac agtaggttgg aaatcatcat gagaaactgt aactattttt 35280 ttttataggt attatatgta ttctttgaga cagggtctca ccctgttgcc caggctggaa 35340 tgctgtgatg tggtcacctc tcactgcaac atccacttcc tggggctgaa gtgatccttg 35400 caactcaccc tcccatgctc ggctaatttt tttttttttt tttttaagta gagaccagat 35460 ctctttatgt tgcccaggct ggtcttgaac tcctgggctc aagtgattct gctttgtctg 35520 cccagagtgc tgggattaca gaagtgagcc acaacacctg gcctaaagat agtattttta 35580 aaatttcttc tgttttcttt cttttgggta tacattttct tctttttttt aaaaaaaaat 35640 ttctgtataa agactgtgac tccccatgaa agtagtttgg gtgataattt atcgtgaaac 35700 aatattagtt gggaaatgta gatattttaa ttaatttttt tctttcaggt gaacagtgtg 35760 aaagagctag acgccttcaa gctaaaatga tgactaattt ggttatggcc aaggaccgct 35820 tacaacttct aggtatcaat taatgtataa tttgatgtgg gatgtattgg aaatgtgtgt 35880 tcaatgaaac tttaatttgt agaaagaaat agatcagtga ttgaaaatgt ggtccaggct 35940 ttttaacata aagaaaacgt ataacatata caaaaacaga agagcataat ggacttcttt 36000 ttttttttga gatggacgct tgctctgtca cccaggctgg agtgcagtgg cgtgatcttg 36060 gctcactgca agctctacct cccaggttca cgccattctc ctgcctcagc ctcctgagta 36120 gctgggacta caggcacccg ccaccacgcc ccgctaattt ttttgtagtt ttagtagaga 36180 cagggtttca ccatgttagc cagaatggtg tccatctcct gacctcgtga tccacccgcc 36240 tcggcctccc gaagtgctgg agttacaggc gtgagccaac gcgcccagcc gagcataatg 36300 aacttctaat tattcttctc tcagctttga taattatcac ctcactatca gtcttgattt 36360 atttatacca agggctagca aactgcagct gatgggccaa cccagctcac tgcctattac 36420 tataaataag gttttattgg cacacagcca ttcctttcct ttaggtattg tctatggctt 36480 tcatgctacg gtgacagaat tgaatagttg atacagagac aacactgccc tcaaaaccta 36540 acatatttac tgtctggccc tgagaaagcc tgccatcttc acttgacatc ccacttcact 36600 gtcccccaac ttcttattat tttgaaacaa attattgact tattttccat ttataaatat 36660 ttcatattat acctctaaaa gataaggatg tcaaaataaa atcacagaaa taccattatc 36720 acacctaaaa aataactcca aatttctttt aacattatcc aaaaaaactg acccccccaa 36780 aatgcaattt ccaaatttct aattttctca aaatttaata atttttacta ttttttaata 36840 atttgtttgt atcaggatct taaaaagatc cgtatgtctc ttttaatgta caggttcatc 36900 tgtttttcat tttcttccaa tttatttgtt gatgaaacca ggtctttgtc atgtaatatt 36960 tcctacagtc tgacttttgc tgcatgcatc ttttgtggta tgttttaaca tgttcttctt 37020 tcctcccacg ttaaatgata gttggatata gagccttgat cacattgaaa gttgattttt 37080 attttttaat gattagacta cttcctaggt ggttgtgttt gtgtgttcat cattagttgt 37140 tccatcttgt gaggttagca gcagttaact atgactgatg tccagtgata ctttaattct 37200 gtcattcttt cagcattcat caactgtaat agaaactttt acttgtcttc tgtttgatgg 37260 cgtaggtttt aaatatatat taataagtta aatctaccac tcaaaaaaag tagaacaaaa 37320 cctactacat atgagtggct ctaccatacg ttggtggatg gaaatagtag atatttggta 37380 agcaggtaaa ccttatttat ttgtagccct gtgacttggg gtaagttatt ttgcatgtct 37440 gggtcttttt tatctaattt gtaatatgaa gctattatta ttattattat tattattatt 37500 attattatta ttattattat tattcgagat ggagtcttgc tttgttgccc aggctggagt 37560 gcagtggtgc aatctcggct caatgcaccc tccacctcct gggttcaaac tattctcgtg 37620 attcagtctc ccgagtagct aggattacag gggcctacca ccacacctaa tttttgtatt 37680 tttagtaggg acggggtttc accatgttgg ccaggctggt ctcaaactcc tgacatcaag 37740 tgatccatcc acctcagcct cccaaagtgc tgggataggc cgggcacggt ggctaacgcc 37800 tgtaatccca gcactttggg aggccgaggc gggtggatca cgaggtcagg agattgagac 37860 catcctggct aacacggtga aaccccgtct ctagtaaaaa aatacaaaaa actagccagg 37920 tgtggtggcg ggcacctgta gtcccagcta cttgggaggc tgaggcagga gaatggcatg 37980 aacccaggag gcggagcttg cagtgagccg agatcatgcc actgcactcc aggctgggca 38040 aaagagcgag actctgtctc aaaaaaataa aataaaataa atagataaat aataataata 38100 aagtgctggg attacaggca tgagccacca cgcccagctg aagctaatat tattagctaa 38160 taataatatc tcatattttt gaccattgaa ttattaaagg aacctaaacc atagtagtaa 38220 gtgctttaaa aatgttggtt tttatttatc tgtttacctg actgtcatca cctcctttgc 38280 ttaggtagaa agatatattc ataaacacat acatatacat tttattcatt ctttaattca 38340 tttactccta tatggtcatt gtgtttgtgg gatttttgcc cgcacatagt taaaaatgca 38400 gccgttactg ctttcagatg agtaacaagg tagtgttccc tggcttctgt ggctgacagg 38460 atttgccttc ttcctttcta aatggaggtt attactgtgt cagatataat taaatagtgt 38520 attaaagttt gttgcaataa aataattgat ggttctaatt ggtactttct acgtgtttta 38580 tctttaaagc ttttcagtgt atatataaag tatatatcat acagaataaa tttgattgtg 38640 gagcattttg taacatcttt caaaattaat aagagttggt ttttatgttt tgtttgatgt 38700 tatgatatag gacattagaa gtattaatat caattagaga ctcatctttg aatgtgactt 38760 tgtactttct tatttgtgtt agtagaggag agaacaaaaa gaagatatgt aatgtaatat 38820 gaaactaggc atttaaagat ttaacgtttt ggatatttta aagttggtgt ctgttttcac 38880 cA 02348657 2001-11-07
16/66 cctcaaaaat gctattacct atttatgaaa tatctttaaa agtgtggagt ggtagatggg 38940 aaaggtgaca tcggctgggc gcggtggctc acacctataa tcccagcact ttgggaggcc 39000 aaggtgggcg gatcacctga ggtcaggagt tcacgaccag tctggtaaca tggtgaaacc 39060 taatctctac taaaaataca aaaaattagc caggctggtg gtacgcacct gtaatcccag 39120 ctactcagga ggctgagtca ggaggatggc ttgaacccag aaaatggagg ttgcattgag 39180 ccaagatggc accactgcac tccagactgg gtgacagaga gagactccgt ctcaaaaaaa 39240 aaaaaacgcc gggcactgtg gctcacacct gtaatcctag cactttggga gactgaggcg 39300 agcagatcac ttgaggtcag gagttcgaga ccagctgggt gcctgggcaa catagtgaaa 39360 ccccgtctct actaaaaata caaaaaaatt agccgggcgt agtggcgggc gcctgtagtc 39420 ccagctactt gggaggctga ggaaggagaa tggcgtgaac ccgggaggcg gagcttgcag 39480 tgagccgaga tcccgccact gcactccagc ctgggtgaca gagcgagact ccgtctcaaa 39540 aaaaaaaaaa aaaaaaaaaa tagccgggca tggtggcggg cacctctaat ctcacctact 39600 tgggaggttg aggcatgaga attgctcgag cctgggaggc agaggttgca gtaagcagag 39660 accacaccac tgcactctag cctggatgac agagtgagac tttgtctcaa aacaaaaaca 39720 aacaaaccaa accacctctt gtccactcct aatctccctt actgtgtttc acttattttt 39780 ttcccatata tttgtcacct tctaataaac tgtgtaactt attttttatg tttattgtgt 39840 actatctgtc ttctccctgt tggaatataa actctatgga ggagggatcc ttgtctatat 39900 cccaagtgcc tacaacagtg tctagcacat gctagttacc gaataaatat ttgccaagtt 39960 aatgaagttg tttataaccc ttggcactat acctgataca gtgtagggac ttaataaatg 40020 aatgttaaat gaagctatct taaaaatata tatatatata taacagccag atacgccaat 40080 ttgccgacat caaaattaat cttttcatct attgcaggtt ttacagttaa gctttgctct 40140 aaggttcact atcactaaac caaaaataaa taatatggat ggtcttttcc catttttaac 40200 agagaggcta catcctctca aaccagtcag tattaggaat tcccaggatc attctctcca 40260 ttttccatcc taattagata cctatctggc accacatctc tgaaaagctc caatttttaa 40320 ccagcacata ataaacaaat atgttactat taatacacgt ttgtacacaa gtcattttta 40380 ttgtcttagg tatatccact cccagacctt ctgagttatt gaaagacagg aatttgtgat 40440 gtcacctctt ttttcttttt tttgagacgg agtcttgcct tatcacccag gccagagtgc 40500 aatggcgtga tctcggctca ctgcaacctc tgcctcccgg gttcaagcga ttatcctgcc 40560 tcatcctcct gagtagctgg gattacaggt ggccctagtt tgggtttttg gttttaaaca 40620 ggatggtctc ctctttgaga agttgccatg agttagccat gatgatacct gggacaataa 40680 tggtccacag agaagtaaga gccaatacaa cgccttaaga gaaagtacct ggtatgtttg 40740 tgaagcagca aagaggccaa tgtgttccag caaggagatt atagtagaga tgaagtcaga 40800 gaactcatgc ggagagggat tgtcacaaca cgcagggctg taaaggccac catgaggact 40860 tgagctttta ccgcctgtga aatggggagc agttacaaag atttttaaga aagcagccca 40920 gtgcagtggc tcatgcctat aatcccagct ctttgggagg ctgaggtggg tggatcacct 40980 gaggtcagga gttcgagacc agcctggcca acatggcgaa accttgtctt tactaaaaat 41040 agaaaaatta gctgcgtgtg gtggccatgc ttgtaatccc aaatactcgg gaggctgagg 41100 cagaagaatc acttgaaccc gggaggcgga ggttgcagtg agccgaggtt gcgccactgc 41160 cctccagcct gggcaacaaa gcgagactcc gtctcaaagc cagaaaaaaa gatttttagg 41220 aaaggaatga aatactctga cttaaatttt agaaggatca ctctggttgc tatgttgcat 41280 tatagactct aagggtagaa ccagggagag caattaggac actgttacag taatctagga 41340 gaaaagtgat agaggcttgc accagggtag tatcaggaga aatggtaaca agtggttgga 41400 ttatgattat agttgaaggt cgaacaacta gatttgctga tagattggat aaaatggtcc 41460 tctctttatg gatctcataa tacagtagga gaaacagaca cataaatagt catcactgca 41520 ggatgggtat tagaaatatt ttgcaagggt gtaaaaggtg ctaagaaagc tttcttgtgt 41580 gacaaagctg gttaaagaaa gaaaagaaag cttcctagaa gtgaaaccta aaatatacac 41640 ttagataaat gaataaaagt tatgaaagaa tgtgagggct gggcacagtg gctcatacct 41700 gtaatcctag cactttggga ggttgagtcg ggggtattgc ttgagtccag gagtttgaaa 41760 ccagcctgga cagcgtactg agaccccatg tctaaattta aaaaaaaaaa aaatagccag 41820 gagtggtgat gtgcacctgt agtcctagct acttacttgg gaggctgagg caggaggatt 41880 gcttgagctc aggaggtcga gactgcagtg agccatgagt acaccactgc actctagtct 41940 gggtgacaga gtgagaccct gtctcaaaga aaatgaaaag aaaaagaatt tgagaaaaga 42000 tatgtcagga aaatgtgatg acatgaacaa atactcaaag gcaagaaaag catggtgagt 42060 aggggagggt acaggttgag acatgaagtt gggattgccg aggcgtaaga ggtataggca 42120 gatcatggat ggcctggttt gtcataggaa ggagcttggg ctcttatctg tgggcaatgg 42180 gaagccacta aagggtttta agtagaagag tgttatatgg taaggttttc ctctccagta 42240
17/66 gatcactcag atgactgtgg gggttggatg tgaggaggta aagcagcaaa gttactgctt 42300 taatttaaat cattgattaa tctgtacaat cctagtcatt ccaaaaagaa acattagtcc 42360 tttaacagaa gtgaattggg tctgggcgcg gtggctcacg cctgtaatcc cagtactttg 42420 ggaggccgag gcgggcagat cacctgaggt caggagtttg agacaagtct ggccaacatg 42480 gcaaaacctt gtatctacta aaattacaaa aattagctgg gcatgggggc acccacctgt 42540 aatcccagct attcgggagg ctgaggcagg agactctctt gaacccataa ggcagaggtt 42600 gcaatgagct gaggtcgcac cactgcgctc cagcctgggc gacagagtga gactccgtct 42660 ccaaaaaaaa gaaaaaatat tggagcagtt tcacagatgc tgtttactgt tatactgtat 42720 gtgtctatga ctcctcctcc aagaaaaaaa aaatgaattg gagcaggttc acagaagcaa 42780 tgtactgtta cactgtatgt gtctgtttct acacatataa atctgaattc tgtgtacacg 42840 aaaagaaatc ctatagcttt ttattcctag ctataaaaac taagaatata atttctttct 42900 ttttattaca taatgaatgg ttctgttaac tttttgttaa aatttcattg aggggagtat 42960 taattcacat ttatgtacgg atgtctacat ttacaaatca gtgtattttt tgatttatgc 43020 ttttactgag acaaagggtt tctgtctcag catggtcatt taaagagttt atcattgaga 43080 aaaatcagat gaccaacctg ttagctcaaa aaaaaaaaaa cctccaaggt atattgtatc 43140 agccagttct aggatacaaa agccatgcag tactttgtgt tttgtgccaa aaagggtagc 43200 tgctatttga cctgtcccaa aggcatgtgt ggttgtaccg taaaccaagc atggtacctg 43260 tttgtcaaac tttagaaatg aaagtttaag agagttaata tataggtgct gcatttttta 43320 tgtattcatt gacttgctgg tacagaagaa aagaatcaat tatgattcag cacaatactc 43380 cacttgggga agagagtgca gcagtagttt agagtgtcag ggatcaaact gctaccttct 43440 tgggcttcag ttgctagact taagagaccc agatcttggg aggggttttt gttgttattt 43500 gatgtggggg taaggttgaa atactccctt ttaattgatt aatataaaaa ataggtaatg 43560 tagacgtatg tcacaaaatt ttaacaagtt tgagtgtgaa aagcatccat cccattctat 43620 gccctggcta cccatttccc ctccctagag gcggctgtta ttatcagttt ctctgggtcc 43680 tttttagagg taatcttttt gtatgcaact gtgcacatgt atgtttacac aaatggtagg 43740 gtattgtata tatatacagt tactgcagta tgcttatttg actttgcttt attgctttta 43800 ttttctgcct gacatatgtt aatgtggcca aatagggcat ttcccagaca atccttatag 43860 tttcattctg tgctacttta aatgctgttc tccttccctg aaatgtcctt tttttttttc 43920 ttttcttttt ttttttttga gacagagtct cgctctgtca cccaggctgg agtgcagtgg 43980 cacaatctca gctcactgca acctccacct ccccggttta agccattccc ctgcctcagc 44040 ttcccgagta gttgggacta caggcgcgtg ccaccacgcc cggatacttt tttgtttgtt 44100 tgttttagta gagacagggt ttcactgtgt tagccaggat cgcctcaatc tcctgacctc 44160 ctgatctgcc tgcctcagcc tcccaaagtg ctgggattac agacgtgagc cactgcgcct 44220 ggctgtcctt tcttttaatc ttttcaaatt ctagccagtt catagcccac ttgctctgta 44280 aagctttttc agtgatcttt cttttgtacc atgcagtctt ttaaaaaatc tacagtttta 44340 ttataagttg ctaattatat ttaataaata cctaaatggt agaaattgat tcatttttta 44400 atctccgtag tgccaggaac tgtggctcat gtctgtaatc cctgcacttt gggaggctaa 44460 ggcgggagga tcgcttaagg ccaggagctt gagcccagcc tgtggaacat attgagaccc 44520 cgtctctaca aaaaataaat tagctgggca tagtggtgtc tgtatgtagt gtcaactact 44580 caggagactg aggcagaagg ataacttgag ctcagggagt tgaggccaca gtgagccatg 44640 atggtgccac tgtacttcag cctgggtgac agagcaagac caagaccgat aattatctcc 44700 atggtatttg ttttggacgt attagatatt cagtaaatat tttctggtga tgatagtgat 44760 atctaactac ctcaggttac ctaacctgaa taaggcctat ttttaacata gccattcact 44820 tgttaatttc tgttattttc gtgacttcat ttttactaat tatattttaa aagataattt 44880 tatataaatg caaaaacttt ttatcatgta acaatctggt aacaccttga gtaatttgtc 44940 atttcacatg cacattttat ttgttcatta tcttttttct ttttgtttat tttttctgtt 45000 ttttaccttc tctgttgcat agagaagatg caaccagttt tgccattttc caagtcacaa 45060 acggacgtct ataatgacag tactaacttg gcatgccgca atggacatct ccagtcaggt 45120 gggtttaggt taactaacat aaaataataa agcttgcatg caaagtaaga gtcttactta 45180 acctgataat gttgatttga ttttataatg gtaggtttaa ttgttcatgt tttcacaggg 45240 ctgtgttgaa aatatagtac ctttatcatc atagtatata aacatgcaac aagtcaggta 45300 tagtcattct aaacttgctt tatttgcata ttttgcaacc tctggttttt cagattataa 45360 aatatgaagg tatacattcc cgtaagtgat taaaataatc tttttttctg ttgtggcttt 45420 tgtgttttta tatggatagc tatactgatt tttttcatga aatagtgttt tctaagacac 45480 attttaattt tttatgtatc aatttttatt gcatatcaat tttcatttat agtatatgtg 45540 aatgtcttat agtacttgat agaagaaatt tgaaacttca catagtgagg agaaacatta 45600
18/66 cagtattatt tgctatggat taactctatc cttcataaac ttttggatat caacttctac 45660 agaagattaa atgtctttct gttttgtttt ctttgggtag gggactctcc atttcttagg 45720 ttctctgaca tctgagctag ctttttgttt aattaaaact ttttttttag ttgacagata 45780 atgtacctgt tcatggggta cacagtgatg ttttgataca tatagtatat ggtgattaga 45840 tcaaggtaat tatcatttcc atcatcccaa acatttatca ttccttgtgt tggaaacatt 45900 cagtattttc cttctagcat ttgaaatgat ataatatatt atattgttac ctataatcat 45960 cctgcagtga tgtagaacaa tggagcttac tctttctatc tagctatacc tttgtatcct 46020 ttccctaccc ttttcagcct ctagtatcct ctgttctact ttttatttct atgagattaa 46080 ctttttaaaa ataatattct gtgtgtatat ataccacatt ttctttattc attcgtctgt 46140 tcttggacac ctaggttgat tctgtatctt ggctgttgtg aatagtgctg cagtaaacat 46200 ggggtgtaga tgtctgttcg atatgatgat tttctttcct ttggataaat tcccaatagt 46260 gggattggtg ggtcatatgg tagttctgtt tgtagttttt gaggaacctc catactcttc 46320 tccatagtag ctgtactagt ttagattccc aaaagtagcg tataagagtt cactttctac 46380 acatcctcac cagcatttgg tacttttttt gtctttttga taatagccat cctaactggg 46440 gtaagatacc ttgttgtggt tttgatttgc atttccctca taattaacga tgttgagcat 46500 tttttcatat ctttgttttt gacggtccag ctagttttat tggttacttt tttttttttt 46560 ttttagcaat agtttcatgt gcagggctca aattatattt aatattactt ttttcaaatt 46620 ataccagaac aaccttaggt taggctataa aacaactgcc ttctttttct tttggcataa 46680 taattatata tatattttta attacacttt acgttctagg gtgcatgtgc acaacatgca 46740 ggtttgttac atatgtatac aagtgccatg ttggtgtgcc gcacccatta acttgtcatt 46800 tacattaggt atatctccta atgctacccc tcccctctcc cctcacccca cgacaggccc 46860 cattgtgtga tgttccccac cctgtgtcca agtgttctca ttgttcagtt cccatctgtg 46920 agtgagaaca tacggtgttt ggttttctgt ccttgcgata gtttgctcag aatgatggtt 46980 tccagcttca tccatgtccc tacaaaggac atgaactcat cctttttgat ggctgcttag 47040 tattccatgg tgtatatgtg ccatattttc ttagtccagt ctatcattga tggacatttg 47100 cattgattcc aagtctttgc tattgtgaat agtgccacag taaacataca tgtgcatgtg 47160 tctttatagc agcatgattt ataatccttt gggtatatac ccagtaatgg gatggctggg 47220 tcaaatggta tttctagttc tagatccttg aggaatcgcc acactgtctt ccacaatggt 47280 tgaactagtt tacgttccca tcaacagtgt aaaagtgttc ctgtttctcc acatcctctc 47340 cagcacctgt tgtttcctga gtttttaatg atcgccattc taactggtgt gagacggtat 47400 ctcattgtgg ttttgatttg catttctctg atggccagtg atgatgagca ttttttcatg 47460 =tgtcttttgg ctgcataaat gtcttctttt gagaagcatc tgttcatata ctttgcccac 47520 tttttgatgg ggttgtttga tttttttctt gtaaattttt ttaagttctt tgtagattct 47580 ggatatcagc cctttgtcag atgggtagat tgcaaaaatt ttctcccatt ctataggttg 47640 cctgttcact ctgatggtag tttcttttgc tgtgcagaaa ctctttagtt taattagatc 47700 ccatttgtca attttggctt ttgttgccat tgcttttggt gttttaggca tgaagtcctt 47760 gcccatgcca gtgcccatgc cagtgtcctg aatggtattg cctagatttt cttctagggt 47820 ttttatagtt ttagaactaa catttaagtc tttaatccat cttgaattaa tttttgtata 47880 aggtgtaagg aagggatcca gtttcagctt tgtacgtttg gctagccagt tttcccagca 47940 ccatttatta aataggaaat cctttcccca tttattgttt ttgtcaggtt tgtcaaagat 48000 cacatggttg tagatgtgtg gtattatttc tgagggctct gttctgttcc attggtctat 48060 atctctgttt tggtatcagt accatgctgt tttgattact gtaccttcgt agtatagttt 48120 gaagtcaggt agcacgatgc ctccagcttt gttcttttgg cttaggattg tcttggcaat 48180 gcaggctctt ttttggttcc atatgaactt taaagtagtt ttttccaatt ctgtgaagaa 48240 agtcatttgt agcttgatgg ggatggcatt gaatctataa attaccttgg gcagtgtggc 48300 cattttcatg atattgattc ttcctatcca taagcatgga atgttcttcc atttgtctgt 48360 gtcctctttt atttcattga gcagtggttt gtagttctcc ttgaagaggt ccttcacatc 48420 ccttgtaagt tggattccta ggtattttat tctctttgaa gcaattgtga atgggagttc 48480 actcatgatt tggctgtttg tctgttattg gtgtatagga atgcttgtga tttttgcaca 48540 ttgattttgt atcctgagac tttgctgaag ttgcttatca gcttaaggag attttgggct 48600 gagatgatgg ggttttctaa atatacaatc atgtcatctc caaacaggga caatttgact 48660 ttcttttcct aattggatac cctttatttc tttctcctgc ctgattgccc tggccagaac 48720 ttccaacact atgttgaaca ggagtggtga gagagggcat ccctgtcttg tgctagcttt 48780 caaagggaat gcttccagtt tttgcccatt cagtatgata ttggctgtgg gtttgtcata 48840 aatagctctt attattttga gatacatccc atcaatacct agtttattga gagtttttag 48900 catgaagggc tgttgaattt tgtcaaaggc cttttctgca tctattgaga taatcatgtg 48960 cA 02348657 2001-11-07
19/66 gtttttgtct ttggttctgt ttatatgatg gattacgttt attgatttgc atatgttgaa 49020 ccagccttgc atcccaggga tgaagccaac ttgattgcgt tggataagct ttttgatgtg 49080 ctgctggatt cggtttgcca gtattttatt gaggattttt gcgttgatgt tcatcaggga 49140 tattggtcta aaattctctt tgttgtgtct ctgccaggct ttggtatcag gatgatgctg 49200 gcctcataaa atgagttagg gaggattccc tctttttcta ttgattggaa tcatttcaga 49260 aggaatggta ccagctcctc tttgtacctc tggtagaatt cagctgtgaa tccatctggt 49320 cctggacttt ttttggttag taggctatta attattgcct caatttcaga gcctgttatt 49380 ggtctattca gggattcagc ttcttcctgg tttagccttg ggaggctgta tgtgtccagg 49440 gatttatcca tttcttctag attttctagt ttatttgagt agaggtgttt atagtattct 49500 ctgatggtag tttgcatttc tgtggaatcg gtggtgatat cccctttatc atttcttatt 49560 gcatctattt gattcttctc tcttttcttc tttattagtc ttggtagcag tctatcagtt 49620 ttgttgatct tttcaaaaaa ccagctcctg gattcattga ttttttgaaa ggttttttgt 49680 gtctctatct ccttcatttc tgctctgatc ttagttattt cttgccttct gctagctttt 49740 gaaggtgttt gctcttgctt ctctagttct tttaatggtg atgttagggt gtcaatttta 49800 gatctttcct gttttctctt gtgggcattt agtgctataa atttccctct acacactact 49860 ttaaatgtgt cccaaagatt ctgatatgtt gtgtctttgt tctcgttggt ttcaaagaac 49920 atctttattt ctgccttcat tttcttatat acccagtagt cattcaggag caggttgttc 49980 agtttccatg tagttgtgtg gttttgcgtg agtttcttaa tcctgagttc tagtttgatt 50040 gcactgtggc ctgagagaca gtttgttgta atttctgttc ttttacattt gctgaggagt 50100 gctttagttc caactatgtg gtcaattttg gaataggtgt ggtgtggtgc tgagaagaat 50160 gtatattctg ttgatttggg gtttagagtt ctgtagatgt ctattaggtc cacttggtgc 50220 agagctgagt tcagttcctg gatctgtctt gttgatctgt ctaatattga cagtggggtg 50280 ttgaagtctc ccagtattat tgtgtgggag tctaagtctc tttgtaggtc tctagggact 50340 tgctttatga atctgggtgc tcctgtattg ggtgcatata tatttaggat agttagctct 50400 tcttgttgaa ttgatccctt tagcattata tgatggcctt ctttgtctct tttgatcttt 50460 gttggtttaa agtctgtttt atcagagagt tggattgcaa accctgcttt ttttgttttc 50520 catttgcttg gtagatcttc ctccatccct ttattttgag cctatgtgtg tctctgcacg 50580 tgagatgggt ttcctgaata cagcacactg atgggtcttg actcgttatc caatttgcca 50640 gtctgtgtct tttaattgga gcatttagcc catttccatt taaggttaat attgttatgt 50700 ttgaatttga tcctgtcatt atgatgttag ctggttattt tgctcgttag ttgatgcagt 50760 ttcttcctag cctcgatggt ctttacaatt tggcatgttt ttgcagtggc ttgtaccggt 50820 tgttcatttc catgttcagt gcttccttca ggagctcctg taagcaggcc tggtagttac 50880 aaaatctgtc agcatttgct tgtctttaaa ggattttatt tctccttcac ttatgaagct 50940 tagtttggct ggatatgaaa ctctgggttg aaaattcttt cctttaagaa tgttgaatat 51000 tggcccccac tctcttctgg tttttagagt ttctgccaag agatcagctg ttagtctgat 51060 gggcttccct ttgtgggtaa cccgaccttt ctctctggct gcccttaaca ttttttccta 51120 catttcaact ttggtgaatc tgacaattat gtgtcttgga gttgctcttc ttgagtagta 51180 tctttgtggc attctctgta tttcctgaat ttgaatgttg gcctgccttg ctaggttggg 51240 gaacttctcc tggataatat cctgcagagt gttttccaac ttggttccat tctccccgtc 51300 actttcaggt acacccgtca gacatagatt tggtcttttc acatagtcct atatttcttg 51360 gaggttctgt tcgtttcctt ttactctttt ttctctaaac ttctcttctg gcttcatttc 51420 attcatttga tcttcaatca ctgataccct ttcttccact tgatcgaatc ggctactgaa 51480 gctcatgcat gcatcacgta gttttcgtgc catggttttc agctccatca ggccatttaa 51540 ggtcttctcc atgctgttta ttctagttag ccatttgtct aatctttttt caaggttttt 51600 agcttctttg caatggtttc gaacatcctc ctttagctcg gagaactttg ttattaccca 51660 tcgtctgagg cctacttctg tcagcttgtc aaagtctttc tctgtctagc tttgttccgt 51720 tgctggtgag gagctgtgtt cctttggagg agaagaggcg ctctgaattt tagaattttc 51780 agcttttctg ctctggtttc tccccatctt tgtggcttta tctacctttg gtctttgatg 51840 atggtgacgt acagatgggg ttttggtgtg gatgtccttt ctgtttgtta attttccttc 51900 taacactcag gaccctcagc tgcaggtctg ttggagtttg ctggaggtcc actccagacc 51960 ctgtttgcct gggtatcacc agcggaggct gcagaacagc aaatgttgca gaacgacaaa 52020 tgttgctgtc tgatccttcc tctggaacct tcgtctgaca ggggtaccca ggtatatgag 52080 gcgtcagtca gcccgtatgg ggaggtgtct cccagttagg ctacttgggg atcagggacc 52140 cacttgagga ggcagtctgt ccgttcgccg atctcaaact ccatgctggg agaactacta 52200 ctctctttag agctgtcaga cagggacctt taagtctgta gaagttactg ctgccttttg 52260 ttcagctatc ccatgtcccc agaggtggag tctacagagg cagtcaggcc tccttgagct 52320 cA 02348657 2001-11-07
20/66 gtggtggact ccacccagtt caagcttcct agctgctttg tttacccact caagcctcag 52380 caatggcaga tgcccccgcc tccagcctct ttgccgcctt gcagttcgat ctcagactgc 52440 tgtgctagca gtgagcgagg ttccgttggc atgggaccct ctgagccagg catgggatat 52500 aatctcctgg tgtgccgttt gctaagacca ttggaaaagc ccagtattag ggtgggagtc 52560 tccctatttt ccaggtacca tatgtcacgg cttcccttgg ctaggagagg gaattcccca 52620 accccttgcg cttcccaggt gaggcaatac cccgcccttc agctcacact atgtgggctg 52680 cacccactgt ctgacaatcc ccagtgagat gaacccagtt cctcagttgg aaatgcagaa 52740 atcagctgtc ttctgtgtcg ctcacactgg gagctgcaga ctggagctgt tcctatttgg 52800 ccatcttgga accctgcctt cttcattcat atgtaataca aaacttctaa ggttttagtg 52860 gagaagagat agagtaaaag gatttctata gacagaagaa acagttggtc atcaactctt 52920 tcccttgtgg cttcacatct cccctaagga cttcttatgt tggtttggtc ttacagtata 52980 gtcagtggca gtttccctct tcccattcct tcctctgtct gatttaaaat gctgtttcaa 53040 gtatcgatat aagtattttg cctgtttctt ttagcgtggc tgtgaagggc tgacattttc 53100 agaaggcact tactgaaaaa aaaaaaacaa agaaatgtaa gagtccatca catataaata 53160 gttaagtttc taaaatatgt atttgagatc ccagtaattc tactaggata aatagcaaaa 53220 attctccagc cctgaagagt tggtctgtct ttcctttcct tgttatcttg attctctttt 53280 atttcatttc acatgctaga ccccatcatg ttttcctgct gcattcccca ctccaccctc 53340 caaagcaatg ttctcttcct gcaacctgtt tgaaaaaatt gaactttgtc ttatttcata 53400 tccctagtac aagttgaata tccctaatat gaaatctgaa atccaaaatg ctctaaaatt 53460 cgactctttt ttttttgaga tgaagtcttc ctctgtcact caggctggag tgcggtggcg 53520 caatcttggc tcactgcaac ctccgcagcc tcccctaacc ccatccctgt gggttcaagc 53580 gattctccca cttcatcctc ccaagtagct gggactacag gcacctgcca ccacacccaa 53640 ctaatttttt gtatttttag tagagatgag gtttcaccat gttggtcaag ctagtctgag 53700 actcctgacc ttaagtgatc cacctgccct ggcctcccaa agtgttggga ttacagtcat 53760 gagccactgt gcctagccaa atatccaaaa ctttttgagc gctgacatga tgctcaaagg 53820 aaatactgga gtattttgca ttttggattt ttgggttaag gatgctgaac cagtaagtat 53880 aatgtaaaca ttgcaaaatg caaaaaaatg taaaaaccct aagcagttct ggtcccaagc 53940 atttcgcata agggatactc aacccataat cttttctttt ctgttttctg gttggaaggg 54000 catattggct ttatagctaa tttacacagc attgatgttt aatacacagt gagtccaagt 54060 agatcactca gacctattag tagtttatta gtgtcactca cttctggaac attctgtgat 54120 gttttacttg gatgagttct ttcacctctc ttgggaaata gtcataccaa agtctgctta 54180 ttactacaat gtgttatcta ttatacattg tccaattttc tactcaaaat tactagacag 54240 gcaaagaaaa agtaaagtat aacccttact caagaaaaaa aagcaatcag tagaaactgt 54300 gagtgggccc agatattgga tttagcagac aaagacttca aagcagctat tataatatgt 54360 ttaaagaatt gaaagaaaat atggtatcag ttaaacagga aatctaagta gatgatataa 54420 actagacaat aaaaataata ttctaaagtt gaaaagtgta gttactgaaa ttaaaaattt 54480 acagacaaca gcctcaacag cagattagag atagcaaaag aaagattcag tgactttgaa 54540 tgcaggtctg tagaaattac taaattgatg actctcacgt agcaactttc acccgtagtt 54600 tggtttcata tacaatgctt taactctttt tgctattttt tctcttactt tctgtgatgg 54660 aaacattttg tgctttgatt ttaatgggtg tatcacagtt atatacatct ttacaaactc 54720 atcaaattgt atactttatt tatatattta tttttttttg agatagggtc tgactctttc 54780 tcccaggctg gagtacagct gaaattagtt gggactacag gtgggcacca ctgtgccagc 54840 taatttttgt attttttgta gagatggggt ttccccatgt tggccagtct ggtctcaaac 54900 tcctgggctc aatcatttct gccgcctcag actcccagag tgttgggatt ataggtgtga 54960 gctactgtgc ctggctggta tagctttttt tttttttttt tttttttttg tgacagagtc 55020 tcactctgtc gcccagggtg gagtgcagtg gcgcgatctg ggctcactgc aacctctgcc 55080 tcccgggttc aacccattct cctgcctcag cctcctgagt agctgggact acagatgcgt 55140 gccaccatac ccagctgatt tttgtattct tagtagaaac agagtttcac catgttggcc 55200 aggatgatct cgatctcctg acctcgatcc acctgccttg gcctcccaca gtgctggcat 55260 tacaggcctg agccaccatg cctggctgtt ggtatacttt aaatggatgt aattcattgc 55320 agattatacc tcagtaaatt tttatttagt ttttgagact gagttgctct gttgcccagg 55380 ctggagtgca gtggcacgat ttcagctcac tgcaacctct gcctcctggg tttaagcgat 55440 tttcctgtct cagcctcccc ggtagctgga attagaggtg tgtgccacca tgatcagatt 55500 atttttgtgt ttttagtaaa gatggggttt caccatgttg gccaggctgg tctcgaactc 55560 ctgacttcag gtgatccacc cgcctcggcc tctcaaagtg ctgggattac aggtgtgagc 55620 caccacgcct ggccttaatt tttaaatact gtaaggctta taaagaaaag aatattcccc 55680 cA 02348657 2001-11-07
21/66 ttctgtttct ttcctctcac gtagcaacct tcacccctag tttggtttca tatacagtgt 55740 tttaactctt tttgctattt ttttctctta ctttctacta tatttccaaa tacaatgctt 55800 ctataatgat tccttttttt tttctatcag tttttgataa tcattgactc cttatggtca 55860 aagaagactt aattcccttc tgtcactctt catatattaa tataactaat atatatattg 55920 tttagttttg atataactaa aaataactat atgtatatat aactatatat gtataagcta 55980 tctgtatata gttatatatg tatatgcaca tacatatata gttacatatg tatacacaca 56040 tacatatata gttacatatg tatatgcata tacatatata gttacatatc tatatgcata 56100 tacatatata gttacatatg tatatgcata cacatatata gttacatatg tatatgcata 56160 tacatatata gttacatatg tatatgtata tgtatataca tatatagtta tatatgtatt 56220 agttatatca aaataactat gtatatatag ctgtaaatgt atatataaac tatatgtata 56280 cagttatata tgtatttgta tatgtgtgta tacatatata gttttttttg tttttttttt 56340 ttgttttttt tgtttttttt tggagatgga gtcttgccct gtcccccagg ctggaatgca 56400 gtggtgctat cttggcttac cgcaacctct gcttcccagg ttcaagcaat tctcctgctt 56460 cagtctcccg agtacctggg attacaggca cgtggcacca cgccaggcta attttttgta 56520 tctttagtag aaatggggtt tcaccatgtt ggccaggctg ttctcaaact cctgacctcg 56580 tgatccaccc gcctcggcct cccaaagtgc tgggattaca ggcgtgagca ccgcgcctgg 56640 tccctataca tatatagtta tatataccta tagttatttt tagttatatc aaaataacta 56700 tatgtatatg taactatata tatagtatat atagtatata tatactatat agtgtgtata 56760 tatagtatat atatactata tagtgtgtat atatagtata tatatagtgt atatatcgta 56820 tatacactat atactatata gtgtatatat agtatatgta gtatatatag tatatatagg 56880 atagtatata tagtatatat agtgtatata tactgtatat ataggtgtac atagtatact 56940 atatagtata catatagtac actgtatagt atatatagta tagtatatat agtatacata 57000 gtatactata tatagtatag tatacatagt atactatata gtatatagag tatatataca 57060 gtatactata tagtatatag agtatatata cagtatacta tatcgtgtgt atagagtata 57120 tatacagtat actatatcgt gtgtatagag tatatataca gtatactata tcgtgtgtat 57180 agagtatata tacagtatac tatatcgtgt gtatagagta tatatacagt atactatatc 57240 gtgtgtatag agtatatata cagtatacta tatcgtgtgt atagagtata tatacagtat 57300 actatatcgt gtgtatagag tatatataca gtatactata tagtgtgtat agagtatata 57360 tacagtatac tatatagtgt gtatagagta tatatacagt atactatata gtgtgtatag 57420 agtatatata cagtatacta tatagtgtgt atagcgtata tatacagtat actatatagt 57480 gtgtatagcg tatatataca gtatactata tagtgtgtat agcgtatata tacagtatac 57540 tgtatagtgt gtatagcgta tatatacagt atactgtata gtgtgtatag cgtatatata 57600 gtatactgta tagcgtatag agtatatata tagtatactg tatagtgtat agagtatata 57660 tatagtatac tgtatagtat atagagtata tatagttaca tatacatata gttattttta 57720 gtaatatcaa aaaaccatag ctaagatttt tatgatttag caaaatattg tttaccccaa 57780 agccacgtat tatatattaa tgatattttt tcccttttga gtttttcttc cccacaggtt 57840 ttctgatctt tttttttgtt ctctaacttt atattatagg tatatactct tttctctgtt 57900 taatttgctt tttaactaga agacctcctt tagtagttct tttagtgaat atctgtggtt 57960 aaactcttag tctttccagt gtctgaaata ccctcatttt aatgtgacag gtcacttttc 58020 tcacctcaac attttggaca tacctcattt ccaacaaaca tttgttactt ctgatagaga 58080 gtctgctgtc attctcatac ttgttccttg tggaaatgtc tatatataaa gtctcagaac 58140 tatatatttt taatatatat acatattttt atttatttaa aaatgtataa ttaagttagt 58200 agtagtagta gtagtagtag tagtagtagt agtagtagtt tttttttttt tagatggagc 58260 ctccatctcc cgggttcaag tgattctcct gcctcagcct cctgagtagc tgggattaca 58320 ggcacacacc accatgcctg gctaattttt gtattttgag tggagatggg gtttcaccat 58380 gttggccagg ctgatcttaa actcctgacc tcagatggac cacctgcttt ggcctcccaa 58440 agcgctagga ttacaggcat gaaccactgc gtctggcctt aagttattat tgactattga 58500 tgccctgttg ctctatcaag tagtaggtct tatttattct agaacctcgt tttaaggtat 58560 cctgaatgtg gctttttttt ttttttttcc taagacggag tctcactctg ttgcccaggc 58620 tggagtgcaa tggagtgatc ttggctcacc gcaatctctg cctccttggt tcaagcaatt 58680 ctcctgcctc agcctcctga gtagctgaga ttacaggcgc acgccaccac acctggctaa 58740 tttttgtgtt tttagtagag acggggtttc accacattgg tcaggcttgt ctcaaactcc 58800 tgaccttgtg atccgcccac cttggcctcc gaaagttctg ggattacagg cgtaagccac 58860 cacgcccagc ctaatgtgga ttttgttttt ttttttaact tgaattttat ttatacttcc 58920 tgattttata atagttaact tgtagtaaaa gtaaactggt tgtctaaata aataagctga 58980 tttcctatac tagtttagag tctttagttt tcttaaaccg tattaagaga tttgattaca 59040 cA 02348657 2001-11-07
22/66 aaagtaaaat tgaggctttt gtcttttttt ttggccactc taatttgctg actgacttaa 59100 catttgtctt cacagtaaac attgtaaata aacactgatg tttgttgcgt agtatgtaaa 59160 aatattattt aggagtggtg agatttaaac atttacaaac ctgtaatata tatagtacag 59220 caacactgga caaataacct tttcaactta atcagaggtg ttctataaat gttcatttgc 59280 atatatacag cccatataat acttagcata tgtaaaagca catctttata ctctttcaat 59340 taaaattgat tattattatt attttttttt tgagacagag tccctctcag tcacccaggc 59400 tggattgcag tggtgtgatc agggctcact gcaatcgggt agctggaact acagggatgt 59460 gccaccacgc ccagctattt ttgtattttt agtggagatg gggtttcacc atgttggcca 59520 ggctggtctt gaactccata cctcaggtga tctgcccgcc tcagcctccc aaatagctgg 59580 gataacaggc gtgagctact gcacccggcc taaaattgat tagtttttaa gaccctcttg 59640 gtgggaacag aptttcatag tgtttatagt tataatagtt tggaatcaaa gtagtcgagt 59700 gctacttttt tttcctctgt acatcctatc cctaatgcct ttactatatt ttgtttctta 59760 tttgagagct ttatttgctt cataactttt tttttttttt tttttttttg agacagagtt 59820 tcactctgtc acccaggctg gagtgcagta gtgcaatctc ggcttactgc aacctccgcc 59880 tcctgagttc aagtgattct cctgcctcag cctccgaagt agctgggatt ataggccccc 59940 accaccacgt ctgactgatt ttttgtattt ttagcagaga cgaggtttca ccatgttggc 60000 cagcctggtc ttgaactact gacatcaggt gatccgtcca cctcgatctc ccaaagtgct 60060 gggattacag gtgtgagcca tcgcgcccgg cgcttcataa cctttttata ttgtctttct 60120 gttccccaaa atgaagtagt ttcttcttaa aaatactgtt ttttgttttt ttgttttttt 60180 ttttatttga gatggaatct ctctctgtcg ccaggctgga gtgcagtggc acgatctcgg 60240 ctcacttcaa cctctgactc cgtggttcaa gcaattctcc tgcctcagcc tcccaggtag 60300 ctgggattac aggcacaaat actgttttta ataagaaaat tagaataggg acaggcacaa 60360 tggctcactc ttgtaatccc agcactttgg gaggccaagg tgggaggatt gcctgagccc 60420 aggagttcga gaccagccta ggcaacatag tgagtgagac cctgtttcta taaaaaaaat 60480 ttttaattag tccggtctgg tggtgcacaa ctgatgtccc agctacttgg gagtttgagg 60540 tgggaggatg gatcacttga gcccaggaag attaaggcca caatgagctg tgatcatgcc 60600 actgcactcc agcccaggcc acaggtttca aaaaaagaga aaattagaat tatacgttag 60660 ggggaaaaaa cctaataacc atattcctat ctacctagtg accaccccta tgaagatcct 60720 ggtacatgtt ctcattgaaa tcttattttg aaatattttt gaattaaaaa aatatattat 60780 taccttggtt ttacaaatgt ttgcttgtct ttatgttcag ctacaatttt ctaatcacaa 60840 tggttttact ttttccttgt cagaaagtgg agctgttcca aaaagaaaag accccttaac 60900 acacactagt aattcactgc ctcgttcaaa aacagttatg aaaactggat ctgcaggcct 60960 ttcaggccac catagagcac ctagttacag tggtttatcc atggtttctg gagtgaaaca 61020 gggatctggt cctgctccta ccactcataa ggtattctgg gacagtaact ttaattgctg 61080 tctttttgca aatagaaaaa tttttaagat actattcctg cttaagttga tcataagtac 61140 tttataatac tttagagaat ggataagttt ccataaagtt aaattttttt tttttttttt 61200 tgagactctt gttttccagg ctggagtgca atggcgcgat ctcggctcat tgcaacctcc 61260 gcctcccagg ttcaagcgat tctcctgcct cagcctccca agtagctggg attacaggca 61320 tgcaccacca cgtcgagcta attttgtatt tttagtagag acggggtttc tccatgttgg 61380 tcaggctggt ctcaaactcc cgacctcagg tgatccgcct gcctcagcct cccaaagtac 61440 tgggattaca ggcgtgagcc accgtgccca aagttaattt ttttttaaat ccacagggca 61500 acttgctata aaactttttt tggacctcat tagacattta ataccaagtt ttgcttaccc 61560 agtctgtttt atataatgct gtatatttca ttttaaattt atttttaaaa ttatttcaat 61620 ctttgtaaat gttttatacc agtaacatac ctagagtttt gtcatgattc taacaagggt 61680 taaaatttgt ttttattttg taaaaactaa atctctggat aaaatcctct ataactgact 61740 taatgccaaa tatagttctc tagtgaatac agttttacct tcaggtaaat aaatatacaa 61800 tttatggatt tttataccct ttttcctatt tttaaagctt gaattctgtg aactttaagg 61860 ttaacttatt tatgaaaagt gtaaatgtta ggttgtattt tcatattaaa attttgtatc 61920 ctttaagggt actccgaaaa caaataggac aaataaacct tctaccccta caactgctac 61980 tcgtaagaaa aaagacttga agaattttag gaatgtggac agcaaccttg ctaaccttat 62040 aatgaatgaa attgtggaca agtaagtttt gccatctaaa tgttttattt tatagttttt 62100 atattttaat tttacttata aaacatgtca ggagtgaaat agataataaa taccttgtct 62160 ggtttacata cttaattttt atgatagttt tcaattataa atgtagaaaa ccattgcttt 62220 actgatttaa ctatagttta acagttaaca ttaaaaataa ctatatgtca tagggcttag 62280 gcttcatctt gtaataactg ggccctgttt gtatcgtaga actaactgag gtcttgtttc 62340 ttagtggaac agctgttaaa tttgatgata tagctggtca agacttggca aaacaagcat 62400 = CA 02348657 2001-11-07
23/66 tgcaagaaat tgttattctt ccttctctga ggcctgaggt aagaacttta tattatcatt 62460 tttctataat accatctgtt actgaatcca tagtagtagt agtagtaaag aaatatttga 62520 gctatactaa aataattaat tcatataagg taacaataga tttaatgttt taaaaaagat 62580 aaaacattaa caattgatgt tgagaagtta ttatagaata ggaaaatgga tatgagttcc 62640 taatttccaa tccttttata tttttaggaa aagtgggtag tatgatataa ttttgttttg 62700 ttttggagac ggagtctcac tcattgtgtc gcccaggctg gagtgcagtg gcatgatctt 62760 agctcactgc aacctctgcg tcccagaatt caagtgattc tcctgcctca gcctcccaag 62820 tagctgggat tacaggcatg tgccactatg cccagctaat ttttgtaatt ttagtagaga 62880 tggggttttg ctatattggc caggctggtc tttcatacct gatgtcaagt tatccaccca 62940 tttcggcctc ccagagtgtt aggattacaa gtgtgagtca ctacatctgg ccaaattttg 63000 atatcaaggt gagagagatt taaaattaag ataaggtaca aaaattagcc tagtgtgggg 63060 gcgcacgctt gtagtcccaa ctactgggga ggctgtggca ggagaattgc ttgaaccagg 63120 aggcagaggt tgcagtgagc caagatggca ccactgcact ccatcctggg tgacagagcg 63180 agatgtcatc tcaaaaacaa aacaggccgg gtacggtagt tcacgcctgt aatcccagca 63240 ctttgggagg ctgaggcggg cagatcacga ggtcaagaga ttgagaccat cctggctaat 63300 atggtgaaac cctgtcttta ctaaaattac aaaaattagc tgggcttggt ggtgtgtaac 63360 cccagctact cgggatgctg aggcaggaga atcgcttgaa cccgggaggc ggaggttgca 63420 gtgagccgag atcacgccac tgcactccag cctggcgaca gagcgagact ccgtctcaaa 63480 aaaataaata aaaatttaaa aagataaata cataaaaata aataaataat attaagagaa 63540 ggaaatcagg caggtagtgg cccctgacac aatgagtttt cccagaattg gattgcttgg 63600 aaatgccgct caaagagtgt ggtaaactcc atcgaaggct aaataccaac gtgacagtga 63660 taataaacaa gtactttatg ggaaagtttt ttttttaatt atttttaaaa agagagaaat 63720 tgtactggag aaaagaggaa ttcaggtaga ataattcttt tttttttttt ttttgagatg 63780 gaattttgct cctgttaccc aggctggagt gcagtggctt gatgttggct cactgcaacc 63840 tctgcctttg gggttcaagt gattctcatg cctcatcctc ctgagtagct gggtctatag 63900 gcatgcaccc caacacctgg ctaatttttg tgtttttagt agagataggg ttttaccatt 63960 ttggccaggc tggtctcaaa ctcctggctt cagatgatcc gcccaccttg gcttcccaaa 64020 gtgctgggat tacaggcaga ggccactgtg cctggcatga agaacaattt ttaaaagaat 64080 gacttttaag gatattaagt catcaaagta gatagagcca ttaaatgatg ggtagaaacc 64140 taatcttcca tcccatattt tatgacttat taaggaagat aggcaatctt gcagttgata 64200 ataaatattt ggctttccat acttagcacc gttttgaatt tttccagttc acagatggta 64260 tatttagtgc tgttccaata atattgcaaa aaataaatct gaagactcac ttctgggtca 64320 cagttatttc actattaaca ttaaaatctt acggacctac ctgcaacatg tagtggaaat 64380 aagttgtgtg gcacgttgtg gtgggtgcat tattaaataa atgtgcaaag gttttatggc 64440 tgtctcaatt tttccatagt cttgagtcat tcacatactg cctttatggt gtttatcact 64500 tgtaagtgag taccaactgt actagaactt actgaatatt tttcaagtct attttactta 64560 ttactcattc taagtacata aaatcactgg tctgatatgc aagttaggtt ttcgctaata 64620 cccagtaaaa taattagata attattaaaa tagaaagcat ttgtcattat gtgaactgga 64680 tttatgtcat gtaccacctc aggtcacact ttgggaaacg tagcttacgt attgagctaa 64740 cattttgctg gagttatata agattagtaa atgctataga ctaaatattg aaaaaaaagc 64800 ttgcttaaag aggatttaca taattgtaga cctgaaaagg atcttagcag tcttctgatc 64860 gattcattga taaagaaact agtcctaaga gctaaaatga cttgctcaag attttagtta 64920 agtggtagac ctaggaaata cctttctaag attagagctg cctggttagt gctatagctg 64980 ccacctaatt cttacattta tttattaagg gacatgcttt ttacggtaga aaaatatatc 65040 taaaattgtg aaggtaatac caaggaaata tttaggctat gcaagaaaag tcattcagct 65100 tttgctttac ccaggcctat agagaacata tctaaaataa taagtaacat gtgaatttga 65160 atttaggcat attttcatgg tagtgacata atgtgcaatt aagaagctat aataatgtaa 65220 aaatgccagt tgcaagttat ttcaaataaa gttgaataac ctgacctcag gaggggcaga 65280 aaccttagta aacttagcaa actgagacct aaggaagagc aagatctgtg gtagagccag 65340 gtctaaaggt ttatatcctg gtacaaactt gtctatacat caccacacct gccaaatgga 65400 actttttttc cttgtagttc agatttccaa gaaagggaat attattgtcc tagctcagcg 65460 tttcacaata gactcacaaa atgaatcttg ttaagcctat gaatgggtaa gacttatccc 65520 ataacacgcc tctattgtgt aaaaaaatca gctttattcc taattccctg tagtaggaag 65580 cttgcataga ccacaataga gacattgtta gattatatca agaaggtgag tggcaggcat 65640 tcttgagtat actggaattt ttatttcatt gtagaaacac agaatcataa ttagtcatct 65700 aaaactggtt ttaaggagat aatactaaag atactcactt gaggtagatt gttctcagaa 65760 = CA 02348657 2001-11-07
24/66 ttacttaaaa taagtgcttt aaatcttgct cattcatgaa gccatagccc tggaaggaga 65820 tattgaaaaa cttctccatc ttccttcaat cccataggac catgttttta attgtagttt 65880 aacattaaac ataatttttg aaagtagcca atattaatct ttgacaaaaa actcaaacta 65940 aatagcagaa aatagaacat gccctctcct ctcgcccaaa agtaagacta cattttaaag 66000 tatatcacag tgatctgtct aaatattttt ctcaaatatt ttactaagaa agcgtatatt 66060 cttctgtcct tatttcatag atctcttctg tatcctgtgc agcttgtcta tcatttcgag 66120 cttttatatt tcttattttg ttctcttgct gcttaaatgt gattctttga gatttataga 66180 agaatgtgat tgttctccag ttttaaaaag ctcttctcta tctactaaaa tttccatgaa 66240 tttctttctt tctttttttt tttttgattg agacagtctc gctgtgttct ccagcgtggc 66300 cttaggctta agtgatcctc ctgtctcagc ctcccaagta gctgagatta cagaaatttc 66360 catgaatttc caaatatgat gttatctttc atataagctt aaacataagc ctttcttctt 66420 tcaaaaatgt tagaacttac ctctttaaat aatcttataa agccatttct taatttttgt 66480 taccttttcg aatctattaa cttgcatatc atagtaaatg aacccttagc tccatcatac 66540 cacacacctt ctactcctgt cctcccactt tttctcaccc aggctggagt acagtgaata 66600 tttagtgctt ttaaatatta ttcattacca agccaagtag cgtactattt tttccttgta 66660 cagccttttt ttcccctaaa taattgtgtt attttttcat ttgcttcatt ttcatcttat 66720 cgattgataa ttcttctgtt ccatttcagt ctaatttcca catggccaaa ccaatctaaa 66780 aacctgttaa ctcaggtctt tttttttttt ttttttccca gaataccttt tcctggaacc 66840 accttcttct tttcattcga gaccaaatgc tttccatgcc tgtgtcaaag tggttgttct 66900 ctaatctgtc ttcactacca tcataatttc cttttccttt tttcctttct ttattatgta 66960 tctcctgtct tttaaattcc atattttcca ctttcatgat ttattttctc attttgatgg 67020 ctacatcttt cagtaactga gaaaaggttg tgtgagggaa tattttgaga tgctgtagtt 67080 ttgaaaatat ctttattctg ctgtcttctc attaataatt tgactggatg tcaagattta 67140 agttggaaac tattttccat gagtattttg aaggcattat ctattgtctt ctagcttcca 67200 gtgctgcttt gtattagaga cagaagatca ggaatcagga tagcattgga cttcttattt 67260 ctatttccca aagctttttg gatcttctct ttattcttat cttctgatat tttataatga 67320 tatgcttgat gcatttactt tttcttttct tcttccctct tgtacatttc tttctttttt 67380 taggtggggg caggggggaa ggagtctcac tcttctcacc caggctagag tgcagtggtg 67440 caacctcagc tcactgcaac ctccacctct ggggttcaag cgattctcct gcctcagcct 67500 cccgagtagc tgggattaca ggcatctgcc accacgccca gctaattttt gtatttttag 67560 tagagacggg gtttcaggct ggtcttgaac tcctgacctc aggtgatccg ccctcctcag 67620 cctcccaaag tgctgggatt agaggcatga gccactgcgc ccagcccctc ttggaccttt 67680 ctagatattc atccttcaat tctgagaaag gttctataat tctttaattt aaaaaaagtt 67740 tttttgtttc atctttctca cttttttttt tttttttttt ttttaagaca cagtcttgct 67800 ctgtcaccca ggctggagtg cagtggtgcg atctcagctc actgcgccct tcgcctcctg 67860 ggttcgagtg attctcctgc ctcagcctcc caagcagctg ggattacagg tgcccaccac 67920 caccatgccc ggctaattgt tgtattttta gtagagacgg agtttcacca tgttggccag 67980 gctggtttca aactcctgac ctcaggtgat ccacctgctt tggcctccca gagtgctggg 68040 attacaggca tgagccaccg tgcccagccc tattctgatt tcatagatgc agtgtctttt 68100 atgtctctga gaggttttgt caagttttct tttgtttact ttattatctg tttcttcaag 68160 attcctcctc ttttcttttt gccttaagct ttttcatatt ggaagcttct ctcaaatgtc 68220 tggttattct ggttgtccac ttatattacg tggaacaata aaaaagttga ttaggactct 68280 gtgctgtaag taagtaaatt gttgatagtg agagcccatt aatcacagga tgatcaagca 68340 gcaagcctac tgtttatttg ggtttctcca aatggctata gctgtcagtc ttttttttct 68400 ggggttattt ggcttctcta gaaaagaatt ttctagtctc ttgtttggag aatacaagct 68460 tgactattgg tgttccagaa aatgggtggg aggagacgac tttgttttct gttaggttga 68520 gccatgtgaa attactaggt tttgttttgt tttctgtttt gttttgagac agagtctcac 68580 tctgttgccc aggctggagt gccttagcat gatcttggct cactgcaacc tctgcctccc 68640 aggttcaagc aattctcatg cctcagcctc ccaagtagct gggattatag gcatgcacca 68700 ccacgcctgg ctaatttttg tatttttagt agagacgggg ttttgccatg ttgaccagtc 68760 tagtctcgaa ctcctgacct caggtgatcc acctgccttg gcctcccaaa gtgctgggat 68820 tacaggtatg agccaccaca cctgggctga aattactgtt tttataggtc aaaaacagtt 68880 gagggatagg catggtggct cccacctata atcccagcac tttcagaggc caaggcagga 68940 agattgcttg agtccaggag ttcgacacca gcctgggcaa tgtagtgaaa ccccatctat 69000 atttaaaaaa aaaaaataga tgaatatctt tgtttgcaga taacatgatt gcatatgtag 69060 aaaatcccaa agaaccaaca aaaagagctc ctagaactaa taagtgatta tgacaaggtg 69120 cA 02348657 2001-11-07
25/66 tagaatacaa agttaatata caaagtcaca ttgctttttt atctaccagc agtgaacaac 69180 tggaatttga aattaaaaca caatactgct gggtgcagtg gctcacacct gtaatcccag 69240 cactttggga ggccgaggtg ggcagatcac ctgatgtcag gggttcaaga ccagcctgac 69300 caatatggtg aaaccccatc tctactaaaa atacaaaaat tagctgggca tggtggcggg 69360 tgcctgtaat ctcagctact caggaggctg aggcaggaga atcgcttgaa cccaggaggc 69420 agaggttgca gtgagccaag atcgcgccat tgcactccag cctgggggac agagcaagac 69480 tccgtctcaa aaaaaaaaac acaatacctt tcatattaac actaataaaa tgaaatatgt 69540 gtagttctaa caaagtttgt tgtagaagat ctatatgaga agaattatag cactcatgaa 69600 agaaatcaaa gatctaagta aactgagaga tattccatgt aaatggacag ggagactaaa 69660 tattattgag atgtcagttc ttcccaagtt catatatcga ttcagtgcag tcccagtcaa 69720 accccagcca gttattttgt ggatactggc aaactaaagt ttatatgaaa aggcaaaaga 69780 cctagaacag ccaacacagt attgaagaag aaaaaagtca gaggactgaa actacccaat 69840 ttcaagactt actgtaaagc tacattaatc aagacagcat gtcattggca aaagaataga 69900 caaataaatc agtagaattg gacagagagc ctagaaatca acccacacag ataaagtcaa 69960 ctgatctttg gcaaagggac aaagacaatt cagtggagaa aagatagcct tttcaacaaa 70020 tggtatagga caactggaca tccacatgca aaaaagttaa tctagacaca gacctgacaa 70080 ctttcacaaa aataaatgga tcatagacct aaatgtaaca tgcgaactga aacttctaga 70140 ggataacata ggagaaaatc taggataaca tgagaaaaat ttttggtttg gcagtgactt 70200 cttaggtaca ataccaaaac atgatccttg aaaaaaaaaa tcagtatgtt gaactttgtt 70260 taaattataa acttctgctc tgtgtaagat gctgttagga gaatgaaaag acatgcagca 70320 gagtgggaga ctttacaaaa ttcattatct gatgaaggac cagtatccaa aatatacaaa 70380 gaacttttaa aactcaacaa taagaaaata tacaacccag ttaataaatg ggcaaaatat 70440 ctgaacagac acctcaccaa ggaagataga tagatgacaa caagcatatg aatatatgct 70500 caacatcatg tcgttaggga aattgcgcat taaaacaaca acaagatacc ctgccatccc 70560 tattagaatg gctgaaatct aaaacactga caacaccaaa ttctggcagg gatgtggagc 70620 agcagaaact ttaattcatt gctgatggaa atctaaaatg gtagaaccat tttggaaggt 70680 agttggacag ttttttacag aactaaagac agtttgacag tttcttacaa aactcttacc 70740 atatggtcca gcagtcttac tccttagtat ttacccaaat aagtttaaaa tgtacatcca 70800 ataaaaaaaa ctgcacatga atatttctag cagcattatt catagttgcc aaaacttgga 70860 agcagtcaag gcatccataa gtaggggaat ggataaacag actttggtat atcatgtaat 70920 ggagtattat tcagcaataa aaagaaatga tctatcaagc cacaaaaata tatggaggaa 70980 ccataaatgc atattgctaa atgaaagaag ccagtctgaa gaggctacac tataggattc 71040 tgactatatg atgttttgga aaaggcaaaa ctatggaaac agtaaataga tcagtggttg 71100 ccaagggaga cagggagaga tgaataggtg gagcacagtg gatttttaag gcagtgaaac 71160 tgttctttat gataatccaa tggtggatac atgtcattat acctttgtca aaacccacag 71220 aatataaaac ataagagtga accctaatgt aaaatatgga cttcagttaa taataatata 71280 tgaatatttt ttcattagtt ctaacaagtg tactacacta atacaagata ttcagagtag 71340 gggaaattgg aaaggaatga gaggttatat gggaactctg tactttctgc tcaattttct 71400 gtaaacctaa aatcactaaa aaaaaagttt atttttattt ttattttttt ttaattttta 71460 attttttgag atggagtttc actcttgttg cccaggctgg aatacaatgg cacgatctcg 71520 gctcactgaa acctccgcct ccagggttca agcgattctc atgcctcaac ctcccgagta 71580 gctgagatta caggcatgtg ccaccacgcc cagctaattt tgcagtttta gtagagacag 71640 ggtttctcca tgttggtcag gctggtcttg aactcctgat ctcaggggat ctgcccgcct 71700 cggcctccca aagtgctgtg attataggcg tgagcagctg cgcccagcag gttttttttt 71760 ttaagttgga tattagccat ttcatatgat tcaacttaaa agtacataca ccttcactgt 71820 tattaaagtg taggtgagat gttttcagtc tggagctcta cccttgattc ctgccatgcc 71880 tagtgtccct gaatctggag actctgactt atttctttag agaacgaaac tcctgccttc 71940 tgctttggtg gtgattggta cctgcttgac tgcctttggt ggggagttcc tcataccaac 72000 tttcaatcag ttcctgtgtt tgtttgtttg tttgtttttg agacggagtt ttgctctgtc 72060 gcccgggttg gagtgcagtg gcgcaatctt ggctcaatac acgctccgcc tcccgggttc 72120 acgccatttt cctgcctcag cctcctgagt agctgggacg acaggcaccc gccaccacgc 72180 ccggctaatt tttttgtatt tttagtagag acggggtttc atcgtgttag ccaggatggt 72240 ctcgatctcc tgacctcgtg atccgcccgc cttggcctcc caaagtgctg ggattacagg 72300 cgtgacgact gtaagccacc gtgcccggcc agttcctctg tttttgactg cctgccttac 72360 tactgctttc tgtggtgcct gataacatcc aattcctgaa ccttcctggg atttttgttc 72420 acgtcagcgt gcttcttgca tttaggtatc ccttcacaag taggcattta ggttttaagc 72480 cA 02348657 2001-11-07
26/66 tctgctaagt gatttaccac actttatcag ttctccattt tgtggaattc attgtgttaa 72540 tctccttttc tatttttgtt tggaagattc atatattttt tattcattta gtattttttg 72600 gtgggatttc taagtagaga aacatgccta tgttcaatat gtcttgttta agcagtctgc 72660 tttcattttt accaccgagg agttggtttt atttcttttt tttttttttt tttttttttt 72720 ttttgagaca gggtctcact ttgtcagcca ggctggagta cagtggcaca atcaaagctc 72780 actgcaccct tggcctccca agctcaagtg atcctcccac ctcagcctcc tgaatagctg 72840 ggagctcagg tgatccagca cacccagcta attttttttt tttttaattt tttgtagaag 72900 cagagttccc ctatgttgcc caagctggtc ttgaactctt gggctcatgt aatcctcctg 72960 tctttgcccc ctaaagtctg ggattacagg tgtgagccac cacacccagc tgtttttaat 73020 tattacatta atttatgatt atgtgtttcc tttaaagcta tgggcagctc tgtttgggaa 73080 gatgctactg aaaaaaggat gctttttaga tggcaaagag tacttaaaat gtctctagaa 73140 tcatagttgt aaactaaagt atatattttt tagttgttca cagggcttag agctcctgcc 73200 agagggctgt tactctttgg tccacctggg aatgggaaga caatgctggt aagggttctc 73260 ttcaaatttg agttttctgt tgagatattt gggataatat gaaaaaaaga aactttatct 73320 tgtccttgag tctattattt acgacttgct ttttgctatt gtacactttt gttttttttg 73380 tttgtttgtt ttgttttgtt ttgagtgatc tgggctcacc gcaacctccg cctcctgggt 73440 tcaagcgatt ttcatgcctc agcctcccaa gtagctggga ttacaggcac acgccaccac 73500 acctgtctag gttttttatt tttggcagag acaggatttc gccatgttgg ccaggctggt 73560 gtcgaactcc tgacctcaag cagtcctcct acctgggcct cctaaagtga tgggattaca 73620 ggcatgagcc actgcacctg gctgatacac ttttaagttt ttcagctact tttcaatgta 73680 gaagtagatg gaaaaccatg tacgttatct tcagtagtgt gtttttggtt ggttaaattt 73740 gacagtatga ttgtcattat tttttgtaaa ttaaattttt acctggaaga gcttacctta 73800 ctatattgag tatctttcta acccctgatt tttgcttcta ctatcataat aactttattt 73860 aagtaatcag tatgttatag cttttttttt tttttaagta ttcttttgcc agaagttttt 73920 atcaggctct ggatacctct ttcctctgca tagtcctcct ggatggaaga aacaaagagg 73980 gaaagagtaa cttttcctta gatgtttgtc tttctcaaag cagttatctt tgtatatcta 74040 agaagagagg agaataacac tgtctctctt tttttttaaa tctctctcta ctcattctct 74100 ctcaggagga gagtagaaag aagcacagct cttcctataa cctgtcctta ttactgagaa 74160 aggaacacat tgattgccat gtattgggga ttgtattata ccttacattt ttatttttat 74220 tttttattaa tttttttttt tagacagtct tactctatca cccaagctgg agtgcagtga 74280 tgtgatctcg gctcactacc atctcttcct tctgggttca agcaattctg ccacgtcagc 74340 ttcctgagta gctgggatta caggcatgcg ccaccacgcc tgactaattt ttgtattttt 74400 attagagatg ggatttcacc atgttggcca ggctggtctc aaactcttgg cctcaagtga 74460 tgcgcctgcc tcggcctccg aaagtgctgg gattacaggc atgagccacc acacctggcc 74520 tcatagctta catttttaga gaatcttttc tagtacttaa atcggtaaat atggttatct 74580 tttaaatgta atatattgaa ctaatttaat atttgctctt gtgattttta aaggctaaag 74640 cagtagctgc agaatcgaat gcaaccttct ttaatataag tgctgcaagt ttaacttcaa 74700 aatacgtgag tgctctgttt ccaatattgt cgtattttaa gttactgtct aaatgttact 74760 gtgttaactg taaatggtaa tatttcatga aaatattttt ctaggagctt atctattgta 74820 tctattattt acatatgatg aatatctatc ttcagagtag aaagttatgt acatttgtgt 74880 tgtcaaatac tgtattagtt tactggggcc atgtaataaa ataccgtaaa ctggctggct 74940 taaacatcag caatttattg tctcacagtt gtggaaggta gaagtctaag atcagtcaaa 75000 atgttggcag ggttgcttcc tcctgagggc tgtgagggaa aatgtatgtt gtgtgcctct 75060 ctcctggctt ctggtggctt gctggcaatc ttttgtattc cttggcttgt agatgcatcc 75120 ctcctatctc tgtctttatc tttatgtggc attctccctg tgtctgtcac catgtccaaa 75180 tttcccctgt ggattaggac ccaccctaat gatctcaatt taagtttgtc atcagcaaca 75240 attctatgtc caaataatgt cacattcata ggtactaggg ataggacttc aacacgtttt 75300 tggagaacac agttcaaccc attaacaaat actatcactt tccacttaag cttcaagtaa 75360 agtggatttt atctcaagga gccaccagat aggaacacag atctgatggc ataaactgag 75420 tatttctggc cttctgattc tgatctaaaa tatgacagaa gattttccct gttttaattt 75480 tttttttttt tttataatag agacacagtc tcgctatgtt gccaggctac tttcaaattc 75540 ctgggcttaa gcaatcctcc tgcctcggac tctcaaagtg ctggaattac aagtgtgagc 75600 accacacct ggccagtaga ttttccctgc tttcttttga ttgtttataa ttttgttttc 75660 ttttccatt caccctctgc tgaccctata gtattattca aagaagtgtt cagtctagtt 75720 ttggggtagg gcaagcataa ctacagtgct taaagagagt aatttgtctg gtgtgcagaa 75780 ctagtgtgta aatataactg gtgcattgca aaactgtgaa gtagtttctg tcaaacctta 75840
27/66 cactgctttg tctttctccc tctctccctt tctcttggtt gccccctccc cctcccaatg 75900 ataccttagt ctctgcttgc ctttatcaaa acctttatga ttggccgggc acagtggccc 75960 tgcctataa tcctagcatt ttgggaggct gaggcaggaa gatcacctga gcccagaagt 76020 tggagaccag cctaggcaac atggtgaaac cccatctctt ccaaaaataa aaaatagagc 76080 caggtgtggt ggcatgcacc tgtagtccca gctactcagg aagctgaggc gagaggatct 76140 cttgagcctg agaggttgag gctgcagtga actgtgatca tgccactgca ctccagcctg 76200 agtgacagtg tgagaccctg tctcaaagaa acaaaacaag ggggggcatg gtggctaact 76260 cctgtaatcc cagtactttg ggagactgag gcaggaggat tgcttgaggc caggagttca 76320 ataccaccct gggcaacata gtgagacccc catctctaca aaaaataaaa aatttagctg 76380 gacatgccag cgaatacgtg gtcccagcaa atcaggaggc tgaggtggga ggatcacttg 76440 agtcaaggag gttgaggttg cagtgagcca cgatcatgcc aatgcattcc aacctgggcg 76500 tcagagcaag accacgtctc aaaaacaaaa caaaacaaac ttttatggtt gaaagtgttt 76560 tggcaaacat acttaaactg aaatgtgaat ctctgatgaa agaacatgtt acctgtaaaa 76620 gtttgaagtg tcagcatttg ttgcaccgaa atccagaggt gaggccaggt gtggtggctc 76680 acgcctgtaa tcccagcact ttgggaagcc aaggctggca gatcacctga ggtcaggagt 76740 tcaaaaccag cctggccaac attgcaaaac cccgtctcga ctaaaaatac aaaaattagc 76800 cagacttggt ggtgtgcgcc tgtaatccca gctattcggg aggctgagac acgagaattg 76860 ctcgaaccca ggaggcagag gttgcagtga gccgagatgg caccactgca ctccagcctg 76920 ggcaactgag tgagactctg tctcaaaaaa aaaaaaaaaa aaaaatccag aggtgaatcc 76980 agaggtgatc accacatgat atccagatag cctctttcca tgagaggctc aaaggataat 77040 tttactgtct acagttttgc agcgagagaa acttgatttt atcagtacac caagagcaga 77100 tctatgtctt cggaacagac atgagatcag aattgtctag ctgctatgaa cagcatgttc 77160 tctccctgta cctatagaca tgtatgggaa acttatttgt aaggttgtat aatgagcagt 77220 gagttaaagc aaacttgaca tgttgaccat agttgttatg gcattggact aaagtagcct 77280 ccatcactat gatagagata gccttggtgt tggacccata gtttttgaag tctgtttgct 77340 aagactccct cttccttagg cagttcttca aatattatta tgctttttcc tgtcatggga 77400 ttcctcttca tggagtttcc tttctcagga acactatctt ctcctggtta atttgtactt 77460 attcttcaga taccagttga aatgttacaa ccttccctga ccctccaaac tattccccgt 77520 tattattctc ctagcaccac ttgcacctca ttttcatact cactggagtt gcaattcata 77580 ttcattgata ggattatttt aattgtatct gatatcactg tcacctccac tagaagatgg 77640 tctccatgcg ggcagagact atcaccatgt gttcttcact tcaattttca gtagttggct 77700 gtgagtaggt attgaataaa tatttgtgga gtaatcataa tgaggtatag atattattct 77760 catagctcta ttttattaat tagggaatta cagaattcag tgatctgctc aggatctcat 77820 aaccaggaag tgggaaacta ggatttgagc tccagtgagt gtggcctttc attaaaaata 77880 ttacagcaac cattctcttt tttttttttt ttttttttga gatggagtct tgctctggag 77940 tgcagtggcg tgatctcggc tcactgcagc ctctgcctcc cgggttcaag tgatccccct 78000 gccttagcct gctgagtagc tgggactaca ggcacccgcc acgacacttg gctaattttt 78060 gtattttagt agaggcgggg tttcaccatg ttggccagga tggtctcgat ctcctgacct 78120 tgtgatccgc ccgcatctac ctcccaaagt gctggattat aggcgtaagc caccacaccc 78180 ggcctacagc aaccattctc ttttatccat acttttttca agagtactgt ttcatcttca 78240 tgttttcaga aacaacatag cattcatgat cttaaccccc aattctgata ctgcctgaat 78300 atcttgaagt aagtttactt ttaagaaagt tgaggctagg tgtggtggct catgcctgta 78360 atcccagcac tttgggaggc caaggcaggt ggatcacttg agctcaggag ttcaagacca 78420 ggctgggcaa catggcgaaa ccctgtctct accagaaata caaaaaatta gtcgggcgtg 78480 gtggcgtgtg cctgtggtcc cagccacttg ggagactgaa gtgggaggat ttcttgagct 78540 tgggaggtgg agtttgctgt gagccgagag atcatgccac tgtactccag cctgggtggc 78600 agagtgagat cccatctcaa aaaaagaaaa gaaaaagaaa attgaaatgt ctagtctatc 78660 attttgtcag ttctatctaa tacaattttt tccttatgtc taactgaaat ctgctttttc 78720 taatttttac atacttgatt taacaaaact caatcttttt ttttttttat gagacagcct 78780 ttcaaatata taggaactta atgttatatc tgcttccctc cagtccccag aatagttact 78840 attttagttg tctttctatg gtctcatgcc agtttgtcag tatgcctaga taagaactga 78900 atattttacc tcagatgtga cctgactttg aagacttaaa aaggaagcat tgtgccaggc 78960 gcagtggctc acacctgtga tcccagcact ttgggaggcc gaggtgggca ggtcaggagt 79020 ttgagaccag cctgattaac atggagaaac cccatgtttc tctactaaat acaaatctct 79080 actaaatact aaatactaaa tctctactaa aaatacaaaa gatgagctgg gcattgtggc 79140 acatgcctgt aatcccagct actcgggagg ctgaggcagg agaatcactt gagcccagga 79200 _ cA 02348657 2001-11-07
28/66 ggcggaggtt gcggtgagcc gagattgcgc cattccactc cagcctgggc aacaaaagtg 79260 aaactccatc tcaaaaaaaa aaagcagcag cattgtgtaa tattatgtag atgttgtgtc 79320 tcatgatcta tcctgagaaa gcttttggga ggaactgcat catagtcatg gacaacattt 79380 gtgttattaa aatatctaga ttattttcca caaaaaatca gttacatatg tatcttaaca 79440 tgttgtatta ttgtttaacc ttgtttattg aataactaac atgtagaaaa gtatttatag 79500 cataagtata cagctgtata cagctcagtg gattaccaca aagcgaatat actttcataa 79560 tcaccaccca ggtcaagaaa taaattgtta cctgtggccc taaaatccct ccaggcactc 79620 caccatcttt atccactcac tcctctccct caaaaccact agactactaa catcatagac 79680 aaagctagca tgcctttgaa ctttatataa atctaatgat gtaggatttt gtgtgtatgt 79740 gtatttggct tctttcatca gcattgtatt tgtgagattt atccagattg ttgcaagtag 79800 ttgtagttgt gcttttttac acagatttaa tttttatatt tttcttatat gttcgaacag 79860 ttaacctgct tatctattat taaaaaaaaa aaaacgaaca ttcacatagt tcttaccagt 79920 ttacagtgtt ttttccacac cgtcttcaaa atgtaaagtt tggtcttcaa tacatcagta 79980 tgctgctaga tttaaatact agggaaaaaa aaatcagaga agttaataat attaactgtc 80040 acctccacta gaagatggtc tccatgtgga cagtaatatt tctcttgtat tatctgtgct 80100 aagtaaaatc ttctgtaagt ttctttaaat attttaataa atcatagtac ttaaaatgtt 80160 ctcaatattc taaagtagtt aaaagtaact ataaaatagt acctgttttt ctgatcacat 80220 tttacttcct atgtgaaatt ttacaagtcg ttactctatt tatttattga tttatttttt 80280 aagacagggt ctgttctgtc gcccaggctg gagtacagtg gcgtgatcat ggctcactgc 80340 agcctcagcc tcctgggctc aagtgatcct cccaccttag catcccaagt agctgggact 80400 ataggcacat gccaccatgc ccagctaatt ttaaaaaatt ctggggggcc gaatgcggtg 80460 gctcacacct gtaatcccag cactttggga ggccgaggca ggcgaatcac aaggtcagga 80520 gttcgagacc agcctggcta acatggtgaa accctgtctc tactaaaaat acaaaaaatt 80580 agcggggtgt ggtggcaggc gcctgtaatc ccacttactc aggaggctga ggcaggagag 80640 ttgcttgaac ctgggaggca gagattgcag tgagccgaga ctccatctca aaaaaaaaaa 80700 attttttttt gtagtgacaa ggtgtcactg tgttgccagg gctggtctca aacttctggg 80760 ctcaagtgat cctcccattt cggcctccca aagtgctagg atcacaggca tgagtcactg 80820 tgcctggtct tcaagttgtt attaaagcat gtttacccac attatgcaca tggtataatg 80880 gaaagtattg ttgtggaagt taggagatag ggattctagc ctagcttttt atttttttgg 80940 gacaaggtct cactttttcg ccccaggccg aagtgcagtt gtgcgatctc ggctcactgc 81000 aacctccaac tctcaggttc aagcaattct cccacgtcag cctcccgagt agctgggatt 81060 acaggcatgc gccaccacgc ccggctaatt tttgtagttt tagtagacac agggtttcac 81120 catgttggcc aggctggtct tgaactcccg acctcaggtg atccacccac cttggcctcc 81180 caaagtgctg ggattacagg catgagccac cgcacccggc ctctagcgta acttttacat 81240 cctgaactga ccttaagaaa gtataacttt aggcctgttt catctgtaaa atgttaatgt 81300 cataggagat gatcttttga gatttctttc agctctgata attttgtgtg tgtgtgtgtg 81360 tgtgtgtgtg tgtgagatgg agtcttgctc tgtcgcccgg gctggagtgc agtggtacca 81420 tctcggctca ctgcaagctc cacctcctgg gttcacgcca ttctcctgcc tcagcctccc 81480 gagtagctgg gactacaggc gcctgccacc acgcctggct aattttttgt atttttagta 81540 gagacgaggt ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc gtgatccgcc 81600 cgcctcagcc tcccaaagtg ctgggattac aggtctgagc cgccgcgccc ggcctagaat 81660 atttgtttcg attattctaa atctggtgac atttcttttg tttttaagtt aaatcttcag 81720 taaaaagaat aaatgccacc tagaggacag aaaaattttt acagtagatt atcacagacc 81780 tcatgactca ttactttggt gtataaaatg gcctttgtat ggtgtcagca cctgggaatg 81840 tctcaagggg tgttcattga ccttctggac tatctggaaa tattttgata tttattggct 81900 gggcgcggtg gctcatgcct gtaattccag cacctcggga ggccaagtta ggtggatcac 81960 ttgaggtcag gagtttgaga tcagcctggc caactaagtt agttgactat ttgtgaaatt 82020 tccctctcca aataggaaag ataggattgg aaacattatt cagaaggaag aagttttaaa 82080 gaagggcagg cttaaagact atctaatgaa tttaccaata tggtaaaacc ccatctttac 82140 taaaaataca aaaattagcc aggcgtggtg gtgggcgcct gtaatcccag ctacctggga 82200 tgttgaggga tgagaatcac ttgaacccag gaggcaaaag tcacagtgag ccgagattgc 82260 accactgcac tccagactgg gctatagagc aaaactctgt ctcaaaaaaa aaaaggaaaa 82320 aaaaaaaaga aattttgata tttatgtgag aatgactttt cacggtgttc ttaatagcgc 82380 aagttttgtt taggagagca cattccaact tacttgcttc tataaatata ccgtgtaatc 82440 tagggcttaa agaatatgta caatgtcttt ttctctcccc tagtcttccc cttttctcac 82500 tagttatatc cttgactgaa gagctatttc attctcaagt cttaggaatg cagggtgaag 82560 cA 02348657 2001-11-07
29/66 caaaacagat gaatttttaa agcacttaac caggctgtat gaaatcacag tctgttgtct 82620 aaaattgtaa gggacggtta gtagtactct cccctttctc aaaccaaatc tttggttgtt 82680 ttaaggaagg gaaattaaat tcctgtgtgc tagattttca acataaaatt taaaaaactg 82740 gaataatgtt gcattttatg tgtataacag tataatgctt tgttttaggt gggagaagga 82800 gagaaattgg tgagggctct ttttgctgtg gctcgagaac ttcaaccttc tataattttt 82860 ataggtaaga acatattttc caactaagtt attgactatt tgtgaaattt ccctctccaa 82920 ataggaaaga tacgattgga aacattattc agaaggaaga agttttaaag aagggcaagc 82980 ttaaagacta tctaatgaat ttagtaggac ccactatatt aataagtagt aaactagatt 83040 aatctcagat gactcacata gcttggtctt taattaaagt cttatacttg tatttcctct 83100 agatgaagtt gatagccttt tgtgtgaaag aagagaaggg gagcacgatg ctagtagacg 83160 cctaaaaact gaatttctaa tagaatttga tggtgtaagt gttgattatg atatttttaa 83220 tgtggcagca ttttagtata ttttcctatt aaatggccaa ggttaaaaat acaaatatct 83280 ttatatttgt tattactttt ctaaatgaat tgaaaaaaga ttttttgctt gtaggtacag 83340 tctgctggag atgacagagt acttgtaatg ggtgcaacta ataggccaca agagcttgat 83400 gaggctgttc tcaggtaggg agatttatat ggaaatacat gcatttatta cagacaatat 83460 ttactcatgt gtccatctta catattattt ccttactctc agttttaaga ctaaattcac 83520 tattttcttc cagtactatc tctagcctct tgttaccaac tacataagga ttttgaggtc 83580 aacagcttga tatcaggaga attagtctag taaaggttta gttacggttt taggcaaatt 83640 ggtcagttct tctgggttgc attaaattat ctttaaactt gaaaattgat tcttaccgtc 83700 ttttattggg cttcatgaga aaataatcaa atcagggttc atggaaaatg tgttttctgt 83760 tcttgtgtgt ttgagcagtt tattcccttc atactggaag gacggtttgg gtcagcataa 83820 aattcttggg catcctttcc caaggaattt acaatattgc tccattgttt ctagattggc 83880 tgtagtagtg taaaagtctg aatccaaatt gattttttca aatttgtaaa ataacttgat 83940 ttttttctct ctttactgga tgggttacgt gggtatattg cacccaggta gtgagcatag 84000 ggtgcagtag gtagtttttc aacccacacc tcactgcttt cttcccccat gtagtagtcc 84060 gcagtgtgta ttgttcccat gtttatgtcc atgtgtactc aatttttagc tccccactta 84120 tgagaacatg agctatttgg tttactgttc ccacattaat tggcgtagta ttaaggcctc 84180 cacctccatc catgttgctg caaaggacat tatttcattc ttttttatgg ctgcgtagta 84240 catagtattc catggtgtgt acgtaccaca ttttctttat ccagtccacc attgatggac 84300 acttagattg attctatgtc tgctgtcatg aatagtacag caataaacat gaaatgcatg 84360 tctttttggt ataatgatct attttccttt gggtatatac ccagtaatgg gatttcaggg 84420 tcaaaggtag atttgtttta tgttttttga gaaatcttca aactgctttc tacaatgact 84480 gaactttaca ttcctaccag cagtacatac gctccacaac ctcaccaaca tctgttattt 84540 ttttactttt tcccgccaat ctgtagacaa tatgggattt tttttgccat tttattaata 84600 gccattctga ctggtgtgag atatctcatt gtgattttga tttgcatttt tctgatggtt 84660 agtgatgatg agcatttttt catgtttgtt gtcccctcgt atgtcttttg agaagtgtct 84720 attcatttcc tttttaccca ttttttaata gggttgtgtg tttttagctt gttcaattgt 84780 ttgaattcct tatagattct ggatatcaga ccattgttag atgcagttct gtagattgtc 84840 tgtttactct gttgatggtt ctttttgctg tgcagaagct ctttagttta attaggtccc 84900 acttgtcaat ttttattttt gttgcaattg tgtttgggga cttagccaaa atttctttct 84960 gaggctgatg tcaagaagtg tatttcctag ttttcttcta gcatttttat actttgagat 85020 cttacattta aatctttaat ccaccttgag ttaatttttg tatatggtga aaagtaaggg 85080 tccagtttca tttttctaca tatggctagc cagtaatccc catgccattt attgaatagg 85140 gagtcctttt cctcattgct tgtttttgtc agtcttatca aagatcagat ggttataggt 85200 gtgtggcttt atttctcaat tttctgtcct gttcctttgg tttgtgtgtc tgtttttata 85260 ccagaattat gctgtttggg ctgctgtgta gttcggttta aagtcaggta acgtgatact 85320 tacagctttg ttctttttgc ttaggattgc tttgtctatt tggactcttt ttttgcttcc 85380 atatgaattt tagaatattt ttttctaatt ttgtgaaaaa caacattgat agtttgatag 85440 aaataccatt gaatctgtaa attgctttgg gcagtatagt cattttacga ccagataaat 85500 caggcaagag aaggaaacaa aaggcatcca aataggaaaa gaagtcatca tactctcact 85560 cttcactggc aatatgattc tatactttga aaaccctaaa aattccgtca aaaggctact 85620 agaactgata aatgatttta ccccaagatt caggatacaa aatcagtgta caaaaaatta 85680 gtaccatttc tatacgctaa taatgtccag gctaagagtc aaatcaagaa cacagtccca 85740 tttacaatag ccacaaagaa aatgaaataa tggctgggca cagtggctca tgcctgtaat 85800 cccagcactt tgggaggctg aggcaggtgg atcacctgag gtcaggagtt cgagaccagc 85860 ctgaccaaca tggtgaaacc ccgtctctac taaaaataca aaaaattagc caggcgtggt 85920 cA 02348657 2001-11-07
30/66 ggtgggcgcc tgtaatccca tctgctcggg aggctgaggc aggagaattg cttgaaccca 85980 ggaggcatag gttgcagtga gccgagatcg tgccactgca ctgcagcctg ggtgtgaaag 86040 agcaagaatc cgtttccaaa attaaaaaaa aaaaaagaaa aaaaaaaaga caatggagta 86100 cctaggaata cggctgatga aggaggtgaa agaatctgta tgaggagaag tgtaaagcac 86160 tgctaaaata aatcagaggt gacacaaata aatggaaaaa cactccatgc tcatggattg 86220 gaagaatcaa tatcgttaaa atgggaaatt tatcttaatt tttttcccta gttcattttt 86280 ctgttttctt ttgcacataa attatgtgtt atgttgcgtc cttttgtttt ccctatctgt 86340 aattttcttc ttcatccttt taaactctta ggtctttttg ttttgttctg ttttcccaag 86400 cctgttgcct ttatttctta ctgggttagt atctaatctc ctttctgcta tatcttttgt 86460 aactcttctt tccttggtgg ttttttattc attactttcc tgacatctgt tattctactt 86520 ttcatcttct gttttatttc tttgagcatc tgtatgttat ttccataagc tcttacattt 86580 cactgggctc ttgtttcata gaaaacaatt ttttggcaag gacagaccac ttgaggccag 86640 gagtttgaga ccagcctggc caacatagta caaccctgtc tctgctaaaa atacaaaaaa 86700 ttagctgggt gtggtcacac acacctgtaa tcccagctac tcaggaggct gataatcgct 86760 tgaacccagg aggcagaggt tgcagtgagc caagacggcg gcactgtact ctagcctggg 86820 ggacagagca aggctctgtc tcaaaaaaaa aaagaaaaaa ttttttggtc aggcgtcatg 86880 gtgggtcaca cctgtaatcc cagcactttg ggaggccaga tcacttgagg ccgggaattc 86940 cagaccagcc tcgccaacgt ggcaaaaccc catatctata aaaaaaactt aaggataaaa 87000 aaaattaaat ttttaaaaaa ttaaattatt ttatttcgtg gaaagatact tggtcataat 87060 tttagtttgc tctatggcaa aatcttctca tgcatgttct tcattttatc tagtttatgt 87120 ttattgtgtt ttgtttgctc ttttttgggg gcaggttttg ttgttgttgt tttttttttt 87180 ttttttttaa atgagccctg tcctggtttt tccttttttg cttattattt ttctttgaat 87240 aaaaggagtt ttcttggaaa acctagtttt ggaaggatat tgtaggggaa gggataggta 87300 tcttgagtag tccatgtata cactaaacta gcatgcagcc tccctcactt acagtgaagc 87360 cctacctaat aatgaagtat atgtgtatgt aaataagaga tagggttgat ttattcttct 87420 actaaaaaat attggtcact gcaagacatt gtcttcccgc cagactgtta gatgccttct 87480 tataaagata attcgtctta gagtttcttt gttcattctc accttccttg ccattcctat 87540 gctatcaatt agggtttata tggtctgcag agccaggctt catatgcttg tttaaatgtg 87600 gagggactgg ccttattacc ctttagggtg tgctatctct ttttgggagg aaaactgtac 87660 tctgacagtc atgtccatga tctttagcgg cagatccttt gtgtgtcttc ctttgtcagt 87720 gtaattttca ctgccctagg cagttcacct ttatgtattt tagttccata aatgttacct 87780 agtttgttga tgaagtgtat gtttctgttt ctattatcct tgctgatttt agtttttttc 87840 agattcaaga agacagatct acttatatca gatattttgt ttgttttaaa gcattactgc 87900 tattaaaaac atatacatac ataaatgatt aattctaaca ataccgaatt aaggatttta 87960 aacattaact agagttttaa aagagtaaca aaaatatttt tacattgata actaccaaaa 88020 tgcattccag tgccttgaat attatatttt aaaagctttt cctgtcattt gctgtttcag 88080 ctttaaattc aaaattatat ttctaaaagt gctggatttt tttttttagg cgtttcatca 88140 aacgggtata tgtgtcttta ccaaatgagg aggtatgtat ctgtgtttga attttttttg 88200 ttttagagca gaaacaagaa ctaccatctt gacaatatta agtcttccaa tccatggtac 88260 agctactttg gaaaacagtt tagtggtttc ttaaaaagat gtacataagc ttactgtcag 88320 agccagcaat ttcactccta agaatttacc ccagagaaac aaaaatgtat gtccacacaa 88380 agacttgtac aagaattttt atagcagcaa tattaataat agccagaact acaaatgatc 88440 taaaatgttt attttggtga ataaacaaat gtggtatatt catttaatgg atactgttat 88500 ccattataca tgctgcatac tcacttcata tattaagttt tatgaatgaa actccaaaac 88560 attataagtg aaagaagcaa gatgatatat gtcgcatatc ataggattct gtttatatgc 88620 agaaaacgca aatttatttt ttatttattt atttttttga gatggagtct tgctctgtcg 88680 ctcaggctgg agtgcagtgg cgtgatctcg gctcactgca accttcacct cctgggttca 88740 agtgattctc ctgcctcagc ctcctgagta gctgggactg caggcatgtg ccaccaggcc 88800 tggctaattt tttgtgtttt tagtagagac gggtttcact gtgttagcca ggatggtgtg 88860 atccgccctc ctcagcctcc caaagtgctg ggattacagg catgagtcac cgtgcccggc 88920 cagaaatcga aaatttctag aaacgtaaag cagatcagtg ggttgtcagg gtgagagttg 88980 ggaatgagga ttaactgcaa acaggtatga gtgaactaaa aagtgttcta aaactggatt 89040 gtggtgatga ttgcacatct ataaatgtat taaaactcat tgaattatat acttacaatg 89100 ggtgaaattc atagtagatg aattcatacc tctataaaac tggttttttg cagcaaaata 89160 tttattgcta tgtttttatt caagtgtggt gaattattgc tatgttttta tccaggtgtg 89220 gtgtctcacg cctataatcc caacactttg ggaggctgag gtgggaggat cgcttgagcc 89280 cA 02348657 2001-11-07 =
31/66 aggaattcaa gaccagcctg ggcaacatag ggagaccctg tctctacaaa aactttttta 89340 gaaattaacc aggcatggtg gcacgtgcct ttggtcccag ttactcggga ggctgagatg 89400 ggaggattgc ttgaacccag gatatcgagg ctatagtgag ctatgattgt gccctgcact 89460 ccagcctggg taacagcaca agaccctgtc tcaatataaa aaaagaaaag aatcattaat 89520 tctgaaatta gactgaatga tcatttttta atatttttca gacaagacta cttttgctta 89580 aaaatctgtt atgtaaacaa ggaagtccat tgacccaaaa agaactagca caacttgcta 89640 ggtgagtaat ttggatttgg tttatcttac agcttttatt tattttttgt aaataattct 89700 ttttttagtt atttaaagta atcttaagta tgaaatgagt aattcattga tcagaagact 89760 ttctctcatc ctctacctcc tttgcctttt tcttacctct tgttcttata tatatatgtg 89820 gaatctaaat ttcactggct atgtcctttg caagacgtga tctaatgatg atagtatatt 89880 ctttttataa atttattaaa acctgtaagt ggtattaaag taatttaaac atttacacct 89940 taggcaacat ggtaaaaccc catctctaca aaaaataaaa tgagtcagga atggtggcac 90000 atacctgtag tcccagctac ttgggaggtt gatgtgggag gatcgcttca gcccgggagg 90060 tggaggttga gcaacagagt gagaccctgt ctcaaaaaaa attttaaaca tttcatattg 90120 cacactaaca cagatatttt tatataaact tgttcttggc atatgctgaa tacttttcag 90180 ctcttttaat aattttaatt atttgataat tttaataatt ttaatttcag ctatttgaat 90240 aatcttaaac tttatgaaca gtgtgaagta gaaactgagt ataggagatg cgctcatgaa 90300 ttttattccc tgaaaaatgt cataaagtaa tataaagtat tcaatgagta tgtgagtatt 90360 gaataatttt aacaagaact ctgagttccc agatacctat gacaaaagaa caaattactt 90420 ggaagtctct tctactccag acctttctgt ctatcccctt atttaaaaaa atgtacattg 90480 attgtccctt atcccatcaa gagagtgttc tttgccaaga taaacgctaa ttagagaagt 90540 aattgtgttt atgtgtcagt tggccaccag tagtttgtag atgttacctt tccaggtgac 90600 atgtttacaa tttaatgaag cctctggaga tagtatgcct taatctaaag gaatggttct 90660 aatgattaaa atttgaggca ttactacatt tgttttcagc aaatgggcct ttctattccc 90720 ttaaaatcaa accctcataa ctatgggttt gctgacaaag ggaaactagt ttttactctt 90780 attatatgga gattttaaat ctgcagagat gaaaataatt tgctgtttca gctgggtgcg 90840 gtggctcatg cctgtaatct cactactttg ggaggctgtg gcgggtggat cacctgaggt 90900 caggagttcg agaccagcct gaccaacatg gcgaaacgcc atctatacta aatacaaaaa 90960 aaaaattagc caggtgcggt ggcgcatgcc tataatccca gctacctgag aggctgaggt 91020 aggagaatcg ctccaggagg tggagatcac agtgagctga gatcatgcca ttgcactcca 91080 gcctgggcaa caagagcaaa actccatctc aaaaaaaagc gggaggggaa ataatttgct 91140 gtttcttcct tcccttcctc agaatgactg atggatactc aggaagtgac ctaacagctt 91200 tggcaaaaga tgcagcactg ggtcctatcc gaggtaggta tacaagagct taaaacattt 91260 agaactattt attataccac cttagaagtt taagaagtcc aaaaaaatct accaagagat 91320 tttttttttc ttttggagac agggtctcac tctgttgccc aggctgtagt gcagtggcac 91380 aatcatagtt cactgcagcc tcgaaccccc caggctcagg tgattctccc acccagcctt 91440 cccagtagct gggactacag gcatgcacca tcatgcccag ataattattt tattttattt 91500 cttgtagaga cagggtttca ccatgttgcc caagctggtc ttgaactccc gggctcaagt 91560 gagcagcctg ccttggcctc ccaaagtgct gggattacag gcatgagcca ccatgcccag 91620 ccttaaaacc attcttagct cacagatcat acaaaaacag tctatgagcc agtagactgt 91680 gacccctgtt ctaggcaaga ggtttcattt cttgatagta agtaagcagc agaaaactca 91740 aaaagaaaac tttaaacaaa aaagaataat gtaaggaaaa tgttcttatc tgttttctgg 91800 ctcttttcag tattctgaca tcatttgaaa ttaatgtgtc taaaggaaat tctataagag 91860 aagttttcac ttttttaatt atatcttttg agggattgca gcaaaatatt tattgctatg 91920 tttttattca ggttacttgg ttgattctga aataccacga ccaattcttt ttaggttagg 91980 ttaggataaa ctcacacaga tattttcagc tacatttcca cagccagcat cggtagtgga 92040 tggttgatgc tctcaggtat gcactcagat tattagctat gatgataaag taatcataat 92100 agctccatcc ctttctctca ttcaagaaag tacaattgaa tgtagttgta cgagaaagat 92160 gttatcatag tgtctactgt aatttgcatt aaaagcctac attatacaaa cctttttgtt 92220 ttactagtta aaaattacca gtaacacctc ccgtagtgaa atagggtgct gattaagaac 92280 tgctactttg caaaataaaa aatgtaatct tgagagtata ttttgaaact ctggatgaac 92340 aaattttctt gctgctggag cttaaatctt gttcagttag tggatttaga aacagtagct 92400 aatgcataaa tgagttgtat tttcttagaa cgttttggct attctaaggt agacaaaatt 92460 tgggtttaaa aaaagattcg catccattaa agtacagaaa atggccgggt gcagtggctc 92520 acacctataa tcccagcact ttgggaggcc aaggtgggag gatcgtgtgg gcctaatagt 92580 ttgagactag actgggcaac atagggagat cctgtctcta caaaaaaata taataaatta 92640 cA 02348657 2001-11-07
32/66 accaggcccg ttggcatgag cctgtaatcc cagctactcg ggagtctgaa gtaggaggat 92700 cacttgagcc tggaaggtgc aggcagcagt gagccatggt catgccactc actgcactcc 92760 agcctgggtg ggtgacatag tgaggtgctg tcttaaaaag taaataaata ggccaggcac 92820 ggtggctcac gcctgtaatc ccagcacttt gggaggccaa gatgggtgga tcatgaggtc 92880 aggagttcga gaccagcttg gccaatatgg tgaaaccgca tctctactga aaatacaaaa 92940 attagccagg cgtggttgtg cgcacctgta atcccagcta ctcaggaggc tgaggcagga 93000 gtatcgcttg aacctgggag gtgaggttgc agtaagccga gcactgcagc ctgggcaaca 93060 gagcaagact ctgtctcaaa aaaaaaaaaa aaaaaaaaaa aaaaaagtaa atacataaag 93120 tgcagagtaa aaacaaaaaa agactaatgc attttgtaaa gaacaagttg cattctttta 93180 agttcccttt caaatttgtg aactattgtt tttgggcagt atgcaagaaa ttgaacactt 93240 tccagttatt ccaaagaagg aatattctct tctcagcatt tataaattgt atttgctctc 93300 aaagttaaca tgtgtctctt ttttttaata taatgatttg tactgaatag atacatgtag 93360 atcattgtac ttggttttgc ccttcaacaa tttcaactgc aaaatgtatg tatttttaag 93420 tgcctgactt ttatgtttta cagaactaaa accagaacag gtgaagaata tgtctgccag 93480 tgaggtatag tattttacaa tgatattttc tttgtcttct atattgtaag acatatataa 93540 gacatacata tatgaatgtg tgtgtgtgtg gttttttttt tttttttttt ttttttgaga 93600 cagtctggca tgatatcggc tcactgcaac ctccacctcc tggattcaag ctattctcct 93660 gcctcagcct cccaagtagc tacaggcatg taccaccaag cccagctaat ttttgtattt 93720 ttagtagaga gggcatttca ccatgttggc cagtctggcc tcagactcct gacctcaagt 93780 gatccaccca actcggcctc ccaaagtgct gggattacag gcttgagccg ctgcatctgg 93840 ctgttttgtt tgtttgtttg tttgtttgtt tgtttgagac ggagtctcac tctgtcgccc 93900 agactggagt gcagtggtgc gatctcagct cactgcaagc tctgcctccc gggttcacgc 93960 cattctcctg cctcagcctc cctagtagct gggactacag gcgcccacca ccacgcctgg 94020 ctaatttttt gtacttttag tagagacggg gtttcaccgt gttagccagg atggtctctg 94080 tctcctgatc tcgtgatctg cctgcctcag cctcccaaag tgctgggatt acaggcgtga 94140 gccactgcgc ccggcctttt tttttttttt tttttgagac acagggtctt gctctgttct 94200 caggctggag tgcagtggtg caatcgtggc tgactgtagc cttgacctct tggtctcaag 94260 cagtcctctt gtctcaaact ttttagtagc tgggactaca ggcaagtgcc acaacgcccc 94320 actaattttt taattttctg tagagatggt gtctctccct gttgcccagg gtggtctcag 94380 actcttggcc tcaagtaatc ctcctgcctc agtctctcag agtgcttggg actaattttt 94440 tttaatggat ttttctagtt gattagaagc tagaaaaaat taactttgct tcatttcaaa 94500 atatggaaac ctatgaaata gtcaaaattt tttttggtaa tagacaaaac atatatacat 94560 aaagtcattt tctatcaaat catattacat aaataccaaa cagaagaaaa ttacaggccg 94620 ggtgcggtgg ctcacgcctg taatcccagc actttgggag gccgaggtgg gcagatcact 94680 tgaggtcagg agttcaagac cagcctggcc aacatggtga aaccctgtct ctatcaaaaa 94740 tacaaaaaaa ttaggccggg ggcggtggct cacacctgta atcccagcac tttgggaggc 94800 cgaggcgggc ggatcacgag gtcaggagat cgagaccatg ctggctaaca tggtgaaacc 94860 ctgtctccac taaaaaatac aaaaaaatta ccggggcgtg gtggcgggca cctgtagtcc 94920 cagctacttg ggaggctgag gcaggagaat ggcgtgaacc tgggaagtgg agcttgcagt 94980 gagccgagat cgtgccactg cactccagcc tgggcgacag agcaagactc catctcaaaa 95040 aaaaaaaaaa atagctgggc atggtggcac gtgcctgtgg tcctggctac ttgggaagct 95100 gaggcaggag aatcacttga acttgggagg cagaggttgc agtgagccaa gattgcccca 95160 ttgcactcta gcctgggcga cagagtgaga cccagtctca aaaaaaaaaa aattacatga 95220 aacttgtggg ggtttataca ataaaaataa cctataacta tacgttaatc ctttaataat 95280 gttctatttt gtttttcaat aacctttatt tttttaatta atttcttttt tttgagaagg 95340 actctggctc tgtcacccag gctgcagtgc agtggcacca tcttggctca ctgcagcctc 95400 cacctcccag gttcaagcga ttctcctgcc tcagcctcct gcgtagctga gattacaggc 95460 atgggccacc acgcccagct aatttttttt ttttttgtat ttttagtaga gatggggttt 95520 cactatgttg gccaggtggg tctcgaactc ctgacctcag gcgatcgcca gcctcggcct 95580 ccctaagtgc aaggattaca ggcgtgagcc accatgcctg gccaatttat taccgtttct 95640 taatatggaa gacctcctta tgagatgctg aagcatttca tttgaaaaaa gttgcatgta 95700 aaatataaaa ttgggtatgc agaatggtca taactctgtg agcaaaattt tgaaatcagg 95760 cttgaattac agtcagcctt ttctatccgt ggattctgca ttcatggatt caaccaactg 95820 cagatcaaaa atacttgggg gaaaaaagca tctgtgttga acatgtacag acttttattc 95880 ttgttattat tccctaaaca atatagtata aaaactattt acattgcatt tacattgtat 95940 taggtgttat aagtaatcta gagatgattt aaagtataca ggaggattgt gtaggttgta 96000 cA 02348657 2001-11-07
33/66 tgcaaatact gcaccatttt acataaggga ctttaagcgt ttgcggattt tgctatctat 96060 gggggaacca atttccgaga gatactgagg gacagctgta tatttgtaac ttatttttta 96120 tttccctaat tgcagcagct gttgagggga cagtgaactg ttaacacaga taacaagtgt 96180 attcaagtac attttggagt ttgtttgttt ttttttttca ggcttttatt cgcctgtcgg 96240 atgaggcacc atacttgaat tttttttttt aagaaagctt ttagttttct ttctttcttt 96300 tttttttttt gtgagatgga gtcttgctct gtttctaggc tggagtggag tgcagtggtg 96360 tgatctcagc tcactgcaac ctccgcctac tgggttcaag tgattctcct gcctcagcct 96420 cccgagtagc tgggactaca ggtgcacgcc accacgccca gctaattttt tttttttttt 96480 tttttttttg tatttgtagt agagacagag tttcaccatg ttggccagga tggtctcgat 96540 ctcctgacct tgggatccgc ccaccttggc ctcccaaagt gctagggatt acaggcatga 96600 gccaccacgc ccggctgaaa gcttttagtt ttctaactta tttaatttaa tttaatttaa 96660 tttattttta ttttattttt tgggacagtg tctcacttgg ttgcccaggc tggagtgcag 96720 tggtacaatc atggctcact gcaccctcta gctcctgggc tcaggcaatc ctcctgcctc 96780 agccttttga gttgctggga ctacgggcat gtaccaccac actcagctaa atttttaatt 96840 ttttgtagag atggggtctc actatgttgc ctaggctggt ctcagattcc tcaagcattc 96900 ctcccacttg cacctcccaa aatgctggga ttacaggtgt gacaccgtgc cagacttgaa 96960 atttttaatc ccacacctaa aaatataatt ttatccacca ttttttaaaa gtcataacat 97020 tatttattaa aaatttagat ggtaaaacta aaaattaaag cttaataaaa ctactgagtg 97080 atttacaagg aagaatatta ctggtccctt ttgtgagcat cccattaatt atatatattc 97140 aggttatatt gttacaatat ttggttctac tgtatacttt tttttttgag actgagtttc 97200 gctgttgttg cccaggctgg agtgcaatgg tgcaatctcg gctcactgca acctccgcct 97260 cctgggttca agtgattctc ctgcctcagc ctcctgagta gctgggatta caggcatgcg 97320 ccactatgcc tggctaattt tgtgtttttg tagagacggg gtttcactat gttggtcagg 97380 ctgatctgga actcccaacc tcaggagatc cgcccacctc ggcctcccaa agtgctggga 97440 ttgcaggtgt gagccaccat gcctggctct actatatact ttcattcagt tgtttctttt 97500 taatctagtg gttttggtat taataatttg ataatgacct ttagctgtta ttgcttactt 97560 atgagttaat atttataaag cacttaaagt agctggcacg tagtaaacac tatgtaaaga 97620 tccattaaat aactttaaaa aatataaaac tgatagtggc attttattat agagattaag 97680 gtaatccatt ctctcatttc catttatggg atgagacgta aacacaagta gtttgctctc 97740 taaaactgta tactagaatt ttatataccc attatttgat gcaactttaa taccaaagtg 97800 tattgtcagt taccggtgaa tatatataaa tttaggtaag gaaaacccaa cttggtcgca 97860 cacagtggct cacgcctgta atcctaccac tttgggaggc cgaggcagtt ggatcacctg 97920 aggtcttgag ttcgagacca gcctggccaa cgtggcgaaa ccccgtctcc actaaaaata 97980 caaaaattag ccgggcgtgg tggcacatgc ctgtaatccc agctgctcgg gaggctgagg 98040 aaggagaatt gcttgaacct ggggaggtgg aggttgcagt gagctgagat cgtaccactg 98100 cactccagtc tgtgcgacag gagcgagact ccatctccaa aaaaaaaaaa aagaaaaacc 98160 caacttatct tttacagttt ataatagtag aagttcaaat aattggtttg gaatttctgt 98220 atttttaagg ttagtactaa aattgttggt tataaattgg ggtacaatat actttgtttt 98280 ttaagtacct tgtgtatcta atttaacttt aagtccttta ttattttggt ttgataagac 98340 aacttttcta cttatttccc cccttaactg aaccagctac catctgcctt tttcctgttg 98400 tatacattag tctcttacgt taaaatatca tataagtttc atatatatac acatatcaaa 98460 ctatagactt aaagtacaat tacatcaaca tcttttaaaa ccttaatttc tggccaggcg 98520 tggttgttca tgcctataat cccagcactt tgggaggctc aggccattgg atcccttgag 98580 ctcaggaatt cgagaccagc ctggataaca tggtgaaatc ctcatctcta caaaaattac 98640 aaaaagttag ctgggcgtgg tggcgcacac ctatagtcct agctacttgg gaggatctct 98700 taagcctggg aggcagaggt tgcagtgagc cgagatcatg ccactgcact ccagcctggg 98760 taacagtgag accctgtctc aaaacaaaaa tattaatttc tataacaaat aaattttatt 98820 tagtaatatc atgtttaata cccatgttac attcattatt cttctacact ttggccttta 98880 ggaagaggca gtgtgtgtgt tacagttaaa taggaaacaa gtagggttca tatagtgctt 98940 atggggtttt ctttggtggg gggttgctgg gtttttgggg tttttttttt tgagacaggg 99000 tatcactctg tctcccaggc tgaaatacat tggcatgctc atggctcact gcagcctcaa 99060 cctcccagac tcaagtgatc ctcccacctc agcttcccta gtagctgaga ctacaggcgt 99120 gcgccaccat gcctagctaa attttgtaca ttttgtagag atgaggcttt gccatgttgc 99180 ccaggctggt ctctaactcc tgggctcaag tgatccactt gcttcagcct cccaaagttc 99240 tgggattaac aggtgcgagc cactgcagcc agcctatatt ttaactatat gtttttttct 99300 ttttggctaa aatttttcag attagtttac aagttacaag tgtaggtgat atctcatgga 99360 cA 02348657 2001-11-07
34/66 gatatcaaag atgatatgaa gttagattgg gtttttaaga gtagttttta aaatacggat 99420 aaataccagt tgttggagtt ttgtttaaag ttctttaact tcttattttt gggccaaaat 99480 acaggtatac gctagaaatg atttttaaca caggtcattt atgccaaact gcattttgcc 99540 ttaatttttt tttttttttt tttttttgag agggagtctc actcattgcc caagctggag 99600 tgcaatggca cgatctcggc tcacttacaa cctccacctc ccaggttcaa gcgattctcc 99660 tgcctcagcc tcctgagtag ctgggattac aggcacctgc ctggctaatt tttgtatttt 99720 tagtggagac ggggtttcac catgttggcc aggctggtct cgaactgctg acctcaggtg 99780 atccacccgc cttggcctcc caaagtgcgg ggattacagg tgtgagccac cgtgcttggc 99840 caaaattttt attaattttt ctattgcctg gactctgtga acctatccat tttgcctttt 99900 aaaaatactt aggtgtaaat atagatattc attaactcag cattgtttta atctatattt 99960 ccaaaggcaa tttaaaagat cagaaaataa gaccaaatta atataaaaat gcatacttta 100020 ggctgggcaa agtggctcac gtctgtaatc ccagcacttt gggaggccaa ggtgggcgga 100080 tcacctgagg ttaggagttc aggaccaacc tggccatcat ggcgaaaccc tgtctctact 100140 aaaaatacaa aaattagctg ggcatggagg catgtgcctg taatcccagc tactcgggag 100200 gctgagacag aagaattgct tgaaccttgg agggggaggt tgcatatctg agtggtgaaa 100260 ttgtgattct ttttttctct ttgtctgtat ttttgaactt ttctataaat gattgtgttt 100320 tgtttttata ttggaaaaat attatgcttt caaatgttaa tacctatgaa actaaacaca 100380 agtaataaat atattagtat agcatttatt aaggtttctt gtgtagcaga tcaacataga 100440 aaatatattt aaatggctga cataattttc taagaataca tacacgtata ttttttataa 100500 cattaagaaa cagcagcatc attactttaa tccatcattt cgttaaccac catatacctg 100560 ttgatcattt gtattgtcat gtgcttttta aaaatctaga tgagaaatat tcgattatct 100620 gacttcactg aatccttgaa aaaaataaaa cgcagcgtca gccctcaaac tttagaagcg 100680 tacatacgtt ggaacaagga ctttggagat accactgttt aaggaaatac ctttgtaaac 100740 ctgcagaaca ttttacttaa aagaggaaac acaagatctt caatgaacgt catcggctac 100800 agaaacagcc taagtttaca ggacttttta gagtcttaca tatttgtgca ccaaacttga 100860 agatgaacca gaaaacagac ttaaacaaaa tatacaatgc aaatgtaatt ttttgttgtt 100920 taaggccttg ccttgatggt cacagttatc ccaatggaca ctaagttaga gcacaacaaa 100980 acctgattct ggtcttcttt accaatataa tcataatgta aataataatt tgtatattgt 101040 gttgcagatg aaagtattcc aggaacagtg aatggtagaa gacacaagaa catttgtttg 101100 tttgtcttct gatgtttttt cttaaaatag taatttctcc tacttttctt ttctactgtt 101160 gtcttaacta caggtgattg gaatgccaaa cactcttaag tttattttct tttttcgttt 101220 tataaattca gtgtgccaaa tgaaactttt ttcctaagta actgtaatag gaaaaagttt 101280 attttgagag tttcttcttc ataaatctac agacattaaa caattgttgt gttcttttta 101340 ccttttattt ttctattacc ttgctaccaa acagtttaga tagcaatata atagcaaaaa 101400 agcaaatatg gtaaaataga gaaggtttga aggtttgagt tactctgtca tataacatgt 101460 agatcagtct tcatgtgacc tgcagtattt ttttttctaa tgtatttgtc agaaatctgt 101520 tgtagactgt taacttcttc ctgatggaat ttattttctg caagaattat tctgatattt 101580 aagagagcca attttaactg ctgtgaaaat gtttccagtg caagagaagg gaaatactag 101640 gaactaagac atttctaatt tattgcttat tactttctta attttacagg ataattataa 101700 gcaagtggaa ctaccatctt ttattcttaa taattattaa tcccttcaat gaaactttaa 101760 aaaaactgaa tttttataca tggcatacat ttttctagtt ccttctgctt gctttattaa 101820 ctcaaaagtt ctagttctag tctgttgatc tgccttttgt tctcccaaaa tgtacagtaa 101880 ttccatttgt ttgtataaat atgcctggat tttcattata aaaatgtcat tgtagggagt 101940 agagactcat atcatggcct tttaaatatt gtaataaagg caaatagata tttgccctta 102000 gtttactggt taaaagtttg tttacagaac ttttctctgg tgcttaaatg atgctatgta 102060 aaatgtcatg agtggaaaga atatttgtag tagtaacaag aatttttcat ttaggaaaga 102120 tttcttaggt tttgaaagaa tacattaaaa taaaaaactt gcccctacta ggtaagaact 102180 ttataatgaa gacatacatt cttcttaatt ttactcttgc tcttgttaaa gatttgtttg 102240 aatatagaag atgcatgatt tctgggtttt tttttttttt tgagacagag tttcgctctt 102300 gttgcccagg ctggagtgca atggcgcaat ctcgactcac cacaacctcc gcctcccagg 102360 ttcaagcaat tctcctgcct cagcctcccg agtagctggg attacaggca tgcgccacta 102420 ccccagctaa ttttgtattt ttagtagaga tggggtttct ccatgttggt caggctggtc 102480 ttgaactcct gacctcaggt gatccgcctg cctcggcctc ccaaagtgct gggattacag 102540 gcataagcca ctgcgcccag ccagaagatg catgatttct taggatcata tgctgtttgt 102600 agccataagg taaatcatgt ctcttccaat catgactttg gaactccctg aataataaaa 102660 atgagagttg agataaatag gggaaaaaaa atttttttca agccagagct atgcatatgt 102720 _ _ cA 02348657 2001-11-07
35/66 taggtgatgg gtagtatccc tttaaggtct caaacattac aacatcaatt atgaaatact 102780 gataacgaaa ggtagtaatg aaatatatat gatgaaaaga attgagaagt tctaaattaa 102840 gacatttcag ttaagctcat aaaatttcat tgttttcatt taaaagatta acgttattga 102900 tacttggata actggctaat catattaaag gactatgtgg ttccagctca acttttaata 102960 tattgtctcc tttaaaacta tcatggttat aattctattg ggaaagactt ttagataaca 103020 aagatttcaa atgttaaaag agataaaagt caggttaata ctatcttaaa cactgagtca 103080 gaaaatcatt actgtataga agttgctttc ctgatcaagt ctgaacttca gctagtgcta 103140 gagaactatt ttctatgact taactctaac caagttttat tttaagctgt ttctttgata 103200 gaagggccat gaaaatagag taatgatata gtaggagata agggattggt ttggtctttt 103260 tcaataaaga tagaagttgc tgaagttttc tgaattaata atgacttaga ttgtgacctt 103320 ttagattcgg tgttgagctc tgtgttgtat tacttcctaa aagataatgc ttaaacatta 103380 agcattagtg tgctcttcat gttaatatgg cagagttttg taaactaaat taaaacttac 103440 tgatatattg gactttgagc caagggaaag aatgagtact atctttccag atatcttaag 103500 ggtaaaagct tattctaaga cagtctgtcc attgagaata ttagatttct gacttgcaaa 103560 tatgtttgta ctccagaaga attagaggaa aagcagatac tagaattcta atttaattac 103620 atatacagcc gtctttgttt atagtgtaga attctttata ttttgtacaa aaactaattc 103680 ttttggtaaa atgaaccatt tacagttcgg ttttggactc tgagtcaaag gattttcctt 103740 taaatgcttg tctcaatttt agtctggtct tttgtacttt tcttcagaag aaatgaatta 103800 aagggtacag ttgcataaag tgggttttta tcctaatgta ttggaaataa atgataaact 103860 ttattttgtc tttacttttt tactttaaaa ctttttgata ttttaggggt tggagtctga 103920 taatgaagga gttgtgtgta ttggactctt agtaacaatt ataaacgctt aacaaaatat 103980 agaaagcaat gattgggtgg ctctgcagag caatcaaaac aaggtagaaa ctgcaaagtc 104040 ctataatgga agagattcag gctgggtgtg gtggctcatg cctgtttggg aggccagtat 104100 gggagaatcg cttacactca ggaattcaag accagcctgg ggaatatagg gagaccctgt 104160 ttctgccaaa aaaaaaaaaa aaaaaaaaac taaactaaaa attagccagg tttggtggcc 104220 tacacctgta gtcccggtta ctcaagaggc tgaggttaga ggatcgctta agcccgggag 104280 gaggaggttg cagtgagcca agatcacacc accacactcc agcccaggtt acagagaacc 104340 tgtctcaaaa aataaaaagt aaacgagatt caccttaacc agcttttacc catagggcaa 104400 tttccagttt gtgcagttca cttggatata gaattcaggt agaatgtgac agttttgaca 104460 ggctgaggaa tcatttggga cttctagaac acctgaaaat tagaagagaa attttgggaa 104520 ggagagtgcc tcagaaagta agctctaaaa tctgcctaca tattcctttc aaatccttgg 104580 tggattccaa aattgtgctg gtgcagtgtg attatttaaa ggaacccagg agaaagcaag 104640 ttaaagtcta aaaaactcag cagcgattgc agctgcccaa ggacagagag tttgaaattc 104700 aagttccact aagaaggact gagtaaatac ttggtgtttc ccattgaacc cccaaaatgc 104760 cacgccttaa ggaagaatga cagcatccta gaactaaagg ctgtgcttca gcactaagga 104820 caaaatggaa ataaacttac tgtaatgaag cttaaaatca aatctcacag catcaaggtt 104880 atccattagt aatttaaaac cagaacaaaa cacagcattc ttgagaagaa aacaattcag 104940 tcatcacagc atatatccaa agctcagtac ataataaaca gttactaagc atgcaaagaa 105000 aaattatgtg atccttttga ctcaacttcc ctgatggaaa aaaaaaagtg gtccatacca 105060 tactcaacag aaaatataca gaagcagatg cacaagtgac ctctatgaga gtgattttaa 105120 aatagcgtta aaatatgtta aaagaattta caagaagaga taatgggtga atagataggg 105180 agtttcagca gaaaaataag aattgaaaac ccaacagagg ccaggcaccg tgcctcacgc 105240 ccgtaatcac agcactttgg gaggccaagg caggtggatc acctaaggtc aggagttcaa 105300 gaccagcctg accaacatgg tgaaacccgg tctctactaa aaatacaaaa ctagccgggc 105360 atgggtgatg catgcccata atcctagcta cttgggaggc tgaagcagga gaattgcttg 105420 aacctgggag gtagaggttg cagtgaacca agatcatgcc attgcactcc agcctgggca 105480 agaagagcaa aactccatct caaaaaataa taataataat tggctgggcg cggtggctca 105540 cgcctgtaat cccagcactt tgggaggccg agacaggcag atcacaaggt caggagattg 105600 agaccatcct ggctaacatg gtgaaacccc gtctctacta aaaatacaaa aaattagcct 105660 ggcatggtgg cgggcacctg tagtcccagc tactcgggag gctgaagcag gagaatggca 105720 tgaccccagg aggcggaact tgcaatgagc ccagatcgcg ccactgcact ccagcctggg 105780 caaccgtctc aaaaataata ataataataa ttagaaaata ataaaaaata acccactgga 105840 aagtcttgta atgaaaacta cagtatctga aattaaaaat ttaaatggat ggacttaaca 105900 gtaaactagg cacaacagga aagactgaaa aagacaagta agtatcaaac caaagcagag 105960 agagaaagaa aaaagaaata gcagaggttt gagacctttg gaacattatc agttcctgta 106020 atttgaagta aagaaggaaa ggaagagaat ggggcaagag aaatctttga agcaatgatg 106080 cA 02348657 2001-11-07
36/66 cgtgaaattt tccccaaagt gttgaaagac atcaacgtac agatctaaga agttcactga 106140 atccccaagc agaataaata caacaaagac tacatctggg tacatcacat tgccaaaaaa 106200 aaaaaaaaaa aaaatcttaa aagcaatcaa ggtggggagt gggaaggagt agcattacat 106260 tcagataaac aagagtgatg gctaacctca tcagaaatga tggaattaag aaaatgatgg 106320 aatgacatct ttaaggtgca aagatgaaac aaaggttaac ttaaaactct gtatccagtt 106380 aaaatatcct tcaagatgtt aaggcaatgg ccaggctcag tggcttatgc ctgtaatccc 106440 aacactttgg ggggctgaga caggagaatc ccttgaggcc atgagtgacc agcctgggca 106500 acctagtgag aaccccatca aaaaataaaa ttagctgggc atgggctgtg gtcgtgctac 106560 tgcactccag cctgggggac agagtcccta tctcttgaaa aacttaagac aaaatctttt 106620 ccagatgaaa acagaatttg ttgctggcag actgacttta tacggaatgc tttaagaaat 106680 tcttcaggct gaaggaaaat ataaatctgg agtgaaaaac gtagtatctg aaattaaaat 106740 tttccttgga tggacttatc agtaaatgga tttcccaatg ggaacctgta tctccaggat 106800 ggaattaaga attttgaaat gataaacatg ttggtaaata agaaagacat ttttcttttt 106860 tatttttcta aatatcattg ctgtttaaag caaacaaaaa tagtattgca gtgtttataa 106920 tatatgtata agtaaaatat aggacagaaa tagcatgaag ggtcagagag ggcaataaat 106980 gtaattatat tgagataata ttactatatt gtacacaaag tgagatagca ttagtgtaag 107040 gtagattgtg ataagaatgc attttgtaat ctctcacccc atcactgggg tgcagtagat 107100 ctaaaaagcc attagagaag ataaaatggg tcactaagaa ttatgtgatt agtcaaatga 107160 aatcaaggaa agaaaaacag agcaaagaag tgtaagataa aacagtggga tggaagagct 107220 gaaattaata atgtcactaa attgcttacc ttcctccttc ctgaactgtt gtggattttt 107280 ttttttcag ggggttgagg ttttttttta gagacagagt ctctattgcc ccaggctgga 107340 cagcagtggc gtaatcagtc tcaaaatccc tgcagtctca aactcctggg ctcaagtgat 107400 cctcctgcct cggcctccca aaatgctggg attacaggca ggcagagcca ccacaccctg 107460 ccagaactat tgttttaaag tcattaggtg gttaagccct cgagactatg tgcaagtttg 107520 atgattcgtt aggagcactc acaggactca gcatatagtc ttattcccaa caatgattta 107580 ttagagcaaa aggatatgaa gcaaattcag caaagggaaa aaaggaatta agtgaagtcc 107640 agaggaaacc aagcaccagc ttctaagggt tctctcctaa tgaagtcaca caggatgtca 107700 ctccagcaac aagtgacagc atgtgaaagt gttaagcctc actgttagac atagtaagct 107760 tgttagggaa tagagggaat ctcccctcaa attcaagttc ccagatgcct ggcaagggcc 107820 aaccttgcca gcaggacttt ctggggatag cagtcccagg cacgtgtttg cacagtggtt 107880 cagatcaatg tgcttacatt gggtagaggg gacctatgga agtccaaatt tgggtgtcag 107940 agacctaata gggtgaagac agtgtctaca atgatggaca gctaggtatg aggtgtcagg 108000 gacagattga ggcagttatt cacatggtgg ataggggcaa cctggaatga ggaataagct 108060 caagcacaga aaggggtgtc catatggggt aagggtgtca gcagagatgg tagattggtt 108120 gcacaccaaa gacttgatgg aataaagtga atatactaac cacagagaag gtaattataa 108180 atacagaaag gggggaaact agaatgaaac ctggagttca gcttgaattg ggtttaagaa 108240 agtgaattca tggtttaaaa tctataaaaa tagatgaaat atcggctggg cacagtggct 108300 cacgcatata atcccagcac tttgggaggc cgaggcgggc agatcgcttg agatcaggag 108360 tttgagacca gcctggccaa cactgcgaaa ccccatctct agtaaaaata caaaaattag 108420 ccaggtgtgg tggtacacac ctgtagtccc agctacttgg gaggctgagg cacgagaatc 108480 acttgaacct gggaggcaga ggttgcagtg ggctgagatc gcaccactgc actccagcct 108540 gggcaacaga gcgagatcct gcctcaaata aaaatagagg acatataagc atataaatat 108600 acacgtgtgt atgtgtccaa atatgtatat tccctagtct gtccaccaag gtggccttgg 108660 agcagttatg ctccaataat aatgagcaca taaagtaccc atatcttgcc ttccaaattc 108720 ttcactgtct tagtctgctt gggctgcatt acaaaatacc atagactggg cagcttaaat 108780 aacagaaatt tatcctcaca gttctagaag cttggaagtc caagattaaa gtaccagcca 108840 gtttggtttc tagtgagggc tttcttcctg gcttgcagat ggccaccttc tcaceàtgtc 108900 cttgtatggc agacagcaca agctctctgg tgtccctttt taaaagggca ttaatcccat 108960 catgacagtc ccatcctcat tatctcatct aaccctaggt acttcccaaa ggctgaatca 109020 ccaaagacca tcacattgct ggtgaaggct tcaacatatg aatttgaggg acacgaatat 109080 tcagtccata acatcaacta aaggaaccaa gactctttga taaaatggct aaattcaggg 109140 ctggggcaga gaaaatacat gagtgtggaa cttcttgtgc cagagagaaa aagtgcccaa 109200 agattgatga ggatgaatca ttgaaatgac acacagatta aaagggttcc cactggacaa 109260 atttgagcat caaaataagt aatagtagta attaattata acccatcaga agaaataaac 109320 catgagctca tgtgaatata tgaatacaaa cataaacaaa ttacaagcat aatgaggaat 109380 gtgatattta tatggtttaa aggtacctct ccaggccggg tgcagtaact ctcacctgta 109440 cA 02348657 2001-11-07 =
37/66 atcccagcac tttgggaggc caaggcaggt agatcacctg aggtcaggca tttgagacca 109500 gcctgcacaa catggtgaaa ccctgactct actaaaaata cataacgcga gccgggcgtg 109560 gtggcacgtg tctataatct gccactgatt aggtgtgtga ttttcccaag caggggataa 109620 tagtagtacc tatgtcaaag gctgttatga ggattaaatg agctaacaca taatcgtgct 109680 tttttttttt tttttttttt ttgagacaga gtcttgcact gtcgcctggg ctggagtgca 109740 atggcacgat ctcggcccac tgcaacctct gcctcccagg ttcaagtgat tctcctgcct 109800 cagcctcctg agtagctggg attacaggct cctgccacca cacctggcta ttttcaatag 109860 agacggggtt tcactatgtt ggccaggcta gtctcaaaaa cctgacctcg tgatccaccc 109920 gctttggcct cccaaagtgc tgggattaca ggcatgagcc actgcacccg gctttttttt 109980 tttttttttg agatggaatc <210> 2 <211> 3263 <212> ADN
<213> Homo sapiens <400> 2 gctcctgaga ccggcgggca cacgggggtc tgtggccccc gccgtagcag tggctgccgc cgtcgcttgg ttcccgtcgg tctgcgggag gcgggttatg gcggcggcgg cagtgagagc tgtgaatgaa ttctccgggt ggacgaggga agaagaaagg ctccggcggc gccagcaacc cggtgcctcc caggcctccg cccccttgcc tggcccccgc ccctcccgcc gccgggccgg cccctccgcc cgagtcgccg cataagcgga acctgtacta tttctcctac ccgctgtttg taggcttcgc gctgctgcgt ttggtcgcct tccacctggg gctcctcttc gtgtggctct gccagcgctt ctcccgcgcc ctcatggcag ccaagaggag ctccggggcc gcgccagcac ctgcctcggc ctcggccccg gcgccggtgc cgggcqgcga ggccgagcgc gtccgagtct tccacaaaca ggccttcgag tacatctcca ttgccctgcg catcgatgag gatgagaaag caggacagaa ggagcaagct gtggaatggt ataagaaagg tattgaagaa ctggaaaaag gaatagctgt tatagttaca ggacaaggtg aacagtgtga aagagctaga cgccttcaag ctaaaatgat gactaatttg gttatggcca aggaccgctt acaacttcta gagaagatgc aaccagtttt gccattttcc aagtcacaaa cggacgtcta taatgacagt actaacttgg catgccgcaa tggacatctc cagtcagaaa gtggagctgt tccaaaaaga aaagacccct taacacacac tagtaattca ctgcctcgtt caaaaacagt tatgaaaact ggatctgcag gcctttcagg ccaccataga gcacctagtt acagtggttt atccatggtt tctggagtga aacagggatc tggtcctgct cctaccactc ataagggtac tccgaaaaca aataggacaa 1020 ataaaccttc tacccctaca actgctactc gtaagaaaaa agacttgaag aattttagga 1080 atgtggacag caaccttgct aaccttataa tgaatgaaat tgtggacaat ggaacagctg 1140 ttaaatttga tgatatagct ggtcaagact tggcaaaaca agcattgcaa gaaattgtta 1200 ttcttccttc tctgaggcct gagttgttca cagggcttag agctcctgcc agagggctgt 1260 tactctttgg tccacctggg aatgggaaga caatgctggc taaagcagta gctgcagaat cgaatgcaac cttctttaat ataagtgctg caagtttaac ttcaaaatac gtgggagaag 1380 gagagaaatt ggtgagggct ctttttgctg tggctcgaga acttcaacct tctataattt ttatagatga agttgatagc cttttgtgtg aaagaagaga aggggagcac gatgctagta 1500 gacgcctaaa aactgaattt ctaatagaat ttgatggtgt acagtctgct ggagatgaca 1560 gagtacttgt aatgggtgca actaataggc cacaagagct tgatgaggct gttctcaggc 1620 gtttcatcaa acgggtatat gtgtctttac caaatgagga gacaagacta cttttgctta aaaatctgtt atgtaaacaa ggaagtccat tgacccaaaa agaactagca caacttgcta gaatgactga tggatactca ggaagtgacc taacagcttt ggcaaaagat gcagcactgg 1800 gtcctatccg agaactaaaa ccagaacagg tgaagaatat gtctgccagt gagatgagaa 1860 atattcgatt atctgacttc actgaatcct tgaaaaaaat aaaacgcagc gtcagccctc 1920 aaactttaga agcgtacata cgttggaaca aggactttgg agataccact gtttaaggaa atacctttgt aaacctgcag aacattttac ttaaaagagg aaacacaaga tcttcaatga 2040 acgtcatcgg ctacagaaac agcctaagtt tacaggactt tttagagtct tacatatttg 2100 tgcaccaaac ttgaagatga accagaaaac agacttaaac aaaatataca atgcaaatgt 2160 aattttttgt tgtttaaggc cttgccttga tggtcacagt tatcccaatg gacactaagt 2220 tagagcacaa caaaacctga ttctggtctt ctttaccaat ataatcataa tgtaaataat 2280 cA 02348657 2001-11-07
38/66 aatttgtata ttgtgttgca gatgaaagta ttccaggaac agtgaatggt agaagacaca 2340 agaacatttg tttgtttgtc ttctgatgtt ttttcttaaa atagtaattt ctcctacttt 2400 tcttttctac tgttgtctta actacaggtg attggaatgc caaacactct taagtttatt ttcttttttc gttttataaa ttcagtgtgc caaatgaaac ttttttccta agtaactgta 2520 ataggaaaaa gtttattttg agagtttctt cttcataaat ctacagacat taaacaattg 2580 ttgtgttctt tttacctttt atttttctat taccttgcta ccaaacagtt tagatagcaa 2640 tataatagca aaaaagcaaa tatggtaaaa tagagaaggt ttgaaggttt gagttactct 2700 gtcatataac atgtagatca gtcttcatgt gacctgcagt attttttttt ctaatgtatt tgtcagaaat ctgttgtaga ctgttaactt cttcctgatg gaatttattt tctgcaagaa 2820 ttattctgat atttaagaga gccaatttta actgctgtga aaatgtttcc agtgcaagag 2880 aagggaaata ctaggaacta agacatttct aatttattgc ttattacttt cttaatttta 2940 caggataatt ataagcaagt ggaactacca tcttttattc ttaataatta ttaatccctt 3000 caatgaaact ttaaaaaaac tgaattttta tacatggcat acatttttct agttccttct 3060 gcttgcttta ttaactcaaa agttctagtt ctagtctgtt gatctgcctt ttgttctccc 3120 aaaatgtaca gtaattccat ttgtttgtat aaatatgcct ggattttcat tataaaaatg 3180 tcattgtagg gagtagagac tcatatcatg gccttttaaa tattgtaata aaggcaaata gatatttgcc cttagtttac tgg <210> 3 <211> 616 <212> PRT
<213> Homo sapiens <400> 3 Met Asn Ser Pro Gly Gly Arg Gly Lys Lys Lys Gly Ser Gly Gly Ala Ser Asn Pro Val Pro Pro Arg Pro Pro Pro Pro Cys Leu Ala Pro Ala Pro Pro Ala Ala Gly Pro Ala Pro Pro Pro Glu Ser Pro His Lys Arg Asn Leu Tyr Tyr Phe Ser Tyr Pro Leu Phe Val Gly Phe Ala Leu Leu Arg Leu Val Ala Phe His Leu Gly Leu Leu Phe Val Trp Leu Cys Gln Arg Phe Ser Arg Ala Leu Met Ala Ala Lys Arg Ser Ser Gly Ala Ala Pro Ala Pro Ala Ser Ala Ser Ala Pro Ala Pro Val Pro Gly Gly Glu Ala Glu Arg Val Arg Val Phe His Lys Gln Ala Phe Glu Tyr Ile Ser Ile Ala Leu Arg Ile Asp Glu Asp Glu Lys Ala Gly Gln Lys Glu Gln Ala Val Glu Trp Tyr Lys Lys Gly Ile Glu Glu Leu Glu Lys Gly Ile Ala Val Ile Val Thr Gly Gln Gly Glu Gln Cys Glu Arg Ala Arg Arg cA 02348657 2001-11-07
39/66 Leu Gin Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu Gin Leu Leu Glu Lys Met Gin Pro Val Leu Pro Phe Ser Lys Ser Gin Thr Asp Val Tyr Asn Asp Ser Thr Asn Leu Ala Cys Arg Asn Gly His Leu Gin Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr His Thr Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Met Lys Thr Gly Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Tyr Ser Gly Leu Ser Met Val Ser Gly Val Lys Gin Gly Ser Gly Pro Ala Pro Thr Thr His Lys Gly Thr Pro Lys Thr Asn Arg Thr Asn Lys Pro Ser Thr Pro Thr Thr Ala Thr Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val Asp Ser Asn Leu Ala Asn Leu lie Met Asn Glu lie Val Asp Asn Gly Thr Ala Val Lys Phe Asp Asp lie Ala Gly Gin Asp Leu Ala Lys Gin Ala Leu Gin Glu lie Val lie Leu Pro Ser Leu Arg Pro Glu Leu Phe Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn Ala Thr Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu Leu Gin Pro Ser lie Ile Phe Ile Asp Glu Val Asp Ser Leu Leu Cys Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu ,
40/66 Phe Leu Ile Glu Phe Asp Gly Val Gln Ser Ala Gly Asp Asp Arg Val Leu Val Met Gly Ala Thr Asn Arg Pro Gln Glu Leu Asp Glu Ala Val Leu Arg Arg Phe lie Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gln Gly Ser Pro Leu Thr Gln Lys Glu Leu Ala Gln Leu Ala Arg Met Thr Asp Gly Tyr Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro Ile Arg Glu Leu Lys Pro Glu Gln Val Lys Asn Met Ser Ala Ser Glu Met Arg Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys lie Lys Arg Ser Val Ser Pro Gln Thr Leu Glu Ala Tyr Ile Arg Trp Asn Lys Asp Phe Gly Asp Thr Thr Val <210> 4 <211> 23 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 4 cggagctcct cttggctgcc atg 23 <210> 5 <211> 26 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 5 agaagcgctg gcagagccac acgaag 26 <210> 6 <211> 27 <212> ADN
,
41/66 <213> Séquence artificielle <220>
<223> Amorce <400> 6 aaggcgacca aacgcagcag cgcgaag 27 <210> 7 <211> 26 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 7 aggagcaagc tgtggaatgg tataag 26 <210> 8 <211> 27 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 8 tggttatggc caaggaccgc ttacaac 27 <210> 9 <211> 26 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 9 caaacggacg tctataatga cagtac 26 <210> 10 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 10 ttaggaatgt ggacagcaac cttgc 25 <210> 11 <211> 25 <212> ADN
<213> Séquence artificielle
42/66 <220>
<223> Amorce <400> 11 cttctctgag gcctgagttg ttcac 25 <210> 12 <211> 27 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 12 tgctagaatg actgatggat actcagg 27 <210> 13 <211> 24 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 13 agatgcagca ctgggtccta tccg 24 <210> 14 <211> 26 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 14 atgaacgtca tcggctacag aaacag 26 <210> 15 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 15 tagcagtggc tgccgccgt 19 <210> 16 <211> 20 <212> ADN
<213> Séquence artificielle
43/66 <220>
<223> Amorce <400> 16 aagcggtcct tggccataac 20 <210> 17 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 17 ggcggcagtg agagctgtg 19 <210> 18 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 18 ctagctcttt cacactgttc 20 <210> 19 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 19 aacaggcctt cgagtacatc 20 <210> 20 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 20 ctgtgaacaa ctcaggcctc 20 <210> 21 <211> 20 <212> ADN
<213> Séquence artificielle <220>

=
44/66 <223> Amorce <400> 21 atgagaaagc aggacagaag 20 <210> 22 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 22 tgccaagtct tgaccagc 18 <210> 23 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 23 ctacaactgc tactcgtaag 20 <210> 24 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 24 cagtgctgca tcttttgcc 19 <210> 25 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 25 taggaatgtg gacagcaacc 20 <210> 26 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce
45/66 <400> 26 aaagctgtta ggtcacttcc 20 <210> 27 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 27 tggagatgac agagtacttg 20 <210> 28 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 28 ctggaatact ttcatctgc 19 <210> 29 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 29 atgaggctgt tctcaggcg 19 <210> 30 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 30 gtgagccgaa ctgcacattg 20 <210> 31 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce _
46/66 <400> 31 caaagtcgac agctacagtg c 21 <210> 32 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 32 ggaactgtag ttgagtggga 20 <210> 33 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 33 agatgaggct ccgacctac 19 <210> 34 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 34 aatgccacac ttgtaatctc 20 <210> 35 <211> 22 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 35 tgtgaatata tcataatttg gg 22 <210> 36 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 36
47/66 tacagcagtt ctcatgatg 19 <210> 37 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 37 gaccaaattg gtgcatgcat g 21 <210> 38 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 38 acatttccaa tacatcccac 20 <210> 39 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 39 atttgtcatt tcacatgcac 20 <210> 40 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 40 ttagaatgac tatacctgac 20 <210> 41 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 41 tcaggttaag taagactc 18 =
48/66 <210> 42 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 42 ttcctatcta cctagtgac 19 <210> 43 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 43 ttttatagca agttgccctg 20 <210> 44 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 44 cctatgaaga tcctggtac 19 <210> 45 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 45 tgtcatgatt ctaacaaggg 20 <210> 46 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 46 tctatttcac tcctgacatg 20 _ _
49/66 <210> 47 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 47 gtcatagggc ttaggcttc 19 <210> 48 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 48 atcatactac ccacttttcc 20 <210> 49 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 49 tgtttgggaa gatgctactg 20 <210> 50 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 50 ctactgaaga taacgtacat g 21 <210> 51 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 51 cattgattgc catgtattgg 20 <210> 52
50/66 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 52 agaaggccag aaatactcag 20 <210> 53 <211> 22 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 53 gtacttaaat cggtaaatat gg 22 <210> 54 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 54 ctcaagtctt aggaatgcag 20 <210> 55 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 55 gcacttaacc aggctgtatg 20 <210> 56 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 56 ctcagatgac tcacatagc 19 <210> 57 <211> 22 _ _
51/66 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 57 ctttactaga ctaattctcc tg <210> 58 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 58 cagattcaag aagacagatc <210> 59 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 59 gcaataattc accacacttg <210> 60 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 60 ggtagttctt gtttctgctc <210> 61 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 61 caagtgtggt gaattattgc <210> 62 <211> 19 <212> ADN
52/66 <213> Séquence artificielle <220>
<223> Amorce <400> 62 gagctgaaaa gtattcagc 19 <210> 63 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 63 tgcaaaggac atagccagtg 20 <210> 64 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 64 agcctctgga gatagtatgc 20 <210> 65 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 65 ctagaacagg ggtcacagtc 20 <210> 66 <211> 18 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 66 ttggacttct taaacttc 18 <210> 67 <211> 21 <212> ADN
<213> Séquence artificielle
53/66 <220>
<223> Amorce <400> 67 gcagtatgca agaaattgaa c 21 <210> 68 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 68 ggcctgtaat tttcttctg 19 <210> 69 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 69 gtactgaata gatacatgta g 21 <210> 70 <211> 19 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 70 gtgtagcaga tcaacatag 19 <210> 71 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Amorce <400> 71 catcttcaag tttggtgcac 20 <210> 72 <211> 1689 <212> ADN
<213> Mus musculus cA 02348657 2001-11-07
54/66 <220>
<223> ADN Spg4 incomplet.
<400> 72 aggccgagag cgtccgcgtc ttccacaagc aggccttcga gtacatctcc attgccctgc 60 gcatcgacga ggaagagaaa gcaggacaga aggaacaagc tgtggaatgg tataagaaag 120 gtatcgaaga actggaaaaa ggaatcgctg ttatagttac gggccaaggt gaacagtatg 180 aaagagctag acgtcttcaa gccaaaatga tgactaattt agttatggcc aaggaccgtt 240 tacaacttct agagaagctg caaccagttt tgcaattttc caagtcacag acggacgtct 300 ataacgagag tactaacctg acatgccgca atggacatct ccagtcagaa agtggagcag 360 ttccgaagag gaaagacccc ttaacacatg ctagtaattc attgcctcga tcaaaaactg 420 tcctgaaaag tggctccgca gggctctccg gtcaccacag ggcgcctagt tgcagtggtt 480 tgtccatggt ttctggagca agaccgggac ctggtcctgc agctaccaca cataagggta 540 ctccaaaacc aaatagaacc aacaaacctt ctactcccac aactgcagtt cggaaaaaga 600 aagacttgaa aaattttagg aatgtggaca gcaatcttgc taaccttata atgaatgaaa 660 ttgttgacaa tgggacagct gttaagtttg atgacatagc cgggcaggag ctggcaaagc 720 aagcgctgca ggagattgtc atccttcctt ctctgcggcc tgagttgttc acagggctca 780 gagctcctgc tagaggcttg ttactcttcg gtccgccagg aaacggaaaa acaatgctgg 840 ctaaagcagt agctgcagag tctaatgcga cctttttcaa cataagtgct gccagtttaa 900 cttcaaaata tgtgggagaa ggagagaaat tggtgagagc tctctttgct gtggctcgag 960 aacttcaacc atctataatt tttatagatg aagttgacag tcttttgtgt gagagacggg 1020 aaggggagca cgacgctagc agacggctaa agacggaatt tttaatagaa tttgacgggg 1080 tgcaatctgc tggagatgac agagtacttg taatgggtgc aactaacagg ccccaagagc 1140 ttgatgaagc tgttctcagg cgtttcatta aacgggtata tgtgtcctta ccaaatgagg 1200 agacaagact ccttctgctt aaaaacctgt tgtgtaaaca aggaagtcca ctgacccaaa 1260 aagaactcgc acagcttgct agaatgaccg atggatactc tggaagtgat ctgaccgctt 1320 tggccaagga tgcagccctg ggtcctatcc gagaactgaa gccagagcag gtgaagaata 1380 tgtctgccag tgagatgaga aatattcgat tatctgactt cacagaatcc ttaaaaaaga 1440 taaaacgcag tgtgagtcct cagaccttag aagcatacat acgctggaac aaggattttg 1500 gagacaccac tgtttaaagg aatggatgcc tctgtgagcc catagaacat cgcacttcac 1560 aggaaacaag agctttggct acaggaaccc agacttcgtt tacaggacgt tttagagttt 1620 tcatttttgt gcaccaaact tgaagaggaa caagaagaca gacctaaata aaatatgcaa 1680 tatgaatgg 1689 <210> 73 <211> 504 <212> PRT
<213> Mus musculus <220>
<223> Spastin murine incomplète.
<400> 73 Ala Glu Ser Val Arg Val Phe His Lys Gin Ala Phe Glu Tyr lie Ser Ile Ala Leu Arg lie Asp Glu Glu Glu Lys Ala Gly Gin Lys Glu Gin Ala Val Glu Trp Tyr Lys Lys Gly lie Glu Glu Leu Glu Lys Gly Ile Ala Val lie Val Thr Gly Gln Gly Glu Gin Tyr Glu Arg Ala Arg Arg cA 02348657 2001-11-07
55/66 Leu Gln Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu Gln Leu Leu Glu Lys Leu Gln Pro Val Leu Gln Phe Ser Lys Ser Gln Thr Asp Val Tyr Asn Glu Ser Thr Asn Leu Thr Cys Arg Asn Gly His Leu Gln Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr His Ala Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Leu Lys Ser Gly Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Cys Ser Gly Leu Ser Met Val Ser Gly Ala Arg Pro Gly Pro Gly Pro Ala Ala Thr Thr His Lys Gly Thr Pro Lys Pro Asn Arg Thr Asn Lys Pro Ser Thr Pro Thr Thr Ala Val Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val Asp Ser Asn Leu Ala Asn Leu lie Met Asn Glu Ile Val Asp Asn Gly Thr Ala Val Lys Phe Asp Asp lie Ala Gly Gln Glu Leu Ala Lys Gln Ala Leu Gln Glu lie Val Ile Leu Pro Ser Leu Arg Pro Glu Leu Phe Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn Ala Thr Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu Leu Gln Pro Ser Ile Ile Phe lie Asp Glu Val Asp Ser Leu Leu Cys Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu _ _
56/66 Phe Leu Ile Glu Phe Asp Gly Val Gin Ser Ala Gly Asp Asp Arg Val Leu Val Met Gly Ala Thr Asn Arg Pro Gin Glu Leu Asp Glu Ala Val Leu Arg Arg Phe Ile Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gin Gly Ser Pro Leu Thr Gin Lys Glu Leu Ala Gln Leu Ala Arg Met Thr Asp Gly Tyr Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro Ile Arg Glu Leu Lys Pro Glu Gin Val Lys Asn Met Ser Ala Ser Glu Met Arg Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys Ile Lys Arg Ser Val Ser Pro Gin Thr Leu Glu Ala Tyr Ile Arg Trp Asn Lys Asp Phe Gly Asp Thr Thr Val <210> 74 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 74 attttttatt ttaaagcagg acag 24 <210> 75 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 75 aatttttttc tttcaggtga acag 24
57/66 <210> 76 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 76 cttctctgtt gcatagagaa gatg 24 <210> 77 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 77 actttttcct tgtcagaaag tgga 24 <210> 78 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 78 ttttgtatcc tttaagggta ctcc 24 <210> 79 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 79 aggtcttgtt tcttagtgga acag 24 <210> 80 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
58/66 <400> 80 agtatatatt ttttagttgt tcac 24 <210> 81 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 81 cttgtgattt ttaaaggcta aagc 24 <210> 82 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 82 taatgctttg ttttaggtgg gaga 24 <210> 83 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 83 cttgtatttc ctctagatga agtt 24 <210> 84 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 84 gattttttgc ttgtaggtac agtc 24 <210> 85 <211> 24 <212> ADN
59/66 <213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 85 ggattttttt ttttaggcgt ttca 24 <210> 86 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 86 ttttaatatt tttcagacaa gact 24 <210> 87 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 87 tccttccctt cctcagaatg actg 24 <210> 88 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 88 cttttatgtt ttacagaact aaaa 24 <210> 89 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site accepteur d'épissage du gène SPG4.
<400> 89 ctttttaaaa atctagatga gaaa 24
60/66 <210> 90 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 90 tgagaaaggt aactaggggg ctgg 24 <210> 91 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 91 aggacaaggt aagattgtat ttgt 24 <210> 92 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 92 acttctaggt atcaattaat gtat 24 <210> 93 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 93 ccagtcaggt gggtttaggt taac 24 <210> 94 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
61/66 <400> 94 ctcataaggt attctgggac agta 24 <210> 95 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 95 gtggacaagt aagttttgcc atct 24 <210> 96 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 96 ggcctgaggt aagaacttta tatt 24 <210> 97 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 97 caatgctggt aagggttctc ttca 24 <210> 98 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 98 caaaatacgt gagtgctctg tttc 24 <210> 99 <211> 24 <212> ADN
62/66 <213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 99 ttttataggt aagaacatat tttc 24 <210> 100 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 100 ttgatggtgt aagtgttgat tatg 24 <210> 101 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 101 gttctcaggt agggagattt atat 24 <210> 102 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 102 atgaggaggt atgtatctgt gttt 24 <210> 103 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 103 cttgctaggt gagtaatttg gatt 24 <210> 104 cA 02348657 2001-11-07 -
63/66 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 104 tatccgaggt aggtatacaa gagc 24 <210> 105 <211> 24 <212> ADN
<213> Homo sapiens <220>
<223> Site donneur d'épissage du gène SPG4.
<400> 105 ccagtgaggt atagtatttt acaa 24 <210> 106 <211> 2152 <212> ADN
<213> Mus musculus <220>
<223> ADN Spg4 complet <400> 106 gctcccgggc tccggcgggc gcgcgagcgg ctccgtgggc ccccgccgcc gcagtggcag 60 tggccgccgc cgccgcttgg tcgccgtcgg tctgcgggaa gcgggttatg gcggcggcgg 120 cagtgggagc tgtgaatgag ttctccggcc ggacgacgga agaagaaagg ctcgggcggc 180 gcgagcccgg cgcccgccag gcctccgccc cccgccgcgg tccccgcccc tgccgccggc 240 ccggcccctg cggccggctc gccgcctaag cggaacctgt cttctttctc gtccccgctg 300 gtcgtcggct tcgccctgct gcgcctgctg gcctgccacc tggggctcct cttcgcgtgg 360 ctctgccagc gcttctcccg cgccctcatg gccgccaaga ggagctccgg gaccgcgccg 420 gcgcccgcct cgccctcgcc cccagcgccc ggaccgggtg gcgaggccga gagcgtccgc 480 gtcttccaca agcaggcctt cgagtacatc tccattgccc tgcgcatcga cgaggaagag 540 aaagcaggac agaaggaaca agctgtggaa tggtataaga aaggtatcga agaactggaa 600 aaaggaatcg ctgttatagt tacgggccaa ggtgaacagt atgaaagagc tagacgtctt 660 caagccaaaa tgatgactaa tttagttatg gccaaggacc gtttacaact tctagagaag 720 ctgcaaccag ttttgcaatt ttccaagtca cagacggacg tctataacga gagtactaac 780 ctgacatgcc gcaatggaca tctccagtca gaaagtggag cagttccgaa gaggaaagac 840 cccttaacac atgctagtaa ttcattgcct cgatcaaaaa ctgtcctgaa aagtggctcc 900 gcagggctct ccggtcacca cagggcgcct agttgcagtg gtttgtccat ggtttctgga 960 gcaagaccgg gacctggtcc tgcagctacc acacataagg gtactccaaa accaaataga 1020 accaacaaac cttctactcc cacaactgca gttcggaaaa agaaagactt gaaaaatttt 1080 aggaatgtgg acagcaatct tgctaacctt ataatgaatg aaattgttga caatgggaca 1140 gctgttaagt ttgatgacat agccgggcag gagctggcaa agcaagcgct gcaggagatt 1200 gtcatccttc cttctctgcg gcctgagttg ttcacagggc tcagagctcc tgctagaggc 1260 ttgttactct tcggtccgcc aggaaacgga aaaacaatgc tggctaaagc agtagctgca 1320 gagtctaatg cgaccttttt caacataagt gctgccagtt taacttcaaa atatgtggga 1380 gaaggagaga aattggtgag agctctcttt gctgtggctc gagaacttca accatctata 1440 cA 02348657 2001-11-07
64/66 atttttatag atgaagttga cagtcttttg tgtgagagac gggaagggga gcacgacgct 1500 agcagacggc taaagacgga atttttaata gaatttgacg gggtgcaatc tgctggagat 1560 gacagagtac ttgtaatggg tgcaactaac aggccccaag agcttgatga agctgttctc 1620 aggcgtttca ttaaacgggt atatgtgtcc ttaccaaatg aggagacaag actccttctg 1680 cttaaaaacc tgttgtgtaa acaaggaagt ccactgaccc aaaaagaact cgcacagctt 1740 gctagaatga ccgatggata ctctggaagt gatctgaccg ctttggccaa ggatgcagcc 1800 ctgggtccta tccgagaact gaagccagag caggtgaaga atatgtctgc cagtgagatg 1860 agaaatattc gattatctga cttcacagaa tccttaaaaa agataaaacg cagtgtgagt 1920 cctcagacct tagaagcata catacgctgg aacaaggatt ttggagacac cactgtttaa 1980 aggaatggat gcctctgtga gcccatagaa catcgcactt cacaggaaac aagagctttg 2040 gctacaggaa cccagacttc gtttacagga cgttttagag ttttcatttt tgtgcaccaa 2100 acttgaagag gaacaagaag acagacctaa ataaaatatg caatatgaat gg 2152 <210> 107 <211> 614 <212> PRT
<213> Mus musculus <220>
<223> Spastin murine complète <400> 107 Met Ser Ser Pro Ala Gly Arg Arg Lys Lys Lys Gly Ser Gly Gly Ala Ser Pro Ala Pro Ala Arg Pro Pro Pro Pro Ala Ala Val Pro Ala Pro Ala Ala Gly Pro Ala Pro Ala Ala Gly Ser Pro Pro Lys Arg Asn Leu Ser Ser Phe Ser Ser Pro Leu Val Val Gly Phe Ala Leu Leu Arg Leu Leu Ala Cys His Leu Gly Leu Leu Phe Ala Trp Leu Cys Gln Arg Phe
65 70 75 80 Ser Arg Ala Leu Met Ala Ala Lys Arg Ser Ser Gly Thr Ala Pro Ala Pro Ala Ser Pro Ser Pro Pro Ala Pro Gly Pro Gly Gly Glu Ala Glu Ser Val Arg Val Phe His Lys Gln Ala Phe Glu Tyr Ile Ser Ile Ala Leu Arg Ile Asp Glu Glu Glu Lys Ala Gly Gln Lys Glu Gln Ala Val Glu Trp Tyr Lys Lys Gly Ile Glu Glu Leu Glu Lys Gly Ile Ala Val Ile Val Thr Gly Gln Gly Glu Gln Tyr Glu Arg Ala Arg Arg Leu Gln cA 02348657 2001-11-07 Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu Gin Leu Leu Glu Lys Leu Gin Pro Val Leu Gin Phe Ser Lys Ser Gin Thr Asp Val Tyr Asn Glu Ser Thr Asn Leu Thr Cys Arg Asn Gly His Leu Gin Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr His Ala Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Leu Lys Ser Gly Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Cys Ser Gly Leu Ser Met Val Ser Gly Ala Arg Pro Gly Pro Gly Pro Ala Ala Thr Thr His Lys Gly Thr Pro Lys Pro Asn Arg Thr Asn Lys Pro Ser Thr Pro Thr Thr Ala Val Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val Asp Ser Asn Leu Ala Asn Leu Ile Met Asn Glu lie Val Asp Asn Gly Thr Ala Val Lys Phe Asp Asp Ile Ala Gly Gin Glu Leu Ala Lys Gin Ala Leu Gin Glu lie Val lie Leu Pro Ser Leu Arg Pro Glu Leu Phe Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn Ala Thr Phe Phe Asn lie Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu Leu Gin Pro Ser lie Ile Phe lie Asp Glu Val Asp Ser Leu Leu Cys Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu Phe Leu Ile Glu Phe Asp Gly Val Gin Ser Ala Gly Asp Asp Arg Val Leu Val cA 02348657 2001-11-07
66/66 Met Gly Ala Thr Asn Arg Pro Gin Glu Leu Asp Glu Ala Val Leu Arg Arg Phe Ile Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gin Gly Ser Pro Leu Thr Gln Lys Glu Leu Ala Gin Leu Ala Arg Met Thr Asp Gly Tyr Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro Ile Arg Glu Leu Lys Pro Glu Gin Val Lys Asn Met Ser Ala Ser Glu Met Arg Asn lie Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys Ile Lys Arg Ser Val Ser Pro Gin Thr Leu Glu Ala Tyr Ile Arg Trp Asn Lys Asp Phe Gly Asp Thr Thr Val

Claims (36)

REVENDICATIONS
1. Acide nucléique purifié ou isolé du gène SPG4 caractérisé en ce qu'il comprend une séquence choisie parmi le groupe consistant en:
a) la séquence SEQ ID NO :1, ou la séquence SEQ ID NO :2, et b) la séquence ADN complémentaire ou la séquence ARN transcrit à partir des séquences telles que définies en a).
2. L'acide nucléique purifié ou isolé selon la revendication 1, caractérisé en ce qu'il comprend au moins une séquence d'au moins 15 nucléotides (nt) consécutifs, du fragment nt 714-809, extrémités incluses, de la séquence SEQ ID NO :2, de sa séquence complémentaire ou de la séquence de son ARN correspondant.
3. L'acide nucléique purifié ou isolé selon la revendication 1 ou 2, caractérisé
en ce qu'il comprend une mutation listée dans le tableau 5.
4. Sonde ou amorce caractérisée en ce que sa séquence est choisie parmi les séquences SEQ ID NO :4 à SEQ ID NO :71.
5. Site accepteur ou donneur d'épissage, caractérisé en ce qu'il comprend une séquence d'un acide nucléique selon la revendication 1 choisie parmi les séquences SEQ ID NO :74 à SEQ ID NO :105.
6. Polypeptide codé par un acide nucléique comprenant SEQ ID NO :1 ou SEQ ID NO :2.
7. Polypeptide selon la revendication 6, caractérisé en ce qu'il comprend une séquence d'acides aminés comprenant la séquence SEQ ID NO :3.
8. Polypeptide selon la revendication 6, caractérisé en ce qu'il comprend la séquence d'au moins 8 acides aminés (aa) consécutifs de la séquence du fragment aa 197- 228, extrémités incluses, de la séquence SEQ ID NO :3.
9. Polypeptide selon la revendication 6, caractérisé en ce qu'il comprend une séquence d'acides aminés comprenant la séquence SEQ ID NO :3, laquelle séquence contient au moins une des mutations listée dans le tableau 5.
10. Vecteur de clonage ou d'expression contenant une séquence d'acide nucléique selon la revendication 1.
11. Vecteur selon la revendication 10, caractérisé en ce qu'il comporte les éléments nécessaires à son expression dans une cellule hôte.
12. Cellule hôte transformée par un vecteur selon la revendication 10 ou 11.
13. Méthode de production d'un polypeptide recombinant, caractérisée en ce que l'on cultive une cellule transformée selon la revendication 12 dans des conditions permettant l'expression dudit polypeptide recombinant et que l'on récupère ledit polypeptide recombinant.
14. Polypeptide, caractérisé en ce qu'il est obtenu par une méthode selon la revendication 13.
15. Méthode pour la détection d'un polypeptide selon l'une quelconque des revendications 6 à 9 et 14, comprenant les étapes :
1) obtention d'anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide comprenant tout ou partie de SEQ ID
NO :3, et 2) analyse par immunohistochimie ou immunocytochimie de l'expression dudit polypeptide au moyen desdits anticorps.
16. Méthode de diagnostic génotypique de la paraplégie spastique familiale transmise selon le mode autosomique dominant (PSF-AD) à partir d'un prélèvement biologique d'un patient, caractérisée en ce qu'elle comporte les étapes suivantes:
a) isolement de l'ADN génomique à partir de l'échantillon biologique à
analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique;

b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon la revendication 4; et c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4, dans laquelle la présence d'au moins une mutation dans la séquence d'acide nucléique comprenant SEQ ID NO :1 ou SEQ ID NO :2 signifie que ledit patient souffre de PSF-AD, ladite mutation correspondant à une troncation, une délétion, une substitution ou une insertion de un ou plus acide(s) aminé(s) dans la protéine de spastine encodée.
17. Méthode de diagnostic de la paraplésie spastique familiale transmise selon le mode autosomique dominant (PSF-AD), caractérisée en ce que l'on met en contact un matériel biologique avec un ou des anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaitre spécifiquement un polypeptide comprenant tout ou partie de SEQ ID NO :3, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte ou quantifie les complexes immunologiques éventuellement formés, dans laquelle une expression anormale d'un polypeptide codé par le gène SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 signifie que ledit patient souffre de PSF-AD.
18. Méthode pour la détection d'un ou plusieurs polymorphismes dans le gène SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 dans un matériel biologique humain, la méthode comprenant les étapes suivantes:
a) isolement de l'ADN dudit matériel biologique ou obtention d'un ADNc à
partir de l'ARNm dudit matériel biologique;
b) amplification dudit ADN ou ADNc pour obtenir un produit d'amplification;
c) séquençage du produit d'amplification, obtenant une séquence d'ADN du produit d' amplification; et d) comparaison de la séquence d'ADN du produit d'amplification avec la séquence d'ADN du gène SPG4 sauvage, caractérisée en ce que si la séquence d'ADN du produit d'amplification est différente de la séquence d'ADN du gène SPG4 sauvage, il y a présence d'un ou de plusieurs polymorphismes dans le gène SPG4 dans le matériel biologique humain.
19. La méthode selon la revendication 18, caractérisée en ce que le matériel biologique est un matériel biologique humain anténatal.
20. La méthode selon l'une quelconque des revendications 18 à 19, caractérisée en ce que le matériel biologique comprend des lymphoblastes.
21. La méthode selon l'une quelconque des revendications 18 à 20, caractérisée en ce que l'étape d'amplification de l'ADN est effectuée à l'aide d'une méthode d'amplification sélectionnée parmi le PCR, l'amplification à
déplacement de brin, la technique TAS (Transcription-based Amplification System), la technique 35R
(Self-Sustained Sequence Replication), la technique NASBA (Nucleic Acid Sequence Based Amplification), la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain Reaction) et la technique CPR (Cycling Probe Reaction).
22. La méthode selon la revendication 18, caractérisée en ce que l'amplification de l'ADN du matériel biologique est effectuée avec au moins une amorce comprenant une séquence choisie parmi les séquences SEQ ID NO :4 à SEQ
ID NO :71.
23. Méthode pour la détection d'un ou plusieurs polymorphismes dans le gène SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 dans un matériel biologique humain, la méthode comprenant les étapes suivantes:
a) isolement de l'ADN dudit matériel biologique, ou obtention d'un ADNc à
partir de l'ARNm dudit matériel biologique, b) amplification dudit ADN ou ADNc pour obtenir un produit d'amplification;

c) hybridation du produit d'amplification avec une amorce qui hybride spécifiquement avec l'ADN du gène SPG4 sauvage, produisant un produit d'hybridation; et d) détection d'un ou plusieurs mésappariements dans le produit d'hybridation, caractérisée en ce que la présence d'un ou de plusieurs mésappariements dans le produit d'hybridation est indicatif de la présence d'un ou plusieurs polymorphismes dans le gène SPG4 dans le matériel biologique humain.
24. La méthode selon la revendication 23, caractérisée en ce que le matériel biologique est un matériel biologique humain anténatal.
25. La méthode selon l'une quelconque des revendications 23 à 24, caractérisée en ce que le matériel biologique comprend des lymphoblastes.
26. La méthode selon l'une quelconque des revendications 23 à 25, caractérisée en ce que l'étape d'amplification de l'ADN est effectuée à l'aide d'une méthode d'amplification sélectionnée parmi le PCR, l'amplification à
déplacement de brin, la technique TAS (Transcription-based Amplification System), la technique 3SR
(Self-Sustained Sequence Replication), la technique NASBA (Nucleic Acid Sequence Based Amplification), la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain Reaction) et la technique CPR (Cycling Probe Reaction).
27. La méthode selon la revendication 25, caractérisée en ce que l' amplification de l'ADN du matériel biologique est effectuée avec au moins une amorce comprenant une séquence choisie parmi les séquences SEQ ID NO :4 à SEQ
ID NO :71.
28. Méthode de diagnostic de la présence ou l'absence de la paraplégie spastique familiale autosomique dominante chez un patient, la paraplégie spastique familiale autosomique dominante étant associée à la présence d'une mutation dans le gène SPG4 a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2, la méthode comprenant l'étape de détection de la présence ou l'absence d'une ou de plusieurs mutations dans le gène SPG4 dans un matériel biologique du patient, la présence d'une mutation est indicative que le patient est atteint de la paraplégie spastique familiale autosomique dominante, ladite mutation correspondant à une troncation, une délétion, une substitution ou une insertion de un ou plus acide(s) aminé(s) dans la protéine de spastine encodée.
29. La méthode selon la revendication 28, caractérisée en ce que l'étape de détection de la présence ou l'absence d'une ou de plusieurs mutations dans le gène SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 comprend les étapes suivantes :
a) isolement de l'ADN à partir dudit matériel biologique, ou obtention d'un ADNc à partir d'un ARNm à partir de l'ARNm dudit matériel biologique, b) amplification spécifique dudit ADN ou ADNc pour obtenir un produit d' amplification;
c) séquençage du produit d'amplification, obtenant une séquence d'ADN du produit d'amplification; et d) comparaison de la séquence d'ADN du produit d'amplification avec la séquence d'ADN du gène SPG4 sauvage, caractérisée en ce que si la séquence d'ADN du produit d'amplification est différente de la séquence d'ADN du gène SPG4 sauvage, il y a présence d'une ou de plusieurs mutations dans le gène SPG4 dans le matériel biologique du patient.
30. La méthode selon l'une quelconque des revendications 28 à 29, caractérisée en ce que le matériel biologique est un matériel biologique humain anténatal.
31. La méthode selon l'une quelconque des revendications 28 à 30, caractérisée en ce que le matériel biologique comprend des lymphoblastes.
32. La méthode selon l'une quelconque des revendications 28 à 31, caractérisée en ce que l'étape d'amplification de l'ADN est effectuée à l'aide d'une méthode d'amplification sélectionnée parmi le PCR, l'amplification à
déplacement de brin, la technique TAS (Transcription-based Amplification System), la technique 3SR
(Self-Sustained Sequence Replication), la technique NASBA (Nucleic Acid Sequence Based Amplification), la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction), la technique de RCR (Repair Chain Reaction) et la technique CPR (Cycling Probe Reaction).
33. La méthode selon la revendication 28, caractérisée en ce que l'amplification de l'ADN du matériel biologique est effectuée avec au moins une amorce comprenant une séquence choisie parmi les séquences SEQ ID NO :4 à SEQ
ID NO :71.
34. La méthode selon la revendication 28, caractérisée en ce que l'étape de détection de la présence ou l'absence d'une ou de plusieurs mutations dans le gène SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2 comprend les étapes suivantes :
a) amplification de l'ADN du matériel biologique pour obtenir un produit d' amplification;
b) hybridation du produit d'amplification avec une amorce qui hybride spécifiquement avec l'ADN du gène SPG4 sauvage, produisant un produit d'hybridation; et c) détection d'un ou plusieurs mésappariements dans le produit d'hybridation, caractérisée en ce que la présence d'un ou de plusieurs mésappariements dans le produit d'hybridation est indicatif de la présence d'une ou plusieurs mutations dans le gène SPG4 dans le matériel biologique du patient.
35. La méthode de détection selon la revendication 15, comprenant en outre l'étape de purifier ledit polypeptide desdits anticorps.
36. La méthode de diagnostic selon l'une quelconque des revendications 16 et 28, dans laquelle ladite mutation est choisie parmi :

Famille Localisation Mutation 624 exon 7 1210 C.fwdarw.G;
6958 exon 8 1233 G.fwdarw.A;
214 exon 8 1267 T.fwdarw.G;
1002 exon 8 1283 T.fwdarw.G;
027 exon 8 1288 A.fwdarw.G;
019 exon 10 1401 C.fwdarw.G;
4014 exon 11 1468 G.fwdarw.A;
148 exon 11 1504 G.fwdarw.T;
618 exon 13 1620 C.fwdarw.T;
636 exon 15 1788 G.fwdarw.A;
627 exon 15 1792 C.fwdarw.T;
2971 exon 3 702 C.fwdarw.T;
3655 exon 5 873 A.fwdarw.T;
1010 exon 5 907 C.fwdarw.A;
3938 exon 5 932 C.fwdarw.G;
6922 exon 10 1416 C.fwdarw.T;
616 exon 10 1416 C.fwdarw.T;
605 exon 15 1809 C.fwdarw.T;
030 exon 2 578-579insA;
615 exon 5 852del11;
042 exon 5 882-883insA;
032 exon 5 906delT;
189 exon 9 1299delG;
3686 exon 9 1340del5;
625 exon 9 1340del5;
A exon 11 1520delT;
115 exon 12 1574deIGG;
3266 exon 13 1634del22;
149 exon 14 1684-1685insTT;
645 exon 14 1685del4;
029 intron 4 808-2 a.fwdarw.g;
162 intron 6 1129+2 t.fwdarw.g;

125 intron 7 1223+1 g.fwdarw.t;
143 intron 8 1299+1 g.fwdarw.a;
1620 intron 11 1538+5 g.fwdarw.a;
1006 intron 11 1538+3 del4;
1605 intron 13 1661+1 g.fwdarw.t;
1012 intron 13 1662-2 a.fwdarw.t;
1626 intron 15 1812+1 g.fwdarw.a;
2992 intron 15 1813-2 a.fwdarw.g;
5226 intron 15 1813-2 a.fwdarw.g;
5330 intron 15 1813-2a.fwdarw.g; et 1611 intron 16 1853+1 g.fwdarw.a, les positions en nucléotide étant en référence à la séquence de l'ADNc SPG4 qui a pour séquence SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ADN
complémentaire à SEQ ID NO :1 ou SEQ ID NO :2 ou une séquence d'ARN
transcrite à partir des séquences SEQ ID NO :1 ou SEQ ID NO :2.
CA2348657A 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante Expired - Lifetime CA2348657C (fr)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CA2848454A CA2848454C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante.

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR9911097A FR2798138B1 (fr) 1999-09-03 1999-09-03 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
FR99/11097 1999-09-03
PCT/FR2000/002433 WO2001018198A1 (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CA2848454A Division CA2848454C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante.

Publications (2)

Publication Number Publication Date
CA2348657A1 CA2348657A1 (fr) 2001-03-15
CA2348657C true CA2348657C (fr) 2014-07-08

Family

ID=9549552

Family Applications (2)

Application Number Title Priority Date Filing Date
CA2348657A Expired - Lifetime CA2348657C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
CA2848454A Expired - Lifetime CA2848454C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante.

Family Applications After (1)

Application Number Title Priority Date Filing Date
CA2848454A Expired - Lifetime CA2848454C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante.

Country Status (5)

Country Link
US (2) US6924126B1 (fr)
JP (2) JP2003508074A (fr)
CA (2) CA2348657C (fr)
FR (1) FR2798138B1 (fr)
WO (1) WO2001018198A1 (fr)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007126916A2 (fr) * 2006-03-30 2007-11-08 Duke University Identification d'un nouveau gène sous-tendant la paraplégie spastique familiale
EP1897891A1 (fr) 2006-09-11 2008-03-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) Diagnose de paraplégie spastique héréditaire par detection d' une mutation dans le gene où la protéine KIAA1840
WO2009127211A1 (fr) * 2008-04-14 2009-10-22 Aarhus Universitet Procédés et kits de dépistage d'une démyélinisation spinale
JP6208104B2 (ja) * 2014-09-16 2017-10-04 株式会社日立製作所 生体認証システム、生体認証処理装置、生体認証方法、生体情報取得端末および情報端末
KR101889072B1 (ko) 2017-09-15 2018-08-16 한국생명공학연구원 디지털 PCR을 이용한 유전성 강직성 대마비(Hereditary spastic paraplegia, HSP) 관련 유전자 SPG4의 거대결손 검증법
CN117820470B (zh) * 2024-03-04 2024-05-31 暨南大学 人源性重组抗Spastin抗体及其制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6197551B1 (en) * 1998-01-27 2001-03-06 Millennium Pharmaceuticals, Inc. Spoil-1 protein and nucleic acid molecules and uses therefor
DE69837542T2 (de) * 1997-04-15 2008-01-31 Merck & Co, Inc. Ldl-rezeptor
JP2002504352A (ja) * 1998-02-23 2002-02-12 デイナ−ファーバー キャンサー インスティチュート,インコーポレイテッド ミスマッチ修復グリコシラーゼ反応性部位を同定する方法、化合物およびそれらの使用

Also Published As

Publication number Publication date
US20050266479A1 (en) 2005-12-01
WO2001018198A1 (fr) 2001-03-15
CA2348657A1 (fr) 2001-03-15
JP2011254824A (ja) 2011-12-22
CA2848454C (fr) 2018-04-17
FR2798138A1 (fr) 2001-03-09
JP5965594B2 (ja) 2016-08-10
JP2003508074A (ja) 2003-03-04
US6924126B1 (en) 2005-08-02
CA2848454A1 (fr) 2001-03-15
FR2798138B1 (fr) 2004-05-21

Similar Documents

Publication Publication Date Title
RU2735551C2 (ru) Композиции для модулирования экспрессии тау-белка
AU2023202878A1 (en) Methods for targeted insertion of DNA in genes
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
KR20130123357A (ko) 저산소증과 관련된 질환의 진단방법 및 키트
CN1423696A (zh) 人类精神分裂症基因
US20030235847A1 (en) Association of polymorphisms in the SOST gene region with bone mineral density
KR20220160053A (ko) 다발성 골수종에서의 면역요법 표적 및 그의 식별 방법
WO2006022629A1 (fr) Procédés d’identification de risque de diabète de type ii et leurs traitements
IL179831A (en) In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders
CA2348657C (fr) Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
KR20240032895A (ko) 미토겐-활성화된 단백질 키나제 키나제 키나제 15 (map3k15) 억제제를 이용한 대사 장애 치료 방법
US20040091497A1 (en) Schizophrenia-related voltage-gated ion channel gene and protein
CA2433869C (fr) Gene d&#39;identification d&#39;individus atteints de dysautonomie familiale
TWI358456B (en) Method of determining susceptibility of high myopi
CN111278468A (zh) 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞
KR102647919B1 (ko) App 돌연변이 세포 및 이의 이용
US20040138441A1 (en) Novel gene functionally related to dyslexia
US20020103115A1 (en) Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof
US20030203380A1 (en) Gene linked to osteoarthritis
KR20220063226A (ko) 메타데린 발현 억제제
US20030219787A1 (en) Novel human gene functionally related to dyslexia
CN115362255A (zh) 用无七之子2(sos2)抑制剂治疗眼科疾患
KR20220144837A (ko) Htt 발현을 감소시키기 위한 방법
US20040163137A1 (en) PG-3 and biallelic markers thereof
US20040191829A1 (en) Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof

Legal Events

Date Code Title Description
EEER Examination request
MKEX Expiry

Effective date: 20200904