CA2848454C

CA2848454C - Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante.

Info

Publication number: CA2848454C
Application number: CA2848454A
Authority: CA
Inventors: Jean Weissenbach; Jamile Hazan
Original assignee: Centre National de la Recherche Scientifique CNRS
Current assignee: Centre National de la Recherche Scientifique CNRS
Priority date: 1999-09-03
Filing date: 2000-09-04
Publication date: 2018-04-17
Anticipated expiration: 2020-09-04
Also published as: CA2348657C; US6924126B1; JP2011254824A; US20050266479A1; JP2003508074A; JP5965594B2; FR2798138A1; FR2798138B1; CA2848454A1; CA2348657A1; WO2001018198A1

Abstract

L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, et certaines de ses mutations responsables de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques, ainsi que des méthodes et trousse de diagnostic, et des méthodes de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.

Description

CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE
SPASTIQUE AUTOSOMIQUE DOMINANTE.
L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, responsable de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques ainsi que des méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé
chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.
Les paraplégies spastiques familiales (PSF) sont des affections dégénératives du système nerveux central caractérisées par une spasticité bilatérale et progressive des membres inférieurs. Elles se manifestent cliniquement par des difficultés de la marche pouvant évoluer en une paralysie totale des deux jambes. La physiopathologie de cet ensemble de 'maladies est à ce jour peu documentée ; toutefois, les données anatomopathologiques permettent de conclure que l'atteinte est limitée aux faisceaux pyramidaux responsables de la motricité volontaire dans la moelle épinière (Reid, 1997). Il existe différentes formes cliniques et génétiques de PSF. On distingue cliniquement les PSF dites pures correspondant à une spasticité isolée des membres inférieurs, des PSF complexes pour lesquelles la spasticité des jambes est associée à d'autres manifestations cliniques de type neurologique ou non (Bruyn et al., 1991). D'un point de vue génétique, les PSF peuvent être transmises selon le mode autosomique dominant (PSF-AD), autosomique récessif (PSF-AR) ou lié au chromosome X (PSF-X). La forme pure de PSF qui est le plus souvent transmise = selon le mode autosomique dominant demeure la plus fréquente (environ 80 % des PSF) (Reid, 1997). L'incidence des PSF qui reste difficile à estimer en raison des rares études épidémiologiques et de l'importante variabilité clinique varie de 0,9:
100 000 au Danemark, 3 à 9,6: 100 000 dans certaines régions d'Espagne (Polo et al.,1991) ou 14: 100 000 en Norvège (Skre, 1974) (environ 3 : 100 000 en France).
En plus de cette grande variabilité clinique qui est observée non seulement entre les différentes familles mais aussi entre différents membres atteints d'une même famille, les PSF se caractérisent également par une importante hétérogénéité
génétique. Dans le cas des PSF-AD, quatre bd ont été identifiés à ce jour sur les

2 chromosomes 14 (locus SPG3) (Hazan et al., 1993), 2 (locus SPG4) (Hazan et al., 1994 ; Hentali et al., 1994), 15 (locus SPG6) (Fink et al., 1995) et 8 (locus SPG8) (Hedera et al., 1999). L'étude d'un grand nombre de familles présentant une PSF-AD a montré que le gène porté par le chromosome 2 est un locus majoritaire de cette forme de la maladie, retrouvé dans 40 à 50 % des familles analysées (The Hereditary Spastic Paraplegia Working Group, 1996; Durr et al., 1996). Un phénomène d'anticipation a été observé dans certaines familles de PSF liée au locus SPG4 ; ce phénomène a par la suite été associé à l'expansion d'une répétition (CAG)n mise en évidence dans 6 familles danoises (Nielsen et al., 1997) par la technique de RED (pour Rapid Expansion Detection). Cette expansion n'a cependant jamais pu être confirmée dans aucune des familles testées par cette même méthode ni par la recherche systématique de séquences de type (CAG)n dans les cartes physiques composées de clones YAC
(pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosome) (Hazan et al., Genomics, 60 (3), 309-19, 1999).
A ce jour, trois gènes responsables de deux formes de PSF-X et d'une forme de PSF-AR ont été identifiés. Des mutations dans le gène, codant pour une molécule d'adhérence cellulaire spécifique des neurones, L1-CAM (pour L1 Cell Adhesion Molecule), et localisé en Xq28 (locus SPG1) causent une forme complexe de PSF
(Jouet et al., 1994) dans laquelle la spasticité est associée à un retard mental, alors que des mutations dans le gène PLP (pour ProteoLipid Protein) situé en Xq21 (locus SPG2), codant pour une molécule constitutive de la couche de myéline, sont à
l'origine de formes pures et complexes de PSF-X (Saugier-Veber, P. et al., 1994). Plus récemment des mutations dans un gène localisé en 16q24.3 (locus SPG7), qui code pour la paraplegin, une ATPase mitochondriale de la famille protéique des AAA
(pour ATPases Associated with diverse cellular Activities ) (Confalonieri et al., 1995) ont été associées à des formes complexes et pures de PSF-AR (Casari et al., 1998).

Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caractériser le gène responsable de la forme la plus fréquente de PSF-AD. L'identification de ce gène devrait en particulier permettre, outre la possibilité d'un test de dépistage anténatal chez les familles concernées, de mieux comprendre certains des mécanismes moléculaires engendrant ces dégénérescences spécifiques de faisceaux nerveux de la moelle épinière, voire d'apporter des éléments de réponse quant à un traitement thérapeutique des malades.
Ceci est justement l'objet de la présente invention.

3 Après avoir délimité l'intervalle de localisation entre les marqueurs génétiques D2S352 et D2S2347 par l'étude des évènements de recombinaison dans les familles de PSF liées au locus SPG4, les inventeurs ont établi un contig de BACs recouvrant une distance physique évaluée à environ 1,5 Mb et entrepris une stratégie de clonage positionnel basée sur le séquençage de l'intervalle SPG4 afin d'identifier de façon exhaustive tous les gènes localisés dans la région candidate. L'analyse de la séquence des deux BACs, D (b336P14) et G (B763N4), a révélé la présence d'un gène composé
de 17 exons, s'étendant sur une distance d'environ 100 kb, et présentant une homologie avec les gènes codant pour des protéines de la famille des AAA. La comparaison de la séquence de ce gène entre les individus sains et atteints des familles de PSF-AD a permis de mettre en évidence différentes mutations chez les patients.
L'invention a ainsi pour objet l'identification et la caractérisation du gène (ou SPAST) codant pour un nouveau membre nucléaire de la famille des AM, responsable de la forme la plus fréquente de PSF-AD.
Sous un premier aspect, la présente invention a pour objet un acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 35, 40, 45, 50, 75, 100 ou nucléotides consécutifs, d'une séquence choisie parmi le groupe comprenant :
- la séquence SEQ ID No. 1, séquence génomique du gène SPG4 humain ;
- les séquences nucléiques homologues ou variantes de l'acide nucléique de séquence SEQ ID No. 1;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
La présente invention concerne, bien entendu, aussi bien les séquences ADN
qu'ARN ainsi que les séquences qui s'hybrident avec elles, de même que les ADNs double brin correspondants.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entendra désigner aussi bien un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou de synthèse, comportant ou non des nucléotides non naturels, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique. On entend par fragment d'ADN
et/ou

4 d'ARN naturel isolé, ou de synthèse, comportant ou non des nucléotides non naturels, un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment, un segment ou une région d'un acide nucléique.
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à-dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié.
Par séquence nucléique homologue , on entendra désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique, et/ou une mutation, notamment ponctuelle, et dont la séquence nucléique présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence nucléique de référence.
Par pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à
comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Les comparaisons de séquences entre deux séquences d'acide nucléique ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L'alignement optimal des séquences pour la comparaison peut être réalisé, outre manuellement, au moyen de l'algorithme d'homologie locale de Smith et Waterman (1981) [Ad. App. Math. 2:482], au moyen de l'algorithme d'homologie locale de Neddleman et Wunsch (1970) [J. Mol. Biol.
48:443], au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988) [Proc. Natl. Acad. Sci. USA 85:2444], au moyen de logiciels informatiques utilisant ces algorithmes (GAP, BESTFIT, FASTA et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI, ou encore par les logiciels de comparaison BLAST N ou BLAST P).
Le pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés est déterminé en comparant ces deux séquences alignées de manière optimale par fenêtre de comparaison dans laquelle la région de la séquence d'acide nucléique ou d'acides aminés à comparer peut comprendre des additions ou des délétions par rapport à la séquence de référence pour un alignement optimal entre ces deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre de positions identiques pour lesquelles le nucléotide ou le résidu d'acide aminé
est

5 identique entre les deux séquences, en divisant ce nombre de positions identiques par le nombre total de positions dans la fenêtre de comparaison et en multipliant le résultat obtenu par 100 pour obtenir le pourcentage d'identité entre ces deux séquences.
Par exemple, on pourra utiliser le programme BLAST, BLAST 2 sequences (Tatusova et al., ''Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol. Lett. 174:247-250) disponible) les paramètres utilisés étant ceux donnés par défaut (en particulier pour les paramètres open gap penaltie : 5, et extension gap penaltie : 2 ; la matrice choisie étant par exemple la matrice BLOSUM 62 proposée par le programme), le pourcentage d'identité entre les deux séquences à
comparer étant calculé directement par le programme.
Il s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec une des séquences de l'invention. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 80 %, de préférence 90 % ou 95 % d'identité après alignement entre l'une des deux séquences et la séquence complémentaire de l'autre.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN
complémentaires.
A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits d-dessus, sont avantageusement les suivantes.
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42 C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCl + 0,015 M
citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardts, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i.e. : 42 C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20 C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20 C
en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 %
SDS

6 pendant 30 minutes à 60 C pour une sonde de taille> 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de taille définie, seront adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et ai, 1989.
Par séquence nucléique variante ou acide nucléique variant d'une séquence nucléique de référence, on entendra désigner l'ensemble des séquences nucléiques correspondant à des variants alléliques, c'est-à-dire des variations individuelles de la séquence nucléique de référence. Ces séquences mutées naturelles correspondent à des polymorphismes présents chez les mammifères, en particulier chez l'être humain et, notamment, à des polymorphismes pouvant conduire à la survenue et/ou au développement de pathologie.
Si les séquences selon l'invention concernent les séquences normales, elles concernent également les séquences mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10 % de mutations par rapport à la séquence normale.
En particulier, les séquences nucléiques variantes comprendront toute séquence d'au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 50, 100 ou 200 nucléotides consécutifs, d'une séquence polymorphique de la séquence génomique du gène SPG4 humain de séquence SEQ ID No. 1, et dont la séquence d'acide nucléique présente par rapport à la séquence SEQ ID No. 1 au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidu d'acide aminé. Dans le cas présent, les séquences nucléiques variantes présentant au moins une mutation seront ici liées aux pathologies de type PSF-AD liées au locus SPG4.
De préférence, la présente invention concerne des séquences nucléiques mutées dans lesquelles les mutations conduisent à une modification de la séquence d'acides aminés du polypeptide codé par la séquence normale.
On entendra également désigner par séquences nucléiques variantes tout ARN
ou ADNc résultant d'une mutation d'un site d'épissage de la séquence nucléique génomique SEQ ID No. 1.
De préférence, l'invention concerne un acide nucléique purifié ou isolé du gène =
SPG4 selon l'invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No.
72, la séquence SEQ ID No. 106 ou la séquence d'au moins 15, de préférence 20, 25,

7 30, 35, 40, 45, 50, 75, 100 ou 200 nucléotides consécutifs de la séquence SEQ
ID
No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
b) les séquences nucléiques homologues ou variantes des séquences SEQ ID No.
1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et c) la séquence complémentaire ou la séquence de l'ARN correspondant aux séquences telles que définies en a) et b), de préférence à l'exception de l'acide nucléique identifié dans la banque de données GenBank sous le numéro d'accession AB029006.
L'acide nucléique dont la séquence est divulguée dans la banque de données GenBank sous le numéro d'accession AB029006, correspond à la séquence de l'un des 100 ADNc issus d'une banque d'ARNm de cerveau humain identifiée par le Kazusa DNA Research Institute au Japon (Kikuno et al., DNA Resarch, 6, 197-205, 1999).
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une séquence d'au moins nucléotides consécutifs, de préférence 20, 25, 30, 50 ou 75 nucléotides consécutifs du fragment nt 714-809, extrémités incluses, de la séquence SEQ ID No. 2, de sa séquence complémentaire ou de la séquence de son ARN correspondant.
L'invention concerne de préférence un acide nucléique purifié ou isolé selon la présente invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe suivant :
- la séquence SEQ ID No. 1;
- la séquence SEQ ID No. 2, séquence de l'ADNc codant pour la spastin humaine ;
- les séquences SEQ ID No. 72 et SEQ ID No. 106, la séquence SEQ ID No. 72 représentant la séquence de l'ADNc incomplet codant pour la spastin murine représentée à la figure 5, ligne "Mouse" et la SEQ ID No. 106 sa séquence complète ;
- les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une mutation correspondant à
un polymorphisme naturel chez l'Homme, notamment dont la position et la nature sont identifiées dans le tableau 5.

8 Les amorces ou sondes, caractérisées en ce qu'elles comprennent une séquence d'un acide nucléique selon l'invention, font également partie de l'invention.
La présente invention concerne ainsi l'ensemble des amorces qui peuvent être déduites des séquences nucléotidiques de l'invention et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques de l'invention, en particulier les séquences mutées, en utilisant notamment une méthode d'amplification telle que la méthode PCR, ou une méthode apparentée.
La présente invention concerne également l'ensemble des sondes qui peuvent être déduites des séquences nucléotidiques de l'invention, notamment des séquences capables de s'hybrider avec elles, et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques, en particulier de discriminer les séquences normales des séquences mutées.
La présente invention concerne en particulier les sondes ou amorces de séquences choisies parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce, pour la détection, l'identification, le dosage ou l'amplification de séquence d'acide nucléique.
Selon l'invention, les polynucléotides pouvant être utilisés comme sonde ou comme amorce dans des procédés de détection, d'identification, de dosage ou d'amplification de séquence nucléique, présenteront une taille minimale de 15 bases, de préférence de 20 bases, ou mieux de 25 à 30 bases.
L'ensemble des sondes et amorces selon l'invention pourront être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable.
Les séquences de polynucléotides selon l'invention non marquées peuvent être utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 3S, le 31-1 ou le 1251. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents

9 luminescents tels que les agents radioluminescents, chémiluminescents, bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR
(réaction en chaîne à la polymérase) (Erlich, 1989; Innis et al., 1990, et Rolfs et al., 1991). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la technique décrite dans le brevet américain U.S. N 4,683,202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquencés. La spécificité de l'amplification peut être contrôlée en utilisant comme amorce les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés. Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entendra désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription reverse. Il existe actuellement de très nombreux procédés permettant cette 30. amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. en 1989, la technique 3SR (Self-Sustained Sequence Replication) décrite par Guatelli et al. en 1990, la technique NASBA (Nucleic Acid Sequ.ence Based Amplification) décrite par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable, la technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la technique CPR (Cycling Probe Reaction) décrite par Duck et al. en 1990, la technique 5 d'amplification à la Q-béta-réplicase décrite par Miele et al. en 1983 et perfectionnée notamment par Chu et al. en 1986 et Lizardi et al. en 1988, puis par Burg et al. ainsi que par Stone et al. en 1996.
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilisera avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à

10 l'aide des amorces selon l'invention ou à la mise en oeuvre d'un procédé
de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase reverse afin d'obtenir un ADNc à partir de l'ARNm contenu dans l'échantillon biologique.
L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention.
La technique d'hybridation de sondes peut être réalisée de manières diverses (Matthews et ai., 1988). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde.
Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par la méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).
Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sonde de capture. Dans ce cas, une sonde, dite sonde de capture , est immobilisée sur un support et sert à
capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite détecté grâce à une seconde sonde, dite sonde de détection , marquée par un élément facilement détectable.
Les séquences selon la présente invention de site accepteur ou donneur d'épissage identifiées au tableau 3 (séquences SEQ ID No. 74 à SEQ ID No. 105) font également partie de la présente invention.
Sous un autre aspect, l'invention comprend une méthode pour le criblage de banques d'ADNc ou d'ADN génomique, ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en oeuvre une séquence nucléique selon l'invention.

11 Parmi ces méthodes, on peut citer notamment :
- le criblage de banques d'ADNc et le clonage des ADNc isolés (Sambrook et al, 1989, Suggs et al., 1981 ; Woo et ai, 1979), à l'aide des séquences nucléiques selon l'invention ;
- le criblage de banques génomiques, par exemple de BACs (Chumakov et ai, 1992;
Chumakov et al., 1995) et éventuellement une analyse génétique en FISH (Cherif et al., 1990) à l'aide de séquences selon l'invention, permettant l'isolement et la localisation chromosomique, puis le séquençage complet du gène SPG4 codant pour la spastin.
En particulier, ces méthodes selon l'invention pourront être mises en oeuvre pour l'identification et ainsi l'obtention de la séquence génomique ou de l'ADNc du gène SPG4 chez d'autres mammifères, notamment la souris.
Ces méthodes de criblage et/ou de clonage comprendront en particulier une étape d'hybridation d'un acide nucléique selon l'invention avec un acide nucléique contenu dans une banque génomique ou d'ADNc.
L'invention comprend aussi une méthode d'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4 de séquence SEQ ID No. 1, caractérisée en ce qu'elle met en oeuvre un acide nucléique selon l'invention.
Les outils informatiques à la disposition de l'homme du métier lui permettent aisément d'identifier à partir des séquences nucléiques génomiques selon l'invention les boîtes régulatrices promotrices nécessaires et suffisantes au contrôle de l'expression génique, notamment les boîtes TATA, CCAAT, GC, ainsi que les séquences régulatrices stimulatrices ( enhancer ) ou inhibitrices ( silencers ) qui contrôlent en GIS l'expression des gènes selon l'invention ; parmi ces séquences régulatrices, il convient de citer l'IRE, MRE, CRE.
L'invention concerne également des méthodes pour l'identification de mutations portées par le gène SPG4 humain caractérisées en ce qu'elles mettent en oeuvre une séquence nucléique selon l'invention, notamment de mutations responsables de la paraplégie spastique familiale autosomique dominante.
Ces méthodes d'identification de ces mutations comprendront en particulier les étapes suivantes; (i) isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARNm de l'échantillon biologique ; (ii) amplification spécifique de l'ADN cible susceptible de présenter une mutation à l'aide d'amorces

12 selon l'invention ; (iii) analyse des produits d'amplification, notamment la taille et/ou la séquence des produits d'amplification, par rapport à une séquence de référence.
Par méthodes d'identification de mutation selon l'invention, on entend également désigner une méthode permettant d'obtenir l'acide nucléique sur lequel a été identifiée ladite mutation.
Font également partie de l'invention, les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention présentant des mutations susceptibles de modifier l'expression de la protéine correspondante.
Les acides nucléiques caractérisés en ce qu'ils sont susceptibles d'être obtenus par une des méthodes précédentes selon l'invention, ou les acides nucléiques capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 80 % entre une des deux séquences et la séquence complémentaire de l'autre) avec lesdits acides nucléiques, font partie de l'invention, notamment les acides nucléiques variants ou homologues, en particulier les séquences nucléiques de variants alléliques du gène SPG4 de séquence SEQ ID No. 1 ou de son ADNc de séquence SEQ ID
No. 2, ainsi que les séquences génomiques des gènes homologues d'autres mammifères tels que la souris.
Dans la présente description, on entendra désigner par "Spg4" le gène de souris homologue au gène humain SPG4.
L'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce pour le criblage de banque génomique ou d'ADNc fait bien entendu partie de l'objet de la présente invention.
Sous un autre aspect, l'invention comprend un polypeptide purifié ou isolé
codé
par un acide nucléique selon l'invention, de préférence à l'exception du peptide de 584 acides aminés dont la séquence est identifiée dans la banque de données GenBank sous le numéro d'accession A8029006.
Dans la présente description, on utilisera le terme polypeptide pour désigner également une protéine ou un peptide.
De préférence, la présente invention concerne un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la sécjuence SEQ ID No. 3, correspondant à la spastin humaine codée par la séquence SEQ ID No. 2 de l'ADNc du gène SPG4 humain ;

13 - la séquence SEQ ID No. 73, correspondant à un fragment de la spastin murine codée par la séquence SEQ ID No. 72 de l'ADNc incomplet du gène Spg4 de souris, la séquence SEQ ID No. 73 est représentée à la figure 4A, ligne "SPAST_MOUSE" ;
- la séquence SEQ ID No. 107, correspondant à la spastin murine codée par la séquence SEQ ID No. 106 de l'ADNc complet du gène Spg4 de souris ;
- les séquences de polypeptides homologues et variants du polypeptide de séquence SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107 ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 3, la .séquence SEQ ID No. 73, la séquence SEQ ID
No.
107 ou la séquence d'au moins 10 acides aminés consécutifs d'une de ces séquences ; et b) les séquences homologues ou variantes des séquences SEQ ID No. 3, SEQ ID
No.
73 ou SEQ ID No; 107.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend la séquence d'au moins 8, de préférence d'au moins 10, 15, 20 ou 30 acides aminés consécutifs de la séquence du fragment aa 197-228, extrémités incluses, de la séquence SEQ ID No. 3.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la séquence SEQ ID No. 3, la séquence SEQ ID No. 73 et la séquence SEQ ID
No.
107, lesquelles séquences portant au moins une des mutations correspondant à
un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
Il doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement. En effet, l'invention concerne les peptides obtenus par purification à partir de sources naturelles,

14 ou bien obtenus par recombinaison génétique, ou encore par synthèse chimique et pouvant alors comporter des amino-acides non naturels. La production d'un polypeptide recombinant, qui peut être réalisée en utilisant l'une des séquences nucléotidiques selon l'invention est particulièrement avantageuse car elle permet d'obtenir un niveau de pureté accrue du polypeptide désiré.
Par polypeptide homologue, on entendra désigner les polypeptides présentant certaines modifications par rapport au polypeptide de référence, comme en particulier une ou plusieurs délétions, troncations, un allongement, une fusion chimérique, et/ou une ou plusieurs substitutions, et dont la séquence d'acides aminés présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence d'acides aminés de référence.
Par polypeptide variant (ou variant protéique), on entendra désigner l'ensemble des polypeptides codés par les séquences nucléiques variantes telles que précedemment définies.
En particulier, les polypeptides variants comprendront tout polypeptide codé
par la séquence génomique mutée du gène SPG4 de séquence SEQ ID No. 1, et dont la séquence d'acides aminés présente au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidus d'acides aminés par rapport à la séquence SEQ ID No. 3. Dans le cas présent, les polypeptides variants présentant au moins une mutation seront liés aux pathologies de type PSF-AD.
On entendra également désigner par polypeptide variant tout polypeptide résultant de mutation d'un site d'épissage dans la séquence nucléique génomique SEQ ID No. 1.
L'invention comprend également les vecteurs de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'invention.
Les vecteurs selon l'invention, caractérisés en ce qu'ils comportent les éléments permettant l'expression et/ou la sécrétion desdites séquences dans une cellule hôte, ou encore une séquence d'adressage cellulaire, font également partie de l'invention.
Les vecteurs caractérisés en ce qu'ils comportent une séquence de promoteur et/ou de régulateur selon l'invention, font également partie de l'invention.
Lesdits vecteurs comporteront de préférence un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Ils doivent pouvoir être maintenus de façon stable dans la cellule et peuvent éventuellement posséder des signaux particuliers spécifiant la sécrétion de la protéine traduite.
Ces différents signaux de contrôle sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences d'acide nucléique selon l'invention peuvent être 5 insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi.
Parmi les systèmes à réplication autonome, on utilisera de préférence en fonction de la cellule hôte, des systèmes de type plasmidique ou viral, les vecteurs viraux pouvant notamment être des adénovirus (Perricaudet et al., 1992), des 10 rétrovirus, des lentivirus, des poxvirus ou des virus herpétiques (Epstein et al., 1992).
L'homme du métier connaît les technologies utilisables pour chacun de ces systèmes.
Lorsque l'on souhaitera l'intégration de la séquence dans les chromosomes de la cellule hôte, on pourra utiliser par exemple des systèmes de type plasmidique ou viral ; de tels virus seront, par exemple, les rétrovirus (Temin, 1986), ou les AAV

15 (Carter, 1993).
Parmi les vecteurs non viraux, on préfère les polynucléotides nus tels que l'ADN
nu ou l'ARN nu selon la technique développée par la société VICAL, les chromosomes artificiels de levure (YAC, yeast artificial chromosome) pour l'expression dans la levure, les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour l'expression dans les cellules murines et de manière préférée les chromosomes artificiels d'homme (HAC, human artificial chromosome) pour l'expression dans les cellules humaines.
De tels vecteurs seront préparés selon les méthodes couramment utilisées par = l'homme du métier, et les clones .en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple la lipofection, l'électroporation, le choc thermique.
L'invention comprend en outre les cellules hôtes, notamment les cellules eucaryotes et procaryotes, transformées par les vecteurs selon l'invention ainsi que les animaux transgéniques, excepté l'Homme, comprenant une desdites cellules transformées selon l'invention.
Parmi les cellules utilisables à ces fins, on peut citer bien entendu les cellules bactériennes (Olins et Lee, 1993), mais également les cellules de levure (Buckholz, 1993), de même que les cellules animales, en particulier les cultures de cellules de mammifères (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster chinois (CHO), mais également les cellules d'insectes dans lesquelles on peut utiliser

16 des procédés mettant en uvre des baculovirus par exemple (Luckow, 1993). Un hôte cellulaire préféré pour l'expression des protéines de l'invention est constitué par les cellules CHO.
Parmi les mammifères selon l'invention, on préférera des animaux tels que les souris, les rats ou les lapins, exprimant un polypeptide selon l'invention.
Parmi les mammifères selon l'invention, on préférera également ceux comprenant une cellule transformée caractérisée en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations correspondant à un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention.
Parmi les mammifères selon l'invention, on préférera également des animaux tels que les souris, les rats ou les lapins, caractérisés en ce que le gène codant pour la =
spastin selon l'invention, n'est pas fonctionnel ou est invalidé.
Parmi les modèles animaux plus particulièrement intéressants ici, on trouve notamment :
- les animaux transgéniques présentant au moins dans une de leurs deux séquences alléliques du gène SPG4, une au moins des mutations dont la position et la nature sont identifiées au tableau 5 ou identifiées par une méthode selon la présente invention. Ces animaux transgéniques sont obtenus par exemple par recombinaison homologue sur cellules souches embryonnaires, transfert de ces cellules souches à
des embryons, sélection des chimères affectées au niveau des lignées reproductrices, et croissance desdites chimères ;
- les animaux (de préférence souris) transgéniques surexprimant le gène SPG4 dans lequel pourra être introduite une desdites mutations selon l'invention. Les souris sont obtenues par exemple par transfection de copie de ce gène sous contrôle d'un promoteur fort de nature ubiquitaire, ou sélectif d'un type de tissu, ou après transcription virale ;
- les animaux (de préférence souris) transgéniques rendus déficients pour le gène SPG4 selon l'invention, par inactivation à l'aide du système LOXP/CRE
recombinase (Rohlmann et al., 1996) ou de tout autre système d'inactivation de l'expression de ce gène.
Les cellules et mammifères selon l'invention sont utilisables dans une méthode de production d'un polypeptide selon l'invention, comme décrit ci-dessous, et peuvent

17 également servir à titre de modèle d'analyse et pour le criblage de banque d'ADN
(génomique ou d'ADNc).
Les cellules ou mammifères transformés tels que décrits précédemment peuvent être ainsi utilisées à titre de modèles afin d'étudier les interactions entre les polypeptides selon l'invention, et les composés chimiques ou protéiques, impliqués directement ou indirectement dans les activités des polypeptides selon l'invention, ceci afin d'étudier les différents mécanismes et interactions mis en jeu.
Surtout, ils peuvent être utilisés pour la Sélection de produits interagissant avec les polypeptides selon l'invention, notamment la spastin humaine de séquence SEQ ID
No. 3 ou ses variants selon l'invention, à titre de cofacteur, ou d'inhibiteur, notamment compétitif, ou encore ayant une activité agoniste ou antagoniste de l'activité
des polypeptides selon l'invention. De préférence, on utilisera lesdites cellules transformées ou animaux transgéniques à titre de modèle permettant, notamment, la sélection de produits permettant de lutter contre la pathologie liée au gène mentionnée ci-dessus.
L'invention concerne également l'utilisation de cellule, de mammifère ou de polypeptide selon l'invention pour le criblage de composé chimique ou biochimique pouvant interagir directement ou indirectement avec les polypeptides selon l'invention, et/ou capable de moduler l'expression ou l'activité de ces polypeptides.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention pour la synthèse de polypeptides recombinants.
La méthode de production d'un polypeptide de l'invention sous forme recombinante est elle-même comprise dans la présente invention, et se caractérise en ce que l'on cultive les cellules transformées, notamment les cellules ou mammifères de la présente invention, dans des conditions permettant l'expression d'un polypeptide recombinant codé par une séquence d'acide nucléique selon l'invention, et que l'on récupère ledit polypeptide recombinant.
Les polypeptides recombinants, caractérisés en ce qu'ils sont susceptibles d'être obtenus par ladite méthode de production, font également partie de l'invention.
Les polypeptides recombinants obtenùs comme indiqué ci-dessus, peuvent aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent présenter ou non la structure tertiaire naturelle.
Ces polypeptides peuvent être produits à partir des séquences d'acide nucléique définies ci-dessus, selon les techniques de production de polypeptides recombinants connues de l'homme du métier. Dans ce cas, la séquence d'acide =

18 nucléique utilisée est placée sous le contrôle de signaux permettant son expression dans un hôte cellulaire.
Un système efficace de production d'un polypeptide recombinant nécessite de disposer d'un vecteur et d'une cellule hôte selon l'invention.
Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.
Les procédés de purification de polypeptide recombinant utilisés sont connus de l'homme du métier. Le polypeptide recombinant peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps monoclonaux ou polyclonaux spécifiques, etc..
= Les polypeptides selon la présente invention peuvent être obtenus par synthèse chimique et ce en utilisant l'une des nombreuses synthèses peptidiques connues, par exemple les techniques mettant en oeuvre des phases solides ou des techniques utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique.
La technique de synthèse en phase solide est bien connue de l'homme du métier. Voir notamment Stewart et al. (1984) et Bodansky (1984).
Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondants sont également compris dans l'invention.
Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'invention, font partie de l'invention.
Des anticorps polyclonaux spécifiques peuvent être obtenus à partir d'un sérum d'un animal immunisé contre les polypeptides selon l'invention, notamment produit par recombinaison génétique ou par synthèse peptidique, selon les modes opératoires usuels.
On notera notamment l'intérêt d'anticorps reconnaissant de façon spécifique certains polypeptides, variants, ou leurs fragments immunogènes, selon l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridomes décrite par Miller et Milstein, 1975.

19 Les anticorps selon l'invention sont, par exemple, des anticorps chimériques, des anticorps humanisés, des fragments Fab ou F(abl2 Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués afin d'obtenir un signal détectable et/ou quantifiable.
L'invention concerne également des méthodes pour la détection et/ou la purification d'un polypeptide selon l'invention, caractérisées en ce qu'elles mettent en oeuvre un anticorps selon l'invention.
L'invention comprend en outre des polypeptides purifiés, caractérisés en ce qu'ils sont obtenus par une méthode selon l'invention.
Par ailleurs, outre leur utilisation pour la purification des polypeptides, les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent également être utilisés pour la détection de ces polypeptides dans un échantillon biologique.
fis constituent ainsi un moyen d'analyse immunocytochimique ou immuno-histochimique de l'expression des polypeptides selon l'invention, notamment le polypeptide de séquence SEQ ID No. 3 ou l'un de ses variants, sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immuno-conjugués enzymatiques.
Ils pourront permettre notamment de mettre en évidence une expression anormale de ces polypeptides dans les tissus ou prélèvements biologiques, ce qui les rend utiles pour le suivi de l'évolution de la maladie et le diagnostic moléculaire.
Plus généralement, les anticorps de l'invention peuvent être avantageusement mis en oeuvre dans toute situation où l'expression d'un polypeptide selon l'invention, normal ou muté, doit être observée.
Font également partie de l'invention, les méthodes de détermination d'une variabilité alléfique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou de toute anomalie génétique du gène SPG4 selon l'invention, caractérisées en ce qu'elles mettent en oeuvre une séquence d'acide nucléique ou un anticorps selon l'invention.
La présente invention comprend ainsi une méthode de diagnostic génotypique de la pathologie associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention.
De préférence, l'invention concerne une méthode de diagnostic génotypique de la maladie associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisé en ce qu'il comporte les étapes suivantes :

a) le cas échéant, isolement de l'ADN génomique à partir de l'échantillon biologique à
analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ;
b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'invention ;
5 c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
L'invention comprend également une méthode de diagnostic de la maladie associée à une expression anormale d'un polypeptide codé par le gène SPG4, notamment le polypeptide de séquence SEQ ID No. 3, caractérisée en ce que l'on met 10 en contact un ou des anticorps selon l'invention avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
Ces méthodes visent par exemple les méthodes de diagnostic de la PSF-AD
15 associée à la présence de mutation dans le gène SPG4 selon l'invention, notamment anténatal, en déterminant à partir d'un prélèvement biologique du patient la présence de mutations dans au moins une des séquences décrites précédemment. Les séquences d'acides nucléiques analysées pourront aussi bien être de l'ADN
génomique, de l'ADNc, ou de l'ARNm.

20 Des acides nucléiques ou anticorps basés sur la présente invention pourront -également être utilisés pour permettre un diagnostic positif chez un malade ou un diagnostic pré-symptomatique chez un sujet à risque, notamment avec antécédent familial.
Les méthodes permettant de mettre en évidence une mutation dans un gène par rapport au gène sauvage sont, bien entendu, très nombreuses. On peut essentiellement les diviser en deux grandes catégories. Le premier type de méthode est celui dans lequel la présence d'une mutation est détectée par comparaison de la séquence mutée avec la séquence correspondante sauvage, et le second type est celui dans lequel la présence de la mutation est détectée de façon indirecte, par exemple par évidence de mésappariements dus à la présence de la mutation.
Ces méthodes peuvent mettre en oeuvre les sondes et amorces de la présente invention décrites. Il s'agit généralement de séquences nucléiques d'hybridation purifiées comprenant au moins 15 nucléotides, de préférence 20,25 ou 30 nucléotides, caractérisées en ce qu'elles peuvent s'hybrider spécifiquement avec une séquence nucléique selon l'invention.

21 De préférence, les conditions d'hybridation spécifiques sont telles que celles définies précédemment ou dans les exemples. La longueur de ces séquences nucléiques d'hybridation peut varier de 15, 20 ou 30 à 200 nucléotides, particulièrement de 20 à 50 nucléotides.
Parmi les méthodes de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou d'une anomalie génétique, on préfère les méthodes comprenant au moins une étape d'amplification dite par PCR (réaction en chaîne par la polymérase) ou par PCR-like de la séquence cible selon l'invention susceptible de présenter une anomalie à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Les produits amplifiés pourront être traités à l'aide d'enzyme de restriction appropriée avant de procéder à la détection ou au dosage du produit ciblé.
Les mutations du gène SPG4 selon l'invention, peuvent être responsables de différentes modifications de son produit de traduction, modifications utilisables pour une approche diagnostique. En effet, les modifications d'antigénicité liées à
ces mutations peuvent permettre la mise au point d'anticorps spécifiques. La discrimination du produit de gène muté peut être réalisée par ces méthodes. Toutes ces modifications peuvent être utilisées dans une approche diagnostique grâce à plusieurs méthodes bien connues basées sur l'utilisation d'anticorps mono- ou polyclonaux reconnaissant le polypeptide normal ou des variants mutés, comme par exemple par RIA ou par ELISA.
Ainsi, l'invention a également pour objet une trousse ou nécessaire pour le diagnostic, notamment pour le diagnostic de la PSF-AD associée à la présence de mutation dans le gène SPG4 selon l'invention, caractérisée en ce qu'elle comprend au moins un composé choisi parmi le groupe de composés suivant :
a) un acide nucléique, notamment comme amorce ou sonde, selon la présente invention ; et b) un anticorps selon l'invention.
Sous un autre aspect, l'invention comprend une méthode de sélection d'un composé chimique ou biochimique capable de prévenir et/ou de traiter la PSF-AD
associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention, un polypeptide selon l'invention, un vecteur selon l'invention, une cellule selon l'invention, un mammifère selon l'invention ou un anticorps selon l'invention.

22 Sont également comprises dans l'invention, les méthodes de sélection de composés chimiques ou biochimiques capables d'interagir directement ou indirectement avec des polypeptides selon l'invention ou avec les acides nucléiques selon l'invention, et/ou permettant de moduler l'expression ou l'activité de ces polypeptides, caractérisées en ce qu'elles comprennent la mise en contact d'un polypeptide selon l'invention, d'une cellule transformée selon l'invention, ou d'un mammifère selon l'invention, avec un composé candidat et, la détection d'une modification de l'activité dudit polypeptide.
Par exemple, mais sans s'y limiter, on peut citer une méthode d'identification de molécules capables d'interagir avec un polypeptide selon l'invention en utilisant un système de double hybride bactérien ou levure tel que le Matchmaker Two Hybrid mc System 2, selon les instructions du manuel accompagnant le Matchmaker Two Hybrid System 2 (Catalogue N K1604-1, Clontech).
Les acides nucléiques codant pour des protéines interagissant avec les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention, peuvent être criblés et/ou sélectionnés en utilisant un système de simple hybride tel que celui décrit mc dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech (Catalog N K1603-).
Sous un autre aspect, l'invention comprend l'utilisation d'acide nucléique ou de polypeptide selon l'invention, d'un vecteur selon l'invention, d'une cellule selon l'invention, ou d'un mammifère selon l'invention, pour l'étude de l'expression ou de l'activité du gène SPG4.
D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples et les figures dont les légendes sont représentées ci-après.
LEGENDES DES FIGURES
FIGURES 1A, 1B et 1C : Carte physique de l'intervalle SPG4 et organisation génomique de SPG4.
FIGURE 1A : La région candidate de 1,5 Mb est délimitée par les marqueurs génétiques D2S352 et D2S2347 indiqués en caractères gras. La position des marqùeurs polymorphes et autres STSs est indiquée en caractères standards alors que la position des ESTs est indiquée en italique. Les clones de BAC
constituant la carte de préséquençage sont représentés par des rectangles dont le nom figure au-.

23 dessus et la taille précise du clone au-dessous si celle-ci a pu être déterminée. Le nom des BACs A, B, C, ... est suivi d'une parenthèse contenant le nom du clone précédé
d'un b si le clone est issu de la banque de BACs CITB_978_SKB ou d'un B
si celui-ci provient de la banque RPCI-11.
FIGURE 1B : Représentation schématique du gène SPG4 qui chevauche les BACs D (b336P14) et G (B563N4). Les exons sont figurés comme des rectangles noirs avec leur nom au-dessus.
FIGURE 1C : Les cinq mutations identifiées dans sept familles de PSF-AD liées au locus SPG4 sont positionnées dans les exons 7, 11, 13 et dans le site accepteur d'épissage de l'intron 15.
FIGURE 2 : Séquence nucléique et protéique de l'ADNc SPG4 et de la spastin.
Les 17 barres verticales avec un nombre situé au-dessous représentent les jonctions entre les différents exons. Le codon ATG initiateur est localisé en position nt 126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des mutations identifiées à ce jour, dont la perte de l'exon 16, sont indiquées en italique (nt 1210, nt 1468, nt 1520, nt 1620 et pour la perte de l'exoh 16: nt 1813-1853).
Le site de polyadénylation est en italique et souligné. Le signal de localisation nucléaire (NLS) putatif, RGKKK, ainsi que les trois domaines conservés prédits par l'analyse dans la base de données ProDom sont respectivement localisés aux positions aa7-11 (NLS), aa342-409 (domaine 92), aa411-509 (domaine 179) et aa512-599 (domaine 6226).
Les quatre motifs prédits par la comparaison de séquence dans la base de données Prosite sont : deux motifs leucine zippers aux positions aa50-78 et aa508-529, le site de fixation de l'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine de dimérisation helix-loop-helix aux positions aa478-486. Les motifs A et B de Walker, GPPGNGK-I" et IIFIDE , ainsi que le consensus minimal des MA sont soulignés.
FIGURES 3A et 3B Caractérisation d'une mutation d'un site d'épissage chez les individus atteints de trois familles de PSF-AD liée au locus SPG4.
FIGURE 3A: Amplification par PCR du fragment IV de l'ADNc SPG4 à partir d'ADNc de lymphoblastes : puits M, marqueur de taille VII (Boehringer) ; puits 1, membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ;
puits 3, membre non atteint de la famille 5330; puits 4, patient de la famille 5330 ;
puits 5, patient de la famille 5226 ; puits 6, témoin négatif (ADN génomique humain).
FIGURE 3B: Graphe de séquence de la mutation du site accepteur d'épissage de l'intron 15.

24 Séquence génomique de l'individu contrôle en haut et d'un patient de la famille 2992 en bas. L'astérisque à la position nt 1813-4 indique un polymorphisme A->C qui touche un nucléotide non conservé du site accepteur d'épissage de l'intron 15 chez le patient.
FIGURES 4A et 4B: Les homologies de la spastin.
Les résidus identiques sont respectivement surlignés en grisé.
FIGURE 4A : Alignement multiple créé par CLUSTAL W 'de huit protéines issues de divers organismes et présentant une forte homologie de séquence avec les spastin humaine et murine (SEQ ID No. 73).
FIGURE 4B : Alignement par CLUSTAL W des métalloprotéases de levure AFG3, RCA1 et YME1, et des paraplegin et spastin humaines.
FIGURE 5 : Alignement par BLASTN des séquences nucléiques de l'ADNc SPG4 et de son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadénylation de l'ADNc murin est souligné et en italique. Le codon STOP est localisé en position nt dans l'ADNc murin et en position nt 1974-1976 dans l'ADNc humain.
FIGURES 6A, 68 et 6C : Analyse par PCR de l'expression de SPG4 et de son orthologue murin Spg4.
FIGURE 6A: Collection d'ADNc provenant de multiples tissus de souris.
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau ;
puits 3, rate ; puits 4, poumon ; puits 5, foie ; puits 6, muscle squelettique ; puits 7, rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7; puits 10, embryon de 11 jours El 1 ; puits 11, embryon de 15 jours El 5 ; puits 12, embryon de 17 jours El 7 ; puits 13, témoin négatif (ADN génomique de souris).
FIGURE 6B: Collection d'ADNc provenant de multiples tissus humains.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancréas puits 7, placenta ; puits 8, muscle squelettique ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).
FIGURE 6C : Collection d'ADNc provenant de multiples tissus de foetus humain.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique ; puits 7, rate ; puits 8, thymus ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).

EXEMPLES
Exemple 1: Matériels et méthodes 1) Sous-clonage et séquençage de la région candidate Douze BACs provenant de deux banques génomiques humaines, 5 CITB_978_SKB (commercialisées par Research Genetics) et RPCI-11 (Osoegawa et al., 1998), et recouvrant l'intervalle SPG4 ont été sélectionnés pour être séquences (Hazan et al., Genomics, 60 (3), 309-19, 1999). 40 pg de l'ADN de chaque BAC a été
digéré partiellement par l'enzyme de restriction CviJI (CHNERx) et séparé par électrophorèse sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les 10 tailles varient autour de 3, 5 et 10 kb ont été éluées avec la p-agarase (Biolabs) et liguées à un vecteur plasmide pBAM3 préalablement digéré par Smal et déphosphorylé dans un rapport de 1Xinsert pour 5Xvecteur. Des bactéries E. cou DH108 électrocompétentes (GIBCO-BRL) ont été transformées par électroporation avec les différentes ligations. Environ 1000 à 1500 sous-clones par BAC (8 à

15 génomes équivalents) composés de 20 % de clones avec inserts à 10 kb, 40 `)/0 de clones avec inserts à 5 kb et 40 A) de clones avec inserts à 3 kb ont été
isolés. Les extrémités des inserts de ces clones ont été séquencées sur un séquenceur mc automatique LICOR 4200. Pour chaque BAC, les séquences furent assemblées en un squelette constitué de plusieurs contigs à l'aide des logiciels Phred et Phrap. Les trous 20 entre chaque c,ontig furent séquenc,és avec des dideoxynucléotides marqués sur un mc séquenceur ABI 377 (PE-Applied Biosystems). Les exons contenus dans ces contigs de séquence ont été prédits par les programmes informatiques GRAIL II, GENSCAN, FGENEH et Genie. Les séquences furent également comparées dans les bases de données nucléiques et protéiques de l'EMBL et de GenBank avec les programmes

25 BLASTN et BLASTX. La détermination des séquences promotrices fut réalisée par les programmes informatiques TSSG et TSSW. Les résultats de toutes ces analyses de séquences furent visualisés par le programme d'annotation de séquence Genotator.
2) Clonage de l'ADNc L'ADNc du gène SPG4 a été isolé par des expériences de RACE-PCR en 5' et 3' sur des ARN polyA+ de cerveau foetal, cerveau adulte et foie adulte à
l'aide du kit MC
d'amplification d'ADNc Marathon (Clontech), selon les instructions du fournisseur. Une première PCR, suivie d'une PCR interne furent effectuées avec différents couples d'amorces dont les séquences sont indiquées sur le tableau 1 d-après :

26 Tableau *I
Amorces utilisées pour les RACE-PCR et les amplifications d'ADNc Amorce Séquence (5'-3') Position en 5 couple/ PCR Taille du produit SPA_5RACE5 CGGAGCTCCTCTTGGCTGCCATG (SEQ ID No.4) nt 405 SPA_5RACE6 AGAAGCGCTGGCAGAGCCACACGAAG (SEQ ID No.5) nt 372 SPA_5RACE7 AAGGCGACCAAACGCAGCAGCGCGAAG (SEQ ID No.6) nt 331 SPA_3RACE1 AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550 SPA_3RACE2 TGGTTATGGCCAAGGACCGCTTACAAC (SEQ ID No.8) nt 689 SPA_3RACE3 CAAACGGACGTCTATAATGACAGTAC (SEQ ID No.9) nt 747 SPA_3RACE4 TTAGGAATGTGGACAGCAACCTTGC (SEQ ID No.10) nt 1075 SPA_3RACE5 CTTCTCTGAGGCCTGAGTTG-ITCAC (SEQ ID No.11) nt 1207 SPA_3RACE6 TGCTAGAATGACTGATGGATACTCAGG (SEQ ID No.12) nt 1736 SPA_3RACE7 AGATGCAGCACTGGGTCCTATCCG (SEQ 1D Nol 3) nt 1787 SPA_3RACE8 ATGAACGTCATCGGCTACAGAAACAG (SEQ ID No.14) nt 2037 SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No.15) nt 45 b+m 655 pb SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) nt 700 SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No.17) nt 106 c+n 543 pb SPA Dn CTAGCTCTTTCACACTGTTC (SEQ ID No.18) nt 649 SPA Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) nt 487 d+n 746 pb SPA_Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) nt 1233 SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No,21) nt 532 SPA_An TGCCAAGTCTTGACCAGC (SEQ ID No.22) nt 1175 SPA Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) nt 1036 a+m 763 pb SPA_Bm CAGTGCTGCATCTTTTGCC (SEQ ID No.24) nt 1799 SPA_Bb TAGGAATGTGGACAGCAACC (SEQ ID No.25) nt 1076 SPA_Bn AAAGCTGTTAGGTCACTTCC (SEQ ID No.26) nt 1780 SPA_Ca TGGAGATGACAGAGTACTTG (SEQ ID No.27) nt 1550 a+m 766 pb SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) nt 2316 SPA_Cb ATGAGGCTGTTCTCAGGCG (SEQ ID No.29) nt 1603

27 MC
Les produits de RACE-PCR ont été clonés avec le kit TA-cloning (lnvitrogen) et les clones correspondants ont été séquences sur un ABI 377 (PE-Applied Biosystems).
La séquence du transcrit SPG4 a été vérifiée par le séquençage de produits de PCR .
amplifiés à partir d'une population d'ADNc provenant des lymphoblastes de 6 individus sains.
3) Détection des mutations Les ARNs totaux ont été extraits de lignées de lymphoblastes d'un individu mc atteint par famille étudiée et de 6 individus témoins à l'aide du kit RNA
PLUSR
(bioprobe System). La synthèse de l'ADNc a été réalisée sur 500 ng à 1 I.Jg d'ARN
avec 100 pmoles d'amorces hexamères aléatoires (Pharmacia) et 200 unités de mc reverse transcriptase Superscript Il (Gibco BRL) dans des conditions standards.
Quatre amplifications par PCR, générant des fragments chevauchants qui recouvrent la totalité de la phase ouverte de lecture de SPG4, ont été réalisées sur les ADNc des patients et contrôles. Le fragment I fut amplifié avec les amorces SPA_Db/SPA_Dm, puis en PCR interne avec les amorces SPA_Dc/SPA_Dn. Les fragments II, III, et IV ont été respectivement amplifiés avec les amorces SPA_Ad/SPA_Am, SPA_Ba/SPA_Bm et SPA_Ca/SPA_Cm (cf. les séquences de ces amorces sur le tableau 1). Chaque amplification a été effectuée dans un volume total de 50 pl contenant 4 pl d'ADNc (-1f7 ème de la prép.), 20 pmoles de chaque amorce, 200 pM de dNTPs, 50 mM de MC
KC1, 10 mM de Tris pH9, 1,5 mM MgC12, 0,1 % de triton X-100, 0,01 ch de gélatine et 2,5 unités de Taq polymérase (Cetus-PE). Les réactions de PCR ont été
réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 92 C après une première étape de dénaturation de 5 min à 94 C. Les échantillons sônt.par la suite soumis à 35 cycles de dénaturation (94 C pendant 40 sec), d'hybridation (55 C
pendant 50 sec, à l'exception du fragment I : 58 C pendant 50 sec) et d'élongation (72 C pendant 1 min), suivis d'une dernière étape d'élongation (5 min à 72 C).
Les produits de PCR sont séquencés sur un séquenceur automatique ABI 377 (PE-Applied Biosystems) avec les amorces SPA_Dc/SPA_Da, SPA_Ac/SPA_An, SPA_Bb/SPA_Bn et SPA_Cb/SPA_Cm pour les fragments I, Il, III et IV respectivement.
Les mutations furent également recherchées ou confirmées par séquençage des 17 exons prédits du gène SPG4 chez les patients et contrôles. Chaque exon fut amplifié avec le couple correspondant d'amorces a+m (cf. tableau 2 ci-après), à
l'exception de l'exon 1 (gSPAex1c/gSPAex1m), et des exons 10, 11 et 12 qui furent co-amplifiés avec les couples d'amorces gSPAex10a/gSPAex12m et gSPAex11a/gSPAex12m.

28 Tableau 2 Amorces de PCR pour l'amplification et le séquençage des exons Exon Taille du produit Programme de PCR Amorce Séquence (5'-3') (SEQ id Nos. ; 30 à 71) 1 1048 pb 0 gSPAex1c GTGAGCCGAACTGCACATTG
gSPAex1m CAAAGTCGACAGCTACAGTGC
gSPAex1d GGAACTGTAGTTGAGTGGGA
gSPAex1n AGATGAGGCTCCGACCTAC
2 624 pb 3 gSPAex2a AATGCCACACTTGTAATCTC
gSPAex2m TGTGAATATATCATAATTTGGG
gSPAex2b TACAGCAGTTCTCATGATG
3 812 pb 1 gSPAex3a GACCAAATTGGTGCATGCATG
gSPAex3m ACATTTCCAATACATCCCAC
4 379 pb 3 gSPAex4a ATTTGTCATTTCACATGCAC
gSPAex4m TTAGAATGACTATACCTGAC
gSPAex4n TCAGGTTAAGTAAGACTC
830 pb 4 gSPAex5a TTCCTATCTACCTAGTGAC
gSPAex5m TTTTATAGCAAGTTGCCCTG
gSPAex5b CCTATGAAGATCCTGGTAC
6 484 pb 3 gSPAex6a TGTCATGATTCTAACAAGGG
gSPAex6m TCTATTTCACTCCTGACATG
7 420 pb 2 gSPAex7a GTCATAGGGCTTAGGCTTC
gSPAex7m ATCATACTACCCACTTTTCC
8 647 pb 3 gSPAex8a TGTTTGGGAAGATGCTACTG
gSPAex8m CTACTGAAGATAACGTACATG
9 1268 pb 1 gSPAex9a CATTGATTGCCATGTATTGG
gSPAex9m AGAAGGCCAGAAATACTCAG
gSPAex9b GTACTTAAATCGGTAAATATGG
101 1061 pb 4 gSPAexl0a CTCAAGTCTTAGGAATGCAG
111 gSPAex10b GCACTTAACCAGGCTGTATG
12] 551 pb 3 gSPAex11a CTCAGATGACTCACATAGC
gSPAex12m CTTTACTAGACTAATTCTCCTG

29 13 1361 pb 4 gSPAexl 3a CAGATTCAAGAAGACAGATC
gSPAexl 3m GCAATAATTCACCACACTTG
gSPAexl 3n GGTAGTTCTTGTTTCTGCTC
14 985 pb 4 gSPAex14a CAAGTGTGGTGAATTATTGC
gSPAexl 4m GAGCTGAAAAGTATTCAGC
gSPAex14n TGCAAAGGACATAGCCAGTG
15 1076 pb 1 gSPAex15a AGCCTCTGGAGATAGTATGC
gSPAexl 5m CTAGAACAGGGGTCACAGTC
gSPAexl 5n TTGGACTTCTTAAACTTC
16 1404 pb 4 g SPAex16a G CAGTATG CAAGAAATTGAAC
gSPAexl6m GGCCTGTAATTTTCTTCTG
gSPAex16b GTACTGAATAGATACATGTAG
17 445 pb 3 gSPAex17a GTGTAGCAGATCAACATAG
gSPAexl 7m CATCITCAAGTTTGGTGCAC
mc Hormis l'exon 1, amplifié à l'aide du kit Advantage GC genomic PCR kit . (Clontech) selon les instructions du fournisseur, quatre programmes de PCR
légèrement différents (1, 2, 3 et 4) furent utilisés pour amplifier les exons de SPG4 (voir tableau 2). Les amplifications furent toutes effectuées dans un volume de 50 pl contenant 100 ng d'ADN génomique, 50 pmoles de chaque amorce, 250 pM de dNTPs, 1X de tampon Takara et 1 unité de Taq polymérase Takara La Taq (Shuzo Co.). Les réactions de PCR ont été réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 94 C après une première étape de dénaturation de 5 min à
96 C. Les échantillons sont par la suite soumis à 30 cycles de dénaturation (94 C
pendant 40 sec), d'hybridation (prog. 1: 60 C pendant 50 sec; prog. 2, 58 C
pendant 50 sec, prog. 3 et 4 : 55 C pendant 50 sec) et d'élongation (prog. 1 et 4: 72 C pendant 1 min, prog. 2 et 3 : 72 C pendant 40 sec), suivis d'une dernière étape d'élongation (10 min à 72 C). Le séquençage de ces produits de PCR a été réalisé sur un séquenceur ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les amorces internes notées b et n (voir tableau 2).
4) Caractérisation de SPG4 Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux correspondent à l'orthologue murin de SPG4, ont été isolés par le consortium IMAGE
et séquencés au laboratoire sur un séquenceur ABI 377 (PE-Applied Biosystems).
Afin d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les collections d'ADNc de différents tissus humains foetaux et adultes, ainsi que de tissus 5 de souris (panels MTC, Clontech) ont été testées par PCR selon le protocole du fournisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le couple SPA_Ca /spam (spam : 5'-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de souris. Les conditions de PCR sont celles utilisées pour l'amplification de SPG4 à partir d'ADNc de lignées de lymphoblastes (cf. Détection des mutations), excepté
que les 10 échantillons ont été soumis à 32 cycles pour les ADNc issus de tissus adultes humains et de tissus murins, et à 28 cycles pour les ADNc issus de tissus foetaux. Les produits d'amplification ont migré par électrophorèse sur des gels d'agarose 2 %.
5) Analyse histologique d'une biopsie musculaire d'un patient Les analyses histologiques et histo-enzymatiques ont été réalisées à partir 15 d'une biopsie musculaire d'un patient issu d'une famille liée au locus SPG4 selon les techniques standards décrites dans Casari et ai, 1998.
6) Numéros d'accession dans les bases de données publiques L'ADNc SPG4 (ou SPAST) et la séquence protéique déduite, GenBank/EMBL
AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gène 20 SPG4 (ou SPAST), GenBank/EMBL AJ246003.
Exemple 2 : Analyse de la séquence de l'intervalle SPG4 L'analyse des évènements de recombinaison a permis de réduire la région candidate SPG4 à un intervalle génétique de 0 cM entre les marqueurs D2S352 et D2S2347 (19, 20). Une carte de préséquençage de l'intervalle SPG4 composée de 25 BACs a été construite (Hazan et al., sous presse dans Genomics) ; la région candidate couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, s'étendant sur l'intervalle SPG4 à l'exception d'un unique trou de 4 kb entre les clones A et E, ont été sélectionnés pour être séquencés (Fig. 1A). Sept de ces BACs (A, B, C, D, E, F et G), couvrant approximativement 70 % de la région d'intérêt, ont déjà été

30 séquencés. Les séquences de ces 7 BACs ont été comparées à celles des bases de données nucléiques et protéiques, et analysées avec quatre programmes de prédiction d'exons. Ces analyses de séquences préliminaires ont permis de mettre en évidence 14 unités de transcription potentielles, dont trois correspondant aux gènes codant pour la xanthine deshydrogénase, la stéroïde 5a-réductase 2 et une protéine liant le TGFp.
Sur les 14 gènes détectés par l'analyse de séquence, 9 avaient été
préalablement

31 identifiés dans les bases de données d'EST (pour Expressed Sequence Tag ) et localisés au sein de l'intervalle SPG4 (Hazan et al., sous presse dans Genomics) ; les gènes restants n'ont pu être identifiés qu'en séquenç,ant la région candidate.
L'un de ces 5 nouveaux gènes présentait une homologie en 3' de sa région codante avec les 5 gènes codant pour la famille protéique des MA (Confalonieri et al., 1995). Des analyses de séquence plus approfondies ont montré que ce gène, nommé SPG4 (ou SPAST), était composé de 17 exons et s'étendait sur une région d'environ 90 kb, couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1B). Les trois premiers exons prédits de ce gène furent identifiés dans le BAC D par deux des quatre programmes de prédiction d'exons utilisés, GRAIL II et GENSCAN ; ils présentent une forte homologie avec un EST de blastocyste de souris, AA560327. Les 14 derniers exons se trouvent dans le BAC G. La séquence protéique déduite des exons 7 à
17 est significativement homologue à une sous-classe de la famille des AAA, comportant les protéines de levure Yta6p (Schnall et al., 1994), TBP6 (Schnall et al., 1994) et End 13, ainsi que la protéine de souris SKD1 (Perier et al., 1994).
Sur les quatre programmes de prédiction d'exons, FGENEH semble le plus fiable et le plus puissant, permettant la détection de la plupart des gènes de cette région chromosomique en 2p21-p22. Cette constatation s'applique également au gène SPG4 pour lequel 15 exons ont pu être mis en évidence par ce programme quand seuls 4, 9 ou 11 exons ont pu respectivement être localisés par les programmes Genie, GRAIL II et GENSCAN. L'organisation génomique de ce gène (Fig. 1B) a pu être confirmée par la suite grâce à la détermination de la séquence de l'ADNc SPG4.
Les jonctions introns/exons sont représentées sur le tableau 3 ci-après : la taille des exons varie de 41 pb (exon 16) à 1,410 kb (exon 17), celle des introns variant de 140 pb (intron 11) à 23,247 kb (intron 1).

Tableau 3 Organisation intron/exon du gène SPG4 Exon/ Taille de l'exon Position Site accepteur d'épissage Site donneur d'épissage Taille de l'intron intron (pb) sur l'ADNc (SEQ ID No. 74 à 89) (SEQ
ID Nos. 90 à 105) (pb) TGAGAAAG/gtaactagggggctgg 23 247 2 87 541 affitttattttaaag/CAGGACAG
AGGACAAG/gtaagattgtatttgt 1 943 3 84 628 aatttttttctttcag/GTGAACAG
ACTTCTAG/gtatcaattaatgtat 9 190 4 96 712 cttctctgttgcatag/AGAAGATG
CCAGTCAG/gtgggtttaggttaac 15 745 188 808 actffitccttgtcag/AAAGTGGA CTCATAAG/gtattctgggacagta 876 tv co e 6 134 996 ttttgtatcctttaag/GGTACTCC
GTGGACAA/gtaagttttgccatct 283 0 e Ln e aggtcttettcttag/TGGAACAG GGCCTGAG/gtaagaactttatatt 10 735 tv o agtatatattteagfTTGTTCAC CAATGCTG/gtaagggttctcttca 1 385 e w i N) o cttgtgatttttaaag/GCTAAAGC CAAAATAC/gtgagtgctctgtttc 8 083 e i 76 1 371 taatgctttgttttag/GTGGGAGA
TTTTATAG/gtaagaacatattttc 238 .4 cttgtatttcctctag/ATGAAGTT TTGATGGT/gtaagtgttgattatg 140 gattttttgcttgtag/GTACAGTC GTTCTCAG/gtagggagatttatat 4 715 ggatttttetttag/GCGTTTCA ATGAGGAG/gtatgtatctgtgttt 1 389 . 14 80 1 662 ttttaatatttttc,ag/ACAAGACT CTTGCTAG/gtgagtaatttggatt 1 521 71 1 742 tccttcccttcctcag/AATGACTG
TATCCGAG/gtaggtatacaagagc 2 210 cttttatettacag/AACTAAAA CCAGTGAG/gtatagtattttacaa 7 115 17 1 410 1 854 ctttttaaaaatctag/ATGAGAAA
Les séquences des exons et des introns sont respectivement indiquées en majuscules et minuscules.

Exemple 3: Identification de l'ADNc SPG4 Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent réalisées sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal, afin de caractériser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donné des produits d'amplification se terminant à la position nt 263 de l'ADNc SPG4 (Fig. 2), ce qui était probablement dû au contenu riche en GC de la région 5' du transcrit (90 % de GC dans les 60 pb précédant la position nt 263). Quatre produits de PCR chevauchants, recouvrant la totalité de la région codante, ont été amplifiés à partir des ADNc issus des lymphoblastes de six individus contrôles et séquencés intégralement dans le but de vérifier la séquence du transcrit SPG4. L'alignement des séquences de tous les produits de PCR et RACE-PCR a permis de reconstituer une séquence de 3263 pb comprenant une phase ouverte de lecture de 1848 pb précédée par une région 5' non traduite (5' UTR
pour 5' UnTranslated Region ) de 125 pb et suivie par une région 3' UTR de 1290 pb incluant un site de polyadénylation entre les positions nt 3227-3232, ¨ 35 pb en amont de -la queue polyA (Fig. 2). La comparaison de la séquence de l'ADNc SPG4 avec les banques de données d'ESTs a permis de détecter une homologie significative avec 6 ESTs humains dont l'EST N47973 qui contient une région 3' non codante plus étendue (+ 180 pb) comprenant un deuxième site de polyadénylation. Le site d'initiation de la traduction a été identifié par la présence d'une séquence consensus de Kosak (CTGTGAatgA) définie comme un contexte adéquat à l'initiation de la traduction attendu qu'une purine est localisée 3 nt en amont de l'ATG initiateur, lui-même précédé
d'un codon STOP. La séquence de l'ADNc de 3263 pb est identique à la séquence transcrite déduite des 17 exons du gène SPG4. L'analyse de la séquence de la région 5' à l'aide des programmes informatiques TSSG et TSSW suggère la présence d'une séquence promotrice de type TATA box située 43 pb en amont de la position nt 1 de l'exon 1.
Exemple 4: Mutations dans le gène SPG4 Des mutations hétérozygotes ont été recherchées dans l'ADNc SPG4 provenant de lymphoblastes de 14 patients issus de familles liées au locus SPG4 (1 individu atteint par famille). Quatre fragments de PCR chevauchants I, II, III et IV recouvrant la phase ouverte de lecture de l'ADNc SPG4 ont été amplifiés et séquencés chez les 14 patients ainsi que chez 6 individus sains contrôles. L'électrophorèse sur gel agarose du fragment de PCR IV a montré trois bandes d'intensité égale chez 3 patients des familles 2992, 5226 et 5330 provenant de la même région de Suisse, ce qui suggérait une microdélétion ou une mutation d'un site d'épissage ; les deux bandes supplémentaires n'étaient pas présentes chez 2 individus sains issus des familles 2992 et 5330 (Fig. 3A). La séquence génomique de l'exon 16 a révélé une mutation hétérozygote A->G du site accepteur d'épissage (AG) de l'intron 15 chez les individus atteints de ces trois familles (Fig. 3B) ;
cette mutation engendre la perte de l'exon 16 suivie d'un décalage de la phase de lecture dans le transcrit anormal. Aucun des membres sains incluant maris et épouses ne porte cette mutation du site d'épissage. L'identification de la même mutation chez tous les membres atteints de ces trois familles suisses démontre l'existence d'un ancêtre commun, ce qui avait été préalablement suggéré par l'étude des haplotypes.
Trois mutations ponctuelles 1210C->G, 1468G->A et 1620C->T qui introduisent des substitutions d'un acide aminé dans la séquence protéique (S362C, C448Y et R499C) ont été respectivement mises en évidence par le séquençage des fragments de PCR III et IV chez les individus atteints des familles 624, 4014 et 618. Ces trois substitutions impliquent toutes un résidu cystéine, induisant la perte ou l'insertion d'une cystéine dans la séquence protéique. Une délétion de 1 pb, 1520delT, qui crée l'apparition d'un codon STOP induisant une protéine tronquée composée de 465 acides aminés (aa) a été détectée chez les individus atteints de la famille A. Aucune des cinq mutations résumées dans le tableau 4 ci-après n'a été trouvée chez les individus contrôles testés, qu'ils appartiennent à la fratrie saine ou aux conjoints des sept familles analysées ici. Ces cinq mutations affectent de façon importante la séquence protéique dans un domaine très conservé, ou cassette AAA (Beyer, 1997), qui est composé
de plusieurs motifs protéiques supposés être responsables de l'activité ATPase chez tous les membres de la famille des AAA.

=
Tableau 4 .
Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé b Conséquence 624 exon 7 1 210 Ci-> G S362C faux sens 0 4 014 exon 11 1 468 Gi---> A C448Y faux sens o tv co e A exon 11 c 1 520 delT 466STOPcodon non sens e ol 618 exon 13 R499C faux sens e 2 992 intron 15 A aa5641--) aa576 (PTC+7 aa) perte de l'exon 16+ décalage t,.1 0 1 813-2a f--) g cri e I
226 intron 15 A aa5641-> aa576 (PTC+7 aa) perte de l'exon 16+ décalage 0 e i 1 813-2ai-> g 5 330 intron 15 perte de l'exon 16 + décalage 0 .4 A aa5641-> aa576 (PTC+7 aa) 1 813-2a,-9g a Les positions en nt font référence à la séquence de l'ADNc SPG4.
b Les positions en aa font référence à la séquence de la spastin.
Les baies des exons sont indiquées en majuscules, celles des introns en minuscules.
PTC+7 aa = "premature termination codon" à 7 aa en aval de l'exon 16.

En addition à ces cinq mutations décrites précédemment, des recherches de mutations hétérozygotes réalisées sur des patients atteints de PSF-AD issus de 36 autres familles ont permis de mettre en évidence 34 autres mutations altérant ou susceptibles d'altérer le produit d'expression du gène SPG4.
Les caractéristiques de ces 34 autres mutations sont résumées dans le tableau ci-après dans lequel ont été également insérées les cinq premières mutations précédemment citées.
=

Tableau 5 Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé a Conséquence 1210 Ci--G S362C faux sens 624 exon 7 1233 G F4A G37OR faux sens 6958 exon 8 F381C faux sens 214 exon 8 1267 T t--->G
N386K faux sens 1002 exon 8 1283 T 1-->G
K388R faux sens 027 exon 8 1288 A t--->G L426V faux sens 019 exon 10 1401 CH>G C448Y faux sens 4014 exon 11 1468 G1-4A R460L faux sens 148 exon 11 1504 Gi->T R499C faux sens 618 exon 13 1620 CI-->T D555N faux sens 636 exon 15 1788 G i---)A A556V faux sens 627 exon 15 1792 C i->T .
702 C t-->T --Q193STOP non sens 2971 exon 3 3655 exon 5 873 Ai-if K229STOP non sens , 1010 exon 5 907 CF->A S261STOP non sens Y269 STOP non sens 3938 exon 5 932 Ci->G
R431STOP non sens 6922 exon 10 1416 C1-)T R431STOP non sens , 616 exon 10 1416 C1->T R562STOP non sens 605 exon 15 1809 CI-4T
_ 030 exon 2 578-579insA PTC + 2 aa décalage + non sens 615 exon 5 852de11 1 PTC + 18 aa décalage + non sens 042 exon 5 882-883insA PTC + 12 aa décalage + non sens 032 exon 5 906delT PTC + 17 aa décalage + non sens 189 exon 9 1299deIG PTC + 3 aa décalage + non sens 3686 exon 9 1340de15 PTC +35 aa décalage + non sens 625 exon 9 1340de15 PTC +35 aa décalage + non sens A exon 11 1520delT PTC +7 aa décalage + non sens 115 exon 12 1574deIGG PTC + 2 aa décalage + non sens 3266 exon 13 1634de122 PTC + 18 aa décalage + non sens 149 exon 14 1684-1685insI1 PTC +9 aa décalage + non sens 645 exon 14 1685de14 PTC +7 aa ,décale + non sens 808-2 a t-->g ?
029 intron 4 ?
1129+2 ti¨>g mutation site d'épissage 162 intron 6 ? mutation site d'épissage 1223+1 g .-->t 125 intron 7 ? . mutation site d'épissage 143 intron 8 1299+1 g t--)a (PTC +6 aa) mutation site d'épissage 1620 intron 11 1538+5 g F4a 7 perte de l'exon 11 + décalage 1006 intron 11 1538+3 del4 ? mutation site d'épissage 1605 intron 13 1661+1 g I-->t ? mutation site d'épissage 1012 intron 13 1662-2 at¨>t ? mutation site d'épissage 1626 intron 15 1812+1 gi-->a à aa564 t--, aa576 (PTC+7 aa) mutation site d'épissage 2992 intron 15 perte de l'exon 16 +
décalage 1813-2 a F->g à aa5641-4 aa576 (PTC+7 aa) 5226 intron 15 perte de l'exon 16 +
décalage 1813-2 ai-->g à aa564 t--> aa576 (PTC+7 aa) 5330 intron 15 perte de l'exon 16+
décalage 1611 intron 16 1813-2 a t--*g ? mutation site d'épissage 1853+1 gi-4a a Les positions en nt font référence à la séquence de VADNc SPG4. b Les positions en aa font référence à la séquence de la spastin. Les bases des exons sont indiquées en majuscules, celles des mixons en minuscules.
PTC+n aa - "premature termination codon" à n acide aminé en aval de la mutation.
=

Exemple 5: Analyse de la séquence protéique de la spastin La phase ouverte de lecture de SPG4 code pour une protéine de 616 aa que nous avons nommée spastin et dont le poids moléculaire est d'environ 67,2 kDaltons (kD). La comparaison de cette séquence en acides aminés dans les bases de données protéiques à l'aide des programmes BLAST a permis de mettre en évidence une zone de forte homologie avec plusieurs membres de la famille des AAA à l'extrémité C-terminale de la spastin. Les motifs types de la famille des AAA, englobés dans la cassette AAA, sont localisés entre les positions aa342 et aa599 (voir Fig. 2) d'après les comparaisons de séquence dans les bases de données de domaines protéiques ProDom et Prosite.
Les trois domaines types conservés, dont les motifs A et B de Walker ainsi que le motif consensus minimal des protéines AAA sont respectivement situés au sein de la cassette MA aux positions aa382-389, aa437-442 et aa480-498 (Fig. 2). Le motif A de Walker, GPPGNGKT appelé également p-loop (ou boucle-p) qui correspond au domaine de fixation de l'ATP et le motif B IIFIDE sont très conservés entre tous les membres de la famille des AAA incluant la spastin.
La comparaison des cassettes AAA présentes dans 150 protéines de cette famille d'ATPase issues d'organismes très éloignés dans l'évolution a permis de classifier cet ensemble de protéines en plusieurs sous-groupes, en fonction du nombre de cassettes MA identifiés (1 ou 2) et des homologies de séquence entre ces différentes cassettes (Beyer, 1997). Parmi toutes les protéines de la famille des AAA, la spastin présente une plus forte homologie avec une sous-classe particulière des AAA, et plus spécifiquement avec les protéines suivantes dont la plupart ont été identifiées grâce au séquençage complet du génome de l'organisme considéré : deux protéines de Caenorhabditis elegans 016299 et Q18128, deux sous-unités du protéasome 26S de Saccharomyces cerevisiae Yta6p (Q02845) et TBP6 (P40328) (Schnall et al., 1994), une sous-unité du protéasome de Schizosaccharomyces pombe (043078), les protéines SAP1 (P39955) et END13 (P52917) de S. cerevisiae et la protéine murine SKD1 (P46467) (Perier et al., 1994).
L'alignement multiple de ces 8 protéines avec la spastin est représenté sur la Fig. 4A. Sur les 257 acides aminés englobant la cassette AAA (positions aa342-599), la spastin présente une identité de séquence de 52 %, 51 % et 50 h avec la protéine de levure Yta6p (Q02845), la protéine de nématode 016299 et la protéine de levure TBP6 (P40328) respectivement. Des résultats similaires ont été obtenus par l'analyse de la séquence protéique de la spastin dans la base de données ProDbm qui a montré
l'existence de trois domaines d'homologie (nommés 92, 179 et 6226 et correspondant aux positions aa342-409, aa411-509 et aa512-599) trouvés dans les sous-unités putatives du protéasome 26S

de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus souvent des motifs de type leucine-zipper dont deux ont pu être détectés dans la séquence protéique de la spastin aux positions aa50-78 et aa508-529 par l'analyse de la séquence dans la base de données Prosite (voir Fig. 2). Cette analyse a également pu prédire la présence d'un motif de dimérisation de type hélice-boucle-hélice ( helix-loop-helix ) =
situé entre les positions aa478 et aa486.
La comparaison de la séquence protéique de la spastin avec celles des métalloprotéases mitochondriales comme les protéines de levure AFG3, RCA1 et YME1, ainsi que la paraplegin qui est impliquée dans une forme rare de PSF-AR montre que l'homologie entre ces cinq membres de la famille des AAA est limitée à la région de 257aa englobant la cassette AAA (Fig. 4B). Dans cette région, l'identité de séquence entre la spastin et la paraplegin n'est que de 29 A alors que la paraplegin et la protéine de levure AFG3 sont identiques à 57 % sur cette même portion de la séquence protéique.
Cette comparaison de séquence suggère que la spastin n'appartient pas au même sous-groupe des AAA que la paraplegin et autres métalloprotéases mitochondriales.
De plus, l'analyse informatique de la séquence de la spastin avec le programme PSORT Il qui permet de prédire la localisation sub-cellulaire des protéines semble indiquer que le spastin est une protéine nucléaire. Un éventuel signal de localisation nucléaire (NLS pour Nuclear Localization Signal ), RGKKK, a été mis en évidence entre les positions aa7 et = aa11 alors qu'aucun peptide signal caractéristique d'un import dans la mitochondrie n'a pu être décelé, contrairement à ce qui avait été observé pour la paraplegin.
Exemple 6: Profils d'expression de SPG4 et de son ortholodue murin Spg4 La comparaison de la séquence nucléique de SPG4 dans les banques de données d'EST a permis de détecter plusieurs ESTs humains, murins et de rat présentant une forte homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de souris correspondant à deux des ESTs murins, AA560327 et AA107866, ont été obtenus du consortium IMAGE et séquencés intégralement. L'assemblage des séquences de ces clones d'ADNc a permis de reconstituer une séquence consensus de 1689 pb incluant une phase ouverte de lecture incomplète de 1514 pb. La comparaison entre l'ADNc SPG4 humain et cet ADNc de souris a montré qu'il manque au transcrit murin environ 460 pb à
l'extrémité 5' dont le codon d'initiation de la traduction. La phase de lecture ouverte de souris est suivie d'une région 3' non codante (3' UTR) de 175 pb contenant un Site de polyadénylation situé à ¨20 pb en amont de la queue polyA (Fig. 5). La séquence nucléique de SPG4 et la séquence protéique de la spastin humaine présentent respectivement une identité de 89 % (entre les positions nt 460 et nt 1982) et de 96 %

(entre les positions aa113 et aa616) avec les séquences de l'ADNc et de la protéine déduite de la souris. Ce degré important d'homologie permet d'affirmer que ce transcrit de souris c,orrespond à l'orthologue murin de SPG4, qui a été donc baptisé Spg4.
L'hybridation de northern blots comprenant les ARNm de divers tissus humains et 5 murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donné de résultats probants excepté une très faible bande correspondant à un transcrit de 2,5 kb dans le testicule de souris après 10 jours d'exposition. En raison du faible niveau .d'expression de ce gène, les profils d'expression de SPG4 et Spg4 ont été déterminés par des expériences de PCR sur des collections d'ADNc normalisées provenant de divers tissus 10 adultes et foetaux (voir Fig. 6A à 6C). Le gène murin Spg4 est exprimé de façon ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de l'embryon de souris (Fig. 6A). Une plus forte expression de Spg4 a été
détectée dans le foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de l'embryon.
L'expression précoce de Spg4 au cours du développement embryonnaire a été
confirmée 15 par la présence d'ESTs provenant de banques d'ADNc de blastocyste, d'embryon E8 et de carcinome embryonnaire dans les banques de données publiques d'ESTs. Le gène humain SPG4 est lui aussi exprimé de façon ubiquitaire dans les tissus adultes (Fig. 6B) et foetaux (Fig. 6C), avec une expression peut-être plus marquée dans le cerveau foetal.
Exemple 7: Pas de défaut de la phosphorvlation oxydative dans la PSF-AD liée au locus Afin de déterminer si des mutations de la spastin induisaient un défaut de la phosphorylation oxydative (OXPHOS) dans la mitochondrie, à l'image de ce qui avait été
observé pour la paraplegin, une biopsie musculaire a été réalisée sur un patient d'une des familles de PSF-AD liée au locus SPG4. Les analyses morphologiques et histo-25 enzymatiques de cette biopsie de muscle n'ont pas révélé de fibre musculaire de type RRF (pour ragged red fibers ), caractéristique des défauts OXPHOS dans la mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales ainsi que la prédiction d'une localisation nucléaire de la spastin semblent indiquer que la PSF-AD liée au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par opposition à
30 la PSF-AR liée au locus SPG7.
Par une approche de clonage positionnel basée sur le séquençage d'une région de 1,5 Mb, nous avons identifié le gène SPG4 (ou SPAST) responsable de la forme la plus fréquente de PSF-AD, préalablement localisé sur les bandes chromosomiques 2p21-35 p22. Trente-neuf mutations altérant ou susceptibles d'altérer le produit du gène, nommé

spastin, ont pu être détectées chez les individus atteints de quarante-et-une familles de PSF-AD présentant une liaison au locus SPG4. La spastin est un nouveau membre de la famille des protéines MA, dont la localisation semble être nucléaire et qui présente une forte homologie avec les sous-unités du protéasome 26S de levure. En dépit d'une grande homologie restreinte à un domaine de 230 à 250 aa, dite cassette AAA, les nombreux membres de cette famille protéique peuvent participer à des mécanismes cellulaires très variés comme le transport de protéines au sein de vésicules, la régulation du cycle cellulaire, la biogénèse des organelles, ie contrôle de la transcription, ....
Toutefois, tous ces mécanismes cellulaires impliquent l'assemblage, la fonction ou la dégradation de complexes protéiques, ce qui suggère que les membres de la famille des AAA sont des protéines dites chaperons .

Références Barany, F., (1991), Proc. Natl. Acad. Sci. USA, 88, 189-193.
Beyer, A. Sequence analysis of the AAA protein family. Protein Sci. 6, 2043-2058 (1997).
Bodansky M., Principles of peptide synthesis, (1984).
Bruyn, R.P.M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-Lorrain) in Handbook of clinical neurology Vol. 15 (ed. de Jong, J.M.B.V.) 301-318 (Elsevier Science Publishers B.V., 1991).
Buckholz, R.G. Curr. Op. Biotechnology 4: 538-542, 1993.
Burg, J.L. et al. (1996), Mol. and Cell. Probes, 10, 257-271.
Carter, B.J. Curr. Op. Biotechnology 3 : 533-539, 1993.
Casari, G. et al. Spastic paraplegia and OXPHOS impairment caused by mutations in Paraplegin, a nuclear-encoded mitochondrial metalloprotease. Gel! 93, 973-983 (1998).
Cherif D., Julier, C., Delattre, O., Derré, J., Lathrop, G.M., and Berger, R.
Proc. Natl.
Acad. Sci. USA. 87 : 6639-6643, 1990.
Chu, B.C.F. et al. (1986), Nucleic Acids Res., 14, 5591-5603.
Chumakov, I., Rigault, P., Guillou, S., Ougen, P., Billault, A., Guasconi, G., Gervy, P., Le Chumakov, I.M., Rigault, P., Le Gall, I., et al. Nature 377: 175-183, 1995.
Confalonieri, F. & Duguet, M. A 200-amino acid ATPase module in search of a basic function. BioEssays 17, 639-650 (1995).
Duck, P. et al. (1990), Biotechniques, 9, 142-147.
Durr, A. et al. Phenotype of autosomel spastic paraplegia linked to chromosome 2. Brain 119, 1487-1496 (1996).
Edwards, C.P., and Aruffo, A. Curr. Op. Biotechnology 4: 558-563, 1993.
Epstein, A. Médecine/Sciences 8: 902-911, 1992.
Erlich, H.A., (1989), New York : Stockton Press.
Guatelli J.C. et al. Proc. Natl. Acad. Sci. USA 87: 1874-1878, 1990 et al.
Cell 85 : 281-290, 1996.
Fink, J.K. et al. Autosomal dominant familial spastic paraplegia tight linkage to chromosome 15q. Am. J. Hum. Genet. 56, 188-192 (1995).
Hazan, J., Lamy, C., Melki, J., Munnich, A., de Recondo, J., & Weissenbach, J.
Autosomel dominant familial spastic paraplegia is genetically heterogeneous and one locus maps to chromosome 14q. Nature Genet. 5, 163-167 (1993).
Hazan, J. et al. Linkage of a new locus for autosomal dominant familial spastic paraplegia to chromosome 2p. Hum. Mol. Genet. 3, 1569-1573 (1994).

Hedera, P. et ai Novel locus for autosomal dominant hereditary spastic paraplegia, on chromosome 8q. Am. J. Hum. Genet. 64, 563-569 (1999).
Heinzlef, O. et al. Mapping of a complicated familial spastic paraplegia to locus SPG4 on chromosome 2p. J. Med. Genet. 35, 89-93 (1998).
Hentati, A. et al. Linkage of a locus for autosomal dominant familial spastic paraplegia to chromosome 2p markers. Hum. Mol. Genet. 3, 1867-1871 (1994).
The Hereditary Spastic Paraplegia Working Group. Hereditary spastic paraplegia :
advances in genetic research. Neurology 46, 1507-1514 (1996).
Innis, M.A. et al. (1990), Academic Press.
Jouet, M. et al. X-linked spastic paraplégia (SPG1), MASA syndrome and X-linked hydrocephalus result from mutations in the L1 gene. Nature Genet. 7, 402-407 (1994).
Kievitis, T. et al. (1991), J. Virol. Methods, 35, 273-286.
Kôhler et Milstein. Nature 256, 495-497, 1975.
Kwoh, D.Y. et al. (1989), Proà. Nati. Acad. Sci. USA, 86, 1173-1177.
Landegren U., Kaiser R., Sanders J. & Hood L. Science 241 : 1077-1080, 1988.
Lizardi, P.M. et al. (1988), Bio/technology, 6, 1197-1202.
Luckow, V.A. (1993), Curr. Op. Biotechnology 4, 564-572.
Matthews, J.A. et al. (1988), Anal. Biochem., 169: 1-25.
Miele, E.A. et al. (1983), J. Mol. Biol., 171 : 281-295.
Nielsen, J.E. et al. GAG repeat expansion in autosomal dominant pure spastic paraplegia linked to chromosome 2p21-24. Hum. Mol. Genet. 6, 1811-1816 (1997).
Olins, P.O., and Lee, S.C. Curr. Op. Biotechnology 4: 520-525, 1993.
Osoegawa, K. et al. An improved approach for construction of bacterial artificial chromosome libraries. Genomics 52, 1-8 (1998).
Perier, F. et al. Identification of a novel mammalian member of the NSF/CDC48p/Pas1p/TBP-1 family through heterologous expression in yeast. FEBS
lett.
351, 286-290 (1994).
Perricaudet, M., Stratford-Penicaudet, L. and Briand, P. La Recherche 23 : 471-473, 1992.
Polo, J.M., Calleja, J., Combarros, O. & Berciano, J. Hereditary ataxias and paraplegias in Cantabria, Spain. An epidemiological and clinicat study..Brain 114, 855-866 (1991).
Reid, E. Pure hereditary spastic paraplegia. J. Med. Genet. 34, 499-503(1997).

Rohlmann, A., Gotthardt, M., Willnow, T.E., Hammer, R.E., and Herz, J. Nature Biotech.
14: 1562-1565, 1996.
Rolfs, A. et al. (1991), Berlin : Springer-Verlag.

Sambrook, J., Fritsch, E.F., and Maniatis, T. Molecular cloning : a laboratory manual.
Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher disease are allelic disorders at the proteolipid protein locus. Nature Genet. 6, 257-262 (1994).
Schnall, R. et al. Identification of a set of yeast genes coding for a novel family of putative ATPases with high similarity to con stituents of the 26S protease complex.
Yeast 10, 1141-1155 (1994).
Scott, W.K. et al. Locus heterogeneity, anticipation, and reduction of the chromosome 2p minimal candidate region in autosomal dominant familial spastic paraplegia.
Neurogenetics 1, 95-102 (1997).
Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.
Segev, D., (1992), Kessler C. Springer Verlag, Berlin, New-York, 197-205.
Skre, H. Hereditary spastic paraplegia in Western Norway. Clin. Genet. 6, 165-183 (1974).
Stone, B.B. et al. (1996). Mol. and Cell'. Probes, 10 : 359-370.
Stewart J.M. et Yound J.D., solid phase peptides synthesis, Pierce Chem.
Company, Rockford, 111, 2ème éd., (1984).
Suggs S.V., Wallace R.B., Hirose T., Kawashima E.H. and Itakura K. PNAS 78 :

6617, 1981.
Temin, H.M. Retrovirus vectors for gene transfer. In Kucherlapati R., ed. Gene Transfer, New York, Plenum Press, 149-187, 1986.
Walker G.T., Fraiser M.S., Schram J.L., Little M.C., Nadeau J.G., & Malinowski D.P.
Nucleic Acids Res. 20: 1691-1696, 1992.
Werderlin, L. Hereditary ataxias. Occurence and clinical features. Acta Neurol. Scand. 73 (Suppl. 106) (1986).
Woo S.L.C. Methods Enzymol. 68: 389, 1979.

Claims

REVENDICATIONS

1. Méthode de diagnostic de la paraplégie spastique familiale autosomique dominante (PSF-AD) chez un patient, comprenant :
- le séquençage d'un acide nucléique dans un échantillon biologique d'un patient, ledit acide nucléique comprenant :
(i) une séquence telle que définie selon SEQ ID NO :1 ou 2;
(ii) une séquence d'ARN transcrite de (i); ou (iii) une séquence d'ADN complémentaire (ADNc) de (i) ou (ii); et - détermination de la présence ou de l'absence des résidus 93444-93484 de la SEQ ID NO :1 ou 1813-1853 de la SEQ ID NO :2 dans l'acide nucléique, caractérisé en ce que l'absence desdits résidus dans l'acide nucléique est indicatif que le patient a la PSF-AD.

2. Méthode selon la revendication 1, caractérisée en ce que l'acide nucléique est un ADNc.

3. Méthode selon la revendication 1 ou 2, caractérisée en ce que l'échantillon biologique est un échantillon humain anténatal.

4. Méthode selon l'une quelconque des revendications 1-3, caractérisée en ce que l'échantillon biologique comprend un lymphoblaste.

5. Méthode selon l'une quelconque des revendications 1-4, comprenant en outre l'amplification de l'acide nucléique suivant une méthode choisie parmi le groupe constitué de la réaction en chaîne à la polymérase (PCR), la technique d'amplification à déplacement de brin (SDA ¨ strand displacement amplification), la technique TAS (transcription-based amplification system), la technique 3SR (self-sustained sequence replication), la technique NASBA
(nucleic acid sequence based amplification), la technique TMA (transcription mediated amplification), la technique LCR (ligase chain reaction), la technique RCR (repair chain reaction) et la technique CPR (cycling probe reaction).

6. Méthode selon la revendication 5, caractérisée en ce que l'amplification est conduite avec au moins une amorce comprenant une séquence choisie parmi le groupe constitué de SEQ ID NO :4 à SEQ ID NO :71.