WO2001018198A1 - Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante - Google Patents

Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante Download PDF

Info

Publication number
WO2001018198A1
WO2001018198A1 PCT/FR2000/002433 FR0002433W WO0118198A1 WO 2001018198 A1 WO2001018198 A1 WO 2001018198A1 FR 0002433 W FR0002433 W FR 0002433W WO 0118198 A1 WO0118198 A1 WO 0118198A1
Authority
WO
WIPO (PCT)
Prior art keywords
sequence
seq
nucleic acid
sequences
polypeptide
Prior art date
Application number
PCT/FR2000/002433
Other languages
English (en)
Inventor
Jean Weissenbach
Jamilé HAZAN
Original Assignee
Centre National De La Recherche Scientifique (Cnrs)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centre National De La Recherche Scientifique (Cnrs) filed Critical Centre National De La Recherche Scientifique (Cnrs)
Priority to JP2001521734A priority Critical patent/JP2003508074A/ja
Priority to CA2348657A priority patent/CA2348657C/fr
Priority to US09/830,902 priority patent/US6924126B1/en
Publication of WO2001018198A1 publication Critical patent/WO2001018198A1/fr
Priority to US11/155,492 priority patent/US20050266479A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)

Definitions

  • the invention relates to the identification and characterization of the SPG4 gene coding for spastin, responsible for the most frequent form of autosomal dominant familial spastic paraplegia (PSF), the cloning and characterization of its cDNA and the corresponding polypeptides.
  • the invention also relates to vectors, transformed cells and transgenic animals as well as diagnostic methods and kits, and methods of selecting a chemical or biochemical compound capable of interacting directly or indirectly with a polypeptide according to the invention. .
  • PSF Family spastic paraplegias
  • PSF can be transmitted in the autosomal dominant (PSF-AD), autosomal recessive (PSF-AR) or linked to the X chromosome (PSF-X) mode.
  • PSF-AD autosomal dominant
  • PSF-AR autosomal recessive
  • PSF-X linked to the X chromosome
  • PSFs are also characterized by significant genetic heterogeneity.
  • loci In the case of PSF-AD, four loci have been identified to date on the chromosomes 14 (locus SPG3) (Hazan et al., 1993), 2 (locus SPG4) (Hazan et al., 1994; Hentali et al., 1994), 15 (locus SPG6) (Fink et al., 1995) and 8 (locus SPG8) (Hedera et al., 1999).
  • locus SPG7 which codes for paraplegin, a mitochondrial ATPase of the protein family of AAA (for “ATPases Associated with diverse cellular Activities”) (Confalonieri et al., 1995 ) have been associated with complex and pure forms of PSF-AR (Casari et al., 1998).
  • the subject of the invention is therefore the identification and characterization of the SPG4 (or SPAST) gene coding for a new nuclear member of the AAA family, responsible for the most frequent form of PSF-AD.
  • the subject of the present invention is a purified or isolated nucleic acid from the SPG4 gene, characterized in that it comprises at least 15 consecutive nucleotides, preferably 20, 25, 30, 35, 40, 45, 50, 75, 100 or 200 consecutive nucleotides, of a sequence chosen from the group comprising: - the sequence SEQ ID No. 1, genomic sequence of the human SPG4 gene;
  • the present invention relates, of course, to both the DNA and RNA sequences as well as the sequences which hybridize with them, as well as the corresponding double-stranded DNAs.
  • nucleic acid nucleic or nucleic acid sequence, polynucleotide, oligonucleotide, polynucleotide sequence, nucleotide sequence, terms which will be used interchangeably in the present description, is intended to denote both double-stranded DNA, single-stranded DNA and products of transcription of said DNAs, and / or a fragment of RNA, said isolated natural fragments, or of synthesis, comprising or not non-natural nucleotides, designating a precise sequence of nucleotides, modified or not, making it possible to define a fragment or a region of a nucleic acid.
  • DNA fragment and / or of isolated or synthetic natural RNA comprising or not non-natural nucleotides, a precise sequence of nucleotides, modified or not, making it possible to define a fragment, a segment or a region of a nucleic acid.
  • genomic nucleotide sequences in their natural chromosomal environment, that is to say in the natural state.
  • sequences which have been isolated and / or purified that is to say that they have been taken directly or indirectly, for example by copying, their environment having been at least partially modified.
  • “Homologous nucleic acid sequence” will be understood to denote the nucleic acid sequences exhibiting, with respect to the reference nucleic acid sequence, certain modifications such as in particular a deletion, a truncation, an elongation, a chimeric fusion, and / or a mutation, notably a point mutation, and whose nucleic sequence has at least 80%, preferably 90% or 95%, of identity after alignment with the reference nucleic sequence.
  • percentage of identity between two nucleic acid or amino acid sequences within the meaning of the present invention is meant a percentage of identical nucleotides or amino acid residues between the two sequences to be compared, obtained after the best alignment, this percentage being purely statistical and the differences between the two sequences being distributed randomly and over their entire length.
  • Sequence comparisons between two nucleic acid or amino acid sequences are traditionally carried out by comparing these sequences after having optimally aligned them, said comparison being carried out by segment or by "comparison window” to identify and compare the regions. sequence similarity locale.
  • the optimal alignment of the sequences for comparison can be achieved, besides manually, by means of the local homology algorithm of Smith and Waterman (1981) [Ad. App. Math.
  • the percentage of identity between two nucleic acid or amino acid sequences is determined by comparing these two optimally aligned sequences per comparison window in which the region of the acid sequence nucleic acid or amino acid to be compared can include additions or deletions with respect to the reference sequence for optimal alignment between these two sequences.
  • the percentage of identity is calculated by determining the number of identical positions for which the nucleotids or the amino acid residue is identical between the two sequences, by dividing this number of identical positions by the total number of positions in the comparison window. and multiplying the result obtained by 100 to obtain the percentage of identity between these two sequences.
  • BLAST 2 sequences (Tatusova et al., "Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol. Lett. 174: 247-250) available on the site http://www.ncbi.nlm.nih.gov/gorf/bl2.html, the parameters used being those given by default (in particular for the parameters "open gap penaltie”: 5, and “extension gap penaltie” : 2; the chosen matrix being for example the “BLOSUM 62” matrix proposed by the program), the percentage of identity between the two sequences to be compared being calculated directly by the program.
  • sequences whose complementary sequences are capable of hybridizing specifically with one of the sequences of the invention are preferably sequences whose complementary sequences are capable of hybridizing specifically with one of the sequences of the invention.
  • the specific hybridization conditions or high stringency will be such that they ensure at least 80%, preferably 90% or 95% identity after alignment between one of the two sequences and the complementary sequence of the other.
  • Hybridization under conditions of high stringency means that the conditions of temperature and ionic strength are chosen in such a way that they allow hybridization to be maintained between two complementary DNA fragments.
  • conditions of high stringency of the hybridization step for the purpose of defining the polynucleotide fragments described above are advantageously as follows.
  • DNA-DNA or DNA-RNA hybridization is carried out in two stages: (1) prehybridization at 42 ° C for 3 hours in phosphate buffer (20 mM, pH 7.5) containing 5 x SSC (1 x SSC corresponds to a 0.15 M NaCl + 0.015 M sodium citrate solution), 50% formamide, 7% sodium dodecyl sulfate (SDS), 10 x Denhardt's, 5% dextran sulfate and 1% salmon sperm DNA; (2) actual hybridization for 20 hours at a temperature depending on the size of the probe (ie: 42 ° C, for a probe of size> 100 nucleotides) followed by 2 washes of 20 minutes at 20 ° C in 2 x SSC + 2% SDS, 1 wash for 20 minutes at 20 ° C in 0.1 x SSC + 0.1% SDS.
  • the last wash is carried out in 0.1 x SSC + 0.1% SDS for 30 minutes at 60 ° C for a probe of size> 100 nucleotides.
  • the high stringency hybridization conditions described above for a polynucleotide of defined size will be adapted by a person skilled in the art for oligonucleotides of larger or smaller size, according to the teaching of Sambrook et al., 1989.
  • the term “variant nucleic acid sequence” or “variant nucleic acid” of a reference nucleic acid sequence is intended to denote the set of nucleic acid sequences corresponding to allelic variants, that is to say individual variations of the nucleic acid sequence of reference. These natural mutated sequences correspond to polymorphisms present in mammals, in particular in humans and, in particular, to polymorphisms which can lead to the occurrence and / or development of pathology.
  • sequences according to the invention relate to the normal sequences, they also relate to the mutated sequences insofar as they comprise at least one point mutation and preferably at most 10% of mutations with respect to the normal sequence.
  • the variant nucleic sequences will comprise any sequence of at least 15 consecutive nucleotides, preferably 20, 25, 30, 50, 100 or 200 consecutive nucleotides, of a polymorphic sequence of the genomic sequence of the human SPG4 gene of sequence SEQ ID No. 1, and whose nucleic acid sequence has, with respect to the sequence SEQ ID No. 1, at least one mutation corresponding in particular to a truncation, deletion, substitution and / or addition of amino acid residue.
  • the variant nucleic sequences presenting at least one mutation will here be linked to pathologies of the PSF-AD type linked to the SPG4 locus.
  • the present invention relates to mutated nucleic acid sequences in which the mutations lead to a modification of the amino acid sequence of the polypeptide encoded by the normal sequence.
  • the invention relates to a purified or isolated nucleic acid from the SPG4 gene according to the invention, characterized in that it comprises a sequence chosen from the group comprising: a) the sequence SEQ ID No. 1, the sequence SEQ ID No. 2, the sequence SEQ ID No. 72, the sequence SEQ ID No. 106 or the sequence of at least 15, preferably 20, 25, 30, 35, 40, 45, 50, 75, 100 or 200 consecutive nucleotides of the sequence SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 or SEQ ID No. 106; b) the homologous nucleic sequences or variants of the sequences SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 or SEQ ID No. 106; and c) the complementary sequence or the RNA sequence corresponding to the sequences as defined in a) and b), preferably with the exception of the nucleic acid identified in the GenBank database under the accession number AB029006.
  • the nucleic acid whose sequence is disclosed in the GenBank database under the accession number AB029006, corresponds to the sequence of one of the 100 cDNAs from a human brain mRNA library identified by the
  • the invention relates to a purified or isolated nucleic acid according to the invention, characterized in that it comprises at least one sequence of at least 15 consecutive nucleotides, preferably 20, 25, 30, 50 or 75 consecutive nucleotides of the nt 714-809 fragment, ends included, of the sequence SEQ ID No. 2, of its complementary sequence or of the sequence of its corresponding RNA.
  • the invention preferably relates to a purified or isolated nucleic acid according to the present invention, characterized in that it comprises a sequence chosen from the following group:
  • sequence SEQ ID No. 72 representing the sequence of the incomplete cDNA coding for the murine spastin represented in FIG. 5, line "Mouse” and SEQ ID No 106 its complete sequence;
  • the invention relates to a purified or isolated nucleic acid according to the invention, characterized in that it comprises at least one mutation corresponding to a natural polymorphism in humans, in particular whose position and nature are identified in the table 5.
  • the primers or probes characterized in that they comprise a sequence of a nucleic acid according to the invention, also form part of the invention.
  • the present invention thus relates to all of the primers which can be deduced from the nucleotide sequences of the invention and which can make it possible to demonstrate said nucleotide sequences of the invention, in particular the mutated sequences, using in particular a method of amplification such as the PCR method, or a related method.
  • the present invention also relates to all of the probes which can be deduced from the nucleotide sequences of the invention, in particular sequences capable of hybridizing with them, and which can make it possible to demonstrate said nucleotide sequences, in particular to discriminate between normal sequences of the mutated sequences.
  • the present invention relates in particular to the probes or primers of sequences chosen from the sequences SEQ ID No. 4 to SEQ ID No. 71.
  • the invention also relates to the use of a nucleic acid sequence according to the invention as probe or primer, for the detection, identification, assay or amplification of nucleic acid sequence.
  • the polynucleotides which can be used as probe or as primer in methods of detection, identification, assay or amplification of nucleic sequence will have a minimum size of 15 bases, preferably 20 bases, or better from 25 to 30 bases.
  • probes and primers according to the invention can be labeled directly or indirectly with a radioactive or non-radioactive compound by methods well known to those skilled in the art, in order to obtain a detectable and / or quantifiable signal.
  • the unlabeled polynucleotide sequences according to the invention can be used directly as a probe or primer.
  • sequences are generally marked to obtain sequences which can be used for numerous applications.
  • the labeling of the primers or probes according to the invention is carried out with radioactive elements or with non-radioactive molecules.
  • Non-radioactive entities are selected from ligands such as biotin, avidin, streptavidin, dioxygenin, haptens, dyes, agents luminescent such as radioluminescent, chemiluminescent, bioluminescent, fluorescent, phosphorescent agents.
  • the polynucleotides according to the invention can thus be used as a primer and / or probe in methods using in particular the technique of PCR (polymerase chain reaction) (Erlich, 1989; Innis et al., 1990, and Rolfs and al., 1991).
  • This technique requires the choice of pairs of oligonucleotide primers framing the fragment which must be amplified.
  • the amplified fragments can be identified, for example after agarose or polyacrylamide gel electrophoresis, or after a chromatographic technique such as gel filtration or ion exchange chromatography, and then sequenced.
  • the specificity of the amplification can be controlled by using, as primer, the nucleotide sequences of polynucleotides of the invention as template, plasmids containing these sequences or else the derived amplification products.
  • the amplified nucleotide fragments can be used as reagents in hybridization reactions in order to demonstrate the presence, in a biological sample, of a target nucleic acid of sequence complementary to that of said amplified nucleotide fragments.
  • the invention also relates to the nucleic acids capable of being obtained by amplification using primers according to the invention.
  • PCR-like will be understood to mean all the methods implementing direct or indirect reproductions of the nucleic acid sequences, or else in which the labeling systems have been amplified, these techniques are of course known, in general these are amplification of DNA with a polymerase; when the original sample is an RNA, a reverse transcription should be carried out beforehand.
  • thermostable ligase in 1991, which uses a thermostable ligase, the RCR technique (Repair Chain Reaction) described by Segev in 1992, the CPR technique (Cycling Probe Reaction) described by Duck et al. in 1990, the Q-beta-replicase amplification technique described by Miele et al. in 1983 and improved in particular by Chu et al. in 1986 and Lizardi et al. in 1988, then by Burg et al. as well as by Stone et al. in 1996.
  • RCR Repair Chain Reaction
  • CPR Cycling Probe Reaction
  • the target polynucleotide to be detected is an mRNA
  • an enzyme of reverse transcriptase type in order to obtain a cDNA from the mRNA contained in the biological sample.
  • the cDNA obtained will then serve as a target for the primers or probes used in the amplification or detection method according to the invention.
  • the probe hybridization technique can be carried out in various ways
  • the most general method consists in immobilizing the nucleic acid extracted from cells of different tissues or cells in culture on a support (such as nitrocellulose, nylon, polystyrene) and incubating, under well defined conditions, the target nucleic acid immobilized with the probe. After hybridization, the excess probe is eliminated and the hybrid molecules formed are detected by the appropriate method (measurement of radioactivity, fluorescence or enzymatic activity linked to the probe).
  • a support such as nitrocellulose, nylon, polystyrene
  • the latter can be used as a capture probe.
  • a probe called a “capture probe”
  • a probe is immobilized on a support and is used to capture by specific hybridization the target nucleic acid obtained from the biological sample to be tested and the target nucleic acid is then detected.
  • a second probe called a “detection probe”, marked by an easily detectable element.
  • sequences according to the present invention of splice acceptor or donor site identified in Table 3 also form part of the present invention.
  • the invention includes a method for screening cDNA or genomic DNA libraries, or for cloning isolated cDNA or genomic coding for spastin, characterized in that it implements a nucleic sequence according to the invention.
  • these methods we can cite in particular: - screening of cDNA libraries and cloning of isolated cDNAs (Sambrook et al., 1989; Suggs et al., 1981; Woo et al., 1979), using nucleic acid sequences according to the invention; - screening of genomic libraries, for example BACs (Chumakov et al., 1992; Chumakov et al., 1995) and possibly a genetic analysis in FISH (Cherif et al., 1990) using sequences according to invention, allowing the isolation and the chromosomal localization, then the complete sequencing of the SPG4 gene coding for the spastin.
  • these methods according to the invention may be used for the identification and thus the obtaining of the genomic
  • screening and / or cloning methods will in particular comprise a step of hybridization of a nucleic acid according to the invention with a nucleic acid contained in a genomic or cDNA library.
  • the invention also includes a method for identifying the nucleic acid sequences which promote and / or regulate the expression of the SPG4 gene of sequence SEQ ID No. 1, characterized in that it uses a nucleic acid according to the invention. 'invention.
  • the computer tools available to those skilled in the art allow him easily to identify, from the genomic nucleic sequences according to the invention, the promoter regulatory boxes necessary and sufficient for the control of gene expression, in particular the TATA, CCAAT boxes, GC, as well as the stimulatory (“enhancer”) or inhibitory (“silent”) regulatory sequences which control in CIS the expression of the genes according to the invention; among these regulatory sequences, mention should be made of TIRE, MRE, CRE.
  • the invention also relates to methods for the identification of mutations carried by the human SPG4 gene, characterized in that they use a nucleic sequence according to the invention, in particular of mutations responsible for autosomal dominant familial spastic paraplegia.
  • These methods of identifying these mutations will in particular include the following steps: (i) isolation of the DNA from the biological sample to be analyzed, or obtaining a cDNA from the mRNA of the biological sample ; (ii) specific amplification of the target DNA capable of presenting a mutation using primers according to the invention; (iii) analysis of the amplification products, in particular the size and / or the sequence of the amplification products, with respect to a reference sequence.
  • the expression mutation identification methods according to the invention is also intended to denote a method making it possible to obtain the nucleic acid on which said mutation has been identified.
  • Also part of the invention are the promoter and / or regulatory sequences of the SPG4 gene according to the invention having mutations capable of modifying the expression of the corresponding protein.
  • Spg4 is intended to denote the mouse gene homologous to the human SPG4 gene.
  • the use of a nucleic acid sequence according to the invention as probe or primer for the screening of genomic library or cDNA is of course part of the object of the present invention.
  • the invention comprises a purified or isolated polypeptide encoded by a nucleic acid according to the invention, preferably with the exception of the peptide of 584 amino acids whose sequence is identified in the GenBank database under the number of accession AB029006.
  • polypeptide will be used to also denote a protein or a peptide.
  • the present invention relates to a polypeptide according to the invention, characterized in that it comprises an amino acid sequence chosen from the following group:
  • sequence SEQ ID No. 3 corresponding to the human spastin coded by the sequence SEQ ID No. 2 of the cDNA of the human SPG4 gene;
  • sequence SEQ ID No. 73 corresponding to a fragment of the murine spastin encoded by the sequence SEQ ID No. 72 of the incomplete cDNA of the mouse Spg4 gene, the sequence SEQ ID No. 73 is represented in FIG. 4A , line "SPAST_MOUSE";
  • the invention relates to a polypeptide according to the invention, characterized in that it comprises an amino acid sequence chosen from the group comprising: a) the sequence SEQ ID No. 3, the sequence SEQ ID No. 73, the sequence SEQ ID No. 107 or the sequence of at least 10 consecutive amino acids of one of these sequences; and b) the homologous sequences or variants of the sequences SEQ ID No. 3, SEQ ID No. 73 or SEQ ID No; 107.
  • the invention relates to a polypeptide according to the invention, characterized in that it comprises the sequence of at least 8, preferably at least 10, 15, 20 or 30 consecutive amino acids of the sequence of fragment aa 197-228, ends included, of the sequence SEQ ID No. 3.
  • the subject of the invention is a polypeptide according to the invention, characterized in that it comprises an amino acid sequence chosen from the following group: - the sequence SEQ ID No. 3, the sequence SEQ ID No. 73 and the sequence SEQ ID No.
  • the invention does not relate to polypeptides in natural form, that is to say that they are not taken in their environment. Indeed, the invention relates to peptides obtained by purification from natural sources, or else obtained by genetic recombination, or else by chemical synthesis and which can then comprise unnatural amino acids.
  • the production of a recombinant polypeptide, which can be carried out using one of the nucleotide sequences according to the invention is particularly advantageous since it makes it possible to obtain an increased level of purity of the desired polypeptide.
  • homologous polypeptide is intended to denote the polypeptides exhibiting certain modifications with respect to the reference polypeptide, such as in particular one or more deletions, truncations, an elongation, a chimeric fusion, and / or one or more substitutions, and the sequence of which is amino acids has at least 80%, preferably 90% or 95%, identity after alignment with the reference amino acid sequence.
  • variant polypeptide (or protein variant) is intended to denote all of the polypeptides encoded by the variant nucleic sequences as defined above.
  • the variant polypeptides will include any polypeptide encoded by the mutated genomic sequence of the SPG4 gene of sequence SEQ ID No. 1, and whose amino acid sequence has at least one mutation corresponding in particular to truncation, deletion, substitution and / or addition of amino acid residues relative to the sequence SEQ ID No. 3.
  • the variant polypeptides having at least one mutation will be linked to pathologies of the PSF-AD type.
  • variant polypeptide will also be understood to mean any polypeptide resulting from mutation of a splicing site in the genomic nucleic sequence SEQ ID No. 1.
  • the invention also includes the cloning and / or expression vectors containing a nucleic acid sequence according to the invention.
  • the vectors according to the invention characterized in that they comprise the elements allowing the expression and / or the secretion of said sequences in a host cell, or even a cell addressing sequence, also form part of the invention.
  • Said vectors will preferably comprise a promoter, translation initiation and termination signals, as well as suitable regions for regulating transcription. They must be able to be maintained stably in the cell and may possibly have particular signals specifying the secretion of the translated protein.
  • control signals are chosen according to the cellular host used.
  • the nucleic acid sequences according to the invention can be inserted into vectors with autonomous replication within the chosen host, or vectors integrative of the chosen host.
  • plasmid or viral type systems will preferably be used depending on the host cell, the viral vectors possibly being in particular adenoviruses (Perricaudet et al., 1992), retroviruses, lentiviruses, poxvirus or herpesvirus (Epstein et al., 1992).
  • viruses When it is desired to integrate the sequence into the chromosomes of the host cell, use may be made, for example, of systems of the plasmid or viral type; such viruses will be, for example, retroviruses (Temin, 1986), or AAVs (Carter, 1993).
  • naked polynucleotides such as naked DNA or naked RNA are preferred according to the technique developed by the company VICAL, artificial yeast chromosomes (YAC) for expression in yeast, mouse artificial chromosomes (MAC) for expression in murine cells and preferably human artificial chromosomes (HAC, human artificial chromosome) for expression in human cells.
  • YAC artificial yeast chromosomes
  • MAC mouse artificial chromosomes
  • HAC human artificial chromosomes
  • Such vectors will be prepared according to the methods commonly used by those skilled in the art, and the resulting clones can be introduced into an appropriate host by standard methods, such as for example lipofection, electroporation, heat shock.
  • the invention furthermore comprises the host cells, in particular the eukaryotic and prokaryotic cells, transformed by the vectors according to the invention as well as the transgenic animals, except Man, comprising one of said cells transformed according to the invention.
  • a preferred cellular host for the expression of the proteins of the invention consists of CHO cells.
  • mice such as mice, rats or rabbits are preferred, expressing a polypeptide according to the invention.
  • those comprising a transformed cell characterized in that the sequence of at least one of the two alleles of the SPG4 gene contains at least one of the mutations corresponding to a natural polymorphism in humans, in particular those whose nature and location are identified in Table 5 below or those which can be identified by the identification methods of mutation of the SPG4 gene according to the present invention.
  • mice such as mice, rats or rabbits are also preferred, characterized in that the gene coding for the spastin according to the invention, is not functional or is invalidated.
  • transgenic animals having at least one of their two allelic sequences of the SPG4 gene, at least one of the mutations whose position and nature are identified in Table 5 or identified by a method according to the present invention.
  • These transgenic animals are obtained for example by homologous recombination on embryonic stem cells, transfer of these stem cells to embryos, selection of the affected chimeras at the level of the reproductive lines, and growth of said chimeras; - transgenic animals (preferably mice) overexpressing the SPG4 gene into which one of said mutations according to the invention may be introduced.
  • mice are obtained for example by transfection of a copy of this gene under the control of a strong promoter of ubiquitous nature, or selective for a type of tissue, or after viral transcription; - transgenic animals (preferably mice) rendered deficient for the SPG4 gene according to the invention, by inactivation using the LOXP / CRE recombinase system (Rohlmann et al., 1996) or any other system for inactivation of the expression of this gene.
  • LOXP / CRE recombinase system Roshlmann et al., 1996) or any other system for inactivation of the expression of this gene.
  • the cells and mammals according to the invention can be used in a method for producing a polypeptide according to the invention, as described below, and can also serve as an analytical template and for DNA library screening
  • the transformed cells or mammals as described above can thus be used as models in order to study the interactions between the polypeptides according to the invention, and the chemical or protein compounds, involved directly or indirectly in the activities of the polypeptides according to the invention, this in order to study the different mechanisms and interactions involved.
  • the polypeptides according to the invention can be used for the selection of products interacting with the polypeptides according to the invention, in particular the human spastin of sequence SEQ ID No. 3 or its variants according to the invention, as cofactor, or inhibitor, in particular competitive, or else having an agonist or antagonist activity of the activity of the polypeptides according to the invention.
  • said transformed cells or transgenic animals will be used as a model allowing, in particular, the selection of products making it possible to combat the pathology linked to the SPG4 gene mentioned above.
  • the invention also relates to the use of a cell, mammal or polypeptide according to the invention for the screening of chemical or biochemical compound which can interact directly or indirectly with the polypeptides according to the invention, and / or capable of modulating the expression or the activity of these polypeptides.
  • the invention also relates to the use of a nucleic acid sequence according to the invention for the synthesis of recombinant polypeptides.
  • the method for producing a polypeptide of the invention in recombinant form is itself included in the present invention, and is characterized in that the transformed cells, in particular the cells or mammals of the present invention, are cultivated in conditions allowing the expression of a recombinant polypeptide encoded by a nucleic acid sequence according to the invention, and that said recombinant polypeptide is recovered.
  • Recombinant polypeptides characterized in that they are capable of being obtained by said production method, also form part of the invention.
  • the recombinant polypeptides obtained as indicated above can be both in glycosylated and non-glycosylated form and may or may not have the natural tertiary structure.
  • polypeptides can be produced from the nucleic acid sequences defined above, according to the techniques for producing recombinant polypeptides known to those skilled in the art.
  • the acid sequence nucleic acid used is placed under the control of signals allowing its expression in a cellular host.
  • An efficient system for producing a recombinant polypeptide requires having a vector and a host cell according to the invention. These cells can be obtained by introducing into host cells a nucleotide sequence inserted into a vector as defined above, then culturing said cells under conditions allowing replication and / or expression of the transfected nucleotide sequence.
  • the recombinant polypeptide purification methods used are known to those skilled in the art.
  • the recombinant polypeptide can be purified from cell lysates and extracts, from the culture medium supernatant, by methods used individually or in combination, such as fractionation, chromatography methods, immunoaffinity techniques using 'specific monoclonal or polyclonal antibodies, etc.
  • the polypeptides according to the present invention can be obtained by chemical synthesis and this using one of the many known peptide syntheses, for example the techniques using solid phases or techniques using partial solid phases, by condensation of fragments or by synthesis in conventional solution.
  • the solid phase synthesis technique is well known to those skilled in the art. See in particular Stewart et al. (1984) and Bodansky (1984).
  • polypeptides obtained by chemical synthesis and which may contain corresponding unnatural amino acids are also included in the invention.
  • polyclonal antibodies can be obtained from a serum of an animal immunized against the polypeptides according to the invention, in particular produced by genetic recombination or by peptide synthesis, according to the usual procedures.
  • the specific monoclonal antibodies can be obtained according to the conventional method of culture of hybridomas described by K ⁇ hler and Milstein, 1975.
  • the antibodies according to the invention are, for example, chimeric antibodies, humanized antibodies, Fab or F (ab ′) 2 fragments. They can also be in the form of immunoconjugates or labeled antibodies in order to obtain a signal. detectable and / or quantifiable.
  • the invention also relates to methods for the detection and / or purification of a polypeptide according to the invention, characterized in that they use an antibody according to the invention.
  • the invention further comprises purified polypeptides, characterized in that they are obtained by a method according to the invention.
  • the antibodies of the invention in particular the monoclonal antibodies, can also be used for the detection of these polypeptides in a biological sample.
  • polypeptides according to the invention in particular the polypeptide of sequence SEQ ID No. 3 or one of its variants, on sections of specific tissues, by example by immunofluorescence, gold labeling, enzyme immunoconjugates.
  • polypeptides may in particular make it possible to demonstrate an abnormal expression of these polypeptides in tissues or biological samples, which makes them useful for monitoring the evolution of the disease and molecular diagnosis.
  • the antibodies of the invention can be advantageously used in any situation where the expression of a polypeptide according to the invention, normal or mutated, must be observed.
  • Also forming part of the invention are the methods for determining an allelic variability, a mutation, a deletion, a loss of heterozygosity or any genetic anomaly of the SPG4 gene according to the invention, characterized in that they use a nucleic acid sequence or an antibody according to the invention.
  • the present invention thus comprises a method for genotypic diagnosis of the pathology associated with the SPG4 gene, characterized in that a nucleic acid sequence according to the invention is used.
  • the invention relates to a method for genotypic diagnosis of the disease associated with the presence of at least one mutation in a sequence of the SPG4 gene from a biological sample from a patient, characterized in that it comprises the following steps: a) where appropriate, isolation of the genomic DNA from the biological sample to be analyzed, or obtaining cDNA from the RNA of the biological sample; b) specific amplification of said DNA sequence of the SPG4 gene capable of containing a mutation using primers according to the invention; c) analysis of the amplification products obtained and comparison of their sequence with the corresponding normal sequence of the SPG4 gene.
  • the invention also includes a method for diagnosing the disease associated with an abnormal expression of a polypeptide coded by the SPG4 gene, in particular the polypeptide of sequence SEQ ID No. 3, characterized in that one or antibodies according to the invention with the biological material to be tested, under conditions allowing the possible formation of specific immunological complexes between said polypeptide and said antibody (s), and in that any immunological complexes possibly formed are detected and / or quantified .
  • These methods aim, for example, at methods of diagnosing PSF-AD associated with the presence of a mutation in the SPG4 gene according to the invention, in particular antenatal, by determining from a biological sample from the patient the presence of mutations in at least one of the sequences described above.
  • the nucleic acid sequences analyzed may as well be genomic DNA, cDNA, or mRNA.
  • Nucleic acids or antibodies based on the present invention could also be used to allow a positive diagnosis in a patient or a pre-symptomatic diagnosis in a subject at risk, in particular with a family history.
  • the methods which make it possible to demonstrate a mutation in a gene relative to the wild-type gene are, of course, very numerous. They can basically be divided into two main categories.
  • the first type of method is that in which the presence of a mutation is detected by comparison of the mutated sequence with the corresponding wild-type sequence
  • the second type is that in which the presence of the mutation is detected indirectly, for example by evidence of mismatches due to the presence of the mutation.
  • These methods can use the probes and primers of the present invention described. They are generally purified hybridization nucleic sequences comprising at least 15 nucleotides, preferably 20, 25 or 30 nucleotides, characterized in that they can hybridize specifically with a nucleic sequence according to the invention. Preferably, the specific hybridization conditions are such as those defined above or in the examples.
  • the length of these nucleic acid hybridization sequences can vary from 15, 20 or 30 to 200 nucleotides, particularly from 20 to 50 nucleotides.
  • methods for determining an allelic variability, a mutation, a deletion, a loss of heterozygosity or a genetic abnormality preference is given to methods comprising at least one amplification step called PCR.
  • the amplified products may be treated with the appropriate restriction enzyme before detecting or assaying the targeted product.
  • the mutations in the SPG4 gene according to the invention may be responsible for various modifications to its translation product, modifications which can be used for a diagnostic approach. Indeed, the modifications of antigenicity linked to these mutations can allow the development of specific antibodies. Discrimination of the mutated gene product can be achieved by these methods. All these modifications can be used in a diagnostic approach using several well-known methods based on the use of mono- or polyclonal antibodies recognizing the normal polypeptide or mutated variants, such as for example by RIA or by ELISA.
  • the subject of the invention is also a kit or kit necessary for the diagnosis, in particular for the diagnosis of PSF-AD associated with the presence of mutation in the SPG4 gene according to the invention, characterized in that it comprises at least a compound chosen from the following group of compounds: a) a nucleic acid, in particular as a primer or probe, according to the present invention; and b) an antibody according to the invention.
  • the invention comprises a method of selecting a chemical or biochemical compound capable of preventing and / or treating PSF-AD associated with the SPG4 gene, characterized in that a sequence d nucleic acid according to the invention, a polypeptide according to the invention, a vector according to the invention, a cell according to the invention, a mammal according to the invention or an antibody according to the invention.
  • nucleic acids coding for proteins interacting with the promoter and / or regulatory sequences of the SPG4 gene according to the invention can be screened and / or selected using a simple hybrid system such as that described in the manual accompanying the Matchmaker One kit. -Hybrid System from Clontech
  • the invention includes the use of nucleic acid or polypeptide according to the invention, a vector according to the invention, a cell according to the invention, or a mammal according to the invention, for studying the expression or activity of the SPG4 gene.
  • FIGURES 1A, 1B and 1C Physical map of the SPG4 interval and genomic organization of SPG4.
  • FIGURE 1A The 1.5 Mb candidate region is delimited by the genetic markers D2S352 and D2S2347 indicated in bold characters. The position of polymorphic markers and other STSs is indicated in standard characters while the position of ESTs is indicated in italics.
  • the LAC clones constituting the pre-sequencing card are represented by rectangles whose names appear above. above and the precise size of the clone below if it could be determined. The name of BACs A, B, C, ...
  • FIGURE 1B Schematic representation of the SPG4 gene which overlaps the
  • BACs D (b336P14) and G (B563N4).
  • the exons are depicted as black rectangles with their names above.
  • FIGURE 1C The five mutations identified in seven families of PSF-AD linked to the SPG4 locus are positioned in exons 7, 11, 13 and in the acceptor splice site of intron 15.
  • FIGURE 2 Nucleic and protein sequence of the SPG4 cDNA and of the spastin.
  • the 17 vertical bars with a number located below represent the junctions between the different exons.
  • the initiating ATG codon is located in position nt 126-128 and the termination STOP codon in position nt 1974-1976.
  • Five of the mutations identified to date, including the loss of exon 16, are indicated in italics (nt 1210, nt 1468, nt 1520, nt 1620 and for the loss of exon 16: nt 1813-1853).
  • the polyadenylation site is in italics and underlined.
  • the putative nuclear location signal (NLS), RGKKK, as well as the three conserved domains predicted by analysis in the ProDom database are respectively located at positions aa7-11 (NLS), aa342-409 (domain 92), aa411 -509 (domain 179) and aa512-599 (domain 6226).
  • the four motifs predicted by the sequence comparison in the Prosite database are: two "leucine zippers” motifs at positions aa50-78 and aa508-529, the ATP binding site (or Walker motif A) at positions aa382-389 and the "helix-loop-helix” dimerization domain at positions aa478-486.
  • Motives A and B by Walker, "GPPGNGKT” and "IIFIDE”, as well as the minimum AAA consensus are underlined.
  • FIGURES 3A and 3B Characterization of a mutation at a splicing site in individuals with three families of PSF-AD linked to the SPG4 locus.
  • FIGURE 3A PCR amplification of fragment IV of the SPG4 cDNA from lymphoblast cDNA: well M, size marker VII (Boehringer); well 1, member not affected by family 2992; well 2, patient of family 2992; well 3, non-affected family member 5330; well 4, patient of family 5330; well 5, patient of family 5226; well 6, negative control (human genomic DNA).
  • FIGURE 3B Sequence graph of the intron 15 splice acceptor site mutation. Genomic sequence of the control individual above and of a patient in family 2992 below. The asterisk at position nt 1813-4 indicates an A-> C polymorphism which affects an unconserved nucleotide of the intron 15 splice acceptor site in the patient.
  • FIGURES 4A and 4B Homologies of the spastin.
  • FIGURE 4A Multiple alignment created by CLUSTAL W of eight proteins from various organisms and showing strong sequence homology with human and murine spastins (SEQ ID No. 73).
  • FIGURE 4B Alignment by yeast metalloproteases by CLUSTAL W
  • FIGURE 5 Alignment by BLASTN of the nucleic sequences of the cDNA SPG4 and of its mouse ortholog Spg4 (SEQ ID No. 72).
  • the murine cDNA polyadenylation site is underlined and in italics.
  • the STOP codon is located in position nt 1515-1517 in murine cDNA and in position nt 1974-1976 in human cDNA.
  • FIGURES 6A, 6B and 6C PCR analysis of the expression of SPG4 and its murine orthologue Spg4.
  • FIGURE 6A Collection of cDNAs from multiple mouse tissues.
  • Well M size V marker (Boehringer); well 1, heart; well 2, brain; well 3, spleen; well 4, lung; well 5, liver; well 6, skeletal muscle; well 7, kidney; well 8, testicle; well 9, 7-day embryo E7; well 10, 11 day embryo
  • FIGURE 6B Collection of cDNAs from multiple human tissues.
  • Well M size VII marker (Boehringer); well 1, brain; well 2, heart; well 3, kidney; well 4, liver; well 5, lung; well 6, pancreas; well 7, placenta; well 8, skeletal muscle; well 9, negative control (human genomic DNA); well 10, negative control (no DNA).
  • FIGURE 6C Collection of cDNAs from multiple tissues of human fetus.
  • Well M size VII marker (Boehringer); well 1, brain; well 2, heart; well 3, kidney; well 4, liver; well 5, lung; well 6, skeletal muscle; well 7, spleen; well 8, thymus; well 9, negative control (human genomic DNA); well 10, negative control (no DNA).
  • BACs from two human genomic libraries CITB_978_SKB (marketed by Research Genetics) and RPCI-11 (Osoegawa et al., 1998), and covering the SPG4 interval were selected to be sequenced (Hazan et al., Genomics, 60 (3), 309-19, 1999).
  • 40 ⁇ g of the DNA of each BAC was partially digested with the restriction enzyme CviJI (CHIMERx) and separated by electrophoresis on 0.4% LMP agarose gel (FMC).
  • DNA fractions varying in size around 3, 5 and 10 kb were eluted with ⁇ -agarase (Biolabs) and ligated to a plasmid vector pBAM3 previously digested with SmaI and dephosphorylated in an IXinsert to 5Xvector ratio. Electrocompetent E. coli DH10B bacteria (GIBCO-BRL) were transformed by electroporation with the different ligations. About 1000 to 1500 subclones per BAC (8 to 10 equivalent genomes) composed of 20% of clones with 10 kb inserts, 40% of clones with 5 kb inserts and 40% of clones with 3 kb inserts have been isolated .
  • the ends of the inserts of these clones were sequenced on a LICOR 4200 automatic sequencer.
  • the sequences were assembled into a skeleton made up of several contigs using Phred and Phrap software.
  • the holes between each contig were sequenced with dideoxynucleotides labeled on an ABI 377 sequencer (PE-Applied Biosystems).
  • the exons contained in these sequence contigs have been predicted by the computer programs GRAIL II, GENSCAN, FGENEH and Génie.
  • the sequences were also compared in the nucleic and protein databases of the EMBL and GenBank with the BLASTN and BLASTX programs.
  • the determination of the promoter sequences was carried out by the computer programs TSSG and TSSW. The results of all these sequence analyzes were visualized by the Genotator sequence annotation program.
  • the SPG4 gene cDNA was isolated by 5 'and 3' RACE-PCR experiments on polyA + RNA from fetal brain, adult brain and adult liver using the Marathon cDNA amplification kit (Clontech ), according to the supplier's instructions. A first PCR, followed by an internal PCR were carried out with different pairs of primers whose sequences are indicated in Table 1 below: Table 1 Primers used for RACE-PCR and cDNA amplifications
  • SPA_3RACE1 AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550
  • SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No.15) nt 45 b + m 655 pb SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) nt 700 SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No.17) nt 106 c + n 543ACTTTTBTCTTBTTCTTBTTCT 18) nt 649 SPA_Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) nt 487 d + n 746 pb SPA_Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) nt 1233 SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No.21) ntGAGTAG2A ) nt 1175 SPA_Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) nt 1036 a + m 763
  • SPA_Ca TGGAGATGACAGAGTACTTG (SEQ ID No.27) nt 1550 a + m 766 bp SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) nt 2316 SPA_Cb ATGAGGCTGTTCTCAGGCG (SEQ ID No.29) nt 1603
  • the RACE-PCR products were cloned with the TA-cloning kit (Invitrogen) and the corresponding clones were sequenced on an ABI 377 (PE-Applied Biosystems).
  • the sequence of the SPG4 transcript was verified by the sequencing of PCR products amplified from a population of cDNA originating from the lymphoblasts of 6 healthy individuals.
  • RNAs were extracted from the lymphoblast lines of an individual affected by the family studied and from 6 control individuals using the RNA PLUSR kit (bioprobe System).
  • the synthesis of the cDNA was carried out on 500 ng to 1 ⁇ g of RNA with 100 pmoles of random hexamer primers (Pharmacia) and 200 units of reverse transcriptase Superscript II (Gibco BRL) under standard conditions.
  • Four amplifications by PCR, generating overlapping fragments which cover the entire open reading phase of SPG4 were carried out on the cDNAs of the patients and controls.
  • Fragment I was amplified with the primers SPA_Db / SPA_Dm, then in internal PCR with the primers SPA_Dc / SPA_Dn. Fragments II, III, and IV were respectively amplified with the primers SPA_Ad / SPA_Am, SPA_Ba / SPA_Bm and SPA_Ca / SPA_Cm (cf. the sequences of these primers in Table 1).
  • Each amplification was carried out in a total volume of 50 ⁇ l containing 4 ⁇ l of cDNA ( ⁇ 1 / 7th of the prep.), 20 pmol of each primer, 200 ⁇ M of dNTPs, 50 mM of KCI, 10 mM of Tris pH9, 1.5 mM MgCI2, 0.1% triton X-100, 0.01% gelatin and 2.5 units of Taq polymerase (Cetus-PE).
  • the PCR reactions were carried out according to the "hot start” method: Taq polymerase is added at 92 ° C after a first denaturation step of 5 min at 94 ° C.
  • the samples are then subjected to 35 cycles of denaturation (94 ° C for 40 sec), hybridization (55 ° C for 50 sec, with the exception of fragment I: 58 ° C for 50 sec) and elongation (72 ° C for 1 min), followed by a final elongation step (5 min at 72 ° C).
  • the PCR products are sequenced on an ABI 377 automatic sequencer (PE-Applied Biosystems) with the primers SPA_Dc / SPA_Dn, SPA_Ac / SPA_An, SPA_Bb / SPA_Bn and SPA_Cb / SPA_Cm for fragments I, II, III and IV respectively.
  • exon 1 amplified using the Advantage GC genomic PCR kit (Clontech) according to the supplier's instructions, four slightly different PCR programs (1, 2, 3 and 4) were used to amplify SPG4 exons (see table 2).
  • the amplifications were all carried out in a volume of 50 ⁇ l containing 100 ng of genomic DNA, 50 pmol of each primer, 250 ⁇ M of dNTPs, 1 ⁇ of Takara buffer and 1 unit of Taq polymerase Takara La Taq (Shuzo Co.).
  • the PCR reactions were carried out according to the “hot start” method: the Taq polymerase is added at 94 ° C. after a first denaturation step of 5 min at 96 ° C.
  • the samples are then subjected to 30 cycles of denaturation (94 ° C for 40 sec), of hybridization (prog. 1: 60 ° C for 50 sec; prog. 2, 58 ° C for 50 sec, prog. 3 and 4: 55 ° C for 50 sec) and elongation (prog. 1 and 4: 72 ° C for 1 min, prog. 2 and 3: 72 ° C for 40 sec), followed by a final step of elongation (10 min at 72 ° C).
  • the sequencing of these PCR products was carried out on an ABI 377 sequencer (PE-Applied Biosystems) using either the PCR primers or the internal primers denoted “b” and “n” (see Table 2). 4) Characterization of SPG4
  • CDNA clones 977312 (EST AA560327) and 568234 (EST AA107866) from the blastocyst and mouse E8 embryo cDNA libraries, both of which correspond to the murine orthologue of SPG4, were isolated by the IMAGE consortium and sequenced in the laboratory on an ABI 377 sequencer (PE-Applied Biosystems).
  • the cDNA collections of different fetal and adult human tissues, as well as mouse tissues were tested by PCR according to the supplier's protocol with the pair of primers SPA_Ca / SPA_Cm for human cDNAs and the pair SPA_Ca / spam (spam: 5'-ACCGAAGTCAAGAGCCTATC-3 ') for mouse cDNAs.
  • the PCR conditions are those used for the amplification of SPG4 from cDNA from lymphoblast lines (cf.
  • Histological and histo-enzymatic analyzes were carried out using a muscle biopsy from a patient from a family linked to the SPG4 locus according to the standard techniques described in Casari et al., 1998.
  • SPG4 (or SPAST) cDNA and the deduced protein sequence GenBank / EMBL AJ246001; the incomplete Spg4 cDNA clone, GenBank / EMBL AJ246002; the SPG4 (or SPAST) gene, GenBank EMBL AJ246003.
  • sequences of these 7 BACs were compared with those of nucleic and protein databases, and analyzed with four exon prediction programs. These preliminary sequence analyzes revealed 14 potential transcription units, three of which correspond to the genes coding for xanthine dehydrogenase, the steroid 5 ⁇ -reductase 2 and a protein binding TGF ⁇ . Of the 14 genes detected by sequence analysis, 9 had been previously identified in EST databases (for “Expressed Sequence Tag”) and located within the SPG4 interval (Hazan et al., in press in Genomics); the 5 remaining genes could only be identified by sequencing the candidate region.
  • SPG4 or SPAST
  • SPG4 was composed of 17 exons and spanned a region of around 90 kb, covered by two adjacent BAC clones, D and G (cf. Fig. 1 B).
  • the first three predicted exons of this gene were identified in BAC D by two of the four exon prediction programs used, GRAIL II and GENSCAN; they have a strong homology with a EST of mouse blastocyst, AA560327.
  • the last 14 exons are found in BAC G.
  • the protein sequence deduced from exons 7 to 17 is significantly homologous to a subclass of the AAA family, comprising the yeast proteins Yta6p (Schnall et al., 1994), TBP6 (Schnall et al, 1994) and End 13, as well as the mouse protein SKD1 (Perier et al., 1994).
  • the intron / exon junctions are shown in table 3 below: the size of the exons varies from 41 bp (exon 16) to 1.410 kb (exon 17), that of the introns varying from 140 bp (intron 11) to 23.247 kb ( intron 1).
  • SPG4 cDNA Heterozygous mutations were sought in the SPG4 cDNA originating from lymphoblasts of 14 patients from families linked to the SPG4 locus (1 affected individual per family).
  • Four overlapping PCR fragments I, II, III and IV covering the open reading phase of the SPG4 cDNA were amplified and sequenced in the 14 patients as well as in 6 healthy control individuals.
  • Agarose gel electrophoresis of the PCR IV fragment showed three bands of equal intensity in 3 patients of families 2992, 5226 and 5330 from the same region of Switzerland, which suggested a microdeletion or a mutation of a site d 'splicing; the two additional bands were not present in 2 healthy individuals from families 2992 and 5330 (Fig. 3A).
  • the genomic sequence of exon 16 revealed a heterozygous mutation A-> G of the splice acceptor site (AG) of intron 15 in individuals with these three families (Fig. 3B); this mutation generates the loss of exon 16 followed by a shift in the reading phase in the abnormal transcript. None of the healthy members including husbands and wife carry this mutation of the splicing site. The identification of the same mutation in all members affected by these three Swiss families demonstrates the existence of a common ancestor, which had previously been suggested by the study of haplotypes.
  • nt positions refer to the sequence of the SPG4 cDNA.
  • b The positions in aa refer to the sequence of the spastin.
  • PTC + 7 aa "premature termination codon" at 7 aa downstream of exon 16.
  • nt positions refer to the sequence of the SPG4 cDNA.
  • b The positions in aa refer to the sequence of the spastin.
  • the bases of exons are indicated in upper case, those of introns in lower case.
  • the open reading phase of SPG4 codes for a protein of 616 aa which we have called spastin and whose molecular weight is approximately 67.2 kDaltons (kD).
  • the comparison of this amino acid sequence in protein databases using BLAST programs made it possible to highlight a zone of strong homology with several members of the AAA family at the C-terminal end of the spastin. .
  • the "typical" motifs of the AAA family, included in the AAA cassette, are located between positions aa342 and aa599 (see FIG. 2) according to the sequence comparisons in the protein domain databases ProDom and Prosite.
  • the three conserved type domains including the A and B Walker motifs as well as the minimal consensus motif of the AAA proteins are located respectively within the AAA cassette at positions aa382-389, aa437-442 and aa480-498 (Fig. 2) .
  • Walker motif A "GPPGNGKT” also called p-loop (or loop-p) which corresponds to the ATP binding domain and motif B "IIFIDE” are very conserved among all members of the AAA family including the spastin.
  • AAA cassettes present in 150 proteins of this family of ATPase coming from very distant organisms in evolution made it possible to classify this set of proteins in several subgroups, according to the number of AAA cassettes identified (1 or 2) and sequence homologies between these different cassettes (Beyer, 1997).
  • the spastin has a stronger homology with a particular subclass of AAA, and more specifically with the following proteins, most of which have been identified by complete sequencing of the genome of the organism considered.
  • the spastin has a sequence identity of 52%, 51% and 50% with the yeast protein Yta6p (Q02845), the nematode protein 016299 and the protein of yeast TBP6 (P40328) respectively. Similar results were obtained by analyzing the protein sequence of the spastin in the ProDom database which showed the existence of three domains of homology (named 92, 179 and 6226 and corresponding to positions aa342-409, aa411-509 and aa512-599) found in putative 26S proteasome subunits yeast.
  • members of this AAA subgroup most often contain leucine-zipper motifs, two of which could be detected in the protein sequence of the spastin at positions aa50-78 and aa508-529 by analysis of the sequence in the Prosite database (see Fig. 2). This analysis was also able to predict the presence of a propeller-loop-helix (“helix-loop-helix”) dimerization pattern located between positions aa478 and aa486.
  • helix-loop-helix propeller-loop-helix
  • the open mouse reading phase is followed by a 3 bp non-coding region (3 'UTR) of 175 bp containing a polyadenylation site located ⁇ 20 bp upstream of the polyA tail (Fig. 5).
  • the nucleic acid sequence of SPG4 and the protein sequence of human spastin have an identity of 89% (between positions nt 460 and nt 1982) and 96% respectively (between positions aa113 and aa616) with the sequences of the cDNA and of the protein deduced from the mouse. This significant degree of homology makes it possible to affirm that this mouse transcript corresponds to the murine ortholog of SPG4, which was therefore baptized Spg4.
  • oxidative phosphorylation OXPHOS
  • a muscle biopsy was performed on a patient from one of the families of PSF-AD linked to the SPG4 locus. Morphological and histo-enzymatic analyzes of this muscle biopsy did not reveal any RRF (“ragged red fibers”) muscle fiber, characteristic of OXPHOS defects in the mitochondria.
  • spastin is a new member of the AAA protein family, the localization of which appears to be nuclear and which has a strong homology with the yeast proteasome 26S subunits.
  • AAA cassette Despite a large homology restricted to a domain of 230 to 250 aa, known as the AAA cassette, the numerous members of this protein family can participate in very varied cellular mechanisms such as the transport of proteins within vesicles, the regulation of the cycle. cellular, organogen biogenesis, ie transcription control, .... However, all these cellular mechanisms involve the assembly, function or degradation of protein complexes, which suggests that members of the AAA family are proteins called "chaperones".
  • Bodansky M. Principles of peptide synthesis, (1984). Bruyn, R.P.M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-Lorrain) in
  • Hereditary Spastic Paraplegia Working Group Hereditary spastic paraplegia: advances in genetic research. Neurology 46, 1507-1514 (1996).
  • Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher disease are allelic disorders at the proteolipid protein locus. Nature Broom. 6, 257-262 (1994).

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, et certaines de ses mutations responsables de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux treansgéniques ainsi que des méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.

Description

CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE SPASTIQUE AUTOSOMIQUE DOMINANTE.
L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, responsable de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques ainsi que des méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.
Les paraplégies spastiques familiales (PSF) sont des affections dégénératives du système nerveux central caractérisées par une spasticité bilatérale et progressive des membres inférieurs. Elles se manifestent cliniquement par des difficultés de la marche pouvant évoluer en une paralysie totale des deux jambes. La physiopathologie de cet ensemble de maladies est à ce jour peu documentée ; toutefois, les données anatomopathologiques permettent de conclure que l'atteinte est limitée aux faisceaux pyramidaux responsables de la motricité volontaire dans la moelle épinière (Reid, 1997). Il existe différentes formes cliniques et génétiques de PSF. On distingue cliniquement les PSF dites « pures » correspondant à une spasticité isolée des membres inférieurs, des PSF « complexes » pour lesquelles la spasticité des jambes est associée à d'autres manifestations cliniques de type neurologique ou non (Bruyn et al., 1991). D'un point de vue génétique, les PSF peuvent être transmises selon le mode autosomique dominant (PSF-AD), autosomique récessif (PSF-AR) ou lié au chromosome X (PSF-X). La forme « pure » de PSF qui est le plus souvent transmise selon le mode autosomique dominant demeure la plus fréquente (environ 80 % des PSF) (Reid, 1997). L'incidence des PSF qui reste difficile à estimer en raison des rares études épidémiologiques et de l'importante variabilité clinique varie de 0,9 : 100 000 au Danemark, 3 à 9,6 : 100 000 dans certaines régions d'Espagne (Polo et al., 1991) ou 14 : 100 000 en Norvège (Skre, 1974) (environ 3 : 100 000 en France).
En plus de cette grande variabilité clinique qui est observée non seulement entre les différentes familles mais aussi entre différents membres atteints d'une même famille, les PSF se caractérisent également par une importante hétérogénéité génétique. Dans le cas des PSF-AD, quatre loci ont été identifiés à ce jour sur les chromosomes 14 (locus SPG3) (Hazan et al., 1993), 2 (locus SPG4) (Hazan et al., 1994 ; Hentali et al., 1994), 15 (locus SPG6) (Fink et al., 1995) et 8 (locus SPG8) (Hedera et al., 1999). L'étude d'un grand nombre de familles présentant une PSF-AD a montré que le gène porté par le chromosome 2 est un locus majoritaire de cette forme de la maladie, retrouvé dans 40 à 50 % des familles analysées (The Hereditary Spastic Paraplegia Working Group, 1996 ; Durr et al., 1996). Un phénomène d'anticipation a été observé dans certaines familles de PSF liée au locus SPG4 ; ce phénomène a par la suite été associé à l'expansion d'une répétition (CAG)n mise en évidence dans 6 familles danoises (Nielsen et al., 1997) par In technique de RED (pour Rapid Expansion Détection). Cette expansion n'a cependant jamais pu être confirmée dans aucune des familles testées par cette même méthode ni par la recherche systématique de séquences de type (CAG)n dans les cartes physiques composées de clones YAC (pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosome) (Hazan et al., Genomics, 60 (3), 309-19, 1999). A ce jour, trois gènes responsables de deux formes de PSF-X et d'une forme de PSF-AR ont été identifiés. Des mutations dans le gène, codant pour une molécule d'adhérence cellulaire spécifique des neurones, L1-CAM (pour L1 Cell Adhésion Molécule), et localisé en Xq28 (locus SPG1) causent une forme complexe de PSF (Jouet et al., 1994) dans laquelle la spasticité est associée à un retard mental, alors que des mutations dans le gène PLP (pour ProteoLipid Protein) situé en Xq21 (locus SPG2), codant pour une molécule constitutive de la couche de myéline, sont à l'origine de formes pures et complexes de PSF-X (Saugier-Veber, P. et al., 1994). Plus récemment des mutations dans un gène localisé en 16q24.3 (locus SPG7), qui code pour la paraplegin, une ATPase mitochondriale de la famille protéique des AAA (pour «ATPases Associated with diverse cellular Activities») (Confalonieri et al., 1995) ont été associées à des formes complexes et pures de PSF-AR (Casari et al., 1998).
Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caractériser le gène responsable de la forme la plus fréquente de PSF-AD. L'identification de ce gène devrait en particulier permettre, outre la possibilité d'un test de dépistage anténatal chez les familles concernées, de mieux comprendre certains des mécanismes moléculaires engendrant ces dégénérescences spécifiques de faisceaux nerveux de la moelle épinière, voire d'apporter des éléments de réponse quant à un traitement thérapeutique des malades.
Ceci est justement l'objet de la présente invention. Après avoir délimité l'intervalle de localisation entre les marqueurs génétiques D2S352 et D2S2347 par l'étude des événements de recombinaison dans les familles de PSF liées au locus SPG4, les inventeurs ont établi un contig de BACs recouvrant une distance physique évaluée à environ 1 ,5 Mb et entrepris une stratégie de clonage positionnel basée sur le séquençage de l'intervalle SPG4 afin d'identifier de façon exhaustive tous les gènes localisés dans la région candidate. L'analyse de la séquence des deux BACs, D (b336P14) et G (B763N4), a révélé la présence d'un gène composé de 17 exons, s'étendant sur une distance d'environ 100 kb, et présentant une homologie avec les gènes codant pour des protéines de la famille des AAA. La comparaison de la séquence de ce gène entre les individus sains et atteints des familles de PSF-AD a permis de mettre en évidence différentes mutations chez les patients.
L'invention a ainsi pour objet l'identification et la caractérisation du gène SPG4 (ou SPAST) codant pour un nouveau membre nucléaire de la famille des AAA, responsable de la forme la plus fréquente de PSF-AD.
Sous un premier aspect, la présente invention a pour objet un acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 35, 40, 45, 50, 75, 100 ou 200 nucléotides consécutifs, d'une séquence choisie parmi le groupe comprenant : - la séquence SEQ ID No. 1, séquence génomique du gène SPG4 humain ;
- les séquences nucléiques homologues ou variantes de l'acide nucléique de séquence SEQ ID No. 1 ;
- leur séquence complémentaire ; et
- la séquence de leur ARN correspondant. La présente invention concerne, bien entendu, aussi bien les séquences ADN qu'ARN ainsi que les séquences qui s'hybrident avec elles, de même que les ADNs double brin correspondants.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entendra désigner aussi bien un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou de synthèse, comportant ou non des nucléotides non naturels, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique. On entend par fragment d'ADN et/ou d'ARN naturel isolé, ou de synthèse, comportant ou non des nucléotides non naturels, un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment, un segment ou une région d'un acide nucléique.
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à- dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à- dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié.
Par «séquence nucléique homologue», on entendra désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique, et/ou une mutation, notamment ponctuelle, et dont la séquence nucléique présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence nucléique de référence. Par « pourcentage d'identité » entre deux séquences d'acide nucléique ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Les comparaisons de séquences entre deux séquences d'acide nucléique ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par « fenêtre de comparaison » pour identifier et comparer les régions locales de similarité de séquence. L'alignement optimal des séquences pour la comparaison peut être réalisé, outre manuellement, au moyen de l'algorithme d'homologie locale de Smith et Waterman (1981) [Ad. App. Math. 2:482], au moyen de l'algorithme d'homologie locale de Neddleman et Wunsch (1970) [J. Mol. Biol. 48:443], au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988) [Proc. Natl. Acad. Sci. USA 85:2444], au moyen de logiciels informatiques utilisant ces algorithmes (GAP, BESTFIT, FASTA et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wl, ou encore par les logiciels de comparaison BLAST N ou BLAST P).
Le pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés est déterminé en comparant ces deux séquences alignées de manière optimale par fenêtre de comparaison dans laquelle la région de la séquence d'acide nucléique ou d'acides aminés à comparer peut comprendre des additions ou des délétions par rapport à la séquence de référence pour un alignement optimal entre ces deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre de positions identiques pour lesquelles le nucléotids ou le résidu d'acide aminé est identique entre les deux séquences, en divisant ce nombre de positions identiques par le nombre total de positions dans la fenêtre de comparaison et en multipliant le résultat obtenu par 100 pour obtenir le pourcentage d'identité entre ces deux séquences.
Par exemple, on pourra utiliser le programme BLAST, « BLAST 2 séquences » (Tatusova et al., "Blast 2 séquences - a new tool for comparing protein and nucleotide séquences", FEMS Microbiol. Lett. 174:247-250) disponible sur le site http://www.ncbi.nlm.nih.gov/gorf/bl2.html, les paramètres utilisés étant ceux donnés par défaut (en particulier pour les paramètres « open gap penaltie » : 5, et « extension gap penaltie » : 2 ; la matrice choisie étant par exemple la matrice « BLOSUM 62 » proposée par le programme), le pourcentage d'identité entre les deux séquences à comparer étant calculé directement par le programme.
Il s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec une des séquences de l'invention. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 80 %, de préférence 90 % ou 95 % d'identité après alignement entre l'une des deux séquences et la séquence complémentaire de l'autre.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN complémentaires.
A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucleotidiques décrits ci-dessus, sont avantageusement les suivantes.
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42°C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCI + 0,015 M citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i.e. : 42°C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20°C en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 % SDS pendant 30 minutes à 60°C pour une sonde de taille > 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de taille définie, seront adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et al., 1989. Par «séquence nucléique variante» ou «acide nucléique variant» d'une séquence nucléique de référence, on entendra désigner l'ensemble des séquences nucléiques correspondant à des variants alléliques, c'est-à-dire des variations individuelles de la séquence nucléique de référence. Ces séquences mutées naturelles correspondent à des polymorphismes présents chez les mammifères, en particulier chez l'être humain et, notamment, à des polymorphismes pouvant conduire à la survenue et/ou au développement de pathologie.
Si les séquences selon l'invention concernent les séquences normales, elles concernent également les séquences mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10 % de mutations par rapport à la séquence normale.
En particulier, les séquences nucléiques variantes comprendront toute séquence d'au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 50, 100 ou 200 nucléotides consécutifs, d'une séquence polymorphique de la séquence génomique du gène SPG4 humain de séquence SEQ ID No. 1, et dont la séquence d'acide nucléique présente par rapport à la séquence SEQ ID No. 1 au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidu d'acide aminé. Dans le cas présent, les séquences nucléiques variantes présentant au moins une mutation seront ici liées aux pathologies de type PSF-AD liées au locus SPG4. De préférence, la présente invention concerne des séquences nucléiques mutées dans lesquelles les mutations conduisent à une modification de la séquence d'acides aminés du polypeptide codé par la séquence normale.
On entendra également désigner par séquences nucléiques variantes tout ARN ou ADNc résultant d'une mutation d'un site d'épissage de la séquence nucléique génomique SEQ ID No. 1.
De préférence, l'invention concerne un acide nucléique purifié ou isolé du gène SPG4 selon l'invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe comprenant : a) la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No. 72, la séquence SEQ ID No. 106 ou la séquence d'au moins 15, de préférence 20, 25, 30, 35, 40, 45, 50, 75, 100 ou 200 nucléotides consécutifs de la séquence SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; b) les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1 , SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et c) la séquence complémentaire ou la séquence de l'ARN correspondant aux séquences telles que définies en a) et b), de préférence à l'exception de l'acide nucléique identifié dans la banque de données GenBank sous le numéro d'accession AB029006.
L'acide nucléique dont la séquence est divulguée dans la banque de données GenBank sous le numéro d'accession AB029006, correspond à la séquence de l'un des 100 ADNc issus d'une banque d'ARNm de cerveau humain identifiée par le
Kazusa DNA Research Institute au Japon (Kikuno et al., DNA Resarch, 6, 197-205,
1999).
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une séquence d'au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 50 ou 75 nucléotides consécutifs du fragment nt 714-809, extrémités incluses, de la séquence SEQ ID No. 2, de sa séquence complémentaire ou de la séquence de son ARN correspondant.
L'invention concerne de préférence un acide nucléique purifié ou isolé selon la présente invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe suivant :
- la séquence SEQ ID No. 1 ;
- la séquence SEQ ID No. 2, séquence de l'ADNc codant pour la spastin humaine ;
- les séquences SEQ ID No. 72 et SEQ ID No. 106, la séquence SEQ ID No. 72 représentant la séquence de l'ADNc incomplet codant pour la spastin murine représentée à la figure 5, ligne "Mouse" et la SEQ ID No. 106 sa séquence complète ;
- les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1 , SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une mutation correspondant à un polymorphisme naturel chez l'Homme, notamment dont la position et la nature sont identifiées dans le tableau 5. Les amorces ou sondes, caractérisées en ce qu'elles comprennent une séquence d'un acide nucléique selon l'invention, font également partie de l'invention.
La présente invention concerne ainsi l'ensemble des amorces qui peuvent être déduites des séquences nucléotidiques de l'invention et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques de l'invention, en particulier les séquences mutées, en utilisant notamment une méthode d'amplification telle que la méthode PCR, ou une méthode apparentée.
La présente invention concerne également l'ensemble des sondes qui peuvent être déduites des séquences nucléotidiques de l'invention, notamment des séquences capables de s'hybrider avec elles, et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques, en particulier de discriminer les séquences normales des séquences mutées.
La présente invention concerne en particulier les sondes ou amorces de séquences choisies parmi les séquences SEQ ID No. 4 à SEQ ID No. 71. L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce, pour la détection, l'identification, le dosage ou l'amplification de séquence d'acide nucléique.
Selon l'invention, les polynucléotides pouvant être utilisés comme sonde ou comme amorce dans des procédés de détection, d'identification, de dosage ou d'amplification de séquence nucléique, présenteront une taille minimale de 15 bases, de préférence de 20 bases, ou mieux de 25 à 30 bases.
L'ensemble des sondes et amorces selon l'invention pourront être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable.
Les séquences de polynucléotides selon l'invention non marquées peuvent être utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 35S, le 3H ou le 125l. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents luminescents tels que les agents radioluminescents, chémiluminescents, bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR (réaction en chaîne à la polymérase) (Erlich, 1989 ; Innis et al., 1990, et Rolfs et al., 1991). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la technique décrite dans le brevet américain U.S. N° 4,683,202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquences. La spécificité de l'amplification peut être contrôlée en utilisant comme amorce les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés. Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entendra désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription reverse. Il existe actuellement de très nombreux procédés permettant cette amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. en 1989, la technique 3SR (Self-Sustained Séquence Replication) décrite par Guatelli et al. en 1990, la technique NASBA (Nucleic Acid Séquence Based Amplification) décrite par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable, la technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la technique CPR (Cycling Probe Reaction) décrite par Duck et al. en 1990, la technique d'amplification à la Q-béta-réplicase décrite par Miele et al. en 1983 et perfectionnée notamment par Chu et al. en 1986 et Lizardi et al. en 1988, puis par Burg et al. ainsi que par Stone et al. en 1996.
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilisera avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à l'aide des amorces selon l'invention ou à la mise en oeuvre d'un procédé de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase reverse afin d'obtenir un ADNc à partir de l'ARNm contenu dans l'échantillon biologique. L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention. La technique d'hybridation de sondes peut être réalisée de manières diverses
(Matthews et al., 1988). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde. Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par la méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).
Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sonde de capture. Dans ce cas, une sonde, dite « sonde de capture », est immobilisée sur un support et sert à capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite détecté grâce à une seconde sonde, dite « sonde de détection », marquée par un élément facilement détectable.
Les séquences selon la présente invention de site accepteur ou donneur d'épissage identifiées au tableau 3 (séquences SEQ ID No. 74 à SEQ ID No. 105) font également partie de la présente invention.
Sous un autre aspect, l'invention comprend une méthode pour le criblage de banques d'ADNc ou d'ADN génomique, ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en œuvre une séquence nucléique selon l'invention. Parmi ces méthodes, on peut citer notamment : - le criblage de banques d'ADNc et le clonage des ADNc isolés (Sambrook et al., 1989 ; Suggs et al., 1981 ; Woo et al., 1979), à l'aide des séquences nucléiques selon l'invention ; - le criblage de banques génomiques, par exemple de BACs (Chumakov et al., 1992 ; Chumakov et al., 1995) et éventuellement une analyse génétique en FISH (Cherif et al., 1990) à l'aide de séquences selon l'invention, permettant l'isolement et la localisation chromosomique, puis le séquençage complet du gène SPG4 codant pour la spastin. En particulier, ces méthodes selon l'invention pourront être mises en œuvre pour l'identification et ainsi l'obtention de la séquence génomique ou de l'ADNc du gène SPG4 chez d'autres mammifères, notamment la souris.
Ces méthodes de criblage et/ou de clonage comprendront en particulier une étape d'hybridation d'un acide nucléique selon l'invention avec un acide nucléique contenu dans une banque génomique ou d'ADNc.
L'invention comprend aussi une méthode d'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4 de séquence SEQ ID No. 1, caractérisée en ce qu'elle met en oeuvre un acide nucléique selon l'invention. Les outils informatiques à la disposition de l'homme du métier lui permettent aisément d'identifier à partir des séquences nucléiques génomiques selon l'invention les boîtes régulatrices promotrices nécessaires et suffisantes au contrôle de l'expression génique, notamment les boîtes TATA, CCAAT, GC, ainsi que les séquences régulatrices stimulatrices (« enhancer ») ou inhibitrices (« silencers ») qui contrôlent en CIS l'expression des gènes selon l'invention ; parmi ces séquences régulatrices, il convient de citer TIRE, MRE, CRE.
L'invention concerne également des méthodes pour l'identification de mutations portées par le gène SPG4 humain caractérisées en ce qu'elles mettent en œuvre une séquence nucléique selon l'invention, notamment de mutations responsables de la paraplégie spastique familiale autosomique dominante.
Ces méthodes d'identification de ces mutations comprendront en particulier les étapes suivantes : (i) isolement de l'ADN à partir da l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARNm de l'échantillon biologique ; (ii) amplification spécifique de l'ADN cible susceptible de présenter une mutation à l'aide d'amorces selon l'invention ; (iii) analyse des produits d'amplification, notamment la taille et/ou la séquence des produits d'amplification, par rapport à une séquence de référence.
Par méthodes d'identification de mutation selon l'invention, on entend également désigner une méthode permettant d'obtenir l'acide nucléique sur lequel a été identifiée ladite mutation.
Font également partie de l'invention, les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention présentant des mutations susceptibles de modifier l'expression de la protéine correspondante.
Les acides nucléiques caractérisés en ce qu'ils sont susceptibles d'être obtenus par une des méthodes précédentes selon l'invention, ou les acides nucléiques capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 80 % entre une des deux séquences et la séquence complémentaire de l'autre) avec lesdits acides nucléiques, font partie de l'invention, notamment les acides nucléiques variants ou homologues, en particulier les séquences nucléiques de variants alléliques du gène SPG4 de séquence SEQ ID No. 1 ou de son ADNc de séquence SEQ ID No. 2, ainsi que les séquences génomiques des gènes homologues d'autres mammifères tels que la souris.
Dans la présente description, on entendra désigner par "Spg4" le gène de souris homologue au gène humain SPG4. L'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce pour le criblage de banque génomique ou d'ADNc fait bien entendu partie de l'objet de la présente invention.
Sous un autre aspect, l'invention comprend un polypeptide purifié ou isolé codé par un acide nucléique selon l'invention, de préférence à l'exception du peptide de 584 acides aminés dont la séquence est identifiée dans la banque de données GenBank sous le numéro d'accession AB029006.
Dans la présente description, on utilisera le terme polypeptide pour désigner également une protéine ou un peptide.
De préférence, la présente invention concerne un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la séquence SEQ ID No. 3, correspondant à la spastin humaine codée par la séquence SEQ ID No. 2 de l'ADNc du gène SPG4 humain ; - la séquence SEQ ID No. 73, correspondant à un fragment de la spastin murine codée par la séquence SEQ ID No. 72 de l'ADNc incomplet du gène Spg4 de souris, la séquence SEQ ID No. 73 est représentée à la figure 4A, ligne "SPAST_MOUSE" ;
- la séquence SEQ ID No. 107, correspondant à la spastin murine codée par la séquence SEQ ID No. 106 de l'ADNc complet du gène Spg4 de souris ;
- les séquences de polypeptides homologues et variants du polypeptide de séquence SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107 ; et
- les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs. De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant : a) la séquence SEQ ID No. 3, la séquence SEQ ID No. 73, la séquence SEQ ID No. 107 ou la séquence d'au moins 10 acides aminés consécutifs d'une de ces séquences ; et b) les séquences homologues ou variantes des séquences SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No; 107.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend la séquence d'au moins 8, de préférence d'au moins 10, 15, 20 ou 30 acides aminés consécutifs de la séquence du fragment aa 197-228, extrémités incluses, de la séquence SEQ ID No. 3.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant : - la séquence SEQ ID No. 3, la séquence SEQ ID No. 73 et la séquence SEQ ID No.
107, lesquelles séquences portant au moins une des mutations correspondant à un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention ; et
- les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
Il doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement. En effet, l'invention concerne les peptides obtenus par purification à partir de sources naturelles, ou bien obtenus par recombinaison génétique, ou encore par synthèse chimique et pouvant alors comporter des amino-acides non naturels. La production d'un polypeptide recombinant, qui peut être réalisée en utilisant l'une des séquences nucléotidiques selon l'invention est particulièrement avantageuse car elle permet d'obtenir un niveau de pureté accrue du polypeptide désiré.
Par polypeptide homologue, on entendra désigner les polypeptides présentant certaines modifications par rapport au polypeptide de référence, comme en particulier une ou plusieurs délétions, troncations, un allongement, une fusion chimérique, et/ou une ou plusieurs substitutions, et dont la séquence d'acides aminés présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence d'acides aminés de référence.
Par « polypeptide variant » (ou variant protéique), on entendra désigner l'ensemble des polypeptides codés par les séquences nucléiques variantes telles que précédemment définies. En particulier, les polypeptides variants comprendront tout polypeptide codé par la séquence génomique mutée du gène SPG4 de séquence SEQ ID No. 1, et dont la séquence d'acides aminés présente au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidus d'acides aminés par rapport à la séquence SEQ ID No. 3. Dans le cas présent, les polypeptides variants présentant au moins une mutation seront liés aux pathologies de type PSF-AD.
On entendra également désigner par polypeptide variant tout polypeptide résultant de mutation d'un site d'épissage dans la séquence nucléique génomique SEQ ID No. 1.
L'invention comprend également les vecteurs de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'invention.
Les vecteurs selon l'invention, caractérisés en ce qu'ils comportent les éléments permettant l'expression et/ou la sécrétion desdites séquences dans une cellule hôte, ou encore une séquence d'adressage cellulaire, font également partie de l'invention. Les vecteurs caractérisés en ce qu'ils comportent une séquence de promoteur et/ou de régulateur selon l'invention, font également partie de l'invention.
Lesdits vecteurs comporteront de préférence un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Ils doivent pouvoir être maintenus de façon stable dans la cellule et peuvent éventuellement posséder des signaux particuliers spécifiant la sécrétion de la protéine traduite.
Ces différents signaux de contrôle sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences d'acide nucléique selon l'invention peuvent être insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi.
Parmi les systèmes à réplication autonome, on utilisera de préférence en fonction de la cellule hôte, des systèmes de type plasmidique ou viral, les vecteurs viraux pouvant notamment être des adénovirus (Perricaudet et al., 1992), des rétrovirus, des lentivirus, des poxvirus ou des virus herpétiques (Epstein et al., 1992).
L'homme du métier connaît les technologies utilisables pour chacun de ces systèmes.
Lorsque l'on souhaitera l'intégration de la séquence dans les chromosomes de la cellule hôte, on pourra utiliser par exemple des systèmes de type plasmidique ou viral ; de tels virus seront, par exemple, les rétrovirus (Temin, 1986), ou les AAV (Carter, 1993).
Parmi les vecteurs non viraux, on préfère les polynucléotides nus tels que l'ADN nu ou TARN nu selon la technique développée par la société VICAL, les chromosomes artificiels de levure (YAC, yeast artificial chromosome) pour l'expression dans la levure, les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour l'expression dans les cellules murines et de manière préférée les chromosomes artificiels d'homme (HAC, human artificial chromosome) pour l'expression dans les cellules humaines.
De tels vecteurs seront préparés selon les méthodes couramment utilisées par l'homme du métier, et les clones en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple la lipofection, l'électroporation, le choc thermique.
L'invention comprend en outre les cellules hôtes, notamment les cellules eucaryotes et procaryotes, transformées par les vecteurs selon l'invention ainsi que les animaux transgéniques, excepté l'Homme, comprenant une desdites cellules transformées selon l'invention.
Parmi les cellules utilisables à ces fins, on peut citer bien entendu les cellules bactériennes (Olins et Lee, 1993), mais également les cellules de levure (Buckholz,
1993), de même que les cellules animales, en particulier les cultures de cellules de mammifères (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster chinois (CHO), mais également les cellules d'insectes dans lesquelles on peut utiliser des procédés mettant en œuvre des baculovirus par exemple (Luckow, 1993). Un hôte cellulaire préféré pour l'expression des protéines de l'invention est constitué par les cellules CHO.
Parmi les mammifères selon l'invention, on préférera des animaux tels que les souris, les rats ou les lapins, exprimant un polypeptide selon l'invention.
Parmi les mammifères selon l'invention, on préférera également ceux comprenant une cellule transformée caractérisée en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations correspondant à un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention.
Parmi les mammifères selon l'invention, on préférera également des animaux tels que les souris, les rats ou les lapins, caractérisés en ce que le gène codant pour la spastin selon l'invention, n'est pas fonctionnel ou est invalidé.
Parmi les modèles animaux plus particulièrement intéressants ici, on trouve notamment :
- les animaux transgéniques présentant au moins dans une de leurs deux séquences alléliques du gène SPG4, une au moins des mutations dont la position et la nature sont identifiées au tableau 5 ou identifiées psr une méthode selon la présente invention. Ces animaux transgéniques sont obtenus par exemple par recombinaison homologue sur cellules souches embryonnaires, transfert de ces cellules souches à des embryons, sélection des chimères affectées au niveau des lignées reproductrices, et croissance desdites chimères ; - les animaux (de préférence souris) transgéniques surexprimant le gène SPG4 dans lequel pourra être introduite une desdites mutations selon l'invention. Les souris sont obtenues par exemple par transfection de copie de ce gène sous contrôle d'un promoteur fort de nature ubiquitaire, ou sélectif d'un type de tissu, ou après transcription virale ; - les animaux (de préférence souris) transgéniques rendus déficients pour le gène SPG4 selon l'invention, par inactivation à l'aide du système LOXP/CRE recombinase (Rohlmann et al., 1996) ou de tout autre système d'inactivation de l'expression de ce gène.
Les cellules et mammifères selon l'invention sont utilisables dans une méthode de production d'un polypeptide selon l'invention, comme décrit ci-dessous, et peuvent également servir à titre de modèle d'analyse et pour le criblage de banque d'ADN
(génomique ou d'ADNc).
Les cellules ou mammifères transformés tels que décrits précédemment peuvent être ainsi utilisées à titre de modèles afin d'étudier les interactions entre les polypeptides selon l'invention, et les composés chimiques ou proteiques, impliqués directement ou indirectement dans les activités des polypeptides selon l'invention, ceci afin d'étudier les différents mécanismes et interactions mis en jeu.
Surtout, ils peuvent être utilisés pour la sélection de produits interagissant avec les polypeptides selon l'invention, notamment la spastin humaine de séquence SEQ ID No. 3 ou ses variants selon l'invention, à titre de cofacteur, ou d'inhibiteur, notamment compétitif, ou encore ayant une activité agoniste ou antagoniste de l'activité des polypeptides selon l'invention. De préférence, on utilisera lesdites cellules transformées ou animaux transgéniques à titre de modèle permettant, notamment, la sélection de produits permettant de lutter contre la pathologie liée au gène SPG4 mentionnée ci-dessus.
L'invention concerne également l'utilisation de cellule, de mammifère ou de polypeptide selon l'invention pour le criblage de composé chimique ou biochimique pouvant interagir directement ou indirectement avec les polypeptides selon l'invention, et/ou capable de moduler l'expression ou l'activité de ces polypeptides. L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention pour la synthèse de polypeptides recombinants.
La méthode de production d'un polypeptide de l'invention sous forme recombinante est elle-même comprise dans la présente invention, et se caractérise en ce que l'on cultive les cellules transformées, notamment les cellules ou mammifères de la présente invention, dans des conditions permettant l'expression d'un polypeptide recombinant codé par une séquence d'acide nucléique selon l'invention, et que l'on récupère ledit polypeptide recombinant.
Les polypeptides recombinants, caractérisés en ce qu'ils sont susceptibles d'être obtenus par ladite méthode de production, font également partie de l'invention. Les polypeptides recombinants obtenus comme indiqué ci-dessus, peuvent aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent présenter ou non la structure tertiaire naturelle.
Ces polypeptides peuvent être produits à partir des séquences d'acide nucléique définies ci-dessus, selon les techniques de production de polypeptides recombinants connues de l'homme du métier. Dans ce cas, la séquence d'acide nucléique utilisée est placée sous le contrôle de signaux permettant son expression dans un hôte cellulaire.
Un système efficace de production d'un polypeptide recombinant nécessite de disposer d'un vecteur et d'une cellule hôte selon l'invention. Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.
Les procédés de purification de polypeptide recombinant utilisés sont connus de l'homme du métier. Le polypeptide recombinant peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps monoclonaux ou polyclonaux spécifiques, etc.. Les polypeptides selon la présente invention peuvent être obtenus par synthèse chimique et ce en utilisant l'une des nombreuses synthèses peptidiques connues, par exemple les techniques mettant en oeuvre des phases solides ou des techniques utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique. La technique de synthèse en phase solide est bien connue de l'homme du métier. Voir notamment Stewart et al. (1984) et Bodansky (1984).
Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondants sont également compris dans l'invention. Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugues, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'invention, font partie de l'invention.
Des anticorps polyclonaux spécifiques peuvent être obtenus à partir d'un sérum d'un animal immunisé contre les polypeptides selon l'invention, notamment produit par recombinaison génétique ou par synthèse peptidique, selon les modes opératoires usuels.
On notera notamment l'intérêt d'anticorps reconnaissant de façon spécifique certains polypeptides, variants, ou leurs fragments immunogènes, selon l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridomes décrite par Kόhler et Milstein, 1975. Les anticorps selon l'invention sont, par exemple, des anticorps chimériques, des anticorps humanisés, des fragments Fab ou F(ab')2 Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués afin d'obtenir un signal détectable et/ou quantifiable. L'invention concerne également des méthodes pour la détection et/ou la purification d'un polypeptide selon l'invention, caractérisées en ce qu'elles mettent en œuvre un anticorps selon l'invention.
L'invention comprend en outre des polypeptides purifiés, caractérisés en ce qu'ils sont obtenus par une méthode selon l'invention. Par ailleurs, outre leur utilisation pour la purification des polypeptides, les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent également être utilisés pour la détection de ces polypeptides dans un échantillon biologique.
Ils constituent ainsi un moyen d'analyse immunocytochimique ou immuno- histochimique de l'expression des polypeptides selon l'invention, notamment le polypeptide de séquence SEQ ID No. 3 ou l'un de ses variants, sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immunoconjugues enzymatiques.
Ils pourront permettre notamment de mettre en évidence une expression anormale de ces polypeptides dans les tissus ou prélèvements biologiques, ce qui les rend utiles pour le suivi de l'évolution de la maladie et le diagnostic moléculaire.
Plus généralement, les anticorps de l'invention peuvent être avantageusement mis en œuvre dans toute situation où l'expression d'un polypeptide selon l'invention, normal ou muté, doit être observée.
Font également partie de l'invention, les méthodes de détermination d'une variabilité allelique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou de toute anomalie génétique du gène SPG4 selon l'invention, caractérisées en ce qu'elles mettent en oeuvre une séquence d'acide nucléique ou un anticorps selon l'invention.
La présente invention comprend ainsi une méthode de diagnostic génotypique de la pathologie associée au gène SPG4, caractérisée en ce que l'on met en œuvre une séquence d'acide nucléique selon l'invention.
De préférence, l'invention concerne une méthode de diagnostic génotypique de la maladie associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisé en ce qu'il comporte les étapes suivantes : a) le cas échéant, isolement de l'ADN génomique à partir de l'échantillon biologique à analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ; b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'invention ; c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
L'invention comprend également une méthode de diagnostic de la maladie associée à une expression anormale d'un polypeptide codé par le gène SPG4, notamment le polypeptide de séquence SEQ ID No. 3, caractérisée en ce que l'on met en contact un ou des anticorps selon l'invention avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
Ces méthodes visent par exemple les méthodes de diagnostic de la PSF-AD associée à la présence de mutation dans le gène SPG4 selon l'invention, notamment anténatal, en déterminant à partir d'un prélèvement biologique du patient la présence de mutations dans au moins une des séquences décrites précédemment. Les séquences d'acides nucléiques analysées pourront aussi bien être de l'ADN génomique, de l'ADNc, ou de l'ARNm. Des acides nucléiques ou anticorps basés sur la présente invention pourront également être utilisés pour permettre un diagnostic positif chez un malade ou un diagnostic pré-symptomatique chez un sujet à risque, notamment avec antécédent familial.
Les méthodes permettant de mettre en évidence une mutation dans un gène par rapport au gène sauvage sont, bien entendu, très nombreuses. On peut essentiellement les diviser en deux grandes catégories. Le premier type de méthode est celui dans lequel la présence d'une mutation est détectée par comparaison de la séquence mutée avec la séquence correspondante sauvage, et le second type est celui dans lequel la présence de la mutation est détectée de façon indirecte, par exemple par évidence de mésappariements dus à la présence de la mutation.
Ces méthodes peuvent mettre en oeuvre les sondes et amorces de la présente invention décrites. Il s'agit généralement de séquences nucléiques d'hybridation purifiées comprenant au moins 15 nucléotides, de préférence 20, 25 ou 30 nucléotides, caractérisées en ce qu'elles peuvent s'hybrider spécifiquement avec une séquence nucléique selon l'invention. De préférence, les conditions d'hybridation spécifiques sont telles que celles définies précédemment ou dans les exemples. La longueur de ces séquences nucléiques d'hybridation peut varier de 15, 20 ou 30 à 200 nucléotides, particulièrement de 20 à 50 nucléotides. Parmi les méthodes de détermination d'une variabilité allelique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou d'une anomalie génétique, on préfère les méthodes comprenant au moins une étape d'amplification dite par PCR (réaction en chaîne par la polymérase) ou par PCR-like de la séquence cible selon l'invention susceptible de présenter une anomalie à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Les produits amplifiés pourront être traités à l'aide d'enzyme de restriction appropriée avant de procéder à la détection ou au dosage du produit ciblé.
Les mutations du gène SPG4 selon l'invention, peuvent être responsables de différentes modifications de son produit de traduction, modifications utilisables pour une approche diagnostique. En effet, les modifications d'antigénicité liées à ces mutations peuvent permettre la mise au point d'anticorps spécifiques. La discrimination du produit de gène muté peut être réalisée par ces méthodes. Toutes ces modifications peuvent être utilisées dans une approche diagnostique grâce à plusieurs méthodes bien connues basées sur l'utilisation d'anticorps mono- ou polyclonaux reconnaissant le polypeptide normal ou des variants mutés, comme par exemple par RIA ou par ELISA.
Ainsi, l'invention a également pour objet une trousse ou nécessaire pour le diagnostic, notamment pour le diagnostic de la PSF-AD associée à la présence de mutation dans le gène SPG4 selon l'invention, caractérisée en ce qu'elle comprend au moins un composé choisi parmi le groupe de composés suivant : a) un acide nucléique, notamment comme amorce ou sonde, selon la présente invention ; et b) un anticorps selon l'invention.
Sous un autre aspect, l'invention comprend une méthode de sélection d'un composé chimique ou biochimique capable de prévenir et/ou de traiter la PSF-AD associée au gène SPG4, caractérisée en ce que l'on met en œuvre une séquence d'acide nucléique selon l'invention, un polypeptide selon l'invention, un vecteur selon l'invention, une cellule selon l'invention, un mammifère selon l'invention ou un anticorps selon l'invention. Sont également comprises dans l'invention, les méthodes de sélection de composés chimiques ou biochimiques capables d'interagir directement ou indirectement avec des polypeptides selon l'invention ou avec les acides nucléiques selon l'invention, et/ou permettant de moduler l'expression ou l'activité de ces polypeptides, caractérisées en ce qu'elles comprennent la mise en contact d'un polypeptide selon l'invention, d'une cellule transformée selon l'invention, ou d'un mammifère selon l'invention, avec un composé candidat et, la détection d'une modification de l'activité dudit polypeptide.
Par exemple, mais sans s'y limiter, on peut citer une méthode d'identification de molécules capables d'interagir avec un polypeptide selon l'invention en utilisant un système de double hybride bactérien ou levure tel que le Matchmaker Two Hybrid
System 2, selon les instructions du manuel accompagnant le Matchmaker Two Hybrid
System 2 (Catalogue N° K1604-1 , Clontech).
Les acides nucléiques codant pour des protéines interagissant avec les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention, peuvent être criblés et/ou sélectionnés en utilisant un système de simple hybride tel que celui décrit dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech
(Catalog N° K1603-).
Sous un autre aspect, l'invention comprend l'utilisation d'acide nucléique ou de polypeptide selon l'invention, d'un vecteur selon l'invention, d'une cellule selon l'invention, ou d'un mammifère selon l'invention, pour l'étude de l'expression ou de l'activité du gène SPG4.
D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples et les figures dont les légendes sont représentées ci-après.
LEGENDES DES FIGURES
FIGURES 1A, 1B et 1C : Carte physique de l'intervalle SPG4 et organisation génomique de SPG4.
FIGURE 1A : La région candidate de 1,5 Mb est délimitée par les marqueurs génétiques D2S352 et D2S2347 indiqués en caractères gras. La position des marqueurs polymorphes et autres STSs est indiquée en caractères standards alors que la position des ESTs est indiquée en italique. Les clones de BAC constituant la carte de préséquençage sont représentés par des rectangles dont le nom figure au- dessus et la taille précise du clone au-dessous si celle-ci a pu être déterminée. Le nom des BACs A, B, C, ... est suivi d'une parenthèse contenant le nom du clone précédé d'un « b » si le clone est issu de la banque de BACs CITB_978_SKB ou d'un « B » si celui-ci provient de la banque RPCI-11. FIGURE 1B : Représentation schématique du gène SPG4 qui chevauche les
BACs D (b336P14) et G (B563N4). Les exons sont figurés comme des rectangles noirs avec leur nom au-dessus.
FIGURE 1C : Les cinq mutations identifiées dans sept familles de PSF-AD liées au locus SPG4 sont positionnées dans les exons 7, 11, 13 et dans le site accepteur d'épissage de l'intron 15.
FIGURE 2 : Séquence nucléique et protéique de l'ADNc SPG4 et de la spastin.
Les 17 barres verticales avec un nombre situé au-dessous représentent les jonctions entre les différents exons. Le codon ATG initiateur est localisé en position nt 126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des mutations identifiées à ce jour, dont la perte de l'exon 16, sont indiquées en italique (nt 1210, nt 1468, nt 1520, nt 1620 et pour la perte de l'exon 16 : nt 1813-1853). Le site de polyadénylation est en italique et souligné. Le signal de localisation nucléaire (NLS) putatif, RGKKK, ainsi que les trois domaines conservés prédits par l'analyse dans la base de données ProDom sont respectivement localisés aux positions aa7-11 (NLS), aa342-409 (domaine 92), aa411-509 (domaine 179) et aa512-599 (domaine 6226). Les quatre motifs prédits par la comparaison de séquence dans la base de données Prosite sont : deux motifs «leucine zippers» aux positions aa50-78 et aa508-529, le site de fixation de l'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine de dimérisation « helix-loop-helix » aux positions aa478-486. Les motifs A et B de Walker, «GPPGNGKT» et «IIFIDE», ainsi que le consensus minimal des AAA sont soulignés.
FIGURES 3A et 3B : Caractérisation d'une mutation d'un site d'épissage chez les individus atteints de trois familles de PSF-AD liée au locus SPG4.
FIGURE 3A : Amplification par PCR du fragment IV de l'ADNc SPG4 à partir d'ADNc de lymphoblastes : puits M, marqueur de taille VII (Boehringer) ; puits 1 , membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ; puits 3, membre non atteint de la famille 5330 ; puits 4, patient de la famille 5330 ; puits 5, patient de la famille 5226 ; puits 6, témoin négatif (ADN génomique humain).
FIGURE 3B : Graphe de séquence de la mutation du site accepteur d'épissage de l'intron 15. Séquence génomique de l'individu contrôle en haut et d'un patient de la famille 2992 en bas. L'astérisque à la position nt 1813-4 indique un polymorphisme A->C qui touche un nucleotide non conservé du site accepteur d'épissage de l'intron 15 chez le patient. FIGURES 4A et 4B : Les homologies de la spastin.
Les résidus identiques sont respectivement surlignés en grisé.
FIGURE 4A : Alignement multiple créé par CLUSTAL W de huit protéines issues de divers organismes et présentant une forte homologie de séquence avec les spastin humaine et murine (SEQ ID No. 73). FIGURE 4B : Alignement par CLUSTAL W des métalloprotéases de levure
AFG3, RCA1 et YME1, et des paraplegin et spastin humaines.
FIGURE 5 : Alignement par BLASTN des séquences nucléiques de l'ADNc SPG4 et de son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadénylation de l'ADNc murin est souligné et en italique. Le codon STOP est localisé en position nt 1515-1517 dans l'ADNc murin et en position nt 1974-1976 dans l'ADNc humain.
FIGURES 6A, 6B et 6C : Analyse par PCR de l'expression de SPG4 et de son orthologue murin Spg4.
FIGURE 6A : Collection d'ADNc provenant de multiples tissus de souris.
Puits M, marqueur de taille V (Boehringer) ; puits 1, cœur ; puits 2, cerveau ; puits 3, rate ; puits 4, poumon ; puits 5, foie ; puits 6, muscle squelettique ; puits 7, rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7 ; puits 10, embryon de 11 jours
E11 ; puits 11 , embryon de 15 jours E15 ; puits 12, embryon de 17 jours E17 ; puits 13, témoin négatif (ADN génomique de souris).
FIGURE 6B : Collection d'ADNc provenant de multiples tissus humains. Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, cœur ; puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancréas ; puits 7, placenta ; puits 8, muscle squelettique ; puits 9, témoin négatif (ADN génomique humain) ; puits 10, témoin négatif (pas d'ADN).
FIGURE 6C : Collection d'ADNc provenant de multiples tissus de fœtus humain.
Puits M, marqueur de taille VII (Boehringer) ; puits 1 , cerveau ; puits 2, cœur ; puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique ; puits 7, rate ; puits 8, thymus ; puits 9, témoin négatif (ADN génomique humain) ; puits 10, témoin négatif (pas d'ADN). EXEMPLES
Exemple 1 : Matériels et méthodes
1) Sous-clonage et séquençage de la région candidate
Douze BACs provenant de deux banques génomiques humaines, CITB_978_SKB (commercialisées par Research Genetics) et RPCI-11 (Osoegawa et al., 1998), et recouvrant l'intervalle SPG4 ont été sélectionnés pour être séquences (Hazan et al., Genomics, 60 (3), 309-19, 1999). 40 μg de l'ADN de chaque BAC a été digéré partiellement par l'enzyme de restriction CviJI (CHIMERx) et séparé par électrophorèse sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les tailles varient autour de 3, 5 et 10 kb ont été éluées avec la β-agarase (Biolabs) et liguées à un vecteur plasmide pBAM3 préalablement digéré par Smal et déphosphorylé dans un rapport de IXinsert pour 5Xvecteur. Des bactéries E. coli DH10B électrocompétentes (GIBCO-BRL) ont été transformées par électroporation avec les différentes ligations. Environ 1000 à 1500 sous-clones par BAC (8 à 10 génomes équivalents) composés de 20 % de clones avec inserts à 10 kb, 40 % de clones avec inserts à 5 kb et 40 % de clones avec inserts à 3 kb ont été isolés. Les extrémités des inserts de ces clones ont été séquencées sur un séquenceur automatique LICOR 4200. Pour chaque BAC, les séquences furent assemblées en un squelette constitué de plusieurs contigs à l'aide des logiciels Phred et Phrap. Les trous entre chaque contig furent séquences avec des dideoxynucleotides marqués sur un séquenceur ABI 377 (PE-Applied Biosystems). Les exons contenus dans ces contigs de séquence ont été prédits par les programmes informatiques GRAIL II, GENSCAN, FGENEH et Génie. Les séquences furent également comparées dans les bases de données nucléiques et proteiques de l'EMBL et de GenBank avec les programmes BLASTN et BLASTX. La détermination des séquences promotrices fut réalisée par les programmes informatiques TSSG et TSSW. Les résultats de toutes ces analyses de séquences furent visualisés par le programme d'annotation de séquence Genotator.
2) Clonage de l'ADNc
L'ADNc du gène SPG4 a été isolé par des expériences de RACE-PCR en 5' et 3' sur des ARN polyA+ de cerveau fœtal, cerveau adulte et foie adulte à l'aide du kit d'amplification d'ADNc Marathon (Clontech), selon les instructions du fournisseur. Une première PCR, suivie d'une PCR interne furent effectuées avec différents couples d'amorces dont les séquences sont indiquées sur le tableau 1 ci-après : Tableau 1 Amorces utilisées pour les RACE-PCR et les amplifications d'ADNc
Amorce Séquence (5'-3') Position en 5' couple/ PCR Taille du produit
SPA_5RACE5 CGGAGCTCCTCTTGGCTGCCATG (SEQ ID No.4) nt 405
SPA_5RACE6 AGAAGCGCTGGCAGAGCCACACGAAG (SEQ ID No.5) nt 372
SPA_5RACE7 AAGGCGACCAAACGCAGCAGCGCGAAG (SEQ ID No.6) nt 331
SPA_3RACE1 AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550
SPA_3RACE2 TGGTTATGGCCAAGGACCGCTTACAAC (SEQ ID No.8) nt 689
SPA_3RACE3 CAAACGGACGTCTATAATGACAGTAC (SEQ ID No.9) nt 747
SPA_3RACE4 TTAGGAATGTGGACAGCAACCTTGC (SEQ ID No.10) nt 1075
SPA_3RACE5 CTTCTCTGAGGCCTGAGTTGTTCAC (SEQ ID No.11) nt 1207
SPA_3RACE6 TGCTAGAATGACTGATGGATACTCAGG (SEQ ID No.12) nt 1736
SPA_3RACE7 AGATGCAGCACTGGGTCCTATCCG (SEQ ID No.13) nt 1787
SPA_3RACE8 ATGAACGTCATCGGCTACAGAAACAG (SEQ ID No.14) nt 2037
SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No.15) nt 45 b+m 655 pb SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) nt 700 SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No.17) nt 106 c+n 543 pb SPA_Dn CTAGCTCTTTCACACTGTTC (SEQ ID No.18) nt 649 SPA_Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) nt 487 d+n 746 pb SPA_Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) nt 1233 SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No.21) nt 532 SPA_An TGCCAAGTCTTGACCAGC (SEQ ID No.22) nt 1175 SPA_Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) nt 1036 a+m 763 pb SPA_Bm CAGTGCTGCATCTTTTGCC (SEQ ID No.24) nt 1799 SPA_Bb TAGGAATGTGGACAGCAACC (SEQ ID No.25) nt 1076 SPA_Bn AAAGCTGTTAGGTCACTTCC (SEQ ID No.26) nt 1780 . SPA_Ca TGGAGATGACAGAGTACTTG (SEQ ID No.27) nt 1550 a+m 766 pb SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) nt 2316 SPA_Cb ATGAGGCTGTTCTCAGGCG (SEQ ID No.29) nt 1603 Les produits de RACE-PCR ont été clones avec le kit TA-cloning (Invitrogen) et les clones correspondants ont été séquences sur un ABI 377 (PE-Applied Biosystems).
La séquence du transcrit SPG4 a été vérifiée par le séquençage de produits de PCR amplifiés à partir d'une population d'ADNc provenant des lymphoblastes de 6 individus sains.
3) Détection des mutations
Les ARNs totaux ont été extraits de lignées de lymphoblastes d'un individu atteint par famille étudiée et de 6 individus témoins à l'aide du kit RNA PLUSR (bioprobe System). La synthèse de l'ADNc a été réalisée sur 500 ng à 1 μg d'ARN avec 100 pmoles d'amorces hexameres aléatoires (Pharmacia) et 200 unités de reverse transcriptase Superscript II (Gibco BRL) dans des conditions standards. Quatre amplifications par PCR, générant des fragments chevauchants qui recouvrent la totalité de la phase ouverte de lecture de SPG4, ont été réalisées sur les ADNc des patients et contrôles. Le fragment I fut amplifié avec les amorces SPA_Db/SPA_Dm, puis en PCR interne avec les amorces SPA_Dc/SPA_Dn. Les fragments II, III, et IV ont été respectivement amplifiés avec les amorces SPA_Ad/SPA_Am, SPA_Ba/SPA_Bm et SPA_Ca/SPA_Cm (cf. les séquences de ces amorces sur le tableau 1). Chaque amplification a été effectuée dans un volume total de 50 μl contenant 4 μl d'ADNc (~1/7 ème de la prép.), 20 pmoles de chaque amorce, 200 μM de dNTPs, 50 mM de KCI, 10 mM de Tris pH9, 1 ,5 mM MgCI2, 0,1 % de triton X-100, 0,01 % de gélatine et 2,5 unités de Taq polymérase (Cetus-PE). Les réactions de PCR ont été réalisées selon le procédé du « hot start » : la Taq polymérase est ajoutée à 92°C après une première étape de dénaturation de 5 min à 94°C. Les échantillons sont par la suite soumis à 35 cycles de dénaturation (94°C pendant 40 sec), d'hybridation (55°C pendant 50 sec, à l'exception du fragment I : 58°C pendant 50 sec) et d'élongation (72°C pendant 1 min), suivis d'une dernière étape d'élongation (5 min à 72°C). Les produits de PCR sont séquences sur un séquenceur automatique ABI 377 (PE-Applied Biosystems) avec les amorces SPA_Dc/SPA_Dn, SPA_Ac/SPA_An, SPA_Bb/SPA_Bn et SPA_Cb/SPA_Cm pour les fragments I, II, III et IV respectivement. Les mutations furent également recherchées ou confirmées par séquençage des 17 exons prédits du gène SPG4 chez les patients et contrôles. Chaque exon fut amplifié avec le couple correspondant d'amorces « a+m » (cf. tableau 2 ci-après), à l'exception de l'exon 1 (gSPAex1c/gSPAex1m), et des exons 10, 11 et 12 qui furent co- amplifiés avec les couples d'amorces gSPAex10a/gSPAex12m et gSPAex11a/gSPAex12m. Tableau 2 Amorces de PCR pour l'amplification et le séquençage des exons
Exon Taille du produit Programme de PCR Amorce Séquence (5'-3') (SEQ id Nos. ; 30 à 71)
1 1048 pb 0 gSPAexIc GTGAGCCGAACTGCACATTG gSPAexl m CAAAGTCGACAGCTACAGTGC gSPAexId GGAACTGTAGTTGAGTGGGA gSPAexIn AGATGAGGCTCCGACCTAC
2 624 pb 3 gSPAex2a AATGCCACACTTGTAATCTC gSPAex2m TGTGAATATATCATAATTTGGG gSPAex2b TACAGCAGTTCTCATGATG
3 812 pb 1 gSPAex3a GACCAAATTGGTGCATGCATG gSPAex3m ACA I I I CCAATACATCCCAC
4 379 pb 3 gSPAex4a ATTTGTCATTTCACATGCAC gSPAex4m TTAGAATGACTATACCTGAC gSPAex4n TCAGGTTAAGTAAGACTC
5 830 pb 4 gSPAexδa TTCCTATCTACCTAGTGAC gSPAexδm TTTTATAGCAAGTTGCCCTG gSPAexδb CCTATGAAGATCCTGGTAC
484 pb 3 gSPAexβa TGTCATGATTCTAACAAGGG gSPAexβm TCTA I I I CACTCCTGACATG
420 pb 2 gSPAex7a GTCATAGGGCTTAGGCTTC gSPAex7m ATCATACTACCCACTTTTCC
647 pb 3 gSPAexδa TGTTTGGGAAGATGCTACTG gSPAexδm CTACTGAAGATAACGTACATG
1268 pb 1 gSPAexθa CATTGATTGCCATGTATTGG gSPAexθm AGAAGGCCAGAAATACTCAG gSPAexθb GTACTTAAATCGGTAAATATGG
10l 1061 pb 4 gSPAexIOa CTCAAGTCTTAGGAATGCAG
11 | gSPAexIOb GCACTTAACCAGGCTGTATG
12j 551 pb 3 gSPAex11a CTCAGATGACTCACATAGC gSPAex12m CTTTACTAGACTAATTCTCCTG 1361 pb 4 gSPAex13a CAGATTCAAGAAGACAGATC gSPAex13m GCAATAATTCACCACACTTG gSPAex13n GGTAGTTCTTGTTTCTGCTC
985 pb 4 gSPAex14a CAAGTGTGGTGAATTATTGC gSPAex14m GAGCTGAAAAGTATTCAGC gSPAex14n TGCAAAGGACATAGCCAGTG
1076 pb 1 gSPAex15a AGCCTCTGGAGATAGTATGC gSPAex15m CTAGAACAGGGGTCACAGTC gSPAex15n TTGGACTTCTTAAACTTC
1404 pb 4 gSPAex16a GCAGTATGCAAGAAATTGAAC gSPAex16m GGCCTGTAATTTTCTTCTG gSPAex16b GTACTGAATAGATACATGTAG
445 pb 3 gSPAex17a GTGTAGCAGATCAACATAG gSPAex17m CATCTTCAAGTTTGGTGCAC
Hormis l'exon 1 , amplifié à l'aide du kit Advantage GC genomic PCR kit (Clontech) selon les instructions du fournisseur, quatre programmes de PCR légèrement différents (1, 2, 3 et 4) furent utilisés pour amplifier les exons de SPG4 (voir tableau 2). Les amplifications furent toutes effectuées dans un volume de 50 μl contenant 100 ng d'ADN génomique, 50 pmoles de chaque amorce, 250 μM de dNTPs, 1X de tampon Takara et 1 unité de Taq polymérase Takara La Taq (Shuzo Co.). Les réactions de PCR ont été réalisées selon le procédé du « hot start » : la Taq polymérase est ajoutée à 94°C après une première étape de dénaturation de 5 min à 96°C. Les échantillons sont par la suite soumis à 30 cycles de dénaturation (94°C pendant 40 sec), d'hybridation (prog. 1 : 60°C pendant 50 sec ; prog. 2, 58°C pendant 50 sec, prog. 3 et 4 : 55°C pendant 50 sec) et d'élongation (prog. 1 et 4 : 72°C pendant 1 min, prog. 2 et 3 : 72°C pendant 40 sec), suivis d'une dernière étape d'élongation (10 min à 72°C). Le séquençage de ces produits de PCR a été réalisé sur un séquenceur ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les amorces internes notées « b » et « n » (voir tableau 2). 4) Caractérisation de SPG4
Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux correspondent à l'orthologue murin de SPG4, ont été isolés par le consortium IMAGE et séquences au laboratoire sur un séquenceur ABI 377 (PE-Applied Biosystems). Afin d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les collections d'ADNc de différents tissus humains fœtaux et adultes, ainsi que de tissus de souris (panels MTC, Clontech) ont été testées par PCR selon le protocole du fournisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le couple SPA_Ca /spam (spam : 5'-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de souris. Les conditions de PCR sont celles utilisées pour l'amplification de SPG4 à partir d'ADNc de lignées de lymphoblastes (cf. § Détection des mutations), excepté que les échantillons ont été soumis à 32 cycles pour les ADNc issus de tissus adultes humains et de tissus murins, et à 28 cycles pour les ADNc issus de tissus fœtaux. Les produits d'amplification ont migré par électrophorèse sur des gels d'agarose 2 %.
5) Analyse histologique d'une biopsie musculaire d'un patient
Les analyses histologiques et histo-enzymatiques ont été réalisées à partir d'une biopsie musculaire d'un patient issu d'une famille liée au locus SPG4 selon les techniques standards décrites dans Casari et al., 1998.
6) Numéros d'accession dans les bases de données publiques
L'ADNc SPG4 (ou SPAST) et la séquence protéique déduite, GenBank/EMBL AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gène SPG4 (ou SPAST), GenBank EMBL AJ246003.
Exemple 2 : Analyse de la séguence de l'intervalle SPG4
L'analyse des événements de recombinaison a permis de réduire la région candidate SPG4 à un intervalle génétique de 0 cM entre les marqueurs D2S352 et D2S2347 (19, 20). Une carte de préséquençage de l'intervalle SPG4 composée de 37 BACs a été construite (Hazan et al., sous presse dans Genomics) ; la région candidate couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, s'étendant sur l'intervalle SPG4 à l'exception d'un unique trou de 4 kb entre les clones A et E, ont été sélectionnés pour être séquences (Fig. 1A). Sept de ces BACs (A, B, C, D, E, F et G), couvrant approximativement 70 % de la région d'intérêt, ont déjà été séquences. Les séquences de ces 7 BACs ont été comparées à celles des bases de données nucléiques et proteiques, et analysées avec quatre programmes de prédiction d'exons. Ces analyses de séquences préliminaires ont permis de mettre en évidence 14 unités de transcription potentielles, dont trois correspondant aux gènes codant pour la xanthine deshydrogénase, la stéroïde 5α-réductase 2 et une protéine liant le TGFβ. Sur les 14 gènes détectés par l'analyse de séquence, 9 avaient été préalablement identifiés dans les bases de données d'EST (pour « Expressed Séquence Tag ») et localisés au sein de l'intervalle SPG4 (Hazan et al., sous presse dans Genomics) ; les 5 gènes restants n'ont pu être identifiés qu'en séquençant la région candidate. L'un de ces 5 nouveaux gènes présentait une homologie en 3' de sa région codante avec les gènes codant pour la famille proteique des AAA (Confalonieri et al., 1995). Des analyses de séquence plus approfondies ont montré que ce gène, nommé SPG4 (ou SPAST), était composé de 17 exons et s'étendait sur une région d'environ 90 kb, couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1 B). Les trois premiers exons prédits de ce gène furent identifiés dans le BAC D par deux des quatre programmes de prédiction d'exons utilisés, GRAIL II et GENSCAN ; ils présentent une forte homologie avec un EST de blastocyste de souris, AA560327. Les 14 derniers exons se trouvent dans le BAC G. La séquence proteique déduite des exons 7 à 17 est significativement homologue à une sous-classe de la famille des AAA, comportant les protéines de levure Yta6p (Schnall et al., 1994), TBP6 (Schnall et al, 1994) et End 13, ainsi que la protéine de souris SKD1 (Perier et al., 1994).
Sur les quatre programmes de prédiction d'exons, FGENEH semble le plus fiable et le plus puissant, permettant la détection de la plupart des gènes de cette région chromosomique en 2p21-p22. Cette constatation s'applique également au gène SPG4 pour lequel 15 exons ont pu être mis en évidence par ce programme quand seuls 4, 9 ou 11 exons ont pu respectivement être localisés par les programmes Génie, GRAIL II et GENSCAN. L'organisation génomique de ce gène (Fig. 1 B) a pu être confirmée par la suite grâce à la détermination de la séquence de l'ADNc SPG4. Les jonctions introns/exons sont représentées sur le tableau 3 ci-après : la taille des exons varie de 41 pb (exon 16) à 1,410 kb (exon 17), celle des introns variant de 140 pb (intron 11) à 23,247 kb (intron 1).
Tableau 3 Organisation intron/exon du gène SPG4
Exon/ Taille de l'exon Position Site accepteur d'épissage Site donneur d'épissage Taille de l'intron intron (pb) sur l'ADNc (SEQ ID No. 74 à 89) (SEQ ID Nos. 90 à 105) (Pb)
1 540 1 TGAGAAAG/gtaactagggggctgg 23247
2 87 541 attttttattttaaag/CAGGACAG AGGACAAG/gtaagattgtatttgt 1943
3 84 628 aatttttttctttcag/GTGAACAG ACTTCTAG/gtatcaattaatgtat 9190
4 96 712 cttctctgttgcatag/AGAAGATG CCAGTCAG/gtgggtttaggttaac 15745
5 188 808 actttttccttgtcag/AAAGTGGA CTCATAAG/gtattctgggacagta 876
6 134 996 ttttgtatcctttaag/GGTACTCC GTGGACAA/gtaagttttgccatct 283
7 94 1130 aggtcttgtttcttag/TGGAACAG GGCCTGAG/gtaagaactttatatt 10735
8 75 1224 agtatatattttttag/TTGTTCAC CAATGCTG/gtaagggttctcttca 1385
9 72 1299 cttgtgatttttaaag/GCTAAAGC CAAAATAC/gtgagtgctctgtttc 8083
10 76 1371 taatgctttgttttag/GTGGGAGA TTTTATAG/gtaagaacatattttc 238
11 92 1447 cttgtatttcctctag/ATGAAGTT TTGATGGT/gtaagtgttgattatg 140
12 80 1539 gattttttgcttgtag/GTACAGTC GTTCTCAG/gtagggagatttatat 4715
13 43 1619 ggatttttttttttag/GCGTTTCA ATGAGGAG/gtatgtatctgtgttt 1389
14 80 1662 ttttaatatttttcag/ACAAGACT CTTGCTAG/gtgagtaatttggatt 1521
15 71 1742 tccttcccttcctcag/AATGACTG TATCCGAG/gtaggtatacaagagc 2210
16 41 1813 cttttatgttttacag/AACTAAAA CCAGTGAG/gtatagtattttacaa 7115
17 1410 1854 ctttttaaaaatctag/ATGAGAAA
Les séquences des exons et des introns sont respectivement indiquées en majuscules et minuscules.
Exemple 3 : Identification de l'ADNc SPG4
Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent réalisées sur des collections d'ADNc de cerveau et de foie adultes et de cerveau fœtal, afin de caractériser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donné des produits d'amplification se terminant à la position nt 263 de l'ADNc SPG4 (Fig. 2), ce qui était probablement dû au contenu riche en GC de la région 5' du transcrit (90 % de GC dans les 60 pb précédant la position nt263). Quatre produits de PCR chevauchants, recouvrant la totalité de la région codante, ont été amplifiés à partir des ADNc issus des lymphoblastes de six individus contrôles et séquences intégralement dans le but de vérifier la séquence du transcrit SPG4. L'alignement des séquences de tous les produits de PCR et RACE-PCR a permis de reconstituer une séquence de 3263 pb comprenant une phase ouverte de lecture de 1848 pb précédée par une région 5' non traduite (5' UTR pour « 5' UnTranslated Région ») de 125 pb et suivie par une région 3' UTR de 1290 pb incluant un site de polyadénylation entre les positions nt 3227-3232, ~ 35 pb en amont de la queue polyA (Fig. 2). La comparaison de la séquence de l'ADNc SPG4 avec les banques de données d'ESTs a permis de détecter une homologie significative avec 6 ESTs humains dont l'EST N47973 qui contient une région 3' non codante plus étendue (+ 180 pb) comprenant un deuxième site de polyadénylation. Le site d'initiation de la traduction a été identifié par la présence d'une séquence consensus de Kosak (CTGTGAatgA) définie comme un «contexte adéquat» à l'initiation de la traduction attendu qu'une purine est localisée 3 nt en amont de l'ATG initiateur, lui-même précédé d'un codon STOP. La séquence de l'ADNc de 3263 pb est identique à la séquence transcrite déduite des 17 exons du gène SPG4. L'analyse de la séquence de la région 5' à l'aide des programmes informatiques TSSG et TSSW suggère la présence d'une séquence promotrice de type TATA box située 43 pb en amont de la position nt 1 de l'exon 1. Exemple 4 : Mutations dans le gène SPG4
Des mutations hétérozygotes ont été recherchées dans l'ADNc SPG4 provenant de lymphoblastes de 14 patients issus de familles liées au locus SPG4 (1 individu atteint par famille). Quatre fragments de PCR chevauchants I, II, III et IV recouvrant la phase ouverte de lecture de l'ADNc SPG4 ont été amplifiés et séquences chez les 14 patients ainsi que chez 6 individus sains contrôles. L'électrophorèse sur gel agarose du fragment de PCR IV a montré trois bandes d'intensité égale chez 3 patients des familles 2992, 5226 et 5330 provenant de la même région de Suisse, ce qui suggérait une microdélétion ou une mutation d'un site d'épissage ; les deux bandes supplémentaires n'étaient pas présentes chez 2 individus sains issus des familles 2992 et 5330 (Fig. 3A). La séquence génomique de l'exon 16 a révélé une mutation hétérozygote A->G du site accepteur d'épissage (AG) de l'intron 15 chez les individus atteints de ces trois familles (Fig. 3B) ; cette mutation engendre la perte de l'exon 16 suivie d'un décalage de la phase de lecture dans le transcrit anormal. Aucun des membres sains incluant maris et épouses ne porte cette mutation du site d'épissage. L'identification de la même mutation chez tous les membres atteints de ces trois familles suisses démontre l'existence d'un ancêtre commun, ce qui avait été préalablement suggéré par l'étude des haplotypes.
Trois mutations ponctuelles 1210C->G, 1468G->A et 1620C->T qui introduisent des substitutions d'un acide aminé dans la séquence proteique (S362C, C448Y et R499C) ont été respectivement mises en évidence par le séquençage des fragments de PCR III et IV chez les individus atteints des familles 624, 4014 et 618. Ces trois substitutions impliquent toutes un résidu cystéine, induisant la perte ou l'insertion d'une cystéine dans la séquence proteique. Une délétion de 1 pb, 1520delT, qui crée l'apparition d'un codon STOP induisant une protéine tronquée composée de 465 acides aminés (aa) a été détectée chez les individus atteints de la famille A. Aucune des cinq mutations résumées dans le tableau 4 ci-après n'a été trouvée chez les individus contrôles testés, qu'ils appartiennent à la fratrie saine ou aux conjoints des sept familles analysées ici. Ces cinq mutations affectent de façon importante la séquence proteique dans un domaine très conservé, ou cassette AAA (Beyer, 1997), qui est composé de plusieurs motifs proteiques supposés être responsables de l'activité ATPase chez tous les membres de la famille des AAA.
Tableau 4 Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation Changement d'acide aminé Conséquence
624 exon 7 1 210 C t→ G S362C faux sens
4 014 exon 11 1 468 G ι→ A C448Y faux sens
A exon 11 1 520 deIT 466STOPcodon non sens
618 exon 13 R499C faux sens 1 620 C i→ T
2 992 intron 15 Δ aa564 1→ aa576 (PTC+7 aa) perte de l'exon 16 + décalage 1 813-2a ι-> g
5226 intron 15 Δ aa564 1→ aa576 (PTC+7 aa) perte de l'exon 16 + décalage 1 813-2a ι→ g
5330 intron 15 perte de l'exon 16 + décalage
Δ aa564 1→ aa576 (PTC+7 aa) 1 813-2a ι→ g
a Les positions en nt font référence à la séquence de l'ADNc SPG4. b Les positions en aa font référence à la séquence de la spastin.
Les bases des exons sont indiquées en majuscules, celles des introns en minuscules.
PTC+7 aa = "prématuré termination codon" à 7 aa en aval de l'exon 16.
En addition à ces cinq mutations décrites précédemment, des recherches de mutations hétérozygotes réalisées sur des patients atteints de PSF-AD issus de 36 autres familles ont permis de mettre en évidence 34 autres mutations altérant ou susceptibles d'altérer le produit d'expression du gène SPG4.
Les caractéristiques de ces 34 autres mutations sont résumées dans le tableau 5 ci-après dans lequel ont été également insérées les cinq premières mutations précédemment citées.
Tableau 5 Mutations dans SPG4 chez les patients atteints de PSF-AD
Figure imgf000038_0001
a Les positions en nt font référence à la séquence de l'ADNc SPG4. b Les positions en aa font référence à la séquence de la spastin. Les bases des exons sont indiquées en majuscules, celles des introns en minuscules. PTC+n aa - "prématuré termination codon" à n acide aminé en aval de la mutation. Exemple 5 : Analyse de la séguence protéigue de la spastin
La phase ouverte de lecture de SPG4 code pour une protéine de 616 aa que nous avons nommée spastin et dont le poids moléculaire est d'environ 67,2 kDaltons (kD). La comparaison de cette séquence en acides aminés dans les bases de données proteiques à l'aide des programmes BLAST a permis de mettre en évidence une zone de forte homologie avec plusieurs membres de la famille des AAA à l'extrémité C-terminale de la spastin. Les motifs « types » de la famille des AAA, englobés dans la cassette AAA, sont localisés entre les positions aa342 et aa599 (voir Fig. 2) d'après les comparaisons de séquence dans les bases de données de domaines proteiques ProDom et Prosite. Les trois domaines types conservés, dont les motifs A et B de Walker ainsi que le motif consensus minimal des protéines AAA sont respectivement situés au sein de la cassette AAA aux positions aa382-389, aa437-442 et aa480-498 (Fig. 2). Le motif A de Walker, « GPPGNGKT » appelé également p-loop (ou boucle-p) qui correspond au domaine de fixation de l'ATP et le motif B « IIFIDE » sont très conservés entre tous les membres de la famille des AAA incluant la spastin.
La comparaison des cassettes AAA présentes dans 150 protéines de cette famille d'ATPase issues d'organismes très éloignés dans l'évolution a permis de classifier cet ensemble de protéines en plusieurs sous-groupes, en fonction du nombre de cassettes AAA identifiés (1 ou 2) et des homologies de séquence entre ces différentes cassettes (Beyer, 1997). Parmi toutes les protéines de la famille des AAA, la spastin présente une plus forte homologie avec une sous-classe particulière des AAA, et plus spécifiquement avec les protéines suivantes dont la plupart ont été identifiées grâce au séquençage complet du génome de l'organisme considéré : deux protéines de Caenorhabditis elegans 016299 et Q18128, deux sous-unités du protéasome 26S de Saccharomyces cerevisiae Yta6p (Q02845) et TBP6 (P40328) (Schnall et al., 1994), une sous-unité du protéasome de Schizosaccharomyces pombe (O43078), les protéines SAP1 (P39955) et END13 (P52917) de S. cerevisiae et la protéine murine SKD1 (P46467) (Perier et al., 1994). L'alignement multiple de ces 8 protéines avec la spastin est représenté sur la Fig. 4A. Sur les 257 acides aminés englobant la cassette AAA (positions aa342-599), la spastin présente une identité de séquence de 52 %, 51 % et 50 % avec la protéine de levure Yta6p (Q02845), la protéine de nématode 016299 et la protéine de levure TBP6 (P40328) respectivement. Des résultats similaires ont été obtenus par l'analyse de la séquence proteique de la spastin dans la base de données ProDom qui a montré l'existence de trois domaines d'homologie (nommés 92, 179 et 6226 et correspondant aux positions aa342- 409, aa411-509 et aa512-599) trouvés dans les sous-unités putatives du protéasome 26S de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus souvent des motifs de type leucine-zipper dont deux ont pu être détectés dans la séquence proteique de la spastin aux positions aa50-78 et aa508-529 par l'analyse de la séquence dans la base de données Prosite (voir Fig. 2). Cette analyse a également pu prédire la présence d'un motif de dimérisation de type hélice-boucle-hélice (« helix-loop-helix ») situé entre les positions aa478 et aa486.
La comparaison de la séquence proteique de la spastin avec celles des métalloprotéases mitochondriales comme les protéines de levure AFG3, RCA1 et YME1, ainsi que la paraplegin qui est impliquée dans une forme rare de PSF-AR montre que l'homologie entre ces cinq membres de la famille des AAA est limitée à la région de 257aa englobant la cassette AAA (Fig. 4B). Dans cette région, l'identité de séquence entre la spastin et la paraplegin n'est que de 29 % alors que la paraplegin et la protéine de levure AFG3 sont identiques à 57 % sur cette même portion de la séquence proteique. Cette comparaison de séquence suggère que la spastin n'appartient pas au même sous- groupe des AAA que la paraplegin et autres métalloprotéases mitochondriales. De plus, l'analyse informatique de la séquence de la spastin avec le programme PSORT II qui permet de prédire la localisation sub-cellulaire des protéines semble indiquer que le spastin est une protéine nucléaire. Un éventuel signal de localisation nucléaire (NLS pour « Nuclear Localization Signal »), RGKKK, a été mis en évidence entre les positions aa7 et aa11 alors qu'aucun peptide signal caractéristique d'un import dans la mitochondrie n'a pu être décelé, contrairement à ce qui avait été observé pour la paraplegin. Exemple 6 : Profils d'expression de SPG4 et de son orthologue murin Spg4
La comparaison de la séquence nucléique de SPG4 dans les banques de données d'EST a permis de détecter plusieurs ESTs humains, murins et de rat présentant une forte homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de souris correspondant à deux des ESTs murins, AA560327 et AA107866, ont été obtenus du consortium IMAGE et séquences intégralement. L'assemblage des séquences de ces clones d'ADNc a permis de reconstituer une séquence consensus de 1689 pb incluant une phase ouverte de lecture incomplète de 1514 pb. La comparaison entre l'ADNc SPG4 humain et cet ADNc de souris a montré qu'il manque au transcrit murin environ 460 pb à l'extrémité 5' dont le codon d'initiation de la traduction. La phase de lecture ouverte de souris est suivie d'une région 3' non codante (3' UTR) de 175 pb contenant un site de polyadénylation situé à ~20 pb en amont de la queue polyA (Fig. 5). La séquence nucléique de SPG4 et la séquence proteique de la spastin humaine présentent respectivement une identité de 89 % (entre les positions nt 460 et nt 1982) et de 96 % (entre les positions aa113 et aa616) avec les séquences de l'ADNc et de la protéine déduite de la souris. Ce degré important d'homologie permet d'affirmer que ce transcrit de souris correspond à l'orthologue murin de SPG4, qui a été donc baptisé Spg4.
L'hybridation de northern blots comprenant les ARNm de divers tissus humains et murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donné de résultats probants excepté une très faible bande correspondant à un transcrit de 2,5 kb dans le testicule de souris après 10 jours d'exposition. En raison du faible niveau d'expression de ce gène, les profils d'expression de SPG4 et Spg4 ont été déterminés par des expériences de PCR sur des collections d'ADNc normalisées provenant de divers tissus adultes et fœtaux (voir Fig. 6A à 6C). Le gène murin Spg4 est exprimé de façon ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de l'embryon de souris (Fig. 6A). Une plus forte expression de Spg4 a été détectée dans le foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de l'embryon. L'expression précoce de Spg4 au cours du développement embryonnaire a été confirmée par la présence d'ESTs provenant de banques d'ADNc de blastocyste, d'embryon E8 et de carcinome embryonnaire dans les banques de données publiques d'ESTs. Le gène humain SPG4 est lui aussi exprimé de façon ubiquitaire dans les tissus adultes (Fig. 6B) et fœtaux (Fig. 6C), avec une expression peut-être plus marquée dans le cerveau fœtal. Exemple 7 : Pas de défaut de la phosphorylation oxydative dans la PSF-AD liée au locus SPG4
Afin de déterminer si des mutations de la spastin induisaient un défaut de la phosphorylation oxydative (OXPHOS) dans la mitochondrie, à l'image de ce qui avait été observé pour la paraplegin, une biopsie musculaire a été réalisée sur un patient d'une des familles de PSF-AD liée au locus SPG4. Les analyses morphologiques et histo- enzymatiques de cette biopsie de muscle n'ont pas révélé de fibre musculaire de type RRF (pour « ragged red fibers »), caractéristique des défauts OXPHOS dans la mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales ainsi que la prédiction d'une localisation nucléaire de la spastin semblent indiquer que la PSF-AD liée au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par opposition à la PSF-AR liée au locus SPG7.
Par une approche de clonage positionnel basée sur le séquençage d'une région de 1 ,5 Mb, nous avons identifié le gène SPG4 (ou SPAST) responsable de la forme la plus fréquente de PSF-AD, préalablement localisé sur les bandes chromosomiques 2p21- p22. Trente-neuf mutations altérant ou susceptibles d'altérer le produit du gène, nommé spastin, ont pu être détectées chez les individus atteints de quarante-et-une familles de PSF-AD présentant une liaison au locus SPG4. La spastin est un nouveau membre de la famille des protéines AAA, dont la localisation semble être nucléaire et qui présente une forte homologie avec les sous-unités du protéasome 26S de levure. En dépit d'une grande homologie restreinte à un domaine de 230 à 250 aa, dite cassette AAA, les nombreux membres de cette famille proteique peuvent participer à des mécanismes cellulaires très variés comme le transport de protéines au sein de vésicules, la régulation du cycle cellulaire, la biogénèse des organelles, ie contrôle de la transcription, .... Toutefois, tous ces mécanismes cellulaires impliquent l'assemblage, la fonction ou la dégradation de complexes proteiques, ce qui suggère que les membres de la famille des AAA sont des protéines dites « chaperons ».
Références
Barany, F., (1991), Proc. Natl. Acad. Sci. USA, 88, 189-193.
Beyer, A. Séquence analysis of the AAA protein family. Protein Sci. 6, 2043-2058 (1997).
Bodansky M., Principles of peptide synthesis, (1984). Bruyn, R.P.M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-Lorrain) in
Handbook of clinical neurology Vol. 15 (éd. de Jong, J.M.B.V.) 301-318 (Elsevier Science
Publishers B.V., 1991).
Buckholz, R.G. Curr. Op. Biotechnology 4 : 538-542, 1993.
Burg, J.L ét al. (1996), Mol. and Cell. Probes, 10, 257-271. Carter, B.J. Curr. Op. Biotechnology 3 : 533-539, 1993.
Casari, G. et al. Spastic paraplegia and OXPHOS impairment caused by mutations in
Paraplegin, a nuclear-encoded mitochondrial metalloprotease. Cell 93, 973-983 (1998).
Cherif D., Julier, C, Delattre, O., Derré, J., Lathrop, G. M., and Berger, R. Proc. Natl.
Acad. Sci. USA. 87 : 6639-6643, 1990. Chu, B.C.F. et al. (1986), Nucleic Acids Res., 14, 5591-5603.
Chumakov, I., Rigault, P., Guillou, S., Ougen, P., Billault, A., Guasconi, G., Gervy, P., Le
Chumakov, I.M., Rigault, P., Le Gall, I., ét al. Nature 377 : 175-183, 1995.
Confalonieri, F. &. Duguet, M. A 200-amino acid ATPase module in search of a basic function. BioEssays 17, 639-650 (1995). Duck, P. et al. (1990), Biotechniques, 9, 142-147.
Durr, A. et al. Phenotype of autosomal spastic paraplegia linked to chromosome 2. Brain
119, 1487-1496 (1996).
Edwards, C.P., and Aruffo, A. Curr. Op. Biotechnology 4 : 558-563, 1993.
Epstein, A. Médecine/Sciences 8 : 902-911, 1992. Erlich, H.A., (1989), New York : Stockton Press.
Guatelli J.C. et al. Proc. Natl. Acad. Sci. USA 87: 1874-1878, 1990 et al. Cell 85 : 281-
290, 1996.
Fink, J.K. et al. Autosomal dominant familial spastic paraplegia : tight linkage to chromosome 15q. Am. J. Hum. Genêt. 56, 188-192 (1995). Hazan, J., Lamy, C, Melki, J., Munnich, A., de Recondo, J., & Weissenbach, J.
Autosomal dominant familial spastic paraplegia is genetically heterogeneous and one locus maps to chromosome 14q. Nature Genêt. 5, 163-167 (1993).
Hazan, J. et al. Linkage of a new locus for autosomal dominant familial spastic paraplegia to chromosome 2p. Hum. Mol. Genêt. 3, 1569-1573 (1994). Hedera, P. et al. Novel locus for autosomal dominant hereditary spastic paraplegia, on chromosome 8q. Am. J. Hum. Genêt. 64, 563-569 (1999).
Heinzlef, O. et al. Mapping of a complicated familial spastic paraplegia to locus SPG4 on chromosome 2p. J. Med. Genêt. 35, 89-93 (1998). Hentati, A. et al. Linkage of a locus for autosomal dominant familial spastic paraplegia to chromosome 2p markers. Hum. Mol. Genêt. 3, 1867-1871 (1994).
The Hereditary Spastic Paraplegia Working Group. Hereditary spastic paraplegia : advances in genetic research. Neurology 46, 1507-1514 (1996).
Innis, M.A. et al. (1990), Académie Press. Jouet, M. et al. X-linked spastic paraplegia (SPG1), MASA syndrome and X-linked hydrocephalus resuit from mutations in the L1 gène. Nature Genêt. 7, 402-407 (1994).
Kievitis, T. et al. (1991), J. Virol. Methods, 35, 273-286.
Kôhler et Milstein. Nature 256, 495-497, 1975.
Kwoh, D.Y. ét al. (1989), Proc. Natl. Acad. Sci. USA, 86, 1173-1177. Landegren U., Kaiser R., Sanders J. & Hood L Science 241 : 1077-1080, 1988.
Lizardi, P.M. ét al. (1988), Bio/technology, 6, 1197-1202.
Luckow, V.A. (1993), Curr. Op. Biotechnology 4, 564-572.
Matthews, J.A. et al. (1988), Anal. Biochem., 169 : 1-25.
Miele, E.A. ét al. (1983), J. Mol. Biol., 171 : 281-295. Nielsen, J.E. et al. CAG repeat expansion in autosomal dominant pure spastic paraplegia linked to chromosome 2p21-24. Hum. Mol. Genêt. 6, 1811-1816 (1997).
Olins, P.O., and Lee, S.C. Curr. Op. Biotechnology 4 : 520-525, 1993.
Osoegawa, K. et al. An improved approach for construction of bacterial artificial chromosome libraries. Genomics 52, 1-8 (1998). Perier, F. et al. Identification of a novel mammalian member of the
NSF/CDC48p/Pas1p/TBP-1 family through heterologous expression in yeast. FEBS lett.
351, 286-290 (1994).
Perricaudet, M., Stratford-Perricaudet, L. and Briand, P. La Recherche 23 : 471-473,
1992. Polo, J.M., Calleja, J., Combarros, O. &. Berciano, J. Hereditary ataxias and paraplegias in
Cantabria, Spain. An epidemiological and clinical study. Brain 114, 855-866 (1991).
Reid, E. Pure hereditary spastic paraplegia. J. Med. Genêt. 34, 499-503 (1997).
Rohlmann, A., Gotthardt, M., Willnow, T.E., Hammer, R.E., and Herz, J. Nature Biotech.
14 : 1562-1565, 1996. Rolfs, A. et al. (1991), Berlin : Springer-Verlag. Sambrook, J., Fritsch, E.F., and Maniatis, T. Molecular cloning : a laboratory manual.
Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher disease are allelic disorders at the proteolipid protein locus. Nature Genêt. 6, 257-262 (1994).
Schnall, R. et al. Identification of a set of yeast gènes coding for a novel family of putative ATPases with high similarity to constituents of the 26S protease complex. Yeast 10, 1141-
1155 (1994).
Scott, W.K. et al. Locus heterogeneity, anticipation, and réduction of the chromosome 2p minimal candidate région in autosomal dominant familial spastic paraplegia.
Neurogenetics 1, 95-102 (1997). Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.
Segev, D., (1992), KessIer C. SpringerVerlag, Berlin, New-York, 197-205.
Skre, H. Hereditary spastic paraplegia in Western Norway. Clin. Genêt. 6, 165-183 (1974).
Stone, B.B. ét al. (1996). Mol. and Cell. Probes, 10 : 359-370.
Stewart J.M. et Yound J.D., solid phase peptides synthesis, Pierce Chem. Company, Rockford, 111 , 2ème éd., (1984).
Suggs S.V., Wallace R.B., Hirose T., Kawashima E.H. and Itakura K. PNAS 78 : 6613-
6617, 1981.
Temin, H. M. Rétrovirus vectors for gène transfer. In Kucheriapati R., éd. Gène Transfer,
New York, Plénum Press, 149-187, 1986. Walker G.T., Fraiser M.S., Schram J.L, Little M.C., Nadeau J.G., & Malinowski D.P.
Nucleic Acids Res. 20 : 1691-1696, 1992.
Werderlin, L. Hereditary ataxias. Occurence and clinical features. Acta Neurol. Scand. 73
(Suppl. 106) (1986).
Woo S.LC. Methods Enzymol. 68 : 389, 1979.

Claims

REVENDICATIONS
1. Acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe comprenant : a) la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No. 72, la séquence la séquence SEQ ID No. 106 ou la séquence d'au moins 15 nucléotides consécutifs d'une de ces séquences ; b) les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et c) la séquence complémentaire ou la séquence de l'ARN correspondant aux séquences telles que définies en a) et b).
2. Acide nucléique purifié ou isolé selon la revendication 1 , à l'exception de l'acide nucléique identifié dans la banque de données GenBank sous le numéro d'accession AB029006.
3. Acide nucléique purifié ou isolé selon la revendication 1 ou 2, caractérisé en ce qu'il comprend au moins une séquence d'au moins 15 nucléotides consécutifs, du fragment nt 714-809, extrémités incluses, de la séquence SEQ ID No. 2, de sa séquence complémentaire ou de la séquence de son ARN correspondant.
4. Acide nucléique purifié ou isolé selon l'une des revendications 1 à 3, caractérisé en ce qu'il comprend une mutation correspondant à un polymoφhisme naturel chez l'Homme.
5. Sonde ou amorce, caractérisée en ce qu'elle comprend une séquence d'un acide nucléique selon l'une des revendications 1 à 4.
6. Sonde ou amorce selon la revendication 5, caractérisée en ce que sa séquence est choisie parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
7. Site accepteur ou donneur d'épissage, caractérisé en ce qu'il comprend une séquence d'un acide nucléique selon la revendication 1 choisie parmi les séquences SEQ ID No. 74 à SEQ ID No. 105.
8. Méthode pour le criblage de banques d'ADNc ou d'ADN génomique ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en œuvre une séquence nucléique selon l'une des revendications 1 à 7.
9. Méthode selon la revendication 8, pour l'identification de la séquence génomique ou de l'ADNc du gène SPG4 de mammifère, notamment de souris.
10. Méthode pour l'identification de mutation portée par le gène SPG4 humain, caractérisée en ce qu'elle met en œuvre une séquence nucléique selon l'une des revendications 1 à 7.
11. Méthode selon la revendication 10, pour l'identification de mutation responsable de la paraplégie spastique familiale autosomique dominante.
12. Méthode pour l'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4, caractérisée en ce qu'elle met en œuvre une séquence nucléique selon l'une des revendications 1 à 7.
13. Acide nucléique identifié par une méthode selon l'une des revendications 9 à 12.
14. Polypeptide codé par un acide nucléique selon l'une des revendications 1 à 4 et 13.
15. Polypeptide selon la revendication 14, de préférence à l'exception du peptide de 584 acides aminés dont la séquence est identifiée dans la banque de données GenBank sous le numéro d'accession AB029006.
16. Polypeptide selon la revendication 14 ou 15, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant : a) la séquence SEQ ID No. 3, la séquence SEQ ID No. 73, la séquence SEQ ID No. 107 ou la séquence d'au moins 10 acides aminés consécutifs d'une de ces séquences ; et b) les séquences homologues ou variantes des séquences SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107.
17. Polypeptide selon la revendication 14 ou 15, caractérisé en ce qu'il comprend la séquence d'au moins 8 acides aminés consécutifs de la séquence du fragment aa 197-228, extrémités incluses, de la séquence SEQ ID No. 3.
18. Polypeptide selon la revendication 14 ou 15, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant la séquence SEQ ID No. 3, la séquence SEQ ID No. 73, la séquence SEQ ID No. 107, lesquelles séquences portant au moins une des mutations correspondant à un polymoφhisme naturel chez l'Homme, et les séquences de leurs fragments d'au moins 10 acides aminés consécutifs.
19. Vecteur de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'une des revendications 1 à 4, et 13.
20. Vecteur selon la revendication 19, caractérisé en ce qu'il comporte les éléments nécessaires à son expression dans une cellule hôte.
21. Cellule hôte transformée par un vecteur selon la revendication 19 ou 20.
22. Mammifère, excepté l'Homme, caractérisé en ce qu'il comprend une cellule selon la revendication 21.
23. Mammifère, excepté l'Homme, selon la revendication 22, comprenant une cellule transformée, caractérisé en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations correspondant à un polymorphisme naturel chez l'Homme ou identifiées par une méthode selon la revendication 10 ou 11.
24. Utilisation d'une séquence d'acide nucléique selon l'une des revendications 5, 6 et 13 comme sonde ou amorce, pour la détection et/ou l'amplification de séquences d'acide nucléique.
25. Utilisation d'une séquence d'acide nucléique selon l'une des revendications
1 à 7, et 13, pour le criblage de banque génomique ou d'ADNc.
26. Utilisation d'une séquence d'acide nucléique selon l'une des revendications 1 à 4, et 13, pour la production d'un polypeptide recornbinant ou synthétique.
27. Méthode de production d'un polypeptide recombinant, caractérisée en ce que l'on cultive une cellule transformée selon la revendication 21 dans des conditions permettant l'expression dudit polypeptide recombinant et que l'on récupère ledit polypeptide recombinant.
28. Polypeptide, caractérisé en ce qu'il est obtenu par une méthode selon la revendication 27.
29. Anticorps mono- ou polyclonaux ou leurs fragments, anticoφs chimériques ou immunoconjugues, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'une des revendications 14 à 18, et 28.
30. Méthode pour la détection et/ou la purification d'un polypeptide selon l'une des revendications 14 à 18, et 28, caractérisée en ce qu'elle met en oeuvre un anticoφs selon la revendication 29.
31. Méthode de diagnostic génotypique de la PSF-AD associée au gène SPG4, caractérisée en ce que l'on met en œuvre une séquence d'acide nucléique selon l'une des revendications 1 à 7, et 13.
32. Méthode de diagnostic génotypique de PSF-AD associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisée en ce qu'elle comporte les étapes suivantes : a) le cas échéant, isolement de l'ADN génomique à partir de l'échantillon biologique à analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ; b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'une des revendications 5 et 6 ou d'un acide nucléique selon la revendication 13 ; c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
33. Méthode de diagnostic de la PSF-AD associée à une expression anormale d'un polypeptide codé par le gène SPG4, caractérisée en ce que l'on met en contact un ou des anticoφs selon la revendication 29 avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
34. Méthode de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'une des revendications 14 à 18, et 28, ou avec un acide nucléique selon l'une des revendications 1 à 7, et 13, et/ou permettant de moduler l'expression ou l'activité de ces polypeptides, caractérisée en ce qu'elle comprend la mise en contact d'une séquence d'acide nucléique selon l'une des revendications 1 à 7, et 13, d'un polypeptide selon l'une des revendications 14 à 18, et 28, d'un vecteur selon l'une des revendications 19 et 20, d'une cellule selon la revendication 21, d'un mammifère selon l'une des revendications 22 et 23 ou d'un anticorps selon la revendication 29, avec un composé candidat et, la détection d'une modification de l'activité dudit polypeptide.
35. Utilisation d'une séquence d'acide nucléique selon l'une des revendications 1 à 7, et 13, d'un polypeptide selon l'une des revendications 14 à 18, et 28, d'un vecteur selon l'une des revendications 19 et 20, d'une cellule selon la revendication 21, d'un mammifère selon l'une des revendications 22 et 23 ou d'un anticorps selon la revendication 29, pour l'étude de l'expression ou de l'activité du gène SPG4.
36. Trousse ou nécessaire pour le diagnostic, caractérisée en ce qu'elle comprend au moins un composé choisi parmi le groupe de composés suivant : a) un acide nucléique selon l'une des revendications 5 et 6 ; et b) un anticoφs selon la revendication 29.
PCT/FR2000/002433 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante WO2001018198A1 (fr)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2001521734A JP2003508074A (ja) 1999-09-03 2000-09-04 最も一般的な形態の常染色体性優性遺伝性痙性対麻痺に応答し得るspg遺伝子のクローニング、発現および同定
CA2348657A CA2348657C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
US09/830,902 US6924126B1 (en) 1999-09-03 2000-09-04 Cloning, expression and characterization of the SPG4 gene responsible for the most frequent form of autosomal spastic paraplegia
US11/155,492 US20050266479A1 (en) 1999-09-03 2005-06-20 Cloning, expression and characterization of the SPG4 gene responsible for the most common form of autosomal dominant spastic paraplegia

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR99/11097 1999-09-03
FR9911097A FR2798138B1 (fr) 1999-09-03 1999-09-03 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US11/155,492 Division US20050266479A1 (en) 1999-09-03 2005-06-20 Cloning, expression and characterization of the SPG4 gene responsible for the most common form of autosomal dominant spastic paraplegia

Publications (1)

Publication Number Publication Date
WO2001018198A1 true WO2001018198A1 (fr) 2001-03-15

Family

ID=9549552

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2000/002433 WO2001018198A1 (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante

Country Status (5)

Country Link
US (2) US6924126B1 (fr)
JP (2) JP2003508074A (fr)
CA (2) CA2848454C (fr)
FR (1) FR2798138B1 (fr)
WO (1) WO2001018198A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009127211A1 (fr) * 2008-04-14 2009-10-22 Aarhus Universitet Procédés et kits de dépistage d'une démyélinisation spinale

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5312314B2 (ja) * 2006-03-30 2013-10-09 デューク ユニヴァーシティー 家族性痙性対麻痺の根底にある新規遺伝子の同定
EP1897891A1 (fr) 2006-09-11 2008-03-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) Diagnose de paraplégie spastique héréditaire par detection d' une mutation dans le gene où la protéine KIAA1840
JP6208104B2 (ja) * 2014-09-16 2017-10-04 株式会社日立製作所 生体認証システム、生体認証処理装置、生体認証方法、生体情報取得端末および情報端末
KR101889072B1 (ko) 2017-09-15 2018-08-16 한국생명공학연구원 디지털 PCR을 이용한 유전성 강직성 대마비(Hereditary spastic paraplegia, HSP) 관련 유전자 SPG4의 거대결손 검증법
CN117820470B (zh) * 2024-03-04 2024-05-31 暨南大学 人源性重组抗Spastin抗体及其制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6197551B1 (en) * 1998-01-27 2001-03-06 Millennium Pharmaceuticals, Inc. Spoil-1 protein and nucleic acid molecules and uses therefor
EP0988379B1 (fr) * 1997-04-15 2007-04-11 The Wellcome Trust Limited as Trustee to the Wellcome Trust Recepteur de ldl
EP1060266A4 (fr) * 1998-02-23 2004-09-22 Dana Farber Cancer Inst Inc Procede permettant d'identifier les sites reactifs des glycosylases de reparation des mesappariements, compose et utilisations de ce dernier

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DATABASE EMBL 4 August 1999 (1999-08-04), OHARA O.: "Homo sapiens mRNA for KIAA1083 protein", XP002140994 *
DATABASE EMBL SEQUENCES 29 March 1997 (1997-03-29), MYERS R.M.: "human STS SHGC-44567", XP002156510 *
HAZAN J. ET AL.: "Spastin, a new AAA protein, is altered in the most frequent form of autosomal dominant spastig paraplegia", NAT. GENET., vol. 23, November 1999 (1999-11-01), pages 296 - 303, XP000914979 *
HEINZLEF O. ET AL.: "Mapping of a complicated familial spastic paraplegia to locus SPG4 on chromosome 2p", J. MED. GENET., vol. 35, no. 2, February 1998 (1998-02-01), pages 89 - 93, XP000914971 *
KIKUNO R. ET AL.: "Prediction of the coding sequences of unidentfied human genes. XIV. The complete sequences of 100 cDNA clones from brain which code for large proteins in vitro.", DNA RES., vol. 6, 30 June 1999 (1999-06-30), pages 197 - 205, XP000852618 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009127211A1 (fr) * 2008-04-14 2009-10-22 Aarhus Universitet Procédés et kits de dépistage d'une démyélinisation spinale

Also Published As

Publication number Publication date
FR2798138A1 (fr) 2001-03-09
US20050266479A1 (en) 2005-12-01
JP2011254824A (ja) 2011-12-22
JP5965594B2 (ja) 2016-08-10
FR2798138B1 (fr) 2004-05-21
US6924126B1 (en) 2005-08-02
CA2348657C (fr) 2014-07-08
CA2848454C (fr) 2018-04-17
CA2848454A1 (fr) 2001-03-15
JP2003508074A (ja) 2003-03-04
CA2348657A1 (fr) 2001-03-15

Similar Documents

Publication Publication Date Title
EP1100825B1 (fr) Mutations geniques mink humaines associees a l'arythmie
EP1268784B1 (fr) Genes impliques dans les maladies inflammatoires de l'intestin et leur utilisation
JP5965594B2 (ja) 最も一般的な形態の常染色体性優性遺伝性痙性対麻痺に応答し得るspg遺伝子のクローニング、発現および同定
WO2001032704A1 (fr) Proteines membranaires ctl (choline transporter like) impliquees dans le transport de la choline
JP2004504054A (ja) 薬物誘導型心臓不整脈に関係するscn5a中の一般的多型
JP3449419B2 (ja) KVLQT1をコードするQT延長症候群遺伝子およびそのminKとの関連
Lee et al. Abnormal Chemosensory Jump 6 Is a Positive Transcriptional Regulator of the Cholinergic Gene Locus in DrosophilaOlfactory Neurons
DE69936781T2 (de) Kvlqt1 - im zusammenhang mit 'long qt syndrom'
AU2004201496A1 (en) DB the receptor for leptin nucleic acids encoding the receptor, and uses thereof
FR2800388A1 (fr) Clonage, expression et caracterisation d'un gene exprime dans des cellules tumorales et implique dans la regulation de la reponse immune
WO2003087153A1 (fr) Proteine knox-25 en doigt de zinc de type kruppel de souris et son utilisation
US20070048836A1 (en) Db, the receptor for leptin, nucleic acids encoding the receptor, and uses thereof
US20090275024A1 (en) Novel centrerosome-associated protein and applications thereof
WO2000078948A2 (fr) Clonage, expression et caracterisation d'un adnc codant pour un recepteur gamma-hydroxybutyrate (ghb) de cerveau de rat
WO1997043415A1 (fr) Facteur de liaison de la cycline de type d et emplois dudit produit
WO1997043415A9 (fr) Facteur de liaison de la cycline de type d et emplois dudit produit
CA2432214A1 (fr) Gene implique dans la regulation de l'apoptose
JP2002360260A (ja) Bタンパク質をコードする遺伝子
WO2002090545A2 (fr) Acide nucleique codant le polypeptide cgl1 et application de cet acide nucleique et du polypeptide cgl1 au diagnostic et en therapeutique
CA2357987A1 (fr) Sequence genetique liee a des maladies osseuses

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): CA JP US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

ENP Entry into the national phase

Ref document number: 2348657

Country of ref document: CA

Ref country code: CA

Ref document number: 2348657

Kind code of ref document: A

Format of ref document f/p: F

ENP Entry into the national phase

Ref country code: JP

Ref document number: 2001 521734

Kind code of ref document: A

Format of ref document f/p: F

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 09830902

Country of ref document: US

122 Ep: pct application non-entry in european phase