CA2848454C - Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante. - Google Patents
Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante. Download PDFInfo
- Publication number
- CA2848454C CA2848454C CA2848454A CA2848454A CA2848454C CA 2848454 C CA2848454 C CA 2848454C CA 2848454 A CA2848454 A CA 2848454A CA 2848454 A CA2848454 A CA 2848454A CA 2848454 C CA2848454 C CA 2848454C
- Authority
- CA
- Canada
- Prior art keywords
- sequence
- seq
- spg4
- nucleic acid
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000010367 cloning Methods 0.000 title abstract description 12
- 238000012512 characterization method Methods 0.000 title abstract description 9
- 230000014509 gene expression Effects 0.000 title description 32
- 206010033892 Paraplegia Diseases 0.000 title description 13
- 101150078320 SPAST gene Proteins 0.000 title description 13
- 208000032930 Spastic paraplegia Diseases 0.000 title description 11
- 238000000034 method Methods 0.000 claims abstract description 92
- 239000002299 complementary DNA Substances 0.000 claims abstract description 66
- 208000008675 hereditary spastic paraplegia Diseases 0.000 claims abstract description 10
- 238000002405 diagnostic procedure Methods 0.000 claims abstract description 4
- 150000007523 nucleic acids Chemical class 0.000 claims description 67
- 102000039446 nucleic acids Human genes 0.000 claims description 52
- 108020004707 nucleic acids Proteins 0.000 claims description 52
- 230000003321 amplification Effects 0.000 claims description 39
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 39
- 239000000523 sample Substances 0.000 claims description 38
- 241000282414 Homo sapiens Species 0.000 claims description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 18
- 239000002253 acid Substances 0.000 claims description 17
- 238000012163 sequencing technique Methods 0.000 claims description 15
- 239000012472 biological sample Substances 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 9
- 238000013518 transcription Methods 0.000 claims description 9
- 230000035897 transcription Effects 0.000 claims description 9
- 108020004635 Complementary DNA Proteins 0.000 claims description 8
- 238000006073 displacement reaction Methods 0.000 claims description 4
- 238000007834 ligase chain reaction Methods 0.000 claims description 4
- 238000003752 polymerase chain reaction Methods 0.000 claims description 4
- 230000010076 replication Effects 0.000 claims description 4
- 230000001351 cycling effect Effects 0.000 claims description 2
- 230000001404 mediated effect Effects 0.000 claims description 2
- 230000008439 repair process Effects 0.000 claims description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims 1
- 238000010804 cDNA synthesis Methods 0.000 claims 1
- 230000035772 mutation Effects 0.000 abstract description 78
- 108090000765 processed proteins & peptides Proteins 0.000 abstract description 75
- 102000004196 processed proteins & peptides Human genes 0.000 abstract description 72
- 229920001184 polypeptide Polymers 0.000 abstract description 70
- 101150055520 SPG4 gene Proteins 0.000 abstract description 32
- 108090001068 Spastin Proteins 0.000 abstract description 32
- 239000013598 vector Substances 0.000 abstract description 15
- 241001465754 Metazoa Species 0.000 abstract description 12
- 150000001875 compounds Chemical class 0.000 abstract description 12
- 230000009261 transgenic effect Effects 0.000 abstract description 9
- 239000000126 substance Substances 0.000 abstract description 6
- 238000009007 Diagnostic Kit Methods 0.000 abstract description 2
- 102000004880 Spastin Human genes 0.000 abstract 1
- 102100038829 Spastin Human genes 0.000 description 96
- 108090000623 proteins and genes Proteins 0.000 description 76
- 101000664527 Homo sapiens Spastin Proteins 0.000 description 75
- 208000031629 Autosomal dominant spastic paraplegia type 4 Diseases 0.000 description 59
- 201000007473 hereditary spastic paraplegia 4 Diseases 0.000 description 59
- 235000018102 proteins Nutrition 0.000 description 43
- 102000004169 proteins and genes Human genes 0.000 description 43
- 210000004027 cell Anatomy 0.000 description 37
- 239000002773 nucleotide Substances 0.000 description 30
- 125000003729 nucleotide group Chemical group 0.000 description 30
- 239000012634 fragment Substances 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 25
- 108700024394 Exon Proteins 0.000 description 21
- 241000699666 Mus <mouse, genus> Species 0.000 description 21
- 239000000047 product Substances 0.000 description 21
- 241001529936 Murinae Species 0.000 description 17
- 238000009396 hybridization Methods 0.000 description 16
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 15
- 241000124008 Mammalia Species 0.000 description 14
- 210000000349 chromosome Anatomy 0.000 description 14
- 235000001014 amino acid Nutrition 0.000 description 13
- 150000001413 amino acids Chemical class 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 13
- 238000004458 analytical method Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 12
- 102100029228 Insulin-like growth factor-binding protein 7 Human genes 0.000 description 11
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 11
- 210000004556 brain Anatomy 0.000 description 11
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 11
- 229920013655 poly(bisphenol-A sulfone) Polymers 0.000 description 11
- 102100027006 Paraplegin Human genes 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 108091033319 polynucleotide Chemical group 0.000 description 10
- 102000040430 polynucleotide Human genes 0.000 description 10
- 239000002157 polynucleotide Chemical group 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 9
- 210000001161 mammalian embryo Anatomy 0.000 description 9
- 108091060211 Expressed sequence tag Proteins 0.000 description 8
- 101710083869 Paraplegin Proteins 0.000 description 8
- 244000007853 Sarothamnus scoparius Species 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 238000012216 screening Methods 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000003745 diagnosis Methods 0.000 description 7
- 108091006112 ATPases Proteins 0.000 description 6
- 102000057290 Adenosine Triphosphatases Human genes 0.000 description 6
- 241000699670 Mus sp. Species 0.000 description 6
- 125000003275 alpha amino acid group Chemical group 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 230000001605 fetal effect Effects 0.000 description 6
- 210000004185 liver Anatomy 0.000 description 6
- 108020004999 messenger RNA Proteins 0.000 description 6
- 239000013642 negative control Substances 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000010627 oxidative phosphorylation Effects 0.000 description 5
- 230000007170 pathology Effects 0.000 description 5
- 239000012071 phase Substances 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 230000002285 radioactive effect Effects 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 108010006035 Metalloproteases Proteins 0.000 description 4
- 102000005741 Metalloproteases Human genes 0.000 description 4
- 208000008238 Muscle Spasticity Diseases 0.000 description 4
- 108010006785 Taq Polymerase Proteins 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 210000002459 blastocyst Anatomy 0.000 description 4
- 238000004925 denaturation Methods 0.000 description 4
- 230000036425 denaturation Effects 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000002438 mitochondrial effect Effects 0.000 description 4
- 238000001964 muscle biopsy Methods 0.000 description 4
- 238000000746 purification Methods 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 210000002027 skeletal muscle Anatomy 0.000 description 4
- 208000018198 spasticity Diseases 0.000 description 4
- 230000037436 splice-site mutation Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 238000011144 upstream manufacturing Methods 0.000 description 4
- 102000009067 AAA Proteins Human genes 0.000 description 3
- 108010087671 AAA Proteins Proteins 0.000 description 3
- 108010022579 ATP dependent 26S protease Proteins 0.000 description 3
- 108010058643 Fungal Proteins Proteins 0.000 description 3
- 101000629361 Homo sapiens Paraplegin Proteins 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- 201000002961 MASA syndrome Diseases 0.000 description 3
- 108091034117 Oligonucleotide Chemical group 0.000 description 3
- 108020005067 RNA Splice Sites Proteins 0.000 description 3
- 241000700159 Rattus Species 0.000 description 3
- 101100162195 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) AFG3 gene Proteins 0.000 description 3
- 101100521046 Xenopus laevis psmc3-a gene Proteins 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 102000056978 human SPAST Human genes 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 210000003470 mitochondria Anatomy 0.000 description 3
- 230000008520 organization Effects 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- -1 radioluminescent Substances 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 210000001550 testis Anatomy 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 102100021765 E3 ubiquitin-protein ligase RNF139 Human genes 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 101001106970 Homo sapiens E3 ubiquitin-protein ligase RNF139 Proteins 0.000 description 2
- 101000803685 Homo sapiens Vacuolar protein sorting-associated protein 4A Proteins 0.000 description 2
- 101000803689 Homo sapiens Vacuolar protein sorting-associated protein 4B Proteins 0.000 description 2
- 102100034343 Integrase Human genes 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 101100149979 Mus musculus Spast gene Proteins 0.000 description 2
- 102100026784 Myelin proteolipid protein Human genes 0.000 description 2
- 108091092724 Noncoding DNA Proteins 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 description 2
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 description 2
- 102000016202 Proteolipids Human genes 0.000 description 2
- 108010010974 Proteolipids Proteins 0.000 description 2
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 2
- 101100267551 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) YME1 gene Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 102100035086 Vacuolar protein sorting-associated protein 4B Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 150000007513 acids Chemical class 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 238000000246 agarose gel electrophoresis Methods 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003795 chemical substances by application Substances 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000006735 deficit Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 210000000688 human artificial chromosome Anatomy 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 229940127121 immunoconjugate Drugs 0.000 description 2
- 230000002779 inactivation Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 210000003141 lower extremity Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000028327 secretion Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000001148 spastic effect Effects 0.000 description 2
- 210000000278 spinal cord Anatomy 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 238000010396 two-hybrid screening Methods 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108050001326 26S Proteasome regulatory subunit 6A Proteins 0.000 description 1
- 102100029510 26S proteasome regulatory subunit 6A Human genes 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 1
- 102100027766 Atlastin-1 Human genes 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 208000012432 Autosomal dominant pure spastic paraplegia Diseases 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000244202 Caenorhabditis Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102100038385 Coiled-coil domain-containing protein R3HCC1L Human genes 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- 101000825172 Dictyostelium discoideum Spore germination protein 3 Proteins 0.000 description 1
- 238000002965 ELISA Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 101000936983 Homo sapiens Atlastin-1 Proteins 0.000 description 1
- 101000884714 Homo sapiens Beta-defensin 4A Proteins 0.000 description 1
- 101000743767 Homo sapiens Coiled-coil domain-containing protein R3HCC1L Proteins 0.000 description 1
- 101001048716 Homo sapiens ETS domain-containing protein Elk-4 Proteins 0.000 description 1
- 101001092930 Homo sapiens Prosaposin Proteins 0.000 description 1
- 208000031300 Hydrocephalus with stenosis of the aqueduct of Sylvius Diseases 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 101150075239 L1 gene Proteins 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108010006519 Molecular Chaperones Proteins 0.000 description 1
- 102000005431 Molecular Chaperones Human genes 0.000 description 1
- 108090000143 Mouse Proteins Proteins 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010083674 Myelin Proteins Proteins 0.000 description 1
- 102000006386 Myelin Proteins Human genes 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 108010012255 Neural Cell Adhesion Molecule L1 Proteins 0.000 description 1
- 102100024964 Neural cell adhesion molecule L1 Human genes 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 238000009004 PCR Kit Methods 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 208000017493 Pelizaeus-Merzbacher disease Diseases 0.000 description 1
- 241000276498 Pollachius virens Species 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 208000025710 Pure hereditary spastic paraplegia Diseases 0.000 description 1
- 108010066717 Q beta Replicase Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101100263884 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) VPS4 gene Proteins 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241000872198 Serjania polyphylla Species 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102100022483 Sodium channel and clathrin linker 1 Human genes 0.000 description 1
- 208000010112 Spinocerebellar Degenerations Diseases 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 229920004890 Triton X-100 Polymers 0.000 description 1
- 239000013504 Triton X-100 Substances 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 210000001766 X chromosome Anatomy 0.000 description 1
- 208000026197 X-linked hydrocephalus with stenosis of the aqueduct of Sylvius Diseases 0.000 description 1
- 108010091383 Xanthine dehydrogenase Proteins 0.000 description 1
- 102000005773 Xanthine dehydrogenase Human genes 0.000 description 1
- 108010093894 Xanthine oxidase Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 235000021028 berry Nutrition 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000021164 cell adhesion Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000007248 cellular mechanism Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000005081 chemiluminescent agent Substances 0.000 description 1
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 1
- 230000014107 chromosome localization Effects 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000009833 condensation Methods 0.000 description 1
- 230000005494 condensation Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000003412 degenerative effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 229940041984 dextran 1 Drugs 0.000 description 1
- 229960000633 dextran sulfate Drugs 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000019688 fish Nutrition 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000005227 gel permeation chromatography Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 208000035474 group of disease Diseases 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 102000055335 human SPG7 Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 210000004408 hybridoma Anatomy 0.000 description 1
- 208000003906 hydrocephalus Diseases 0.000 description 1
- 238000010166 immunofluorescence Methods 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000002055 immunohistochemical effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 239000003999 initiator Substances 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000891 luminescent agent Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- 208000012268 mitochondrial disease Diseases 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 210000005012 myelin Anatomy 0.000 description 1
- 210000001087 myotubule Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000010397 one-hybrid screening Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000007310 pathophysiology Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 101150091331 plp gene Proteins 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000033458 reproduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 238000002416 scanning tunnelling spectroscopy Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000004960 subcellular localization Effects 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 208000011317 telomere syndrome Diseases 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000006490 viral transcription Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 230000002747 voluntary effect Effects 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P21/00—Drugs for disorders of the muscular or neuromuscular system
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01K—ANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
- A01K2217/00—Genetically modified animals
- A01K2217/05—Animals comprising random inserted nucleic acids (transgenic)
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Medicinal Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Gastroenterology & Hepatology (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Toxicology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Neurology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- Physical Education & Sports Medicine (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Animal Behavior & Ethology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, et certaines de ses mutations responsables de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques, ainsi que des méthodes et trousse de diagnostic, et des méthodes de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.
Description
CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE
SPASTIQUE AUTOSOMIQUE DOMINANTE.
L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, responsable de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques ainsi que des méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé
chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.
Les paraplégies spastiques familiales (PSF) sont des affections dégénératives du système nerveux central caractérisées par une spasticité bilatérale et progressive des membres inférieurs. Elles se manifestent cliniquement par des difficultés de la marche pouvant évoluer en une paralysie totale des deux jambes. La physiopathologie de cet ensemble de 'maladies est à ce jour peu documentée ; toutefois, les données anatomopathologiques permettent de conclure que l'atteinte est limitée aux faisceaux pyramidaux responsables de la motricité volontaire dans la moelle épinière (Reid, 1997). Il existe différentes formes cliniques et génétiques de PSF. On distingue cliniquement les PSF dites pures correspondant à une spasticité isolée des membres inférieurs, des PSF complexes pour lesquelles la spasticité des jambes est associée à d'autres manifestations cliniques de type neurologique ou non (Bruyn et al., 1991). D'un point de vue génétique, les PSF peuvent être transmises selon le mode autosomique dominant (PSF-AD), autosomique récessif (PSF-AR) ou lié au chromosome X (PSF-X). La forme pure de PSF qui est le plus souvent transmise = selon le mode autosomique dominant demeure la plus fréquente (environ 80 % des PSF) (Reid, 1997). L'incidence des PSF qui reste difficile à estimer en raison des rares études épidémiologiques et de l'importante variabilité clinique varie de 0,9:
100 000 au Danemark, 3 à 9,6: 100 000 dans certaines régions d'Espagne (Polo et al.,1991) ou 14: 100 000 en Norvège (Skre, 1974) (environ 3 : 100 000 en France).
En plus de cette grande variabilité clinique qui est observée non seulement entre les différentes familles mais aussi entre différents membres atteints d'une même famille, les PSF se caractérisent également par une importante hétérogénéité
génétique. Dans le cas des PSF-AD, quatre bd ont été identifiés à ce jour sur les
SPASTIQUE AUTOSOMIQUE DOMINANTE.
L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, responsable de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques ainsi que des méthodes et trousses de diagnostic, et des méthodes de sélection d'un composé
chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.
Les paraplégies spastiques familiales (PSF) sont des affections dégénératives du système nerveux central caractérisées par une spasticité bilatérale et progressive des membres inférieurs. Elles se manifestent cliniquement par des difficultés de la marche pouvant évoluer en une paralysie totale des deux jambes. La physiopathologie de cet ensemble de 'maladies est à ce jour peu documentée ; toutefois, les données anatomopathologiques permettent de conclure que l'atteinte est limitée aux faisceaux pyramidaux responsables de la motricité volontaire dans la moelle épinière (Reid, 1997). Il existe différentes formes cliniques et génétiques de PSF. On distingue cliniquement les PSF dites pures correspondant à une spasticité isolée des membres inférieurs, des PSF complexes pour lesquelles la spasticité des jambes est associée à d'autres manifestations cliniques de type neurologique ou non (Bruyn et al., 1991). D'un point de vue génétique, les PSF peuvent être transmises selon le mode autosomique dominant (PSF-AD), autosomique récessif (PSF-AR) ou lié au chromosome X (PSF-X). La forme pure de PSF qui est le plus souvent transmise = selon le mode autosomique dominant demeure la plus fréquente (environ 80 % des PSF) (Reid, 1997). L'incidence des PSF qui reste difficile à estimer en raison des rares études épidémiologiques et de l'importante variabilité clinique varie de 0,9:
100 000 au Danemark, 3 à 9,6: 100 000 dans certaines régions d'Espagne (Polo et al.,1991) ou 14: 100 000 en Norvège (Skre, 1974) (environ 3 : 100 000 en France).
En plus de cette grande variabilité clinique qui est observée non seulement entre les différentes familles mais aussi entre différents membres atteints d'une même famille, les PSF se caractérisent également par une importante hétérogénéité
génétique. Dans le cas des PSF-AD, quatre bd ont été identifiés à ce jour sur les
2 chromosomes 14 (locus SPG3) (Hazan et al., 1993), 2 (locus SPG4) (Hazan et al., 1994 ; Hentali et al., 1994), 15 (locus SPG6) (Fink et al., 1995) et 8 (locus SPG8) (Hedera et al., 1999). L'étude d'un grand nombre de familles présentant une PSF-AD a montré que le gène porté par le chromosome 2 est un locus majoritaire de cette forme de la maladie, retrouvé dans 40 à 50 % des familles analysées (The Hereditary Spastic Paraplegia Working Group, 1996; Durr et al., 1996). Un phénomène d'anticipation a été observé dans certaines familles de PSF liée au locus SPG4 ; ce phénomène a par la suite été associé à l'expansion d'une répétition (CAG)n mise en évidence dans 6 familles danoises (Nielsen et al., 1997) par la technique de RED (pour Rapid Expansion Detection). Cette expansion n'a cependant jamais pu être confirmée dans aucune des familles testées par cette même méthode ni par la recherche systématique de séquences de type (CAG)n dans les cartes physiques composées de clones YAC
(pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosome) (Hazan et al., Genomics, 60 (3), 309-19, 1999).
A ce jour, trois gènes responsables de deux formes de PSF-X et d'une forme de PSF-AR ont été identifiés. Des mutations dans le gène, codant pour une molécule d'adhérence cellulaire spécifique des neurones, L1-CAM (pour L1 Cell Adhesion Molecule), et localisé en Xq28 (locus SPG1) causent une forme complexe de PSF
(Jouet et al., 1994) dans laquelle la spasticité est associée à un retard mental, alors que des mutations dans le gène PLP (pour ProteoLipid Protein) situé en Xq21 (locus SPG2), codant pour une molécule constitutive de la couche de myéline, sont à
l'origine de formes pures et complexes de PSF-X (Saugier-Veber, P. et al., 1994). Plus récemment des mutations dans un gène localisé en 16q24.3 (locus SPG7), qui code pour la paraplegin, une ATPase mitochondriale de la famille protéique des AAA
(pour ATPases Associated with diverse cellular Activities ) (Confalonieri et al., 1995) ont été associées à des formes complexes et pures de PSF-AR (Casari et al., 1998).
Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caractériser le gène responsable de la forme la plus fréquente de PSF-AD. L'identification de ce gène devrait en particulier permettre, outre la possibilité d'un test de dépistage anténatal chez les familles concernées, de mieux comprendre certains des mécanismes moléculaires engendrant ces dégénérescences spécifiques de faisceaux nerveux de la moelle épinière, voire d'apporter des éléments de réponse quant à un traitement thérapeutique des malades.
Ceci est justement l'objet de la présente invention.
(pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosome) (Hazan et al., Genomics, 60 (3), 309-19, 1999).
A ce jour, trois gènes responsables de deux formes de PSF-X et d'une forme de PSF-AR ont été identifiés. Des mutations dans le gène, codant pour une molécule d'adhérence cellulaire spécifique des neurones, L1-CAM (pour L1 Cell Adhesion Molecule), et localisé en Xq28 (locus SPG1) causent une forme complexe de PSF
(Jouet et al., 1994) dans laquelle la spasticité est associée à un retard mental, alors que des mutations dans le gène PLP (pour ProteoLipid Protein) situé en Xq21 (locus SPG2), codant pour une molécule constitutive de la couche de myéline, sont à
l'origine de formes pures et complexes de PSF-X (Saugier-Veber, P. et al., 1994). Plus récemment des mutations dans un gène localisé en 16q24.3 (locus SPG7), qui code pour la paraplegin, une ATPase mitochondriale de la famille protéique des AAA
(pour ATPases Associated with diverse cellular Activities ) (Confalonieri et al., 1995) ont été associées à des formes complexes et pures de PSF-AR (Casari et al., 1998).
Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caractériser le gène responsable de la forme la plus fréquente de PSF-AD. L'identification de ce gène devrait en particulier permettre, outre la possibilité d'un test de dépistage anténatal chez les familles concernées, de mieux comprendre certains des mécanismes moléculaires engendrant ces dégénérescences spécifiques de faisceaux nerveux de la moelle épinière, voire d'apporter des éléments de réponse quant à un traitement thérapeutique des malades.
Ceci est justement l'objet de la présente invention.
3 Après avoir délimité l'intervalle de localisation entre les marqueurs génétiques D2S352 et D2S2347 par l'étude des évènements de recombinaison dans les familles de PSF liées au locus SPG4, les inventeurs ont établi un contig de BACs recouvrant une distance physique évaluée à environ 1,5 Mb et entrepris une stratégie de clonage positionnel basée sur le séquençage de l'intervalle SPG4 afin d'identifier de façon exhaustive tous les gènes localisés dans la région candidate. L'analyse de la séquence des deux BACs, D (b336P14) et G (B763N4), a révélé la présence d'un gène composé
de 17 exons, s'étendant sur une distance d'environ 100 kb, et présentant une homologie avec les gènes codant pour des protéines de la famille des AAA. La comparaison de la séquence de ce gène entre les individus sains et atteints des familles de PSF-AD a permis de mettre en évidence différentes mutations chez les patients.
L'invention a ainsi pour objet l'identification et la caractérisation du gène (ou SPAST) codant pour un nouveau membre nucléaire de la famille des AM, responsable de la forme la plus fréquente de PSF-AD.
Sous un premier aspect, la présente invention a pour objet un acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 35, 40, 45, 50, 75, 100 ou nucléotides consécutifs, d'une séquence choisie parmi le groupe comprenant :
- la séquence SEQ ID No. 1, séquence génomique du gène SPG4 humain ;
- les séquences nucléiques homologues ou variantes de l'acide nucléique de séquence SEQ ID No. 1;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
La présente invention concerne, bien entendu, aussi bien les séquences ADN
qu'ARN ainsi que les séquences qui s'hybrident avec elles, de même que les ADNs double brin correspondants.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entendra désigner aussi bien un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou de synthèse, comportant ou non des nucléotides non naturels, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique. On entend par fragment d'ADN
et/ou
de 17 exons, s'étendant sur une distance d'environ 100 kb, et présentant une homologie avec les gènes codant pour des protéines de la famille des AAA. La comparaison de la séquence de ce gène entre les individus sains et atteints des familles de PSF-AD a permis de mettre en évidence différentes mutations chez les patients.
L'invention a ainsi pour objet l'identification et la caractérisation du gène (ou SPAST) codant pour un nouveau membre nucléaire de la famille des AM, responsable de la forme la plus fréquente de PSF-AD.
Sous un premier aspect, la présente invention a pour objet un acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 35, 40, 45, 50, 75, 100 ou nucléotides consécutifs, d'une séquence choisie parmi le groupe comprenant :
- la séquence SEQ ID No. 1, séquence génomique du gène SPG4 humain ;
- les séquences nucléiques homologues ou variantes de l'acide nucléique de séquence SEQ ID No. 1;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
La présente invention concerne, bien entendu, aussi bien les séquences ADN
qu'ARN ainsi que les séquences qui s'hybrident avec elles, de même que les ADNs double brin correspondants.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entendra désigner aussi bien un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou de synthèse, comportant ou non des nucléotides non naturels, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique. On entend par fragment d'ADN
et/ou
4 d'ARN naturel isolé, ou de synthèse, comportant ou non des nucléotides non naturels, un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment, un segment ou une région d'un acide nucléique.
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à-dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié.
Par séquence nucléique homologue , on entendra désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique, et/ou une mutation, notamment ponctuelle, et dont la séquence nucléique présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence nucléique de référence.
Par pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à
comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Les comparaisons de séquences entre deux séquences d'acide nucléique ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L'alignement optimal des séquences pour la comparaison peut être réalisé, outre manuellement, au moyen de l'algorithme d'homologie locale de Smith et Waterman (1981) [Ad. App. Math. 2:482], au moyen de l'algorithme d'homologie locale de Neddleman et Wunsch (1970) [J. Mol. Biol.
48:443], au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988) [Proc. Natl. Acad. Sci. USA 85:2444], au moyen de logiciels informatiques utilisant ces algorithmes (GAP, BESTFIT, FASTA et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI, ou encore par les logiciels de comparaison BLAST N ou BLAST P).
Le pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés est déterminé en comparant ces deux séquences alignées de manière optimale par fenêtre de comparaison dans laquelle la région de la séquence d'acide nucléique ou d'acides aminés à comparer peut comprendre des additions ou des délétions par rapport à la séquence de référence pour un alignement optimal entre ces deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre de positions identiques pour lesquelles le nucléotide ou le résidu d'acide aminé
est
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à-dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié.
Par séquence nucléique homologue , on entendra désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique, et/ou une mutation, notamment ponctuelle, et dont la séquence nucléique présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence nucléique de référence.
Par pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés au sens de la présente invention, on entend désigner un pourcentage de nucléotides ou de résidus d'acides aminés identiques entre les deux séquences à
comparer, obtenu après le meilleur alignement, ce pourcentage étant purement statistique et les différences entre les deux séquences étant réparties au hasard et sur toute leur longueur. Les comparaisons de séquences entre deux séquences d'acide nucléique ou d'acides aminés sont traditionnellement réalisées en comparant ces séquences après les avoir alignées de manière optimale, ladite comparaison étant réalisée par segment ou par fenêtre de comparaison pour identifier et comparer les régions locales de similarité de séquence. L'alignement optimal des séquences pour la comparaison peut être réalisé, outre manuellement, au moyen de l'algorithme d'homologie locale de Smith et Waterman (1981) [Ad. App. Math. 2:482], au moyen de l'algorithme d'homologie locale de Neddleman et Wunsch (1970) [J. Mol. Biol.
48:443], au moyen de la méthode de recherche de similarité de Pearson et Lipman (1988) [Proc. Natl. Acad. Sci. USA 85:2444], au moyen de logiciels informatiques utilisant ces algorithmes (GAP, BESTFIT, FASTA et TFASTA dans le Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI, ou encore par les logiciels de comparaison BLAST N ou BLAST P).
Le pourcentage d'identité entre deux séquences d'acide nucléique ou d'acides aminés est déterminé en comparant ces deux séquences alignées de manière optimale par fenêtre de comparaison dans laquelle la région de la séquence d'acide nucléique ou d'acides aminés à comparer peut comprendre des additions ou des délétions par rapport à la séquence de référence pour un alignement optimal entre ces deux séquences. Le pourcentage d'identité est calculé en déterminant le nombre de positions identiques pour lesquelles le nucléotide ou le résidu d'acide aminé
est
5 identique entre les deux séquences, en divisant ce nombre de positions identiques par le nombre total de positions dans la fenêtre de comparaison et en multipliant le résultat obtenu par 100 pour obtenir le pourcentage d'identité entre ces deux séquences.
Par exemple, on pourra utiliser le programme BLAST, BLAST 2 sequences (Tatusova et al., ''Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol. Lett. 174:247-250) disponible) les paramètres utilisés étant ceux donnés par défaut (en particulier pour les paramètres open gap penaltie : 5, et extension gap penaltie : 2 ; la matrice choisie étant par exemple la matrice BLOSUM 62 proposée par le programme), le pourcentage d'identité entre les deux séquences à
comparer étant calculé directement par le programme.
Il s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec une des séquences de l'invention. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 80 %, de préférence 90 % ou 95 % d'identité après alignement entre l'une des deux séquences et la séquence complémentaire de l'autre.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN
complémentaires.
A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits d-dessus, sont avantageusement les suivantes.
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42 C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCl + 0,015 M
citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardts, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i.e. : 42 C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20 C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20 C
en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 %
SDS
Par exemple, on pourra utiliser le programme BLAST, BLAST 2 sequences (Tatusova et al., ''Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol. Lett. 174:247-250) disponible) les paramètres utilisés étant ceux donnés par défaut (en particulier pour les paramètres open gap penaltie : 5, et extension gap penaltie : 2 ; la matrice choisie étant par exemple la matrice BLOSUM 62 proposée par le programme), le pourcentage d'identité entre les deux séquences à
comparer étant calculé directement par le programme.
Il s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec une des séquences de l'invention. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 80 %, de préférence 90 % ou 95 % d'identité après alignement entre l'une des deux séquences et la séquence complémentaire de l'autre.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN
complémentaires.
A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits d-dessus, sont avantageusement les suivantes.
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42 C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCl + 0,015 M
citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardts, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i.e. : 42 C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20 C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20 C
en 0,1 x SSC + 0,1 % SDS. Le dernier lavage est pratiqué en 0,1 x SSC + 0,1 %
SDS
6 pendant 30 minutes à 60 C pour une sonde de taille> 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de taille définie, seront adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et ai, 1989.
Par séquence nucléique variante ou acide nucléique variant d'une séquence nucléique de référence, on entendra désigner l'ensemble des séquences nucléiques correspondant à des variants alléliques, c'est-à-dire des variations individuelles de la séquence nucléique de référence. Ces séquences mutées naturelles correspondent à des polymorphismes présents chez les mammifères, en particulier chez l'être humain et, notamment, à des polymorphismes pouvant conduire à la survenue et/ou au développement de pathologie.
Si les séquences selon l'invention concernent les séquences normales, elles concernent également les séquences mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10 % de mutations par rapport à la séquence normale.
En particulier, les séquences nucléiques variantes comprendront toute séquence d'au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 50, 100 ou 200 nucléotides consécutifs, d'une séquence polymorphique de la séquence génomique du gène SPG4 humain de séquence SEQ ID No. 1, et dont la séquence d'acide nucléique présente par rapport à la séquence SEQ ID No. 1 au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidu d'acide aminé. Dans le cas présent, les séquences nucléiques variantes présentant au moins une mutation seront ici liées aux pathologies de type PSF-AD liées au locus SPG4.
De préférence, la présente invention concerne des séquences nucléiques mutées dans lesquelles les mutations conduisent à une modification de la séquence d'acides aminés du polypeptide codé par la séquence normale.
On entendra également désigner par séquences nucléiques variantes tout ARN
ou ADNc résultant d'une mutation d'un site d'épissage de la séquence nucléique génomique SEQ ID No. 1.
De préférence, l'invention concerne un acide nucléique purifié ou isolé du gène =
SPG4 selon l'invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No.
72, la séquence SEQ ID No. 106 ou la séquence d'au moins 15, de préférence 20, 25,
Par séquence nucléique variante ou acide nucléique variant d'une séquence nucléique de référence, on entendra désigner l'ensemble des séquences nucléiques correspondant à des variants alléliques, c'est-à-dire des variations individuelles de la séquence nucléique de référence. Ces séquences mutées naturelles correspondent à des polymorphismes présents chez les mammifères, en particulier chez l'être humain et, notamment, à des polymorphismes pouvant conduire à la survenue et/ou au développement de pathologie.
Si les séquences selon l'invention concernent les séquences normales, elles concernent également les séquences mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10 % de mutations par rapport à la séquence normale.
En particulier, les séquences nucléiques variantes comprendront toute séquence d'au moins 15 nucléotides consécutifs, de préférence 20, 25, 30, 50, 100 ou 200 nucléotides consécutifs, d'une séquence polymorphique de la séquence génomique du gène SPG4 humain de séquence SEQ ID No. 1, et dont la séquence d'acide nucléique présente par rapport à la séquence SEQ ID No. 1 au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidu d'acide aminé. Dans le cas présent, les séquences nucléiques variantes présentant au moins une mutation seront ici liées aux pathologies de type PSF-AD liées au locus SPG4.
De préférence, la présente invention concerne des séquences nucléiques mutées dans lesquelles les mutations conduisent à une modification de la séquence d'acides aminés du polypeptide codé par la séquence normale.
On entendra également désigner par séquences nucléiques variantes tout ARN
ou ADNc résultant d'une mutation d'un site d'épissage de la séquence nucléique génomique SEQ ID No. 1.
De préférence, l'invention concerne un acide nucléique purifié ou isolé du gène =
SPG4 selon l'invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No.
72, la séquence SEQ ID No. 106 ou la séquence d'au moins 15, de préférence 20, 25,
7 30, 35, 40, 45, 50, 75, 100 ou 200 nucléotides consécutifs de la séquence SEQ
ID
No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
b) les séquences nucléiques homologues ou variantes des séquences SEQ ID No.
1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et c) la séquence complémentaire ou la séquence de l'ARN correspondant aux séquences telles que définies en a) et b), de préférence à l'exception de l'acide nucléique identifié dans la banque de données GenBank sous le numéro d'accession AB029006.
L'acide nucléique dont la séquence est divulguée dans la banque de données GenBank sous le numéro d'accession AB029006, correspond à la séquence de l'un des 100 ADNc issus d'une banque d'ARNm de cerveau humain identifiée par le Kazusa DNA Research Institute au Japon (Kikuno et al., DNA Resarch, 6, 197-205, 1999).
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une séquence d'au moins nucléotides consécutifs, de préférence 20, 25, 30, 50 ou 75 nucléotides consécutifs du fragment nt 714-809, extrémités incluses, de la séquence SEQ ID No. 2, de sa séquence complémentaire ou de la séquence de son ARN correspondant.
L'invention concerne de préférence un acide nucléique purifié ou isolé selon la présente invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe suivant :
- la séquence SEQ ID No. 1;
- la séquence SEQ ID No. 2, séquence de l'ADNc codant pour la spastin humaine ;
- les séquences SEQ ID No. 72 et SEQ ID No. 106, la séquence SEQ ID No. 72 représentant la séquence de l'ADNc incomplet codant pour la spastin murine représentée à la figure 5, ligne "Mouse" et la SEQ ID No. 106 sa séquence complète ;
- les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une mutation correspondant à
un polymorphisme naturel chez l'Homme, notamment dont la position et la nature sont identifiées dans le tableau 5.
ID
No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
b) les séquences nucléiques homologues ou variantes des séquences SEQ ID No.
1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106 ; et c) la séquence complémentaire ou la séquence de l'ARN correspondant aux séquences telles que définies en a) et b), de préférence à l'exception de l'acide nucléique identifié dans la banque de données GenBank sous le numéro d'accession AB029006.
L'acide nucléique dont la séquence est divulguée dans la banque de données GenBank sous le numéro d'accession AB029006, correspond à la séquence de l'un des 100 ADNc issus d'une banque d'ARNm de cerveau humain identifiée par le Kazusa DNA Research Institute au Japon (Kikuno et al., DNA Resarch, 6, 197-205, 1999).
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une séquence d'au moins nucléotides consécutifs, de préférence 20, 25, 30, 50 ou 75 nucléotides consécutifs du fragment nt 714-809, extrémités incluses, de la séquence SEQ ID No. 2, de sa séquence complémentaire ou de la séquence de son ARN correspondant.
L'invention concerne de préférence un acide nucléique purifié ou isolé selon la présente invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe suivant :
- la séquence SEQ ID No. 1;
- la séquence SEQ ID No. 2, séquence de l'ADNc codant pour la spastin humaine ;
- les séquences SEQ ID No. 72 et SEQ ID No. 106, la séquence SEQ ID No. 72 représentant la séquence de l'ADNc incomplet codant pour la spastin murine représentée à la figure 5, ligne "Mouse" et la SEQ ID No. 106 sa séquence complète ;
- les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1, SEQ ID No. 2, SEQ ID No. 72 ou SEQ ID No. 106;
- leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une mutation correspondant à
un polymorphisme naturel chez l'Homme, notamment dont la position et la nature sont identifiées dans le tableau 5.
8 Les amorces ou sondes, caractérisées en ce qu'elles comprennent une séquence d'un acide nucléique selon l'invention, font également partie de l'invention.
La présente invention concerne ainsi l'ensemble des amorces qui peuvent être déduites des séquences nucléotidiques de l'invention et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques de l'invention, en particulier les séquences mutées, en utilisant notamment une méthode d'amplification telle que la méthode PCR, ou une méthode apparentée.
La présente invention concerne également l'ensemble des sondes qui peuvent être déduites des séquences nucléotidiques de l'invention, notamment des séquences capables de s'hybrider avec elles, et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques, en particulier de discriminer les séquences normales des séquences mutées.
La présente invention concerne en particulier les sondes ou amorces de séquences choisies parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce, pour la détection, l'identification, le dosage ou l'amplification de séquence d'acide nucléique.
Selon l'invention, les polynucléotides pouvant être utilisés comme sonde ou comme amorce dans des procédés de détection, d'identification, de dosage ou d'amplification de séquence nucléique, présenteront une taille minimale de 15 bases, de préférence de 20 bases, ou mieux de 25 à 30 bases.
L'ensemble des sondes et amorces selon l'invention pourront être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable.
Les séquences de polynucléotides selon l'invention non marquées peuvent être utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 3S, le 31-1 ou le 1251. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents
La présente invention concerne ainsi l'ensemble des amorces qui peuvent être déduites des séquences nucléotidiques de l'invention et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques de l'invention, en particulier les séquences mutées, en utilisant notamment une méthode d'amplification telle que la méthode PCR, ou une méthode apparentée.
La présente invention concerne également l'ensemble des sondes qui peuvent être déduites des séquences nucléotidiques de l'invention, notamment des séquences capables de s'hybrider avec elles, et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques, en particulier de discriminer les séquences normales des séquences mutées.
La présente invention concerne en particulier les sondes ou amorces de séquences choisies parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce, pour la détection, l'identification, le dosage ou l'amplification de séquence d'acide nucléique.
Selon l'invention, les polynucléotides pouvant être utilisés comme sonde ou comme amorce dans des procédés de détection, d'identification, de dosage ou d'amplification de séquence nucléique, présenteront une taille minimale de 15 bases, de préférence de 20 bases, ou mieux de 25 à 30 bases.
L'ensemble des sondes et amorces selon l'invention pourront être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable.
Les séquences de polynucléotides selon l'invention non marquées peuvent être utilisées directement comme sonde ou amorce.
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 3S, le 31-1 ou le 1251. Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents
9 luminescents tels que les agents radioluminescents, chémiluminescents, bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR
(réaction en chaîne à la polymérase) (Erlich, 1989; Innis et al., 1990, et Rolfs et al., 1991). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la technique décrite dans le brevet américain U.S. N 4,683,202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquencés. La spécificité de l'amplification peut être contrôlée en utilisant comme amorce les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés. Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entendra désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription reverse. Il existe actuellement de très nombreux procédés permettant cette 30. amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. en 1989, la technique 3SR (Self-Sustained Sequence Replication) décrite par Guatelli et al. en 1990, la technique NASBA (Nucleic Acid Sequ.ence Based Amplification) décrite par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable, la technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la technique CPR (Cycling Probe Reaction) décrite par Duck et al. en 1990, la technique 5 d'amplification à la Q-béta-réplicase décrite par Miele et al. en 1983 et perfectionnée notamment par Chu et al. en 1986 et Lizardi et al. en 1988, puis par Burg et al. ainsi que par Stone et al. en 1996.
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilisera avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR
(réaction en chaîne à la polymérase) (Erlich, 1989; Innis et al., 1990, et Rolfs et al., 1991). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la technique décrite dans le brevet américain U.S. N 4,683,202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquencés. La spécificité de l'amplification peut être contrôlée en utilisant comme amorce les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés. Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entendra désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription reverse. Il existe actuellement de très nombreux procédés permettant cette 30. amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al. en 1989, la technique 3SR (Self-Sustained Sequence Replication) décrite par Guatelli et al. en 1990, la technique NASBA (Nucleic Acid Sequ.ence Based Amplification) décrite par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable, la technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la technique CPR (Cycling Probe Reaction) décrite par Duck et al. en 1990, la technique 5 d'amplification à la Q-béta-réplicase décrite par Miele et al. en 1983 et perfectionnée notamment par Chu et al. en 1986 et Lizardi et al. en 1988, puis par Burg et al. ainsi que par Stone et al. en 1996.
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilisera avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à
10 l'aide des amorces selon l'invention ou à la mise en oeuvre d'un procédé
de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase reverse afin d'obtenir un ADNc à partir de l'ARNm contenu dans l'échantillon biologique.
L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention.
La technique d'hybridation de sondes peut être réalisée de manières diverses (Matthews et ai., 1988). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde.
Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par la méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).
Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sonde de capture. Dans ce cas, une sonde, dite sonde de capture , est immobilisée sur un support et sert à
capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite détecté grâce à une seconde sonde, dite sonde de détection , marquée par un élément facilement détectable.
Les séquences selon la présente invention de site accepteur ou donneur d'épissage identifiées au tableau 3 (séquences SEQ ID No. 74 à SEQ ID No. 105) font également partie de la présente invention.
Sous un autre aspect, l'invention comprend une méthode pour le criblage de banques d'ADNc ou d'ADN génomique, ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en oeuvre une séquence nucléique selon l'invention.
de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase reverse afin d'obtenir un ADNc à partir de l'ARNm contenu dans l'échantillon biologique.
L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention.
La technique d'hybridation de sondes peut être réalisée de manières diverses (Matthews et ai., 1988). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde.
Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par la méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).
Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sonde de capture. Dans ce cas, une sonde, dite sonde de capture , est immobilisée sur un support et sert à
capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite détecté grâce à une seconde sonde, dite sonde de détection , marquée par un élément facilement détectable.
Les séquences selon la présente invention de site accepteur ou donneur d'épissage identifiées au tableau 3 (séquences SEQ ID No. 74 à SEQ ID No. 105) font également partie de la présente invention.
Sous un autre aspect, l'invention comprend une méthode pour le criblage de banques d'ADNc ou d'ADN génomique, ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en oeuvre une séquence nucléique selon l'invention.
11 Parmi ces méthodes, on peut citer notamment :
- le criblage de banques d'ADNc et le clonage des ADNc isolés (Sambrook et al, 1989, Suggs et al., 1981 ; Woo et ai, 1979), à l'aide des séquences nucléiques selon l'invention ;
- le criblage de banques génomiques, par exemple de BACs (Chumakov et ai, 1992;
Chumakov et al., 1995) et éventuellement une analyse génétique en FISH (Cherif et al., 1990) à l'aide de séquences selon l'invention, permettant l'isolement et la localisation chromosomique, puis le séquençage complet du gène SPG4 codant pour la spastin.
En particulier, ces méthodes selon l'invention pourront être mises en oeuvre pour l'identification et ainsi l'obtention de la séquence génomique ou de l'ADNc du gène SPG4 chez d'autres mammifères, notamment la souris.
Ces méthodes de criblage et/ou de clonage comprendront en particulier une étape d'hybridation d'un acide nucléique selon l'invention avec un acide nucléique contenu dans une banque génomique ou d'ADNc.
L'invention comprend aussi une méthode d'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4 de séquence SEQ ID No. 1, caractérisée en ce qu'elle met en oeuvre un acide nucléique selon l'invention.
Les outils informatiques à la disposition de l'homme du métier lui permettent aisément d'identifier à partir des séquences nucléiques génomiques selon l'invention les boîtes régulatrices promotrices nécessaires et suffisantes au contrôle de l'expression génique, notamment les boîtes TATA, CCAAT, GC, ainsi que les séquences régulatrices stimulatrices ( enhancer ) ou inhibitrices ( silencers ) qui contrôlent en GIS l'expression des gènes selon l'invention ; parmi ces séquences régulatrices, il convient de citer l'IRE, MRE, CRE.
L'invention concerne également des méthodes pour l'identification de mutations portées par le gène SPG4 humain caractérisées en ce qu'elles mettent en oeuvre une séquence nucléique selon l'invention, notamment de mutations responsables de la paraplégie spastique familiale autosomique dominante.
Ces méthodes d'identification de ces mutations comprendront en particulier les étapes suivantes; (i) isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARNm de l'échantillon biologique ; (ii) amplification spécifique de l'ADN cible susceptible de présenter une mutation à l'aide d'amorces
- le criblage de banques d'ADNc et le clonage des ADNc isolés (Sambrook et al, 1989, Suggs et al., 1981 ; Woo et ai, 1979), à l'aide des séquences nucléiques selon l'invention ;
- le criblage de banques génomiques, par exemple de BACs (Chumakov et ai, 1992;
Chumakov et al., 1995) et éventuellement une analyse génétique en FISH (Cherif et al., 1990) à l'aide de séquences selon l'invention, permettant l'isolement et la localisation chromosomique, puis le séquençage complet du gène SPG4 codant pour la spastin.
En particulier, ces méthodes selon l'invention pourront être mises en oeuvre pour l'identification et ainsi l'obtention de la séquence génomique ou de l'ADNc du gène SPG4 chez d'autres mammifères, notamment la souris.
Ces méthodes de criblage et/ou de clonage comprendront en particulier une étape d'hybridation d'un acide nucléique selon l'invention avec un acide nucléique contenu dans une banque génomique ou d'ADNc.
L'invention comprend aussi une méthode d'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4 de séquence SEQ ID No. 1, caractérisée en ce qu'elle met en oeuvre un acide nucléique selon l'invention.
Les outils informatiques à la disposition de l'homme du métier lui permettent aisément d'identifier à partir des séquences nucléiques génomiques selon l'invention les boîtes régulatrices promotrices nécessaires et suffisantes au contrôle de l'expression génique, notamment les boîtes TATA, CCAAT, GC, ainsi que les séquences régulatrices stimulatrices ( enhancer ) ou inhibitrices ( silencers ) qui contrôlent en GIS l'expression des gènes selon l'invention ; parmi ces séquences régulatrices, il convient de citer l'IRE, MRE, CRE.
L'invention concerne également des méthodes pour l'identification de mutations portées par le gène SPG4 humain caractérisées en ce qu'elles mettent en oeuvre une séquence nucléique selon l'invention, notamment de mutations responsables de la paraplégie spastique familiale autosomique dominante.
Ces méthodes d'identification de ces mutations comprendront en particulier les étapes suivantes; (i) isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARNm de l'échantillon biologique ; (ii) amplification spécifique de l'ADN cible susceptible de présenter une mutation à l'aide d'amorces
12 selon l'invention ; (iii) analyse des produits d'amplification, notamment la taille et/ou la séquence des produits d'amplification, par rapport à une séquence de référence.
Par méthodes d'identification de mutation selon l'invention, on entend également désigner une méthode permettant d'obtenir l'acide nucléique sur lequel a été identifiée ladite mutation.
Font également partie de l'invention, les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention présentant des mutations susceptibles de modifier l'expression de la protéine correspondante.
Les acides nucléiques caractérisés en ce qu'ils sont susceptibles d'être obtenus par une des méthodes précédentes selon l'invention, ou les acides nucléiques capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 80 % entre une des deux séquences et la séquence complémentaire de l'autre) avec lesdits acides nucléiques, font partie de l'invention, notamment les acides nucléiques variants ou homologues, en particulier les séquences nucléiques de variants alléliques du gène SPG4 de séquence SEQ ID No. 1 ou de son ADNc de séquence SEQ ID
No. 2, ainsi que les séquences génomiques des gènes homologues d'autres mammifères tels que la souris.
Dans la présente description, on entendra désigner par "Spg4" le gène de souris homologue au gène humain SPG4.
L'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce pour le criblage de banque génomique ou d'ADNc fait bien entendu partie de l'objet de la présente invention.
Sous un autre aspect, l'invention comprend un polypeptide purifié ou isolé
codé
par un acide nucléique selon l'invention, de préférence à l'exception du peptide de 584 acides aminés dont la séquence est identifiée dans la banque de données GenBank sous le numéro d'accession A8029006.
Dans la présente description, on utilisera le terme polypeptide pour désigner également une protéine ou un peptide.
De préférence, la présente invention concerne un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la sécjuence SEQ ID No. 3, correspondant à la spastin humaine codée par la séquence SEQ ID No. 2 de l'ADNc du gène SPG4 humain ;
Par méthodes d'identification de mutation selon l'invention, on entend également désigner une méthode permettant d'obtenir l'acide nucléique sur lequel a été identifiée ladite mutation.
Font également partie de l'invention, les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention présentant des mutations susceptibles de modifier l'expression de la protéine correspondante.
Les acides nucléiques caractérisés en ce qu'ils sont susceptibles d'être obtenus par une des méthodes précédentes selon l'invention, ou les acides nucléiques capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 80 % entre une des deux séquences et la séquence complémentaire de l'autre) avec lesdits acides nucléiques, font partie de l'invention, notamment les acides nucléiques variants ou homologues, en particulier les séquences nucléiques de variants alléliques du gène SPG4 de séquence SEQ ID No. 1 ou de son ADNc de séquence SEQ ID
No. 2, ainsi que les séquences génomiques des gènes homologues d'autres mammifères tels que la souris.
Dans la présente description, on entendra désigner par "Spg4" le gène de souris homologue au gène humain SPG4.
L'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce pour le criblage de banque génomique ou d'ADNc fait bien entendu partie de l'objet de la présente invention.
Sous un autre aspect, l'invention comprend un polypeptide purifié ou isolé
codé
par un acide nucléique selon l'invention, de préférence à l'exception du peptide de 584 acides aminés dont la séquence est identifiée dans la banque de données GenBank sous le numéro d'accession A8029006.
Dans la présente description, on utilisera le terme polypeptide pour désigner également une protéine ou un peptide.
De préférence, la présente invention concerne un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la sécjuence SEQ ID No. 3, correspondant à la spastin humaine codée par la séquence SEQ ID No. 2 de l'ADNc du gène SPG4 humain ;
13 - la séquence SEQ ID No. 73, correspondant à un fragment de la spastin murine codée par la séquence SEQ ID No. 72 de l'ADNc incomplet du gène Spg4 de souris, la séquence SEQ ID No. 73 est représentée à la figure 4A, ligne "SPAST_MOUSE" ;
- la séquence SEQ ID No. 107, correspondant à la spastin murine codée par la séquence SEQ ID No. 106 de l'ADNc complet du gène Spg4 de souris ;
- les séquences de polypeptides homologues et variants du polypeptide de séquence SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107 ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 3, la .séquence SEQ ID No. 73, la séquence SEQ ID
No.
107 ou la séquence d'au moins 10 acides aminés consécutifs d'une de ces séquences ; et b) les séquences homologues ou variantes des séquences SEQ ID No. 3, SEQ ID
No.
73 ou SEQ ID No; 107.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend la séquence d'au moins 8, de préférence d'au moins 10, 15, 20 ou 30 acides aminés consécutifs de la séquence du fragment aa 197-228, extrémités incluses, de la séquence SEQ ID No. 3.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la séquence SEQ ID No. 3, la séquence SEQ ID No. 73 et la séquence SEQ ID
No.
107, lesquelles séquences portant au moins une des mutations correspondant à
un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
Il doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement. En effet, l'invention concerne les peptides obtenus par purification à partir de sources naturelles,
- la séquence SEQ ID No. 107, correspondant à la spastin murine codée par la séquence SEQ ID No. 106 de l'ADNc complet du gène Spg4 de souris ;
- les séquences de polypeptides homologues et variants du polypeptide de séquence SEQ ID No. 3, SEQ ID No. 73 ou SEQ ID No. 107 ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant :
a) la séquence SEQ ID No. 3, la .séquence SEQ ID No. 73, la séquence SEQ ID
No.
107 ou la séquence d'au moins 10 acides aminés consécutifs d'une de ces séquences ; et b) les séquences homologues ou variantes des séquences SEQ ID No. 3, SEQ ID
No.
73 ou SEQ ID No; 107.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend la séquence d'au moins 8, de préférence d'au moins 10, 15, 20 ou 30 acides aminés consécutifs de la séquence du fragment aa 197-228, extrémités incluses, de la séquence SEQ ID No. 3.
De manière également préférée, l'invention a pour objet un polypeptide selon l'invention, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
- la séquence SEQ ID No. 3, la séquence SEQ ID No. 73 et la séquence SEQ ID
No.
107, lesquelles séquences portant au moins une des mutations correspondant à
un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention ; et - les séquences de leurs fragments d'au moins 8, 10, 15, 30 ou 50 acides aminés consécutifs.
Il doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement. En effet, l'invention concerne les peptides obtenus par purification à partir de sources naturelles,
14 ou bien obtenus par recombinaison génétique, ou encore par synthèse chimique et pouvant alors comporter des amino-acides non naturels. La production d'un polypeptide recombinant, qui peut être réalisée en utilisant l'une des séquences nucléotidiques selon l'invention est particulièrement avantageuse car elle permet d'obtenir un niveau de pureté accrue du polypeptide désiré.
Par polypeptide homologue, on entendra désigner les polypeptides présentant certaines modifications par rapport au polypeptide de référence, comme en particulier une ou plusieurs délétions, troncations, un allongement, une fusion chimérique, et/ou une ou plusieurs substitutions, et dont la séquence d'acides aminés présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence d'acides aminés de référence.
Par polypeptide variant (ou variant protéique), on entendra désigner l'ensemble des polypeptides codés par les séquences nucléiques variantes telles que précedemment définies.
En particulier, les polypeptides variants comprendront tout polypeptide codé
par la séquence génomique mutée du gène SPG4 de séquence SEQ ID No. 1, et dont la séquence d'acides aminés présente au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidus d'acides aminés par rapport à la séquence SEQ ID No. 3. Dans le cas présent, les polypeptides variants présentant au moins une mutation seront liés aux pathologies de type PSF-AD.
On entendra également désigner par polypeptide variant tout polypeptide résultant de mutation d'un site d'épissage dans la séquence nucléique génomique SEQ ID No. 1.
L'invention comprend également les vecteurs de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'invention.
Les vecteurs selon l'invention, caractérisés en ce qu'ils comportent les éléments permettant l'expression et/ou la sécrétion desdites séquences dans une cellule hôte, ou encore une séquence d'adressage cellulaire, font également partie de l'invention.
Les vecteurs caractérisés en ce qu'ils comportent une séquence de promoteur et/ou de régulateur selon l'invention, font également partie de l'invention.
Lesdits vecteurs comporteront de préférence un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Ils doivent pouvoir être maintenus de façon stable dans la cellule et peuvent éventuellement posséder des signaux particuliers spécifiant la sécrétion de la protéine traduite.
Ces différents signaux de contrôle sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences d'acide nucléique selon l'invention peuvent être 5 insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi.
Parmi les systèmes à réplication autonome, on utilisera de préférence en fonction de la cellule hôte, des systèmes de type plasmidique ou viral, les vecteurs viraux pouvant notamment être des adénovirus (Perricaudet et al., 1992), des 10 rétrovirus, des lentivirus, des poxvirus ou des virus herpétiques (Epstein et al., 1992).
L'homme du métier connaît les technologies utilisables pour chacun de ces systèmes.
Lorsque l'on souhaitera l'intégration de la séquence dans les chromosomes de la cellule hôte, on pourra utiliser par exemple des systèmes de type plasmidique ou viral ; de tels virus seront, par exemple, les rétrovirus (Temin, 1986), ou les AAV
Par polypeptide homologue, on entendra désigner les polypeptides présentant certaines modifications par rapport au polypeptide de référence, comme en particulier une ou plusieurs délétions, troncations, un allongement, une fusion chimérique, et/ou une ou plusieurs substitutions, et dont la séquence d'acides aminés présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence d'acides aminés de référence.
Par polypeptide variant (ou variant protéique), on entendra désigner l'ensemble des polypeptides codés par les séquences nucléiques variantes telles que précedemment définies.
En particulier, les polypeptides variants comprendront tout polypeptide codé
par la séquence génomique mutée du gène SPG4 de séquence SEQ ID No. 1, et dont la séquence d'acides aminés présente au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidus d'acides aminés par rapport à la séquence SEQ ID No. 3. Dans le cas présent, les polypeptides variants présentant au moins une mutation seront liés aux pathologies de type PSF-AD.
On entendra également désigner par polypeptide variant tout polypeptide résultant de mutation d'un site d'épissage dans la séquence nucléique génomique SEQ ID No. 1.
L'invention comprend également les vecteurs de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'invention.
Les vecteurs selon l'invention, caractérisés en ce qu'ils comportent les éléments permettant l'expression et/ou la sécrétion desdites séquences dans une cellule hôte, ou encore une séquence d'adressage cellulaire, font également partie de l'invention.
Les vecteurs caractérisés en ce qu'ils comportent une séquence de promoteur et/ou de régulateur selon l'invention, font également partie de l'invention.
Lesdits vecteurs comporteront de préférence un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Ils doivent pouvoir être maintenus de façon stable dans la cellule et peuvent éventuellement posséder des signaux particuliers spécifiant la sécrétion de la protéine traduite.
Ces différents signaux de contrôle sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences d'acide nucléique selon l'invention peuvent être 5 insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi.
Parmi les systèmes à réplication autonome, on utilisera de préférence en fonction de la cellule hôte, des systèmes de type plasmidique ou viral, les vecteurs viraux pouvant notamment être des adénovirus (Perricaudet et al., 1992), des 10 rétrovirus, des lentivirus, des poxvirus ou des virus herpétiques (Epstein et al., 1992).
L'homme du métier connaît les technologies utilisables pour chacun de ces systèmes.
Lorsque l'on souhaitera l'intégration de la séquence dans les chromosomes de la cellule hôte, on pourra utiliser par exemple des systèmes de type plasmidique ou viral ; de tels virus seront, par exemple, les rétrovirus (Temin, 1986), ou les AAV
15 (Carter, 1993).
Parmi les vecteurs non viraux, on préfère les polynucléotides nus tels que l'ADN
nu ou l'ARN nu selon la technique développée par la société VICAL, les chromosomes artificiels de levure (YAC, yeast artificial chromosome) pour l'expression dans la levure, les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour l'expression dans les cellules murines et de manière préférée les chromosomes artificiels d'homme (HAC, human artificial chromosome) pour l'expression dans les cellules humaines.
De tels vecteurs seront préparés selon les méthodes couramment utilisées par = l'homme du métier, et les clones .en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple la lipofection, l'électroporation, le choc thermique.
L'invention comprend en outre les cellules hôtes, notamment les cellules eucaryotes et procaryotes, transformées par les vecteurs selon l'invention ainsi que les animaux transgéniques, excepté l'Homme, comprenant une desdites cellules transformées selon l'invention.
Parmi les cellules utilisables à ces fins, on peut citer bien entendu les cellules bactériennes (Olins et Lee, 1993), mais également les cellules de levure (Buckholz, 1993), de même que les cellules animales, en particulier les cultures de cellules de mammifères (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster chinois (CHO), mais également les cellules d'insectes dans lesquelles on peut utiliser
Parmi les vecteurs non viraux, on préfère les polynucléotides nus tels que l'ADN
nu ou l'ARN nu selon la technique développée par la société VICAL, les chromosomes artificiels de levure (YAC, yeast artificial chromosome) pour l'expression dans la levure, les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour l'expression dans les cellules murines et de manière préférée les chromosomes artificiels d'homme (HAC, human artificial chromosome) pour l'expression dans les cellules humaines.
De tels vecteurs seront préparés selon les méthodes couramment utilisées par = l'homme du métier, et les clones .en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple la lipofection, l'électroporation, le choc thermique.
L'invention comprend en outre les cellules hôtes, notamment les cellules eucaryotes et procaryotes, transformées par les vecteurs selon l'invention ainsi que les animaux transgéniques, excepté l'Homme, comprenant une desdites cellules transformées selon l'invention.
Parmi les cellules utilisables à ces fins, on peut citer bien entendu les cellules bactériennes (Olins et Lee, 1993), mais également les cellules de levure (Buckholz, 1993), de même que les cellules animales, en particulier les cultures de cellules de mammifères (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster chinois (CHO), mais également les cellules d'insectes dans lesquelles on peut utiliser
16 des procédés mettant en uvre des baculovirus par exemple (Luckow, 1993). Un hôte cellulaire préféré pour l'expression des protéines de l'invention est constitué par les cellules CHO.
Parmi les mammifères selon l'invention, on préférera des animaux tels que les souris, les rats ou les lapins, exprimant un polypeptide selon l'invention.
Parmi les mammifères selon l'invention, on préférera également ceux comprenant une cellule transformée caractérisée en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations correspondant à un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention.
Parmi les mammifères selon l'invention, on préférera également des animaux tels que les souris, les rats ou les lapins, caractérisés en ce que le gène codant pour la =
spastin selon l'invention, n'est pas fonctionnel ou est invalidé.
Parmi les modèles animaux plus particulièrement intéressants ici, on trouve notamment :
- les animaux transgéniques présentant au moins dans une de leurs deux séquences alléliques du gène SPG4, une au moins des mutations dont la position et la nature sont identifiées au tableau 5 ou identifiées par une méthode selon la présente invention. Ces animaux transgéniques sont obtenus par exemple par recombinaison homologue sur cellules souches embryonnaires, transfert de ces cellules souches à
des embryons, sélection des chimères affectées au niveau des lignées reproductrices, et croissance desdites chimères ;
- les animaux (de préférence souris) transgéniques surexprimant le gène SPG4 dans lequel pourra être introduite une desdites mutations selon l'invention. Les souris sont obtenues par exemple par transfection de copie de ce gène sous contrôle d'un promoteur fort de nature ubiquitaire, ou sélectif d'un type de tissu, ou après transcription virale ;
- les animaux (de préférence souris) transgéniques rendus déficients pour le gène SPG4 selon l'invention, par inactivation à l'aide du système LOXP/CRE
recombinase (Rohlmann et al., 1996) ou de tout autre système d'inactivation de l'expression de ce gène.
Les cellules et mammifères selon l'invention sont utilisables dans une méthode de production d'un polypeptide selon l'invention, comme décrit ci-dessous, et peuvent
Parmi les mammifères selon l'invention, on préférera des animaux tels que les souris, les rats ou les lapins, exprimant un polypeptide selon l'invention.
Parmi les mammifères selon l'invention, on préférera également ceux comprenant une cellule transformée caractérisée en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations correspondant à un polymorphisme naturel chez l'Homme, notamment celles dont la nature et la localisation sont identifiées au tableau 5 ci-après ou celles qui pourront être identifiées par les méthodes d'identification de mutation du gène SPG4 selon la présente invention.
Parmi les mammifères selon l'invention, on préférera également des animaux tels que les souris, les rats ou les lapins, caractérisés en ce que le gène codant pour la =
spastin selon l'invention, n'est pas fonctionnel ou est invalidé.
Parmi les modèles animaux plus particulièrement intéressants ici, on trouve notamment :
- les animaux transgéniques présentant au moins dans une de leurs deux séquences alléliques du gène SPG4, une au moins des mutations dont la position et la nature sont identifiées au tableau 5 ou identifiées par une méthode selon la présente invention. Ces animaux transgéniques sont obtenus par exemple par recombinaison homologue sur cellules souches embryonnaires, transfert de ces cellules souches à
des embryons, sélection des chimères affectées au niveau des lignées reproductrices, et croissance desdites chimères ;
- les animaux (de préférence souris) transgéniques surexprimant le gène SPG4 dans lequel pourra être introduite une desdites mutations selon l'invention. Les souris sont obtenues par exemple par transfection de copie de ce gène sous contrôle d'un promoteur fort de nature ubiquitaire, ou sélectif d'un type de tissu, ou après transcription virale ;
- les animaux (de préférence souris) transgéniques rendus déficients pour le gène SPG4 selon l'invention, par inactivation à l'aide du système LOXP/CRE
recombinase (Rohlmann et al., 1996) ou de tout autre système d'inactivation de l'expression de ce gène.
Les cellules et mammifères selon l'invention sont utilisables dans une méthode de production d'un polypeptide selon l'invention, comme décrit ci-dessous, et peuvent
17 également servir à titre de modèle d'analyse et pour le criblage de banque d'ADN
(génomique ou d'ADNc).
Les cellules ou mammifères transformés tels que décrits précédemment peuvent être ainsi utilisées à titre de modèles afin d'étudier les interactions entre les polypeptides selon l'invention, et les composés chimiques ou protéiques, impliqués directement ou indirectement dans les activités des polypeptides selon l'invention, ceci afin d'étudier les différents mécanismes et interactions mis en jeu.
Surtout, ils peuvent être utilisés pour la Sélection de produits interagissant avec les polypeptides selon l'invention, notamment la spastin humaine de séquence SEQ ID
No. 3 ou ses variants selon l'invention, à titre de cofacteur, ou d'inhibiteur, notamment compétitif, ou encore ayant une activité agoniste ou antagoniste de l'activité
des polypeptides selon l'invention. De préférence, on utilisera lesdites cellules transformées ou animaux transgéniques à titre de modèle permettant, notamment, la sélection de produits permettant de lutter contre la pathologie liée au gène mentionnée ci-dessus.
L'invention concerne également l'utilisation de cellule, de mammifère ou de polypeptide selon l'invention pour le criblage de composé chimique ou biochimique pouvant interagir directement ou indirectement avec les polypeptides selon l'invention, et/ou capable de moduler l'expression ou l'activité de ces polypeptides.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention pour la synthèse de polypeptides recombinants.
La méthode de production d'un polypeptide de l'invention sous forme recombinante est elle-même comprise dans la présente invention, et se caractérise en ce que l'on cultive les cellules transformées, notamment les cellules ou mammifères de la présente invention, dans des conditions permettant l'expression d'un polypeptide recombinant codé par une séquence d'acide nucléique selon l'invention, et que l'on récupère ledit polypeptide recombinant.
Les polypeptides recombinants, caractérisés en ce qu'ils sont susceptibles d'être obtenus par ladite méthode de production, font également partie de l'invention.
Les polypeptides recombinants obtenùs comme indiqué ci-dessus, peuvent aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent présenter ou non la structure tertiaire naturelle.
Ces polypeptides peuvent être produits à partir des séquences d'acide nucléique définies ci-dessus, selon les techniques de production de polypeptides recombinants connues de l'homme du métier. Dans ce cas, la séquence d'acide =
(génomique ou d'ADNc).
Les cellules ou mammifères transformés tels que décrits précédemment peuvent être ainsi utilisées à titre de modèles afin d'étudier les interactions entre les polypeptides selon l'invention, et les composés chimiques ou protéiques, impliqués directement ou indirectement dans les activités des polypeptides selon l'invention, ceci afin d'étudier les différents mécanismes et interactions mis en jeu.
Surtout, ils peuvent être utilisés pour la Sélection de produits interagissant avec les polypeptides selon l'invention, notamment la spastin humaine de séquence SEQ ID
No. 3 ou ses variants selon l'invention, à titre de cofacteur, ou d'inhibiteur, notamment compétitif, ou encore ayant une activité agoniste ou antagoniste de l'activité
des polypeptides selon l'invention. De préférence, on utilisera lesdites cellules transformées ou animaux transgéniques à titre de modèle permettant, notamment, la sélection de produits permettant de lutter contre la pathologie liée au gène mentionnée ci-dessus.
L'invention concerne également l'utilisation de cellule, de mammifère ou de polypeptide selon l'invention pour le criblage de composé chimique ou biochimique pouvant interagir directement ou indirectement avec les polypeptides selon l'invention, et/ou capable de moduler l'expression ou l'activité de ces polypeptides.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention pour la synthèse de polypeptides recombinants.
La méthode de production d'un polypeptide de l'invention sous forme recombinante est elle-même comprise dans la présente invention, et se caractérise en ce que l'on cultive les cellules transformées, notamment les cellules ou mammifères de la présente invention, dans des conditions permettant l'expression d'un polypeptide recombinant codé par une séquence d'acide nucléique selon l'invention, et que l'on récupère ledit polypeptide recombinant.
Les polypeptides recombinants, caractérisés en ce qu'ils sont susceptibles d'être obtenus par ladite méthode de production, font également partie de l'invention.
Les polypeptides recombinants obtenùs comme indiqué ci-dessus, peuvent aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent présenter ou non la structure tertiaire naturelle.
Ces polypeptides peuvent être produits à partir des séquences d'acide nucléique définies ci-dessus, selon les techniques de production de polypeptides recombinants connues de l'homme du métier. Dans ce cas, la séquence d'acide =
18 nucléique utilisée est placée sous le contrôle de signaux permettant son expression dans un hôte cellulaire.
Un système efficace de production d'un polypeptide recombinant nécessite de disposer d'un vecteur et d'une cellule hôte selon l'invention.
Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.
Les procédés de purification de polypeptide recombinant utilisés sont connus de l'homme du métier. Le polypeptide recombinant peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps monoclonaux ou polyclonaux spécifiques, etc..
= Les polypeptides selon la présente invention peuvent être obtenus par synthèse chimique et ce en utilisant l'une des nombreuses synthèses peptidiques connues, par exemple les techniques mettant en oeuvre des phases solides ou des techniques utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique.
La technique de synthèse en phase solide est bien connue de l'homme du métier. Voir notamment Stewart et al. (1984) et Bodansky (1984).
Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondants sont également compris dans l'invention.
Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'invention, font partie de l'invention.
Des anticorps polyclonaux spécifiques peuvent être obtenus à partir d'un sérum d'un animal immunisé contre les polypeptides selon l'invention, notamment produit par recombinaison génétique ou par synthèse peptidique, selon les modes opératoires usuels.
On notera notamment l'intérêt d'anticorps reconnaissant de façon spécifique certains polypeptides, variants, ou leurs fragments immunogènes, selon l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridomes décrite par Miller et Milstein, 1975.
Un système efficace de production d'un polypeptide recombinant nécessite de disposer d'un vecteur et d'une cellule hôte selon l'invention.
Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.
Les procédés de purification de polypeptide recombinant utilisés sont connus de l'homme du métier. Le polypeptide recombinant peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps monoclonaux ou polyclonaux spécifiques, etc..
= Les polypeptides selon la présente invention peuvent être obtenus par synthèse chimique et ce en utilisant l'une des nombreuses synthèses peptidiques connues, par exemple les techniques mettant en oeuvre des phases solides ou des techniques utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique.
La technique de synthèse en phase solide est bien connue de l'homme du métier. Voir notamment Stewart et al. (1984) et Bodansky (1984).
Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondants sont également compris dans l'invention.
Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'invention, font partie de l'invention.
Des anticorps polyclonaux spécifiques peuvent être obtenus à partir d'un sérum d'un animal immunisé contre les polypeptides selon l'invention, notamment produit par recombinaison génétique ou par synthèse peptidique, selon les modes opératoires usuels.
On notera notamment l'intérêt d'anticorps reconnaissant de façon spécifique certains polypeptides, variants, ou leurs fragments immunogènes, selon l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridomes décrite par Miller et Milstein, 1975.
19 Les anticorps selon l'invention sont, par exemple, des anticorps chimériques, des anticorps humanisés, des fragments Fab ou F(abl2 Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués afin d'obtenir un signal détectable et/ou quantifiable.
L'invention concerne également des méthodes pour la détection et/ou la purification d'un polypeptide selon l'invention, caractérisées en ce qu'elles mettent en oeuvre un anticorps selon l'invention.
L'invention comprend en outre des polypeptides purifiés, caractérisés en ce qu'ils sont obtenus par une méthode selon l'invention.
Par ailleurs, outre leur utilisation pour la purification des polypeptides, les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent également être utilisés pour la détection de ces polypeptides dans un échantillon biologique.
fis constituent ainsi un moyen d'analyse immunocytochimique ou immuno-histochimique de l'expression des polypeptides selon l'invention, notamment le polypeptide de séquence SEQ ID No. 3 ou l'un de ses variants, sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immuno-conjugués enzymatiques.
Ils pourront permettre notamment de mettre en évidence une expression anormale de ces polypeptides dans les tissus ou prélèvements biologiques, ce qui les rend utiles pour le suivi de l'évolution de la maladie et le diagnostic moléculaire.
Plus généralement, les anticorps de l'invention peuvent être avantageusement mis en oeuvre dans toute situation où l'expression d'un polypeptide selon l'invention, normal ou muté, doit être observée.
Font également partie de l'invention, les méthodes de détermination d'une variabilité alléfique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou de toute anomalie génétique du gène SPG4 selon l'invention, caractérisées en ce qu'elles mettent en oeuvre une séquence d'acide nucléique ou un anticorps selon l'invention.
La présente invention comprend ainsi une méthode de diagnostic génotypique de la pathologie associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention.
De préférence, l'invention concerne une méthode de diagnostic génotypique de la maladie associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisé en ce qu'il comporte les étapes suivantes :
a) le cas échéant, isolement de l'ADN génomique à partir de l'échantillon biologique à
analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ;
b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'invention ;
5 c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
L'invention comprend également une méthode de diagnostic de la maladie associée à une expression anormale d'un polypeptide codé par le gène SPG4, notamment le polypeptide de séquence SEQ ID No. 3, caractérisée en ce que l'on met 10 en contact un ou des anticorps selon l'invention avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
Ces méthodes visent par exemple les méthodes de diagnostic de la PSF-AD
15 associée à la présence de mutation dans le gène SPG4 selon l'invention, notamment anténatal, en déterminant à partir d'un prélèvement biologique du patient la présence de mutations dans au moins une des séquences décrites précédemment. Les séquences d'acides nucléiques analysées pourront aussi bien être de l'ADN
génomique, de l'ADNc, ou de l'ARNm.
L'invention concerne également des méthodes pour la détection et/ou la purification d'un polypeptide selon l'invention, caractérisées en ce qu'elles mettent en oeuvre un anticorps selon l'invention.
L'invention comprend en outre des polypeptides purifiés, caractérisés en ce qu'ils sont obtenus par une méthode selon l'invention.
Par ailleurs, outre leur utilisation pour la purification des polypeptides, les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent également être utilisés pour la détection de ces polypeptides dans un échantillon biologique.
fis constituent ainsi un moyen d'analyse immunocytochimique ou immuno-histochimique de l'expression des polypeptides selon l'invention, notamment le polypeptide de séquence SEQ ID No. 3 ou l'un de ses variants, sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immuno-conjugués enzymatiques.
Ils pourront permettre notamment de mettre en évidence une expression anormale de ces polypeptides dans les tissus ou prélèvements biologiques, ce qui les rend utiles pour le suivi de l'évolution de la maladie et le diagnostic moléculaire.
Plus généralement, les anticorps de l'invention peuvent être avantageusement mis en oeuvre dans toute situation où l'expression d'un polypeptide selon l'invention, normal ou muté, doit être observée.
Font également partie de l'invention, les méthodes de détermination d'une variabilité alléfique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou de toute anomalie génétique du gène SPG4 selon l'invention, caractérisées en ce qu'elles mettent en oeuvre une séquence d'acide nucléique ou un anticorps selon l'invention.
La présente invention comprend ainsi une méthode de diagnostic génotypique de la pathologie associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention.
De préférence, l'invention concerne une méthode de diagnostic génotypique de la maladie associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisé en ce qu'il comporte les étapes suivantes :
a) le cas échéant, isolement de l'ADN génomique à partir de l'échantillon biologique à
analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ;
b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'invention ;
5 c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
L'invention comprend également une méthode de diagnostic de la maladie associée à une expression anormale d'un polypeptide codé par le gène SPG4, notamment le polypeptide de séquence SEQ ID No. 3, caractérisée en ce que l'on met 10 en contact un ou des anticorps selon l'invention avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
Ces méthodes visent par exemple les méthodes de diagnostic de la PSF-AD
15 associée à la présence de mutation dans le gène SPG4 selon l'invention, notamment anténatal, en déterminant à partir d'un prélèvement biologique du patient la présence de mutations dans au moins une des séquences décrites précédemment. Les séquences d'acides nucléiques analysées pourront aussi bien être de l'ADN
génomique, de l'ADNc, ou de l'ARNm.
20 Des acides nucléiques ou anticorps basés sur la présente invention pourront -également être utilisés pour permettre un diagnostic positif chez un malade ou un diagnostic pré-symptomatique chez un sujet à risque, notamment avec antécédent familial.
Les méthodes permettant de mettre en évidence une mutation dans un gène par rapport au gène sauvage sont, bien entendu, très nombreuses. On peut essentiellement les diviser en deux grandes catégories. Le premier type de méthode est celui dans lequel la présence d'une mutation est détectée par comparaison de la séquence mutée avec la séquence correspondante sauvage, et le second type est celui dans lequel la présence de la mutation est détectée de façon indirecte, par exemple par évidence de mésappariements dus à la présence de la mutation.
Ces méthodes peuvent mettre en oeuvre les sondes et amorces de la présente invention décrites. Il s'agit généralement de séquences nucléiques d'hybridation purifiées comprenant au moins 15 nucléotides, de préférence 20,25 ou 30 nucléotides, caractérisées en ce qu'elles peuvent s'hybrider spécifiquement avec une séquence nucléique selon l'invention.
Les méthodes permettant de mettre en évidence une mutation dans un gène par rapport au gène sauvage sont, bien entendu, très nombreuses. On peut essentiellement les diviser en deux grandes catégories. Le premier type de méthode est celui dans lequel la présence d'une mutation est détectée par comparaison de la séquence mutée avec la séquence correspondante sauvage, et le second type est celui dans lequel la présence de la mutation est détectée de façon indirecte, par exemple par évidence de mésappariements dus à la présence de la mutation.
Ces méthodes peuvent mettre en oeuvre les sondes et amorces de la présente invention décrites. Il s'agit généralement de séquences nucléiques d'hybridation purifiées comprenant au moins 15 nucléotides, de préférence 20,25 ou 30 nucléotides, caractérisées en ce qu'elles peuvent s'hybrider spécifiquement avec une séquence nucléique selon l'invention.
21 De préférence, les conditions d'hybridation spécifiques sont telles que celles définies précédemment ou dans les exemples. La longueur de ces séquences nucléiques d'hybridation peut varier de 15, 20 ou 30 à 200 nucléotides, particulièrement de 20 à 50 nucléotides.
Parmi les méthodes de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou d'une anomalie génétique, on préfère les méthodes comprenant au moins une étape d'amplification dite par PCR (réaction en chaîne par la polymérase) ou par PCR-like de la séquence cible selon l'invention susceptible de présenter une anomalie à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Les produits amplifiés pourront être traités à l'aide d'enzyme de restriction appropriée avant de procéder à la détection ou au dosage du produit ciblé.
Les mutations du gène SPG4 selon l'invention, peuvent être responsables de différentes modifications de son produit de traduction, modifications utilisables pour une approche diagnostique. En effet, les modifications d'antigénicité liées à
ces mutations peuvent permettre la mise au point d'anticorps spécifiques. La discrimination du produit de gène muté peut être réalisée par ces méthodes. Toutes ces modifications peuvent être utilisées dans une approche diagnostique grâce à plusieurs méthodes bien connues basées sur l'utilisation d'anticorps mono- ou polyclonaux reconnaissant le polypeptide normal ou des variants mutés, comme par exemple par RIA ou par ELISA.
Ainsi, l'invention a également pour objet une trousse ou nécessaire pour le diagnostic, notamment pour le diagnostic de la PSF-AD associée à la présence de mutation dans le gène SPG4 selon l'invention, caractérisée en ce qu'elle comprend au moins un composé choisi parmi le groupe de composés suivant :
a) un acide nucléique, notamment comme amorce ou sonde, selon la présente invention ; et b) un anticorps selon l'invention.
Sous un autre aspect, l'invention comprend une méthode de sélection d'un composé chimique ou biochimique capable de prévenir et/ou de traiter la PSF-AD
associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention, un polypeptide selon l'invention, un vecteur selon l'invention, une cellule selon l'invention, un mammifère selon l'invention ou un anticorps selon l'invention.
Parmi les méthodes de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou d'une anomalie génétique, on préfère les méthodes comprenant au moins une étape d'amplification dite par PCR (réaction en chaîne par la polymérase) ou par PCR-like de la séquence cible selon l'invention susceptible de présenter une anomalie à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Les produits amplifiés pourront être traités à l'aide d'enzyme de restriction appropriée avant de procéder à la détection ou au dosage du produit ciblé.
Les mutations du gène SPG4 selon l'invention, peuvent être responsables de différentes modifications de son produit de traduction, modifications utilisables pour une approche diagnostique. En effet, les modifications d'antigénicité liées à
ces mutations peuvent permettre la mise au point d'anticorps spécifiques. La discrimination du produit de gène muté peut être réalisée par ces méthodes. Toutes ces modifications peuvent être utilisées dans une approche diagnostique grâce à plusieurs méthodes bien connues basées sur l'utilisation d'anticorps mono- ou polyclonaux reconnaissant le polypeptide normal ou des variants mutés, comme par exemple par RIA ou par ELISA.
Ainsi, l'invention a également pour objet une trousse ou nécessaire pour le diagnostic, notamment pour le diagnostic de la PSF-AD associée à la présence de mutation dans le gène SPG4 selon l'invention, caractérisée en ce qu'elle comprend au moins un composé choisi parmi le groupe de composés suivant :
a) un acide nucléique, notamment comme amorce ou sonde, selon la présente invention ; et b) un anticorps selon l'invention.
Sous un autre aspect, l'invention comprend une méthode de sélection d'un composé chimique ou biochimique capable de prévenir et/ou de traiter la PSF-AD
associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention, un polypeptide selon l'invention, un vecteur selon l'invention, une cellule selon l'invention, un mammifère selon l'invention ou un anticorps selon l'invention.
22 Sont également comprises dans l'invention, les méthodes de sélection de composés chimiques ou biochimiques capables d'interagir directement ou indirectement avec des polypeptides selon l'invention ou avec les acides nucléiques selon l'invention, et/ou permettant de moduler l'expression ou l'activité de ces polypeptides, caractérisées en ce qu'elles comprennent la mise en contact d'un polypeptide selon l'invention, d'une cellule transformée selon l'invention, ou d'un mammifère selon l'invention, avec un composé candidat et, la détection d'une modification de l'activité dudit polypeptide.
Par exemple, mais sans s'y limiter, on peut citer une méthode d'identification de molécules capables d'interagir avec un polypeptide selon l'invention en utilisant un système de double hybride bactérien ou levure tel que le Matchmaker Two Hybrid mc System 2, selon les instructions du manuel accompagnant le Matchmaker Two Hybrid System 2 (Catalogue N K1604-1, Clontech).
Les acides nucléiques codant pour des protéines interagissant avec les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention, peuvent être criblés et/ou sélectionnés en utilisant un système de simple hybride tel que celui décrit mc dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech (Catalog N K1603-).
Sous un autre aspect, l'invention comprend l'utilisation d'acide nucléique ou de polypeptide selon l'invention, d'un vecteur selon l'invention, d'une cellule selon l'invention, ou d'un mammifère selon l'invention, pour l'étude de l'expression ou de l'activité du gène SPG4.
D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples et les figures dont les légendes sont représentées ci-après.
LEGENDES DES FIGURES
FIGURES 1A, 1B et 1C : Carte physique de l'intervalle SPG4 et organisation génomique de SPG4.
FIGURE 1A : La région candidate de 1,5 Mb est délimitée par les marqueurs génétiques D2S352 et D2S2347 indiqués en caractères gras. La position des marqùeurs polymorphes et autres STSs est indiquée en caractères standards alors que la position des ESTs est indiquée en italique. Les clones de BAC
constituant la carte de préséquençage sont représentés par des rectangles dont le nom figure au-.
Par exemple, mais sans s'y limiter, on peut citer une méthode d'identification de molécules capables d'interagir avec un polypeptide selon l'invention en utilisant un système de double hybride bactérien ou levure tel que le Matchmaker Two Hybrid mc System 2, selon les instructions du manuel accompagnant le Matchmaker Two Hybrid System 2 (Catalogue N K1604-1, Clontech).
Les acides nucléiques codant pour des protéines interagissant avec les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention, peuvent être criblés et/ou sélectionnés en utilisant un système de simple hybride tel que celui décrit mc dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech (Catalog N K1603-).
Sous un autre aspect, l'invention comprend l'utilisation d'acide nucléique ou de polypeptide selon l'invention, d'un vecteur selon l'invention, d'une cellule selon l'invention, ou d'un mammifère selon l'invention, pour l'étude de l'expression ou de l'activité du gène SPG4.
D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples et les figures dont les légendes sont représentées ci-après.
LEGENDES DES FIGURES
FIGURES 1A, 1B et 1C : Carte physique de l'intervalle SPG4 et organisation génomique de SPG4.
FIGURE 1A : La région candidate de 1,5 Mb est délimitée par les marqueurs génétiques D2S352 et D2S2347 indiqués en caractères gras. La position des marqùeurs polymorphes et autres STSs est indiquée en caractères standards alors que la position des ESTs est indiquée en italique. Les clones de BAC
constituant la carte de préséquençage sont représentés par des rectangles dont le nom figure au-.
23 dessus et la taille précise du clone au-dessous si celle-ci a pu être déterminée. Le nom des BACs A, B, C, ... est suivi d'une parenthèse contenant le nom du clone précédé
d'un b si le clone est issu de la banque de BACs CITB_978_SKB ou d'un B
si celui-ci provient de la banque RPCI-11.
FIGURE 1B : Représentation schématique du gène SPG4 qui chevauche les BACs D (b336P14) et G (B563N4). Les exons sont figurés comme des rectangles noirs avec leur nom au-dessus.
FIGURE 1C : Les cinq mutations identifiées dans sept familles de PSF-AD liées au locus SPG4 sont positionnées dans les exons 7, 11, 13 et dans le site accepteur d'épissage de l'intron 15.
FIGURE 2 : Séquence nucléique et protéique de l'ADNc SPG4 et de la spastin.
Les 17 barres verticales avec un nombre situé au-dessous représentent les jonctions entre les différents exons. Le codon ATG initiateur est localisé en position nt 126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des mutations identifiées à ce jour, dont la perte de l'exon 16, sont indiquées en italique (nt 1210, nt 1468, nt 1520, nt 1620 et pour la perte de l'exoh 16: nt 1813-1853).
Le site de polyadénylation est en italique et souligné. Le signal de localisation nucléaire (NLS) putatif, RGKKK, ainsi que les trois domaines conservés prédits par l'analyse dans la base de données ProDom sont respectivement localisés aux positions aa7-11 (NLS), aa342-409 (domaine 92), aa411-509 (domaine 179) et aa512-599 (domaine 6226).
Les quatre motifs prédits par la comparaison de séquence dans la base de données Prosite sont : deux motifs leucine zippers aux positions aa50-78 et aa508-529, le site de fixation de l'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine de dimérisation helix-loop-helix aux positions aa478-486. Les motifs A et B de Walker, GPPGNGK-I" et IIFIDE , ainsi que le consensus minimal des MA sont soulignés.
FIGURES 3A et 3B Caractérisation d'une mutation d'un site d'épissage chez les individus atteints de trois familles de PSF-AD liée au locus SPG4.
FIGURE 3A: Amplification par PCR du fragment IV de l'ADNc SPG4 à partir d'ADNc de lymphoblastes : puits M, marqueur de taille VII (Boehringer) ; puits 1, membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ;
puits 3, membre non atteint de la famille 5330; puits 4, patient de la famille 5330 ;
puits 5, patient de la famille 5226 ; puits 6, témoin négatif (ADN génomique humain).
FIGURE 3B: Graphe de séquence de la mutation du site accepteur d'épissage de l'intron 15.
d'un b si le clone est issu de la banque de BACs CITB_978_SKB ou d'un B
si celui-ci provient de la banque RPCI-11.
FIGURE 1B : Représentation schématique du gène SPG4 qui chevauche les BACs D (b336P14) et G (B563N4). Les exons sont figurés comme des rectangles noirs avec leur nom au-dessus.
FIGURE 1C : Les cinq mutations identifiées dans sept familles de PSF-AD liées au locus SPG4 sont positionnées dans les exons 7, 11, 13 et dans le site accepteur d'épissage de l'intron 15.
FIGURE 2 : Séquence nucléique et protéique de l'ADNc SPG4 et de la spastin.
Les 17 barres verticales avec un nombre situé au-dessous représentent les jonctions entre les différents exons. Le codon ATG initiateur est localisé en position nt 126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des mutations identifiées à ce jour, dont la perte de l'exon 16, sont indiquées en italique (nt 1210, nt 1468, nt 1520, nt 1620 et pour la perte de l'exoh 16: nt 1813-1853).
Le site de polyadénylation est en italique et souligné. Le signal de localisation nucléaire (NLS) putatif, RGKKK, ainsi que les trois domaines conservés prédits par l'analyse dans la base de données ProDom sont respectivement localisés aux positions aa7-11 (NLS), aa342-409 (domaine 92), aa411-509 (domaine 179) et aa512-599 (domaine 6226).
Les quatre motifs prédits par la comparaison de séquence dans la base de données Prosite sont : deux motifs leucine zippers aux positions aa50-78 et aa508-529, le site de fixation de l'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine de dimérisation helix-loop-helix aux positions aa478-486. Les motifs A et B de Walker, GPPGNGK-I" et IIFIDE , ainsi que le consensus minimal des MA sont soulignés.
FIGURES 3A et 3B Caractérisation d'une mutation d'un site d'épissage chez les individus atteints de trois familles de PSF-AD liée au locus SPG4.
FIGURE 3A: Amplification par PCR du fragment IV de l'ADNc SPG4 à partir d'ADNc de lymphoblastes : puits M, marqueur de taille VII (Boehringer) ; puits 1, membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ;
puits 3, membre non atteint de la famille 5330; puits 4, patient de la famille 5330 ;
puits 5, patient de la famille 5226 ; puits 6, témoin négatif (ADN génomique humain).
FIGURE 3B: Graphe de séquence de la mutation du site accepteur d'épissage de l'intron 15.
24 Séquence génomique de l'individu contrôle en haut et d'un patient de la famille 2992 en bas. L'astérisque à la position nt 1813-4 indique un polymorphisme A->C qui touche un nucléotide non conservé du site accepteur d'épissage de l'intron 15 chez le patient.
FIGURES 4A et 4B: Les homologies de la spastin.
Les résidus identiques sont respectivement surlignés en grisé.
FIGURE 4A : Alignement multiple créé par CLUSTAL W 'de huit protéines issues de divers organismes et présentant une forte homologie de séquence avec les spastin humaine et murine (SEQ ID No. 73).
FIGURE 4B : Alignement par CLUSTAL W des métalloprotéases de levure AFG3, RCA1 et YME1, et des paraplegin et spastin humaines.
FIGURE 5 : Alignement par BLASTN des séquences nucléiques de l'ADNc SPG4 et de son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadénylation de l'ADNc murin est souligné et en italique. Le codon STOP est localisé en position nt dans l'ADNc murin et en position nt 1974-1976 dans l'ADNc humain.
FIGURES 6A, 68 et 6C : Analyse par PCR de l'expression de SPG4 et de son orthologue murin Spg4.
FIGURE 6A: Collection d'ADNc provenant de multiples tissus de souris.
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau ;
puits 3, rate ; puits 4, poumon ; puits 5, foie ; puits 6, muscle squelettique ; puits 7, rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7; puits 10, embryon de 11 jours El 1 ; puits 11, embryon de 15 jours El 5 ; puits 12, embryon de 17 jours El 7 ; puits 13, témoin négatif (ADN génomique de souris).
FIGURE 6B: Collection d'ADNc provenant de multiples tissus humains.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancréas puits 7, placenta ; puits 8, muscle squelettique ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).
FIGURE 6C : Collection d'ADNc provenant de multiples tissus de foetus humain.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique ; puits 7, rate ; puits 8, thymus ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).
EXEMPLES
Exemple 1: Matériels et méthodes 1) Sous-clonage et séquençage de la région candidate Douze BACs provenant de deux banques génomiques humaines, 5 CITB_978_SKB (commercialisées par Research Genetics) et RPCI-11 (Osoegawa et al., 1998), et recouvrant l'intervalle SPG4 ont été sélectionnés pour être séquences (Hazan et al., Genomics, 60 (3), 309-19, 1999). 40 pg de l'ADN de chaque BAC a été
digéré partiellement par l'enzyme de restriction CviJI (CHNERx) et séparé par électrophorèse sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les 10 tailles varient autour de 3, 5 et 10 kb ont été éluées avec la p-agarase (Biolabs) et liguées à un vecteur plasmide pBAM3 préalablement digéré par Smal et déphosphorylé dans un rapport de 1Xinsert pour 5Xvecteur. Des bactéries E. cou DH108 électrocompétentes (GIBCO-BRL) ont été transformées par électroporation avec les différentes ligations. Environ 1000 à 1500 sous-clones par BAC (8 à
15 génomes équivalents) composés de 20 % de clones avec inserts à 10 kb, 40 `)/0 de clones avec inserts à 5 kb et 40 A) de clones avec inserts à 3 kb ont été
isolés. Les extrémités des inserts de ces clones ont été séquencées sur un séquenceur mc automatique LICOR 4200. Pour chaque BAC, les séquences furent assemblées en un squelette constitué de plusieurs contigs à l'aide des logiciels Phred et Phrap. Les trous 20 entre chaque c,ontig furent séquenc,és avec des dideoxynucléotides marqués sur un mc séquenceur ABI 377 (PE-Applied Biosystems). Les exons contenus dans ces contigs de séquence ont été prédits par les programmes informatiques GRAIL II, GENSCAN, FGENEH et Genie. Les séquences furent également comparées dans les bases de données nucléiques et protéiques de l'EMBL et de GenBank avec les programmes
FIGURES 4A et 4B: Les homologies de la spastin.
Les résidus identiques sont respectivement surlignés en grisé.
FIGURE 4A : Alignement multiple créé par CLUSTAL W 'de huit protéines issues de divers organismes et présentant une forte homologie de séquence avec les spastin humaine et murine (SEQ ID No. 73).
FIGURE 4B : Alignement par CLUSTAL W des métalloprotéases de levure AFG3, RCA1 et YME1, et des paraplegin et spastin humaines.
FIGURE 5 : Alignement par BLASTN des séquences nucléiques de l'ADNc SPG4 et de son orthologue de souris Spg4 (SEQ ID No. 72). Le site de polyadénylation de l'ADNc murin est souligné et en italique. Le codon STOP est localisé en position nt dans l'ADNc murin et en position nt 1974-1976 dans l'ADNc humain.
FIGURES 6A, 68 et 6C : Analyse par PCR de l'expression de SPG4 et de son orthologue murin Spg4.
FIGURE 6A: Collection d'ADNc provenant de multiples tissus de souris.
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau ;
puits 3, rate ; puits 4, poumon ; puits 5, foie ; puits 6, muscle squelettique ; puits 7, rein ; puits 8, testicule ; puits 9, embryon de 7 jours E7; puits 10, embryon de 11 jours El 1 ; puits 11, embryon de 15 jours El 5 ; puits 12, embryon de 17 jours El 7 ; puits 13, témoin négatif (ADN génomique de souris).
FIGURE 6B: Collection d'ADNc provenant de multiples tissus humains.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, pancréas puits 7, placenta ; puits 8, muscle squelettique ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).
FIGURE 6C : Collection d'ADNc provenant de multiples tissus de foetus humain.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits 2, coeur ;
puits 3, rein ; puits 4, foie ; puits 5, poumon ; puits 6, muscle squelettique ; puits 7, rate ; puits 8, thymus ; puits 9, témoin négatif (ADN génomique humain) ;
puits 10, témoin négatif (pas d'ADN).
EXEMPLES
Exemple 1: Matériels et méthodes 1) Sous-clonage et séquençage de la région candidate Douze BACs provenant de deux banques génomiques humaines, 5 CITB_978_SKB (commercialisées par Research Genetics) et RPCI-11 (Osoegawa et al., 1998), et recouvrant l'intervalle SPG4 ont été sélectionnés pour être séquences (Hazan et al., Genomics, 60 (3), 309-19, 1999). 40 pg de l'ADN de chaque BAC a été
digéré partiellement par l'enzyme de restriction CviJI (CHNERx) et séparé par électrophorèse sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les 10 tailles varient autour de 3, 5 et 10 kb ont été éluées avec la p-agarase (Biolabs) et liguées à un vecteur plasmide pBAM3 préalablement digéré par Smal et déphosphorylé dans un rapport de 1Xinsert pour 5Xvecteur. Des bactéries E. cou DH108 électrocompétentes (GIBCO-BRL) ont été transformées par électroporation avec les différentes ligations. Environ 1000 à 1500 sous-clones par BAC (8 à
15 génomes équivalents) composés de 20 % de clones avec inserts à 10 kb, 40 `)/0 de clones avec inserts à 5 kb et 40 A) de clones avec inserts à 3 kb ont été
isolés. Les extrémités des inserts de ces clones ont été séquencées sur un séquenceur mc automatique LICOR 4200. Pour chaque BAC, les séquences furent assemblées en un squelette constitué de plusieurs contigs à l'aide des logiciels Phred et Phrap. Les trous 20 entre chaque c,ontig furent séquenc,és avec des dideoxynucléotides marqués sur un mc séquenceur ABI 377 (PE-Applied Biosystems). Les exons contenus dans ces contigs de séquence ont été prédits par les programmes informatiques GRAIL II, GENSCAN, FGENEH et Genie. Les séquences furent également comparées dans les bases de données nucléiques et protéiques de l'EMBL et de GenBank avec les programmes
25 BLASTN et BLASTX. La détermination des séquences promotrices fut réalisée par les programmes informatiques TSSG et TSSW. Les résultats de toutes ces analyses de séquences furent visualisés par le programme d'annotation de séquence Genotator.
2) Clonage de l'ADNc L'ADNc du gène SPG4 a été isolé par des expériences de RACE-PCR en 5' et 3' sur des ARN polyA+ de cerveau foetal, cerveau adulte et foie adulte à
l'aide du kit MC
d'amplification d'ADNc Marathon (Clontech), selon les instructions du fournisseur. Une première PCR, suivie d'une PCR interne furent effectuées avec différents couples d'amorces dont les séquences sont indiquées sur le tableau 1 d-après :
2) Clonage de l'ADNc L'ADNc du gène SPG4 a été isolé par des expériences de RACE-PCR en 5' et 3' sur des ARN polyA+ de cerveau foetal, cerveau adulte et foie adulte à
l'aide du kit MC
d'amplification d'ADNc Marathon (Clontech), selon les instructions du fournisseur. Une première PCR, suivie d'une PCR interne furent effectuées avec différents couples d'amorces dont les séquences sont indiquées sur le tableau 1 d-après :
26 Tableau *I
Amorces utilisées pour les RACE-PCR et les amplifications d'ADNc Amorce Séquence (5'-3') Position en 5 couple/ PCR Taille du produit SPA_5RACE5 CGGAGCTCCTCTTGGCTGCCATG (SEQ ID No.4) nt 405 SPA_5RACE6 AGAAGCGCTGGCAGAGCCACACGAAG (SEQ ID No.5) nt 372 SPA_5RACE7 AAGGCGACCAAACGCAGCAGCGCGAAG (SEQ ID No.6) nt 331 SPA_3RACE1 AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550 SPA_3RACE2 TGGTTATGGCCAAGGACCGCTTACAAC (SEQ ID No.8) nt 689 SPA_3RACE3 CAAACGGACGTCTATAATGACAGTAC (SEQ ID No.9) nt 747 SPA_3RACE4 TTAGGAATGTGGACAGCAACCTTGC (SEQ ID No.10) nt 1075 SPA_3RACE5 CTTCTCTGAGGCCTGAGTTG-ITCAC (SEQ ID No.11) nt 1207 SPA_3RACE6 TGCTAGAATGACTGATGGATACTCAGG (SEQ ID No.12) nt 1736 SPA_3RACE7 AGATGCAGCACTGGGTCCTATCCG (SEQ 1D Nol 3) nt 1787 SPA_3RACE8 ATGAACGTCATCGGCTACAGAAACAG (SEQ ID No.14) nt 2037 SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No.15) nt 45 b+m 655 pb SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) nt 700 SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No.17) nt 106 c+n 543 pb SPA Dn CTAGCTCTTTCACACTGTTC (SEQ ID No.18) nt 649 SPA Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) nt 487 d+n 746 pb SPA_Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) nt 1233 SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No,21) nt 532 SPA_An TGCCAAGTCTTGACCAGC (SEQ ID No.22) nt 1175 SPA Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) nt 1036 a+m 763 pb SPA_Bm CAGTGCTGCATCTTTTGCC (SEQ ID No.24) nt 1799 SPA_Bb TAGGAATGTGGACAGCAACC (SEQ ID No.25) nt 1076 SPA_Bn AAAGCTGTTAGGTCACTTCC (SEQ ID No.26) nt 1780 SPA_Ca TGGAGATGACAGAGTACTTG (SEQ ID No.27) nt 1550 a+m 766 pb SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) nt 2316 SPA_Cb ATGAGGCTGTTCTCAGGCG (SEQ ID No.29) nt 1603
Amorces utilisées pour les RACE-PCR et les amplifications d'ADNc Amorce Séquence (5'-3') Position en 5 couple/ PCR Taille du produit SPA_5RACE5 CGGAGCTCCTCTTGGCTGCCATG (SEQ ID No.4) nt 405 SPA_5RACE6 AGAAGCGCTGGCAGAGCCACACGAAG (SEQ ID No.5) nt 372 SPA_5RACE7 AAGGCGACCAAACGCAGCAGCGCGAAG (SEQ ID No.6) nt 331 SPA_3RACE1 AGGAGCAAGCTGTGGAATGGTATAAG (SEQ ID No.7) nt 550 SPA_3RACE2 TGGTTATGGCCAAGGACCGCTTACAAC (SEQ ID No.8) nt 689 SPA_3RACE3 CAAACGGACGTCTATAATGACAGTAC (SEQ ID No.9) nt 747 SPA_3RACE4 TTAGGAATGTGGACAGCAACCTTGC (SEQ ID No.10) nt 1075 SPA_3RACE5 CTTCTCTGAGGCCTGAGTTG-ITCAC (SEQ ID No.11) nt 1207 SPA_3RACE6 TGCTAGAATGACTGATGGATACTCAGG (SEQ ID No.12) nt 1736 SPA_3RACE7 AGATGCAGCACTGGGTCCTATCCG (SEQ 1D Nol 3) nt 1787 SPA_3RACE8 ATGAACGTCATCGGCTACAGAAACAG (SEQ ID No.14) nt 2037 SPA_Db TAGCAGTGGCTGCCGCCGT (SEQ ID No.15) nt 45 b+m 655 pb SPA_Dm AAGCGGTCCTTGGCCATAAC (SEQ ID No.16) nt 700 SPA_Dc GGCGGCAGTGAGAGCTGTG (SEQ ID No.17) nt 106 c+n 543 pb SPA Dn CTAGCTCTTTCACACTGTTC (SEQ ID No.18) nt 649 SPA Ad AACAGGCCTTCGAGTACATC (SEQ ID No.19) nt 487 d+n 746 pb SPA_Am CTGTGAACAACTCAGGCCTC (SEQ ID No.20) nt 1233 SPA_Ac ATGAGAAAGCAGGACAGAAG (SEQ ID No,21) nt 532 SPA_An TGCCAAGTCTTGACCAGC (SEQ ID No.22) nt 1175 SPA Ba CTACAACTGCTACTCGTAAG (SEQ ID No.23) nt 1036 a+m 763 pb SPA_Bm CAGTGCTGCATCTTTTGCC (SEQ ID No.24) nt 1799 SPA_Bb TAGGAATGTGGACAGCAACC (SEQ ID No.25) nt 1076 SPA_Bn AAAGCTGTTAGGTCACTTCC (SEQ ID No.26) nt 1780 SPA_Ca TGGAGATGACAGAGTACTTG (SEQ ID No.27) nt 1550 a+m 766 pb SPA_Cm CTGGAATACTTTCATCTGC (SEQ ID No.28) nt 2316 SPA_Cb ATGAGGCTGTTCTCAGGCG (SEQ ID No.29) nt 1603
27 MC
Les produits de RACE-PCR ont été clonés avec le kit TA-cloning (lnvitrogen) et les clones correspondants ont été séquences sur un ABI 377 (PE-Applied Biosystems).
La séquence du transcrit SPG4 a été vérifiée par le séquençage de produits de PCR .
amplifiés à partir d'une population d'ADNc provenant des lymphoblastes de 6 individus sains.
3) Détection des mutations Les ARNs totaux ont été extraits de lignées de lymphoblastes d'un individu mc atteint par famille étudiée et de 6 individus témoins à l'aide du kit RNA
PLUSR
(bioprobe System). La synthèse de l'ADNc a été réalisée sur 500 ng à 1 I.Jg d'ARN
avec 100 pmoles d'amorces hexamères aléatoires (Pharmacia) et 200 unités de mc reverse transcriptase Superscript Il (Gibco BRL) dans des conditions standards.
Quatre amplifications par PCR, générant des fragments chevauchants qui recouvrent la totalité de la phase ouverte de lecture de SPG4, ont été réalisées sur les ADNc des patients et contrôles. Le fragment I fut amplifié avec les amorces SPA_Db/SPA_Dm, puis en PCR interne avec les amorces SPA_Dc/SPA_Dn. Les fragments II, III, et IV ont été respectivement amplifiés avec les amorces SPA_Ad/SPA_Am, SPA_Ba/SPA_Bm et SPA_Ca/SPA_Cm (cf. les séquences de ces amorces sur le tableau 1). Chaque amplification a été effectuée dans un volume total de 50 pl contenant 4 pl d'ADNc (-1f7 ème de la prép.), 20 pmoles de chaque amorce, 200 pM de dNTPs, 50 mM de MC
KC1, 10 mM de Tris pH9, 1,5 mM MgC12, 0,1 % de triton X-100, 0,01 ch de gélatine et 2,5 unités de Taq polymérase (Cetus-PE). Les réactions de PCR ont été
réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 92 C après une première étape de dénaturation de 5 min à 94 C. Les échantillons sônt.par la suite soumis à 35 cycles de dénaturation (94 C pendant 40 sec), d'hybridation (55 C
pendant 50 sec, à l'exception du fragment I : 58 C pendant 50 sec) et d'élongation (72 C pendant 1 min), suivis d'une dernière étape d'élongation (5 min à 72 C).
Les produits de PCR sont séquencés sur un séquenceur automatique ABI 377 (PE-Applied Biosystems) avec les amorces SPA_Dc/SPA_Da, SPA_Ac/SPA_An, SPA_Bb/SPA_Bn et SPA_Cb/SPA_Cm pour les fragments I, Il, III et IV respectivement.
Les mutations furent également recherchées ou confirmées par séquençage des 17 exons prédits du gène SPG4 chez les patients et contrôles. Chaque exon fut amplifié avec le couple correspondant d'amorces a+m (cf. tableau 2 ci-après), à
l'exception de l'exon 1 (gSPAex1c/gSPAex1m), et des exons 10, 11 et 12 qui furent co-amplifiés avec les couples d'amorces gSPAex10a/gSPAex12m et gSPAex11a/gSPAex12m.
Les produits de RACE-PCR ont été clonés avec le kit TA-cloning (lnvitrogen) et les clones correspondants ont été séquences sur un ABI 377 (PE-Applied Biosystems).
La séquence du transcrit SPG4 a été vérifiée par le séquençage de produits de PCR .
amplifiés à partir d'une population d'ADNc provenant des lymphoblastes de 6 individus sains.
3) Détection des mutations Les ARNs totaux ont été extraits de lignées de lymphoblastes d'un individu mc atteint par famille étudiée et de 6 individus témoins à l'aide du kit RNA
PLUSR
(bioprobe System). La synthèse de l'ADNc a été réalisée sur 500 ng à 1 I.Jg d'ARN
avec 100 pmoles d'amorces hexamères aléatoires (Pharmacia) et 200 unités de mc reverse transcriptase Superscript Il (Gibco BRL) dans des conditions standards.
Quatre amplifications par PCR, générant des fragments chevauchants qui recouvrent la totalité de la phase ouverte de lecture de SPG4, ont été réalisées sur les ADNc des patients et contrôles. Le fragment I fut amplifié avec les amorces SPA_Db/SPA_Dm, puis en PCR interne avec les amorces SPA_Dc/SPA_Dn. Les fragments II, III, et IV ont été respectivement amplifiés avec les amorces SPA_Ad/SPA_Am, SPA_Ba/SPA_Bm et SPA_Ca/SPA_Cm (cf. les séquences de ces amorces sur le tableau 1). Chaque amplification a été effectuée dans un volume total de 50 pl contenant 4 pl d'ADNc (-1f7 ème de la prép.), 20 pmoles de chaque amorce, 200 pM de dNTPs, 50 mM de MC
KC1, 10 mM de Tris pH9, 1,5 mM MgC12, 0,1 % de triton X-100, 0,01 ch de gélatine et 2,5 unités de Taq polymérase (Cetus-PE). Les réactions de PCR ont été
réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 92 C après une première étape de dénaturation de 5 min à 94 C. Les échantillons sônt.par la suite soumis à 35 cycles de dénaturation (94 C pendant 40 sec), d'hybridation (55 C
pendant 50 sec, à l'exception du fragment I : 58 C pendant 50 sec) et d'élongation (72 C pendant 1 min), suivis d'une dernière étape d'élongation (5 min à 72 C).
Les produits de PCR sont séquencés sur un séquenceur automatique ABI 377 (PE-Applied Biosystems) avec les amorces SPA_Dc/SPA_Da, SPA_Ac/SPA_An, SPA_Bb/SPA_Bn et SPA_Cb/SPA_Cm pour les fragments I, Il, III et IV respectivement.
Les mutations furent également recherchées ou confirmées par séquençage des 17 exons prédits du gène SPG4 chez les patients et contrôles. Chaque exon fut amplifié avec le couple correspondant d'amorces a+m (cf. tableau 2 ci-après), à
l'exception de l'exon 1 (gSPAex1c/gSPAex1m), et des exons 10, 11 et 12 qui furent co-amplifiés avec les couples d'amorces gSPAex10a/gSPAex12m et gSPAex11a/gSPAex12m.
28 Tableau 2 Amorces de PCR pour l'amplification et le séquençage des exons Exon Taille du produit Programme de PCR Amorce Séquence (5'-3') (SEQ id Nos. ; 30 à 71) 1 1048 pb 0 gSPAex1c GTGAGCCGAACTGCACATTG
gSPAex1m CAAAGTCGACAGCTACAGTGC
gSPAex1d GGAACTGTAGTTGAGTGGGA
gSPAex1n AGATGAGGCTCCGACCTAC
2 624 pb 3 gSPAex2a AATGCCACACTTGTAATCTC
gSPAex2m TGTGAATATATCATAATTTGGG
gSPAex2b TACAGCAGTTCTCATGATG
3 812 pb 1 gSPAex3a GACCAAATTGGTGCATGCATG
gSPAex3m ACATTTCCAATACATCCCAC
4 379 pb 3 gSPAex4a ATTTGTCATTTCACATGCAC
gSPAex4m TTAGAATGACTATACCTGAC
gSPAex4n TCAGGTTAAGTAAGACTC
830 pb 4 gSPAex5a TTCCTATCTACCTAGTGAC
gSPAex5m TTTTATAGCAAGTTGCCCTG
gSPAex5b CCTATGAAGATCCTGGTAC
6 484 pb 3 gSPAex6a TGTCATGATTCTAACAAGGG
gSPAex6m TCTATTTCACTCCTGACATG
7 420 pb 2 gSPAex7a GTCATAGGGCTTAGGCTTC
gSPAex7m ATCATACTACCCACTTTTCC
8 647 pb 3 gSPAex8a TGTTTGGGAAGATGCTACTG
gSPAex8m CTACTGAAGATAACGTACATG
9 1268 pb 1 gSPAex9a CATTGATTGCCATGTATTGG
gSPAex9m AGAAGGCCAGAAATACTCAG
gSPAex9b GTACTTAAATCGGTAAATATGG
101 1061 pb 4 gSPAexl0a CTCAAGTCTTAGGAATGCAG
111 gSPAex10b GCACTTAACCAGGCTGTATG
12] 551 pb 3 gSPAex11a CTCAGATGACTCACATAGC
gSPAex12m CTTTACTAGACTAATTCTCCTG
gSPAex1m CAAAGTCGACAGCTACAGTGC
gSPAex1d GGAACTGTAGTTGAGTGGGA
gSPAex1n AGATGAGGCTCCGACCTAC
2 624 pb 3 gSPAex2a AATGCCACACTTGTAATCTC
gSPAex2m TGTGAATATATCATAATTTGGG
gSPAex2b TACAGCAGTTCTCATGATG
3 812 pb 1 gSPAex3a GACCAAATTGGTGCATGCATG
gSPAex3m ACATTTCCAATACATCCCAC
4 379 pb 3 gSPAex4a ATTTGTCATTTCACATGCAC
gSPAex4m TTAGAATGACTATACCTGAC
gSPAex4n TCAGGTTAAGTAAGACTC
830 pb 4 gSPAex5a TTCCTATCTACCTAGTGAC
gSPAex5m TTTTATAGCAAGTTGCCCTG
gSPAex5b CCTATGAAGATCCTGGTAC
6 484 pb 3 gSPAex6a TGTCATGATTCTAACAAGGG
gSPAex6m TCTATTTCACTCCTGACATG
7 420 pb 2 gSPAex7a GTCATAGGGCTTAGGCTTC
gSPAex7m ATCATACTACCCACTTTTCC
8 647 pb 3 gSPAex8a TGTTTGGGAAGATGCTACTG
gSPAex8m CTACTGAAGATAACGTACATG
9 1268 pb 1 gSPAex9a CATTGATTGCCATGTATTGG
gSPAex9m AGAAGGCCAGAAATACTCAG
gSPAex9b GTACTTAAATCGGTAAATATGG
101 1061 pb 4 gSPAexl0a CTCAAGTCTTAGGAATGCAG
111 gSPAex10b GCACTTAACCAGGCTGTATG
12] 551 pb 3 gSPAex11a CTCAGATGACTCACATAGC
gSPAex12m CTTTACTAGACTAATTCTCCTG
29 13 1361 pb 4 gSPAexl 3a CAGATTCAAGAAGACAGATC
gSPAexl 3m GCAATAATTCACCACACTTG
gSPAexl 3n GGTAGTTCTTGTTTCTGCTC
14 985 pb 4 gSPAex14a CAAGTGTGGTGAATTATTGC
gSPAexl 4m GAGCTGAAAAGTATTCAGC
gSPAex14n TGCAAAGGACATAGCCAGTG
15 1076 pb 1 gSPAex15a AGCCTCTGGAGATAGTATGC
gSPAexl 5m CTAGAACAGGGGTCACAGTC
gSPAexl 5n TTGGACTTCTTAAACTTC
16 1404 pb 4 g SPAex16a G CAGTATG CAAGAAATTGAAC
gSPAexl6m GGCCTGTAATTTTCTTCTG
gSPAex16b GTACTGAATAGATACATGTAG
17 445 pb 3 gSPAex17a GTGTAGCAGATCAACATAG
gSPAexl 7m CATCITCAAGTTTGGTGCAC
mc Hormis l'exon 1, amplifié à l'aide du kit Advantage GC genomic PCR kit . (Clontech) selon les instructions du fournisseur, quatre programmes de PCR
légèrement différents (1, 2, 3 et 4) furent utilisés pour amplifier les exons de SPG4 (voir tableau 2). Les amplifications furent toutes effectuées dans un volume de 50 pl contenant 100 ng d'ADN génomique, 50 pmoles de chaque amorce, 250 pM de dNTPs, 1X de tampon Takara et 1 unité de Taq polymérase Takara La Taq (Shuzo Co.). Les réactions de PCR ont été réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 94 C après une première étape de dénaturation de 5 min à
96 C. Les échantillons sont par la suite soumis à 30 cycles de dénaturation (94 C
pendant 40 sec), d'hybridation (prog. 1: 60 C pendant 50 sec; prog. 2, 58 C
pendant 50 sec, prog. 3 et 4 : 55 C pendant 50 sec) et d'élongation (prog. 1 et 4: 72 C pendant 1 min, prog. 2 et 3 : 72 C pendant 40 sec), suivis d'une dernière étape d'élongation (10 min à 72 C). Le séquençage de ces produits de PCR a été réalisé sur un séquenceur ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les amorces internes notées b et n (voir tableau 2).
4) Caractérisation de SPG4 Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux correspondent à l'orthologue murin de SPG4, ont été isolés par le consortium IMAGE
et séquencés au laboratoire sur un séquenceur ABI 377 (PE-Applied Biosystems).
Afin d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les collections d'ADNc de différents tissus humains foetaux et adultes, ainsi que de tissus 5 de souris (panels MTC, Clontech) ont été testées par PCR selon le protocole du fournisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le couple SPA_Ca /spam (spam : 5'-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de souris. Les conditions de PCR sont celles utilisées pour l'amplification de SPG4 à partir d'ADNc de lignées de lymphoblastes (cf. Détection des mutations), excepté
que les 10 échantillons ont été soumis à 32 cycles pour les ADNc issus de tissus adultes humains et de tissus murins, et à 28 cycles pour les ADNc issus de tissus foetaux. Les produits d'amplification ont migré par électrophorèse sur des gels d'agarose 2 %.
5) Analyse histologique d'une biopsie musculaire d'un patient Les analyses histologiques et histo-enzymatiques ont été réalisées à partir 15 d'une biopsie musculaire d'un patient issu d'une famille liée au locus SPG4 selon les techniques standards décrites dans Casari et ai, 1998.
6) Numéros d'accession dans les bases de données publiques L'ADNc SPG4 (ou SPAST) et la séquence protéique déduite, GenBank/EMBL
AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gène 20 SPG4 (ou SPAST), GenBank/EMBL AJ246003.
Exemple 2 : Analyse de la séquence de l'intervalle SPG4 L'analyse des évènements de recombinaison a permis de réduire la région candidate SPG4 à un intervalle génétique de 0 cM entre les marqueurs D2S352 et D2S2347 (19, 20). Une carte de préséquençage de l'intervalle SPG4 composée de 25 BACs a été construite (Hazan et al., sous presse dans Genomics) ; la région candidate couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, s'étendant sur l'intervalle SPG4 à l'exception d'un unique trou de 4 kb entre les clones A et E, ont été sélectionnés pour être séquencés (Fig. 1A). Sept de ces BACs (A, B, C, D, E, F et G), couvrant approximativement 70 % de la région d'intérêt, ont déjà été
gSPAexl 3m GCAATAATTCACCACACTTG
gSPAexl 3n GGTAGTTCTTGTTTCTGCTC
14 985 pb 4 gSPAex14a CAAGTGTGGTGAATTATTGC
gSPAexl 4m GAGCTGAAAAGTATTCAGC
gSPAex14n TGCAAAGGACATAGCCAGTG
15 1076 pb 1 gSPAex15a AGCCTCTGGAGATAGTATGC
gSPAexl 5m CTAGAACAGGGGTCACAGTC
gSPAexl 5n TTGGACTTCTTAAACTTC
16 1404 pb 4 g SPAex16a G CAGTATG CAAGAAATTGAAC
gSPAexl6m GGCCTGTAATTTTCTTCTG
gSPAex16b GTACTGAATAGATACATGTAG
17 445 pb 3 gSPAex17a GTGTAGCAGATCAACATAG
gSPAexl 7m CATCITCAAGTTTGGTGCAC
mc Hormis l'exon 1, amplifié à l'aide du kit Advantage GC genomic PCR kit . (Clontech) selon les instructions du fournisseur, quatre programmes de PCR
légèrement différents (1, 2, 3 et 4) furent utilisés pour amplifier les exons de SPG4 (voir tableau 2). Les amplifications furent toutes effectuées dans un volume de 50 pl contenant 100 ng d'ADN génomique, 50 pmoles de chaque amorce, 250 pM de dNTPs, 1X de tampon Takara et 1 unité de Taq polymérase Takara La Taq (Shuzo Co.). Les réactions de PCR ont été réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 94 C après une première étape de dénaturation de 5 min à
96 C. Les échantillons sont par la suite soumis à 30 cycles de dénaturation (94 C
pendant 40 sec), d'hybridation (prog. 1: 60 C pendant 50 sec; prog. 2, 58 C
pendant 50 sec, prog. 3 et 4 : 55 C pendant 50 sec) et d'élongation (prog. 1 et 4: 72 C pendant 1 min, prog. 2 et 3 : 72 C pendant 40 sec), suivis d'une dernière étape d'élongation (10 min à 72 C). Le séquençage de ces produits de PCR a été réalisé sur un séquenceur ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les amorces internes notées b et n (voir tableau 2).
4) Caractérisation de SPG4 Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux correspondent à l'orthologue murin de SPG4, ont été isolés par le consortium IMAGE
et séquencés au laboratoire sur un séquenceur ABI 377 (PE-Applied Biosystems).
Afin d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les collections d'ADNc de différents tissus humains foetaux et adultes, ainsi que de tissus 5 de souris (panels MTC, Clontech) ont été testées par PCR selon le protocole du fournisseur avec le couple d'amorces SPA_Ca/SPA_Cm pour les ADNc humains et le couple SPA_Ca /spam (spam : 5'-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de souris. Les conditions de PCR sont celles utilisées pour l'amplification de SPG4 à partir d'ADNc de lignées de lymphoblastes (cf. Détection des mutations), excepté
que les 10 échantillons ont été soumis à 32 cycles pour les ADNc issus de tissus adultes humains et de tissus murins, et à 28 cycles pour les ADNc issus de tissus foetaux. Les produits d'amplification ont migré par électrophorèse sur des gels d'agarose 2 %.
5) Analyse histologique d'une biopsie musculaire d'un patient Les analyses histologiques et histo-enzymatiques ont été réalisées à partir 15 d'une biopsie musculaire d'un patient issu d'une famille liée au locus SPG4 selon les techniques standards décrites dans Casari et ai, 1998.
6) Numéros d'accession dans les bases de données publiques L'ADNc SPG4 (ou SPAST) et la séquence protéique déduite, GenBank/EMBL
AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gène 20 SPG4 (ou SPAST), GenBank/EMBL AJ246003.
Exemple 2 : Analyse de la séquence de l'intervalle SPG4 L'analyse des évènements de recombinaison a permis de réduire la région candidate SPG4 à un intervalle génétique de 0 cM entre les marqueurs D2S352 et D2S2347 (19, 20). Une carte de préséquençage de l'intervalle SPG4 composée de 25 BACs a été construite (Hazan et al., sous presse dans Genomics) ; la région candidate couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, s'étendant sur l'intervalle SPG4 à l'exception d'un unique trou de 4 kb entre les clones A et E, ont été sélectionnés pour être séquencés (Fig. 1A). Sept de ces BACs (A, B, C, D, E, F et G), couvrant approximativement 70 % de la région d'intérêt, ont déjà été
30 séquencés. Les séquences de ces 7 BACs ont été comparées à celles des bases de données nucléiques et protéiques, et analysées avec quatre programmes de prédiction d'exons. Ces analyses de séquences préliminaires ont permis de mettre en évidence 14 unités de transcription potentielles, dont trois correspondant aux gènes codant pour la xanthine deshydrogénase, la stéroïde 5a-réductase 2 et une protéine liant le TGFp.
Sur les 14 gènes détectés par l'analyse de séquence, 9 avaient été
préalablement
Sur les 14 gènes détectés par l'analyse de séquence, 9 avaient été
préalablement
31 identifiés dans les bases de données d'EST (pour Expressed Sequence Tag ) et localisés au sein de l'intervalle SPG4 (Hazan et al., sous presse dans Genomics) ; les gènes restants n'ont pu être identifiés qu'en séquenç,ant la région candidate.
L'un de ces 5 nouveaux gènes présentait une homologie en 3' de sa région codante avec les 5 gènes codant pour la famille protéique des MA (Confalonieri et al., 1995). Des analyses de séquence plus approfondies ont montré que ce gène, nommé SPG4 (ou SPAST), était composé de 17 exons et s'étendait sur une région d'environ 90 kb, couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1B). Les trois premiers exons prédits de ce gène furent identifiés dans le BAC D par deux des quatre programmes de prédiction d'exons utilisés, GRAIL II et GENSCAN ; ils présentent une forte homologie avec un EST de blastocyste de souris, AA560327. Les 14 derniers exons se trouvent dans le BAC G. La séquence protéique déduite des exons 7 à
17 est significativement homologue à une sous-classe de la famille des AAA, comportant les protéines de levure Yta6p (Schnall et al., 1994), TBP6 (Schnall et al., 1994) et End 13, ainsi que la protéine de souris SKD1 (Perier et al., 1994).
Sur les quatre programmes de prédiction d'exons, FGENEH semble le plus fiable et le plus puissant, permettant la détection de la plupart des gènes de cette région chromosomique en 2p21-p22. Cette constatation s'applique également au gène SPG4 pour lequel 15 exons ont pu être mis en évidence par ce programme quand seuls 4, 9 ou 11 exons ont pu respectivement être localisés par les programmes Genie, GRAIL II et GENSCAN. L'organisation génomique de ce gène (Fig. 1B) a pu être confirmée par la suite grâce à la détermination de la séquence de l'ADNc SPG4.
Les jonctions introns/exons sont représentées sur le tableau 3 ci-après : la taille des exons varie de 41 pb (exon 16) à 1,410 kb (exon 17), celle des introns variant de 140 pb (intron 11) à 23,247 kb (intron 1).
Tableau 3 Organisation intron/exon du gène SPG4 Exon/ Taille de l'exon Position Site accepteur d'épissage Site donneur d'épissage Taille de l'intron intron (pb) sur l'ADNc (SEQ ID No. 74 à 89) (SEQ
ID Nos. 90 à 105) (pb) TGAGAAAG/gtaactagggggctgg 23 247 2 87 541 affitttattttaaag/CAGGACAG
AGGACAAG/gtaagattgtatttgt 1 943 3 84 628 aatttttttctttcag/GTGAACAG
ACTTCTAG/gtatcaattaatgtat 9 190 4 96 712 cttctctgttgcatag/AGAAGATG
CCAGTCAG/gtgggtttaggttaac 15 745 188 808 actffitccttgtcag/AAAGTGGA CTCATAAG/gtattctgggacagta 876 tv co e 6 134 996 ttttgtatcctttaag/GGTACTCC
GTGGACAA/gtaagttttgccatct 283 0 e Ln e aggtcttettcttag/TGGAACAG GGCCTGAG/gtaagaactttatatt 10 735 tv o agtatatattteagfTTGTTCAC CAATGCTG/gtaagggttctcttca 1 385 e w i N) o cttgtgatttttaaag/GCTAAAGC CAAAATAC/gtgagtgctctgtttc 8 083 e i 76 1 371 taatgctttgttttag/GTGGGAGA
TTTTATAG/gtaagaacatattttc 238 .4 cttgtatttcctctag/ATGAAGTT TTGATGGT/gtaagtgttgattatg 140 gattttttgcttgtag/GTACAGTC GTTCTCAG/gtagggagatttatat 4 715 ggatttttetttag/GCGTTTCA ATGAGGAG/gtatgtatctgtgttt 1 389 . 14 80 1 662 ttttaatatttttc,ag/ACAAGACT CTTGCTAG/gtgagtaatttggatt 1 521 71 1 742 tccttcccttcctcag/AATGACTG
TATCCGAG/gtaggtatacaagagc 2 210 cttttatettacag/AACTAAAA CCAGTGAG/gtatagtattttacaa 7 115 17 1 410 1 854 ctttttaaaaatctag/ATGAGAAA
Les séquences des exons et des introns sont respectivement indiquées en majuscules et minuscules.
Exemple 3: Identification de l'ADNc SPG4 Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent réalisées sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal, afin de caractériser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donné des produits d'amplification se terminant à la position nt 263 de l'ADNc SPG4 (Fig. 2), ce qui était probablement dû au contenu riche en GC de la région 5' du transcrit (90 % de GC dans les 60 pb précédant la position nt 263). Quatre produits de PCR chevauchants, recouvrant la totalité de la région codante, ont été amplifiés à partir des ADNc issus des lymphoblastes de six individus contrôles et séquencés intégralement dans le but de vérifier la séquence du transcrit SPG4. L'alignement des séquences de tous les produits de PCR et RACE-PCR a permis de reconstituer une séquence de 3263 pb comprenant une phase ouverte de lecture de 1848 pb précédée par une région 5' non traduite (5' UTR
pour 5' UnTranslated Region ) de 125 pb et suivie par une région 3' UTR de 1290 pb incluant un site de polyadénylation entre les positions nt 3227-3232, ¨ 35 pb en amont de -la queue polyA (Fig. 2). La comparaison de la séquence de l'ADNc SPG4 avec les banques de données d'ESTs a permis de détecter une homologie significative avec 6 ESTs humains dont l'EST N47973 qui contient une région 3' non codante plus étendue (+ 180 pb) comprenant un deuxième site de polyadénylation. Le site d'initiation de la traduction a été identifié par la présence d'une séquence consensus de Kosak (CTGTGAatgA) définie comme un contexte adéquat à l'initiation de la traduction attendu qu'une purine est localisée 3 nt en amont de l'ATG initiateur, lui-même précédé
d'un codon STOP. La séquence de l'ADNc de 3263 pb est identique à la séquence transcrite déduite des 17 exons du gène SPG4. L'analyse de la séquence de la région 5' à l'aide des programmes informatiques TSSG et TSSW suggère la présence d'une séquence promotrice de type TATA box située 43 pb en amont de la position nt 1 de l'exon 1.
Exemple 4: Mutations dans le gène SPG4 Des mutations hétérozygotes ont été recherchées dans l'ADNc SPG4 provenant de lymphoblastes de 14 patients issus de familles liées au locus SPG4 (1 individu atteint par famille). Quatre fragments de PCR chevauchants I, II, III et IV recouvrant la phase ouverte de lecture de l'ADNc SPG4 ont été amplifiés et séquencés chez les 14 patients ainsi que chez 6 individus sains contrôles. L'électrophorèse sur gel agarose du fragment de PCR IV a montré trois bandes d'intensité égale chez 3 patients des familles 2992, 5226 et 5330 provenant de la même région de Suisse, ce qui suggérait une microdélétion ou une mutation d'un site d'épissage ; les deux bandes supplémentaires n'étaient pas présentes chez 2 individus sains issus des familles 2992 et 5330 (Fig. 3A). La séquence génomique de l'exon 16 a révélé une mutation hétérozygote A->G du site accepteur d'épissage (AG) de l'intron 15 chez les individus atteints de ces trois familles (Fig. 3B) ;
cette mutation engendre la perte de l'exon 16 suivie d'un décalage de la phase de lecture dans le transcrit anormal. Aucun des membres sains incluant maris et épouses ne porte cette mutation du site d'épissage. L'identification de la même mutation chez tous les membres atteints de ces trois familles suisses démontre l'existence d'un ancêtre commun, ce qui avait été préalablement suggéré par l'étude des haplotypes.
Trois mutations ponctuelles 1210C->G, 1468G->A et 1620C->T qui introduisent des substitutions d'un acide aminé dans la séquence protéique (S362C, C448Y et R499C) ont été respectivement mises en évidence par le séquençage des fragments de PCR III et IV chez les individus atteints des familles 624, 4014 et 618. Ces trois substitutions impliquent toutes un résidu cystéine, induisant la perte ou l'insertion d'une cystéine dans la séquence protéique. Une délétion de 1 pb, 1520delT, qui crée l'apparition d'un codon STOP induisant une protéine tronquée composée de 465 acides aminés (aa) a été détectée chez les individus atteints de la famille A. Aucune des cinq mutations résumées dans le tableau 4 ci-après n'a été trouvée chez les individus contrôles testés, qu'ils appartiennent à la fratrie saine ou aux conjoints des sept familles analysées ici. Ces cinq mutations affectent de façon importante la séquence protéique dans un domaine très conservé, ou cassette AAA (Beyer, 1997), qui est composé
de plusieurs motifs protéiques supposés être responsables de l'activité ATPase chez tous les membres de la famille des AAA.
=
Tableau 4 .
Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé b Conséquence 624 exon 7 1 210 Ci-> G S362C faux sens 0 4 014 exon 11 1 468 Gi---> A C448Y faux sens o tv co e A exon 11 c 1 520 delT 466STOPcodon non sens e ol 618 exon 13 R499C faux sens e 2 992 intron 15 A aa5641--) aa576 (PTC+7 aa) perte de l'exon 16+ décalage t,.1 0 1 813-2a f--) g cri e I
226 intron 15 A aa5641-> aa576 (PTC+7 aa) perte de l'exon 16+ décalage 0 e i 1 813-2ai-> g 5 330 intron 15 perte de l'exon 16 + décalage 0 .4 A aa5641-> aa576 (PTC+7 aa) 1 813-2a,-9g a Les positions en nt font référence à la séquence de l'ADNc SPG4.
b Les positions en aa font référence à la séquence de la spastin.
Les baies des exons sont indiquées en majuscules, celles des introns en minuscules.
PTC+7 aa = "premature termination codon" à 7 aa en aval de l'exon 16.
En addition à ces cinq mutations décrites précédemment, des recherches de mutations hétérozygotes réalisées sur des patients atteints de PSF-AD issus de 36 autres familles ont permis de mettre en évidence 34 autres mutations altérant ou susceptibles d'altérer le produit d'expression du gène SPG4.
Les caractéristiques de ces 34 autres mutations sont résumées dans le tableau ci-après dans lequel ont été également insérées les cinq premières mutations précédemment citées.
=
Tableau 5 Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé a Conséquence 1210 Ci--G S362C faux sens 624 exon 7 1233 G F4A G37OR faux sens 6958 exon 8 F381C faux sens 214 exon 8 1267 T t--->G
N386K faux sens 1002 exon 8 1283 T 1-->G
K388R faux sens 027 exon 8 1288 A t--->G L426V faux sens 019 exon 10 1401 CH>G C448Y faux sens 4014 exon 11 1468 G1-4A R460L faux sens 148 exon 11 1504 Gi->T R499C faux sens 618 exon 13 1620 CI-->T D555N faux sens 636 exon 15 1788 G i---)A A556V faux sens 627 exon 15 1792 C i->T .
702 C t-->T --Q193STOP non sens 2971 exon 3 3655 exon 5 873 Ai-if K229STOP non sens , 1010 exon 5 907 CF->A S261STOP non sens Y269 STOP non sens 3938 exon 5 932 Ci->G
R431STOP non sens 6922 exon 10 1416 C1-)T R431STOP non sens , 616 exon 10 1416 C1->T R562STOP non sens 605 exon 15 1809 CI-4T
_ 030 exon 2 578-579insA PTC + 2 aa décalage + non sens 615 exon 5 852de11 1 PTC + 18 aa décalage + non sens 042 exon 5 882-883insA PTC + 12 aa décalage + non sens 032 exon 5 906delT PTC + 17 aa décalage + non sens 189 exon 9 1299deIG PTC + 3 aa décalage + non sens 3686 exon 9 1340de15 PTC +35 aa décalage + non sens 625 exon 9 1340de15 PTC +35 aa décalage + non sens A exon 11 1520delT PTC +7 aa décalage + non sens 115 exon 12 1574deIGG PTC + 2 aa décalage + non sens 3266 exon 13 1634de122 PTC + 18 aa décalage + non sens 149 exon 14 1684-1685insI1 PTC +9 aa décalage + non sens 645 exon 14 1685de14 PTC +7 aa ,décale + non sens 808-2 a t-->g ?
029 intron 4 ?
1129+2 ti¨>g mutation site d'épissage 162 intron 6 ? mutation site d'épissage 1223+1 g .-->t 125 intron 7 ? . mutation site d'épissage 143 intron 8 1299+1 g t--)a (PTC +6 aa) mutation site d'épissage 1620 intron 11 1538+5 g F4a 7 perte de l'exon 11 + décalage 1006 intron 11 1538+3 del4 ? mutation site d'épissage 1605 intron 13 1661+1 g I-->t ? mutation site d'épissage 1012 intron 13 1662-2 at¨>t ? mutation site d'épissage 1626 intron 15 1812+1 gi-->a à aa564 t--, aa576 (PTC+7 aa) mutation site d'épissage 2992 intron 15 perte de l'exon 16 +
décalage 1813-2 a F->g à aa5641-4 aa576 (PTC+7 aa) 5226 intron 15 perte de l'exon 16 +
décalage 1813-2 ai-->g à aa564 t--> aa576 (PTC+7 aa) 5330 intron 15 perte de l'exon 16+
décalage 1611 intron 16 1813-2 a t--*g ? mutation site d'épissage 1853+1 gi-4a a Les positions en nt font référence à la séquence de VADNc SPG4. b Les positions en aa font référence à la séquence de la spastin. Les bases des exons sont indiquées en majuscules, celles des mixons en minuscules.
PTC+n aa - "premature termination codon" à n acide aminé en aval de la mutation.
=
Exemple 5: Analyse de la séquence protéique de la spastin La phase ouverte de lecture de SPG4 code pour une protéine de 616 aa que nous avons nommée spastin et dont le poids moléculaire est d'environ 67,2 kDaltons (kD). La comparaison de cette séquence en acides aminés dans les bases de données protéiques à l'aide des programmes BLAST a permis de mettre en évidence une zone de forte homologie avec plusieurs membres de la famille des AAA à l'extrémité C-terminale de la spastin. Les motifs types de la famille des AAA, englobés dans la cassette AAA, sont localisés entre les positions aa342 et aa599 (voir Fig. 2) d'après les comparaisons de séquence dans les bases de données de domaines protéiques ProDom et Prosite.
Les trois domaines types conservés, dont les motifs A et B de Walker ainsi que le motif consensus minimal des protéines AAA sont respectivement situés au sein de la cassette MA aux positions aa382-389, aa437-442 et aa480-498 (Fig. 2). Le motif A de Walker, GPPGNGKT appelé également p-loop (ou boucle-p) qui correspond au domaine de fixation de l'ATP et le motif B IIFIDE sont très conservés entre tous les membres de la famille des AAA incluant la spastin.
La comparaison des cassettes AAA présentes dans 150 protéines de cette famille d'ATPase issues d'organismes très éloignés dans l'évolution a permis de classifier cet ensemble de protéines en plusieurs sous-groupes, en fonction du nombre de cassettes MA identifiés (1 ou 2) et des homologies de séquence entre ces différentes cassettes (Beyer, 1997). Parmi toutes les protéines de la famille des AAA, la spastin présente une plus forte homologie avec une sous-classe particulière des AAA, et plus spécifiquement avec les protéines suivantes dont la plupart ont été identifiées grâce au séquençage complet du génome de l'organisme considéré : deux protéines de Caenorhabditis elegans 016299 et Q18128, deux sous-unités du protéasome 26S de Saccharomyces cerevisiae Yta6p (Q02845) et TBP6 (P40328) (Schnall et al., 1994), une sous-unité du protéasome de Schizosaccharomyces pombe (043078), les protéines SAP1 (P39955) et END13 (P52917) de S. cerevisiae et la protéine murine SKD1 (P46467) (Perier et al., 1994).
L'alignement multiple de ces 8 protéines avec la spastin est représenté sur la Fig. 4A. Sur les 257 acides aminés englobant la cassette AAA (positions aa342-599), la spastin présente une identité de séquence de 52 %, 51 % et 50 h avec la protéine de levure Yta6p (Q02845), la protéine de nématode 016299 et la protéine de levure TBP6 (P40328) respectivement. Des résultats similaires ont été obtenus par l'analyse de la séquence protéique de la spastin dans la base de données ProDbm qui a montré
l'existence de trois domaines d'homologie (nommés 92, 179 et 6226 et correspondant aux positions aa342-409, aa411-509 et aa512-599) trouvés dans les sous-unités putatives du protéasome 26S
de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus souvent des motifs de type leucine-zipper dont deux ont pu être détectés dans la séquence protéique de la spastin aux positions aa50-78 et aa508-529 par l'analyse de la séquence dans la base de données Prosite (voir Fig. 2). Cette analyse a également pu prédire la présence d'un motif de dimérisation de type hélice-boucle-hélice ( helix-loop-helix ) =
situé entre les positions aa478 et aa486.
La comparaison de la séquence protéique de la spastin avec celles des métalloprotéases mitochondriales comme les protéines de levure AFG3, RCA1 et YME1, ainsi que la paraplegin qui est impliquée dans une forme rare de PSF-AR montre que l'homologie entre ces cinq membres de la famille des AAA est limitée à la région de 257aa englobant la cassette AAA (Fig. 4B). Dans cette région, l'identité de séquence entre la spastin et la paraplegin n'est que de 29 A alors que la paraplegin et la protéine de levure AFG3 sont identiques à 57 % sur cette même portion de la séquence protéique.
Cette comparaison de séquence suggère que la spastin n'appartient pas au même sous-groupe des AAA que la paraplegin et autres métalloprotéases mitochondriales.
De plus, l'analyse informatique de la séquence de la spastin avec le programme PSORT Il qui permet de prédire la localisation sub-cellulaire des protéines semble indiquer que le spastin est une protéine nucléaire. Un éventuel signal de localisation nucléaire (NLS pour Nuclear Localization Signal ), RGKKK, a été mis en évidence entre les positions aa7 et = aa11 alors qu'aucun peptide signal caractéristique d'un import dans la mitochondrie n'a pu être décelé, contrairement à ce qui avait été observé pour la paraplegin.
Exemple 6: Profils d'expression de SPG4 et de son ortholodue murin Spg4 La comparaison de la séquence nucléique de SPG4 dans les banques de données d'EST a permis de détecter plusieurs ESTs humains, murins et de rat présentant une forte homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de souris correspondant à deux des ESTs murins, AA560327 et AA107866, ont été obtenus du consortium IMAGE et séquencés intégralement. L'assemblage des séquences de ces clones d'ADNc a permis de reconstituer une séquence consensus de 1689 pb incluant une phase ouverte de lecture incomplète de 1514 pb. La comparaison entre l'ADNc SPG4 humain et cet ADNc de souris a montré qu'il manque au transcrit murin environ 460 pb à
l'extrémité 5' dont le codon d'initiation de la traduction. La phase de lecture ouverte de souris est suivie d'une région 3' non codante (3' UTR) de 175 pb contenant un Site de polyadénylation situé à ¨20 pb en amont de la queue polyA (Fig. 5). La séquence nucléique de SPG4 et la séquence protéique de la spastin humaine présentent respectivement une identité de 89 % (entre les positions nt 460 et nt 1982) et de 96 %
(entre les positions aa113 et aa616) avec les séquences de l'ADNc et de la protéine déduite de la souris. Ce degré important d'homologie permet d'affirmer que ce transcrit de souris c,orrespond à l'orthologue murin de SPG4, qui a été donc baptisé Spg4.
L'hybridation de northern blots comprenant les ARNm de divers tissus humains et 5 murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donné de résultats probants excepté une très faible bande correspondant à un transcrit de 2,5 kb dans le testicule de souris après 10 jours d'exposition. En raison du faible niveau .d'expression de ce gène, les profils d'expression de SPG4 et Spg4 ont été déterminés par des expériences de PCR sur des collections d'ADNc normalisées provenant de divers tissus 10 adultes et foetaux (voir Fig. 6A à 6C). Le gène murin Spg4 est exprimé de façon ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de l'embryon de souris (Fig. 6A). Une plus forte expression de Spg4 a été
détectée dans le foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de l'embryon.
L'expression précoce de Spg4 au cours du développement embryonnaire a été
confirmée 15 par la présence d'ESTs provenant de banques d'ADNc de blastocyste, d'embryon E8 et de carcinome embryonnaire dans les banques de données publiques d'ESTs. Le gène humain SPG4 est lui aussi exprimé de façon ubiquitaire dans les tissus adultes (Fig. 6B) et foetaux (Fig. 6C), avec une expression peut-être plus marquée dans le cerveau foetal.
Exemple 7: Pas de défaut de la phosphorvlation oxydative dans la PSF-AD liée au locus Afin de déterminer si des mutations de la spastin induisaient un défaut de la phosphorylation oxydative (OXPHOS) dans la mitochondrie, à l'image de ce qui avait été
observé pour la paraplegin, une biopsie musculaire a été réalisée sur un patient d'une des familles de PSF-AD liée au locus SPG4. Les analyses morphologiques et histo-25 enzymatiques de cette biopsie de muscle n'ont pas révélé de fibre musculaire de type RRF (pour ragged red fibers ), caractéristique des défauts OXPHOS dans la mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales ainsi que la prédiction d'une localisation nucléaire de la spastin semblent indiquer que la PSF-AD liée au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par opposition à
30 la PSF-AR liée au locus SPG7.
Par une approche de clonage positionnel basée sur le séquençage d'une région de 1,5 Mb, nous avons identifié le gène SPG4 (ou SPAST) responsable de la forme la plus fréquente de PSF-AD, préalablement localisé sur les bandes chromosomiques 2p21-35 p22. Trente-neuf mutations altérant ou susceptibles d'altérer le produit du gène, nommé
spastin, ont pu être détectées chez les individus atteints de quarante-et-une familles de PSF-AD présentant une liaison au locus SPG4. La spastin est un nouveau membre de la famille des protéines MA, dont la localisation semble être nucléaire et qui présente une forte homologie avec les sous-unités du protéasome 26S de levure. En dépit d'une grande homologie restreinte à un domaine de 230 à 250 aa, dite cassette AAA, les nombreux membres de cette famille protéique peuvent participer à des mécanismes cellulaires très variés comme le transport de protéines au sein de vésicules, la régulation du cycle cellulaire, la biogénèse des organelles, ie contrôle de la transcription, ....
Toutefois, tous ces mécanismes cellulaires impliquent l'assemblage, la fonction ou la dégradation de complexes protéiques, ce qui suggère que les membres de la famille des AAA sont des protéines dites chaperons .
Références Barany, F., (1991), Proc. Natl. Acad. Sci. USA, 88, 189-193.
Beyer, A. Sequence analysis of the AAA protein family. Protein Sci. 6, 2043-2058 (1997).
Bodansky M., Principles of peptide synthesis, (1984).
Bruyn, R.P.M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-Lorrain) in Handbook of clinical neurology Vol. 15 (ed. de Jong, J.M.B.V.) 301-318 (Elsevier Science Publishers B.V., 1991).
Buckholz, R.G. Curr. Op. Biotechnology 4: 538-542, 1993.
Burg, J.L. et al. (1996), Mol. and Cell. Probes, 10, 257-271.
Carter, B.J. Curr. Op. Biotechnology 3 : 533-539, 1993.
Casari, G. et al. Spastic paraplegia and OXPHOS impairment caused by mutations in Paraplegin, a nuclear-encoded mitochondrial metalloprotease. Gel! 93, 973-983 (1998).
Cherif D., Julier, C., Delattre, O., Derré, J., Lathrop, G.M., and Berger, R.
Proc. Natl.
Acad. Sci. USA. 87 : 6639-6643, 1990.
Chu, B.C.F. et al. (1986), Nucleic Acids Res., 14, 5591-5603.
Chumakov, I., Rigault, P., Guillou, S., Ougen, P., Billault, A., Guasconi, G., Gervy, P., Le Chumakov, I.M., Rigault, P., Le Gall, I., et al. Nature 377: 175-183, 1995.
Confalonieri, F. & Duguet, M. A 200-amino acid ATPase module in search of a basic function. BioEssays 17, 639-650 (1995).
Duck, P. et al. (1990), Biotechniques, 9, 142-147.
Durr, A. et al. Phenotype of autosomel spastic paraplegia linked to chromosome 2. Brain 119, 1487-1496 (1996).
Edwards, C.P., and Aruffo, A. Curr. Op. Biotechnology 4: 558-563, 1993.
Epstein, A. Médecine/Sciences 8: 902-911, 1992.
Erlich, H.A., (1989), New York : Stockton Press.
Guatelli J.C. et al. Proc. Natl. Acad. Sci. USA 87: 1874-1878, 1990 et al.
Cell 85 : 281-290, 1996.
Fink, J.K. et al. Autosomal dominant familial spastic paraplegia tight linkage to chromosome 15q. Am. J. Hum. Genet. 56, 188-192 (1995).
Hazan, J., Lamy, C., Melki, J., Munnich, A., de Recondo, J., & Weissenbach, J.
Autosomel dominant familial spastic paraplegia is genetically heterogeneous and one locus maps to chromosome 14q. Nature Genet. 5, 163-167 (1993).
Hazan, J. et al. Linkage of a new locus for autosomal dominant familial spastic paraplegia to chromosome 2p. Hum. Mol. Genet. 3, 1569-1573 (1994).
Hedera, P. et ai Novel locus for autosomal dominant hereditary spastic paraplegia, on chromosome 8q. Am. J. Hum. Genet. 64, 563-569 (1999).
Heinzlef, O. et al. Mapping of a complicated familial spastic paraplegia to locus SPG4 on chromosome 2p. J. Med. Genet. 35, 89-93 (1998).
Hentati, A. et al. Linkage of a locus for autosomal dominant familial spastic paraplegia to chromosome 2p markers. Hum. Mol. Genet. 3, 1867-1871 (1994).
The Hereditary Spastic Paraplegia Working Group. Hereditary spastic paraplegia :
advances in genetic research. Neurology 46, 1507-1514 (1996).
Innis, M.A. et al. (1990), Academic Press.
Jouet, M. et al. X-linked spastic paraplégia (SPG1), MASA syndrome and X-linked hydrocephalus result from mutations in the L1 gene. Nature Genet. 7, 402-407 (1994).
Kievitis, T. et al. (1991), J. Virol. Methods, 35, 273-286.
Kôhler et Milstein. Nature 256, 495-497, 1975.
Kwoh, D.Y. et al. (1989), Proà. Nati. Acad. Sci. USA, 86, 1173-1177.
Landegren U., Kaiser R., Sanders J. & Hood L. Science 241 : 1077-1080, 1988.
Lizardi, P.M. et al. (1988), Bio/technology, 6, 1197-1202.
Luckow, V.A. (1993), Curr. Op. Biotechnology 4, 564-572.
Matthews, J.A. et al. (1988), Anal. Biochem., 169: 1-25.
Miele, E.A. et al. (1983), J. Mol. Biol., 171 : 281-295.
Nielsen, J.E. et al. GAG repeat expansion in autosomal dominant pure spastic paraplegia linked to chromosome 2p21-24. Hum. Mol. Genet. 6, 1811-1816 (1997).
Olins, P.O., and Lee, S.C. Curr. Op. Biotechnology 4: 520-525, 1993.
Osoegawa, K. et al. An improved approach for construction of bacterial artificial chromosome libraries. Genomics 52, 1-8 (1998).
Perier, F. et al. Identification of a novel mammalian member of the NSF/CDC48p/Pas1p/TBP-1 family through heterologous expression in yeast. FEBS
lett.
351, 286-290 (1994).
Perricaudet, M., Stratford-Penicaudet, L. and Briand, P. La Recherche 23 : 471-473, 1992.
Polo, J.M., Calleja, J., Combarros, O. & Berciano, J. Hereditary ataxias and paraplegias in Cantabria, Spain. An epidemiological and clinicat study..Brain 114, 855-866 (1991).
Reid, E. Pure hereditary spastic paraplegia. J. Med. Genet. 34, 499-503(1997).
Rohlmann, A., Gotthardt, M., Willnow, T.E., Hammer, R.E., and Herz, J. Nature Biotech.
14: 1562-1565, 1996.
Rolfs, A. et al. (1991), Berlin : Springer-Verlag.
Sambrook, J., Fritsch, E.F., and Maniatis, T. Molecular cloning : a laboratory manual.
Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher disease are allelic disorders at the proteolipid protein locus. Nature Genet. 6, 257-262 (1994).
Schnall, R. et al. Identification of a set of yeast genes coding for a novel family of putative ATPases with high similarity to con stituents of the 26S protease complex.
Yeast 10, 1141-1155 (1994).
Scott, W.K. et al. Locus heterogeneity, anticipation, and reduction of the chromosome 2p minimal candidate region in autosomal dominant familial spastic paraplegia.
Neurogenetics 1, 95-102 (1997).
Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.
Segev, D., (1992), Kessler C. Springer Verlag, Berlin, New-York, 197-205.
Skre, H. Hereditary spastic paraplegia in Western Norway. Clin. Genet. 6, 165-183 (1974).
Stone, B.B. et al. (1996). Mol. and Cell'. Probes, 10 : 359-370.
Stewart J.M. et Yound J.D., solid phase peptides synthesis, Pierce Chem.
Company, Rockford, 111, 2ème éd., (1984).
Suggs S.V., Wallace R.B., Hirose T., Kawashima E.H. and Itakura K. PNAS 78 :
6617, 1981.
Temin, H.M. Retrovirus vectors for gene transfer. In Kucherlapati R., ed. Gene Transfer, New York, Plenum Press, 149-187, 1986.
Walker G.T., Fraiser M.S., Schram J.L., Little M.C., Nadeau J.G., & Malinowski D.P.
Nucleic Acids Res. 20: 1691-1696, 1992.
Werderlin, L. Hereditary ataxias. Occurence and clinical features. Acta Neurol. Scand. 73 (Suppl. 106) (1986).
Woo S.L.C. Methods Enzymol. 68: 389, 1979.
L'un de ces 5 nouveaux gènes présentait une homologie en 3' de sa région codante avec les 5 gènes codant pour la famille protéique des MA (Confalonieri et al., 1995). Des analyses de séquence plus approfondies ont montré que ce gène, nommé SPG4 (ou SPAST), était composé de 17 exons et s'étendait sur une région d'environ 90 kb, couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1B). Les trois premiers exons prédits de ce gène furent identifiés dans le BAC D par deux des quatre programmes de prédiction d'exons utilisés, GRAIL II et GENSCAN ; ils présentent une forte homologie avec un EST de blastocyste de souris, AA560327. Les 14 derniers exons se trouvent dans le BAC G. La séquence protéique déduite des exons 7 à
17 est significativement homologue à une sous-classe de la famille des AAA, comportant les protéines de levure Yta6p (Schnall et al., 1994), TBP6 (Schnall et al., 1994) et End 13, ainsi que la protéine de souris SKD1 (Perier et al., 1994).
Sur les quatre programmes de prédiction d'exons, FGENEH semble le plus fiable et le plus puissant, permettant la détection de la plupart des gènes de cette région chromosomique en 2p21-p22. Cette constatation s'applique également au gène SPG4 pour lequel 15 exons ont pu être mis en évidence par ce programme quand seuls 4, 9 ou 11 exons ont pu respectivement être localisés par les programmes Genie, GRAIL II et GENSCAN. L'organisation génomique de ce gène (Fig. 1B) a pu être confirmée par la suite grâce à la détermination de la séquence de l'ADNc SPG4.
Les jonctions introns/exons sont représentées sur le tableau 3 ci-après : la taille des exons varie de 41 pb (exon 16) à 1,410 kb (exon 17), celle des introns variant de 140 pb (intron 11) à 23,247 kb (intron 1).
Tableau 3 Organisation intron/exon du gène SPG4 Exon/ Taille de l'exon Position Site accepteur d'épissage Site donneur d'épissage Taille de l'intron intron (pb) sur l'ADNc (SEQ ID No. 74 à 89) (SEQ
ID Nos. 90 à 105) (pb) TGAGAAAG/gtaactagggggctgg 23 247 2 87 541 affitttattttaaag/CAGGACAG
AGGACAAG/gtaagattgtatttgt 1 943 3 84 628 aatttttttctttcag/GTGAACAG
ACTTCTAG/gtatcaattaatgtat 9 190 4 96 712 cttctctgttgcatag/AGAAGATG
CCAGTCAG/gtgggtttaggttaac 15 745 188 808 actffitccttgtcag/AAAGTGGA CTCATAAG/gtattctgggacagta 876 tv co e 6 134 996 ttttgtatcctttaag/GGTACTCC
GTGGACAA/gtaagttttgccatct 283 0 e Ln e aggtcttettcttag/TGGAACAG GGCCTGAG/gtaagaactttatatt 10 735 tv o agtatatattteagfTTGTTCAC CAATGCTG/gtaagggttctcttca 1 385 e w i N) o cttgtgatttttaaag/GCTAAAGC CAAAATAC/gtgagtgctctgtttc 8 083 e i 76 1 371 taatgctttgttttag/GTGGGAGA
TTTTATAG/gtaagaacatattttc 238 .4 cttgtatttcctctag/ATGAAGTT TTGATGGT/gtaagtgttgattatg 140 gattttttgcttgtag/GTACAGTC GTTCTCAG/gtagggagatttatat 4 715 ggatttttetttag/GCGTTTCA ATGAGGAG/gtatgtatctgtgttt 1 389 . 14 80 1 662 ttttaatatttttc,ag/ACAAGACT CTTGCTAG/gtgagtaatttggatt 1 521 71 1 742 tccttcccttcctcag/AATGACTG
TATCCGAG/gtaggtatacaagagc 2 210 cttttatettacag/AACTAAAA CCAGTGAG/gtatagtattttacaa 7 115 17 1 410 1 854 ctttttaaaaatctag/ATGAGAAA
Les séquences des exons et des introns sont respectivement indiquées en majuscules et minuscules.
Exemple 3: Identification de l'ADNc SPG4 Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent réalisées sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal, afin de caractériser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donné des produits d'amplification se terminant à la position nt 263 de l'ADNc SPG4 (Fig. 2), ce qui était probablement dû au contenu riche en GC de la région 5' du transcrit (90 % de GC dans les 60 pb précédant la position nt 263). Quatre produits de PCR chevauchants, recouvrant la totalité de la région codante, ont été amplifiés à partir des ADNc issus des lymphoblastes de six individus contrôles et séquencés intégralement dans le but de vérifier la séquence du transcrit SPG4. L'alignement des séquences de tous les produits de PCR et RACE-PCR a permis de reconstituer une séquence de 3263 pb comprenant une phase ouverte de lecture de 1848 pb précédée par une région 5' non traduite (5' UTR
pour 5' UnTranslated Region ) de 125 pb et suivie par une région 3' UTR de 1290 pb incluant un site de polyadénylation entre les positions nt 3227-3232, ¨ 35 pb en amont de -la queue polyA (Fig. 2). La comparaison de la séquence de l'ADNc SPG4 avec les banques de données d'ESTs a permis de détecter une homologie significative avec 6 ESTs humains dont l'EST N47973 qui contient une région 3' non codante plus étendue (+ 180 pb) comprenant un deuxième site de polyadénylation. Le site d'initiation de la traduction a été identifié par la présence d'une séquence consensus de Kosak (CTGTGAatgA) définie comme un contexte adéquat à l'initiation de la traduction attendu qu'une purine est localisée 3 nt en amont de l'ATG initiateur, lui-même précédé
d'un codon STOP. La séquence de l'ADNc de 3263 pb est identique à la séquence transcrite déduite des 17 exons du gène SPG4. L'analyse de la séquence de la région 5' à l'aide des programmes informatiques TSSG et TSSW suggère la présence d'une séquence promotrice de type TATA box située 43 pb en amont de la position nt 1 de l'exon 1.
Exemple 4: Mutations dans le gène SPG4 Des mutations hétérozygotes ont été recherchées dans l'ADNc SPG4 provenant de lymphoblastes de 14 patients issus de familles liées au locus SPG4 (1 individu atteint par famille). Quatre fragments de PCR chevauchants I, II, III et IV recouvrant la phase ouverte de lecture de l'ADNc SPG4 ont été amplifiés et séquencés chez les 14 patients ainsi que chez 6 individus sains contrôles. L'électrophorèse sur gel agarose du fragment de PCR IV a montré trois bandes d'intensité égale chez 3 patients des familles 2992, 5226 et 5330 provenant de la même région de Suisse, ce qui suggérait une microdélétion ou une mutation d'un site d'épissage ; les deux bandes supplémentaires n'étaient pas présentes chez 2 individus sains issus des familles 2992 et 5330 (Fig. 3A). La séquence génomique de l'exon 16 a révélé une mutation hétérozygote A->G du site accepteur d'épissage (AG) de l'intron 15 chez les individus atteints de ces trois familles (Fig. 3B) ;
cette mutation engendre la perte de l'exon 16 suivie d'un décalage de la phase de lecture dans le transcrit anormal. Aucun des membres sains incluant maris et épouses ne porte cette mutation du site d'épissage. L'identification de la même mutation chez tous les membres atteints de ces trois familles suisses démontre l'existence d'un ancêtre commun, ce qui avait été préalablement suggéré par l'étude des haplotypes.
Trois mutations ponctuelles 1210C->G, 1468G->A et 1620C->T qui introduisent des substitutions d'un acide aminé dans la séquence protéique (S362C, C448Y et R499C) ont été respectivement mises en évidence par le séquençage des fragments de PCR III et IV chez les individus atteints des familles 624, 4014 et 618. Ces trois substitutions impliquent toutes un résidu cystéine, induisant la perte ou l'insertion d'une cystéine dans la séquence protéique. Une délétion de 1 pb, 1520delT, qui crée l'apparition d'un codon STOP induisant une protéine tronquée composée de 465 acides aminés (aa) a été détectée chez les individus atteints de la famille A. Aucune des cinq mutations résumées dans le tableau 4 ci-après n'a été trouvée chez les individus contrôles testés, qu'ils appartiennent à la fratrie saine ou aux conjoints des sept familles analysées ici. Ces cinq mutations affectent de façon importante la séquence protéique dans un domaine très conservé, ou cassette AAA (Beyer, 1997), qui est composé
de plusieurs motifs protéiques supposés être responsables de l'activité ATPase chez tous les membres de la famille des AAA.
=
Tableau 4 .
Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé b Conséquence 624 exon 7 1 210 Ci-> G S362C faux sens 0 4 014 exon 11 1 468 Gi---> A C448Y faux sens o tv co e A exon 11 c 1 520 delT 466STOPcodon non sens e ol 618 exon 13 R499C faux sens e 2 992 intron 15 A aa5641--) aa576 (PTC+7 aa) perte de l'exon 16+ décalage t,.1 0 1 813-2a f--) g cri e I
226 intron 15 A aa5641-> aa576 (PTC+7 aa) perte de l'exon 16+ décalage 0 e i 1 813-2ai-> g 5 330 intron 15 perte de l'exon 16 + décalage 0 .4 A aa5641-> aa576 (PTC+7 aa) 1 813-2a,-9g a Les positions en nt font référence à la séquence de l'ADNc SPG4.
b Les positions en aa font référence à la séquence de la spastin.
Les baies des exons sont indiquées en majuscules, celles des introns en minuscules.
PTC+7 aa = "premature termination codon" à 7 aa en aval de l'exon 16.
En addition à ces cinq mutations décrites précédemment, des recherches de mutations hétérozygotes réalisées sur des patients atteints de PSF-AD issus de 36 autres familles ont permis de mettre en évidence 34 autres mutations altérant ou susceptibles d'altérer le produit d'expression du gène SPG4.
Les caractéristiques de ces 34 autres mutations sont résumées dans le tableau ci-après dans lequel ont été également insérées les cinq premières mutations précédemment citées.
=
Tableau 5 Mutations dans SPG4 chez les patients atteints de PSF-AD
Famille Localisation Mutation a Changement d'acide aminé a Conséquence 1210 Ci--G S362C faux sens 624 exon 7 1233 G F4A G37OR faux sens 6958 exon 8 F381C faux sens 214 exon 8 1267 T t--->G
N386K faux sens 1002 exon 8 1283 T 1-->G
K388R faux sens 027 exon 8 1288 A t--->G L426V faux sens 019 exon 10 1401 CH>G C448Y faux sens 4014 exon 11 1468 G1-4A R460L faux sens 148 exon 11 1504 Gi->T R499C faux sens 618 exon 13 1620 CI-->T D555N faux sens 636 exon 15 1788 G i---)A A556V faux sens 627 exon 15 1792 C i->T .
702 C t-->T --Q193STOP non sens 2971 exon 3 3655 exon 5 873 Ai-if K229STOP non sens , 1010 exon 5 907 CF->A S261STOP non sens Y269 STOP non sens 3938 exon 5 932 Ci->G
R431STOP non sens 6922 exon 10 1416 C1-)T R431STOP non sens , 616 exon 10 1416 C1->T R562STOP non sens 605 exon 15 1809 CI-4T
_ 030 exon 2 578-579insA PTC + 2 aa décalage + non sens 615 exon 5 852de11 1 PTC + 18 aa décalage + non sens 042 exon 5 882-883insA PTC + 12 aa décalage + non sens 032 exon 5 906delT PTC + 17 aa décalage + non sens 189 exon 9 1299deIG PTC + 3 aa décalage + non sens 3686 exon 9 1340de15 PTC +35 aa décalage + non sens 625 exon 9 1340de15 PTC +35 aa décalage + non sens A exon 11 1520delT PTC +7 aa décalage + non sens 115 exon 12 1574deIGG PTC + 2 aa décalage + non sens 3266 exon 13 1634de122 PTC + 18 aa décalage + non sens 149 exon 14 1684-1685insI1 PTC +9 aa décalage + non sens 645 exon 14 1685de14 PTC +7 aa ,décale + non sens 808-2 a t-->g ?
029 intron 4 ?
1129+2 ti¨>g mutation site d'épissage 162 intron 6 ? mutation site d'épissage 1223+1 g .-->t 125 intron 7 ? . mutation site d'épissage 143 intron 8 1299+1 g t--)a (PTC +6 aa) mutation site d'épissage 1620 intron 11 1538+5 g F4a 7 perte de l'exon 11 + décalage 1006 intron 11 1538+3 del4 ? mutation site d'épissage 1605 intron 13 1661+1 g I-->t ? mutation site d'épissage 1012 intron 13 1662-2 at¨>t ? mutation site d'épissage 1626 intron 15 1812+1 gi-->a à aa564 t--, aa576 (PTC+7 aa) mutation site d'épissage 2992 intron 15 perte de l'exon 16 +
décalage 1813-2 a F->g à aa5641-4 aa576 (PTC+7 aa) 5226 intron 15 perte de l'exon 16 +
décalage 1813-2 ai-->g à aa564 t--> aa576 (PTC+7 aa) 5330 intron 15 perte de l'exon 16+
décalage 1611 intron 16 1813-2 a t--*g ? mutation site d'épissage 1853+1 gi-4a a Les positions en nt font référence à la séquence de VADNc SPG4. b Les positions en aa font référence à la séquence de la spastin. Les bases des exons sont indiquées en majuscules, celles des mixons en minuscules.
PTC+n aa - "premature termination codon" à n acide aminé en aval de la mutation.
=
Exemple 5: Analyse de la séquence protéique de la spastin La phase ouverte de lecture de SPG4 code pour une protéine de 616 aa que nous avons nommée spastin et dont le poids moléculaire est d'environ 67,2 kDaltons (kD). La comparaison de cette séquence en acides aminés dans les bases de données protéiques à l'aide des programmes BLAST a permis de mettre en évidence une zone de forte homologie avec plusieurs membres de la famille des AAA à l'extrémité C-terminale de la spastin. Les motifs types de la famille des AAA, englobés dans la cassette AAA, sont localisés entre les positions aa342 et aa599 (voir Fig. 2) d'après les comparaisons de séquence dans les bases de données de domaines protéiques ProDom et Prosite.
Les trois domaines types conservés, dont les motifs A et B de Walker ainsi que le motif consensus minimal des protéines AAA sont respectivement situés au sein de la cassette MA aux positions aa382-389, aa437-442 et aa480-498 (Fig. 2). Le motif A de Walker, GPPGNGKT appelé également p-loop (ou boucle-p) qui correspond au domaine de fixation de l'ATP et le motif B IIFIDE sont très conservés entre tous les membres de la famille des AAA incluant la spastin.
La comparaison des cassettes AAA présentes dans 150 protéines de cette famille d'ATPase issues d'organismes très éloignés dans l'évolution a permis de classifier cet ensemble de protéines en plusieurs sous-groupes, en fonction du nombre de cassettes MA identifiés (1 ou 2) et des homologies de séquence entre ces différentes cassettes (Beyer, 1997). Parmi toutes les protéines de la famille des AAA, la spastin présente une plus forte homologie avec une sous-classe particulière des AAA, et plus spécifiquement avec les protéines suivantes dont la plupart ont été identifiées grâce au séquençage complet du génome de l'organisme considéré : deux protéines de Caenorhabditis elegans 016299 et Q18128, deux sous-unités du protéasome 26S de Saccharomyces cerevisiae Yta6p (Q02845) et TBP6 (P40328) (Schnall et al., 1994), une sous-unité du protéasome de Schizosaccharomyces pombe (043078), les protéines SAP1 (P39955) et END13 (P52917) de S. cerevisiae et la protéine murine SKD1 (P46467) (Perier et al., 1994).
L'alignement multiple de ces 8 protéines avec la spastin est représenté sur la Fig. 4A. Sur les 257 acides aminés englobant la cassette AAA (positions aa342-599), la spastin présente une identité de séquence de 52 %, 51 % et 50 h avec la protéine de levure Yta6p (Q02845), la protéine de nématode 016299 et la protéine de levure TBP6 (P40328) respectivement. Des résultats similaires ont été obtenus par l'analyse de la séquence protéique de la spastin dans la base de données ProDbm qui a montré
l'existence de trois domaines d'homologie (nommés 92, 179 et 6226 et correspondant aux positions aa342-409, aa411-509 et aa512-599) trouvés dans les sous-unités putatives du protéasome 26S
de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus souvent des motifs de type leucine-zipper dont deux ont pu être détectés dans la séquence protéique de la spastin aux positions aa50-78 et aa508-529 par l'analyse de la séquence dans la base de données Prosite (voir Fig. 2). Cette analyse a également pu prédire la présence d'un motif de dimérisation de type hélice-boucle-hélice ( helix-loop-helix ) =
situé entre les positions aa478 et aa486.
La comparaison de la séquence protéique de la spastin avec celles des métalloprotéases mitochondriales comme les protéines de levure AFG3, RCA1 et YME1, ainsi que la paraplegin qui est impliquée dans une forme rare de PSF-AR montre que l'homologie entre ces cinq membres de la famille des AAA est limitée à la région de 257aa englobant la cassette AAA (Fig. 4B). Dans cette région, l'identité de séquence entre la spastin et la paraplegin n'est que de 29 A alors que la paraplegin et la protéine de levure AFG3 sont identiques à 57 % sur cette même portion de la séquence protéique.
Cette comparaison de séquence suggère que la spastin n'appartient pas au même sous-groupe des AAA que la paraplegin et autres métalloprotéases mitochondriales.
De plus, l'analyse informatique de la séquence de la spastin avec le programme PSORT Il qui permet de prédire la localisation sub-cellulaire des protéines semble indiquer que le spastin est une protéine nucléaire. Un éventuel signal de localisation nucléaire (NLS pour Nuclear Localization Signal ), RGKKK, a été mis en évidence entre les positions aa7 et = aa11 alors qu'aucun peptide signal caractéristique d'un import dans la mitochondrie n'a pu être décelé, contrairement à ce qui avait été observé pour la paraplegin.
Exemple 6: Profils d'expression de SPG4 et de son ortholodue murin Spg4 La comparaison de la séquence nucléique de SPG4 dans les banques de données d'EST a permis de détecter plusieurs ESTs humains, murins et de rat présentant une forte homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de souris correspondant à deux des ESTs murins, AA560327 et AA107866, ont été obtenus du consortium IMAGE et séquencés intégralement. L'assemblage des séquences de ces clones d'ADNc a permis de reconstituer une séquence consensus de 1689 pb incluant une phase ouverte de lecture incomplète de 1514 pb. La comparaison entre l'ADNc SPG4 humain et cet ADNc de souris a montré qu'il manque au transcrit murin environ 460 pb à
l'extrémité 5' dont le codon d'initiation de la traduction. La phase de lecture ouverte de souris est suivie d'une région 3' non codante (3' UTR) de 175 pb contenant un Site de polyadénylation situé à ¨20 pb en amont de la queue polyA (Fig. 5). La séquence nucléique de SPG4 et la séquence protéique de la spastin humaine présentent respectivement une identité de 89 % (entre les positions nt 460 et nt 1982) et de 96 %
(entre les positions aa113 et aa616) avec les séquences de l'ADNc et de la protéine déduite de la souris. Ce degré important d'homologie permet d'affirmer que ce transcrit de souris c,orrespond à l'orthologue murin de SPG4, qui a été donc baptisé Spg4.
L'hybridation de northern blots comprenant les ARNm de divers tissus humains et 5 murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donné de résultats probants excepté une très faible bande correspondant à un transcrit de 2,5 kb dans le testicule de souris après 10 jours d'exposition. En raison du faible niveau .d'expression de ce gène, les profils d'expression de SPG4 et Spg4 ont été déterminés par des expériences de PCR sur des collections d'ADNc normalisées provenant de divers tissus 10 adultes et foetaux (voir Fig. 6A à 6C). Le gène murin Spg4 est exprimé de façon ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de l'embryon de souris (Fig. 6A). Une plus forte expression de Spg4 a été
détectée dans le foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de l'embryon.
L'expression précoce de Spg4 au cours du développement embryonnaire a été
confirmée 15 par la présence d'ESTs provenant de banques d'ADNc de blastocyste, d'embryon E8 et de carcinome embryonnaire dans les banques de données publiques d'ESTs. Le gène humain SPG4 est lui aussi exprimé de façon ubiquitaire dans les tissus adultes (Fig. 6B) et foetaux (Fig. 6C), avec une expression peut-être plus marquée dans le cerveau foetal.
Exemple 7: Pas de défaut de la phosphorvlation oxydative dans la PSF-AD liée au locus Afin de déterminer si des mutations de la spastin induisaient un défaut de la phosphorylation oxydative (OXPHOS) dans la mitochondrie, à l'image de ce qui avait été
observé pour la paraplegin, une biopsie musculaire a été réalisée sur un patient d'une des familles de PSF-AD liée au locus SPG4. Les analyses morphologiques et histo-25 enzymatiques de cette biopsie de muscle n'ont pas révélé de fibre musculaire de type RRF (pour ragged red fibers ), caractéristique des défauts OXPHOS dans la mitochondrie. Le fait que toutes les fibres musculaires apparaissent normales ainsi que la prédiction d'une localisation nucléaire de la spastin semblent indiquer que la PSF-AD liée au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par opposition à
30 la PSF-AR liée au locus SPG7.
Par une approche de clonage positionnel basée sur le séquençage d'une région de 1,5 Mb, nous avons identifié le gène SPG4 (ou SPAST) responsable de la forme la plus fréquente de PSF-AD, préalablement localisé sur les bandes chromosomiques 2p21-35 p22. Trente-neuf mutations altérant ou susceptibles d'altérer le produit du gène, nommé
spastin, ont pu être détectées chez les individus atteints de quarante-et-une familles de PSF-AD présentant une liaison au locus SPG4. La spastin est un nouveau membre de la famille des protéines MA, dont la localisation semble être nucléaire et qui présente une forte homologie avec les sous-unités du protéasome 26S de levure. En dépit d'une grande homologie restreinte à un domaine de 230 à 250 aa, dite cassette AAA, les nombreux membres de cette famille protéique peuvent participer à des mécanismes cellulaires très variés comme le transport de protéines au sein de vésicules, la régulation du cycle cellulaire, la biogénèse des organelles, ie contrôle de la transcription, ....
Toutefois, tous ces mécanismes cellulaires impliquent l'assemblage, la fonction ou la dégradation de complexes protéiques, ce qui suggère que les membres de la famille des AAA sont des protéines dites chaperons .
Références Barany, F., (1991), Proc. Natl. Acad. Sci. USA, 88, 189-193.
Beyer, A. Sequence analysis of the AAA protein family. Protein Sci. 6, 2043-2058 (1997).
Bodansky M., Principles of peptide synthesis, (1984).
Bruyn, R.P.M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-Lorrain) in Handbook of clinical neurology Vol. 15 (ed. de Jong, J.M.B.V.) 301-318 (Elsevier Science Publishers B.V., 1991).
Buckholz, R.G. Curr. Op. Biotechnology 4: 538-542, 1993.
Burg, J.L. et al. (1996), Mol. and Cell. Probes, 10, 257-271.
Carter, B.J. Curr. Op. Biotechnology 3 : 533-539, 1993.
Casari, G. et al. Spastic paraplegia and OXPHOS impairment caused by mutations in Paraplegin, a nuclear-encoded mitochondrial metalloprotease. Gel! 93, 973-983 (1998).
Cherif D., Julier, C., Delattre, O., Derré, J., Lathrop, G.M., and Berger, R.
Proc. Natl.
Acad. Sci. USA. 87 : 6639-6643, 1990.
Chu, B.C.F. et al. (1986), Nucleic Acids Res., 14, 5591-5603.
Chumakov, I., Rigault, P., Guillou, S., Ougen, P., Billault, A., Guasconi, G., Gervy, P., Le Chumakov, I.M., Rigault, P., Le Gall, I., et al. Nature 377: 175-183, 1995.
Confalonieri, F. & Duguet, M. A 200-amino acid ATPase module in search of a basic function. BioEssays 17, 639-650 (1995).
Duck, P. et al. (1990), Biotechniques, 9, 142-147.
Durr, A. et al. Phenotype of autosomel spastic paraplegia linked to chromosome 2. Brain 119, 1487-1496 (1996).
Edwards, C.P., and Aruffo, A. Curr. Op. Biotechnology 4: 558-563, 1993.
Epstein, A. Médecine/Sciences 8: 902-911, 1992.
Erlich, H.A., (1989), New York : Stockton Press.
Guatelli J.C. et al. Proc. Natl. Acad. Sci. USA 87: 1874-1878, 1990 et al.
Cell 85 : 281-290, 1996.
Fink, J.K. et al. Autosomal dominant familial spastic paraplegia tight linkage to chromosome 15q. Am. J. Hum. Genet. 56, 188-192 (1995).
Hazan, J., Lamy, C., Melki, J., Munnich, A., de Recondo, J., & Weissenbach, J.
Autosomel dominant familial spastic paraplegia is genetically heterogeneous and one locus maps to chromosome 14q. Nature Genet. 5, 163-167 (1993).
Hazan, J. et al. Linkage of a new locus for autosomal dominant familial spastic paraplegia to chromosome 2p. Hum. Mol. Genet. 3, 1569-1573 (1994).
Hedera, P. et ai Novel locus for autosomal dominant hereditary spastic paraplegia, on chromosome 8q. Am. J. Hum. Genet. 64, 563-569 (1999).
Heinzlef, O. et al. Mapping of a complicated familial spastic paraplegia to locus SPG4 on chromosome 2p. J. Med. Genet. 35, 89-93 (1998).
Hentati, A. et al. Linkage of a locus for autosomal dominant familial spastic paraplegia to chromosome 2p markers. Hum. Mol. Genet. 3, 1867-1871 (1994).
The Hereditary Spastic Paraplegia Working Group. Hereditary spastic paraplegia :
advances in genetic research. Neurology 46, 1507-1514 (1996).
Innis, M.A. et al. (1990), Academic Press.
Jouet, M. et al. X-linked spastic paraplégia (SPG1), MASA syndrome and X-linked hydrocephalus result from mutations in the L1 gene. Nature Genet. 7, 402-407 (1994).
Kievitis, T. et al. (1991), J. Virol. Methods, 35, 273-286.
Kôhler et Milstein. Nature 256, 495-497, 1975.
Kwoh, D.Y. et al. (1989), Proà. Nati. Acad. Sci. USA, 86, 1173-1177.
Landegren U., Kaiser R., Sanders J. & Hood L. Science 241 : 1077-1080, 1988.
Lizardi, P.M. et al. (1988), Bio/technology, 6, 1197-1202.
Luckow, V.A. (1993), Curr. Op. Biotechnology 4, 564-572.
Matthews, J.A. et al. (1988), Anal. Biochem., 169: 1-25.
Miele, E.A. et al. (1983), J. Mol. Biol., 171 : 281-295.
Nielsen, J.E. et al. GAG repeat expansion in autosomal dominant pure spastic paraplegia linked to chromosome 2p21-24. Hum. Mol. Genet. 6, 1811-1816 (1997).
Olins, P.O., and Lee, S.C. Curr. Op. Biotechnology 4: 520-525, 1993.
Osoegawa, K. et al. An improved approach for construction of bacterial artificial chromosome libraries. Genomics 52, 1-8 (1998).
Perier, F. et al. Identification of a novel mammalian member of the NSF/CDC48p/Pas1p/TBP-1 family through heterologous expression in yeast. FEBS
lett.
351, 286-290 (1994).
Perricaudet, M., Stratford-Penicaudet, L. and Briand, P. La Recherche 23 : 471-473, 1992.
Polo, J.M., Calleja, J., Combarros, O. & Berciano, J. Hereditary ataxias and paraplegias in Cantabria, Spain. An epidemiological and clinicat study..Brain 114, 855-866 (1991).
Reid, E. Pure hereditary spastic paraplegia. J. Med. Genet. 34, 499-503(1997).
Rohlmann, A., Gotthardt, M., Willnow, T.E., Hammer, R.E., and Herz, J. Nature Biotech.
14: 1562-1565, 1996.
Rolfs, A. et al. (1991), Berlin : Springer-Verlag.
Sambrook, J., Fritsch, E.F., and Maniatis, T. Molecular cloning : a laboratory manual.
Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher disease are allelic disorders at the proteolipid protein locus. Nature Genet. 6, 257-262 (1994).
Schnall, R. et al. Identification of a set of yeast genes coding for a novel family of putative ATPases with high similarity to con stituents of the 26S protease complex.
Yeast 10, 1141-1155 (1994).
Scott, W.K. et al. Locus heterogeneity, anticipation, and reduction of the chromosome 2p minimal candidate region in autosomal dominant familial spastic paraplegia.
Neurogenetics 1, 95-102 (1997).
Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.
Segev, D., (1992), Kessler C. Springer Verlag, Berlin, New-York, 197-205.
Skre, H. Hereditary spastic paraplegia in Western Norway. Clin. Genet. 6, 165-183 (1974).
Stone, B.B. et al. (1996). Mol. and Cell'. Probes, 10 : 359-370.
Stewart J.M. et Yound J.D., solid phase peptides synthesis, Pierce Chem.
Company, Rockford, 111, 2ème éd., (1984).
Suggs S.V., Wallace R.B., Hirose T., Kawashima E.H. and Itakura K. PNAS 78 :
6617, 1981.
Temin, H.M. Retrovirus vectors for gene transfer. In Kucherlapati R., ed. Gene Transfer, New York, Plenum Press, 149-187, 1986.
Walker G.T., Fraiser M.S., Schram J.L., Little M.C., Nadeau J.G., & Malinowski D.P.
Nucleic Acids Res. 20: 1691-1696, 1992.
Werderlin, L. Hereditary ataxias. Occurence and clinical features. Acta Neurol. Scand. 73 (Suppl. 106) (1986).
Woo S.L.C. Methods Enzymol. 68: 389, 1979.
Claims (6)
1. Méthode de diagnostic de la paraplégie spastique familiale autosomique dominante (PSF-AD) chez un patient, comprenant :
- le séquençage d'un acide nucléique dans un échantillon biologique d'un patient, ledit acide nucléique comprenant :
(i) une séquence telle que définie selon SEQ ID NO :1 ou 2;
(ii) une séquence d'ARN transcrite de (i); ou (iii) une séquence d'ADN complémentaire (ADNc) de (i) ou (ii); et - détermination de la présence ou de l'absence des résidus 93444-93484 de la SEQ ID NO :1 ou 1813-1853 de la SEQ ID NO :2 dans l'acide nucléique, caractérisé en ce que l'absence desdits résidus dans l'acide nucléique est indicatif que le patient a la PSF-AD.
- le séquençage d'un acide nucléique dans un échantillon biologique d'un patient, ledit acide nucléique comprenant :
(i) une séquence telle que définie selon SEQ ID NO :1 ou 2;
(ii) une séquence d'ARN transcrite de (i); ou (iii) une séquence d'ADN complémentaire (ADNc) de (i) ou (ii); et - détermination de la présence ou de l'absence des résidus 93444-93484 de la SEQ ID NO :1 ou 1813-1853 de la SEQ ID NO :2 dans l'acide nucléique, caractérisé en ce que l'absence desdits résidus dans l'acide nucléique est indicatif que le patient a la PSF-AD.
2. Méthode selon la revendication 1, caractérisée en ce que l'acide nucléique est un ADNc.
3. Méthode selon la revendication 1 ou 2, caractérisée en ce que l'échantillon biologique est un échantillon humain anténatal.
4. Méthode selon l'une quelconque des revendications 1-3, caractérisée en ce que l'échantillon biologique comprend un lymphoblaste.
5. Méthode selon l'une quelconque des revendications 1-4, comprenant en outre l'amplification de l'acide nucléique suivant une méthode choisie parmi le groupe constitué de la réaction en chaîne à la polymérase (PCR), la technique d'amplification à déplacement de brin (SDA ¨ strand displacement amplification), la technique TAS (transcription-based amplification system), la technique 3SR (self-sustained sequence replication), la technique NASBA
(nucleic acid sequence based amplification), la technique TMA (transcription mediated amplification), la technique LCR (ligase chain reaction), la technique RCR (repair chain reaction) et la technique CPR (cycling probe reaction).
(nucleic acid sequence based amplification), la technique TMA (transcription mediated amplification), la technique LCR (ligase chain reaction), la technique RCR (repair chain reaction) et la technique CPR (cycling probe reaction).
6. Méthode selon la revendication 5, caractérisée en ce que l'amplification est conduite avec au moins une amorce comprenant une séquence choisie parmi le groupe constitué de SEQ ID NO :4 à SEQ ID NO :71.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR9911097A FR2798138B1 (fr) | 1999-09-03 | 1999-09-03 | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante |
FR99/11097 | 1999-09-03 | ||
CA2348657A CA2348657C (fr) | 1999-09-03 | 2000-09-04 | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CA2348657A Division CA2348657C (fr) | 1999-09-03 | 2000-09-04 | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante |
Publications (2)
Publication Number | Publication Date |
---|---|
CA2848454A1 CA2848454A1 (fr) | 2001-03-15 |
CA2848454C true CA2848454C (fr) | 2018-04-17 |
Family
ID=9549552
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CA2348657A Expired - Lifetime CA2348657C (fr) | 1999-09-03 | 2000-09-04 | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante |
CA2848454A Expired - Lifetime CA2848454C (fr) | 1999-09-03 | 2000-09-04 | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante. |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CA2348657A Expired - Lifetime CA2348657C (fr) | 1999-09-03 | 2000-09-04 | Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante |
Country Status (5)
Country | Link |
---|---|
US (2) | US6924126B1 (fr) |
JP (2) | JP2003508074A (fr) |
CA (2) | CA2348657C (fr) |
FR (1) | FR2798138B1 (fr) |
WO (1) | WO2001018198A1 (fr) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007126916A2 (fr) * | 2006-03-30 | 2007-11-08 | Duke University | Identification d'un nouveau gène sous-tendant la paraplégie spastique familiale |
EP1897891A1 (fr) | 2006-09-11 | 2008-03-12 | Institut National De La Sante Et De La Recherche Medicale (Inserm) | Diagnose de paraplégie spastique héréditaire par detection d' une mutation dans le gene où la protéine KIAA1840 |
WO2009127211A1 (fr) * | 2008-04-14 | 2009-10-22 | Aarhus Universitet | Procédés et kits de dépistage d'une démyélinisation spinale |
JP6208104B2 (ja) * | 2014-09-16 | 2017-10-04 | 株式会社日立製作所 | 生体認証システム、生体認証処理装置、生体認証方法、生体情報取得端末および情報端末 |
KR101889072B1 (ko) | 2017-09-15 | 2018-08-16 | 한국생명공학연구원 | 디지털 PCR을 이용한 유전성 강직성 대마비(Hereditary spastic paraplegia, HSP) 관련 유전자 SPG4의 거대결손 검증법 |
CN117820470B (zh) * | 2024-03-04 | 2024-05-31 | 暨南大学 | 人源性重组抗Spastin抗体及其制备方法和应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6197551B1 (en) * | 1998-01-27 | 2001-03-06 | Millennium Pharmaceuticals, Inc. | Spoil-1 protein and nucleic acid molecules and uses therefor |
CA2286313C (fr) * | 1997-04-15 | 2011-01-11 | The Wellcome Trust Limited As Trustee To The Wellcome Trust | Nouveau recepteur de ldl |
WO1999042622A1 (fr) * | 1998-02-23 | 1999-08-26 | Dana-Farber Cancer Institute, Inc. | Procede permettant d'identifier les sites reactifs des glycosylases de reparation des mesappariements, compose et utilisations de ce dernier |
-
1999
- 1999-09-03 FR FR9911097A patent/FR2798138B1/fr not_active Expired - Lifetime
-
2000
- 2000-09-04 US US09/830,902 patent/US6924126B1/en not_active Expired - Lifetime
- 2000-09-04 JP JP2001521734A patent/JP2003508074A/ja not_active Withdrawn
- 2000-09-04 CA CA2348657A patent/CA2348657C/fr not_active Expired - Lifetime
- 2000-09-04 CA CA2848454A patent/CA2848454C/fr not_active Expired - Lifetime
- 2000-09-04 WO PCT/FR2000/002433 patent/WO2001018198A1/fr active Application Filing
-
2005
- 2005-06-20 US US11/155,492 patent/US20050266479A1/en not_active Abandoned
-
2011
- 2011-07-19 JP JP2011158305A patent/JP5965594B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
CA2348657C (fr) | 2014-07-08 |
US6924126B1 (en) | 2005-08-02 |
JP2011254824A (ja) | 2011-12-22 |
US20050266479A1 (en) | 2005-12-01 |
JP2003508074A (ja) | 2003-03-04 |
JP5965594B2 (ja) | 2016-08-10 |
FR2798138A1 (fr) | 2001-03-09 |
FR2798138B1 (fr) | 2004-05-21 |
CA2848454A1 (fr) | 2001-03-15 |
CA2348657A1 (fr) | 2001-03-15 |
WO2001018198A1 (fr) | 2001-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6228591B1 (en) | Polycystic kidney disease PKD2 gene and uses thereof | |
EP1100825B1 (fr) | Mutations geniques mink humaines associees a l'arythmie | |
JP5965594B2 (ja) | 最も一般的な形態の常染色体性優性遺伝性痙性対麻痺に応答し得るspg遺伝子のクローニング、発現および同定 | |
FR2806739A1 (fr) | Genes impliques dans les maladies inflammatoires de l'intestin et leur utilisation | |
JP2002521065A (ja) | Herg−長期qt症候群遺伝子中の突然変異およびそのゲノム構造 | |
JP3449419B2 (ja) | KVLQT1をコードするQT延長症候群遺伝子およびそのminKとの関連 | |
JP2004504054A (ja) | 薬物誘導型心臓不整脈に関係するscn5a中の一般的多型 | |
DE69936781T2 (de) | Kvlqt1 - im zusammenhang mit 'long qt syndrom' | |
Kashuba et al. | Initial isolation and analysis of the human Kv1. 7 (KCNA7) gene, a member of the voltage-gated potassium channel gene family | |
WO2003040369A2 (fr) | Sequences impliquees dans les phenomenes de suppression tumorale, reversion tumorale, apoptose et/ou resistance aux virus et leur utilisation comme medicaments | |
US6476188B1 (en) | Clock gene and methods of use thereof | |
WO2003025176A2 (fr) | Sequences impliquees dans les phenomenes de suppression tumorale, reversion tumorale, apoptose et/ou resistance aux virus et leur utilisation comme medicaments | |
FR2800388A1 (fr) | Clonage, expression et caracterisation d'un gene exprime dans des cellules tumorales et implique dans la regulation de la reponse immune | |
US20070048836A1 (en) | Db, the receptor for leptin, nucleic acids encoding the receptor, and uses thereof | |
KR100508845B1 (ko) | KVLQT1을 코딩하는 장기 QT증후군 유전자 및 KVLQT1과 minK의 결합체 | |
JP2002360260A (ja) | Bタンパク質をコードする遺伝子 | |
WO2000078948A2 (fr) | Clonage, expression et caracterisation d'un adnc codant pour un recepteur gamma-hydroxybutyrate (ghb) de cerveau de rat | |
CA2357987A1 (fr) | Sequence genetique liee a des maladies osseuses |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EEER | Examination request |
Effective date: 20140407 |
|
MKEX | Expiry |
Effective date: 20200904 |