FR2798138A1 - Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante - Google Patents

Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante Download PDF

Info

Publication number
FR2798138A1
FR2798138A1 FR9911097A FR9911097A FR2798138A1 FR 2798138 A1 FR2798138 A1 FR 2798138A1 FR 9911097 A FR9911097 A FR 9911097A FR 9911097 A FR9911097 A FR 9911097A FR 2798138 A1 FR2798138 A1 FR 2798138A1
Authority
FR
France
Prior art keywords
sep
sequence
nucleic acid
polypeptide
spg4
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
FR9911097A
Other languages
English (en)
Other versions
FR2798138B1 (fr
Inventor
Jean Weissenbach
Jamile Hazan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centre National de la Recherche Scientifique CNRS
Original Assignee
Centre National de la Recherche Scientifique CNRS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to FR9911097A priority Critical patent/FR2798138B1/fr
Application filed by Centre National de la Recherche Scientifique CNRS filed Critical Centre National de la Recherche Scientifique CNRS
Priority to JP2001521734A priority patent/JP2003508074A/ja
Priority to US09/830,902 priority patent/US6924126B1/en
Priority to CA2848454A priority patent/CA2848454C/fr
Priority to CA2348657A priority patent/CA2348657C/fr
Priority to PCT/FR2000/002433 priority patent/WO2001018198A1/fr
Publication of FR2798138A1 publication Critical patent/FR2798138A1/fr
Application granted granted Critical
Publication of FR2798138B1 publication Critical patent/FR2798138B1/fr
Priority to US11/155,492 priority patent/US20050266479A1/en
Priority to JP2011158305A priority patent/JP5965594B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Toxicology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Neurology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, et certaines de ses mutations responsables de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants. L'invention conceme également des vecteurs, des cellules transformées et des animaux transgéniques ainsi que des méthodes de diagnostic et des méthodes de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.

Description

<Desc/Clms Page number 1>
CLONAGE, EXPRESSION ET CARACTERISATION DU GENE SPG4 RESPONSABLE DE LA FORME LA PLUS FREQUENTE DE PARAPLEGIE SPASTIQUE AUTOSOMIQUE DOMINANTE.
L'invention concerne l'identification et la caractérisation du gène SPG4 codant pour la spastin, responsable de la forme la plus fréquente de paraplégie spastique familiale (PSF) autosomique dominante, le clonage et la caractérisation de son ADNc ainsi que les polypeptides correspondants L'invention concerne également des vecteurs, des cellules transformées et des animaux transgéniques ainsi que des méthodes de diagnostic et des méthodes de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'invention.
Les paraplégies spastiques familiales (PSF) sont des affections dégénératives du système nerveux central caractérisées par une spasticité bilatérale et progressive des membres inférieurs. Elles se manifestent cliniquement par des difficultés de la marche pouvant évoluer en une paralysie totale des deux jambes. La physiopathologie de cet ensemble de maladies est à ce jour peu documentée ; toutefois,les données anatomopathologiques permettent de conclure que l'atteinte est limitée aux faisceaux pyramidaux responsables de la motricité volontaire dans la moelle épinière (1). Il existe différentes formes cliniques et génétiques de PSF. On distingue cliniquement les PSF dites pures correspondant à une spasticité isolée des membres inférieurs, des PSF complexes pour lesquelles la spasticité des jambes est associée à d'autres manifestations cliniques de type neurologique ou non (2). D'un point de vue génétique, les PSF peuvent être transmises selon le mode autosomique dominant (PSF-AD), autosomique récessif (PSF-AR) ou lié au chromosome X (PSF-X). La forme pure de PSF qui est le plus souvent transmise selon le mode autosomique dominant demeure la plus fréquente (environ 80 % des PSF) (1). L'incidence des PSF qui reste difficile à estimer en raison des rares études épidémiologiques et de l'importante variabilité clinique varie de 0,9 100 000 au Danemark, 3 à 9,6 : 000 dans certaines régions d'Espagne (4) ou 14 : 000 en Norvège (5) (environ 3 100 000 en France).
En plus de cette grande variabilité clinique qui est observée non seulement entre les différentes familles mais aussi entre différents membres atteints d'une même famille, les PSF se caractérisent également par une importante hétérogénéité génétique. Dans le cas des PSF-AD, quatre loci ont été identifiés à ce jour sur les
<Desc/Clms Page number 2>
chromosomes 14 (locus SPG3) (6), 2 (locus SPG4) (7, 8), 15 (locus SPG6) (9) et 8 (locus SPG8) (10). L'étude d'un grand nombre de familles présentant une PSF-AD a montré que le gène porté par le chromosome 2 est un locus majoritaire de cette forme de la maladie, retrouvé dans 40 à 50 % des familles analysées (11,12). Un phénomène d'anticipation a été observé dans certaines familles de PSF liée au locus SPG4 ; ce phénomène a par la suite été associé à l'expansion d'une répétition (CAG)n mise en évidence dans 6 familles danoises (13) par la technique de RED (pour Rapid Expansion Détection) Cette expansion n'a cependant jamais pu être confirmée dans aucune des familles testées par cette même méthode ni par la recherche systématique de séquences de type (CAG)n dans les cartes physiques composées de clones YAC (pour Yeast Artificial Chromosome) ou BAC (pour Bacterial Artificial Chromosome) (Hazan et al., sous presse dans Genomics).
A ce jour, trois gènes responsables de deux formes de PSF-X et d'une forme de PSF-AR ont été identifiés. Des mutations dans le gène, codant pour une molécule d'adhérence cellulaire spécifique des neurones, L1-CAM (pour L1 Cell Adhesion Molécule), et localisé en Xq28 (locus SPG1) causent une forme complexe de PSF (14) dans laquelle la spasticité est associée à un retard mental, alors que des mutations dans le gène PLP (pour ProteoLipid Protein) situé en Xq21 (locus SPG2), codant pour une molécule constitutive de la couche de myéline, sont à l'origine de formes pures et complexes de PSF-X (15). Plus récemment des mutations dans un gène localisé en 16q24. 3 (locus SPG7), qui code pour la paraplegin, une ATPase mitochondriale de la famille protéique des AAA (pour ATPases Associated with diverse cellular Activities ) (16) ont été associées à des formes complexes et pures de PSF-AR (17), suggérant que des altérations de la phosphorylation oxydative (OXPHOS) peuvent être à l'origine de PSF.
Ainsi, il reste aujourd'hui un grand besoin d'identifier et de caractériser le gène responsable de la forme la plus fréquente de PSF-AD L'identification de ce gène devrait en particulier permettre, outre la possibilité d'un test de dépistage anténatal chez les familles concernées, de mieux comprendre certains des mécanismes moléculaires engendrant ces dégénérescences spécifiques de faisceaux nerveux de la moelle épinière, voire d'apporter des éléments de réponse quant à un traitement thérapeutique des malades
Ceci estjustement l'objet de la présente invention.
Après avoir délimité l'intervalle de localisation entre les marqueurs génétiques D2S352 et D2S2347 par l'étude des événements de recombinaison dans les familles
<Desc/Clms Page number 3>
de PSF liées au locus SPG4, les inventeurs ont établi un contig de BACs recouvrant une distance physique évaluée à environ 1,5 Mb et entrepris une stratégie de clonage positionnel basée sur le séquençage de l'intervalle SPG4 afin d'identifier de façon exhaustive tous les gènes localisés dans la région candidate. L'analyse de la séquence des deux BACs, D (b336P14) et G (B763N4), a révélé la présence d'un gène composé de 17 exons, s'étendant sur une distance d'environ 100 kb, et présentant une homologie avec les gènes codant pour des protéines de la famille des AAA. La comparaison de la séquence de ce gène entre les individus sains et atteints des familles de PSF-AD a permis de mettre en évidence différentes mutations chez les patients.
L'invention a ainsi pour objet l'identification et la caractérisation du gène SPG4 (ou SPAST) codant pour un nouveau membre nucléaire de la famille des AAA, responsable de la forme la plus fréquente de PSF-AD.
Sous un premier aspect, la présente invention a pour objet un acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15 nucléotides consécutifs, de préférence 20,25, 30,50, 100 ou 200 nucléotides consécutifs, d'une séquence choisie parmi le groupe comprenant : - la séquence SEQ ID No. 1, séquence génomique du gène SPG4 humain ; - les séquences nucléiques homologues ou variantes de l'acide nucléique de séquence
SEQ ID No. 1 ; - leur séquence complémentaire ; et - la séquence de leur ARN correspondant.
La présente invention concerne, bien entendu, aussi bien les séquences ADN qu'ARN ainsi que les séquences qui s'hybrident avec elles, de même que les ADNs double brin correspondants.
Par acide nucléique, séquence nucléique ou d'acide nucléique, polynucléotide, oligonucléotide, séquence de polynucléotide, séquence nucléotidique, termes qui seront employés indifféremment dans la présente description, on entendra désigner aussi bien un ADN double brin, un ADN simple brin que des produits de transcription desdits ADNs, et/ou un fragment d'ARN, lesdits fragments naturels isolés, ou de synthèse, comportant ou non des nucléotides non naturels, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment ou une région d'un acide nucléique On entend par fragment d'ADN et/ou d'ARN naturel isolé, ou de synthèse, comportant ou non des nucléotides non naturels,
<Desc/Clms Page number 4>
un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment, un segment ou une région d'un acide nucléique.
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à- dire à l'état naturel. Il s'agit de séquences qui ont été isolées et/ou purifiées, c'est-à- dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie, leur environnement ayant été au moins partiellement modifié.
Par séquence nucléique homologue , on entendra désigner les séquences nucléiques présentant, par rapport à la séquence nucléique de référence certaines modifications comme en particulier une délétion, une troncation, un allongement, une fusion chimérique, et/ou une mutation, notamment ponctuelle, et dont la séquence nucléique présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence nucléique de référence. Il s'agit de préférence de séquences dont les séquences complémentaires sont susceptibles de s'hybrider spécifiquement avec une des séquences de l'invention. De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent au moins 80 %, de préférence 90 % ou 95 % d'identité après alignement entre l'une des deux séquences et la séquence complémentaire de l'autre.
Une hybridation dans des conditions de forte stringence signifie que les conditions de température et de force ionique sont choisies de telle manière qu'elles permettent le maintien de l'hybridation entre deux fragments d'ADN complémentaires A titre illustratif, des conditions de forte stringence de l'étape d'hybridation aux fins de définir les fragments polynucléotidiques décrits ci-dessus, sont avantageusement les suivantes
L'hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation à 42 C pendant 3 heures en tampon phosphate (20 mM, pH 7,5) contenant 5 x SSC (1 x SSC correspond à une solution 0,15 M NaCI + 0,015 M citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardt's, 5 % de dextran sulfate et 1 % d'ADN de sperme de saumon ; (2) hybridation proprement dite pendant 20 heures à une température dépendant de la taille de la sonde (i.e. : 42 C, pour une sonde de taille > 100 nucléotides) suivie de 2 lavages de 20 minutes à 20 C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes à 20 C en 0,1x SSC + 0,1% SDS. Le dernier lavage est pratiqué en 0,1x SSC + 0,1% SDS pendant 30 minutes à 60 C pour une sonde de taille > 100 nucléotides. Les conditions d'hybridation de forte stringence décrites ci-dessus pour un polynucléotide de taille
<Desc/Clms Page number 5>
définie, seront adaptées par l'homme du métier pour des oligonucléotides de taille plus grande ou plus petite, selon l'enseignement de Sambrook et al , 1989.
Par séquence nucléique variante ou acide nucléique variant d'une séquence nucléique de référence, on entendra désigner l'ensemble des séquences nucléiques correspondant à des variants alléliques, c'est-à-dire des variations individuelles de la séquence nucléique de référence. Ces séquences mutées naturelles correspondent à des polymorphismes présents chez les mammifères, en particulier chez l'être humain et, notamment, à des polymorphismes pouvant conduire à la survenue et/ou au développement de pathologie.
Si les séquences selon l'invention concernent les séquences normales, elles concernent également les séquences mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10 % de mutations par rapport à la séquence normale.
En particulier, les séquences nucléiques variantes comprendront toute séquence d'au moins 15 nucléotides consécutifs, de préférence 20,25, 30,50, 100 ou 200 nucléotides consécutifs, d'une séquence polymorphique de la séquence génomique du gène SPG4 humain de séquence SEQ ID No. 1, et dont la séquence d'acide nucléique présente par rapport à la séquence SEQ ID No. 1 au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidu d'acide aminé. Dans le cas présent, les séquences nucléiques variantes présentant au moins une mutation seront ici liées aux pathologies de type PSF-AD liées au locus SPG4.
De préférence, la présente invention concerne des séquences nucléiques mutées dans lesquelles les mutations conduisent à une modification de la séquence d'acides aminés du polypeptide codé par la séquence normale.
On entendra également désigner par séquences nucléiques variantes tout ARN ou ADNc résultant d'une mutation d'un site d'épissage de la séquence nucléique génomique SEQ ID No. 1.
L'invention concerne de préférence un acide nucléique purifié ou isolé selon la présente invention, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe suivant : - la séquence SEQ ID No 1 ; - la séquence SEQ ID No. 2, séquence de l'ADNc codant pour la spastin humaine ; - la séquence SEQ ID No 72, séquence de l'ADNc incomplet codant pour la spastin murine représentée à la figure 5, ligne "Mouse" ;
<Desc/Clms Page number 6>
- les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1,
SEQ ID No. 2 ou SEQ ID No. 72 ; - leur séquence complémentaire ; -la séquence de leur ARN correspondant.
De préférence, l'invention concerne un acide nucléique purifié ou isolé selon l'invention, caractérisé en ce qu'il comprend au moins une mutation dont la position et la nature sont identifiées dans le tableau 5.
Les amorces ou sondes, caractérisées en ce qu'elles comprennent une séquence d'un acide nucléique selon l'invention, font également partie de l'invention
La présente invention concerne ainsi l'ensemble des amorces qui peuvent être déduites des séquences nucléotidiques de l'invention et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques de l'invention, en particulier les séquences mutées, en utilisant notamment une méthode d'amplification telle que la méthode PCR, ou une méthode apparentée.
La présente invention concerne également l'ensemble des sondes qui peuvent être déduites des séquences nucléotidiques de l'invention, notamment des séquences capables de s'hybrider avec elles, et qui peuvent permettre de mettre en évidence lesdites séquences nucléotidiques, en particulier de discriminer les séquences normales des séquences mutées.
La présente invention concerne en particulier les sondes ou amorces de séquences choisies parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce, pour la détection, l'identification, le dosage ou l'amplification de séquence d'acide nucléique.
Selon l'invention, les polynucléotides pouvant être utilisés comme sonde ou comme amorce dans des procédés de détection, d'identification, de dosage ou d'amplification de séquence nucléique, présenteront une taille minimale de 15 bases, de préférence de 20 bases, ou mieux de 25 à 30 bases.
L'ensemble des sondes et amorces selon l'invention pourront être marquées directement ou indirectement par un composé radioactif ou non radioactif par des méthodes bien connues de l'homme du métier, afin d'obtenir un signal détectable et/ou quantifiable.
Les séquences de polynucléotides selon l'invention non marquées peuvent être utilisées directement comme sonde ou amorce.
<Desc/Clms Page number 7>
Les séquences sont généralement marquées pour obtenir des séquences utilisables pour de nombreuses applications. Le marquage des amorces ou des sondes selon l'invention est réalisé par des éléments radioactifs ou par des molécules non radioactives.
Parmi les isotopes radioactifs utilisés, on peut citer le 32P, le 33P, le 35S, le 3H ou le 1251 . Les entités non radioactives sont sélectionnées parmi les ligands tels la biotine, l'avidine, la streptavidine, la dioxygénine, les haptènes, les colorants, les agents luminescents tels que les agents radioluminescents, chémiluminescents, bioluminescents, fluorescents, phosphorescents.
Les polynucléotides selon l'invention peuvent ainsi être utilisés comme amorce et/ou sonde dans des procédés mettant en oeuvre notamment la technique de PCR (réaction en chaîne à la polymérase) (Erlich, 1989 ; Innis et al., 1990, et Rolfs et al., 1991). Cette technique nécessite le choix de paires d'amorces oligonucléotidiques encadrant le fragment qui doit être amplifié. On peut, par exemple, se référer à la technique décrite dans le brevet américain U.S. N 4,683,202. Les fragments amplifiés peuvent être identifiés, par exemple après une électrophorèse en gel d'agarose ou de polyacrylamide, ou après une technique chromatographique comme la filtration sur gel ou la chromatographie échangeuse d'ions, puis séquences. La spécificité de l'amplification peut être contrôlée en utilisant comme amorce les séquences nucléotidiques de polynucléotides de l'invention comme matrice, des plasmides contenant ces séquences ou encore les produits d'amplification dérivés Les fragments nucléotidiques amplifiés peuvent être utilisés comme réactifs dans des réactions d'hybridation afin de mettre en évidence la présence, dans un échantillon biologique, d'un acide nucléique cible de séquence complémentaire à celle desdits fragments nucléotidiques amplifiés.
L'invention vise également les acides nucléiques susceptibles d'être obtenus par amplification à l'aide d'amorces selon l'invention.
D'autres techniques d'amplification de l'acide nucléique cible peuvent être avantageusement employées comme alternative à la PCR (PCR-like) à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Par PCR-like on entendra désigner toutes les méthodes mettant en oeuvre des reproductions directes ou indirectes des séquences d'acides nucléiques, ou bien dans lesquelles les systèmes de marquage ont été amplifiés, ces techniques sont bien entendu connues, en général il s'agit de l'amplification de l'ADN par une polymérase ; lorsque l'échantillon d'origine est un ARN il convient préalablement d'effectuer une transcription
<Desc/Clms Page number 8>
reverse. Il existe actuellement de très nombreux procédés permettant cette amplification, comme par exemple la technique SDA (Strand Displacement Amplification) ou technique d'amplification à déplacement de brin (Walker et al., 1992), la technique TAS (Transcription-based Amplification System) décrite par Kwoh et al en 1989, la technique 3SR (Self-Sustained Séquence Replication) décrite par Guatelli et al. en 1990, la technique NASBA (Nucleic Acid Séquence Based Amplification) décrite par Kievitis et al. en 1991, la technique TMA (Transcription Mediated Amplification), la technique LCR (Ligase Chain Reaction) décrite par Landegren et al. en 1988 et perfectionnée par Barany et al. en 1991, qui emploie une ligase thermostable, la technique de RCR (Repair Chain Reaction) décrite par Segev en 1992, la technique CPR (Cycling Probe Reaction) décrite par Duck et al en 1990, la technique d'amplification à la Q-béta-réplicase décrite par Miele et al. en 1983 et perfectionnée notamment par Chu et al. en 1986 et Lizardi et al. en 1988, puis par Burg et al ainsi que par Stone et al. en 1996.
Dans le cas où le polynucléotide cible à détecter est un ARNm, on utilisera avantageusement, préalablement à la mise en oeuvre d'une réaction d'amplification à l'aide des amorces selon l'invention ou à la mise en oeuvre d'un procédé de détection à l'aide des sondes de l'invention, une enzyme de type transcriptase reverse afin d'obtenir un ADNc à partir de l'ARNm contenu dans l'échantillon biologique. L'ADNc obtenu servira alors de cible pour les amorces ou les sondes mises en oeuvre dans le procédé d'amplification ou de détection selon l'invention
La technique d'hybridation de sondes peut être réalisée de manières diverses (Matthews et al., 1988). La méthode la plus générale consiste à immobiliser l'acide nucléique extrait des cellules de différents tissus ou de cellules en culture sur un support (tels que la nitrocellulose, le nylon, le polystyrène) et à incuber, dans des conditions bien définies, l'acide nucléique cible immobilisé avec la sonde. Après l'hybridation, l'excès de sonde est éliminé et les molécules hybrides formées sont détectées par la méthode appropriée (mesure de la radioactivité, de la fluorescence ou de l'activité enzymatique liée à la sonde).
Selon un autre mode de mise en oeuvre des sondes nucléiques selon l'invention, ces dernières peuvent être utilisées comme sonde de capture. Dans ce cas, une sonde, dite sonde de capture , est immobilisée sur un support et sert à capturer par hybridation spécifique l'acide nucléique cible obtenu à partir de l'échantillon biologique à tester et l'acide nucléique cible est ensuite détecté grâce à une seconde sonde, dite sonde de détection , marquée par un élément facilement détectable.
<Desc/Clms Page number 9>
Les séquences de site accepteur ou donneur d'épissage identifiées au tableau 3 font également partie de la présente invention.
Sous un autre aspect, l'invention comprend une méthode pour le criblage de banques d'ADNc ou d'ADN génomique, ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en #uvre une séquence nucléique selon l'invention.
Parmi ces méthodes, on peut citer notamment : - le criblage de banques d'ADNc et le clonage des ADNc isolés (Sambrook et al.,
1989; Suggs et al., 1981 ; Woo et al., 1979), à l'aide des séquences nucléiques selon l'invention ; - le criblage de banques génomiques, par exemple de BACs (Chumakov et al., 1992 ;
Chumakov et al., 1995) et éventuellement une analyse génétique en FISH (Cherif et al., 1990) à l'aide de séquences selon l'invention, permettant l'isolement et la localisation chromosomique, puis le séquençage complet du gène SPG4 codant pour la spastin.
En particulier, ces méthodes selon l'invention pourront être mises en oeuvre pour l'identification et ainsi l'obtention de la séquence génomique ou de l'ADNc du gène SPG4 chez d'autres mammifères, notamment la souris.
Ces méthodes de criblage et/ou de clonage comprendront en particulier une étape d'hybridation d'un acide nucléique selon l'invention avec un acide nucléique contenu dans une banque génomique ou d'ADNc.
L'invention comprend aussi une méthode d'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4 de séquence SEQ ID No. 1, caractérisée en ce qu'elle met en oeuvre un acide nucléique selon l'invention.
Les outils informatiques à la disposition de l'homme du métier lui permettent aisément d'identifier à partir des séquences nucléiques génomiques selon l'invention les boîtes régulatrices promotrices nécessaires et suffisantes au contrôle de l'expression génique, notamment les boîtes TATA, CCAAT, GC, ainsi que les séquences régulatrices stimulatrices ( enhancer ) ou inhibitrices ( silencers ) qui contrôlent en CIS l'expression des gènes selon l'invention ; parmi ces séquences régulatrices, il convient de citer l'IRE, MRE, CRE.
L'invention concerne également des méthodes pour l'identification de mutations portées par le gène SPG4 humain caractérisées en ce qu'elles mettent en #uvre une
<Desc/Clms Page number 10>
séquence nucléique selon l'invention, notamment de mutations responsables de la paraplégie spastique familiale autosomique dominante.
Ces méthodes d'identification de ces mutations comprendront en particulier les étapes suivantes : (i) isolement de l'ADN à partir de l'échantillon biologique à analyser, ou obtention d'un ADNc à partir de l'ARNm de l'échantillon biologique ; (ii) amplification spécifique de l'ADN cible susceptible de présenter une mutation à l'aide d'amorces selon l'invention , (iii) analyse des produits d'amplification, notamment la taille et/ou la séquence des produits d'amplification, par rapport à une séquence de référence.
Par méthodes d'identification de mutation selon l'invention, on entend également désigner une méthode permettant d'obtenir l'acide nucléique sur lequel a été identifiée ladite mutation.
Font également partie de l'invention, les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention présentant des mutations susceptibles de modifier l'expression de la protéine correspondante.
Les acides nucléiques caractérisés en ce qu'ils sont susceptibles d'être obtenus par une des méthodes précédentes selon l'invention, ou les acides nucléiques capables de s'hybrider dans des conditions de forte stringence (homologie d'au moins 80 % entre une des deux séquences et la séquence complémentaire de l'autre) avec lesdits acides nucléiques, font partie de l'invention, notamment les acides nucléiques variants ou homologues, en particulier les séquences nucléiques de variants alléliques du gène SPG4 de séquence SEQ ID No. 1 ou de son ADNc de séquence SEQ ID No 2, ainsi que les séquences génomiques des gènes homologues d'autres mammifères tels que la souris.
Dans la présente description, on entendra désigner par "Spg4" le gène de souris homologue au gène humain SPG4.
L'utilisation d'une séquence d'acide nucléique selon l'invention comme sonde ou amorce pour le criblage de banque génomique ou d'ADNc fait bien entendu partie de l'objet de la présente invention.
Sous un autre aspect, l'invention comprend un polypeptide purifié ou isolé codé par un acide nucléique selon l'invention.
Dans la présente description, on utilisera le terme polypeptide pour désigner également une protéine ou un peptide.
De préférence, la présente invention concerne un polypeptide, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant :
<Desc/Clms Page number 11>
- la séquence SEQ ID No. 3, correspondant à la spastin humaine codée par la séquence SEQ ID No. 2 de l'ADNc du gène SPG4 humain ; - la séquence SEQ ID No. 73, correspondant à un fragment de la spastin murine codée par la séquence SEQ ID No. 72 de l'ADNc incomplet du gène Spg4 de souris, la séquence SEQ ID No 73 est représentée à la figure 4A, ligne "SPAST~MOUSE", - les séquences de polypeptides homologues et variants du polypeptide de séquence
SEQ ID No. 3 ou SEQ ID No. 73 ; et - les séquences de leurs fragments d'au moins 8, 10,15, 30 ou 50 acides aminés consécutifs.
De manière également préférée, l'invention a pour objet un polypeptide, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe suivant : - la séquence SEQ ID No. 3 et la séquence SEQ ID No 73, lesquelles séquences portant au moins une des mutations dont la nature et la localisation sont identifiées au tableau 5 ci-après ; et - les séquences de leurs fragments d'au moins 8, 10,15, 30 ou 50 acides aminés consécutifs.
Il doit être compris que l'invention ne concerne pas les polypeptides sous forme naturelle, c'est-à-dire qu'ils ne sont pas pris dans leur environnement. En effet, l'invention concerne les peptides obtenus par purification à partir de sources naturelles, ou bien obtenus par recombinaison génétique, ou encore par synthèse chimique et pouvant alors comporter des amino-acides non naturels. La production d'un polypeptide recombinant, qui peut être réalisée en utilisant l'une des séquences nucléotidiques selon l'invention est particulièrement avantageuse car elle permet d'obtenir un niveau de pureté accrue du polypeptide désiré.
Par polypeptide homologue, on entendra désigner les polypeptides présentant certaines modifications par rapport au polypeptide de référence, comme en particulier une ou plusieurs délétions, troncations, un allongement, une fusion chimérique, et/ou une ou plusieurs substitutions, et dont la séquence d'acides aminés présente au moins 80 %, de préférence 90 % ou 95 %, d'identité après alignement avec la séquence d'acides aminés de référence.
Par polypeptide variant (ou variant protéique), on entendra désigner l'ensemble des polypeptides codés par les séquences nucléiques variantes telles que précédemment définies.
<Desc/Clms Page number 12>
En particulier, les polypeptides variants comprendront tout polypeptide codé par la séquence génomique mutée du gène SPG4 de séquence SEQ ID N 1, et dont la séquence d'acides aminés présente au moins une mutation correspondant notamment à une troncation, délétion, substitution et/ou addition de résidus d'acides aminés par rapport à la séquence SEQ ID No. 3. Dans le cas présent, les polypeptides variants présentant au moins une mutation seront liés aux pathologies de type PSF-AD.
On entendra également désigner par polypeptide variant tout polypeptide résultant de mutation d'un site d'épissage dans la séquence nucléique génomique SEQ ID No. 1.
L'invention comprend également les vecteurs de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'invention.
Les vecteurs selon l'invention, caractérisés en ce qu'ils comportent les éléments permettant l'expression et/ou la sécrétion desdites séquences dans une cellule hôte, ou encore une séquence d'adressage cellulaire, font également partie de l'invention.
Les vecteurs caractérisés en ce qu'ils comportent une séquence de promoteur et/ou de régulateur selon l'invention, font également partie de l'invention.
Lesdits vecteurs comporteront de préférence un promoteur, des signaux d'initiation et de terminaison de la traduction, ainsi que des régions appropriées de régulation de la transcription. Ils doivent pouvoir être maintenus de façon stable dans la cellule et peuvent éventuellement posséder des signaux particuliers spécifiant la sécrétion de la protéine traduite.
Ces différents signaux de contrôle sont choisis en fonction de l'hôte cellulaire utilisé. A cet effet, les séquences d'acide nucléique selon l'invention peuvent être insérées dans des vecteurs à réplication autonome au sein de l'hôte choisi, ou des vecteurs intégratifs de l'hôte choisi.
Parmi les systèmes à réplication autonome, on utilisera de préférence en fonction de la cellule hôte, des systèmes de type plasmidique ou viral, les vecteurs viraux pouvant notamment être des adénovirus (Perricaudet et al., 1992), des rétrovirus, des lentivirus, des poxvirus ou des virus herpétiques (Epstein et al., 1992).
L'homme du métier connaît les technologies utilisables pour chacun de ces systèmes.
Lorsque l'on souhaitera l'intégration de la séquence dans les chromosomes de la cellule hôte, on pourra utiliser par exemple des systèmes de type plasmidique ou viral ; de tels virus seront, par exemple, les rétrovirus (Temin, 1986), ou les AAV (Carter, 1993).
<Desc/Clms Page number 13>
Parmi les vecteurs non viraux, on préfère les polynucléotides nus tels que l'ADN nu ou l'ARN nu selon la technique développée par la société VICAL, les chromosomes artificiels de levure (YAC, yeast artificial chromosome) pour l'expression dans la levure, les chromosomes artificiels de souris (MAC, mouse artificial chromosome) pour l'expression dans les cellules murines et de manière préférée les chromosomes artificiels d'homme (HAC, human artificial chromosome) pour l'expression dans les cellules humaines.
De tels vecteurs seront préparés selon les méthodes couramment utilisées par l'homme du métier, et les clones en résultant peuvent être introduits dans un hôte approprié par des méthodes standard, telles que par exemple la lipofection, l'électroporation, le choc thermique.
L'invention comprend en outre les cellules hôtes, notamment les cellules eucaryotes et procaryotes, transformées par les vecteurs selon l'invention ainsi que les animaux transgéniques, excepté l'Homme, comprenant une desdites cellules transformées selon l'invention.
Parmi les cellules utilisables à ces fins, on peut citer bien entendu les cellules bactériennes (Olins et Lee, 1993), mais également les cellules de levure (Buckholz, 1993), de même que les cellules animales, en particulier les cultures de cellules de mammifères (Edwards et Aruffo, 1993), et notamment les cellules d'ovaire de hamster chinois (CHO), mais également les cellules d'insectes dans lesquelles on peut utiliser des procédés mettant en #uvre des baculovirus par exemple (Luckow, 1993). Un hôte cellulaire préféré pour l'expression des protéines de l'invention est constitué par les cellules CHO.
Parmi les mammifères selon l'invention, on préférera des animaux tels que les souris, les rats ou les lapins, exprimant un polypeptide selon l'invention.
Parmi les mammifères selon l'invention, on préférera également ceux comprenant une cellule transformée caractérisée en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations dont la position et la nature sont identifiées dans le tableau 5 ou identifiées par une méthode selon la présente invention.
Parmi les mammifères selon l'invention, on préférera également des animaux tels que les souris, les rats ou les lapins, caractérisés en ce que le gène codant pour la spastin selon l'invention, n'est pas fonctionnel ou est invalidé.
Parmi les modèles animaux plus particulièrement intéressants ici, on trouve notamment :
<Desc/Clms Page number 14>
- les animaux transgéniques présentant au moins dans une de leurs deux séquences alléliques du gène SPG4, une au moins des mutations dont la position et la nature sont identifiées au tableau 5 ou identifiées par une méthode selon la présente invention. Ces animaux transgéniques sont obtenus par exemple par recombinaison homologue sur cellules souches embryonnaires, transfert de ces cellules souches à des embryons, sélection des chimères affectées au niveau des lignées reproductrices, et croissance desdites chimères ; - les animaux (de préférence souris) transgéniques surexprimant le gène SPG4 dans lequel pourra être introduite une desdites mutations selon l'invention. Les souris sont obtenues par exemple par transfection de copie de ce gène sous contrôle d'un promoteur fort de nature ubiquitaire, ou sélectif d'un type de tissu, ou après transcription virale ; - les animaux (de préférence souris) transgéniques rendus déficients pour le gène
SPG4 selon l'invention, par inactivation à l'aide du système LOXP/CRE recombinase (Rohlmann et al., 1996) ou de tout autre système d'inactivation de l'expression de ce gène.
Les cellules et mammifères selon l'invention sont utilisables dans une méthode de production d'un polypeptide selon l'invention, comme décrit ci-dessous, et peuvent également servir à titre de modèle d'analyse et pour le criblage de banque d'ADN (génomique ou d'ADNc).
Les cellules ou mammifères transformés tels que décrits précédemment peuvent être ainsi utilisés à titre de modèles afin d'étudier les interactions entre les polypeptides selon l'invention, et les composés chimiques ou protéiques, impliqués directement ou indirectement dans les activités des polypeptides selon l'invention, ceci afin d'étudier les différents mécanismes et interactions mis en jeu.
Surtout, ils peuvent être utilisés pour la sélection de produits interagissant avec les polypeptides selon l'invention, notamment la spastin humaine de séquence SEQ ID No. 3 ou ses variants selon l'invention, à titre de cofacteur, ou d'inhibiteur, notamment compétitif, ou encore ayant une activité agoniste ou antagoniste de l'activité des polypeptides selon l'invention. De préférence, on utilisera lesdites cellules transformées ou animaux transgéniques à titre de modèle permettant, notamment, la sélection de produits permettant de lutter contre la pathologie liée au gène SPG4 mentionnée ci-dessus.
L'invention concerne également l'utilisation de cellule, de mammifère ou de polypeptide selon l'invention pour le criblage de composé chimique ou biochimique
<Desc/Clms Page number 15>
pouvant interagir directement ou indirectement avec les polypeptides selon l'invention, et/ou capable de moduler l'expression ou l'activité de ces polypeptides.
L'invention concerne également l'utilisation d'une séquence d'acide nucléique selon l'invention pour la synthèse de polypeptides recombinants.
La méthode de production d'un polypeptide de l'invention sous forme recombinante est elle-même comprise dans la présente invention, et se caractérise en ce que l'on cultive les cellules transformées, notamment les cellules ou mammifères de la présente invention, dans des conditions permettant l'expression d'un polypeptide recombinant codé par une séquence d'acide nucléique selon l'invention, et que l'on récupère ledit polypeptide recombinant.
Les polypeptides recombinants, caractérisés en ce qu'ils sont susceptibles d'être obtenus par ladite méthode de production, font également partie de l'invention.
Les polypeptides recombinants obtenus comme indiqué ci-dessus, peuvent aussi bien se présenter sous forme glycosylée que non glycosylée et peuvent présenter ou non la structure tertiaire naturelle.
Ces polypeptides peuvent être produits à partir des séquences d'acide nucléique définies ci-dessus, selon les techniques de production de polypeptides recombinants connues de l'homme du métier. Dans ce cas, la séquence d'acide nucléique utilisée est placée sous le contrôle de signaux permettant son expression dans un hôte cellulaire.
Un système efficace de production d'un polypeptide recombinant nécessite de disposer d'un vecteur et d'une cellule hôte selon l'invention.
Ces cellules peuvent être obtenues par l'introduction dans des cellules hôtes d'une séquence nucléotidique insérée dans un vecteur tel que défini ci-dessus, puis la mise en culture desdites cellules dans des conditions permettant la réplication et/ou l'expression de la séquence nucléotidique transfectée.
Les procédés de purification de polypeptide recombinant utilisés sont connus de l'homme du métier. Le polypeptide recombinant peut être purifié à partir de lysats et extraits cellulaires, du surnageant du milieu de culture, par des méthodes utilisées individuellement ou en combinaison, telles que le fractionnement, les méthodes de chromatographie, les techniques d'immunoaffinité à l'aide d'anticorps monoclonaux ou polyclonaux spécifiques, etc..
Les polypeptides selon la présente invention peuvent être obtenus par synthèse chimique et ce en utilisant l'une des nombreuses synthèses peptidiques connues, par exemple les techniques mettant en oeuvre des phases solides ou des techniques
<Desc/Clms Page number 16>
utilisant des phases solides partielles, par condensation de fragments ou par une synthèse en solution classique.
La technique de synthèse en phase solide est bien connue de l'homme du métier. Voir notamment Stewart et al. (1984) et Bodansky (1984)
Les polypeptides obtenus par synthèse chimique et pouvant comporter des acides aminés non naturels correspondants sont également compris dans l'invention.
Les anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'invention, font partie de l'invention.
Des anticorps polyclonaux spécifiques peuvent être obtenus à partir d'un sérum d'un animal immunisé contre les polypeptides selon l'invention, notamment produit par recombinaison génétique ou par synthèse peptidique, selon les modes opératoires usuels.
On notera notamment l'intérêt d'anticorps reconnaissant de façon spécifique certains polypeptides, vanants, ou leurs fragments immunogènes, selon l'invention.
Les anticorps monoclonaux spécifiques peuvent être obtenus selon la méthode classique de culture d'hybridomes décrite par Kôhler et Milstein, 1975.
Les anticorps selon l'invention sont, par exemple, des anticorps chimériques, des anticorps humanisés, des fragments Fab ou F(ab')2 Ils peuvent également se présenter sous forme d'immunoconjugués ou d'anticorps marqués afin d'obtenir un signal détectable et/ou quantifiable.
L'invention concerne également des méthodes pour la détection et/ou la purification d'un polypeptide selon l'invention, caractérisées en ce qu'elles mettent en #uvre un anticorps selon l'invention.
L'invention comprend en outre des polypeptides purifiés, caractérisés en ce qu'ils sont obtenus par une méthode selon l'invention.
Par ailleurs, outre leur utilisation pour la purification des polypeptides, les anticorps de l'invention, en particulier les anticorps monoclonaux, peuvent également être utilisés pour la détection de ces polypeptides dans un échantillon biologique
Ils constituent ainsi un moyen d'analyse immunocytochimique ou immuno- histochimique de l'expression des polypeptides selon l'invention, notamment le polypeptide de séquence SEQ ID No. 3 ou l'un de ses variants, sur des coupes de tissus spécifiques, par exemple par immunofluorescence, marquage à l'or, immuno- conjugués enzymatiques
<Desc/Clms Page number 17>
Ils pourront permettent notamment de mettre en évidence une expression anormale de ces polypeptides dans les tissus ou prélèvements biologiques, ce qui les rend utiles pour le suivi de l'évolution de la maladie et le diagnostic moléculaire.
Plus généralement, les anticorps de l'invention peuvent être avantageusement mis en #uvre dans toute situation où l'expression d'un polypeptide selon l'invention, normal ou muté, doit être observée
Font également partie de l'invention, les méthodes de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou de toute anomalie génétique du gène SPG4 selon l'invention, caractérisées en ce qu'elles mettent en oeuvre une séquence d'acide nucléique ou un anticorps selon l'invention.
La présente invention comprend ainsi une méthode de diagnostic génotypique de la pathologie associée au gène SPG4, caractérisée en ce que l'on met en oeuvre une séquence d'acide nucléique selon l'invention.
De préférence, l'invention concerne une méthode de diagnostic génotypique de la maladie associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisé en ce qu'il comporte les étapes suivantes : a) le cas échéant, isolement de l'ADN génomique à partir de l'échantillon biologique à analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ; b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'invention ; c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
L'invention comprend également une méthode de diagnostic de la maladie associée à une expression anormale d'un polypeptide codé par le gène SPG4, notamment le polypeptide de séquence SEQ ID No. 3, caractérisée en ce que l'on met en contact un ou des anticorps selon l'invention avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
Ces méthodes visent par exemple les méthodes de diagnostic de la PSF-AD associée à la présence de mutation dans le gène SPG4 selon l'invention, notamment anténatal, en déterminant à partir d'un prélèvement biologique du patient la présence de mutations dans au moins une des séquences décrites précédemment. Les
<Desc/Clms Page number 18>
séquences d'acides nucléiques analysées pourront aussi bien être de l'ADN génomique, de l'ADNc, ou de l'ARNm.
Des acides nucléiques ou anticorps basés sur la présente invention pourront également être utilisés pour permettre un diagnostic positif chez un malade ou un diagnostic pré-symptomatique chez un sujet à risque, notamment avec antécédent familial.
Les méthodes permettant de mettre en évidence une mutation dans un gène par rapport au gène sauvage sont, bien entendu, très nombreuses On peut essentiellement les diviser en deux grandes catégories. Le premier type de méthode est celui dans lequel la présence d'une mutation est détectée par comparaison de la séquence mutée avec la séquence correspondante sauvage, et le second type est celui dans lequel la présence de la mutation est détectée de façon indirecte, par exemple par évidence de mésappariements dus à la présence de la mutation.
Ces méthodes peuvent mettre en oeuvre les sondes et amorces de la présente invention décrites. Il s'agit généralement de séquences nucléiques d'hybridation purifiées comprenant au moins 15 nucléotides, de préférence 20, 25 ou 30 nucléotides, caractérisées en ce qu'elles peuvent s'hybrider spécifiquement avec une séquence nucléique selon l'invention.
De préférence, les conditions d'hybridation spécifiques sont telles que celles définies précédemment ou dans les exemples. La longueur de ces séquences nucléiques d'hybridation peut varier de 15,20 ou 30 à 200 nucléotides, particulièrement de 20 à 50 nucléotides.
Parmi les méthodes de détermination d'une variabilité allélique, d'une mutation, d'une délétion, d'une perte d'hétérozygotie ou d'une anomalie génétique, on préfère les méthodes comprenant au moins une étape d'amplification dite par PCR (réaction en chaîne par la polymérase) ou par PCR-like de la séquence cible selon l'invention susceptible de présenter une anomalie à l'aide de couple d'amorces de séquences nucléotidiques selon l'invention. Les produits amplifiés pourront être traités à l'aide d'enzyme de restriction approprié avant de procéder à la détection ou au dosage du produit ciblé.
Les mutations du gène SPG4 selon l'invention, peuvent être responsables de différentes modifications de son produit de traduction, modifications utilisables pour une approche diagnostique. En effet, les modifications d'antigénicité liées à ces mutations peuvent permettre la mise au point d'anticorps spécifiques La discrimination du produit de gène muté peut être réalisée par ces méthodes Toutes ces modifications
<Desc/Clms Page number 19>
peuvent être utilisées dans une approche diagnostique grâce à plusieurs méthodes bien connues basées sur l'utilisation d'anticorps mono- ou polyclonaux reconnaissant le polypeptide normal ou des variants mutés, comme par exemple par RIA ou par ELISA.
Sous un autre aspect, l'invention comprend une méthode de sélection d'un composé chimique ou biochimique capable de prévenir et/ou de traiter la PSF-AD associée au gène SPG4, caractérisée en ce que l'on met en #uvre une séquence d'acide nucléique selon l'invention, un polypeptide selon l'invention, un vecteur selon l'invention, une cellule selon l'invention, un mammifère selon l'invention ou un anticorps selon l'invention.
Sont également comprises dans l'invention, les méthodes de sélection de composés chimiques ou biochimiques capables d'interagir directement ou indirectement avec des polypeptides selon l'invention ou avec les acides nucléiques selon l'invention, et/ou permettant de moduler l'expression ou l'activité de ces polypeptides, caractérisées en ce qu'elles comprennent la mise en contact d'un polypeptide selon l'invention, d'une cellule transformée selon l'invention, ou d'un mammifère selon l'invention, avec un composé candidat et, la détection d'une modification de l'activité dudit polypeptide.
Par exemple, mais sans s'y limiter, on peut citer une méthode d'identification de molécules capables d'interagir avec un polypeptide selon l'invention en utilisant un système de double hybride bactérien ou levure tel que le Matchmaker Two Hybrid System 2, selon les instructions du manuel accompagnant le Matchmaker Two Hybrid System 2 (Catalogue N K1604-1, Clontech).
Les acides nucléiques codant pour des protéines interagissant avec les séquences promotrices et/ou régulatrices du gène SPG4 selon l'invention, peuvent être criblés et/ou sélectionnés en utilisant un système de simple hybride tel que celui décrit dans le manuel accompagnant le kit Matchmaker One-Hybrid System de Clontech (Catalog N K1603-).
Sous un autre aspect, l'invention comprend l'utilisation d'acide nucléique ou de polypeptide selon l'invention, d'un vecteur selon l'invention, d'une cellule selon l'invention, ou d'un mammifère selon l'invention, pour l'étude de l'expression ou de l'activité du gène SPG4.
<Desc/Clms Page number 20>
D'autres caractéristiques et avantages de l'invention apparaissent dans la suite de la description avec les exemples et les figures dont les légendes sont représentées ci-après.
LEGENDES DES FIGURES FIGURES 1A, 1B et 1C : physique de l'intervalle SPG4 et organisation génomique de SPG4.
FIGURE 1A : La région candidate de 1,5 Mb est délimitée par les marqueurs génétiques D2S352 et D2S2347 indiqués en caractères gras. La position des marqueurs polymorphes et autres STSs est indiquée en caractères standards alors que la position des ESTs est indiquée en italique. Les clones de BAC constituant la carte de préséquençage sont représentés par des rectangles dont le nom figure au- dessus et la taille précise du clone au-dessous si celle-ci a pu être déterminée Le nom des BACs A, B, C... est suivi d'une parenthèse contenant le nom du clone précédé d'un b si le clone est issu de la banque de BACs CITB~978~SKB ou d'un B si celui-ci provient de la banque RPCI-11.
FIGURE 1B : Représentation schématique du gène SPG4 qui chevauche les BACs D (b336P14) et G (B563N4). Les exons sont figurés comme des rectangles noirs avec leur nom au-dessus.
FIGURE 1C : Les cinq mutations identifiées dans sept familles de PSF-AD liées au locus SPG4 sont positionnées dans les exons 7,11, 13 et dans le site accepteur d'épissage de l'intron 15.
FIGURE 2 : Séquence nucléique et protéique de l'ADNc SPG4 et de la spastin.
Les 17 barres verticales avec un nombre situé au-dessous représentent les jonctions entre les différents exons. Le codon ATG initiateur est localisé en position nt 126-128 et le codon STOP de terminaison en position nt 1974-1976. Cinq des mutations identifiées à ce jour, dont la perte de l'exon 16, sont indiquées en italique (nt 1210, nt 1468, nt 1520, nt 1620 et pour la perte de l'exon 16 : nt 1813-1853). Le site de polyadénylation est en italique et souligné. Le signal de localisation nucléaire (NLS) putatif, RGKKK, ainsi que les trois domaines conservés prédits par l'analyse dans la base de données ProDom sont respectivement localisés aux positions aa7-11 (NLS), aa342-409 (domaine 92), aa411-509 (domaine 179) et aa512-599 (domaine 6226). Les quatre motifs prédits par la comparaison de séquence dans la base de données Prosite sont deux motifs leucine zippers aux positions aa50-78 et aa508-529, le site de fixation de l'ATP (ou motif A de Walker) aux positions aa382-389 et le domaine
<Desc/Clms Page number 21>
de dimérisation helix-loop-helix aux positions aa478-486. Les motifs A et B de Walker, GPPGNGKT et IIFIDE , ainsi que le consensus minimal des AAA sont soulignés.
FIGURES 3A, 3B et 3C : d'une mutation d'un site d'épissage chez les individus atteints de trois familles de PSF-AD liée au locus SPG4.
FIGURE 3A : Amplification par PCR du fragment IV de l'ADNc SPG4 à partir d'ADNc de lymphoblastes : puits M, marqueur de taille VII (Boehringer) ; puits 1, membre non atteint de la famille 2992 ; puits 2, patient de la famille 2992 ; puits 3, membre non atteint de la famille 5330 ; puits 4, patient de la famille 5330 ; puits 5, patient de la famille 5226 ; puits 6, témoin négatif (ADN génomique humain).
FIGURE 3B : Graphe de séquence de la mutation du site accepteur d'épissage de l'intron 15.
Séquence génomique de l'individu contrôle en haut et d'un patient de la famille 2992 en bas. L'astérisque à la position nt 1813-4 indique un polymorphisme A->C qui touche un nucléotide non conservé du site accepteur d'épissage de l'intron 15 chez le patient.
FIGURES 4A et 4B : Les homologies de la spastin.
Les résidus conservés et identiques sont respectivement surlignés en bleu et jaune.
FIGURE 4A : Alignement multiple créé par CLUSTAL W de huit protéines issues de divers organismes et présentant une forte homologie de séquence avec les spastin humaine et murine (SEQ ID No. 73)
FIGURE 4B : Alignement par CLUSTAL W des métalloprotéases de levure AFG3, RCA1 et YME1, et des paraplegin et spastin humaines.
FIGURE 5 : Alignement par BLASTN des séquences nucléiques de l'ADNc SPG4 et de son orthologue de souris Spg4 (SEQ ID No 72). Le site de polyadénylation de l'ADNc murin est souligné et en italique Le codon STOP est localisé en position nt 1515-1517 dans l'ADNc murin et en position nt 1974-1976 dans l'ADNc humain.
FIGURES 6A, 6B et 6C : Analyse par PCR de l'expression de SPG4 et de son orthologue murin Spg4.
FIGURE 6A . Collection d'ADNc provenant de multiples tissus de souris.
Puits M, marqueur de taille V (Boehringer) ; puits 1, coeur ; puits 2, cerveau ; puits 3, rate ; puits 4, poumon ; 5, foie ; puits 6, muscle squelettique ; puits 7, rein ; puits 8, testicule ; 9, embryon de 7 jours E7 ; 10, embryon de 11 jours
<Desc/Clms Page number 22>
E11 ; puits 11, embryon de 15 jours E15 ; puits 12, embryon de 17 jours E17 ; puits 13, témoin négatif (ADN génomique de souris).
FIGURE 6B : Collection d'ADNc provenant de multiples tissus humains Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; 2, coeur ; puits 3, rein ; puits 4, foie ; puits 5, poumon ; 6, pancréas ; puits 7, placenta ; puits 8, muscle squelettique ; puits 9, témoin négatif (ADN génomique humain) ; 10, témoin négatif (pas d'ADN).
FIGURE 6C : Collection d'ADNc provenant de multiples tissus de f#tus humain.
Puits M, marqueur de taille VII (Boehringer) ; puits 1, cerveau ; puits2, coeur ; puits 3, rein ; puits 4, foie ; puits 5, poumon ; 6, muscle squelettique ; puits 7, rate ; puits 8, thymus ; 9, témoin négatif (ADN génomique humain) ; 10, témoin négatif (pas d'ADN).
EXEMPLES Exemple 1 : Matériels et méthodes 1) Sous-clonage et séquençage de la région candidate
Douze BACs provenant de deux banques génomiques humaines, CITB~978~SKB (commercialisées par Research Genetics) et RPCI-11 (18), et recouvrant l'intervalle SPG4 ont été sélectionnés pour être séquences (Hazan et al., sous presse dans Genomics). 40 g de l'ADN de chaque BAC a été digéré partiellement par l'enzyme de restriction CviJI (CHIMERx) et séparé par électrophorèse sur gel d'agarose 0,4 % LMP (FMC). Des fractions d'ADN dont les tailles varient autour de 3,5 et 10 kb ont été éluées avec la ss-agarase (Biolabs) et liguées à un vecteur plasmide pBAM3 préalablement digéré par Smal et déphosphorylé dans un rapport de 1Xinsert pour 5Xvecteur. Des bactéries E. coli DH10B électrocompétentes (GIBCOBRL) ont été transformées par électroporation avec les différentes ligations. Environ 1000 à 1500 sous-clones par BAC (8 à 10 génomes équivalents) composés de 20 % de clones avec inserts à 10 kb, 40 % de clones avec inserts à 5 kb et 40 % de clones avec inserts à 3 kb ont été isolés. Les extrémités des inserts de ces clones ont été séquencées sur un séquenceur automatique LICOR 4200. Pour chaque BAC, les séquences furent assemblées en un squelette constitué de plusieurs contigs à l'aide des logiciels Phred et Phrap. Les trous entre chaque contig furent séquences avec des dideoxynucléotides marqués sur un séquenceur ABI 377 (PE-Applied Biosystems). Les exons contenus dans ces contigs de séquence ont été prédits par les programmes
<Desc/Clms Page number 23>
informatiques GRAIL II, GENSCAN, FGENEH et Genie. Les séquences furent également comparées dans les bases de données nucléiques et protéiques de l'EMBL et de GenBank avec les programmes BLASTN et BLASTX. La détermination des séquences promotrices fut réalisée par les programmes informatiques TSSG et TSSW.
Les résultats de toutes ces analyses de séquences furent visualisés par le programme d'annotation de séquence Genotator.
2) Clonage de l'ADNc
L'ADNc du gène SPG4 a été isolé par des expériences de RACE-PCR en 5' et 3' sur des ARN polyA+ de cerveau foetal, cerveau adulte et foie adulte à l'aide du kit d'amplification d'ADNc Marathon (Clontech), selon les instructions du fournisseur Une première PCR, suivie d'une PCR interne furent effectuées avec différents couples d'amorces dont les séquences sont indiquées sur le tableau 1 ci-après :
<Desc/Clms Page number 24>
Tableau 1 Amorces utilisées pour les RACE-PCR et les amplifications d'ADNc
Figure img00240001
<tb> Amorce <SEP> Séquence <SEP> (5'-3 <SEP> Position <SEP> en <SEP> 5' <SEP> couple/ <SEP> PCR <SEP> Taille <SEP> du <SEP> produit
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb> SPA~5RACE5 <SEP> CGGAGCTCCTCTTGGCTGCCATG <SEP> nt <SEP> 405
<tb>
<tb>
<tb>
<tb>
<tb> SPA~5RACE6 <SEP> AGAAGCGCTGGCAGAGCCACACGAAG <SEP> nt <SEP> 372 <SEP>
<tb>
<tb>
<tb>
<tb> SPA~5RACE7 <SEP> AAGGCGACCAAACGCAGCAGCGCGAAG <SEP> nt <SEP> 331 <SEP>
<tb>
<tb>
<tb>
<tb>
<tb> SPA~3RACE1 <SEP> AGGAGCAAGCTGTGGAATGGTATAAG <SEP> nt <SEP> 550
<tb>
<tb>
<tb>
<tb> SPA~3RACE2 <SEP> TGGTTATGGCCAAGGACCGCTTACAAC <SEP> nt <SEP> 689
<tb>
<tb>
<tb>
<tb>
<tb> SPA~3RACE3 <SEP> CAAACGGACGTCTATAATGACAGTAC <SEP> nt <SEP> 747
<tb>
<tb>
<tb>
<tb> SPA~3RACE4 <SEP> TTAGGAATGTGGACAGCAACCTTGC <SEP> nt <SEP> 1075 <SEP>
<tb>
<tb>
<tb>
<tb>
<tb> SPA~3RACE5 <SEP> CTTCTCTGAGGCCTGAGTTGTTCAC <SEP> nt <SEP> 1207
<tb>
<tb>
<tb>
<tb> SPA~3RACE6 <SEP> TGCTAGAATGACTGATGGATACTCAGG <SEP> nt <SEP> 1736 <SEP>
<tb>
<tb>
<tb>
<tb>
<tb> SPA~3RACE7 <SEP> AGATGCAGCACTGGGTCCTATCCG <SEP> nt <SEP> 1787 <SEP>
<tb>
<tb>
<tb>
<tb>
<tb> SPA~3RACE8 <SEP> ATGAACGTCATCGGCTACAGAAACAG <SEP> nt <SEP> 2037
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb> SPA~Db <SEP> TAGCAGTGGCTGCCGCCGT <SEP> nt <SEP> 45 <SEP> b+m <SEP> 655 <SEP> pb
<tb>
<tb>
<tb>
<tb>
<tb> SPA~Dm <SEP> AAGCGGTCCTTGGCCATAAC <SEP> nt <SEP> 700
<tb>
<tb>
<tb>
<tb> SPA~Dc <SEP> GGCGGCAGTGAGAGCTGTG <SEP> nt <SEP> 106 <SEP> c+n <SEP> 543 <SEP> pb
<tb>
<tb>
<tb>
<tb>
<tb> SPA~Dn <SEP> CTAGCTCTTTCACACTGTTC <SEP> nt <SEP> 649
<tb>
<tb>
<tb>
<tb> SPA~Ad <SEP> AACAGGCCTTCGAGTACATC <SEP> nt <SEP> 487 <SEP> d+n <SEP> 746 <SEP> pb
<tb>
<tb>
<tb>
<tb>
<tb> SPA <SEP> Am <SEP> CTGTGAACAACTCAGGCCTC <SEP> nt <SEP> 1233
<tb>
<tb>
<tb>
<tb> SPA~Ac <SEP> ATGAGAAAGCAGGACAGAAG <SEP> nt <SEP> 532
<tb>
<tb>
<tb>
<tb>
<tb> SPA~An <SEP> TGCCAAGTCTTGACCAGC <SEP> nt <SEP> 1175 <SEP>
<tb>
<tb>
<tb>
<tb> SPA~Ba <SEP> CTACAACTGCTACTCGTAAG <SEP> nt <SEP> 1036 <SEP> a+m <SEP> 763 <SEP> pb
<tb>
<tb>
<tb>
<tb>
<tb> SPA~Bm <SEP> CAGTGCTGCATCTTTTGCC <SEP> nt <SEP> 1799
<tb>
<tb>
<tb>
<tb> SPA~Bb <SEP> TAGGAATGTGGACAGCAACC <SEP> nt <SEP> 1076 <SEP>
<tb>
<tb>
<tb>
<tb>
<tb> SPA~Bn <SEP> AAAGCTGTTAGGTCACTTCC <SEP> nt <SEP> 1780 <SEP>
<tb>
<tb>
<tb>
<tb> SPA~Ca <SEP> TGGAGATGACAGAGTACTTG <SEP> nt <SEP> 1550 <SEP> a+m <SEP> 766 <SEP> pb
<tb>
<tb>
<tb>
<tb>
<tb> SPA~Cm <SEP> CTGGAATACTTTCATCTGC <SEP> nt <SEP> 2316
<tb>
<tb>
<tb>
<tb>
<tb> SPA~Cb <SEP> ATGAGGCTGTTCTCAGGCG <SEP> nt <SEP> 1603
<tb>
<Desc/Clms Page number 25>
Les produits de RACE-PCR ont été clones avec le kit TA-cloning (Invitrogen) et les clones correspondants ont été séquences sur un ABI 377 (PE-Applied Biosystems).
La séquence du transcrit SPG4 a été vérifiée par le séquençage de produits de PCR amplifiés à partir d'une population d'ADNc provenant des lymphoblastes de 6 individus sains.
3) Détection des mutations
Les ARNs totaux ont été extraits de lignées de lymphoblastes d'un individu atteint par famille étudiée et de 6 individus témoins à l'aide du kit RNA PLUSR (bioprobe System). La synthèse de l'ADNc a été réalisée sur 500 ng à 1 g d'ARN avec 100 pmoles d'amorces hexamères aléatoires (Pharmacia) et 200 unités de reverse transcriptase Superscript Il (Gibco BRL) dans des conditions standards.
Quatre amplifications par PCR, générant des fragments chevauchants qui recouvrent la totalité de la phase ouverte de lecture de SPG4, ont été réalisées sur les ADNc des patients et contrôles. Le fragment I fut amplifié avec les amorces SPA~Db/SPA~Dm, puis en PCR interne avec les amorces SPA~Dc/SPA~Dn. Les fragments II, III, et IV ont été respectivement amplifiés avec les amorces SPA~Ad/SPA~Am, SPA~Ba/SPA~Bm et SPA~Ca/SPA~Cm (cf. les séquences de ces amorces sur le tableau 1). Chaque amplification a été effectuée dans un volume total de 50 l contenant 4 NI d'ADNc (-1/7 ème de la prép. ), 20 pmoles de chaque amorce, 200 M de dNTPs, 50 mM de KCI, 10 mM de Tris pH9,1,5 mM MgCI2, 0,1 % de triton X-100,0,01 % de gélatine et 2,5 unités de Taq polymérase (Cetus-PE). Les réactions de PCR ont été réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 92 C après une première étape de dénaturation de 5 min à 94 C. Les échantillons sont par la suite soumis à 35 cycles de dénaturation (94 C pendant 40 sec), d'hybridation (55 C pendant 50 sec, à l'exception du fragment 1 : 58 C pendant 50 sec) et d'élongation (72 C pendant 1 min), suivis d'une dernière étape d'élongation (5 min à 72 C). Les produits de PCR sont séquences sur un séquenceur automatique ABI 377 (PE-Applied Biosystems) avec les amorces SPA~Dc/SPA~Dn, SPA~Ac/SPA~An, SPA~Bb/SPA~Bn et SPA~Cb/SPA~Cm pour les fragments I, II, III et IV respectivement
Les mutations furent également recherchées ou confirmées par séquençage des 17 exons prédits du gène SPG4 chez les patients et contrôles. Chaque exon fut amplifié avec le couple correspondant d'amorces a+m (cf tableau 2 ci-après), à l'exception de l'exon 1 (gSPAex1c/gSPAex1m), et des exons 10, 11 et 12 qui furent co- amplifiés avec les couples d'amorces gSPAex10a/gSPAex12m et gSPAex11a/gSPAex12m.
<Desc/Clms Page number 26>
Tableau 2 Amorces de PCR pour l'amplification et le séquençage des exons
Figure img00260001
<tb> Exon <SEP> Taille <SEP> du <SEP> produit <SEP> Programme <SEP> de <SEP> PCR <SEP> Amorce <SEP> Séquence <SEP> (5'-3')
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb>
<tb> 1 <SEP> 1048 <SEP> pb <SEP> 0 <SEP> gSPAex1c <SEP> GTGAGCCGAACTGCACATTG
<tb>
<tb>
<tb>
<tb> gSPAex1 <SEP> m <SEP> CAAAGTCGACAGCTACAGTGC
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex1 <SEP> d <SEP> GGAACTGTAGTTGAGTGGGA
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex1n <SEP> AGATGAGGCTCCGACCTAC
<tb>
<tb>
<tb>
<tb>
<tb> 2 <SEP> 624 <SEP> pb <SEP> 3 <SEP> gSPAex2a <SEP> AATGCCACACTTGTAATCTC
<tb>
<tb>
<tb>
<tb> gSPAex2m <SEP> TGTGAATATATCATAATTTGGG
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex2b <SEP> TACAGCAGTTCTCATGATG
<tb>
<tb>
<tb>
<tb>
<tb> 3 <SEP> 812 <SEP> pb <SEP> 1 <SEP> gSPAex3a <SEP> GACCAAATTGGTGCATGCATG
<tb>
<tb>
<tb>
<tb> gSPAex3m <SEP> ACATTTCCAATACATCCCAC
<tb>
<tb>
<tb>
<tb>
<tb> 4 <SEP> 379 <SEP> pb <SEP> 3 <SEP> gSPAex4a <SEP> ATTTGTCATTTCACATGCAC
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex4m <SEP> TTAGAATGACTATACCTGAC
<tb>
<tb>
<tb>
<tb> gSPAex4n <SEP> TCAGGTTAAGTAAGACTC
<tb>
<tb>
<tb>
<tb>
<tb> 5 <SEP> 830 <SEP> pb <SEP> 4 <SEP> gSPAex5a <SEP> TTCCTATCTACCTAGTGAC
<tb>
<tb>
<tb>
<tb>
<tb> gSPAexSm <SEP> TTTTATAGCAAGTTGCCCTG
<tb>
<tb>
<tb>
<tb> gSPAex5b <SEP> CCTATGAAGATCCTGGTAC
<tb>
<tb>
<tb>
<tb>
<tb> 6 <SEP> 484 <SEP> pb <SEP> 3 <SEP> gSPAex6a <SEP> TGTCATGATTCTAACAAGGG
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex6m <SEP> TCTATTTCACTCCTGACATG
<tb>
<tb>
<tb>
<tb> 7 <SEP> 420 <SEP> pb <SEP> 2 <SEP> gSPAex7a <SEP> GTCATAGGGCTTAGGCTTC
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex7m <SEP> ATCATACTACCCACTTTTCC
<tb>
<tb>
<tb>
<tb>
<tb> 8 <SEP> 647 <SEP> pb <SEP> 3 <SEP> gSPAex8a <SEP> TGTTTGGGAAGATGCTACTG
<tb>
<tb>
<tb>
<tb> gSPAex8m <SEP> CTACTGAAGATAACGTACATG
<tb>
<tb>
<tb>
<tb>
<tb> 9 <SEP> 1268 <SEP> pb <SEP> 1 <SEP> gSPAex9a <SEP> CATTGATTGCCATGTATTGG
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex9m <SEP> AGAAGGCCAGAAATACTCAG
<tb>
<tb>
<tb>
<tb> gSPAex9b <SEP> GTACTTAAATCGGTAAATATGG
<tb>
<tb>
<tb>
<tb>
<tb> 10# <SEP> 1061 <SEP> pb <SEP> 4 <SEP> gSPAex10a <SEP> CTCAAGTCTTAGGAATGCAG
<tb>
<tb>
<tb>
<tb>
<tb> 11# <SEP> gSPAex10b <SEP> GCACTTAACCAGGCTGTATG
<tb>
<tb>
<tb>
<tb>
<tb> 12# <SEP> 551 <SEP> pb <SEP> 3 <SEP> gSPAex11a <SEP> CTCAGATGACTCACATAGC
<tb>
<tb>
<tb>
<tb>
<tb> gSPAex12m <SEP> CTTTACTAGACTAATTCTCCTG
<tb>
<Desc/Clms Page number 27>
Figure img00270001
<tb> 13 <SEP> 1361 <SEP> pb <SEP> 4 <SEP> gSPAex13a <SEP> CAGATTCAAGAAGACAGATC
<tb>
<tb> gSPAex13m <SEP> GCAATAATTCACCACACTTG
<tb>
<tb>
<tb> gSPAex13n <SEP> GGTAGTTCTTGTTTCTGCTC
<tb>
<tb>
<tb> 14 <SEP> 985 <SEP> pb <SEP> 4 <SEP> gSPAex14a <SEP> CAAGTGTGGTGAATTATTGC
<tb>
<tb>
<tb> gSPAex14m <SEP> GAGCTGAAAAGTATTCAGC
<tb>
<tb>
<tb> gSPAex14n <SEP> TGCAAAGGACATAGCCAGTG
<tb>
<tb>
<tb> 15 <SEP> 1076 <SEP> pb <SEP> 1 <SEP> gSPAex15a <SEP> AGCCTCTGGAGATAGTATGC
<tb>
<tb>
<tb> gSPAex15m <SEP> CTAGAACAGGGGTCACAGTC
<tb>
<tb>
<tb> gSPAex15n <SEP> TTGGACTTCTTAAACTTC
<tb>
<tb>
<tb> 16 <SEP> 1404 <SEP> pb <SEP> 4 <SEP> gSPAex16a <SEP> GCAGTATGCAAGAAATTGAAC
<tb>
<tb>
<tb> gSPAex16m <SEP> GGCCTGTAATTTTCTTCTG
<tb>
<tb>
<tb> gSPAex16b <SEP> GTACTGAATAGATACATGTAG
<tb>
<tb>
<tb> 17 <SEP> 445 <SEP> pb <SEP> 3 <SEP> gSPAex17a <SEP> GTGTAGCAGATCAACATAG
<tb>
<tb>
<tb> gSPAex17m <SEP> CATCTTCAAGTTTGGTGCAC
<tb>
Hormis l'exon 1, amplifié à l'aide du kit Advantage GC genomic PCR kit (Clontech) selon les instructions du fournisseur, quatre programmes de PCR légèrement différents (1,2, 3 et 4) furent utilisés pour amplifier les exons de SPG4 (voir tableau 2). Les amplifications furent toutes effectuées dans un volume de 50 l contenant 100 ng d'ADN génomique, 50 pmoles de chaque amorce, 250 M de dNTPs, 1X de tampon Takara et 1 unité de Taq polymérase Takara La Taq (Shuzo Co). Les réactions de PCR ont été réalisées selon le procédé du hot start : la Taq polymérase est ajoutée à 94 C après une première étape de dénaturation de 5 min à 96 C. Les échantillons sont par la suite soumis à 30 cycles de dénaturation (94 C pendant 40 sec), d'hybridation (prog. 1 : 60 C pendant 50 sec ; prog. 2, 58 C pendant 50 sec, prog 3 et 4 55 C pendant 50 sec) et d'élongation (prog 1 et 4 : 72 C pendant 1 min, prog. 2 et 3 : 72 C pendant 40 sec), suivis d'une dernière étape d'élongation (10 min à 72 C). Le séquençage de ces produits de PCR a été réalisé sur un séquenceur ABI 377 (PE-Applied Biosystems) en utilisant soit les amorces de PCR soit les amorces internes notées b et n (voir tableau 2).
4) Caractérisation de SPG4
Les clones d'ADNc 977312 (EST AA560327) et 568234 (EST AA107866) issus des banques d'ADNc de blastocyste et d'embryon E8 de souris, qui tous deux
<Desc/Clms Page number 28>
correspondent à l'orthologue murin de SPG4, ont été isolés par le consortium IMAGE et séquences au laboratoire sur un séquenceur ABI 377 (PE-Applied Biosystems). Afin d'analyser le profil d'expression de SPG4 et de son orthologue murin Spg4, les collections d'ADNc de différents tissus humains foetaux et adultes, ainsi que de tissus de souris (panels MTC, Clontech) ont été testées par PCR selon le protocole du fournisseur avec le couple d'amorces SPA~Ca/SPA~Cm pour les ADNc humains et le couple SPA~Ca /spam (spam : 5'-ACCGAAGTCAAGAGCCTATC-3') pour les ADNc de souris. Les conditions de PCR sont celles utilisées pour l'amplification de SPG4 à partir d'ADNc de lignées de lymphoblastes (cf. ≈Détection des mutations), excepté que les échantillons ont été soumis à 32 cycles pour les ADNc issus de tissus adultes humains et de tissus murins, et à 28 cycles pour les ADNc issus de tissus f#taux. Les produits d'amplification ont migré par électrophorèse sur des gels d'agarose 2 %.
5) Analyse histologique d'une biopsie musculaire d'un patient
Les analyses histologiques et histo-enzymatiques ont été réalisées à partir d'une biopsie musculaire d'un patient issu d'une famille liée au locus SPG4 selon les techniques standards décrites dans Casari et al. (17).
6) Numéros d'accession dans les bases de données publiques
L'ADNc SPG4 (ou SPAST) et la séquence protéique déduite, GenBank/EMBL AJ246001 ; le clone d'ADNc incomplet Spg4, GenBank/EMBL AJ246002 ; le gène SPG4 (ou SPAST), GenBank/EMBL AJ246003.
Exemple 2 : Analyse de la séquence de l'intervalle SPG4
L'analyse des événements de recombinaison a permis de réduire la région candidate SPG4 à un intervalle génétique de 0 cM entre les marqueurs D2S352 et D2S2347 (19,20). Une carte de préséquençage de l'intervalle SPG4 composée de 37 BACs a été construite (Hazan et al., sous presse dans Genomics) , la région candidate couvre une distance physique d'environ 1,5 Mb. Douze BACs chevauchants, s'étendant sur l'intervalle SPG4 à l'exception d'un unique trou de 4 kb entre les clones A et E, ont été sélectionnés pour être séquences (Fig. 1A). Sept de ces BACs (A, B, C, D, E, F et G), couvrant approximativement 70 % de la région d'intérêt, ont déjà été séquences Les séquences de ces 7 BACs ont été comparées à celles des bases de données nucléiques et protéiques, et analysées avec quatre programmes de prédiction d'exons. Ces analyses de séquences préliminaires ont permis de mettre en évidence 14 unités de transcription potentielles, dont trois correspondant aux gènes codant pour la xanthine deshydrogénase, la stéroïde 5a-réductase 2 et une protéine liant le TGFp.
Sur les 14 gènes détectés par l'analyse de séquence, 9 avaient été préalablement
<Desc/Clms Page number 29>
identifiés dans les bases de données d'EST (pour Expressed Séquence Tag ) et localisés au sein de l'intervalle SPG4 (Hazan et al., sous presse dans Genomics) , les 5 gènes restants n'ont pu être identifiés qu'en séquençant la région candidate. L'un de ces 5 nouveaux gènes présentait une homologie en 3' de sa région codante avec les gènes codant pour la famille protéique des AAA (16). Des analyses de séquence plus approfondies ont montré que ce gène, nommé SPG4 (ou SPAST), était composé de 17 exons et s'étendait sur une région d'environ 90 kb, couverte par deux clones de BAC adjacents, D et G (cf. Fig. 1 B). Les trois premiers exons prédits de ce gène furent identifiés dans le BAC D par deux des quatre programmes de prédiction d'exons utilisés, GRAIL Il et GENSCAN ; ils présentent une forte homologie avec un EST de blastocyste de souris, AA560327. Les 14 derniers exons se trouvent dans le BAC G La séquence protéique déduite des exons 7 à 17 est significativement homologue à une sous-classe de la famille des AAA, comportant les protéines de levure Yta6p (21), TBP6 (21) et End 13, ainsi que la protéine de souris SKD1 (22).
Sur les quatre programmes de prédiction d'exons, FGENEH semble le plus fiable et le plus puissant, permettant la détection de la plupart des gènes de cette région chromosomique en 2p21-p22. Cette constatation s'applique également au gène SPG4 pour lequel 15 exons ont pu être mis en évidence par ce programme quand seuls 4,9 ou 11exons ont pu respectivement être localisés par les programmes Genie, GRAIL Il et GENSCAN. L'organisation génomique de ce gène (Fig. 1B) a pu être confirmée par la suite grâce à la détermination de la séquence de l'ADNc SPG4. Les jonctions introns/exons sont représentées sur le tableau 3 ci-après : la taille des exons varie de 41 pb (exon 16) à 1,410 kb (exon 17), celle des introns variant de 140 pb (intron 11) à 23,247 kb (intron 1)
<Desc/Clms Page number 30>
Tableau 3 Organisation intron/exon du gène SPG4
Figure img00300001
<tb> Exon/ <SEP> Taille <SEP> de <SEP> l'exon <SEP> Position <SEP> Site <SEP> accepteur <SEP> crépissage <SEP> Site <SEP> donneur <SEP> d'épissage <SEP> Taille <SEP> de <SEP> l'intron
<tb> intron <SEP> (pb) <SEP> sur <SEP> l'ADNc <SEP> (pb)
<tb> 1 <SEP> 540 <SEP> 1 <SEP> TGAGAAAG/ <SEP> g <SEP> taacta <SEP> gggggctgg <SEP> 23 <SEP> 247 <SEP>
<tb> 2 <SEP> 87 <SEP> 541 <SEP> attttttattttaaag/CAGGACAG <SEP> AGGACAAG/gtaagattgtatttgt <SEP> 1943
<tb> 3 <SEP> 84 <SEP> 628 <SEP> aatttttttctttcag/GTGAACAG <SEP> ACTTCTAG/gtatcaattaatgtat <SEP> 9190
<tb> 4 <SEP> 96 <SEP> 712 <SEP> cttctctgttgcatag/AGAAGATG <SEP> CCAGTCAG/gtgggtttaggttaac <SEP> 15745
<tb> 5 <SEP> 188 <SEP> 808 <SEP> actttttccttgtcag/AAAGTGGA <SEP> CTCATAAG/gtattctgggacagta <SEP> 876
<tb> 6 <SEP> 134 <SEP> 996 <SEP> ttttgtatcctttaag/GGTACTCC <SEP> GTGGACAA/gtaagttttgccatct <SEP> 283
<tb> 7 <SEP> 94 <SEP> 1 <SEP> 130 <SEP> aggtcttgtttcttag/TGGAACAG <SEP> GGCCTGAG/gtaagaactttatatt <SEP> 10 <SEP> 735 <SEP>
<tb> 8 <SEP> 75 <SEP> 1224 <SEP> agtatatattttttag/TTGTTCAC <SEP> CAATGCTG/gtaagggttctcttca <SEP> 1385
<tb> 9 <SEP> 72 <SEP> 1 <SEP> 299 <SEP> cttgtgatttttaaag/GCTAAAGC <SEP> CAAAATAC/gtgagtgctctgtttc <SEP> 8 <SEP> 083 <SEP>
<tb> 10 <SEP> 76 <SEP> 1 <SEP> 371 <SEP> taatgctttgttttag/GTGGGAGA <SEP> TTTTATAG/gtaagaacatattttc <SEP> 238
<tb> 11 <SEP> 92 <SEP> 1447 <SEP> cttgtatttcctctag/ATGAAGTT <SEP> TTGATGGT/gtaagtgttgattatg <SEP> 140
<tb> 12 <SEP> 80 <SEP> 1 <SEP> 539 <SEP> gattttttgcttgtag/GTACAGTC <SEP> GTTCTCAG/gtagggagatttatat <SEP> 4 <SEP> 715 <SEP>
<tb> 13 <SEP> 43 <SEP> 1619 <SEP> ggatttttttttttag/GCGTTTCA <SEP> ATGAGGAG/gtatgtatctgtgttt <SEP> 1389
<tb> 14 <SEP> 80 <SEP> 1662 <SEP> ttttaatatttttcag/ACAAGACT <SEP> CTTGCTAG/gtgagtaatttggatt <SEP> 1521
<tb> 15 <SEP> 71 <SEP> 1 <SEP> 742 <SEP> tccttcccttcctcag/AATGACTG <SEP> TATCCGAG/gtaggtatacaagagc <SEP> 2 <SEP> 210 <SEP>
<tb> 16 <SEP> 41 <SEP> 1813 <SEP> cttttatgttttacag/AACTAAAA <SEP> CCAGTGAG/gtatagtattttacaa <SEP> 7115
<tb> 17 <SEP> 1410 <SEP> 1854 <SEP> ctttttaaaaatctag/ATGAGAAA
<tb>
Les séquences des exons et des introns sont respectivement indiquées en majuscules et minuscules
<Desc/Clms Page number 31>
Exemple 3 : Identification de l'ADNc SPG4
Plusieurs amplifications successives par RACE-PCR en 5' et 3' furent réalisées sur des collections d'ADNc de cerveau et de foie adultes et de cerveau foetal, afin de caractériser le transcrit SPG4. Toutes les RACE-PCR en 5' ont donné des produits d'amplification se terminant à la position nt 263 de l'ADNc SPG4 (Fig 2), ce qui était probablement dû au contenu riche en GC de la région 5' du transcrit (90 % de GC dans les 60 pb précédant la position nt 263) Quatre produits de PCR chevauchants, recouvrant la totalité de la région codante, ont été amplifiés à partir des ADNc issus des lymphoblastes de six individus contrôles et séquences intégralement dans le but de vérifier la séquence du transcrit SPG4. L'alignement des séquences de tous les produits de PCR et RACE-PCR a permis de reconstituer une séquence de 3263 pb comprenant une phase ouverte de lecture de 1848 pb précédée par une région 5' non traduite (5' UTR pour 5' UnTranslated Région ) de 125 pb et suivie par une région 3' UTR de 1290 pb incluant un site de polyadénylation entre les positions nt 3227-3232, - 35 pb en amont de la queue polyA (Fig. 2) La comparaison de la séquence de l'ADNc SPG4 avec les banques de données d'ESTs a permis de détecter une homologie significative avec 6 ESTs humains dont l'EST N47973 qui contient une région 3' non codante plus étendue (+ 180 pb) comprenant un deuxième site de polyadénylation. Le site d'initiation de la traduction a été identifié par la présence d'une séquence consensus de Kosak (CTGTGAatgA) définie comme un contexte adéquat à l'initiation de la traduction attendu qu'une purine est localisée 3 nt en amont de l'ATG initiateur, lui-même précédé d'un codon STOP. La séquence de l'ADNc de 3263 pb est identique à la séquence transcrite déduite des 17 exons du gène SPG4. L'analyse de la séquence de la région 5' à l'aide des programmes informatiques TSSG et TSSW suggère la présence d'une séquence promotrice de type TATA box située 43 pb en amont de la position nt 1 de l'exon 1.
Exemple 4 : Mutations dans le gène SPG4
Des mutations hétérozygotes ont été recherchées dans l'ADNc SPG4 provenant de lymphoblastes de 14 patients issus de familles liées au locus SPG4 (1 individu atteint par famille). Quatre fragments de PCR chevauchants I, II, III et IV recouvrant la phase ouverte de lecture de l'ADNc SPG4 ont été amplifiés et séquences chez les 14 patients ainsi que chez 6 individus sains contrôles L'électrophorèse sur gel agarose du fragment de PCR IV a montré trois bandes d'intensité égale chez 3 patients des familles 2992,5226 et 5330 provenant de la même région de Suisse, ce qui suggérait une microdélétion ou une mutation d'un site d'épissage ; les deux bandes
<Desc/Clms Page number 32>
supplémentaires n'étaient pas présentes chez 2 individus sains issus des familles 2992 et 5330 (Fig. 3A). La séquence génomique de l'exon 16 a révélé une mutation hétérozygote A->G du site accepteur d'épissage (AG) de l'intron 15 chez les individus atteints de ces trois familles (Fig. 3B) ; cette mutation engendre la perte de l'exon 16 suivie d'un décalage de la phase de lecture dans le transcrit anormal Aucun des membres sains incluant maris et épouses ne porte cette mutation du site d'épissage L'identification de la même mutation chez tous les membres atteints de ces trois familles suisses démontre l'existence d'un ancêtre commun, ce qui avait été préalablement suggéré par l'étude des haplotypes.
Trois mutations ponctuelles 1210C->G, 1468G->A et 1620C->T qui introduisent des substitutions d'un acide aminé dans la séquence protéique (S362C, C448Y et R499C) ont été respectivement mises en évidence par le séquençage des fragments de PCR III et IV chez les individus atteints des familles 624,4014 et 618. Ces trois substitutions impliquent toutes un résidu cystéine, induisant la perte ou l'insertion d'une cystéine dans la séquence protéique. Une délétion de 1 pb, 1520delT, qui crée l'apparition d'un codon STOP induisant une protéine tronquée composée de 465 acides aminés (aa) a été détectée chez les individus atteints de la famille A Aucune des cinq mutations résumées dans le tableau 4 ci-après n'a été trouvée chez les individus contrôles testés, qu'ils appartiennent à la fratrie saine ou aux conjoints des sept familles analysées ici. Ces cinq mutations affectent de façon importante la séquence protéique dans un domaine très conservé, ou cassette AAA (23), qui est composé de plusieurs motifs protéiques supposés être responsables de l'activité ATPase chez tous les membres de la famille des AAA
<Desc/Clms Page number 33>
Tableau 4 Mutations dans SPG4 chez les patients atteints de PSF-AD
Figure img00330001
<tb> Famille <SEP> Localisation <SEP> Mutation <SEP> a <SEP> Changement <SEP> d'acide <SEP> aminé <SEP> Conséquence
<tb> 624 <SEP> exon <SEP> 7 <SEP> 1 <SEP> 210 <SEP> C <SEP> # <SEP> G <SEP> S362C <SEP> faux <SEP> sens
<tb> 4 <SEP> 014 <SEP> exon <SEP> 11 <SEP> 1 <SEP> 468 <SEP> G <SEP> A <SEP> C448Y <SEP> faux <SEP> sens
<tb> A <SEP> exon <SEP> 11 <SEP> 1 <SEP> 520 <SEP> delT <SEP> 466STOPcodon <SEP> non <SEP> sens
<tb> 618 <SEP> exon <SEP> 13 <SEP> 1 <SEP> 620 <SEP> C <SEP> # <SEP> T <SEP> R499C <SEP> faux <SEP> sens
<tb> 2 <SEP> 992 <SEP> intron <SEP> 15 <SEP> 1 <SEP> 813-2a <SEP> # <SEP> g <SEP> # <SEP> aa564 <SEP> H <SEP> aa576 <SEP> (PTC+7 <SEP> aa) <SEP> perte <SEP> de <SEP> l'exon <SEP> 16 <SEP> + <SEP> décalage
<tb> 5 <SEP> 226 <SEP> intron <SEP> 15 <SEP> 1 <SEP> 813-2a <SEP> # <SEP> g <SEP> # <SEP> aa564 <SEP> aa576 <SEP> (PTC+7 <SEP> aa) <SEP> perte <SEP> de <SEP> l'exon <SEP> 16 <SEP> + <SEP> décalage
<tb> 5 <SEP> 330 <SEP> intron <SEP> 15 <SEP> 1 <SEP> 813-2a <SEP> # <SEP> g <SEP> # <SEP> aa564 <SEP> aa576 <SEP> (PTC+7 <SEP> aa) <SEP> perte <SEP> de <SEP> l'exon <SEP> 16 <SEP> + <SEP> décalage
<tb>
a Les positions en nt font référence à la séquence de l'ADNc SPG4. b Les positions en aa font référence à la séquence de la spastin.
Les bases des exons sont indiquées en majuscules, celles des introns en minuscules.
PTC+7 aa = "premature termination codon" à 7 aa en aval de l'exon 16.
<Desc/Clms Page number 34>
En addition à ces cinq mutations décrites précédemment, des recherches de mutations hétérozygotes réalisées sur des patients atteints de PSF-AD issus de 36 autres familles ont permis de mettre en évidence 34 autres mutations altérant ou susceptibles d'altérer le produit d'expression du gène SPG4.
Les caractéristiques de ces 34 autres mutations sont résumées dans le tableau 5 ci-après dans lequel ont été également insérées les cinq premières mutations précédemment citées.
<Desc/Clms Page number 35>
Tableau 5 Mutations dans SPG4 chez les patients atteints de PSF-AD
Figure img00350001
<tb> Famille <SEP> Localisation <SEP> Mutation <SEP> Changement <SEP> d'acide <SEP> aminé <SEP> Conséquence
<tb>
<tb>
<tb>
<tb>
<tb> 624 <SEP> exon <SEP> 7 <SEP> 1210 <SEP> C#G <SEP> S362C <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 6958 <SEP> exon <SEP> 1233 <SEP> G <SEP> HA <SEP> G370R <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb> 214 <SEP> exon8 <SEP> 1267 <SEP> T#G <SEP> F381C <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 1002 <SEP> exon8 <SEP> 1283 <SEP> T#G <SEP> N386K <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb> 027 <SEP> exon8 <SEP> 1288 <SEP> A#G <SEP> K388R <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 019 <SEP> exon <SEP> 10 <SEP> 1401 <SEP> C#G <SEP> L426V <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb> 4014 <SEP> exon <SEP> 11 <SEP> 1468 <SEP> G <SEP> HA <SEP> C448Y <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 148 <SEP> exon <SEP> 11 <SEP> 1504 <SEP> G <SEP> HT <SEP> R460L <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 618 <SEP> exon <SEP> 13 <SEP> 1620 <SEP> C <SEP> HT <SEP> R499C <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb> 636 <SEP> exon <SEP> 15 <SEP> 1788 <SEP> G#A <SEP> D555N <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 627 <SEP> exon <SEP> 15 <SEP> 1792 <SEP> C <SEP> #T <SEP> A556V <SEP> faux <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 2971 <SEP> exon <SEP> 3 <SEP> 702 <SEP> C#T <SEP> Q <SEP> 193 <SEP> STOP <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 3655 <SEP> exon <SEP> 5 <SEP> 873 <SEP> A <SEP> HT <SEP> K229STOP <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb> 1010 <SEP> exon <SEP> 5 <SEP> 907 <SEP> C <SEP> HA <SEP> S261STOP <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 3938 <SEP> exon <SEP> 5 <SEP> 932 <SEP> C <SEP> HG <SEP> Y269STOP <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 6922 <SEP> exon <SEP> 10 <SEP> 1416 <SEP> C#T <SEP> R431 <SEP> STOP <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb> 616 <SEP> exon <SEP> 10 <SEP> 1416 <SEP> C <SEP> HT <SEP> R431 <SEP> STOP <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 605 <SEP> exon <SEP> 15 <SEP> 1809 <SEP> C <SEP> #T <SEP> R562STOP <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 030 <SEP> exon <SEP> 2 <SEP> 578-579insA <SEP> PTC <SEP> + <SEP> 2 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 615 <SEP> exon <SEP> 5 <SEP> 852del11 <SEP> PTC <SEP> + <SEP> 18 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb> 042 <SEP> exon <SEP> 5 <SEP> 882-883insA <SEP> PTC <SEP> + <SEP> 12 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 032 <SEP> exon <SEP> 5 <SEP> 906deIT <SEP> PTC <SEP> + <SEP> 17 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb> 189 <SEP> exon <SEP> 9 <SEP> 1299DelG <SEP> PTC <SEP> + <SEP> 3 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 3686 <SEP> exon <SEP> 9 <SEP> 1340del5 <SEP> PTC <SEP> + <SEP> 35 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb> 625 <SEP> exon <SEP> 9 <SEP> 1340del5 <SEP> PTC <SEP> + <SEP> 35 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> A <SEP> exon <SEP> 11 <SEP> 1520delT <SEP> PTC <SEP> + <SEP> 7 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb> 115 <SEP> exon <SEP> 12 <SEP> 1574deIGG <SEP> PTC <SEP> + <SEP> 2 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 3266 <SEP> exon <SEP> 13 <SEP> 1634del22 <SEP> PTC <SEP> + <SEP> 18 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 149 <SEP> exon <SEP> 14 <SEP> 1684-1685insTT <SEP> PTC <SEP> + <SEP> 9 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb> 645 <SEP> exon <SEP> 14 <SEP> 1685del4 <SEP> PTC <SEP> + <SEP> 7 <SEP> aa <SEP> décalage <SEP> + <SEP> non <SEP> sens
<tb>
<tb>
<tb>
<tb>
<tb> 029 <SEP> intron <SEP> 4 <SEP> 808-2 <SEP> a <SEP> #g <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb>
<tb> 162 <SEP> intron <SEP> 6 <SEP> 1129+2 <SEP> t <SEP> Hg <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb>
<tb> 125 <SEP> intron <SEP> 7 <SEP> 1223+1 <SEP> g <SEP> #t <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb>
<tb> 143 <SEP> intron <SEP> 1299+1 <SEP> g <SEP> #a <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb>
<tb> 1620 <SEP> mtron <SEP> 11 <SEP> 1538+5 <SEP> g <SEP> Ha <SEP> (PTC <SEP> + <SEP> 6 <SEP> aa) <SEP> perre <SEP> de <SEP> l'exon <SEP> 11 <SEP> + <SEP> décalage
<tb>
<tb>
<tb>
<tb> 1006 <SEP> intron <SEP> 11 <SEP> 1538+3 <SEP> del4 <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb>
<tb> 1605 <SEP> intron <SEP> 13 <SEP> 1661+1 <SEP> g <SEP> #t <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb> 1012 <SEP> intron <SEP> 13 <SEP> 1662-2 <SEP> a <SEP> #T <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb>
<tb> 1626 <SEP> intron <SEP> 15 <SEP> 1812+1 <SEP> g#a <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
<tb>
<tb>
<tb> 2992 <SEP> intron <SEP> 15 <SEP> 1813-2 <SEP> a <SEP> #g <SEP> # <SEP> aa564 <SEP> # <SEP> aa576 <SEP> (PTC+7 <SEP> aa) <SEP> perte <SEP> de <SEP> l'exon <SEP> 16 <SEP> + <SEP> décalage
<tb>
<tb>
<tb>
<tb> 5226 <SEP> intron <SEP> 15 <SEP> 1813-2 <SEP> a <SEP> #g <SEP> # <SEP> aa564 <SEP> # <SEP> aa576 <SEP> (PTC+7 <SEP> aa) <SEP> perte <SEP> de <SEP> l'exon <SEP> 16 <SEP> + <SEP> décalage
<tb>
<tb>
<tb>
<tb> 5330 <SEP> intron <SEP> 15 <SEP> 1813-2 <SEP> a <SEP> #g <SEP> # <SEP> aa564 <SEP> # <SEP> aa576 <SEP> (PTC+7 <SEP> aa) <SEP> perte <SEP> de <SEP> l'exon <SEP> 16 <SEP> + <SEP> décalage
<tb>
<tb>
<tb>
<tb> 1611 <SEP> intron <SEP> 16 <SEP> 1853+1 <SEP> g#a <SEP> ? <SEP> mutation <SEP> site <SEP> d'épissage
<tb>
a Les positions en nt font référence à la séquence de l'ADNc SPG4. b Les positions en aa font référence à la séquence de la spastin. Les bases des exons sont indiquées en majuscules, celles des introns en minuscules. PTC+n aa - "premature termination codon" à n acide aminé en aval de la mutation.
<Desc/Clms Page number 36>
Exemple 5 : Analyse de la séquence protéique de la spastin
La phase ouverte de lecture de SPG4 code pour une protéine de 616 aa que nous avons nommée spastin et dont le poids moléculaire est d'environ 67,2 kDaltons (kD). La comparaison de cette séquence en acides aminés dans les bases de données protéiques à l'aide des programmes BLAST a permis de mettre en évidence une zone de forte homologie avec plusieurs membres de la famille des AAA à l'extrémité C- terminale de la spastin. Les motifs types de la famille des AAA, englobés dans la cassette AAA, sont localisés entre les positions aa342 et aa599 (voir Fig. 2) d'après les comparaisons de séquence dans les bases de données de domaines protéiques ProDom et Prosite. Les trois domaines types conservés, dont les motifs A et B de Walker ainsi que le motif consensus minimal des protéines AAA sont respectivement situés au sein de la cassette AAA aux positions aa382-389, aa437-442 et aa480-498 (Fig 2) Le motif A de Walker, GPPGNGKT appelé également p-loop (ou boucle-p) qui correspond au domaine de fixation de l'ATP et le motif B IIFIDE sont très conservés entre tous les membres de la famille des AAA incluant la spastin.
La comparaison des cassettes AAA présentes dans 150 protéines de cette famille d'ATPase issues d'organismes très éloignés dans l'évolution a permis de classifier cet ensemble de protéines en plusieurs sous-groupes, en fonction du nombre de cassettes AAA identifiés (1 ou 2) et des homologies de séquence entre ces différentes cassettes (23). Parmi toutes les protéines de la famille des AAA, la spastin présente une plus forte homologie avec une sous-classe particulière des AAA, et plus spécifiquement avec les protéines suivantes dont la plupart ont été identifiées grâce au séquençage complet du génome de l'organisme considéré deux protéines de Caenorhabditis elegans 016299 et Q18128, deux sous-unités du protéasome 26S de Saccharomyces cerevisiae Yta6p (Q02845) et TBP6 (P40328) (21), une sous-unité du protéasome de Schizosaccharomyces pombe (043078), les protéines SAP1 (P39955) et END13 (P52917) de S. cerevisiae et la protéine murine SKD1 (P46467) (22) L'alignement multiple de ces 8 protéines avec la spastin est représenté sur la Fig. 4A.
Sur les 257 acides aminés englobant la cassette AAA (positions aa342-599), la spastin présente une identité de séquence de 52 %, 51 % et 50 % avec la protéine de levure Yta6p (Q02845), la protéine de nématode 016299 et la protéine de levure TBP6 (P40328) respectivement. Des résultats similaires ont été obtenus par l'analyse de la séquence protéique de la spastin dans la base de données ProDom qui a montré l'existence de trois domaines d'homologie (nommés 92,179 et 6226 et correspondant aux positions aa342-409, aa411-509 et aa512-599) trouvés dans les sous-unités
<Desc/Clms Page number 37>
putatives du protéasome 26S de levure. En outre, les membres de ce sous-groupe des AAA contiennent le plus souvent des motifs de type leucine-zipper dont deux ont pu être détectés dans la séquence protéique de la spastin aux positions aa50-78 et aa508-529 par l'analyse de la séquence dans la base de données Prosite (voir Fig 2) Cette analyse a également pu prédire la présence d'un motif de dimérisation de type hélice-boucle-hélice ( helix-loop-helix ) situé entre les positions aa478 et aa486
La comparaison de la séquence protéique de la spastin avec celles des métalloprotéases mitochondriales comme les protéines de levure AFG3, RCA1 et YME1, ainsi que la paraplegin qui est impliquée dans une forme rare de PSF-AR montre que l'homologie entre ces cinq membres de la famille des AAA est limitée à la région de 257aa englobant la cassette AAA (Fig. 4B). Dans cette région, l'identité de séquence entre la spastin et la paraplegin n'est que de 29 % alors que la paraplegin et la protéine de levure AFG3 sont identiques à 57 % sur cette même portion de la séquence protéique. Cette comparaison de séquence suggère que la spastin n'appartient pas au même sous-groupe des AAA que la paraplegin et autres métalloprotéases mitochondriales. De plus, l'analyse informatique de la séquence de la spastin avec le programme PSORT II qui permet de prédire la localisation sub- cellulaire des protéines semble indiquer que le spastin est une protéine nucléaire Un éventuel signal de localisation nucléaire (NLS pour Nuclear Localization Signal ), RGKKK, a été mis en évidence entre les positions aa7 et aa111 alors qu'aucun peptide signal caractéristique d'un import dans la mitochondrie n'a pu être décelé, contrairement à ce qui avait été observé pour la paraplegin Exemple 6 : Profils d'expression de SPG4 et de son orthologue murin Spg4
La comparaison de la séquence nucléique de SPG4 dans les banques de données d'EST a permis de détecter plusieurs ESTs humains, murins et de rat présentant une forte homologie avec SPG4. Les clones d'ADNc de blastocyste et d'embryon E8 de souris correspondant à deux des ESTs murins, AA560327 et AA107866, ont été obtenus du consortium IMAGE et séquences intégralement L'assemblage des séquences de ces clones d'ADNc a permis de reconstituer une séquence consensus de 1689 pb incluant une phase ouverte de lecture incomplète de 1514 pb. La comparaison entre l'ADNc SPG4 humain et cet ADNc de souris a montré qu'il manque au transcrit murin environ 460 pb à l'extrémité 5' dont le codon d'initiation de la traduction. La phase de lecture ouverte de souris est suivie d'une région 3' non codante (3' UTR) de 175 pb contenant un site de polyadénylation situé à -20 pb en amont de la queue polyA (Fig. 5). La séquence nucléique de SPG4 et la séquence
<Desc/Clms Page number 38>
protéique de la spastin humaine présentent respectivement une identité de 89 % (entre les positions nt 460 et nt 1982) et de 96 % (entre les positions aa113 et aa616) avec les séquences de l'ADNc et de la protéine déduite de la souris. Ce degré important d'homologie permet d'affirmer que ce transcrit de souris correspond à l'orthologue murin de SPG4, qui a été donc baptisé Spg4.
L'hybridation de northern blots comprenant les ARNm de divers tissus humains et murins (Clontech) avec les clones d'ADNc SPG4 et Spg4 n'a pas donné de résultats probants excepté une très faible bande correspondant à un transcrit de 2,5 kb dans le testicule de souris après 10 jours d'exposition. En raison du faible niveau d'expression de ce gène, les profils d'expression de SPG4 et Spg4 ont été déterminés par des expériences de PCR sur des collections d'ADNc normalisées provenant de divers tissus adultes et f#taux (voir Fig. 6). Le gène murin Spg4 est exprimé de façon ubiquitaire dans les tissus adultes de souris ainsi que du stade E7 au stade E17 de l'embryon de souris (Fig 6A). Une plus forte expression de Spg4 a été détectée dans le foie, le muscle squelettique et les testicules, ainsi qu'au stade E15 de l'embryon.
L'expression précoce de Spg4 au cours du développement embryonnaire a été confirmée par la présence d'ESTs provenant de banques d'ADNc de blastocyste, d'embryon E8 et de carcinome embryonnaire dans les banques de données publiques d'ESTs. Le gène humain SPG4 est lui aussi exprimé de façon ubiquitaire dans les tissus adultes (Fig. 6B) et f#taux (Fig 6C), avec une expression peut-être plus marquée dans le cerveau foetal.
Exemple 7 : Pas de défaut de la phosphorylation oxydative dans la PSF-AD liée au locus SPG4
Afin de déterminer si des mutations de la spastin induisaient un défaut de la phosphorylation oxydative (OXPHOS) dans la mitochondrie, à l'image de ce qui avait été observé pour la paraplegin, une biopsie musculaire a été réalisée sur un patient d'une des familles de PSF-AD liée au locus SPG4. Les analyses morphologiques et histo-enzymatiques de cette biopsie de muscle n'ont pas révélé de fibre musculaire de type RRF (pour ragged red fibers ), caractéristique des défauts OXPHOS dans la mitochondrie Le fait que toutes les fibres musculaires apparaissent normales ainsi que la prédiction d'une localisation nucléaire de la spastin semblent indiquer que la PSF- AD liée au locus SPG4 n'est pas une maladie mitochondriale de type OXPHOS, par opposition à la PSF-AR liée au locus SPG7.
<Desc/Clms Page number 39>
Par une approche de clonage positionnel basée sur le séquençage d'une région de 1,5 Mb, nous avons identifié le gène SPG4 (ou SPAST) responsable de la forme la plus fréquente de PSF-AD, préalablement localisé sur les bandes chromosomiques 2p21-p22 Trente-neuf mutations altérant ou susceptibles d'altérer le produit du gène, nommé spastin, ont pu être détectées chez les individus atteints de quarante-et-une familles de PSF-AD présentant une liaison au locus SPG4. La spastin est un nouveau membre de la famille des protéines AAA, dont la localisation semble être nucléaire et qui présente une forte homologie avec les sous-unités du protéasome 26S de levure En dépit d'une grande homologie restreinte à un domaine de 230 à 250 aa, dite cassette AAA, les nombreux membres de cette famille protéique peuvent participer à des mécanismes cellulaires très variés comme le transport de protéines au sein de vésicules, la régulation du cycle cellulaire, la biogénèse des organelles, le contrôle de la transcription, .... Toutefois, tous ces mécanismes cellulaires impliquent l'assemblage, la fonction ou la dégradation de complexes protéiques, ce qui suggère que les membres de la famille des AAA sont des protéines dites chaperons .
<Desc/Clms Page number 40>
Références 1. Reid, E. Pure hereditary spastic paraplegia. J. Med. Genet. 34,499-503 (1997).
2 Bruyn, R. P M. & Scheltens, P.H. Hereditary spastic paraparesis (Strumpell-Lorrain) in Handbook of clinical neurology Vol. 15 (ed. de Jong, J.M B.V) 301-318 (Elsevier Science Publishers B.V., 1991).
3. Werderlin, L. Hereditary ataxias. Occurence and clinical features Acta Neurol.
Scand. 73 (Suppl. 106) (1986).
4. Polo, J.M., Calleja, J., Combarros, 0 & Berciano, J. Hereditary ataxias and paraplegias in Cantabria, Spain. An epidemiological and clinical study Brain 114,855- 866 (1991).
5. Skre, H. Hereditary spastic paraplegia in Western Norway. Clin. Genet 6,165-183 (1974).
6. Hazan, J., Lamy, C., Melki, J., Munnich, A., de Recondo, J , & Weissenbach, J Autosomal dominant familial spastic paraplegia is genetically heterogeneous and one locus maps to chromosome 14q. Nature Genet 5,163-167 (1993).
7. Hazan, J. et al. Linkage of a new locus for autosomal dominant familial spastic paraplegia to chromosome 2p. Hum. Mol. Genet. 3, 1569-1573 (1994).
8. Hentati, A. et al. Linkage of a locus for autosomal dominant familial spastic paraplegia to chromosome 2p markers. Hum. Mol. Genet. 3,1867-1871 (1994).
9. Fink, J. K. et al. Autosomal dominant familial spastic paraplegia : tight linkage to chromosome 15q. Am. J. Hum. Genet. 56, 188-192 (1995).
10. Hedera, P. et al Novel locus for autosomal dominant hereditary spastic paraplegia, on chromosome 8q. Am. J. Hum Genet 64,563-569 (1999).
11The Hereditary Spastic Paraplegia Working Group. Hereditary spastic paraplegia : advances in genetic research. Neurology 46,1507-1514 (1996).
12. Durr, A. et al. Phenotype of autosomal spastic paraplegia linked to chromosome 2.
Brain 119, 1487-1496 (1996).
13. Nielsen, J. E. et al. CAG repeat expansion in autosomal dominant pure spastic paraplegia linked to chromosome 2p21-24. Hum. Mol. Genet. 6,1811-1816 (1997).
14. Jouet, M. et al. X-linked spastic paraplegia (SPG1), MASA syndrome and X-linked hydrocephalus resuit from mutations in the L1 gène. Nature Genet. 7,402-407 (1994).
15. Saugier-Veber, P. et al. X-linked spastic paraplegia and Pelizaeus-Merzbacher disease are allelic disorders at the proteolipid protein locus. Nature Genet 6, 257-262 (1994).
<Desc/Clms Page number 41>
16. Confalonieri, F. & Duguet, M. A 200-amino acid ATPase module in search of a basic function. BioEssays 17, 639-650 (1995).
17. Casari, G et al Spastic paraplegia and OXPHOS impairment caused by mutations in Paraplegin, a nuclear-encoded mitochondrial metalloprotease. Cell 93,973-983 (1998).
18. Osoegawa, K. et al. An improved approach for construction of bacterial artificial chromosome libraries. Genomics 52,1-8 (1998).
19. Scott, W. K. et al. Locus heterogeneity, anticipation, and réduction of the chromosome 2p minimal candidate région in autosomal dominant familial spastic paraplegia. Neurogenetics 1,95-102 (1997).
20. Heinzlef, O. et al. Mapping of a complicated familial spastic paraplegia to locus SPG4 on chromosome 2p. J. Med Genet 35,89-93 (1998).
21. Schnall, R. et al. Identification of a set of yeast gènes coding for a novel family of putative ATPases with high similarity to constituents of the 26S protease complex.
Yeast 10, 1141-1155 (1994).
22. Perier, F. et al. Identification of a novel mammalian member of the NSF/CDC48p/Pas1 p/TBP-1 family through heterologous expression in yeast. FEBS lett. 351, 286-290 (1994).
23. Beyer, A. Séquence analysis of the AAA protein family. Protein Sci. 6, 2043-2058 (1997).
Barany, F., (1991), Proc. Natl. Acad. Sci. USA, 88,189-193.
Bodansky M., Principles of peptide synthesis, (1984).
*Buckholz, R.G. Curr. Op. Biotechnology 4 : 538-542,1993.
Burg, J. L. et al. (1996), Mol. and Cell Probes, 10, 257-271.
Carter, B. J. Curr. Op. Biotechnology 3 : 533-539,1993.
Cherif D., Julier, C., Delattre, O., Derré, J., Lathrop, G.M , and Berger, R. Proc Natl Acad. Sci. USA. 87 : 6639-6643,1990.
Chu, B.C.F. et al. (1986), Nucleic Acids Res., 14, 5591-5603.
Chumakov, I., Rigault, P., Guillou, S., Ougen, P., Billault, A., Guasconi, G., Gervy, P., Le Chumakov, I.M., Rigault, P., Le Gall, I., et al. Nature 377 : 175-183,1995.
Duck, P. et al. (1990), Biotechniques, 9,142-147.
Edwards, C. P., and Aruffo, A. Curr. Op. Biotechnology 4 558-563, 1993.
Epstein, A. Médecine/Sciences 8 . 902-911,1992.
Erlich, H. A., (1989), New York : Stockton Press.
<Desc/Clms Page number 42>
Guatelli J. C. et al. Proc. Natl. Acad. Sci. USA 87 : 1990 et al. Cell 85 : 281- 290, 1996.
Innis, M.A. et al. (1990), Academic Press.
Kievitis, T. et al. (1991), J. Virol. Methods, 35, 273-286.
Kôhler et Milstein. Nature 256, 495-497, 1975.
Kwoh, D.Y. et al. (1989), Proc. Natl. Acad. Sci USA, 86, 1173-1177 Landegren U., Kaiser R., Sanders J. & Hood L. Science 241 : 1988.
Lizardi, P.M. étal. (1988), Bioltechnology, 6, 1197-1202.
Luckow, V. A. (1993), Curr. Op. Biotechnology 4,564-572.
Matthews, J.A. et al. (1988), Anal. Biochem., 169 : 1-25.
Miele, E.A. et al. (1983), J. Mol. Biol., 171 : 281-295.
Olins, P.O., and Lee, S.C. Curr. Op. Biotechnology 4 . 520-525, 1993.
Perricaudet, M., Stratford-Perricaudet, L and Briand, P. La Recherche 23 : 471-473, 1992.
Rohlmann, A., Gotthardt, M., Willnow, T.E., Hammer, R.E., and Herz, J Nature Biotech. 14 : 1562-1565,1996.
Rolfs, A. et al. (1991), Berlin : Springer-Verlag.
Sambrook, J., Fritsch, E. F., and Maniatis, T. Molecular cloning : a laboratory manual Sec. Ed. Cold Spring Harbor Lab., Cold Spring Harbor, New York.
Segev, D., (1992), Kessler C. Springer Verlag, Berlin, New-York, 197-205.
Stone, B. B. et al. (1996). Mol. and Cell. Probes, 10 : 359-370.
Stewart J. M. et Yound J.D., solid phase peptides synthesis, Pierce Chem Company, Rockford, 111,2ème éd., (1984).
Suggs S.V , Wallace R.B., Hirose T., Kawashima E. H. and Itakura K PNAS 78 6613- 6617, 1981.
Temin, H.M. Retrovirus vectors for gene transfer. In Kucherlapati R., ed. Gene Transfer, New York, Plenum Press, 149-187, 1986.
Walker G. T., Fraiser M. S., Schram J L., Little MC., Nadeau J. G., & Malinowski D. P Nucleic Acids Res. 20 . 1691-1696,1992.
Woo S.L.C. Methods Enzymol. 68 : 389, 1979.
<Desc/Clms Page number 43>
LISTE DE SÉQUENCES <110> CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE - CNRS <120> CLONAGE, EXPRESSION ET CARACTÉRISATION DU GÈNE SPG4
RESPONSABLE DE LA FORME LA PLUS FRÉQUENTE DE PARAPLÉGIE
SPASTIQUE AUTOSOMIQUE DOMINANTE <130> D18374 <160> 105 <170> PatentIn Vers. 2.0 <210> 1 <211> 110000 <212> DNA <213> Homo sapiens <220> <221> exon <222> (9932)...(10471) <220> <221> intron <222> (10472)...(33718) <220> <221> exon <222> (33719)...(33805) <220> <221> intron <222> (33806)...(35748) <220> <221> exon <222> (35749)...(35832) <220> <221> intron <222> (35833)...(45022) <220> <221> exon <222> (45023)...(45118) <220> <221> intron <222> (45119)...(60863) <220> <221> exon <222> (60864)...(61051) <220> @ <221> intron <222> (61052)...(61927)
<Desc/Clms Page number 44>
<220> <221> exon <222> (61928)...(62061) <220> <221> intron <222> (62062)...(62344) <220> <221> exon <222> (62345)...(62438) <220> <221> intron <222> (62439) ... (73173) <220> <221> exon <222> (73174)...(73248) <220> <221> intron <222> (73249)...(74633) <220> <221> exon <222> (74634)...(74705) <220> <221> intron <222> (74706)...(82788) <220> <221> exon <222> (82789)...(82864) <220> <221> intron <222> (82865)...(83102) <220> <221> exon <222> (83103)...(83194) <220> <221> intron <222> (83195) ... (83334) <220> <221> exon <222> (83335)...(83414) <220> <221> intron <222> (83415)...(88129) <220> <221> exon <222> (88130)...(88172)
<Desc/Clms Page number 45>
<220> <221> intron <222> (88173)...(89561) <220> <221> exon <222> (89562)...(89641) <220> <221> intron <222> (89642)...(91162) <220> <221> exon <222> (91163)...(91233) <220> <221> intron <222> (91234)...(93443) <220> <221> exon <222> (93444)...(93484) <220> <221> intron <222> (93485)...(100599) <220> <221> exon <222> (100600)...(102009) <400> 1 taactgactc tgctgtgttt ccttggcatt atagctaatc aaattgagca ggtcaggtaa 60 cagtttatac ttacacctac tatttcaaaa ccatgagctc attcacattt tcactgaagt 120 aacaaatcct ccataaacta gaaaatctca aactggtgac tgggagtttt ggttttgttt 180 ttttgttgtt ttattttatt ttattttatt ttctagatgg agtcttgctc tgttgcccag 240 gctggaatgc aatggcatga tctcagctca ctgcaacctc cacctttcgg gttcaagcaa 300 tcctcctgcc tcaatcttcc aagtagctgg gactacagga atgagctgcc gcacctggcc 360 tggtttgttt gtttttaaat tttgaggcca ggtgcagtgg cccatatctg tgatcccagc 420 actttgggag accaaggcag gccgattact tgaggtcagg agttcaagac cagccaggcc 480 aacatggtaa aaccatgtcg ctactaaaaa cacaaaaatt aggccgggca cggtggctca 540 cgtctataat cccagcactt tgggaggcca aggtgagtgg atcacctgag gtcaggaggt 600 caagaccagc ctggcaaaca tggtgaaacc ccgtctctat taaaaataca aaaattagcc 660 gggtgtggtg gcgggcacct gtaatcccag ctattgggga ggctgaggca ggagaatcgc 720 ttgaacctgg gaggtggagg ttgcagtgag tcgagatggtgccactgacc tccagcctgg 780
<Desc/Clms Page number 46>
gcaataagag cgagacgcca tctcaaaaat atataaataa ataaataaaa atacaaaaag 840 tagctaggct ttgtggcagg cacctgtagt cccagctact taggaggctg aggcaggaga 900 attgcttgaa cccaggaggc ggaggttgca gtgagccaag attgtgccac tgcgttccag 960 cctgggtgac agagcaagac tccttctcaa aaataaataa ataaataaat aaataaataa 1020 ataaataaaa ttttgagctg ggcatgaaag ctgaggcagg aggatccctt gagcccagca 1080 gtttgagacc ccagtgagct ataattctga cactgcactt cagcctggct gacagaggga 1140 gaccgtgtat ctaaaaagaa taaaataaca atgatttttg agccaataac tcttagccaa 1200 tagatttcac ataaaaattt agaattctgg tttctcttga aaaattaaaa aaatctgaca 1260 atgttaagct tcacattcct gaaaggcaaa aatcagtgga agctagctgg gtgctgtggc 1320 tcacgcctat aaacccagtg ctttgggagg ctagggtaag tggattggtt gagtccagga 1380 gtttgagatc agcctggcca acacagtcaa accccatctc tacaaaacat acaaaaatta 1440 gctgggatat ggtggtgtgc acttgtggtc ccaactactc aggaggctga ggcaggagga 1500 ccacttgagc cctggaggtt gagggggcag tgagccatga ttgtgccact gcactccagc 1560 ctggacgaca gagagacatt gtctcaaaaa gaaaaaaaaa aatcagctca gtgggagctg 1620 agtaacagct gtcctgttca attacaggat gcaactcttt agcttctcat agtttccatc 1680 attcacatca tacatgcatt tttgcatgcc acacaaccca cacatggaac ccatatatgt 1740 tatatgcctg accactgttg ctattggaag ttttggccac tgcattaaac tataaactcc 1800 atcttattaa tcctgacacc ccacttattg cctgatatat tgtccgtttc ttaatatcta 1860 ttcatagaac aaatgaatga ataatatgtg ccacattgtg gactcaattc agggagatga 1920 ctaatcattc acaattatgt ttttccttct taatacagag attggataat aattccccaa 1980 ttgttacttc tctcatccct cccctccaac catatctttt catttgtttt tcttatttta 2040 ggttttctgc ctttttcaaa atcagccatt tcctcactgg actctacatg tgccattttt 2100 tttttttttt ttttactaat ttttttagtt gaaaagaggt ccttaatatc tgtcattggt 2160 ccacacttga aatctagaat ctctcgaatt gaaggtctga agagttcctt agaaggcaag 2220 tagggccgaa atatccaaaa aaaactattt gatggtaggc actgtggtaa ataaatatgg 2280 gttaaagtga taaagtgacc gaatgtcctg gattagttag cacagtacct agctccttct 2340 ttttgtcctt gtgaaactgt ctcagattcc attcaagatt aagtgtcctg aaagttctta 2400 caagctgaaa actgggaggc tctcacactg taggtagaat ggctagcagg gttgggatct 2460 catctaggca cattgcagaa ccagggtaac accaaggcat tatttttttt ctttctttac 2520 ttttcttctt tttttttaga gacagggtct cattatgtta cccaggctgg attccaattc 2580
<Desc/Clms Page number 47>
ctgagctcaa gtgatcctcc tgagtagctg ggacttcagg tgtgcaccgc tgtgtctgaa 2640 ggcactgttt tttttgtttt ttttgttttt tttgacacaa atttaggaag atgttaattc 2700 acaacagtct tgagactgag atataattcc aaggagcaga agatgtgagt ttagagcact 2760 aaaaaatgag attccagtag agtcagaaat ctgaaatggc attacagata taagagacaa 2820 aaacaaaatg tattgagctc tgtcatgttg caggcatcat gatggaggtt ttagatgtac 2880 tctttcattt tgtaattttt atagaggaat taactagaat agcaacccca gtcccactaa 2940 ctctaaatcc catattttta ccatacaaaa aaagagcaaa agtgcagaaa agcacagtca 3000 atattaagta caaccagata gcagagactc agtaaatggg aggccggagg cccgaaaccc 3060 aacataatgc ccatgaatga aagcccatca cttgcgcttc aggggctaac aatatactta 3120 tttcataatt aaaatagaaa cagactatgt aaaaatatta ttcttgagat cccagatttt 3180 taccttaaat tactgaggca gtaagtgtaa ttaactaata tgtgatgttg ggcaaataac 3240 agactcttag agccccaaat tctttatttt aaaaaactga ggccagatga ggtggcttac 3300 acatgtaatc ccagcactgg ggatgccaaa gcaggcagat cacttgagct tgagcttagg 3360 agtttgagat cagcctgggc aacacggtta agacctcatc tctaaacaaa atacaaaaat 3420 tagccaaaca tggtggtgtg cacctgtgtt cctggctact caggaggctg aggtggaagg 3480 atcgcttgag cccgagaggt tgagggtgca gtgagccatg atcttgccat tgcactctac 3540 actctagtct gggtgacaga gtgagactct gtcttggggg aaaacaaaag agatgataat 3600 gcttaactga agtagcaata ttttaaaaag gcactaaaag ttcatctgct tagttcagaa 3660 tatgggttcg ataaatatta gcaagtagta gtagtcatca tcatcactgt cactgctgtt 3720 ctctccttaa acttaagcat gttttttgtt tttttgagac agtgtctcac tctgtcaccc 3780 aagctggagt tcagtggtgt gatcttggct cactccaacc tctgcctccc aggttcaagt 3840 gattctcctg tctcaccctc ccaagtagct gggaccacag acacgtacca caaccacacc 3900 cagctaattt ttcgtatttt tggtagaggt ggggtttcac catgttggcc aggctggtct 3960 tgaactcctg acctcaagtg atccacctgt ctcggcctcc caaagtgctg ggattacagg 4020 cgttagccac agcatccagc cttaagcatg ttaattaagt ttttataatt cagcaaaatg 4080 gttggaaaat gctgtcttaa atgagatgct taagctgccg tctgaacatg aggtagaagg 4140 aaattctaca cataatcatt gtgctaaatt acttgcaaag atggccacaa caattcctcc 4200 tatcctcata tatatgcccc tttgcaatgt gactttgcta cttctctatc aagatgtgga 4260 gcttattttc ccatatattg cactagagtt ggccttctga cttgctttga caatggaatg 4320 tagtacaaat gacactgtgc aactttggat tttaggtttc gagagaactt acaccttcca 4380
<Desc/Clms Page number 48>
ctcacactct cttggaaacc agatgcaatg taaagaagtc agggctatcc tgctagagac 4440 atatgtccca gctaatagcc acaatcaacc tctgaacata tgaatgaggc tagctaggcc 4500 atacagccat tcggtcaagc catcagatga ctacatccac aggaatgatc cacaggcaag 4560 gccatcagaa gaaccatcca gctgaactta ccccaaattg ctgagtcaca aagttgtgtg 4620 taaataaatg tctgctatct taagccagtg agttttggag tggtatatta catagcatca 4680 gaaatctaac acaatcatta tgtttgaatc atttttcaaa tttctcatat ttattaaatg 4740 agtaccataa gcaaggtgtc aggctggatg caaaaagtga ggcaaaatgt ataaagtgtg 4800 accactgcct tcagtaagtt tacaatctat atcaagaggt gatgaagtgt ttaaataatc 4860 atcctgcagg gcaatatagt ataagagcca cagagtaaca caaccatatt gtcataacaa 4920 ctgaaaaaca agatcatttc tgctggaggt gataatggaa taatttatca agaatataac 4980 agagctggac gcggtggctc acacctgtaa tcccagcact ttgggaggcc aaggaaggtg 5040 gatcacaagg tcaggagttc gagaccatcc tggctaacac gatgaacccg tctctactaa 5100 aaatacaaga aattagccgg gcgtggtggc acgcgtctgt agtcgcagct actcaggagg 5160 ctgaggcagg agaaccactt gaacatggga agcagaggtt gcattgagct gagatcgtgc 5220 catggcactc cagcctgggt gacagagtga gactcagtct caaaaaaaaa aaaaaaaaaa 5280 aaaatataac attagaggta agtcttgaag gactttgaca gtggaagtag gaggcgaggc 5340 cattctaagt gaatgaaaaa tgacaggaga gtaattgtag tcctggaaaa gagcaaagta 5400 ggtacagacc aacagtctat attagctaga gtatagtgaa agtgcagagg aaatgtcgga 5460 gaaccattct ttattcaaaa actatcttcc tcatggccaa gcatagtggc tcatgcctgt 5520 aatcccagca ttttgggagg tcaaggtgag tggatcactt gagctcagga attcaagacc 5580 atctggggca acatagtgag acctcatctc aactaaaaaa caaaaaattc agacagatgc 5640 agtggctcac acctgtaatc ccagaacttt ggtaggctga ggcgggcgga tcacgaggtc 5700 aggagatcaa gaccctcctg gacaacatgg agaaacccca tctctattaa aaatacaaaa 5760 ttagctgggc atggtggcac atccctgtaa tcccagctac tcgggaggct gaggcaggag 5820 aatcgcttga accagggagt cggaggttgc agtgagccga gatcgcacca ctgcactcca 5880 gtctggcgac agagcgagac tccatcttaa aaaataaata aattttaaaa aaaactaccc 5940 cagcatggtg gtgcatgcct gtagtcccag ttactcagga ggctgaggca agagggtggt 6000 ttgagccagg gaggtcaagg ctgcagtgag ctctgatggc gccactgtac tccagcttgg 6060 gtgacagagt gagaccttgt ctcaaaaaca aaaacaaaaa caaaaaacca acaaatctcc 6120 ttgttagtat catggtgagt aaaaaataaa ataaaaatag aaataaactg aacatggtgg 6180
<Desc/Clms Page number 49>
ctcatgcctg taatcctagc actttggaag gctgaagtgg gaggattgct tgagggctgg 6240 agttcaaaac tggcttgggc aacacggtga gagagacctt gtctctacaa aagaactttt 6300 aaaacaaaaa atagataatt taaaaaaatt aaaaaaaaca aaaaataaaa aaataatcaa 6360 gtatcaactt gattccaggc actgcttact actctagtgt tatactgtag atgtggaagc 6420 tgagtaactc atccaagatc accgaaagtg atggaacaca gatctaaatg caaccagtct 6480 gactccagga ccatttaacc attctactat tgggccctat cttggctaag ttagaaagta 6540 agttactttc tttagtggta aagactggag ggataacagg gaagatagtt atttaagaaa 6600 aaaaactggc atcaaactaa atatccatca atagttgaac agtaaaatag gttgtggtaa 6660 attcatataa tggaatacta tatagcagtg aaaatgtacc acagttatag aaatcaacag 6720 ggaggaattt caacacttaa ttattaagta ggtagccagg catagcggtt tatgcctgta 6780 atcccagcac tttgggagac caagacagga ggattacttg agcccagggg ttcgagatca 6840 acctgggcaa cagtgagact ccatctctat tttcttaaaa taaaataaat gaaattttaa 6900 aaattttgag gagggaaagc aaacaaggga tacttgaaat atgattacat ttccataaag 6960 tcaaagtgag gcaaaatcat acaagacatt gtttagaaat acataaatac actgcaaact 7020 aaaaatgaga cactagaatg attaatataa aattcaggat agtggcttcc tctagaggaa 7080 gagacaagac attgagatta gggaggagct cacagagtgc ttcgaggagt tggttacatt 7140 catttttctt aaatggaatg ctgcttatta tttttcttta aattgtgcat ttaagtaaca 7200 cacttcttgt ttatatgata tatgtataaa tgtaattttt ttttttgaga tggagtttcg 7260 ctcttgttgc ccaggctgga gtgcaatggc actatcttgg ctcactgcaa cctccacttc 7320 ctgggttcaa gtgattctcc tgcctcagcc tcccgagtag ctgggattac aggcatgcgc 7380 caccatgccc ggctagtttt gtatttttaa tagagaaagg gtttctccat gttggtcagg 7440 ctggtctcga actcccgacc tcaggtgatc cgcctgcctt ggcctcccaa agtgttggga 7500 ttacaggtgt gagccaccgt gccaggccct gaatcagatt taaaagaggg catttcatta 7560 aaaaaaattt tttgttgttt gcttttgaga cagagtctcg ctctgtcgcc caggctgcag 7620 tgcattggca tgatcttggc tcaccgcggc ctcagcctcc caggttcaag tgattctcct 7680 gcctcagcct cgcactagtt gagattacag gaatgcacca ccaccacagg aatgcacctg 7740 tctaactttt gtatttttag tatagaggga gttttgccat gttagccagg ctgctcttga 7800 actcctgacc tccggtgatc tgctcgcctc ggctcccaaa gttctgggat tacaggcgtg 7860 agccaccaca cccggccgaa agagggcatt tcagaatgag ggtctagcat aagcacagag 7920 aagggggagc aataagaggg aaacagggag taggtcattt ttgcaatagc ctgtgacatt 7980
<Desc/Clms Page number 50>
tgtagggcag tactggcggg gaataattaa gtaaaattgg ctggtgctgt ggctcatgcc 8040 tgtaatccca gcactttggg aggccgaggc gggcaggttg cttgagccca ggaattcaag 8100 accaacctgg gaaacatagc aagaccctgt ctcaacaaaa aagtaaaaaa attagctggg 8160 ggcgcgatgg ggtggctcat gcctgtaatc ccaacacttt ggaaggctga ggcaggcgga 8220 ttgcttgagc ccaggagttg gagaccagcc tgggcaacat ggtgaaaccc tggctctata 8280 aagaatacaa aaattagtcg ggcccagtgg cgtgtgcctg tgatcccagc tactcgggag 8340 gctgaggtgg aaggatcacc tgagccaggg aggtggaggt tgcagtgagt catgttgttt 8400 gcgccactgc actccagcct gggcaatgga gtgaaaccct gtccaaaaaa taaaaaaata 8460 aagctgtggc agaatgtgga gattcttgga agctggaagc tctcatgggg catttggaaa 8520 cctcacattg taaataacgg agtcttttta tcagtttggc ttccttagtt ttaggaaaca 8580 agaaataatt atggctaact caagtaaaaa gagaaagaga agagaaaaaa gacgtggaga 8640 tagagagaga gggagagaga ggaaaagacg aaaggaagga agggggaaag gagagaggaa 8700 gagagaaaca gagaaacaga ctgattagtg tattggatag attacataac caagtgacca 8760 gtcaggaacc cagcagctct gggggagctc aatgtgatgc attgataaac ccgctcttaa 8820 gagcactcgt ttccagttac tttctattcg gtgggtctcc agccaagatt ccaggtccca 8880 ggagaatctg actgacctag tgtttgcttc cgcctttgcg gtctgggttc tgtgcttgca 8940 gctcattaga atacagggag cagagacaag caggtagttt cccaaaggaa gggatgctga 9000 gtagattaaa aaaaaagtgt agattcttca gtaaactatg ggatggtaac tatgcaaaac 9060 ctaagatttc ccttattcaa ataaattatc tttcatatta gacatctaaa tatgcactaa 9120 tttagttaaa cccctgggtt agttgatctc atcacactga gctaacattt ttgttgctgt 9180 tgtttgcagt gacctgaagt ttcttatctt cacaattgct ttcctctcaa ataattccca 9240 gattttaaat ttttatttta ttttttctgg agacggagtc tcgctctgtc gcccaggctg 9300 gagtgcagtg gcgcgatctc agctcacttg cagcctctgc ctcccgagtt caagcgattc 9360 tccggcctta gccttccaac cagctgggac tacaggcgcg cgcccccacg cccggctaat 9420 ttaattccca gattgatatc cattgcttct gagatgggcc aattatcctt cggagaagac 9480 ttaggtcgcc tggcagaaaa agatgaaaga aatctaagaa aacgacgaca ctgagagagg 9540 agcctagcga accagcagag cgaccccaag ccgcaattcc cccttccgtg gatcgattac 9600 gaaggcttcc tggcaggagc tctccagggc tgccgacgtg agccgaactg cacattggga 9660 actgtagttg agtgggaaag ccgagaggcg ggggccgcac acgcgtacag gggccccggt 9720 caacaaagac gcgccgtgcg cgcgcgcgcc ggagaaaaac acgggaagac gtgcgcgtgc 9780
<Desc/Clms Page number 51>
gcggccgccg ctgggagcca ccaggcggcg gagaggacag cgacaggaag ggaggggccc 9840 gagccaccga ctgcaggagg agaaggggtt gtgctcctgg ccgaggaagg agaaaggggc 9900 ggggccggcg ggcagcgtgc ggcagtgcgg agctcctgag accggcgggc acacgggggt 9960 ctgtggcccc cgccgtagca gtggctgccg ccgtcgcttg gttcccgtcg gtctgcggga 10020 ggcgggttat ggcggcggcg gcagtgagag ctgtgaatga attctccggg tggacgaggg 10080 aagaagaaag gctccggcgg cgccagcaac ccggtgcctc ccaggcctcc gcccccttgc 10140 ctggcccccg cccctcccgc cgccgggccg gcccctccgc ccgagtcgcc gcataagcgg 10200 aacctgtact atttctccta cccgctgttt gtaggcttcg cgctgctgcg tttggtcgcc 10260 ttccacctgg ggctcctctt cgtgtggctc tgccagcgct tctcccgcgc cctcatggca 10320 gccaagagga gctccggggc cgcgccagca cctgcctcgg cctcggcccc ggcgccggtg 10380 ccgggcggcg aggccgagcg cgtccgagtc ttccacaaac aggccttcga gtacatctcc 10440 attgccctgc gcatcgatga ggatgagaaa ggtaactagg gggctggggg agggggcggc 10500 ggcgccggga agaaggcggt ggggtcgccg ggggagggca acacctgcgt cccttttctg 10560 cgggagggga cggtgcaccc ccggaattga tatgccccgg gagactgctt tcccgtaggt 10620 cggagcctca tcttctagta ttcttaaaac ctctcccctt tcagggcact gtagctgtcg 10680 actttgtttc agacaccagc cttcccccac acttctgcat gacccaggtc actatgagac 10740 acccagacgt gttgatgaca gtgacatttg tcctagagtg accacactga tcctttctag 10800 cactgtgaag agtgtgcagc ttcctctgaa ccaaggtttc caaaaggttt tgatattgaa 10860 gaagcagtgc cgccttactg gcttttaatg aaagcagagt attgtagtgt cagaaaaaaa 10920 gaacaaatgg tgacaatttt gaaagaaata gctgcatatg actgcagttg aatttgcatc 10980 attttaatca agataatcat tttatcagta caacgattcc tgaatacttt ttcaatgaag 11040 ttatatttag cataaaactt ttccccctgt tgctttgatt ttaattaaaa cagtattcca 11100 aagtagcctt taatttccaa gttgaaatgt ttgatgaatg gattgcgtaa acttaaacat 11160 accactttac agtaaaacct aaaacaacta tgtatgtttc tgaatgaaag caaggatact 11220 acatctttcg ggtttctttt aagctaactt tttttttttt ttgagacgga atctcgccct 11280 gtcgcccaag ctggagtgca atggtgcagt ctcggctcac tgcaacctcc gactccctgg 11340 ttccagcgat tctcctgcct cagcctcccg agtagctggg attacaggca cgcaccacca 11400 cgcctggcta atttttgtat ttttagtaga gtagggattt caccatgttg gccaggatgg 11460 tctccatctc ctgacctcgt gatcgggtcg cctcggcctc ccaaagtgct ggtaatacag 11520 gcatgagcca ccgcgcctgg ccttaagcta acatttttta ttatatgtgc caggcattgt 11580
<Desc/Clms Page number 52>
gctattagct ttgcatgtgt tatctttttt ctttttaaaa aaaatagcaa ccatcccaga 11640 ccatgaaaag tgttatttaa tcctcacaat aactttgtga gatgaaggta ttattggtat 11700 cagcatttta gagatgaaga aaatgaggcc caaaagataa aggaggttat tccaaacctg 11760 tgctaataat gaaatttctt ttatggaaaa taagtgaaat taggagaagt ctaactttta 11820 caattctccc cttttatcct tacttccagt atgctgagat cttgcttctc cctctgccaa 11880 aaacacccac ttttctacca cacctcaatt agatactcac ttgcattgtc cattagtgaa 11940 aacagaaaca atctgcactt cattcatagt gtctgtctct actgccaact ccaaaaactg 12000 ttctagaatt tcaatcttgt tgaaacctgt ttcctttgtg gggcctggga gtgggaagtg 12060 ggatataagg aaagaggcag ttattcattg ttttggacag taaggaaaga gtgacggtta 12120 agagaggtca aggagggtgt taacatttaa gaatactatg tgtttgtaga aggaaatttt 12180 ttgttaactg ctccattctt tttttttttt ttttttgaga tggagtctcc ctgtgtcacc 12240 cagactggag tgcagtggcg tgatctcagc ttactgcaac ctctgcctcc cagacgcagg 12300 cgattctctt gcctcagtct cccgagtagc tggaaccaca ggtgcgccct atcacggctg 12360 gctaattttt tgtattttta gtagagatgg tgtttcacca tgttggccag actggtcacg 12420 aactcctgac ctcaggtgat tcgcctgcct cgaccttcca agtgcttgga ttacaggtgt 12480 cagccactgt gcccacccag caagctccat tctttatcac ctcttaagaa catccaggat 12540 cccttgggga gaattaaaac ggttgcaaag ttttagaata gaggaacatg tttaagcgta 12600 gatcattttt tgggccagtc atggtggctc acgcgtgtaa tcccaacact ttgggaggcc 12660 ggggcgggtg gatcatgagg tcaagagttt gagaccatcc tggccaacat ggtgaaatcc 12720 catctctact aaaaatacaa aaattagctg ggcatggtga cacatgcctg tagtcccagc 12780 tactcaggag gctgaggcaa gagaagtgct tgaacctgga aggtggaggt tgcagtgagc 12840 cgagatcgtg ccactacact ccagcctggg cggcagagca agactccgtc ttgaaaaaaa 12900 aaagtaggtc atttttggct gggcacggtg gctcatgcct gtaattccag cactttggga 12960 ggctgaggtg ggtggattgc ttgagcccag gagtttgaga ccagcctggg caacatagtg 13020 aaaccctgtc tttgtgaaaa atacaaagat tagctaggcg cagtggcaaa tgcctgtagt 13080 cccagctact tggggggctg aggtaggagg atcacttgag ctcaggttgt tcaggctgca 13140 atgagctgag atcgtgcaac tgcactccga actgggtgac aggagtaaaa ctgtctcaaa 13200 aaaaaaaaaa aaaaaaacca aaaaaaaaaa aactgtttta attgttttat ttaggaagag 13260 aaagtcagaa catgcaagga aatttttttt atttgtttat ttttgagacg gagtctcgct 13320 cagttgccca ggctggagtg caatggtatg atcttggctc actgcaacct ctgcctcccg 13380
<Desc/Clms Page number 53>
gattcaagcg attctcctgc ctcagcctcc tgagcagctg ggattacagg tgtatgccac 13440 cacgcccagc taatttttgt gtttttagta gagatggggt tccaccatgt tggccaggct 13500 ggtttcgagc tcctgacctc aagtgaaccg ccctccttgg cctcccaaag tgctgggatt 13560 acaggtgtga gccgcggtga ccgaccacaa ggaaatttta gttaacactg ttggttgatg 13620 ggagttggga ggtaggataa aaggagaaat taaggaaaac ctaggcatga aaaataaaag 13680 accctgagct cttagatttg aagaaatagc agttccatgt gaggaataag tggaagaaat 13740 agaattcaga cctcaggtct caggctggtg acttaaatct ttcagtatca catatatgaa 13800 tatatctatt atacttaaat cctcctaaac atttttattt ttcagttgga tatattaaat 13860 atataaaaat aattatttaa tttattttag agacagtgtt tcactctctt acccaagctg 13920 gagtggaatg tgatcatagc tcactgcagc ctcaaggctc attcctaggc ttaagtgatc 13980 ctcttttttt tttttttgct agagatagga tcttgttatg ttagccaggc tggagaaatt 14040 tcaacaatat tttgaacaat aaaaaaaaaa taaattaggt tttattgtaa agtggtatgt 14100 ttaagtttac gccattctcc tgcgtaatgc atatttcata ctcttcctac tgataatgtt 14160 tctgttcaca actttttctt tatattttga tttcttttct cttttctttt tttttttttt 14220 tgagacagag cctcgctttg tcgcccaggc tagagtgcag tggcgcgatc tcggctcact 14280 gctagctccg cctcccgggt tcacgccatt ctcctgcctc agcttcccga gtagctggga 14340 ctacaggcgc ccgccaccat gcccagctaa ttttttgtat ttttagtaga gacggggttt 14400 cactgtgtta gccaggatgg tctcgatctc ctgacctcgt gatccacccg cctcggcctc 14460 ccaaagtgct gggattacag gcgtgagcca ccgcgcccgg cacatatttt gatttctaat 14520 gtggacatca gaatgggctg ttgacagctc tttttttttt ttttgaggca gagtctcgct 14580 tcttcaccca ggctggagtg caatggcgcg atctcagctc actgcaacct ccacctccca 14640 ggttcaagcg attctcctgc ctcagcctcc ccagtaactg ggattacagg catgtgccac 14700 cccacaccca gccaattttt gtatttttag tagagacagc atttcaccat gttggccagg 14760 ctgttctcga actcctggcc tcaagtgatc cactcgcctt ggcctcacaa actgctagga 14820 ttacaggtgt gagccaccgt gcccagcctt gacaggtctt tagtttgatt ttagttcaac 14880 aactgatgcc gtaatatgcc aaattaaatt agttcagact gaaacggatt acttaaagat 14940 tcattttcct ttaaaaatga agtaaaactt tagccggatg tggtggcggg tgtgtgtaat 15000 cccagctact cgggagggtg aggcaggaga atcgcttgaa cccaggaggt ggaggttgca 15060 gtgagctgag atctcaccca ttgcactcct gcctgggtga gaagagtgag actccatcaa 15120 aaaaaaaaaa aaaggctggg catggtggct caagccgggt gcagtggccc atgcctgtta 15180
<Desc/Clms Page number 54>
tcccagcact ttgggaggca gaggcaggcg gatcacttgt agtcagaagt tcgcgaccag 15240 cctggccaac atattagtga aaccccgtct ctactaaaaa tacaaaaatt agctgggcat 15300 agtggtgcac gcctgtagtc ccgggtactt gggacgctga cgcaggacaa ttgcttgaac 15360 tccagaggtg gagattgcgg tgggccaaga tcacgccact gcacgccagc ctgggcaaca 15420 gagcaagact ccatctctca aaaaaaaaaa aaaaagaaaa ctgagtttat attgttatgg 15480 ttcttatcta tcttaaattt tttctttagg agattgaata tttttgtact ttagtcttaa 15540 tccagtggtt gaaagagagt gcacttttga agtctgcctc ttggctgtcc ttgacaacac 15600 aaaccttagt tccaagagaa tgtaattctt cctctttctc agtgcttcaa aatatatatg 15660 atcaaataga aacgagttga ataggcagtc tcttcaaagg tttcctaact ctgtggttaa 15720 ctatcaagga gctggtaata tcatgcactg ccattccctt ggcaacatga cttatctttt 15780 tttttttttt ttcttttttg agacagagtc ttgctctgtc acccaggctg gagtgcagtg 15840 gcgagatctc agctcgctgc aagccccgcc tcccacgttc acgccatttt cctgcctcag 15900 cctcccaagt agctgggact acaggcgcct gccatcacac ctggctaatt ttttttgtat 15960 tttttagtag agacggggtt tcaccgtgtt agccagtacg gtctcgatct cctgtcctcg 16020 tgatccgccc accttggcct cccaaagtgt tgggattaca ggtgtgagcc actgcgcctg 16080 gcctacttat cttctaattt aactgaaaac caatttattt gattcagtga aatggcatca 16140 aactgtagta gtgttaattg aaatatttgg taccttgaaa tgttaaatgc caaattaaat 16200 ctcattttaa tgaaatctcg tgtaaatgtg ttttatatgg tgactatgtt tattctgaat 16260 tttattctta tggcatacta aaaaaaaaaa aaattttttt ttttttttgt aatggagtct 16320 tgctctgtca cccacgctgg agtgcagtgg cgcaatctcg gttcactgta acctccacct 16380 cccgggttca agcgattctc ctgcctcagt ctcccgagta gctggtacta caggcgtgca 16440 ccactatgcc tggctaatat ttttgtattt ttaggagaga cagggtttca ccatgttggt 16500 caggctgatc tcgaactcct gacctgaagt gatccgcctg cctcagcctc ccaaagtgct 16560 gggattacag gtatgaccca ctgcacccaa cccatactca aatttgacac tgaattttca 16620 taaaggcctt aatttatctg aaaccaaact atttcaaaag aggaatagca cagcaaattc 16680 tgttgactta atgagaggat atgtgaagtc tatttattaa agcaaatatt aattggaggc 16740 cagttaattt gtacagctct gcattttaga tatttgagaa atatttattt cctctccagt 16800 gagatgtgtt aaaacattag ttatgtgatt aacaaatatg tgtacatacg tatatatgta 16860 catacacatt ttgagacagg gccttggtct gttgttcagg ctggagtgca atgacaccat 16920 cttagctcat tgaagcttca gcctcgcagg ctcaatcgat ccacccacct cagcctccct 16980
<Desc/Clms Page number 55>
agtagctggg tctacagaca tataccacca tgcttggctg attttttaat tttttgtaga 17040 gatggtgatc ttgccctgtt gactaagttg gtaaatattt taattgttga actttcttgg 17100 aagactgaaa acctgtgata gccattttat ataaggagaa gctgaagttc aaagagtaga 17160 ctcatagcag aaacaaaaat agaatttaag tgaatggact caaaatattg tactttttac 17220 tttatactgc aggtttttat gttgtaatgc tggtaatgag ctccttggaa tatttggagg 17280 aaaagagaag gttgtaataa tggttctttg gatttactag aacatatcat gttctgcatg 17340 gctcctgtgg gtagacaagc cggaaatctc ctgggtaaca caatggtgga ggttctctag 17400 gtgacgtttg atttctcaag tacataggac taaacagaaa aggcctagta tgttatatga 17460 atgagagatc aagtttctca ggatattcta gggctaaagg atcaggcatc gaagacagaa 17520 attgtctaaa taaaattttt tctattcata gttttaaagg gctaaagggt caggcattga 17580 agacagaaat tgtctaagta aaatattttt ctgttcatag ttttaagctg tgtatatgtg 17640 catgtgtgta tttaaaataa cttcgtcaat gaaaagagtc aaactctgta aaatatttga 17700 agagatttat tctgagccaa atatgagtga ccagtggccc atgacacagc cccagtagat 17760 actaagaaca tctgtccaag gtggtcaggc tatagcttga ttttatacac tttagggaga 17820 cataagacgt cagttaaaca tgtaagatgt acattggttc catctggaaa ggcaggaaaa 17880 ctagaagttg gggaggcttc caggtcgtag gcagattcaa agattttctg attggcaatt 17940 ggtcaaaaga gcttatctaa agtcctggaa tccatagaag ggagtgtctg gtttaaaata 18000 ataggttgta gctaccaagg tttttattgt acagatgaag cctccaggta gcaggcttca 18060 gagagaatac attgtaaatg tttcttatga gactttaaaa ggtggcagac tcttaagtta 18120 attttctcct ggttcaggta aaagacttgg aaagggaaag gattctctac agaacgtaaa 18180 ttttccccac aagagaaagc tttgcagggc catttcagaa tatgtcaaag aaatataatt 18240 tagggtaaaa tacttcaatt tgttttattt atttatttat tttttgagac agagtctcgc 18300 tctgttgccc aggctggagt gcagtggcat gatctcggct cactgcaagc tccgcctcct 18360 gtgttcacgc cgttctcctg cctcagcctc ctgagtagct gggactacag gcgctggcca 18420 ccatgcccag ctattttttt tgtattttta gtagagacgg gatttcacca tgttggccag 18480 gatggtctcg atctcttgac ctcgtgattc acccgcctcg gcctcccaaa gtgctgggat 18540 tacaggcgtg agccactgtg cccggcctca aaatacttca atttctttca tggcctgcta 18600 tctgacgtga tgctgtacta gagtcaggct gggaatttgg cgtcttattg ctacaaaaca 18660 tcttaatatc tctgttttaa tgttaatgct gatcagttgt ccctgaattc caaagggaag 18720 agggtatatg agtcatgtcc aacccccact tctcattatg gcctgaacta gttttttagg 18780
<Desc/Clms Page number 56>
ttaactttgg aatgcctttg gcaaggggag ggtccatgag tcagttgggg gtcttagagt 18840 tttatttttt gcttaccggt ttataaaaag ttaatgaaaa ttatcatatt tcataattct 18900 atataattca atattgtact ttatttaaaa ctcacgtata aaatagctgt ccatatctgt 18960 tttcagaaga tgaggatgga gggtagaaat cagaagtgtc agatttggta attttcttac 19020 actgctgaaa acctatacct accactttga aaggattaat ttcagacttg ctttctttgg 19080 gcctaatgat tctactttga agtttctctg attaaactaa ggaataaatc tgataaatgg 19140 acattcagat gataccatac ttttccaaaa gataacattg cttttgatta catatgcaat 19200 aaacatttca cattttttct caagattatt tactggcatc tgcaccaaag acacaaaaaa 19260 gcagccactg ttaaggactt tatcccttgt tctgttttta gctggtttgt tgttgtattt 19320 ttcctcatgt tgaatacagt taaaccctat taaactggat tccccatatt actgttagtt 19380 gtcctgatga caattaagga tagttagtaa atggatattg aatcatttta tttttttagt 19440 agtgatggcg tttcgctgtg ttggccaggt tggtctcgaa ctcctggcct caagtgatct 19500 gcctgtgttg gcccctcaaa gtgttaggat tacaggcgtg agccactgca cctggctgga 19560 tattgaatta ttgaagaagg atgttcccta acacttcctg cctcttttcc gctgtcttac 19620 tctctctgtt ccacccagta gtagttgggt ttttgatgtc tggcaaagta tagattgtct 19680 actcttctat attagttttc ttcactcttt tttttaaaaa tgtttttaaa gcaagataga 19740 gacagggtct tgccgtattg cccaggctgg tcttgaactc ctgagctcaa gcaatcctcc 19800 cacctcaccc cataaagtgc ggagattaca ggcatgagcc accatgcctg gccagttttc 19860 ttcactcttg acctataata gtcctgcaaa gccagtgaag ctgttaatat gctgacgtag 19920 cctttttttc tctcgtttgt gaattattaa caatcgctga tcttacacat catatacaat 19980 aaaacatctt tgaacactgt cacatctcag cagctcattc tggttaatga ggaaagaaaa 20040 atgtcaaaat ctgtgatttt cttagaggtt attaaatgtt ttacagctat gtagatattc 20100 tgtagacttg ctgtacttac ttacataact tttctgctct tctgcagagg gagagaatta 20160 acttcataag tgggctttgt caatgccctc cagtcagcga tctccaggaa caaacttatc 20220 tatggttgag caagtggggt ttattaccca ctgtagccag ggagaacaca catatgtaat 20280 aaccatggta tgtcatagta aagggtgtta ggaagatagg atttgggctc gtttatttgg 20340 tgattttaag gagggtttaa agaagcaggg ttttgctctg atttggatgc taccaggagc 20400 tgcgaataat tctatgaata aatatcataa aacctatcta gaagaaaaga ctagagtgag 20460 gtctaaagct gtagtagtta aaaagcaaag gtcactcctt atctggaaaa ggggaatatt 20520 tggtatttca tggtttagac agtgttcagt gttcatgttt tgcctgtgtt tagacataat 20580
<Desc/Clms Page number 57>
tgtagagtgg tcttgttcca ccgtggtcac agagtggcat tatttcatgc tgatattctg 20640 taagtgccag gtcaaatacc aaggtttagc tgatagtagt aggccagctc ctggatgtaa 20700 taagctgttt ttctctttct cagctttttt ttttgttgtt ttttttttaa aatagagtct 20760 ggctctgtca cccaggctgg agttcagtgg gggcaatctc agctcactgc agcctctgcc 20820 tcctggattc aagcgactct cctgcctcag cctcccaact agctggaatt acaggcgcaa 20880 gtcaccacac ccggctaatt tttgtatttt tagtagagac ggggtttcac catgttgagc 20940 aggctggtct cgaactccgg acctcaagca atccatctgc ctcagcctcc caaagtgctg 21000 agattacagg catgagtcac tgcacctggc ctgtttctta gatttgaggg tcaactttta 21060 cccttttcga actgtggggc ttcttatgga aattgacatt taagtcctga ccatatagga 21120 tcttgggcaa gttacttaac tatgtatgct gagatgtttt tttaaatgct tagtgcttgc 21180 acataatagg tactcagtaa atgagaacta ttattataaa atcaatagta cttttaagat 21240 tacagctaga ggttatgtta gaacattgtt aactcttcgt actagtttct gttacacttt 21300 ttaggatgca gtagcagcat aaacgagata tggggaagaa cgagaggtat ttaaacagtg 21360 atataggccg ggcgtggtgg ctcacgcttg taatcccagc actttgggag gctgaggtgg 21420 gcagattacg aggtcaggag attgagacca tcctggctaa cacggtgaaa ccccatctct 21480 actaaaaata caaaaacaaa attagccggg cgtggtagtg ggcgcctgta atcccagcta 21540 tttgggaggc tgaggcagga gagtggcgag aacccaggag acagagcttg cagtgagccg 21600 agatcgcgcc actgcacccc agcctgggcc acagagcgag actctgtctc aaaaaaaaaa 21660 aaaaaaaaaa attaaaacaa aaatatttgt gttaattgtg atgacaaaaa aaaaaaaaga 21720 gatggaagtc tctccctaac ctcactcctc atttagtgtc atggcttttt tctttttttt 21780 tttttttttt ttgagacaaa gcctcactct gtcacccagg ctggactgca gtggtgcaat 21840 ctcagctcac tgcaggctct gcctcccaga ttcaagcaat tctcctgcct cagcctcaca 21900 agtagatggg actacaggca catggcacca tgcccagcta attttttgtg tagtttttag 21960 tagagacagg gtttcactat gttggccaggctggtctcga actcctgagc tcaagtgatc 22020 ccccctcctt ggcctcccaa agtgctggga ttacaggcgt gagccctgct cccagactcc 22080 tggctttttt tttttttttt aatgaaaaat tcaaaatgct cttttttttt tttttttttt 22140 tttgagacag agtctcgctc tgtcgcccag gctgaagtgc agtggtgtga tctcggctca 22200 ctgcaacctc tgcctcccag gttgaagtga ttctcctgcc tcagcctctc gaacagctga 22260 gattacaggt acgcgccacc acgcctggct aatttttgta tttttaatag agatggggtt 22320 ttgtcatgtt gtccaggcta gccttgaact cctcgcctcg tgtgatccac ctgccttggc 22380
<Desc/Clms Page number 58>
ctcccaaagt gctaggatta taggcgtgag tcgctgcacc tggccacaga aattttttga 22440 agaagataaa taaggtgaca tttttaaggg tcaaagaaaa tgtcaaaaac tagaatgatg 22500 tctttacata gggtttaaaa ctttccaaat taacagggaa aataattctt taccttgaaa 22560 ataaatgttt gctagtgaaa gcaaatacaa tctttttact aaatgtttta ttaaattttt 22620 ttttcttgta gacacagggt cctactgtat tacccaggct ggtcttgaat gcctggcctc 22680 aagcaatcct cctacctcag tcttccaaag tgctgggact acagacatga gccatcacac 22740 tgggtctttt ttaccaaatt atagtagaaa gcactttttc tctaatggtg aactatgaga 22800 gaattaatca ggggctatta gtaattcatc cctgaattaa tcagtgatta taatgctttg 22860 tggtccatgt agtttgctgg ggattaacac accatgaaag tctaccagga gatttttttt 22920 tttctttgag aacaggggcc ataatcagta gtccttaaat gaaatggact attcccattt 22980 cattatatgt tgcctaggct ggactcgagc tccttggctt aagtgatctt cccacttcag 23040 actctcaagc agctgggact ataggtgtgt gccaccatac ctggcttaat tgagtgtttg 23100 ttttttgttt ttttttctga gacagagtct cgttgtgtcg cccaggctag agtgcagtgg 23160 cacaatctcg gctcactgca acctctgttt cccaggttca aacgattctc ctgcctcagc 23220 ctcccaagta gctgggatta caggcgcctg ccaccatgcc tggctaattt ttgtattttt 23280 agtagagatg gggtttcacc atcttggcca ggctgatctc gaactcttga cctcatgatc 23340 cacacacctt ggcctcccaa agtgctggga ttataggcgt gagccaccgc gcccggcttt 23400 aattgagatt tttagatatc tattactctg ctaattttgt cacttgcaag ttgccatcag 23460 aaaattgtag gaaaatggat atatttgttc cttggaatgg tttgtgtgag aatacttaag 23520 gattaaatag ataagtaaaa ctggtgggct ttatataaca tagatgagca aatgtcagga 23580 acatacaact gtgcacacag ttcaggagaa ggaggattta agttaatcaa caaatttact 23640 aagtataata aagatactaa aagtagtgtt tccataccac tttattactt aaagtatcat 23700 catataccct attttatatg atttttgcca caagtcagag ttaggtaaaa gaaatacttg 23760 cttttcaggt aaggagtttg acgcccagac agattaactg acttttccaa aatcatattg 23820 ctattaaatg gtggaacaag gacttaaatc tttgccttct aactcacata cttgcaaaca 23880 catatcctct cactctaccc caagctaccc atgttttgac ccttcttgtg gcaatctggg 23940 tctcactaat atttgaaaga aaacgtacag tagataattt gcaagttaat ctgttacgca 24000 tatctcttac ctctatttaa agatgaatat cagcatttct gttgtttcta cagtaacata 24060 ctaaaaaata atgcagtcca ggtgcagtgg ctcacacgtg taatcctagc acttttggaa 24120 gttgaggcag gaggatcact tgaagccagg agttcgagac tagcctgggt atgcaagacc 24180
<Desc/Clms Page number 59>
ccatttctgt tttttttttt tgtttgtttt gttttgtttt gttttgtttt tttgagacgg 24240 agtctcgctc tgtcgcccag gctggagtgc agtggcggga tctcggctca ctgcaagctc 24300 cgcctcccgg gttcacgcca ttctcctgcc tcagcctccc aagtagctgg gactacaggc 24360 gcccgccact acgcccggct aattttttgt atttttagta gagacggggt ttcaccgttt 24420 tagccgggat ggtctcgatc tcctgacctc gtgatcccca tttctttttc actgcaacct 24480 ttgcctccca ggttcaagtg attgtcgtgc ctcagcctcc caagtagctt gggattacag 24540 gcatgtgcca ccatgcctgg ctaatttttg tattttttgg tagagatgga gtttctggcc 24600 aagctggcca ggctggtctc gaacgcctag cctcaagtga tctaccctcc ttagcctccc 24660 aaagtgctgg gattacaggt gtgagccact gtgcccggcc ccatttctac aacaattaaa 24720 aaatattagc ccagtgtagt ggtgcatgtc tctagtccca gctactcaga aggctgaagt 24780 gaaaggattg cttgagccca gaatttcaag gctacagtga gctatgataa tggcattgca 24840 ctccagcttg ggtgacagag tgagaccctg tctctaaaaa atgaagtaaa atagtgcaca 24900 agtatagaac ttgaaaatct tccttaacct taccataagg gaaatgatta ctaataagtt 24960 tcttaacttt ttgtacttac ataaacataa atattcatca gagaaaaaaa tatgcaaaac 25020 aatttgcaat ctttttcact taccatattt tggaattttt ttcatttcaa tatatttgat 25080 cttccttgtg ttttttcagt ttgtttgttt ttgtcaccca ggttggagtg aagtggtaag 25140 aacatggctt attgcagcct caatctcctg ctcccattca gcccctcaag tagctgggac 25200 tacaggtaca tgtcaccacg cccggctaat ttttattttt attttggtag agatggggtt 25260 tcaccatgtt gcccaggctg atcttgaatt cctgggctca agtgacccgc ccacctcagc 25320 ctcccgaagt gttgagagaa caggtgtgaa ccaccatgct ccacctctta gtctttacaa 25380 tctgcaaaac ctcataagtg gctaatagag gaatatagta aagcaaaggg ggatatcact 25440 gattagaact gtgtttttag gctgggtgcg gtggctcacg cctgtaatcg caacattttg 25500 ggaggctaag tgggagtatc acttgagccc gggagttcaa gaccagcctg ggcaatatag 25560 tgagagaccc tgtctttaga aaaaaattaa ccaggtgtgg tggtgcacac ctgtggtccc 25620 agctattcaa gaggctgagg tgggagaatc gcttaagcct aggaggcgga ggttgcagtg 25680 agatcatacc actgctctct agcatgggtg acagagcgag acccagtcta aaaaaaaaag 25740 tattttttcg tttttttcca actcatgtac acccgccacc ccacccctgc tttttttttt 25800 tctgacattg ggtcttgctc tgtcacccag gctagagtgc agtagcacaa tcaactcact 25860 gcagcctcct cttcctggac tcaagcagtc ctaccacctc agcctcccaa gtagctggga 25920 ccacaggtgt gcaccatcat gcctggctaa tttttgtact ttttgtagag atagggtttc 25980
<Desc/Clms Page number 60>
accatgtggt tcaccatctc taactcctgg gctcagtcag tccacttttg cctcggcatg 26040 agccactgtg tgcagcccac gttttttatt aatggatatt tggattgttt ccatctattg 26100 tgaataatgt ggctatgaac attggtctaa atatctgttt aagtcccggc tttcaatact 26160 tttggatata tacctaggag tagaattact gaattatatg gtaactttct gtttaaattt 26220 ttgaactgcc aacctgtttt ccataggggc tgcaccattt tgcattccca ccagcagtgt 26280 acaagggttc cagtttctcc acatttgtta tttttcattt tttaaaataa tagtcatcct 26340 aaagggtatg aagtggtatc tcgttgtgat tttgatttgc atgtattttt ctaatgactt 26400 atgatgctca gcattttgtc atgtacttat gtaccatttg tgtatcttct ttggaaaaat 26460 gtctattaat gttcttttcc cattttttaa ttgggttgtt tttatgttta tcaattttgt 26520 aaacatttta agctctgcag cataactact caaccctgtc acatggtaag attgacccag 26580 taaaacttta tgtacaaaaa taggcagctt actagattta atcttagtcc atagtttgct 26640 aaggcatgca ttagataatg tagttacact attggctaat aatttaaact acaagtggtt 26700 gtaagtttct gccacccaaa ttctttcttg atttgatgta gtctggttgg ttgaatttga 26760 gtgttatatg gggtcataga gttaaaagag aaatgtctat gagaaactag ggactgttgg 26820 gagctaatgt taaaggattt tggaggcctt ttgtgcactg gagaccattg gaagattgga 26880 ttttctgcta taaatgtatc taaaggataa tcagtgtaag ttatgggctg tagtttgcca 26940 acccctacat taagggattg aaataatttg aatatgggtt tcagttcttg tatggtctgg 27000 ctcagttctt tttttttttt tttttttttt tttttttttg agatggagtc tcactctgtt 27060 gcccaagctg cagtgccatg gcacgatctc agctcgctgc aacctccgcc tcctggcttc 27120 aagtgattct cctgcctcag cctccagagt agctaggact acaggcacgt gccaccacat 27180 ctggctaatt tttttttttt tcaagacaga gtttcgctct tgtcacccag cctggagtgc 27240 aatggcacga tcttggctca ccgcagcctc cgcctcctgg gttcaagtga ttctcctgcc 27300 tcagcctccc aaatagctga ggcaacaggc gtgcgccacc acgcctagct aatttttctg 27360 tttttagtag agatggggtt tcaccatctt ggccaggctg gtctcgaact cctgatctca 27420 tgatccaccc gcctcagcct cccaaagtgc tgggattaca ggcgtgagcc acctcacctg 27480 gcgttttttt gtgtgtgttt tcagtagaga tggggcttca ctgtattagc cagaatggtc 27540 ttgatctcct gacctcgtga ttcacctgcc tcagcctccc aaagtgctgg aattataggc 27600 atgagccacc acgcctggct gtggctcagt tcttaactgt tcattcattc agggtcccag 27660 ccaaaatctt ttgccacagc ttctcctggg catgctctga aattcatttt ttgtctgttt 27720 agttgcatga gtccactgaa agctttgctt attttctcca ccactttcag agttcacagt 27780
<Desc/Clms Page number 61>
cacttcaagt agacgaggtc aggagatcga gaccatcctg gccaacatgg tgaaaccccg 27840 tctctactaa aaatacaaaa cttagctggg cgtggtagcg tgtgcctgta gtcccagcta 27900 ctcaggaggc tgaggcagga aaattgcttg aacccgagag gcagaggttg cagtaagccg 27960 agatcatacc atttcactcc agcctgggcg acagagtgag acactgtcaa aaaaaaaaaa 28020 aaaaaaaaaa aggaaagaaa agtgctccaa atgctgggct catctctgct ggcttctctc 28080 ctttttatat ttcgataatt tttaaaataa taaccatcct aatgggcttg atatggtccc 28140 tcctttctaa attttggtaa ttttcattgt tttggaaact cactaatccc ttcaaacaga 28200 tgtttttaaa actttttttc tagttctctc tctttttttt tttttttttt tttttgagac 28260 agggtctctc tcagtggtgc gacctccctt actgcaacct ctccctcctg ggttcaagca 28320 gcgattctcc tgcctcagcc tcccaaatag ctgggagtac aggcacccac ccccacgccc 28380 agctaatgtt tgtattttta gtagagattg ggtttcatca tgttggccag gctggtctcg 28440 aactcctgac cccaggtgat ccgcctgcct cagccttcca aagtgctggg attacagcca 28500 tgagccaccg cacctggctc tagttctctt ctaatcttac tatagtaatc aaaattttag 28560 tgctgatgtt ataatccaag cccaaatgga tattcttata cattaaatgt tggaatatca 28620 tgtttgttaa aaatcagatc tgctgggcac ggtggctcaa tgcctgttat cccagcactt 28680 tgggaggccg aggcaggtgg atcccctgag atcaggagtt cgagaccagc ctgaccaaca 28740 tggagaaact ccgtctctac taaaaataca aaattagccg ggcgtggtgg cacgtgcctt 28800 tcatcccagc tacttgggag gctgaggcag aagaattgct tgaacctgtg aggcggaggt 28860 tccagggagc tgagatcgtg ccattgtact ccagcctggg caacaagagc gaaattccat 28920 ctcaaaaaaa aaaaatcaga tctgtcccta tggttttatc ttcactgcat gtcatatata 28980 aatggaagca tgtagtatgt agccttttgt gtctcgcttc tctccctttg cataatattt 29040 ttgagattta tcccttttcc tacatatgtc agtagtttgt ttctttttaa tgctgaatag 29100 tattccacgt gtggagatac cacaatttgt tactccattc actaaatgat ttgggttgtt 29160 tcctgttttt gttattgttg ttgttgttgt ttaattaatt aattaatttt ttttttgaga 29220 tggagtcttg ctctgttgcc caggctagag tgcagtggcg caatcacagc tcactgcaac 29280 ctctgcctcc ccggttcaag tgattctcct gcctcagcct cccaagtagc tgtgattaca 29340 ggtgcccgcc accacaacca gctaattttt gtatttttag tagagatggg atttcaccat 29400 gttggccagg ctggtcttga actcttccct ccttggtctc ccaaaatgct gggattacag 29460 gtgtgagcca ccatgcccat cctcctgttt ttaaatttta tgaataaagg tactgtaaat 29520 tcatgtacag gtcttagaag tttgcatttt tcttgggtaa atatgtagaa gaagagattg 29580
<Desc/Clms Page number 62>
ttgactcatg tggtaaatat atgtttaatg tcataagaaa ctaccaaact gtttttccaa 29640 ctgggtgcca ttttgtttcc taccagcaaa cataatgaaa ggtccattac cctttgtctc 29700 gtaatatttt ggtattttta tgttcttttg tttttttgcc attcaaaatt gggtgcattg 29760 ttgtatcttt ggattttaat ttgtacttcc ctaacaacta atgatgtgga gcatcttttt 29820 atacgcttac ttgccaatta tgtcttaatt ctttggcaat acttatattt gactctgcct 29880 actatatata tatatatata tatttttatg ctatatatag agtatatata tttttatact 29940 atatatattt atatatacta tatatattta tatatactat atatatatat atatatatat 30000 atattttttt ttttttttga gatgaagtca tgctctgttg accaggctgg atgcagtggc 30060 atgatcttgg cttaccgcaa cctcaacctc tgcctcccag gttcaagtga ttctcctgcc 30120 tcagcttcct gagtagctgg gactacagac acatgccacc atgcccggct aatttttgta 30180 tttttagtag aggtggagtt tcgccatgtt gtccaggctg gtcttcaact cctgacctca 30240 ggtgatccac ccgcttcagc ctcccaaaag tgctgggatt acaggcatga cccaccgtgc 30300 ccagctggaa taagcaatct taaaaagcag tttgttgatt tctggtgaat agagaaaatg 30360 tgacaaacta tgactcaata gtttcatttc ttttttgttt gtttgtttgt ttttttgaga 30420 cagagtcttg ctctgtcacc caggctggcg tgcagtggct cactgcaagc tctgcttcct 30480 gggttcacgc cattctcctg cctcagcctc cggagtagct gggactacag gcgcccgcca 30540 ccatgcctgg ctaatttgtt ttttgtattt ttagtagaga cagggtttca ctgtgttagc 30600 caggatggtc tcgatctcct gacctcgtga tccacccgtc tcggcctccc aaagtgctgg 30660 gattacaggc atgagccacc gcccctggcc tacttttatt tcttaagcat atatcttaaa 30720 gaaactgcag gtatgcatta ggggacaggt agaaaaatgt tacagcattg tttgaaatgt 30780 tgaaaaactg gaaacaacct caatatctta ataatagaaa aaatggttga ggctggctgt 30840 ggtggttcat gcctgtaatc ctagcacttt tggaggctga ggcgggcgga tcacctgagg 30900 tcgggagttt gagtccagcc tggccaacat ggtgaaaccc cgtctctact aaaaatacaa 30960 aaaattaggc aggtgtggtg gtgcacacct gtaatcccag ctacttggga ggctgaggca 31020 caagaatcac ttgagcctgg gaaatggagg ttgtagtgag ccgagatcat gcctactgca 31080 ctccagcctg ggcaatagag tgagactccg tctcaaaaaa aaaaaaaaaa aaaaaaaggg 31140 aaggagcatg ggaatgggaa gaggcactaa aaaaggaact tcttttgtat ctgttacatt 31200 gtactcattt tgtttttaaa attttaagcc aaatatgaca ttgttatcac ttttgttgcc 31260 actcagaata caagtgctat tacactattt tctataattt tccctttttc aaactaaaaa 31320 acaaaaatac atgtaaacag gtgttttctt tatggaaaac aggaaggtga gcatccaaat 31380
<Desc/Clms Page number 63>
aattttagtt aatttataac aaactcttaa taatttcttt ttcttcttct tctttttttt 31440 tttttttttt tgagtcaggg tcttgctctt ttgctcaggt tagagtgcaa tggtacaatc 31500 tggtacaatc acatcttagt gcaacttcta cctcttcagc tcaagtgacc tctctcctca 31560 gtcccccaag tagatgggac cacagatgtg tatccccaat catggttaat ttttaaattt 31620 tttggtagag ataaaatctc accatgttgc ccaagctggg cttgagctcc tgggctcaag 31680 cagtcctcct gccttggcct cccaaagtgc tgggattata ggcgtgagca aactgtgccc 31740 agtcttcata aacttttctt tacatgtcct tatcaagtac tttttgagca cctactgtca 31800 accagccgta gtatataata ctgataattc tataacataa gaaattgacc tgtttaaggg 31860 gatgaatatg gttagttatt ttcagggtga agaaacagaa gaatcgggga ggtagtacat 31920 agtcataagg agacggcatt tcttagtcac tttgtgtggt gtttataata agacttcatg 31980 tggccaggtg cggtggctcg tgagcgcctg taatcccagc actttgggag gccgaggtgg 32040 gaggatcaca acaaggtcag gagatcgaga ctatcctgaa caacatggtg aaaccccgtc 32100 tctactaaaa atacaaaaat tagctgggtg tggtggcacg tgcctgtaac cccagctact 32160 cgggaggctg aggcaggaga atcgcttgaa ccagggagtc ggaggttgca gtgaaccaag 32220 atcgtgccac tgcactgcag cctgggctac agagagagac tccatctaaa taaataaata 32280 aataaataaa taaatagact tcgtctgttt catcaagagt cattgtatta tattgatttt 32340 gaaatttcaa ataataataa ggaatagtat ggaaattttt gtttgattaa atggggacat 32400 gaggccaggt gtggtcactc aggcttgtaa tcccagcact tcgggagacc agggcaggag 32460 gattacttga gcctaggagt tcaagaccag cctgggcaac atggcaagac cctatctcta 32520 caaaagaaat acacaaaaat tagctaagtg tggtggcaca tgcctgtagt cttagctact 32580 cgggaggcca agggaagagg atggatcact tgagcccagg agttggaggg tgcagtgagc 32640 taggattgtg cccctgcact ctagtgtggg tgacagcaag actctgttta aaaaaaaaaa 32700 aaaatgaggc cgggcgcggt ggctcacctc tgtaatctga gcactttgag aggccaaggc 32760 gggtggatca cctgagttca agatcagcct ggccaacatg gtgaaaaccc cgtctttata 32820 cttaaattac aaagattagc tgggtgtgat ggtgcacacc tgtaacccca gctactccag 32880 aggctgagac agcagaatcg cttgaacccg ggagggggag gttgcaatga gccgagattg 32940 caccactgca ctccagccta ggtgacagag caagactctg tctcaaaaaa aaaagaaaaa 33000 aagtctaaga agttaatttt cattcagaca aatgttcaaa aataatagaa ataaaacaaa 33060 aaattaattt tcaaatatgt gatttgagta taacgatcac tttacagaag ttattctaca 33120 tactttttga ttatgctgag tttttaggtc cttttaaagc ttaacttgta tcaggaatta 33180
<Desc/Clms Page number 64>
atgttttaaa ctagttgttg ggttcaaaga aaatagaaat gtgttattaa atgccacact 33240 tgtaatctca tacagcagtt ctcatgatgc aatcaattgt taaataaaaa cttcctctag 33300 agaggaggta cccagcaatg aacacattat atcagatttg aatatgagat taaacaatgc 33360 tttttgtttc attgttattg aaatcatatt tgtatttttc aaaagtatat atacttaaaa 33420 attcctaaat aaaatgtctt tctgtaatac agcattttag gttataagga tcaataccat 33480 gggctgataa gcaaaatagg actcacggcc ccaaaatgtt gataaacatc atgaccatat 33540 tccccataat ggagttacat atacacatta caatgataaa aatactaaga agttatatag 33600 taatgtttct cagacttgtt cacaaccctg ttttttatgt attacctctc aaaagcatga 33660 tttgcaatat ttagtgtact cttcatacga tctatacaaa taatttttta ttttaaagca 33720 ggacagaagg agcaagctgt ggaatggtat aagaaaggta ttgaagaact ggaaaaagga 33780 atagctgtta tagttacagg acaaggtaag attgtatttg tttatagcca tcccaaatta 33840 tgatatattc acatgattgt ccagatttca gatctattta tttatttatt tatttttctt 33900 tctttctttt cttttctttt cttttttttt tttttttttg agacagggtc tttcctctgt 33960 tacccaggct ggagtgcagt gatgtgatca tagctcactg caacctcaaa cttctgggct 34020 caagtgatcc tcctgcctct gcttcccatg tagctgggac cacaggcgca cactaccata 34080 cttagctaat tattattatt attattatta ttattattac tagtttttga gacagagtct 34140 cgctcttttg cccaggctgt agtgcaatgg tgcaatctcg gctcactgca atctccgcct 34200 cccggattca ggctatttat tctcctgcct gagactcctg agtagctggg attacaggtg 34260 catgccaccg tgcccagcta atttttgtat ttttagtgaa gatggggttt tgccacgttg 34320 gccaggctgg tttcgaactc ctgatctcaa gtgatctgcc cacctcagcc tcccaaagtg 34380 gtgggagtac aggcatgagc cactgtgggc cacacttagc taattaaaaa aaattttttt 34440 gtagagacag ggtctcactg tgtttctgtg actgatctta aacttctggc ctcaagtgat 34500 cctcctgcct cagctttcca aagttgtggg attacaggca tgagccactg tacccagcca 34560 gattgtattt atcttaataa atgtatttgg gccaggcaca gtggctcatg cctgtaatcc 34620 cagcactttg ggaggccgag gtgggcgaat cacctgggat caggagttcg agaccagcct 34680 gatcaacatg gagaaaccct gtctctacta aaaattcaaa attagccagg cgtggtgtcg 34740 cgcacctgta attgcagcta cttgggaggc tgaggcagga gaattgcttg gacccaggag 34800 gcggaggttg tggtaagcca agatcgcgcc attgcactcc agcctgggca acaagagtga 34860 aactctgtct cagaaagaaa gaaaagcaaa acagtatttc atttaattaa aaatgccttg 34920 tattatacca gtaagagtaa aaaacaattt aattaaagta tgatatatgc tcttttcatc 34980
<Desc/Clms Page number 65>
acttagaatt tgaattttaa tcttattgaa gaggctgttt tagttttatt tagatatggt 35040 tataacaaca atattaatat ctgtgaccaa attggtgcat gcatgggcaa tgaaaagcta 35100 tgttgtgact gcagcatggt ggatagcatt agtaagttag cattggttgt aaaatgaatc 35160 ccaatttcaa agattttgaa acgtggggaa aaaatatttt agaccccatg aaataagacc 35220 tgaaatctat gaaataccac agtaggttgg aaatcatcat gagaaactgt aactattttt 35280 ttttataggt attatatgta ttctttgaga cagggtctca ccctgttgcc caggctggaa 35340 tgctgtgatg tggtcacctc tcactgcaac atccacttcc tggggctgaa gtgatccttg 35400 caactcaccc tcccatgctc ggctaatttt tttttttttt tttttaagta gagaccagat 35460 ctctttatgt tgcccaggct ggtcttgaac tcctgggctc aagtgattct gctttgtctg 35520 cccagagtgc tgggattaca gaagtgagcc acaacacctg gcctaaagat agtattttta 35580 aaatttcttc tgttttcttt cttttgggta tacattttct tctttttttt aaaaaaaaat 35640 ttctgtataa agactgtgac tccccatgaa agtagtttgg gtgataattt atcgtgaaac 35700 aatattagtt gggaaatgta gatattttaa ttaatttttt tctttcaggt gaacagtgtg 35760 aaagagctag acgccttcaa gctaaaatga tgactaattt ggttatggcc aaggaccgct 35820 tacaacttct aggtatcaat taatgtataa tttgatgtgg gatgtattgg aaatgtgtgt 35880 tcaatgaaac tttaatttgt agaaagaaat agatcagtga ttgaaaatgt ggtccaggct 35940 ttttaacata aagaaaacgt ataacatata caaaaacaga agagcataat ggacttcttt 36000 ttttttttga gatggacgct tgctctgtca cccaggctgg agtgcagtgg cgtgatcttg 36060 gctcactgca agctctacct cccaggttca cgccattctc ctgcctcagc ctcctgagta 36120 gctgggacta caggcacccg ccaccacgcc ccgctaattt ttttgtagtt ttagtagaga 36180 cagggtttca ccatgttagc cagaatggtg tccatctcct gacctcgtga tccacccgcc 36240 tcggcctccc gaagtgctgg agttacaggc gtgagccaac gcgcccagcc gagcataatg 36300 aacttctaat tattcttctc tcagctttga taattatcac ctcactatca gtcttgattt 36360 atttatacca agggctagca aactgcagct gatgggccaa cccagctcac tgcctattac 36420 tataaataag gttttattgg cacacagcca ttcctttcct ttaggtattg tctatggctt 36480 tcatgctacg gtgacagaat tgaatagttg atacagagac aacactgccc tcaaaaccta 36540 acatatttac tgtctggccc tgagaaagcc tgccatcttc acttgacatc ccacttcact 36600 gtcccccaac ttcttattat tttgaaacaa attattgact tattttccat ttataaatat 36660 ttcatattat acctctaaaa gataaggatg tcaaaataaa atcacagaaa taccattatc 36720 acacctaaaa aataactcca aatttctttt aacattatcc aaaaaaactg acccccccaa 36780
<Desc/Clms Page number 66>
aatgcaattt ccaaatttct aattttctca aaatttaata atttttacta ttttttaata 36840 atttgtttgt atcaggatct taaaaagatc cgtatgtctc ttttaatgta caggttcatc 36900 tgtttttcat tttcttccaa tttatttgtt gatgaaacca ggtctttgtc atgtaatatt 36960 tcctacagtc tgacttttgc tgcatgcatc ttttgtggta tgttttaaca tgttcttctt 37020 tcctcccacg ttaaatgata gttggatata gagccttgat cacattgaaa gttgattttt 37080 attttttaat gattagacta cttcctaggt ggttgtgttt gtgtgttcat cattagttgt 37140 tccatcttgt gaggttagca gcagttaact atgactgatg tccagtgata ctttaattct 37200 gtcattcttt cagcattcat caactgtaat agaaactttt acttgtcttc tgtttgatgg 37260 cgtaggtttt aaatatatat taataagtta aatctaccac tcaaaaaaag tagaacaaaa 37320 cctactacat atgagtggct ctaccatacg ttggtggatg gaaatagtag atatttggta 37380 agcaggtaaa ccttatttat ttgtagccct gtgacttggg gtaagttatt ttgcatgtct 37440 gggtcttttt tatctaattt gtaatatgaa gctattatta ttattattat tattattatt 37500 attattatta ttattattat tattcgagat ggagtcttgc tttgttgccc aggctggagt 37560 gcagtggtgc aatctcggct caatgcaccc tccacctcct gggttcaaac tattctcgtg 37620 attcagtctc ccgagtagct aggattacag gggcctacca ccacacctaa tttttgtatt 37680 tttagtaggg acggggtttc accatgttgg ccaggctggt ctcaaactcc tgacatcaag 37740 tgatccatcc acctcagcct cccaaagtgc tgggataggc cgggcacggt ggctaacgcc 37800 tgtaatccca gcactttggg aggccgaggc gggtggatca cgaggtcagg agattgagac 37860 catcctggct aacacggtga aaccccgtct ctagtaaaaa aatacaaaaa actagccagg 37920 tgtggtggcg ggcacctgta gtcccagcta cttgggaggc tgaggcagga gaatggcatg 37980 aacccaggag gcggagcttg cagtgagccg agatcatgcc actgcactcc aggctgggca 38040 aaagagcgag actctgtctc aaaaaaataa aataaaataa atagataaat aataataata 38100 aagtgctggg attacaggca tgagccacca cgcccagctg aagctaatat tattagctaa 38160 taataatatc tcatattttt gaccattgaa ttattaaagg aacctaaacc atagtagtaa 38220 gtgctttaaa aatgttggtt tttatttatc tgtttacctg actgtcatca cctcctttgc 38280 ttaggtagaa agatatattc ataaacacat acatatacat tttattcatt ctttaattca 38340 tttactccta tatggtcatt gtgtttgtgg gatttttgcc cgcacatagt taaaaatgca 38400 gccgttactg ctttcagatg agtaacaagg tagtgttccc tggcttctgt ggctgacagg 38460 atttgccttc ttcctttcta aatggaggtt attactgtgt cagatataat taaatagtgt 38520 attaaagttt gttgcaataa aataattgat ggttctaatt ggtactttct acgtgtttta 38580
<Desc/Clms Page number 67>
tctttaaagc ttttcagtgt atatataaag tatatatcat acagaataaa tttgattgtg 38640 gagcattttg taacatcttt caaaattaat aagagttggt ttttatgttt tgtttgatgt 38700 tatgatatag gacattagaa gtattaatat caattagaga ctcatctttg aatgtgactt 38760 tgtactttct tatttgtgtt agtagaggag agaacaaaaa gaagatatgt aatgtaatat 38820 gaaactaggc atttaaagat ttaacgtttt ggatatttta aagttggtgt ctgttttcac 38880 cctcaaaaat gctattacct atttatgaaa tatctttaaa agtgtggagt ggtagatggg 38940 aaaggtgaca tcggctgggc gcggtggctc acacctataa tcccagcact ttgggaggcc 39000 aaggtgggcg gatcacctga ggtcaggagt tcacgaccag tctggtaaca tggtgaaacc 39060 taatctctac taaaaataca aaaaattagc caggctggtg gtacgcacct gtaatcccag 39120 ctactcagga ggctgagtca ggaggatggc ttgaacccag aaaatggagg ttgcattgag 39180 ccaagatggc accactgcac tccagactgg gtgacagaga gagactccgt ctcaaaaaaa 39240 aaaaaacgcc gggcactgtg gctcacacct gtaatcctag cactttggga gactgaggcg 39300 agcagatcac ttgaggtcag gagttcgaga ccagctgggt gcctgggcaa catagtgaaa 39360 ccccgtctct actaaaaata caaaaaaatt agccgggcgt agtggcgggc gcctgtagtc 39420 ccagctactt gggaggctga ggaaggagaa tggcgtgaac ccgggaggcg gagcttgcag 39480 tgagccgaga tcccgccact gcactccagc ctgggtgaca gagcgagact ccgtctcaaa 39540 aaaaaaaaaa aaaaaaaaaa tagccgggca tggtggcggg cacctctaat ctcacctact 39600 tgggaggttg aggcatgaga attgctcgag cctgggaggc agaggttgca gtaagcagag 39660 accacaccac tgcactctag cctggatgac agagtgagac tttgtctcaa aacaaaaaca 39720 aacaaaccaa accacctctt gtccactcct aatctccctt actgtgtttc acttattttt 39780 ttcccatata tttgtcacct tctaataaac tgtgtaactt attttttatg tttattgtgt 39840 actatctgtc ttctccctgt tggaatataa actctatgga ggagggatcc ttgtctatat 39900 cccaagtgcc tacaacagtg tctagcacat gctagttacc gaataaatat ttgccaagtt 39960 aatgaagttg tttataaccc ttggcactat acctgataca gtgtagggac ttaataaatg 40020 aatgttaaat gaagctatct taaaaatata tatatatata taacagccag atacgccaat 40080 ttgccgacat caaaattaat cttttcatct attgcaggtt ttacagttaa gctttgctct 40140 aaggttcact atcactaaac caaaaataaa taatatggat ggtcttttcc catttttaac 40200 agagaggcta catcctctca aaccagtcag tattaggaat tcccaggatc attctctcca 40260 ttttccatcc taattagata cctatctggc accacatctc tgaaaagctc caatttttaa 40320 ccagcacata ataaacaaat atgttactat taatacacgt ttgtacacaa gtcattttta 40380
<Desc/Clms Page number 68>
ttgtcttagg tatatccact cccagacctt ctgagttatt gaaagacagg aatttgtgat 40440 gtcacctctt ttttcttttt tttgagacgg agtcttgcct tatcacccag gccagagtgc 40500 aatggcgtga tctcggctca ctgcaacctc tgcctcccgg gttcaagcga ttatcctgcc 40560 tcatcctcct gagtagctgg gattacaggt ggccctagtt tgggtttttg gttttaaaca 40620 ggatggtctc ctctttgaga agttgccatg agttagccat gatgatacct gggacaataa 40680 tggtccacag agaagtaaga gccaatacaa cgccttaaga gaaagtacct ggtatgtttg 40740 tgaagcagca aagaggccaa tgtgttccag caaggagatt atagtagaga tgaagtcaga 40800 gaactcatgc ggagagggat tgtcacaaca cgcagggctg taaaggccac catgaggact 40860 tgagctttta ccgcctgtga aatggggagc agttacaaag atttttaaga aagcagccca 40920 gtgcagtggc tcatgcctat aatcccagct ctttgggagg ctgaggtggg tggatcacct 40980 gaggtcagga gttcgagacc agcctggcca acatggcgaa accttgtctt tactaaaaat 41040 agaaaaatta gctgcgtgtg gtggccatgc ttgtaatccc aaatactcgg gaggctgagg 41100 cagaagaatc acttgaaccc gggaggcgga ggttgcagtg agccgaggtt gcgccactgc 41160 cctccagcct gggcaacaaa gcgagactcc gtctcaaagc cagaaaaaaa gatttttagg 41220 aaaggaatga aatactctga cttaaatttt agaaggatca ctctggttgc tatgttgcat 41280 tatagactct aagggtagaa ccagggagag caattaggac actgttacag taatctagga 41340 gaaaagtgat agaggcttgc accagggtag tatcaggaga aatggtaaca agtggttgga 41400 ttatgattat agttgaaggt cgaacaacta gatttgctga tagattggat aaaatggtcc 41460 tctctttatg gatctcataa tacagtagga gaaacagaca cataaatagt catcactgca 41520 ggatgggtat tagaaatatt ttgcaagggt gtaaaaggtg ctaagaaagc tttcttgtgt 41580 gacaaagctg gttaaagaaa gaaaagaaag cttcctagaa gtgaaaccta aaatatacac 41640 ttagataaat gaataaaagt tatgaaagaa tgtgagggct gggcacagtg gctcatacct 41700 gtaatcctag cactttggga ggttgagtcg ggggtattgc ttgagtccag gagtttgaaa 41760 ccagcctgga cagcgtactg agaccccatg tctaaattta aaaaaaaaaa aaatagccag 41820 gagtggtgat gtgcacctgt agtcctagct acttacttgg gaggctgagg caggaggatt 41880 gcttgagctc aggaggtcga gactgcagtg agccatgagt acaccactgc actctagtct 41940 gggtgacaga gtgagaccct gtctcaaaga aaatgaaaag aaaaagaatt tgagaaaaga 42000 tatgtcagga aaatgtgatg acatgaacaa atactcaaag gcaagaaaag catggtgagt 42060 aggggagggt acaggttgag acatgaagtt gggattgccg aggcgtaaga ggtataggca 42120 gatcatggat ggcctggttt gtcataggaa ggagcttggg ctcttatctg tgggcaatgg 42180
<Desc/Clms Page number 69>
gaagccacta aagggtttta agtagaagag tgttatatgg taaggttttc ctctccagta 42240 gatcactcag atgactgtgg gggttggatg tgaggaggta aagcagcaaa gttactgctt 42300 taatttaaat cattgattaa tctgtacaat cctagtcatt ccaaaaagaa acattagtcc 42360 tttaacagaa gtgaattggg tctgggcgcg gtggctcacg cctgtaatcc cagtactttg 42420 ggaggccgag gcgggcagat cacctgaggt caggagtttg agacaagtct ggccaacatg 42480 gcaaaacctt gtatctacta aaattacaaa aattagctgg gcatgggggc acccacctgt 42540 aatcccagct attcgggagg ctgaggcagg agactctctt gaacccataa ggcagaggtt 42600 gcaatgagct gaggtcgcac cactgcgctc cagcctgggc gacagagtga gactccgtct 42660 ccaaaaaaaa gaaaaaatat tggagcagtt tcacagatgc tgtttactgt tatactgtat 42720 gtgtctatga ctcctcctcc aagaaaaaaa aaatgaattg gagcaggttc acagaagcaa 42780 tgtactgtta cactgtatgt gtctgtttct acacatataa atctgaattc tgtgtacacg 42840 aaaagaaatc ctatagcttt ttattcctag ctataaaaac taagaatata atttctttct 42900 ttttattaca taatgaatgg ttctgttaac tttttgttaa aatttcattg aggggagtat 42960 taattcacat ttatgtacgg atgtctacat ttacaaatca gtgtattttt tgatttatgc 43020 ttttactgag acaaagggtt tctgtctcag catggtcatt taaagagttt atcattgaga 43080 aaaatcagat gaccaacctg ttagctcaaa aaaaaaaaaa cctccaaggt atattgtatc 43140 agccagttct aggatacaaa agccatgcag tactttgtgt tttgtgccaa aaagggtagc 43200 tgctatttga cctgtcccaa aggcatgtgt ggttgtaccg taaaccaagc atggtacctg 43260 tttgtcaaac tttagaaatg aaagtttaag agagttaata tataggtgct gcatttttta 43320 tgtattcatt gacttgctgg tacagaagaa aagaatcaat tatgattcag cacaatactc 43380 cacttgggga agagagtgca gcagtagttt agagtgtcag ggatcaaact gctaccttct 43440 tgggcttcag ttgctagact taagagaccc agatcttggg aggggttttt gttgttattt 43500 gatgtggggg taaggttgaa atactccctt ttaattgatt aatataaaaa ataggtaatg 43560 tagacgtatg tcacaaaatt ttaacaagtt tgagtgtgaa aagcatccat cccattctat 43620 gccctggcta cccatttccc ctccctagag gcggctgtta ttatcagttt ctctgggtcc 43680 tttttagagg taatcttttt gtatgcaact gtgcacatgt atgtttacac aaatggtagg 43740 gtattgtata tatatacagt tactgcagta tgcttatttg actttgcttt attgctttta 43800 ttttctgcct gacatatgtt aatgtggcca aatagggcat ttcccagacaatccttatag 43860 tttcattctg tgctacttta aatgctgttc tccttccctg aaatgtcctt tttttttttc 43920 ttttcttttt ttttttttga gacagagtct cgctctgtca cccaggctgg agtgcagtgg 43980
<Desc/Clms Page number 70>
cacaatctca gctcactgca acctccacct ccccggttta agccattccc ctgcctcagc 44040 ttcccgagta gttgggacta caggcgcgtg ccaccacgcc cggatacttt tttgtttgtt 44100 tgttttagta gagacagggt ttcactgtgt tagccaggat cgcctcaatc tcctgacctc 44160 ctgatctgcc tgcctcagcc tcccaaagtg ctgggattac agacgtgagc cactgcgcct 44220 ggctgtcctt tcttttaatc ttttcaaatt ctagccagtt catagcccac ttgctctgta 44280 aagctttttc agtgatcttt cttttgtacc atgcagtctt ttaaaaaatc tacagtttta 44340 ttataagttg ctaattatat ttaataaata cctaaatggt agaaattgat tcatttttta 44400 atctccgtag tgccaggaac tgtggctcat gtctgtaatc cctgcacttt gggaggctaa 44460 ggcgggagga tcgcttaagg ccaggagctt gagcccagcc tgtggaacat attgagaccc 44520 cgtctctaca aaaaataaat tagctgggca tagtggtgtc tgtatgtagt gtcaactact 44580 caggagactg aggcagaagg ataacttgag ctcagggagt tgaggccaca gtgagccatg 44640 atggtgccac tgtacttcag cctgggtgac agagcaagac caagaccgat aattatctcc 44700 atggtatttg ttttggacgt attagatatt cagtaaatat tttctggtga tgatagtgat 44760 atctaactac ctcaggttac ctaacctgaa taaggcctat ttttaacata gccattcact 44820 tgttaatttc tgttattttc gtgacttcat ttttactaat tatattttaa aagataattt 44880 tatataaatg caaaaacttt ttatcatgta acaatctggt aacaccttga gtaatttgtc 44940 atttcacatg cacattttat ttgttcatta tcttttttct ttttgtttat tttttctgtt 45000 ttttaccttc tctgttgcat agagaagatg caaccagttt tgccattttc caagtcacaa 45060 acggacgtct ataatgacag tactaacttg gcatgccgca atggacatct ccagtcaggt 45120 gggtttaggt taactaacat aaaataataa agcttgcatg caaagtaaga gtcttactta 45180 acctgataat gttgatttga ttttataatg gtaggtttaa ttgttcatgt tttcacaggg 45240 ctgtgttgaa aatatagtac ctttatcatc atagtatata aacatgcaac aagtcaggta 45300 tagtcattct aaacttgctt tatttgcata ttttgcaacc tctggttttt cagattataa 45360 aatatgaagg tatacattcc cgtaagtgat taaaataatc tttttttctg ttgtggcttt 45420 tgtgttttta tatggatagc tatactgatt tttttcatga aatagtgttt tctaagacac 45480 attttaattt tttatgtatc aatttttatt gcatatcaat tttcatttat agtatatgtg 45540 aatgtcttat agtacttgat agaagaaatt tgaaacttca catagtgagg agaaacatta 45600 cagtattatt tgctatggat taactctatc cttcataaac ttttggatat caacttctac 45660 agaagattaa atgtctttct gttttgtttt ctttgggtag gggactctcc atttcttagg 45720 ttctctgaca tctgagctag ctttttgttt aattaaaact ttttttttag ttgacagata 45780
<Desc/Clms Page number 71>
atgtacctgt tcatggggta cacagtgatg ttttgataca tatagtatat ggtgattaga 45840 tcaaggtaat tatcatttcc atcatcccaa acatttatca ttccttgtgt tggaaacatt 45900 cagtattttc cttctagcat ttgaaatgat ataatatatt atattgttac ctataatcat 45960 cctgcagtga tgtagaacaa tggagcttac tctttctatc tagctatacc tttgtatcct 46020 ttccctaccc ttttcagcct ctagtatcct ctgttctact ttttatttct atgagattaa 46080 ctttttaaaa ataatattct gtgtgtatat ataccacatt ttctttattc attcgtctgt 46140 tcttggacac ctaggttgat tctgtatctt ggctgttgtg aatagtgctg cagtaaacat 46200 ggggtgtaga tgtctgttcg atatgatgat tttctttcct ttggataaat tcccaatagt 46260 gggattggtg ggtcatatgg tagttctgtt tgtagttttt gaggaacctc catactcttc 46320 tccatagtag ctgtactagt ttagattccc aaaagtagcg tataagagtt cactttctac 46380 acatcctcac cagcatttgg tacttttttt gtctttttga taatagccat cctaactggg 46440 gtaagatacc ttgttgtggt tttgatttgc atttccctca taattaacga tgttgagcat 46500 tttttcatat ctttgttttt gacggtccag ctagttttat tggttacttt tttttttttt 46560 ttttagcaat agtttcatgt gcagggctca aattatattt aatattactt ttttcaaatt 46620 ataccagaac aaccttaggt taggctataa aacaactgcc ttctttttct tttggcataa 46680 taattatata tatattttta attacacttt acgttctagg gtgcatgtgc acaacatgca 46740 ggtttgttac atatgtatac aagtgccatg ttggtgtgcc gcacccatta acttgtcatt 46800 tacattaggt atatctccta atgctacccc tcccctctcc cctcacccca cgacaggccc 46860 cattgtgtga tgttccccac cctgtgtcca agtgttctca ttgttcagtt cccatctgtg 46920 agtgagaaca tacggtgttt ggttttctgt ccttgcgata gtttgctcag aatgatggtt 46980 tccagcttca tccatgtccc tacaaaggac atgaactcat cctttttgat ggctgcttag 47040 tattccatgg tgtatatgtg ccatattttc ttagtccagt ctatcattga tggacatttg 47100 cattgattcc aagtctttgc tattgtgaat agtgccacag taaacataca tgtgcatgtg 47160 tctttatagc agcatgattt ataatccttt gggtatatac ccagtaatgg gatggctggg 47220 tcaaatggta tttctagttc tagatccttg aggaatcgcc acactgtctt ccacaatggt 47280 tgaactagtt tacgttccca tcaacagtgt aaaagtgttc ctgtttctcc acatcctctc 47340 cagcacctgt tgtttcctga gtttttaatg atcgccattc taactggtgt gagacggtat 47400 ctcattgtgg ttttgatttg catttctctg atggccagtg atgatgagca ttttttcatg 47460 tgtcttttgg ctgcataaat gtcttctttt gagaagcatc tgttcatata ctttgcccac 47520 tttttgatgg ggttgtttga tttttttctt gtaaattttt ttaagttctt tgtagattct 47580
<Desc/Clms Page number 72>
ggatatcagc cctttgtcag atgggtagat tgcaaaaatt ttctcccatt ctataggttg 47640 cctgttcact ctgatggtag tttcttttgc tgtgcagaaa ctctttagtt taattagatc 47700 ccatttgtca attttggctt ttgttgccat tgcttttggt gttttaggca tgaagtcctt 47760 gcccatgcca gtgcccatgc cagtgtcctg aatggtattg cctagatttt cttctagggt 47820 ttttatagtt ttagaactaa catttaagtc tttaatccat cttgaattaa tttttgtata 47880 aggtgtaagg aagggatcca gtttcagctt tgtacgtttg gctagccagt tttcccagca 47940 ccatttatta aataggaaat cctttcccca tttattgttt ttgtcaggtt tgtcaaagat 48000 cacatggttg tagatgtgtg gtattatttc tgagggctct gttctgttcc attggtctat 48060 atctctgttt tggtatcagt accatgctgt tttgattact gtaccttcgt agtatagttt 48120 gaagtcaggt agcacgatgc ctccagcttt gttcttttgg cttaggattg tcttggcaat 48180 gcaggctctt ttttggttcc atatgaactt taaagtagtt ttttccaatt ctgtgaagaa 48240 agtcatttgt agcttgatgg ggatggcatt gaatctataa attaccttgg gcagtgtggc 48300 cattttcatg atattgattc ttcctatcca taagcatgga atgttcttcc atttgtctgt 48360 gtcctctttt atttcattga gcagtggttt gtagttctcc ttgaagaggt ccttcacatc 48420 ccttgtaagt tggattccta ggtattttat tctctttgaa gcaattgtga atgggagttc 48480 actcatgatt tggctgtttg tctgttattg gtgtatagga atgcttgtga tttttgcaca 48540 ttgattttgt atcctgagac tttgctgaag ttgcttatca gcttaaggag attttgggct 48600 gagatgatgg ggttttctaa atatacaatc atgtcatctc caaacaggga caatttgact 48660 ttcttttcct aattggatac cctttatttc tttctcctgc ctgattgccc tggccagaac 48720 ttccaacact atgttgaaca ggagtggtga gagagggcat ccctgtcttg tgctagcttt 48780 caaagggaat gcttccagtt tttgcccatt cagtatgata ttggctgtgg gtttgtcata 48840 aatagctctt attattttga gatacatccc atcaatacct agtttattga gagtttttag 48900 catgaagggc tgttgaattt tgtcaaaggc cttttctgca tctattgaga taatcatgtg 48960 gtttttgtct ttggttctgt ttatatgatg gattacgttt attgatttgc atatgttgaa 49020 ccagccttgc atcccaggga tgaagccaac ttgattgcgt tggataagct ttttgatgtg 49080 ctgctggatt cggtttgcca gtattttatt gaggattttt gcgttgatgt tcatcaggga 49140 tattggtcta aaattctctt tgttgtgtct ctgccaggct ttggtatcag gatgatgctg 49200 gcctcataaa atgagttagg gaggattccc tctttttcta ttgattggaa tcatttcaga 49260 aggaatggta ccagctcctc tttgtacctc tggtagaatt cagctgtgaa tccatctggt 49320 cctggacttt ttttggttag taggctatta attattgcct caatttcaga gcctgttatt 49380
<Desc/Clms Page number 73>
ggtctattca gggattcagc ttcttcctgg tttagccttg ggaggctgta tgtgtccagg 49440 gatttatcca tttcttctag attttctagt ttatttgagt agaggtgttt atagtattct 49500 ctgatggtag tttgcatttc tgtggaatcg gtggtgatat cccctttatc atttcttatt 49560 gcatctattt gattcttctc tcttttcttc tttattagtc ttggtagcag tctatcagtt 49620 ttgttgatct tttcaaaaaa ccagctcctg gattcattga ttttttgaaa ggttttttgt 49680 gtctctatct ccttcatttc tgctctgatc ttagttattt cttgccttct gctagctttt 49740 gaaggtgttt gctcttgctt ctctagttct tttaatggtg atgttagggt gtcaatttta 49800 gatctttcct gttttctctt gtgggcattt agtgctataa atttccctct acacactact 49860 ttaaatgtgt cccaaagatt ctgatatgtt gtgtctttgt tctcgttggt ttcaaagaac 49920 atctttattt ctgccttcat tttcttatat acccagtagt cattcaggag caggttgttc 49980 agtttccatg tagttgtgtg gttttgcgtg agtttcttaa tcctgagttc tagtttgatt 50040 gcactgtggc ctgagagaca gtttgttgta atttctgttc ttttacattt gctgaggagt 50100 gctttagttc caactatgtg gtcaattttg gaataggtgt ggtgtggtgc tgagaagaat 50160 gtatattctg ttgatttggg gtttagagtt ctgtagatgt ctattaggtc cacttggtgc 50220 agagctgagt tcagttcctg gatctgtctt gttgatctgt ctaatattga cagtggggtg 50280 ttgaagtctc ccagtattat tgtgtgggag tctaagtctc tttgtaggtc tctagggact 50340 tgctttatga atctgggtgc tcctgtattg ggtgcatata tatttaggat agttagctct 50400 tcttgttgaa ttgatccctt tagcattata tgatggcctt ctttgtctct tttgatcttt 50460 gttggtttaa agtctgtttt atcagagagt tggattgcaa accctgcttt ttttgttttc 50520 catttgcttg gtagatcttc ctccatccct ttattttgag cctatgtgtg tctctgcacg 50580 tgagatgggt ttcctgaata cagcacactg atgggtcttg actcgttatc caatttgcca 50640 gtctgtgtct tttaattgga gcatttagcc catttccatt taaggttaat attgttatgt 50700 ttgaatttga tcctgtcatt atgatgttag ctggttattt tgctcgttag ttgatgcagt 50760 ttcttcctag cctcgatggt ctttacaatt tggcatgttt ttgcagtggc ttgtaccggt 50820 tgttcatttc catgttcagt gcttccttca ggagctcctg taagcaggcc tggtagttac 50880 aaaatctgtc agcatttgct tgtctttaaa ggattttatt tctccttcac ttatgaagct 50940 tagtttggct ggatatgaaa ctctgggttg aaaattcttt cctttaagaa tgttgaatat 51000 tggcccccac tctcttctgg tttttagagt ttctgccaag agatcagctg ttagtctgat 51060 gggcttccct ttgtgggtaa cccgaccttt ctctctggct gcccttaaca ttttttccta 51120 catttcaact ttggtgaatc tgacaattat gtgtcttgga gttgctcttc ttgagtagta 51180
<Desc/Clms Page number 74>
tctttgtggc attctctgta tttcctgaat ttgaatgttg gcctgccttg ctaggttggg 51240 gaacttctcc tggataatat cctgcagagt gttttccaac ttggttccat tctccccgtc 51300 actttcaggt acacccgtca gacatagatt tggtcttttc acatagtcct atatttcttg 51360 gaggttctgt tcgtttcctt ttactctttt ttctctaaac ttctcttctg gcttcatttc 51420 attcatttga tcttcaatca ctgataccct ttcttccact tgatcgaatc ggctactgaa 51480 gctcatgcat gcatcacgta gttttcgtgc catggttttc agctccatca ggccatttaa 51540 ggtcttctcc atgctgttta ttctagttag ccatttgtct aatctttttt caaggttttt 51600 agcttctttg caatggtttc gaacatcctc ctttagctcg gagaactttg ttattaccca 51660 tcgtctgagg cctacttctg tcagcttgtc aaagtctttc tctgtctagc tttgttccgt 51720 tgctggtgag gagctgtgtt cctttggagg agaagaggcg ctctgaattt tagaattttc 51780 agcttttctg ctctggtttc tccccatctt tgtggcttta tctacctttg gtctttgatg 51840 atggtgacgt acagatgggg ttttggtgtg gatgtccttt ctgtttgtta attttccttc 51900 taacactcag gaccctcagc tgcaggtctg ttggagtttg ctggaggtcc actccagacc 51960 ctgtttgcct gggtatcacc agcggaggct gcagaacagc aaatgttgca gaacgacaaa 52020 tgttgctgtc tgatccttcc tctggaacct tcgtctgaca ggggtaccca ggtatatgag 52080 gcgtcagtca gcccgtatgg ggaggtgtct cccagttagg ctacttgggg atcagggacc 52140 cacttgagga ggcagtctgt ccgttcgccg atctcaaact ccatgctggg agaactacta 52200 ctctctttag agctgtcaga cagggacctt taagtctgta gaagttactg ctgccttttg 52260 ttcagctatc ccatgtcccc agaggtggag tctacagagg cagtcaggcc tccttgagct 52320 gtggtggact ccacccagtt caagcttcct agctgctttg tttacccact caagcctcag 52380 caatggcaga tgcccccgcc tccagcctct ttgccgcctt gcagttcgat ctcagactgc 52440 tgtgctagca gtgagcgagg ttccgttggc atgggaccct ctgagccagg catgggatat 52500 aatctcctgg tgtgccgttt gctaagacca ttggaaaagc ccagtattag ggtgggagtc 52560 tccctatttt ccaggtacca tatgtcacgg cttcccttgg ctaggagagg gaattcccca 52620 accccttgcg cttcccaggt gaggcaatac cccgcccttc agctcacact atgtgggctg 52680 cacccactgt ctgacaatcc ccagtgagat gaacccagtt cctcagttgg aaatgcagaa 52740 atcagctgtc ttctgtgtcg ctcacactgg gagctgcaga ctggagctgt tcctatttgg 52800 ccatcttgga accctgcctt cttcattcat atgtaataca aaacttctaa ggttttagtg 52860 gagaagagat agagtaaaag gatttctata gacagaagaa acagttggtc atcaactctt 52920 tcccttgtgg cttcacatct cccctaagga cttcttatgt tggtttggtc ttacagtata 52980
<Desc/Clms Page number 75>
gtcagtggca gtttccctct tcccattcct tcctctgtct gatttaaaat gctgtttcaa 53040 gtatcgatat aagtattttg cctgtttctt ttagcgtggc tgtgaagggc tgacattttc 53100 agaaggcact tactgaaaaa aaaaaaacaa agaaatgtaa gagtccatca catataaata 53160 gttaagtttc taaaatatgt atttgagatc ccagtaattc tactaggata aatagcaaaa 53220 attctccagc cctgaagagt tggtctgtct ttcctttcct tgttatcttg attctctttt 53280 atttcatttc acatgctaga ccccatcatg ttttcctgct gcattcccca ctccaccctc 53340 caaagcaatg ttctcttcct gcaacctgtt tgaaaaaatt gaactttgtc ttatttcata 53400 tccctagtac aagttgaata tccctaatat gaaatctgaa atccaaaatg ctctaaaatt 53460 cgactctttt ttttttgaga tgaagtcttc ctctgtcact caggctggag tgcggtggcg 53520 caatcttggc tcactgcaac ctccgcagcc tcccctaacc ccatccctgt gggttcaagc 53580 gattctccca cttcatcctc ccaagtagct gggactacag gcacctgcca ccacacccaa 53640 ctaatttttt gtatttttag tagagatgag gtttcaccat gttggtcaag ctagtctgag 53700 actcctgacc ttaagtgatc cacctgccct ggcctcccaa agtgttggga ttacagtcat 53760 gagccactgt gcctagccaa atatccaaaa ctttttgagc gctgacatga tgctcaaagg 53820 aaatactgga gtattttgca ttttggattt ttgggttaag gatgctgaac cagtaagtat 53880 aatgtaaaca ttgcaaaatg caaaaaaatg taaaaaccct aagcagttct ggtcccaagc 53940 atttcgcata agggatactc aacccataat cttttctttt ctgttttctg gttggaaggg 54000 catattggct ttatagctaa tttacacagc attgatgttt aatacacagt gagtccaagt 54060 agatcactca gacctattag tagtttatta gtgtcactca cttctggaac attctgtgat 54120 gttttacttg gatgagttct ttcacctctc ttgggaaata gtcataccaa agtctgctta 54180 ttactacaat gtgttatcta ttatacattg tccaattttc tactcaaaat tactagacag 54240 gcaaagaaaa agtaaagtat aacccttact caagaaaaaa aagcaatcag tagaaactgt 54300 gagtgggccc agatattgga tttagcagac aaagacttca aagcagctat tataatatgt 54360 ttaaagaatt gaaagaaaat atggtatcag ttaaacagga aatctaagta gatgatataa 54420 actagacaat aaaaataata ttctaaagtt gaaaagtgta gttactgaaa ttaaaaattt 54480 acagacaaca gcctcaacag cagattagag atagcaaaag aaagattcag tgactttgaa 54540 tgcaggtctg tagaaattac taaattgatg actctcacgt agcaactttc acccgtagtt 54600 tggtttcata tacaatgctt taactctttt tgctattttt tctcttactt tctgtgatgg 54660 aaacattttg tgctttgatt ttaatgggtg tatcacagtt atatacatct ttacaaactc 54720 atcaaattgt atactttatt tatatattta tttttttttg agatagggtc tgactctttc 54780
<Desc/Clms Page number 76>
tcccaggctg gagtacagct gaaattagtt gggactacag gtgggcacca ctgtgccagc 54840 taatttttgt attttttgta gagatggggt ttccccatgt tggccagtct ggtctcaaac 54900 tcctgggctc aatcatttct gccgcctcag actcccagag tgttgggatt ataggtgtga 54960 gctactgtgc ctggctggta tagctttttt tttttttttt tttttttttg tgacagagtc 55020 tcactctgtc gcccagggtg gagtgcagtg gcgcgatctg ggctcactgc aacctctgcc 55080 tcccgggttc aacccattct cctgcctcag cctcctgagt agctgggact acagatgcgt 55140 gccaccatac ccagctgatt tttgtattct tagtagaaac agagtttcac catgttggcc 55200 aggatgatct cgatctcctg acctcgatcc acctgccttg gcctcccaca gtgctggcat 55260 tacaggcctg agccaccatg cctggctgtt ggtatacttt aaatggatgt aattcattgc 55320 agattatacc tcagtaaatt tttatttagt ttttgagact gagttgctct gttgcccagg 55380 ctggagtgca gtggcacgat ttcagctcac tgcaacctct gcctcctggg tttaagcgat 55440 tttcctgtct cagcctcccc ggtagctgga attagaggtg tgtgccacca tgatcagatt 55500 atttttgtgt ttttagtaaa gatggggttt caccatgttg gccaggctgg tctcgaactc 55560 ctgacttcag gtgatccacc cgcctcggcc tctcaaagtg ctgggattac aggtgtgagc 55620 caccacgcct ggccttaatt tttaaatact gtaaggctta taaagaaaag aatattcccc 55680 ttctgtttct ttcctctcac gtagcaacct tcacccctag tttggtttca tatacagtgt 55740 tttaactctt tttgctattt ttttctctta ctttctacta tatttccaaa tacaatgctt 55800 ctataatgat tccttttttt tttctatcag tttttgataa tcattgactc cttatggtca 55860 aagaagactt aattcccttc tgtcactctt catatattaa tataactaat atatatattg 55920 tttagttttg atataactaa aaataactat atgtatatat aactatatat gtataagcta 55980 tctgtatata gttatatatg tatatgcaca tacatatata gttacatatg tatacacaca 56040 tacatatata gttacatatg tatatgcata tacatatata gttacatatc tatatgcata 56100 tacatatata gttacatatg tatatgcata cacatatata gttacatatg tatatgcata 56160 tacatatata gttacatatg tatatgtata tgtatataca tatatagtta tatatgtatt 56220 agttatatca aaataactat gtatatatag ctgtaaatgt atatataaac tatatgtata 56280 cagttatata tgtatttgta tatgtgtgta tacatatata gttttttttg tttttttttt 56340 ttgttttttt tgtttttttt tggagatgga gtcttgccct gtcccccagg ctggaatgca 56400 gtggtgctat cttggcttac cgcaacctct gcttcccagg ttcaagcaat tctcctgctt 56460 cagtctcccg agtacctggg attacaggca cgtggcacca cgccaggcta attttttgta 56520 tctttagtag aaatggggtt tcaccatgtt ggccaggctg ttctcaaact cctgacctcg 56580
<Desc/Clms Page number 77>
tgatccaccc gcctcggcct cccaaagtgc tgggattaca ggcgtgagca ccgcgcctgg 56640 tccctataca tatatagtta tatataccta tagttatttt tagttatatc aaaataacta 56700 tatgtatatg taactatata tatagtatat atagtatata tatactatat agtgtgtata 56760 tatagtatat atatactata tagtgtgtat atatagtata tatatagtgt atatatcgta 56820 tatacactat atactatata gtgtatatat agtatatgta gtatatatag tatatatagg 56880 atagtatata tagtatatat agtgtatata tactgtatat ataggtgtac atagtatact 56940 atatagtata catatagtac actgtatagt atatatagta tagtatatat agtatacata 57000 gtatactata tatagtatag tatacatagt atactatata gtatatagag tatatataca 57060 gtatactata tagtatatag agtatatata cagtatacta tatcgtgtgt atagagtata 57120 tatacagtat actatatcgt gtgtatagag tatatataca gtatactata tcgtgtgtat 57180 agagtatata tacagtatac tatatcgtgt gtatagagta tatatacagt atactatatc 57240 gtgtgtatag agtatatata cagtatacta tatcgtgtgt atagagtata tatacagtat 57300 actatatcgt gtgtatagag tatatataca gtatactata tagtgtgtat agagtatata 57360 tacagtatac tatatagtgt gtatagagta tatatacagt atactatata gtgtgtatag 57420 agtatatata cagtatacta tatagtgtgt atagcgtata tatacagtat actatatagt 57480 gtgtatagcg tatatataca gtatactata tagtgtgtat agcgtatata tacagtatac 57540 tgtatagtgt gtatagcgta tatatacagt atactgtata gtgtgtatag cgtatatata 57600 gtatactgta tagcgtatag agtatatata tagtatactg tatagtgtat agagtatata 57660 tatagtatac tgtatagtat atagagtata tatagttaca tatacatata gttattttta 57720 gtaatatcaa aaaaccatag ctaagatttt tatgatttag caaaatattg tttaccccaa 57780 agccacgtat tatatattaa tgatattttt tcccttttga gtttttcttc cccacaggtt 57840 ttctgatctt tttttttgtt ctctaacttt atattatagg tatatactct tttctctgtt 57900 taatttgctt tttaactaga agacctcctt tagtagttct tttagtgaat atctgtggtt 57960 aaactcttag tctttccagt gtctgaaata ccctcatttt aatgtgacag gtcacttttc 58020 tcacctcaac attttggaca tacctcattt ccaacaaaca tttgttactt ctgatagaga 58080 gtctgctgtc attctcatac ttgttccttg tggaaatgtc tatatataaa gtctcagaac 58140 tatatatttt taatatatat acatattttt atttatttaa aaatgtataa ttaagttagt 58200 agtagtagta gtagtagtag tagtagtagt agtagtagtt tttttttttt tagatggagc 58260 ctccatctcc cgggttcaag tgattctcct gcctcagcct cctgagtagc tgggattaca 58320 ggcacacacc accatgcctg gctaattttt gtattttgag tggagatggg gtttcaccat 58380
<Desc/Clms Page number 78>
gttggccagg ctgatcttaa actcctgacc tcagatggac cacctgcttt ggcctcccaa 58440 agcgctagga ttacaggcat gaaccactgc gtctggcctt aagttattat tgactattga 58500 tgccctgttg ctctatcaag tagtaggtct tatttattct agaacctcgt tttaaggtat 58560 cctgaatgtg gctttttttt ttttttttcc taagacggag tctcactctg ttgcccaggc 58620 tggagtgcaa tggagtgatc ttggctcacc gcaatctctg cctccttggt tcaagcaatt 58680 ctcctgcctc agcctcctga gtagctgaga ttacaggcgc acgccaccac acctggctaa 58740 tttttgtgtt tttagtagag acggggtttc accacattgg tcaggcttgt ctcaaactcc 58800 tgaccttgtg atccgcccac cttggcctcc gaaagttctg ggattacagg cgtaagccac 58860 cacgcccagc ctaatgtgga ttttgttttt ttttttaact tgaattttat ttatacttcc 58920 tgattttata atagttaact tgtagtaaaa gtaaactggt tgtctaaata aataagctga 58980 tttcctatac tagtttagag tctttagttt tcttaaaccg tattaagaga tttgattaca 59040 aaagtaaaat tgaggctttt gtcttttttt ttggccactc taatttgctg actgacttaa 59100 catttgtctt cacagtaaac attgtaaata aacactgatg tttgttgcgt agtatgtaaa 59160 aatattattt aggagtggtg agatttaaac atttacaaac ctgtaatata tatagtacag 59220 caacactgga caaataacct tttcaactta atcagaggtg ttctataaat gttcatttgc 59280 atatatacag cccatataat acttagcata tgtaaaagca catctttata ctctttcaat 59340 taaaattgat tattattatt attttttttt tgagacagag tccctctcag tcacccaggc 59400 tggattgcag tggtgtgatc agggctcact gcaatcgggt agctggaact acagggatgt 59460 gccaccacgc ccagctattt ttgtattttt agtggagatg gggtttcacc atgttggcca 59520 ggctggtctt gaactccata cctcaggtga tctgcccgcc tcagcctccc aaatagctgg 59580 gataacaggc gtgagctact gcacccggcc taaaattgat tagtttttaa gaccctcttg 59640 gtgggaacag actttcatag tgtttatagt tataatagtt tggaatcaaa gtagtcgagt 59700 gctacttttt tttcctctgt acatcctatc cctaatgcct ttactatatt ttgtttctta 59760 tttgagagct ttatttgctt cataactttt tttttttttt tttttttttg agacagagtt 59820 tcactctgtc acccaggctg gagtgcagta gtgcaatctc ggcttactgc aacctccgcc 59880 tcctgagttc aagtgattct cctgcctcag cctccgaagt agctgggatt ataggccccc 59940 accaccacgt ctgactgatt ttttgtattt ttagcagaga cgaggtttca ccatgttggc 60000 cagcctggtc ttgaactact gacatcaggt gatccgtcca cctcgatctc ccaaagtgct 60060 gggattacag gtgtgagcca tcgcgcccgg cgcttcataa cctttttata ttgtctttct 60120 gttccccaaa atgaagtagt ttcttcttaa aaatactgtt ttttgttttt ttgttttttt 60180
<Desc/Clms Page number 79>
ttttatttga gatggaatct ctctctgtcg ccaggctgga gtgcagtggc acgatctcgg 60240 ctcacttcaa cctctgactc cgtggttcaa gcaattctcc tgcctcagcc tcccaggtag 60300 ctgggattac aggcacaaat actgttttta ataagaaaat tagaataggg acaggcacaa 60360 tggctcactc ttgtaatccc agcactttgg gaggccaagg tgggaggatt gcctgagccc 60420 aggagttcga gaccagccta ggcaacatag tgagtgagac cctgtttcta taaaaaaaat 60480 ttttaattag tccggtctgg tggtgcacaa ctgatgtccc agctacttgg gagtttgagg 60540 tgggaggatg gatcacttga gcccaggaag attaaggcca caatgagctg tgatcatgcc 60600 actgcactcc agcccaggcc acaggtttca aaaaaagaga aaattagaat tatacgttag 60660 ggggaaaaaa cctaataacc atattcctat ctacctagtg accaccccta tgaagatcct 60720 ggtacatgtt ctcattgaaa tcttattttg aaatattttt gaattaaaaa aatatattat 60780 taccttggtt ttacaaatgt ttgcttgtct ttatgttcag ctacaatttt ctaatcacaa 60840 tggttttact ttttccttgt cagaaagtgg agctgttcca aaaagaaaag accccttaac 60900 acacactagt aattcactgc ctcgttcaaa aacagttatg aaaactggat ctgcaggcct 60960 ttcaggccac catagagcac ctagttacag tggtttatcc atggtttctg gagtgaaaca 61020 gggatctggt cctgctccta ccactcataa ggtattctgg gacagtaact ttaattgctg 61080 tctttttgca aatagaaaaa tttttaagat actattcctg cttaagttga tcataagtac 61140 tttataatac tttagagaat ggataagttt ccataaagtt aaattttttt tttttttttt 61200 tgagactctt gttttccagg ctggagtgca atggcgcgat ctcggctcat tgcaacctcc 61260 gcctcccagg ttcaagcgat tctcctgcct cagcctccca agtagctggg attacaggca 61320 tgcaccacca cgtcgagcta attttgtatt tttagtagag acggggtttc tccatgttgg 61380 tcaggctggt ctcaaactcc cgacctcagg tgatccgcct gcctcagcct cccaaagtac 61440 tgggattaca ggcgtgagcc accgtgccca aagttaattt ttttttaaat ccacagggca 61500 acttgctata aaactttttt tggacctcat tagacattta ataccaagtt ttgcttaccc 61560 agtctgtttt atataatgct gtatatttca ttttaaattt atttttaaaa ttatttcaat 61620 ctttgtaaat gttttatacc agtaacatac ctagagtttt gtcatgattc taacaagggt 61680 taaaatttgt ttttattttg taaaaactaa atctctggat aaaatcctct ataactgact 61740 taatgccaaa tatagttctc tagtgaatac agttttacct tcaggtaaat aaatatacaa 61800 tttatggatt tttataccct ttttcctatt tttaaagctt gaattctgtg aactttaagg 61860 ttaacttatt tatgaaaagt gtaaatgtta ggttgtattt tcatattaaa attttgtatc 61920 ctttaagggt actccgaaaa caaataggac aaataaacct tctaccccta caactgctac 61980
<Desc/Clms Page number 80>
tcgtaagaaa aaagacttga agaattttag gaatgtggac agcaaccttg ctaaccttat 62040 aatgaatgaa attgtggaca agtaagtttt gccatctaaa tgttttattt tatagttttt 62100 atattttaat tttacttata aaacatgtca ggagtgaaat agataataaa taccttgtct 62160 ggtttacata cttaattttt atgatagttt tcaattataa atgtagaaaa ccattgcttt 62220 actgatttaa ctatagttta acagttaaca ttaaaaataa ctatatgtca tagggcttag 62280 gcttcatctt gtaataactg ggccctgttt gtatcgtaga actaactgag gtcttgtttc 62340 ttagtggaac agctgttaaa tttgatgata tagctggtca agacttggca aaacaagcat 62400 tgcaagaaat tgttattctt ccttctctga ggcctgaggt aagaacttta tattatcatt 62460 tttctataat accatctgtt actgaatcca tagtagtagt agtagtaaag aaatatttga 62520 gctatactaa aataattaat tcatataagg taacaataga tttaatgttt taaaaaagat 62580 aaaacattaa caattgatgt tgagaagtta ttatagaata ggaaaatgga tatgagttcc 62640 taatttccaa tccttttata tttttaggaa aagtgggtag tatgatataa ttttgttttg 62700 ttttggagac ggagtctcac tcattgtgtc gcccaggctg gagtgcagtg gcatgatctt 62760 agctcactgc aacctctgcg tcccagaatt caagtgattc tcctgcctca gcctcccaag 62820 tagctgggat tacaggcatg tgccactatg cccagctaat ttttgtaatt ttagtagaga 62880 tggggttttg ctatattggc caggctggtc tttcatacct gatgtcaagt tatccaccca 62940 tttcggcctc ccagagtgtt aggattacaa gtgtgagtca ctacatctgg ccaaattttg 63000 atatcaaggt gagagagatt taaaattaag ataaggtaca aaaattagcc tagtgtgggg 63060 gcgcacgctt gtagtcccaa ctactgggga ggctgtggca ggagaattgc ttgaaccagg 63120 aggcagaggt tgcagtgagc caagatggca ccactgcact ccatcctggg tgacagagcg 63180 agatgtcatc tcaaaaacaa aacaggccgg gtacggtagt tcacgcctgt aatcccagca 63240 ctttgggagg ctgaggcggg cagatcacga ggtcaagaga ttgagaccat cctggctaat 63300 atggtgaaac cctgtcttta ctaaaattac aaaaattagc tgggcttggt ggtgtgtaac 63360 cccagctact cgggatgctg aggcaggaga atcgcttgaa cccgggaggc ggaggttgca 63420 gtgagccgag atcacgccac tgcactccag cctggcgaca gagcgagact ccgtctcaaa 63480 aaaataaata aaaatttaaa aagataaata cataaaaata aataaataat attaagagaa 63540 ggaaatcagg caggtagtgg cccctgacac aatgagtttt cccagaattg gattgcttgg 63600 aaatgccgct caaagagtgt ggtaaactcc atcgaaggct aaataccaac gtgacagtga 63660 taataaacaa gtactttatg ggaaagtttt ttttttaatt atttttaaaa agagagaaat 63720 tgtactggag aaaagaggaa ttcaggtaga ataattcttt tttttttttt ttttgagatg 63780
<Desc/Clms Page number 81>
gaattttgct cctgttaccc aggctggagt gcagtggctt gatgttggct cactgcaacc 63840 tctgcctttg gggttcaagt gattctcatg cctcatcctc ctgagtagct gggtctatag 63900 gcatgcaccc caacacctgg ctaatttttg tgtttttagt agagataggg ttttaccatt 63960 ttggccaggc tggtctcaaa ctcctggctt cagatgatcc gcccaccttg gcttcccaaa 64020 gtgctgggat tacaggcaga ggccactgtg cctggcatga agaacaattt ttaaaagaat 64080 gacttttaag gatattaagt catcaaagta gatagagcca ttaaatgatg ggtagaaacc 64140 taatcttcca tcccatattt tatgacttat taaggaagat aggcaatctt gcagttgata 64200 ataaatattt ggctttccat acttagcacc gttttgaatt tttccagttc acagatggta 64260 tatttagtgc tgttccaata atattgcaaa aaataaatct gaagactcac ttctgggtca 64320 cagttatttc actattaaca ttaaaatctt acggacctac ctgcaacatg tagtggaaat 64380 aagttgtgtg gcacgttgtg gtgggtgcat tattaaataa atgtgcaaag gttttatggc 64440 tgtctcaatt tttccatagt cttgagtcat tcacatactg cctttatggt gtttatcact 64500 tgtaagtgag taccaactgt actagaactt actgaatatt tttcaagtct attttactta 64560 ttactcattc taagtacata aaatcactgg tctgatatgc aagttaggtt ttcgctaata 64620 cccagtaaaa taattagata attattaaaa tagaaagcat ttgtcattat gtgaactgga 64680 tttatgtcat gtaccacctc aggtcacact ttgggaaacg tagcttacgt attgagctaa 64740 cattttgctg gagttatata agattagtaa atgctataga ctaaatattg aaaaaaaagc 64800 ttgcttaaag aggatttaca taattgtaga cctgaaaagg atcttagcag tcttctgatc 64860 gattcattga taaagaaact agtcctaaga gctaaaatga cttgctcaag attttagtta 64920 agtggtagac ctaggaaata cctttctaag attagagctg cctggttagt gctatagctg 64980ccacctaatt cttacattta tttattaagg gacatgcttt ttacggtaga aaaatatatc 65040 taaaattgtg aaggtaatac caaggaaata tttaggctat gcaagaaaag tcattcagct 65100 tttgctttac ccaggcctat agagaacata tctaaaataa taagtaacat gtgaatttga 65160 atttaggcat attttcatgg tagtgacata atgtgcaatt aagaagctat aataatgtaa 65220 aaatgccagt tgcaagttat ttcaaataaa gttgaataac ctgacctcag gaggggcaga 65280 aaccttagta aacttagcaa actgagacct aaggaagagc aagatctgtg gtagagccag 65340 gtctaaaggt ttatatcctg gtacaaactt gtctatacat caccacacct gccaaatgga 65400 actttttttc cttgtagttc agatttccaa gaaagggaat attattgtcc tagctcagcg 65460 tttcacaata gactcacaaa atgaatcttg ttaagcctat gaatgggtaa gacttatccc 65520 ataacacgcc tctattgtgt aaaaaaatca gctttattcc taattccctg tagtaggaag 65580
<Desc/Clms Page number 82>
cttgcataga ccacaataga gacattgtta gattatatca agaaggtgag tggcaggcat 65640 tcttgagtat actggaattt ttatttcatt gtagaaacac agaatcataa ttagtcatct 65700 aaaactggtt ttaaggagat aatactaaag atactcactt gaggtagatt gttctcagaa 65760 ttacttaaaa taagtgcttt aaatcttgct cattcatgaa gccatagccc tggaaggaga 65820 tattgaaaaa cttctccatc ttccttcaat cccataggac catgttttta attgtagttt 65880 aacattaaac ataatttttg aaagtagcca atattaatct ttgacaaaaa actcaaacta 65940 aatagcagaa aatagaacat gccctctcct ctcgcccaaa agtaagacta cattttaaag 66000 tatatcacag tgatctgtct aaatattttt ctcaaatatt ttactaagaa agcgtatatt 66060 cttctgtcct tatttcatag atctcttctg tatcctgtgc agcttgtcta tcatttcgag 66120 cttttatatt tcttattttg ttctcttgct gcttaaatgt gattctttga gatttataga 66180 agaatgtgat tgttctccag ttttaaaaag ctcttctcta tctactaaaa tttccatgaa 66240 tttctttctt tctttttttt tttttgattg agacagtctc gctgtgttct ccagcgtggc 66300 cttaggctta agtgatcctc ctgtctcagc ctcccaagta gctgagatta cagaaatttc 66360 catgaatttc caaatatgat gttatctttc atataagctt aaacataagc ctttcttctt 66420 tcaaaaatgt tagaacttac ctctttaaat aatcttataa agccatttct taatttttgt 66480 taccttttcg aatctattaa cttgcatatc atagtaaatg aacccttagc tccatcatac 66540 cacacacctt ctactcctgt cctcccactt tttctcaccc aggctggagt acagtgaata 66600 tttagtgctt ttaaatatta ttcattacca agccaagtag cgtactattt tttccttgta 66660 cagccttttt ttcccctaaa taattgtgtt attttttcat ttgcttcatt ttcatcttat 66720 cgattgataa ttcttctgtt ccatttcagt ctaatttcca catggccaaa ccaatctaaa 66780 aacctgttaa ctcaggtctt tttttttttt ttttttccca gaataccttt tcctggaacc 66840 accttcttct tttcattcga gaccaaatgc tttccatgcc tgtgtcaaag tggttgttct 66900 ctaatctgtc ttcactacca tcataatttc cttttccttt tttcctttct ttattatgta 66960 tctcctgtct tttaaattcc atattttcca ctttcatgat ttattttctc attttgatgg 67020 ctacatcttt cagtaactga gaaaaggttg tgtgagggaa tattttgaga tgctgtagtt 67080 ttgaaaatat ctttattctg ctgtcttctc attaataatt tgactggatg tcaagattta 67140 agttggaaac tattttccat gagtattttg aaggcattat ctattgtctt ctagcttcca 67200 gtgctgcttt gtattagaga cagaagatca ggaatcagga tagcattgga cttcttattt 67260 ctatttccca aagctttttg gatcttctct ttattcttat cttctgatat tttataatga 67320 tatgcttgat gcatttactt tttcttttct tcttccctct tgtacatttc tttctttttt 67380
<Desc/Clms Page number 83>
taggtggggg caggggggaa ggagtctcac tcttctcacc caggctagag tgcagtggtg 67440 caacctcagc tcactgcaac ctccacctct ggggttcaag cgattctcct gcctcagcct 67500 cccgagtagc tgggattaca ggcatctgcc accacgccca gctaattttt gtatttttag 67560 tagagacggg gtttcaggct ggtcttgaac tcctgacctc aggtgatccg ccctcctcag 67620 cctcccaaag tgctgggatt agaggcatga gccactgcgc ccagcccctc ttggaccttt 67680 ctagatattc atccttcaat tctgagaaag gttctataat tctttaattt aaaaaaagtt 67740 tttttgtttc atctttctca cttttttttt tttttttttt ttttaagaca cagtcttgct 67800 ctgtcaccca ggctggagtg cagtggtgcg atctcagctc actgcgccct tcgcctcctg 67860 ggttcgagtg attctcctgc ctcagcctcc caagcagctg ggattacagg tgcccaccac 67920 caccatgccc ggctaattgt tgtattttta gtagagacgg agtttcacca tgttggccag 67980 gctggtttca aactcctgac ctcaggtgat ccacctgctt tggcctccca gagtgctggg 68040 attacaggca tgagccaccg tgcccagccc tattctgatt tcatagatgc agtgtctttt 68100 atgtctctga gaggttttgt caagttttct tttgtttact ttattatctg tttcttcaag 68160 attcctcctc ttttcttttt gccttaagct ttttcatatt ggaagcttct ctcaaatgtc 68220 tggttattct ggttgtccac ttatattacg tggaacaata aaaaagttga ttaggactct 68280 gtgctgtaag taagtaaatt gttgatagtg agagcccatt aatcacagga tgatcaagca 68340 gcaagcctac tgtttatttg ggtttctcca aatggctata gctgtcagtc ttttttttct 68400 ggggttattt ggcttctcta gaaaagaatt ttctagtctc ttgtttggag aatacaagct 68460 tgactattgg tgttccagaa aatgggtggg aggagacgac tttgttttct gttaggttga 68520 gccatgtgaa attactaggt tttgttttgt tttctgtttt gttttgagac agagtctcac 68580 tctgttgccc aggctggagt gccttagcat gatcttggct cactgcaacc tctgcctccc 68640 aggttcaagc aattctcatg cctcagcctc ccaagtagct gggattatag gcatgcacca 68700 ccacgcctgg ctaatttttg tatttttagt agagacgggg ttttgccatg ttgaccagtc 68760 tagtctcgaa ctcctgacct caggtgatcc acctgccttg gcctcccaaa gtgctgggat 68820 tacaggtatg agccaccaca cctgggctga aattactgtt tttataggtc aaaaacagtt 68880 gagggatagg catggtggct cccacctata atcccagcac tttcagaggc caaggcagga 68940 agattgcttg agtccaggag ttcgacacca gcctgggcaa tgtagtgaaa ccccatctat 69000 atttaaaaaa aaaaaataga tgaatatctt tgtttgcaga taacatgatt gcatatgtag 69060 aaaatcccaa agaaccaaca aaaagagctc ctagaactaa taagtgatta tgacaaggtg 69120 tagaatacaa agttaatata caaagtcaca ttgctttttt atctaccagc agtgaacaac 69180
<Desc/Clms Page number 84>
tggaatttga aattaaaaca caatactgct gggtgcagtg gctcacacct gtaatcccag 69240 cactttggga ggccgaggtg ggcagatcac ctgatgtcag gggttcaaga ccagcctgac 69300 caatatggtg aaaccccatc tctactaaaa atacaaaaat tagctgggca tggtggcggg 69360 tgcctgtaat ctcagctact caggaggctg aggcaggaga atcgcttgaa cccaggaggc 69420 agaggttgca gtgagccaag atcgcgccat tgcactccag cctgggggac agagcaagac 69480 tccgtctcaa aaaaaaaaac acaatacctt tcatattaac actaataaaa tgaaatatgt 69540 gtagttctaa caaagtttgt tgtagaagat ctatatgaga agaattatag cactcatgaa 69600 agaaatcaaa gatctaagta aactgagaga tattccatgt aaatggacag ggagactaaa 69660 tattattgag atgtcagttc ttcccaagtt catatatcga ttcagtgcag tcccagtcaa 69720 accccagcca gttattttgt ggatactggc aaactaaagt ttatatgaaa aggcaaaaga 69780 cctagaacag ccaacacagt attgaagaag aaaaaagtca gaggactgaa actacccaat 69840 ttcaagactt actgtaaagc tacattaatc aagacagcat gtcattggca aaagaataga 69900 caaataaatc agtagaattg gacagagagc ctagaaatca acccacacag ataaagtcaa 69960 ctgatctttg gcaaagggac aaagacaatt cagtggagaa aagatagcct tttcaacaaa 70020 tggtatagga caactggaca tccacatgca aaaaagttaa tctagacaca gacctgacaa 70080 ctttcacaaa aataaatgga tcatagacct aaatgtaaca tgcgaactga aacttctaga 70140 ggataacata ggagaaaatc taggataaca tgagaaaaat ttttggtttg gcagtgactt 70200 cttaggtaca ataccaaaac atgatccttg aaaaaaaaaa tcagtatgtt gaactttgtt 70260 taaattataa acttctgctc tgtgtaagat gctgttagga gaatgaaaag acatgcagca 70320 gagtgggaga ctttacaaaa ttcattatct gatgaaggac cagtatccaa aatatacaaa 70380 gaacttttaa aactcaacaa taagaaaata tacaacccag ttaataaatg ggcaaaatat 70440 ctgaacagac acctcaccaa ggaagataga tagatgacaa caagcatatg aatatatgct 70500 caacatcatg tcgttaggga aattgcgcat taaaacaaca acaagatacc ctgccatccc 70560 tattagaatg gctgaaatct aaaacactga caacaccaaa ttctggcagg gatgtggagc 70620 agcagaaact ttaattcatt gctgatggaa atctaaaatg gtagaaccat tttggaaggt 70680 agttggacag ttttttacag aactaaagac agtttgacag tttcttacaa aactcttacc 70740 atatggtcca gcagtcttac tccttagtat ttacccaaat aagtttaaaa tgtacatcca 70800 ataaaaaaaa ctgcacatga atatttctag cagcattatt catagttgcc aaaacttgga 70860 agcagtcaag gcatccataa gtaggggaat ggataaacag actttggtat atcatgtaat 70920 ggagtattat tcagcaataa aaagaaatga tctatcaagc cacaaaaata tatggaggaa 70980
<Desc/Clms Page number 85>
ccataaatgc atattgctaa atgaaagaag ccagtctgaa gaggctacac tataggattc 71040 tgactatatg atgttttgga aaaggcaaaa ctatggaaac agtaaataga tcagtggttg 71100 ccaagggaga cagggagaga tgaataggtg gagcacagtg gatttttaag gcagtgaaac 71160 tgttctttat gataatccaa tggtggatac atgtcattat acctttgtca aaacccacag 71220 aatataaaac ataagagtga accctaatgt aaaatatgga cttcagttaa taataatata 71280 tgaatatttt ttcattagtt ctaacaagtg tactacacta atacaagata ttcagagtag 71340 gggaaattgg aaaggaatga gaggttatat gggaactctg tactttctgc tcaattttct 71400 gtaaacctaa aatcactaaa aaaaaagttt atttttattt ttattttttt ttaattttta 71460 attttttgag atggagtttc actcttgttg cccaggctgg aatacaatgg cacgatctcg 71520 gctcactgaa acctccgcct ccagggttca agcgattctc atgcctcaac ctcccgagta 71580 gctgagatta caggcatgtg ccaccacgcc cagctaattt tgcagtttta gtagagacag 71640 ggtttctcca tgttggtcag gctggtcttg aactcctgat ctcaggggat ctgcccgcct 71700 cggcctccca aagtgctgtg attataggcg tgagcagctg cgcccagcag gttttttttt 71760 ttaagttgga tattagccat ttcatatgat tcaacttaaa agtacataca ccttcactgt 71820 tattaaagtg taggtgagat gttttcagtc tggagctcta cccttgattc ctgccatgcc 71880 tagtgtccct gaatctggag actctgactt atttctttag agaacgaaac tcctgccttc 71940 tgctttggtg gtgattggta cctgcttgac tgcctttggt ggggagttcc tcataccaac 72000 tttcaatcag ttcctgtgtt tgtttgtttg tttgtttttg agacggagtt ttgctctgtc 72060 gcccgggttg gagtgcagtg gcgcaatctt ggctcaatac acgctccgcc tcccgggttc 72120 acgccatttt cctgcctcag cctcctgagt agctgggacg acaggcaccc gccaccacgc 72180 ccggctaatt tttttgtatt tttagtagag acggggtttc atcgtgttag ccaggatggt 72240 ctcgatctcc tgacctcgtg atccgcccgc cttggcctcc caaagtgctg ggattacagg 72300 cgtgacgact gtaagccacc gtgcccggcc agttcctctg tttttgactg cctgccttac 72360 tactgctttc tgtggtgcct gataacatcc aattcctgaa ccttcctggg atttttgttc 72420 acgtcagcgt gcttcttgca tttaggtatc ccttcacaag taggcattta ggttttaagc 72480 tctgctaagt gatttaccac actttatcag ttctccattt tgtggaattc attgtgttaa 72540 tctccttttc tatttttgtt tggaagattc atatattttt tattcattta gtattttttg 72600 gtgggatttc taagtagaga aacatgccta tgttcaatat gtcttgttta agcagtctgc 72660 tttcattttt accaccgagg agttggtttt atttcttttt tttttttttt tttttttttt 72720 ttttgagaca gggtctcact ttgtcagcca ggctggagta cagtggcaca atcaaagctc 72780
<Desc/Clms Page number 86>
actgcaccct tggcctccca agctcaagtg atcctcccac ctcagcctcc tgaatagctg 72840 ggagctcagg tgatccagca cacccagcta attttttttt tttttaattt tttgtagaag 72900 cagagttccc ctatgttgcc caagctggtc ttgaactctt gggctcatgt aatcctcctg 72960 tctttgcccc ctaaagtctg ggattacagg tgtgagccac cacacccagc tgtttttaat 73020 tattacatta atttatgatt atgtgtttcc tttaaagcta tgggcagctc tgtttgggaa 73080 gatgctactg aaaaaaggat gctttttaga tggcaaagag tacttaaaat gtctctagaa 73140 tcatagttgt aaactaaagt atatattttt tagttgttca cagggcttag agctcctgcc 73200 agagggctgt tactctttgg tccacctggg aatgggaaga caatgctggt aagggttctc 73260 ttcaaatttg agttttctgt tgagatattt gggataatat gaaaaaaaga aactttatct 73320 tgtccttgag tctattattt acgacttgct ttttgctatt gtacactttt gttttttttg 73380 tttgtttgtt ttgttttgtt ttgagtgatc tgggctcacc gcaacctccg cctcctgggt 73440 tcaagcgatt ttcatgcctc agcctcccaa gtagctggga ttacaggcac acgccaccac 73500 acctgtctag gttttttatt tttggcagag acaggatttc gccatgttgg ccaggctggt 73560 gtcgaactcc tgacctcaag cagtcctcct acctgggcct cctaaagtga tgggattaca 73620 ggcatgagcc actgcacctg gctgatacac ttttaagttt ttcagctact tttcaatgta 73680 gaagtagatg gaaaaccatg tacgttatct tcagtagtgt gtttttggtt ggttaaattt 73740 gacagtatga ttgtcattat tttttgtaaa ttaaattttt acctggaaga gcttacctta 73800 ctatattgag tatctttcta acccctgatt tttgcttcta ctatcataat aactttattt 73860 aagtaatcag tatgttatag cttttttttt tttttaagta ttcttttgcc agaagttttt 73920 atcaggctct ggatacctct ttcctctgca tagtcctcct ggatggaaga aacaaagagg 73980 gaaagagtaa cttttcctta gatgtttgtc tttctcaaag cagttatctt tgtatatcta 74040 agaagagagg agaataacac tgtctctctt tttttttaaa tctctctcta ctcattctct 74100 ctcaggagga gagtagaaag aagcacagct cttcctataa cctgtcctta ttactgagaa 74160 aggaacacat tgattgccat gtattgggga ttgtattata ccttacattt ttatttttat 74220 tttttattaa tttttttttt tagacagtct tactctatca cccaagctgg agtgcagtga 74280 tgtgatctcg gctcactacc atctcttcct tctgggttca agcaattctg ccacgtcagc 74340 ttcctgagta gctgggatta caggcatgcg ccaccacgcc tgactaattt ttgtattttt 74400 attagagatg ggatttcacc atgttggcca ggctggtctc aaactcttgg cctcaagtga 74460 tgcgcctgcc tcggcctccg aaagtgctgg gattacaggc atgagccacc acacctggcc 74520 tcatagctta catttttaga gaatcttttc tagtacttaa atcggtaaat atggttatct 74580
<Desc/Clms Page number 87>
tttaaatgta atatattgaa ctaatttaat atttgctctt gtgattttta aaggctaaag 74640 cagtagctgc agaatcgaat gcaaccttct ttaatataag tgctgcaagt ttaacttcaa 74700 aatacgtgag tgctctgttt ccaatattgt cgtattttaa gttactgtct aaatgttact 74760 gtgttaactg taaatggtaa tatttcatga aaatattttt ctaggagctt atctattgta 74820 tctattattt acatatgatg aatatctatc ttcagagtag aaagttatgt acatttgtgt 74880 tgtcaaatac tgtattagtt tactggggcc atgtaataaa ataccgtaaa ctggctggct 74940 taaacatcag caatttattg tctcacagtt gtggaaggta gaagtctaag atcagtcaaa 75000 atgttggcag ggttgcttcc tcctgagggc tgtgagggaa aatgtatgtt gtgtgcctct 75060 ctcctggctt ctggtggctt gctggcaatc ttttgtattc cttggcttgt agatgcatcc 75120 ctcctatctc tgtctttatc tttatgtggc attctccctg tgtctgtcac catgtccaaa 75180 tttcccctgt ggattaggac ccaccctaat gatctcaatt taagtttgtc atcagcaaca 75240 attctatgtc caaataatgt cacattcata ggtactaggg ataggacttc aacacgtttt 75300 tggagaacac agttcaaccc attaacaaat actatcactt tccacttaag cttcaagtaa 75360 agtggatttt atctcaagga gccaccagat aggaacacag atctgatggc ataaactgag 75420 tatttctggc cttctgattc tgatctaaaa tatgacagaa gattttccct gttttaattt 75480 tttttttttt tttataatag agacacagtc tcgctatgtt gccaggctac tttcaaattc 75540 ctgggcttaa gcaatcctcc tgcctcggac tctcaaagtg ctggaattac aagtgtgagc 75600 caccacacct ggccagtaga ttttccctgc tttcttttga ttgtttataa ttttgttttc 75660 tttttccatt caccctctgc tgaccctata gtattattca aagaagtgtt cagtctagtt 75720 ttggggtagg gcaagcataa ctacagtgct taaagagagt aatttgtctg gtgtgcagaa 75780 ctagtgtgta aatataactg gtgcattgca aaactgtgaa gtagtttctg tcaaacctta 75840 cactgctttg tctttctccc tctctccctt tctcttggtt gccccctccc cctcccaatg 75900 ataccttagt ctctgcttgc ctttatcaaa acctttatga ttggccgggc acagtggccc 75960 atgcctataa tcctagcatt ttgggaggct gaggcaggaa gatcacctga gcccagaagt 76020 tggagaccag cctaggcaac atggtgaaac cccatctctt ccaaaaataa aaaatagagc 76080 caggtgtggt ggcatgcacc tgtagtccca gctactcagg aagctgaggc gagaggatct 76140 cttgagcctg agaggttgag gctgcagtga actgtgatca tgccactgca ctccagcctg 76200 agtgacagtg tgagaccctg tctcaaagaa acaaaacaag ggggggcatg gtggctaact 76260 cctgtaatcc cagtactttg ggagactgag gcaggaggat tgcttgaggc caggagttca 76320 ataccaccct gggcaacata gtgagacccc catctctaca aaaaataaaa aatttagctg 76380
<Desc/Clms Page number 88>
gacatgccag cgaatacgtg gtcccagcaa atcaggaggc tgaggtggga ggatcacttg 76440 agtcaaggag gttgaggttg cagtgagcca cgatcatgcc aatgcattcc aacctgggcg 76500 tcagagcaag accacgtctc aaaaacaaaa caaaacaaac ttttatggtt gaaagtgttt 76560 tggcaaacat acttaaactg aaatgtgaat ctctgatgaa agaacatgtt acctgtaaaa 76620 gtttgaagtg tcagcatttg ttgcaccgaa atccagaggt gaggccaggt gtggtggctc 76680 acgcctgtaa tcccagcact ttgggaagcc aaggctggca gatcacctga ggtcaggagt 76740 tcaaaaccag cctggccaac attgcaaaac cccgtctcga ctaaaaatac aaaaattagc 76800 cagacttggt ggtgtgcgcc tgtaatccca gctattcggg aggctgagac acgagaattg 76860 ctcgaaccca ggaggcagag gttgcagtga gccgagatgg caccactgca ctccagcctg 76920 ggcaactgag tgagactctg tctcaaaaaa aaaaaaaaaa aaaaatccag aggtgaatcc 76980 agaggtgatc accacatgat atccagatag cctctttcca tgagaggctc aaaggataat 77040 tttactgtct acagttttgc agcgagagaa acttgatttt atcagtacac caagagcaga 77100 tctatgtctt cggaacagac atgagatcag aattgtctag ctgctatgaa cagcatgttc 77160 tctccctgta cctatagaca tgtatgggaa acttatttgt aaggttgtat aatgagcagt 77220 gagttaaagc aaacttgaca tgttgaccat agttgttatg gcattggact aaagtagcct 77280 ccatcactat gatagagata gccttggtgt tggacccata gtttttgaag tctgtttgct 77340 aagactccct cttccttagg cagttcttca aatattatta tgctttttcc tgtcatggga 77400 ttcctcttca tggagtttcc tttctcagga acactatctt ctcctggtta atttgtactt 77460 attcttcaga taccagttga aatgttacaa ccttccctga ccctccaaac tattccccgt 77520 tattattctc ctagcaccac ttgcacctca ttttcatact cactggagtt gcaattcata 77580 ttcattgata ggattatttt aattgtatct gatatcactg tcacctccac tagaagatgg 77640 tctccatgcg ggcagagact atcaccatgt gttcttcact tcaattttca gtagttggct 77700 gtgagtaggt attgaataaa tatttgtgga gtaatcataa tgaggtatag atattattct 77760 catagctcta ttttattaat tagggaatta cagaattcag tgatctgctc aggatctcat 77820 aaccaggaag tgggaaacta ggatttgagc tccagtgagt gtggcctttc attaaaaata 77880 ttacagcaac cattctcttt tttttttttt ttttttttga gatggagtct tgctctggag 77940 tgcagtggcg tgatctcggc tcactgcagc ctctgcctcc cgggttcaag tgatccccct 78000 gccttagcct gctgagtagc tgggactaca ggcacccgcc acgacacttg gctaattttt 78060 gtattttagt agagacgggg tttcaccatg ttggccagga tggtctcgat ctcctgacct 78120 tgtgatccgc ccgcatctac ctcccaaagt gctggattat aggcgtaagc caccacaccc 78180
<Desc/Clms Page number 89>
ggcctacagc aaccattctc ttttatccat acttttttca agagtactgt ttcatcttca 78240 tgttttcaga aacaacatag cattcatgat cttaaccccc aattctgata ctgcctgaat 78300 atcttgaagt aagtttactt ttaagaaagt tgaggctagg tgtggtggct catgcctgta 78360 atcccagcac tttgggaggc caaggcaggt ggatcacttg agctcaggag ttcaagacca 78420 ggctgggcaa catggcgaaa ccctgtctct accagaaata caaaaaatta gtcgggcgtg 78480 gtggcgtgtg cctgtggtcc cagccacttg ggagactgaa gtgggaggat ttcttgagct 78540 tgggaggtgg agtttgctgt gagccgagag atcatgccac tgtactccag cctgggtggc 78600 agagtgagat cccatctcaa aaaaagaaaa gaaaaagaaa attgaaatgt ctagtctatc 78660 attttgtcag ttctatctaa tacaattttt tccttatgtc taactgaaat ctgctttttc 78720 taatttttac atacttgatt taacaaaact caatcttttt ttttttttat gagacagcct 78780 ttcaaatata taggaactta atgttatatc tgcttccctc cagtccccag aatagttact 78840 attttagttg tctttctatg gtctcatgcc agtttgtcag tatgcctaga taagaactga 78900 atattttacc tcagatgtga cctgactttg aagacttaaa aaggaagcat tgtgccaggc 78960 gcagtggctc acacctgtga tcccagcact ttgggaggcc gaggtgggca ggtcaggagt 79020 ttgagaccag cctgattaac atggagaaac cccatgtttc tctactaaat acaaatctct 79080 actaaatact aaatactaaa tctctactaa aaatacaaaa gatgagctgg gcattgtggc 79140 acatgcctgt aatcccagct actcgggagg ctgaggcagg agaatcactt gagcccagga 79200 ggcggaggtt gcggtgagcc gagattgcgc cattccactc cagcctgggc aacaaaagtg 79260 aaactccatc tcaaaaaaaa aaagcagcag cattgtgtaa tattatgtag atgttgtgtc 79320 tcatgatcta tcctgagaaa gcttttggga ggaactgcat catagtcatg gacaacattt 79380 gtgttattaa aatatctaga ttattttcca caaaaaatca gttacatatg tatcttaaca 79440 tgttgtatta ttgtttaacc ttgtttattg aataactaac atgtagaaaa gtatttatag 79500 cataagtata cagctgtata cagctcagtg gattaccaca aagcgaatat actttcataa 79560 tcaccaccca ggtcaagaaa taaattgtta cctgtggccc taaaatccct ccaggcactc 79620 caccatcttt atccactcac tcctctccct caaaaccact agactactaa catcatagac 79680 aaagctagca tgcctttgaa ctttatataa atctaatgat gtaggatttt gtgtgtatgt 79740 gtatttggct tctttcatca gcattgtatt tgtgagattt atccagattg ttgcaagtag 79800 ttgtagttgt gcttttttac acagatttaa tttttatatt tttcttatat gttcgaacag 79860 ttaacctgct tatctattat taaaaaaaaa aaaacgaaca ttcacatagt tcttaccagt 79920 ttacagtgtt ttttccacac cgtcttcaaa atgtaaagtt tggtcttcaa tacatcagta 79980
<Desc/Clms Page number 90>
tgctgctaga tttaaatact agggaaaaaa aaatcagaga agttaataat attaactgtc 80040 acctccacta gaagatggtc tccatgtgga cagtaatatt tctcttgtat tatctgtgct 80100 aagtaaaatc ttctgtaagt ttctttaaat attttaataa atcatagtac ttaaaatgtt 80160 ctcaatattc taaagtagtt aaaagtaact ataaaatagt acctgttttt ctgatcacat 80220 tttacttcct atgtgaaatt ttacaagtcg ttactctatt tatttattga tttatttttt 80280 aagacagggt ctgttctgtc gcccaggctg gagtacagtg gcgtgatcat ggctcactgc 80340 agcctcagcc tcctgggctc aagtgatcct cccaccttag catcccaagt agctgggact 80400 ataggcacat gccaccatgc ccagctaatt ttaaaaaatt ctggggggcc gaatgcggtg 80460 gctcacacct gtaatcccag cactttggga ggccgaggca ggcgaatcac aaggtcagga 80520 gttcgagacc agcctggcta acatggtgaa accctgtctc tactaaaaat acaaaaaatt 80580 agcggggtgt ggtggcaggc gcctgtaatc ccacttactc aggaggctga ggcaggagag 80640 ttgcttgaac ctgggaggca gagattgcag tgagccgaga ctccatctca aaaaaaaaaa 80700 attttttttt gtagtgacaa ggtgtcactg tgttgccagg gctggtctca aacttctggg 80760 ctcaagtgat cctcccattt cggcctccca aagtgctagg atcacaggca tgagtcactg 80820 tgcctggtct tcaagttgtt attaaagcat gtttacccac attatgcaca tggtataatg 80880 gaaagtattg ttgtggaagt taggagatag ggattctagc ctagcttttt atttttttgg 80940 gacaaggtct cactttttcg ccccaggccg aagtgcagtt gtgcgatctc ggctcactgc 81000 aacctccaac tctcaggttc aagcaattct cccacgtcag cctcccgagt agctgggatt 81060 acaggcatgc gccaccacgc ccggctaatt tttgtagttt tagtagacac agggtttcac 81120 catgttggcc aggctggtct tgaactcccg acctcaggtg atccacccac cttggcctcc 81180 caaagtgctg ggattacagg catgagccac cgcacccggc ctctagcgta acttttacat 81240 cctgaactga ccttaagaaa gtataacttt aggcctgttt catctgtaaa atgttaatgt 81300 cataggagat gatcttttga gatttctttc agctctgata attttgtgtg tgtgtgtgtg 81360 tgtgtgtgtg tgtgagatgg agtcttgctc tgtcgcccgg gctggagtgc agtggtacca 81420 tctcggctca ctgcaagctc cacctcctgg gttcacgcca ttctcctgcc tcagcctccc 81480 gagtagctgg gactacaggc gcctgccacc acgcctggct aattttttgt atttttagta 81540 gagacgaggt ttcaccgtgt tagccaggat ggtctcgatc tcctgacctc gtgatccgcc 81600 cgcctcagcc tcccaaagtg ctgggattac aggtctgagc cgccgcgccc ggcctagaat 81660 atttgtttcg attattctaa atctggtgac atttcttttg tttttaagtt aaatcttcag 81720 taaaaagaat aaatgccacc tagaggacag aaaaattttt acagtagatt atcacagacc 81780
<Desc/Clms Page number 91>
tcatgactca ttactttggt gtataaaatg gcctttgtat ggtgtcagca cctgggaatg 81840 tctcaagggg tgttcattga ccttctggac tatctggaaa tattttgata tttattggct 81900 gggcgcggtg gctcatgcct gtaattccag cacctcggga ggccaagtta ggtggatcac 81960 ttgaggtcag gagtttgaga tcagcctggc caactaagtt agttgactat ttgtgaaatt 82020 tccctctcca aataggaaag ataggattgg aaacattatt cagaaggaag aagttttaaa 82080 gaagggcagg cttaaagact atctaatgaa tttaccaata tggtaaaacc ccatctttac 82140 taaaaataca aaaattagcc aggcgtggtg gtgggcgcct gtaatcccag ctacctggga 82200 tgttgaggga tgagaatcac ttgaacccag gaggcaaaag tcacagtgag ccgagattgc 82260 accactgcac tccagactgg gctatagagc aaaactctgt ctcaaaaaaa aaaaggaaaa 82320 aaaaaaaaga aattttgata tttatgtgag aatgactttt cacggtgttc ttaatagcgc 82380 aagttttgtt taggagagca cattccaact tacttgcttc tataaatata ccgtgtaatc 82440 tagggcttaa agaatatgta caatgtcttt ttctctcccc tagtcttccc cttttctcac 82500 tagttatatc cttgactgaa gagctatttc attctcaagt cttaggaatg cagggtgaag 82560 caaaacagat gaatttttaa agcacttaac caggctgtat gaaatcacag tctgttgtct 82620 aaaattgtaa gggacggtta gtagtactct cccctttctc aaaccaaatc tttggttgtt 82680 ttaaggaagg gaaattaaat tcctgtgtgc tagattttca acataaaatt taaaaaactg 82740 gaataatgtt gcattttatg tgtataacag tataatgctt tgttttaggt gggagaagga 82800 gagaaattgg tgagggctct ttttgctgtg gctcgagaac ttcaaccttc tataattttt 82860 ataggtaaga acatattttc caactaagtt attgactatt tgtgaaattt ccctctccaa 82920 ataggaaaga tacgattgga aacattattc agaaggaaga agttttaaag aagggcaagc 82980 ttaaagacta tctaatgaat ttagtaggac ccactatatt aataagtagt aaactagatt 83040 aatctcagat gactcacata gcttggtctt taattaaagt cttatacttg tatttcctct 83100 agatgaagtt gatagccttt tgtgtgaaag aagagaaggg gagcacgatg ctagtagacg 83160 cctaaaaact gaatttctaa tagaatttga tggtgtaagt gttgattatg atatttttaa 83220 tgtggcagca ttttagtata ttttcctatt aaatggccaa ggttaaaaat acaaatatct 83280 ttatatttgt tattactttt ctaaatgaat tgaaaaaaga ttttttgctt gtaggtacag 83340 tctgctggag atgacagagt acttgtaatg ggtgcaacta ataggccaca agagcttgat 83400 gaggctgttc tcaggtaggg agatttatat ggaaatacat gcatttatta cagacaatat 83460 ttactcatgt gtccatctta catattattt ccttactctc agttttaaga ctaaattcac 83520 tattttcttc cagtactatc tctagcctct tgttaccaac tacataagga ttttgaggtc 83580
<Desc/Clms Page number 92>
aacagcttga tatcaggaga attagtctag taaaggttta gttacggttt taggcaaatt 83640 ggtcagttct tctgggttgc attaaattat ctttaaactt gaaaattgat tcttaccgtc 83700 ttttattggg cttcatgaga aaataatcaa atcagggttc atggaaaatg tgttttctgt 83760 tcttgtgtgt ttgagcagtt tattcccttc atactggaag gacggtttgg gtcagcataa 83820 aattcttggg catcctttcc caaggaattt acaatattgc tccattgttt ctagattggc 83880 tgtagtagtg taaaagtctg aatccaaatt gattttttca aatttgtaaa ataacttgat 83940 ttttttctct ctttactgga tgggttacgt gggtatattg cacccaggta gtgagcatag 84000 ggtgcagtag gtagtttttc aacccacacc tcactgcttt cttcccccat gtagtagtcc 84060 gcagtgtgta ttgttcccat gtttatgtcc atgtgtactc aatttttagc tccccactta 84120 tgagaacatg agctatttgg tttactgttc ccacattaat tggcgtagta ttaaggcctc 84180 cacctccatc catgttgctg caaaggacat tatttcattc ttttttatgg ctgcgtagta 84240 catagtattc catggtgtgt acgtaccaca ttttctttat ccagtccacc attgatggac 84300 acttagattg attctatgtc tgctgtcatg aatagtacag caataaacat gaaatgcatg 84360 tctttttggt ataatgatct attttccttt gggtatatac ccagtaatgg gatttcaggg 84420 tcaaaggtag atttgtttta tgttttttga gaaatcttca aactgctttc tacaatgact 84480 gaactttaca ttcctaccag cagtacatac gctccacaac ctcaccaaca tctgttattt 84540 ttttactttt tcccgccaat ctgtagacaa tatgggattt tttttgccat tttattaata 84600 gccattctga ctggtgtgag atatctcatt gtgattttga tttgcatttt tctgatggtt 84660 agtgatgatg agcatttttt catgtttgtt gtcccctcgt atgtcttttg agaagtgtct 84720 attcatttcc tttttaccca ttttttaata gggttgtgtg tttttagctt gttcaattgt 84780 ttgaattcct tatagattct ggatatcaga ccattgttag atgcagttct gtagattgtc 84840 tgtttactct gttgatggtt ctttttgctg tgcagaagct ctttagttta attaggtccc 84900 acttgtcaat ttttattttt gttgcaattg tgtttgggga cttagccaaa atttctttct 84960 gaggctgatg tcaagaagtg tatttcctag ttttcttcta gcatttttat actttgagat 85020 cttacattta aatctttaat ccaccttgag ttaatttttg tatatggtga aaagtaaggg 85080 tccagtttca tttttctaca tatggctagc cagtaatccc catgccattt attgaatagg 85140 gagtcctttt cctcattgct tgtttttgtc agtcttatca aagatcagat ggttataggt 85200 gtgtggcttt atttctcaat tttctgtcct gttcctttgg tttgtgtgtc tgtttttata 85260 ccagaattat gctgtttggg ctgctgtgta gttcggttta aagtcaggta acgtgatact 85320 tacagctttg ttctttttgc ttaggattgc tttgtctatt tggactcttt ttttgcttcc 85380
<Desc/Clms Page number 93>
atatgaattt tagaatattt ttttctaatt ttgtgaaaaa caacattgat agtttgatag 85440 aaataccatt gaatctgtaa attgctttgg gcagtatagt cattttacga ccagataaat 85500 caggcaagag aaggaaacaa aaggcatcca aataggaaaa gaagtcatca tactctcact 85560 cttcactggc aatatgattc tatactttga aaaccctaaa aattccgtca aaaggctact 85620 agaactgata aatgatttta ccccaagatt caggatacaa aatcagtgta caaaaaatta 85680 gtaccatttc tatacgctaa taatgtccag gctaagagtc aaatcaagaa cacagtccca 85740 tttacaatag ccacaaagaa aatgaaataa tggctgggca cagtggctca tgcctgtaat 85800 cccagcactt tgggaggctg aggcaggtgg atcacctgag gtcaggagtt cgagaccagc 85860 ctgaccaaca tggtgaaacc ccgtctctac taaaaataca aaaaattagc caggcgtggt 85920 ggtgggcgcc tgtaatccca tctgctcggg aggctgaggc aggagaattg cttgaaccca 85980 ggaggcatag gttgcagtga gccgagatcg tgccactgca ctgcagcctg ggtgtgaaag 86040 agcaagaatc cgtttccaaa attaaaaaaa aaaaaagaaa aaaaaaaaga caatggagta 86100 cctaggaata cggctgatga aggaggtgaa agaatctgta tgaggagaag tgtaaagcac 86160 tgctaaaata aatcagaggt gacacaaata aatggaaaaa cactccatgc tcatggattg 86220 gaagaatcaa tatcgttaaa atgggaaatt tatcttaatt tttttcccta gttcattttt 86280 ctgttttctt ttgcacataa attatgtgtt atgttgcgtc cttttgtttt ccctatctgt 86340 aattttcttc ttcatccttt taaactctta ggtctttttg ttttgttctg ttttcccaag 86400 cctgttgcct ttatttctta ctgggttagt atctaatctc ctttctgcta tatcttttgt 86460 aactcttctt tccttggtgg ttttttattc attactttcc tgacatctgt tattctactt 86520 ttcatcttct gttttatttc tttgagcatc tgtatgttat ttccataagc tcttacattt 86580 cactgggctc ttgtttcata gaaaacaatt ttttggcaag gacagaccac ttgaggccag 86640 gagtttgaga ccagcctggc caacatagta caaccctgtc tctgctaaaa atacaaaaaa 86700 ttagctgggt gtggtcacac acacctgtaa tcccagctac tcaggaggct gataatcgct 86760 tgaacccagg aggcagaggt tgcagtgagc caagacggcg gcactgtact ctagcctggg 86820 ggacagagca aggctctgtctcaaaaaaaa aaagaaaaaa ttttttggtc aggcgtcatg 86880 gtgggtcaca cctgtaatcc cagcactttg ggaggccaga tcacttgagg ccgggaattc 86940 cagaccagcc tcgccaacgt ggcaaaaccc catatctata aaaaaaactt aaggataaaa 87000 aaaattaaat ttttaaaaaa ttaaattatt ttatttcgtg gaaagatact tggtcataat 87060 tttagtttgc tctatggcaa aatcttctca tgcatgttct tcattttatc tagtttatgt 87120 ttattgtgtt ttgtttgctc ttttttgggg gcaggttttg ttgttgttgt tttttttttt 87180
<Desc/Clms Page number 94>
ttttttttaa atgagccctg tcctggtttt tccttttttg cttattattt ttctttgaat 87240 aaaaggagtt ttcttggaaa acctagtttt ggaaggatat tgtaggggaa gggataggta 87300 tcttgagtag tccatgtata cactaaacta gcatgcagcc tccctcactt acagtgaagc 87360 cctacctaat aatgaagtat atgtgtatgt aaataagaga tagggttgat ttattcttct 87420 actaaaaaat attggtcact gcaagacatt gtcttcccgc cagactgtta gatgccttct 87480 tataaagata attcgtctta gagtttcttt gttcattctc accttccttg ccattcctat 87540 gctatcaatt agggtttata tggtctgcag agccaggctt catatgcttg tttaaatgtg 87600 gagggactgg ccttattacc ctttagggtg tgctatctct ttttgggagg aaaactgtac 87660 tctgacagtc atgtccatga tctttagcgg cagatccttt gtgtgtcttc ctttgtcagt 87720 gtaattttca ctgccctagg cagttcacct ttatgtattt tagttccata aatgttacct 87780 agtttgttga tgaagtgtat gtttctgttt ctattatcct tgctgatttt agtttttttc 87840 agattcaaga agacagatct acttatatca gatattttgt ttgttttaaa gcattactgc 87900 tattaaaaac atatacatac ataaatgatt aattctaaca ataccgaatt aaggatttta 87960 aacattaact agagttttaa aagagtaaca aaaatatttt tacattgata actaccaaaa 88020 tgcattccag tgccttgaat attatatttt aaaagctttt cctgtcattt gctgtttcag 88080 ctttaaattc aaaattatat ttctaaaagt gctggatttt tttttttagg cgtttcatca 88140 aacgggtata tgtgtcttta ccaaatgagg aggtatgtat ctgtgtttga attttttttg 88200 ttttagagca gaaacaagaa ctaccatctt gacaatatta agtcttccaa tccatggtac 88260 agctactttg gaaaacagtt tagtggtttc ttaaaaagat gtacataagc ttactgtcag 88320 agccagcaat ttcactccta agaatttacc ccagagaaac aaaaatgtat gtccacacaa 88380 agacttgtac aagaattttt atagcagcaa tattaataat agccagaact acaaatgatc 88440 taaaatgttt attttggtga ataaacaaat gtggtatatt catttaatgg atactgttat 88500 ccattataca tgctgcatac tcacttcata tattaagttt tatgaatgaa actccaaaac 88560 attataagtg aaagaagcaa gatgatatat gtcgcatatc ataggattct gtttatatgc 88620 agaaaacgca aatttatttt ttatttattt atttttttga gatggagtct tgctctgtcg 88680 ctcaggctgg agtgcagtgg cgtgatctcg gctcactgca accttcacct cctgggttca 88740 agtgattctc ctgcctcagc ctcctgagta gctgggactg caggcatgtg ccaccaggcc 88800 tggctaattt tttgtgtttt tagtagagac gggtttcact gtgttagcca ggatggtgtg 88860 atccgccctc ctcagcctcc caaagtgctg ggattacagg catgagtcac cgtgcccggc 88920 cagaaatcga aaatttctag aaacgtaaag cagatcagtg ggttgtcagg gtgagagttg 88980
<Desc/Clms Page number 95>
ggaatgagga ttaactgcaa acaggtatga gtgaactaaa aagtgttcta aaactggatt 89040 gtggtgatga ttgcacatct ataaatgtat taaaactcat tgaattatat acttacaatg 89100 ggtgaaattc atagtagatg aattcatacc tctataaaac tggttttttg cagcaaaata 89160 tttattgcta tgtttttatt caagtgtggt gaattattgc tatgttttta tccaggtgtg 89220 gtgtctcacg cctataatcc caacactttg ggaggctgag gtgggaggat cgcttgagcc 89280 aggaattcaa gaccagcctg ggcaacatag ggagaccctg tctctacaaa aactttttta 89340 gaaattaacc aggcatggtg gcacgtgcct ttggtcccag ttactcggga ggctgagatg 89400 ggaggattgc ttgaacccag gatatcgagg ctatagtgag ctatgattgt gccctgcact 89460 ccagcctggg taacagcaca agaccctgtc tcaatataaa aaaagaaaag aatcattaat 89520 tctgaaatta gactgaatga tcatttttta atatttttca gacaagacta cttttgctta 89580 aaaatctgtt atgtaaacaa ggaagtccat tgacccaaaa agaactagca caacttgcta 89640 ggtgagtaat ttggatttgg tttatcttac agcttttatt tattttttgt aaataattct 89700 ttttttagtt atttaaagta atcttaagta tgaaatgagt aattcattga tcagaagact 89760 ttctctcatc ctctacctcc tttgcctttt tcttacctct tgttcttata tatatatgtg 89820 gaatctaaat ttcactggct atgtcctttg caagacgtga tctaatgatg atagtatatt 89880 ctttttataa atttattaaa acctgtaagt ggtattaaag taatttaaac atttacacct 89940 taggcaacat ggtaaaaccc catctctaca aaaaataaaa tgagtcagga atggtggcac 90000 atacctgtag tcccagctac ttgggaggtt gatgtgggag gatcgcttca gcccgggagg 90060 tggaggttga gcaacagagt gagaccctgt ctcaaaaaaa attttaaaca tttcatattg 90120 cacactaaca cagatatttt tatataaact tgttcttggc atatgctgaa tacttttcag 90180 ctcttttaat aattttaatt atttgataat tttaataatt ttaatttcag ctatttgaat 90240 aatcttaaac tttatgaaca gtgtgaagta gaaactgagt ataggagatg cgctcatgaa 90300 ttttattccc tgaaaaatgt cataaagtaa tataaagtat tcaatgagta tgtgagtatt 90360 gaataatttt aacaagaact ctgagttccc agatacctat gacaaaagaa caaattactt 90420 ggaagtctct tctactccag acctttctgt ctatcccctt atttaaaaaa atgtacattg 90480 attgtccctt atcccatcaa gagagtgttc tttgccaaga taaacgctaa ttagagaagt 90540 aattgtgttt atgtgtcagt tggccaccag tagtttgtag atgttacctt tccaggtgac 90600 atgtttacaa tttaatgaag cctctggaga tagtatgcct taatctaaag gaatggttct 90660 aatgattaaa atttgaggca ttactacatt tgttttcagc aaatgggcct ttctattccc 90720 ttaaaatcaa accctcataa ctatgggttt gctgacaaag ggaaactagt ttttactctt 90780
<Desc/Clms Page number 96>
attatatgga gattttaaat ctgcagagat gaaaataatt tgctgtttca gctgggtgcg 90840 gtggctcatg cctgtaatct cactactttg ggaggctgtg gcgggtggat cacctgaggt 90900 caggagttcg agaccagcct gaccaacatg gcgaaacgcc atctatacta aatacaaaaa 90960 aaaaattagc caggtgcggt ggcgcatgcc tataatccca gctacctgag aggctgaggt 91020 aggagaatcg ctccaggagg tggagatcac agtgagctga gatcatgcca ttgcactcca 91080 gcctgggcaa caagagcaaa actccatctc aaaaaaaagc gggaggggaa ataatttgct 91140 gtttcttcct tcccttcctc agaatgactg atggatactc aggaagtgac ctaacagctt 91200 tggcaaaaga tgcagcactg ggtcctatcc gaggtaggta tacaagagct taaaacattt 91260 agaactattt attataccac cttagaagtt taagaagtcc aaaaaaatct accaagagat 91320 tttttttttc ttttggagac agggtctcac tctgttgccc aggctgtagt gcagtggcac 91380 aatcatagtt cactgcagcc tcgaaccccc caggctcagg tgattctccc acccagcctt 91440 cccagtagct gggactacag gcatgcacca tcatgcccag ataattattt tattttattt 91500 cttgtagaga cagggtttca ccatgttgcc caagctggtc ttgaactccc gggctcaagt 91560 gagcagcctg ccttggcctc ccaaagtgct gggattacag gcatgagcca ccatgcccag 91620 ccttaaaacc attcttagct cacagatcat acaaaaacag tctatgagcc agtagactgt 91680 gacccctgtt ctaggcaaga ggtttcattt cttgatagta agtaagcagc agaaaactca 91740 aaaagaaaac tttaaacaaa aaagaataat gtaaggaaaa tgttcttatc tgttttctgg 91800 ctcttttcag tattctgaca tcatttgaaa ttaatgtgtc taaaggaaat tctataagag 91860 aagttttcac ttttttaatt atatcttttg agggattgca gcaaaatatt tattgctatg 91920 tttttattca ggttacttgg ttgattctga aataccacga ccaattcttt ttaggttagg 91980 ttaggataaa ctcacacaga tattttcagc tacatttcca cagccagcat cggtagtgga 92040 tggttgatgc tctcaggtat gcactcagat tattagctat gatgataaag taatcataat 92100 agctccatcc ctttctctca ttcaagaaag tacaattgaa tgtagttgta cgagaaagat 92160 gttatcatag tgtctactgt aatttgcatt aaaagcctac attatacaaa cctttttgtt 92220 ttactagtta aaaattacca gtaacacctc ccgtagtgaa atagggtgct gattaagaac 92280 tgctactttg caaaataaaa aatgtaatct tgagagtata ttttgaaact ctggatgaac 92340 aaattttctt gctgctggag cttaaatctt gttcagttag tggatttaga aacagtagct 92400 aatgcataaa tgagttgtat tttcttagaa cgttttggct attctaaggt agacaaaatt 92460 tgggtttaaa aaaagattcg catccattaa agtacagaaa atggccgggt gcagtggctc 92520 acacctataa tcccagcact ttgggaggcc aaggtgggag gatcgtgtgg gcctaatagt 92580
<Desc/Clms Page number 97>
ttgagactag actgggcaac atagggagat cctgtctcta caaaaaaata taataaatta 92640 accaggcccg ttggcatgag cctgtaatcc cagctactcg ggagtctgaa gtaggaggat 92700 cacttgagcc tggaaggtgc aggcagcagt gagccatggt catgccactc actgcactcc 92760 agcctgggtg ggtgacatag tgaggtgctg tcttaaaaag taaataaata ggccaggcac 92820 ggtggctcac gcctgtaatc ccagcacttt gggaggccaa gatgggtgga tcatgaggtc 92880 aggagttcga gaccagcttg gccaatatgg tgaaaccgca tctctactga aaatacaaaa 92940 attagccagg cgtggttgtg cgcacctgta atcccagcta ctcaggaggc tgaggcagga 93000 gtatcgcttg aacctgggag gtgaggttgc agtaagccga gcactgcagc ctgggcaaca 93060 gagcaagact ctgtctcaaa aaaaaaaaaa aaaaaaaaaa aaaaaagtaa atacataaag 93120 tgcagagtaa aaacaaaaaa agactaatgc attttgtaaa gaacaagttg cattctttta 93180 agttcccttt caaatttgtg aactattgtt tttgggcagt atgcaagaaa ttgaacactt 93240 tccagttatt ccaaagaagg aatattctct tctcagcatt tataaattgt atttgctctc 93300 aaagttaaca tgtgtctctt ttttttaata taatgatttg tactgaatag atacatgtag 93360 atcattgtac ttggttttgc ccttcaacaa tttcaactgc aaaatgtatg tatttttaag 93420 tgcctgactt ttatgtttta cagaactaaa accagaacag gtgaagaata tgtctgccag 93480 tgaggtatag tattttacaa tgatattttc tttgtcttct atattgtaag acatatataa 93540 gacatacata tatgaatgtg tgtgtgtgtg gttttttttt tttttttttt ttttttgaga 93600 cagtctggca tgatatcggc tcactgcaac ctccacctcc tggattcaag ctattctcct 93660 gcctcagcct cccaagtagc tacaggcatg taccaccaag cccagctaat ttttgtattt 93720 ttagtagaga gggcatttca ccatgttggc cagtctggcc tcagactcct gacctcaagt 93780 gatccaccca actcggcctc ccaaagtgct gggattacag gcttgagccg ctgcatctgg 93840 ctgttttgtt tgtttgtttg tttgtttgtt tgtttgagac ggagtctcac tctgtcgccc 93900 agactggagt gcagtggtgc gatctcagct cactgcaagc tctgcctccc gggttcacgc 93960 cattctcctg cctcagcctc cctagtagct gggactacag gcgcccacca ccacgcctgg 94020 ctaatttttt gtacttttag tagagacggg gtttcaccgt gttagccagg atggtctctg 94080 tctcctgatc tcgtgatctg cctgcctcag cctcccaaag tgctgggatt acaggcgtga 94140 gccactgcgc ccggcctttt tttttttttt tttttgagac acagggtctt gctctgttct 94200 caggctggag tgcagtggtg caatcgtggc tgactgtagc cttgacctct tggtctcaag 94260 cagtcctctt gtctcaaact ttttagtagc tgggactaca ggcaagtgcc acaacgcccc 94320 actaattttt taattttctg tagagatggt gtctctccct gttgcccagg gtggtctcag 94380
<Desc/Clms Page number 98>
actcttggcc tcaagtaatc ctcctgcctc agtctctcag agtgcttggg actaattttt 94440 tttaatggat ttttctagtt gattagaagc tagaaaaaat taactttgct tcatttcaaa 94500 atatggaaac ctatgaaata gtcaaaattt tttttggtaa tagacaaaac atatatacat 94560 aaagtcattt tctatcaaat catattacat aaataccaaa cagaagaaaa ttacaggccg 94620 ggtgcggtgg ctcacgcctg taatcccagc actttgggag gccgaggtgg gcagatcact 94680 tgaggtcagg agttcaagac cagcctggcc aacatggtga aaccctgtct ctatcaaaaa 94740 tacaaaaaaa ttaggccggg ggcggtggct cacacctgta atcccagcac tttgggaggc 94800 cgaggcgggc ggatcacgag gtcaggagat cgagaccatg ctggctaaca tggtgaaacc 94860 ctgtctccac taaaaaatac aaaaaaatta ccggggcgtg gtggcgggca cctgtagtcc 94920 cagctacttg ggaggctgag gcaggagaat ggcgtgaacc tgggaagtgg agcttgcagt 94980 gagccgagat cgtgccactg cactccagcc tgggcgacag agcaagactc catctcaaaa 95040 aaaaaaaaaa atagctgggc atggtggcac gtgcctgtgg tcctggctac ttgggaagct 95100 gaggcaggag aatcacttga acttgggagg cagaggttgc agtgagccaa gattgcccca 95160 ttgcactcta gcctgggcga cagagtgaga cccagtctca aaaaaaaaaa aattacatga 95220 aacttgtggg ggtttataca ataaaaataa cctataacta tacgttaatc ctttaataat 95280 gttctatttt gtttttcaat aacctttatt tttttaatta atttcttttt tttgagaagg 95340 actctggctc tgtcacccag gctgcagtgc agtggcacca tcttggctca ctgcagcctc 95400 cacctcccag gttcaagcga ttctcctgcc tcagcctcct gcgtagctga gattacaggc 95460 atgggccacc acgcccagct aatttttttt ttttttgtat ttttagtaga gatggggttt 95520 cactatgttg gccaggtggg tctcgaactc ctgacctcag gcgatcgcca gcctcggcct 95580 ccctaagtgc aaggattaca ggcgtgagcc accatgcctg gccaatttat taccgtttct 95640 taatatggaa gacctcctta tgagatgctg aagcatttca tttgaaaaaa gttgcatgta 95700 aaatataaaa ttgggtatgc agaatggtca taactctgtg agcaaaattt tgaaatcagg 95760 cttgaattac agtcagcctt ttctatccgt ggattctgca ttcatggatt caaccaactg 95820 cagatcaaaa atacttgggg gaaaaaagca tctgtgttga acatgtacag acttttattc 95880 ttgttattat tccctaaaca atatagtata aaaactattt acattgcatt tacattgtat 95940 taggtgttat aagtaatcta gagatgattt aaagtataca ggaggattgt gtaggttgta 96000 tgcaaatact gcaccatttt acataaggga ctttaagcgt ttgcggattt tgctatctat 96060 gggggaacca atttccgaga gatactgagg gacagctgta tatttgtaac ttatttttta 96120 tttccctaat tgcagcagct gttgagggga cagtgaactg ttaacacaga taacaagtgt 96180
<Desc/Clms Page number 99>
attcaagtac attttggagt ttgtttgttt ttttttttca ggcttttatt cgcctgtcgg 96240 atgaggcacc atacttgaat tttttttttt aagaaagctt ttagttttct ttctttcttt 96300 tttttttttt gtgagatgga gtcttgctct gtttctaggc tggagtggag tgcagtggtg 96360 tgatctcagc tcactgcaac ctccgcctac tgggttcaag tgattctcct gcctcagcct 96420 cccgagtagc tgggactaca ggtgcacgcc accacgccca gctaattttt tttttttttt 96480 tttttttttg tatttgtagt agagacagag tttcaccatg ttggccagga tggtctcgat 96540 ctcctgacct tgggatccgc ccaccttggc ctcccaaagt gctagggatt acaggcatga 96600 gccaccacgc ccggctgaaa gcttttagtt ttctaactta tttaatttaa tttaatttaa 96660 tttattttta ttttattttt tgggacagtg tctcacttgg ttgcccaggc tggagtgcag 96720 tggtacaatc atggctcact gcaccctcta gctcctgggc tcaggcaatc ctcctgcctc 96780 agccttttga gttgctggga ctacgggcat gtaccaccac actcagctaa atttttaatt 96840 ttttgtagag atggggtctc actatgttgc ctaggctggt ctcagattcc tcaagcattc 96900 ctcccacttg cacctcccaa aatgctggga ttacaggtgt gacaccgtgc cagacttgaa 96960 atttttaatc ccacacctaa aaatataatt ttatccacca ttttttaaaa gtcataacat 97020 tatttattaa aaatttagat ggtaaaacta aaaattaaag cttaataaaa ctactgagtg 97080 atttacaagg aagaatatta ctggtccctt ttgtgagcat cccattaatt atatatattc 97140 aggttatatt gttacaatat ttggttctac tgtatacttt tttttttgag actgagtttc 97200 gctgttgttg cccaggctgg agtgcaatgg tgcaatctcg gctcactgca acctccgcct 97260 cctgggttca agtgattctc ctgcctcagc ctcctgagta gctgggatta caggcatgcg 97320 ccactatgcc tggctaattt tgtgtttttg tagagacggg gtttcactat gttggtcagg 97380 ctgatctgga actcccaacc tcaggagatc cgcccacctc ggcctcccaa agtgctggga 97440 ttgcaggtgt gagccaccat gcctggctct actatatact ttcattcagt tgtttctttt 97500 taatctagtg gttttggtat taataatttg ataatgacct ttagctgtta ttgcttactt 97560 atgagttaat atttataaag cacttaaagt agctggcacg tagtaaacac tatgtaaaga 97620 tccattaaat aactttaaaa aatataaaac tgatagtggc attttattat agagattaag 97680 gtaatccatt ctctcatttc catttatggg atgagacgta aacacaagta gtttgctctc 97740 taaaactgta tactagaatt ttatataccc attatttgat gcaactttaa taccaaagtg 97800 tattgtcagt taccggtgaa tatatataaa tttaggtaag gaaaacccaa cttggtcgca 97860 cacagtggct cacgcctgta atcctaccac tttgggaggc cgaggcagtt ggatcacctg 97920 aggtcttgag ttcgagacca gcctggccaa cgtggcgaaa ccccgtctcc actaaaaata 97980
<Desc/Clms Page number 100>
caaaaattag ccgggcgtgg tggcacatgc ctgtaatccc agctgctcgg gaggctgagg 98040 aaggagaatt gcttgaacct ggggaggtgg aggttgcagt gagctgagat cgtaccactg 98100 cactccagtc tgtgcgacag gagcgagact ccatctccaa aaaaaaaaaa aagaaaaacc 98160 caacttatct tttacagttt ataatagtag aagttcaaat aattggtttg gaatttctgt 98220 atttttaagg ttagtactaa aattgttggt tataaattgg ggtacaatat actttgtttt 98280 ttaagtacct tgtgtatcta atttaacttt aagtccttta ttattttggt ttgataagac 98340 aacttttcta cttatttccc cccttaactg aaccagctac catctgcctt tttcctgttg 98400 tatacattag tctcttacgt taaaatatca tataagtttc atatatatac acatatcaaa 98460 ctatagactt aaagtacaat tacatcaaca tcttttaaaa ccttaatttc tggccaggcg 98520 tggttgttca tgcctataat cccagcactt tgggaggctc aggccattgg atcccttgag 98580 ctcaggaatt cgagaccagc ctggataaca tggtgaaatc ctcatctcta caaaaattac 98640 aaaaagttag ctgggcgtgg tggcgcacac ctatagtcct agctacttgg gaggatctct 98700 taagcctggg aggcagaggt tgcagtgagc cgagatcatg ccactgcact ccagcctggg 98760 taacagtgag accctgtctc aaaacaaaaa tattaatttc tataacaaat aaattttatt 98820 tagtaatatc atgtttaata cccatgttac attcattatt cttctacact ttggccttta 98880 ggaagaggca gtgtgtgtgt tacagttaaa taggaaacaa gtagggttca tatagtgctt 98940 atggggtttt ctttggtggg gggttgctgg gtttttgggg tttttttttt tgagacaggg 99000 tatcactctg tctcccaggc tgaaatacat tggcatgctc atggctcact gcagcctcaa 99060 cctcccagac tcaagtgatc ctcccacctc agcttcccta gtagctgaga ctacaggcgt 99120 gcgccaccat gcctagctaa attttgtaca ttttgtagag atgaggcttt gccatgttgc 99180 ccaggctggt ctctaactcc tgggctcaag tgatccactt gcttcagcct cccaaagttc 99240 tgggattaac aggtgcgagc cactgcagcc agcctatatt ttaactatat gtttttttct 99300 ttttggctaa aatttttcag attagtttac aagttacaag tgtaggtgat atctcatgga 99360 gatatcaaag atgatatgaa gttagattgg gtttttaaga gtagttttta aaatacggat 99420 aaataccagt tgttggagtt ttgtttaaag ttctttaact tcttattttt gggccaaaat 99480 acaggtatac gctagaaatg atttttaaca caggtcattt atgccaaact gcattttgcc 99540 ttaatttttt tttttttttt tttttttgag agggagtctc actcattgcc caagctggag 99600 tgcaatggca cgatctcggc tcacttacaa cctccacctc ccaggttcaa gcgattctcc 99660 tgcctcagcc tcctgagtag ctgggattac aggcacctgc ctggctaatt tttgtatttt 99720 tagtggagac ggggtttcac catgttggcc aggctggtct cgaactgctg acctcaggtg 99780
<Desc/Clms Page number 101>
atccacccgc cttggcctcc caaagtgcgg ggattacagg tgtgagccac cgtgcttggc 99840 caaaattttt attaattttt ctattgcctg gactctgtga acctatccat tttgcctttt 99900 aaaaatactt aggtgtaaat atagatattc attaactcag cattgtttta atctatattt 99960 ccaaaggcaa tttaaaagat cagaaaataa gaccaaatta atataaaaat gcatacttta 100020 ggctgggcaa agtggctcac gtctgtaatc ccagcacttt gggaggccaa ggtgggcgga 100080 tcacctgagg ttaggagttc aggaccaacc tggccatcat ggcgaaaccc tgtctctact 100140 aaaaatacaa aaattagctg ggcatggagg catgtgcctg taatcccagc tactcgggag 100200 gctgagacag aagaattgct tgaaccttgg agggggaggt tgcatatctg agtggtgaaa 100260 ttgtgattct ttttttctct ttgtctgtat ttttgaactt ttctataaat gattgtgttt 100320 tgtttttata ttggaaaaat attatgcttt caaatgttaa tacctatgaa actaaacaca 100380 agtaataaat atattagtat agcatttatt aaggtttctt gtgtagcaga tcaacataga 100440 aaatatattt aaatggctga cataattttc taagaataca tacacgtata ttttttataa 100500 cattaagaaa cagcagcatc attactttaa tccatcattt cgttaaccac catatacctg 100560 ttgatcattt gtattgtcat gtgcttttta aaaatctaga tgagaaatat tcgattatct 100620 gacttcactg aatccttgaa aaaaataaaa cgcagcgtca gccctcaaac tttagaagcg 100680 tacatacgtt ggaacaagga ctttggagat accactgttt aaggaaatac ctttgtaaac 100740 ctgcagaaca ttttacttaa aagaggaaac acaagatctt caatgaacgt catcggctac 100800 agaaacagcc taagtttaca ggacttttta gagtcttaca tatttgtgca ccaaacttga 100860 agatgaacca gaaaacagac ttaaacaaaa tatacaatgc aaatgtaatt ttttgttgtt 100920 taaggccttg ccttgatggt cacagttatc ccaatggaca ctaagttaga gcacaacaaa 100980 acctgattct ggtcttcttt accaatataa tcataatgta aataataatt tgtatattgt 101040 gttgcagatg aaagtattcc aggaacagtg aatggtagaa gacacaagaa catttgtttg 101100 tttgtcttct gatgtttttt cttaaaatag taatttctcc tacttttctt ttctactgtt 101160 gtcttaacta caggtgattg gaatgccaaa cactcttaag tttattttct tttttcgttt 101220 tataaattca gtgtgccaaa tgaaactttt ttcctaagta actgtaatag gaaaaagttt 101280 attttgagag tttcttcttc ataaatctac agacattaaa caattgttgt gttcttttta 101340 ccttttattt ttctattacc ttgctaccaa acagtttaga tagcaatata atagcaaaaa 101400 agcaaatatg gtaaaataga gaaggtttga aggtttgagt tactctgtca tataacatgt 101460 agatcagtct tcatgtgacc tgcagtattt ttttttctaa tgtatttgtc agaaatctgt 101520 tgtagactgt taacttcttc ctgatggaat ttattttctg caagaattat tctgatattt 101580
<Desc/Clms Page number 102>
aagagagcca attttaactg ctgtgaaaat gtttccagtg caagagaagg gaaatactag 101640 gaactaagac atttctaatt tattgcttat tactttctta attttacagg ataattataa 101700 gcaagtggaa ctaccatctt ttattcttaa taattattaa tcccttcaat gaaactttaa 101760 aaaaactgaa tttttataca tggcatacat ttttctagtt ccttctgctt gctttattaa 101820 ctcaaaagtt ctagttctag tctgttgatc tgccttttgt tctcccaaaa tgtacagtaa 101880 ttccatttgt ttgtataaat atgcctggat tttcattata aaaatgtcat tgtagggagt 101940 agagactcat atcatggcct tttaaatatt gtaataaagg caaatagata tttgccctta 102000 gtttactggt taaaagtttg tttacagaac ttttctctgg tgcttaaatg atgctatgta 102060 aaatgtcatg agtggaaaga atatttgtag tagtaacaag aatttttcat ttaggaaaga 102120 tttcttaggt tttgaaagaa tacattaaaa taaaaaactt gcccctacta ggtaagaact 102180 ttataatgaa gacatacatt cttcttaatt ttactcttgc tcttgttaaa gatttgtttg 102240 aatatagaag atgcatgatt tctgggtttt tttttttttt tgagacagag tttcgctctt 102300 gttgcccagg ctggagtgca atggcgcaat ctcgactcac cacaacctcc gcctcccagg 102360 ttcaagcaat tctcctgcct cagcctcccg agtagctggg attacaggca tgcgccacta 102420 ccccagctaa ttttgtattt ttagtagaga tggggtttct ccatgttggt caggctggtc 102480 ttgaactcct gacctcaggt gatccgcctg cctcggcctc ccaaagtgct gggattacag 102540 gcataagcca ctgcgcccag ccagaagatg catgatttct taggatcata tgctgtttgt 102600 agccataagg taaatcatgt ctcttccaat catgactttg gaactccctg aataataaaa 102660 atgagagttg agataaatag gggaaaaaaa atttttttca agccagagct atgcatatgt 102720 taggtgatgg gtagtatccc tttaaggtct caaacattac aacatcaatt atgaaatact 102780 gataacgaaa ggtagtaatg aaatatatat gatgaaaaga attgagaagt tctaaattaa 102840 gacatttcag ttaagctcat aaaatttcat tgttttcatt taaaagatta acgttattga 102900 tacttggata actggctaat catattaaag gactatgtgg ttccagctca acttttaata 102960 tattgtctcc tttaaaacta tcatggttat aattctattg ggaaagactt ttagataaca 103020 aagatttcaa atgttaaaag agataaaagt caggttaata ctatcttaaa cactgagtca 103080 gaaaatcatt actgtataga agttgctttc ctgatcaagt ctgaacttca gctagtgcta 103140 gagaactatt ttctatgact taactctaac caagttttat tttaagctgt ttctttgata 103200 gaagggccat gaaaatagag taatgatata gtaggagata agggattggt ttggtctttt 103260 tcaataaaga tagaagttgc tgaagttttc tgaattaata atgacttaga ttgtgacctt 103320 ttagattcgg tgttgagctc tgtgttgtat tacttcctaa aagataatgc ttaaacatta 103380
<Desc/Clms Page number 103>
agcattagtg tgctcttcat gttaatatgg cagagttttg taaactaaat taaaacttac 103440 tgatatattg gactttgagc caagggaaag aatgagtact atctttccag atatcttaag 103500 ggtaaaagct tattctaaga cagtctgtcc attgagaata ttagatttct gacttgcaaa 103560 tatgtttgta ctccagaaga attagaggaa aagcagatac tagaattcta atttaattac 103620 atatacagcc gtctttgttt atagtgtaga attctttata ttttgtacaa aaactaattc 103680 ttttggtaaa atgaaccatt tacagttcgg ttttggactc tgagtcaaag gattttcctt 103740 taaatgcttg tctcaatttt agtctggtct tttgtacttt tcttcagaag aaatgaatta 103800 aagggtacag ttgcataaag tgggttttta tcctaatgta ttggaaataa atgataaact 103860 ttattttgtc tttacttttt tactttaaaa ctttttgata ttttaggggt tggagtctga 103920 taatgaagga gttgtgtgta ttggactctt agtaacaatt ataaacgctt aacaaaatat 103980 agaaagcaat gattgggtgg ctctgcagag caatcaaaac aaggtagaaa ctgcaaagtc 104040 ctataatgga agagattcag gctgggtgtg gtggctcatg cctgtttggg aggccagtat 104100 gggagaatcg cttacactca ggaattcaag accagcctgg ggaatatagg gagaccctgt 104160 ttctgccaaa aaaaaaaaaa aaaaaaaaac taaactaaaa attagccagg tttggtggcc 104220 tacacctgta gtcccggtta ctcaagaggc tgaggttaga ggatcgctta agcccgggag 104280 gaggaggttg cagtgagcca agatcacacc accacactcc agcccaggtt acagagaacc 104340 tgtctcaaaa aataaaaagt aaacgagatt caccttaacc agcttttacc catagggcaa 104400 tttccagttt gtgcagttca cttggatata gaattcaggt agaatgtgac agttttgaca 104460 ggctgaggaa tcatttggga cttctagaac acctgaaaat tagaagagaa attttgggaa 104520 ggagagtgcc tcagaaagta agctctaaaa tctgcctaca tattcctttc aaatccttgg 104580 tggattccaa aattgtgctg gtgcagtgtg attatttaaa ggaacccagg agaaagcaag 104640 ttaaagtcta aaaaactcag cagcgattgc agctgcccaa ggacagagag tttgaaattc 104700 aagttccact aagaaggact gagtaaatac ttggtgtttc ccattgaacc cccaaaatgc 104760 cacgccttaa ggaagaatga cagcatccta gaactaaagg ctgtgcttca gcactaagga 104820 caaaatggaa ataaacttac tgtaatgaag cttaaaatca aatctcacag catcaaggtt 104880 atccattagt aatttaaaac cagaacaaaa cacagcattc ttgagaagaa aacaattcag 104940 tcatcacagc atatatccaa agctcagtac ataataaaca gttactaagc atgcaaagaa 105000 aaattatgtg atccttttga ctcaacttcc ctgatggaaa aaaaaaagtg gtccatacca 105060 tactcaacag aaaatataca gaagcagatg cacaagtgac ctctatgaga gtgattttaa 105120 aatagcgtta aaatatgtta aaagaattta caagaagaga taatgggtga atagataggg 105180
<Desc/Clms Page number 104>
agtttcagca gaaaaataag aattgaaaac ccaacagagg ccaggcaccg tgcctcacgc 105240 ccgtaatcac agcactttgg gaggccaagg caggtggatc acctaaggtc aggagttcaa 105300 gaccagcctg accaacatgg tgaaacccgg tctctactaa aaatacaaaa ctagccgggc 105360 atgggtgatg catgcccata atcctagcta cttgggaggc tgaagcagga gaattgcttg 105420 aacctgggag gtagaggttg cagtgaacca agatcatgcc attgcactcc agcctgggca 105480 agaagagcaa aactccatct caaaaaataa taataataat tggctgggcg cggtggctca 105540 cgcctgtaat cccagcactt tgggaggccg agacaggcag atcacaaggt caggagattg 105600 agaccatcct ggctaacatg gtgaaacccc gtctctacta aaaatacaaa aaattagcct 105660 ggcatggtgg cgggcacctg tagtcccagc tactcgggag gctgaagcag gagaatggca 105720 tgaccccagg aggcggaact tgcaatgagc ccagatcgcg ccactgcact ccagcctggg 105780 caaccgtctc aaaaataata ataataataa ttagaaaata ataaaaaata acccactgga 105840 aagtcttgta atgaaaacta cagtatctga aattaaaaat ttaaatggat ggacttaaca 105900 gtaaactagg cacaacagga aagactgaaa aagacaagta agtatcaaac caaagcagag 105960 agagaaagaa aaaagaaata gcagaggttt gagacctttg gaacattatc agttcctgta 106020 atttgaagta aagaaggaaa ggaagagaat ggggcaagag aaatctttga agcaatgatg 106080 cgtgaaattt tccccaaagt gttgaaagac atcaacgtac agatctaaga agttcactga 106140 atccccaagc agaataaata caacaaagac tacatctggg tacatcacat tgccaaaaaa 106200 aaaaaaaaaa aaaatcttaa aagcaatcaa ggtggggagt gggaaggagt agcattacat 106260 tcagataaac aagagtgatg gctaacctca tcagaaatga tggaattaag aaaatgatgg 106320 aatgacatct ttaaggtgca aagatgaaac aaaggttaac ttaaaactct gtatccagtt 106380 aaaatatcct tcaagatgtt aaggcaatgg ccaggctcag tggcttatgc ctgtaatccc 106440 aacactttgg ggggctgaga caggagaatc ccttgaggcc atgagtgacc agcctgggca 106500 acctagtgag aaccccatca aaaaataaaa ttagctgggc atgggctgtg gtcgtgctac 106560 tgcactccag cctgggggac agagtcccta tctcttgaaa aacttaagac aaaatctttt 106620 ccagatgaaa acagaatttg ttgctggcag actgacttta tacggaatgc tttaagaaat 106680 tcttcaggct gaaggaaaat ataaatctgg agtgaaaaac gtagtatctg aaattaaaat 106740 tttccttgga tggacttatc agtaaatgga tttcccaatg ggaacctgta tctccaggat 106800 ggaattaaga attttgaaat gataaacatg ttggtaaata agaaagacat ttttcttttt 106860 tatttttcta aatatcattg ctgtttaaag caaacaaaaa tagtattgca gtgtttataa 106920 tatatgtata agtaaaatat aggacagaaa tagcatgaag ggtcagagag ggcaataaat 106980
<Desc/Clms Page number 105>
gtaattatat tgagataata ttactatatt gtacacaaag tgagatagca ttagtgtaag 107040 gtagattgtg ataagaatgc attttgtaat ctctcacccc atcactgggg tgcagtagat 107100 ctaaaaagcc attagagaag ataaaatggg tcactaagaa ttatgtgatt agtcaaatga 107160 aatcaaggaa agaaaaacag agcaaagaag tgtaagataa aacagtggga tggaagagct 107220 gaaattaata atgtcactaa attgcttacc ttcctccttc ctgaactgtt gtggattttt 107280 tttttttcag ggggttgagg ttttttttta gagacagagt ctctattgcc ccaggctgga 107340 cagcagtggc gtaatcagtc tcaaaatccc tgcagtctca aactcctggg ctcaagtgat 107400 cctcctgcct cggcctccca aaatgctggg attacaggca ggcagagcca ccacaccctg 107460 ccagaactat tgttttaaag tcattaggtg gttaagccct cgagactatg tgcaagtttg 107520 atgattcgtt aggagcactc acaggactca gcatatagtc ttattcccaa caatgattta 107580 ttagagcaaa aggatatgaa gcaaattcag caaagggaaa aaaggaatta agtgaagtcc 107640 agaggaaacc aagcaccagc ttctaagggt tctctcctaa tgaagtcaca caggatgtca 107700 ctccagcaac aagtgacagc atgtgaaagt gttaagcctc actgttagac atagtaagct 107760 tgttagggaa tagagggaat ctcccctcaa attcaagttc ccagatgcct ggcaagggcc 107820 aaccttgcca gcaggacttt ctggggatag cagtcccagg cacgtgtttg cacagtggtt 107880 cagatcaatg tgcttacatt gggtagaggg gacctatgga agtccaaatt tgggtgtcag 107940 agacctaata gggtgaagac agtgtctaca atgatggaca gctaggtatg aggtgtcagg 108000 gacagattga ggcagttatt cacatggtgg ataggggcaa cctggaatga ggaataagct 108060 caagcacaga aaggggtgtc catatggggt aagggtgtca gcagagatgg tagattggtt 108120 gcacaccaaa gacttgatgg aataaagtga atatactaac cacagagaag gtaattataa 108180 atacagaaag gggggaaact agaatgaaac ctggagttca gcttgaattg ggtttaagaa 108240 agtgaattca tggtttaaaa tctataaaaa tagatgaaat atcggctggg cacagtggct 108300 cacgcatata atcccagcac tttgggaggc cgaggcgggc agatcgcttg agatcaggag 108360 tttgagacca gcctggccaa cactgcgaaa ccccatctct agtaaaaata caaaaattag 108420 ccaggtgtgg tggtacacac ctgtagtccc agctacttgg gaggctgagg cacgagaatc 108480 acttgaacct gggaggcaga ggttgcagtg ggctgagatc gcaccactgc actccagcct 108540 gggcaacaga gcgagatcct gcctcaaata aaaatagagg acatataagc atataaatat 108600 acacgtgtgt atgtgtccaaatatgtatat tccctagtct gtccaccaag gtggccttgg 108660 agcagttatg ctccaataat aatgagcaca taaagtaccc atatcttgcc ttccaaattc 108720 ttcactgtct tagtctgctt gggctgcatt acaaaatacc atagactggg cagcttaaat 108780
<Desc/Clms Page number 106>
aacagaaatt tatcctcaca gttctagaag cttggaagtc caagattaaa gtaccagcca 108840 gtttggtttc tagtgagggc tttcttcctg gcttgcagat ggccaccttc tcaccgtgtc 108900 cttgtatggc agacagcaca agctctctgg tgtccctttt taaaagggca ttaatcccat 108960 catgacagtc ccatcctcat tatctcatct aaccctaggt acttcccaaa ggctgaatca 109020 ccaaagacca tcacattgct ggtgaaggct tcaacatatg aatttgaggg acacgaatat 109080 tcagtccata acatcaacta aaggaaccaa gactctttga taaaatggct aaattcaggg 109140 ctggggcaga gaaaatacat gagtgtggaa cttcttgtgc cagagagaaa aagtgcccaa 109200 agattgatga ggatgaatca ttgaaatgac acacagatta aaagggttcc cactggacaa 109260 atttgagcat caaaataagt aatagtagta attaattata acccatcaga agaaataaac 109320 catgagctca tgtgaatata tgaatacaaa cataaacaaa ttacaagcat aatgaggaat 109380 gtgatattta tatggtttaa aggtacctct ccaggccggg tgcagtaact ctcacctgta 109440 atcccagcac tttgggaggc caaggcaggt agatcacctg aggtcaggca tttgagacca 109500 gcctgcacaa catggtgaaa ccctgactct actaaaaata cataacgcga gccgggcgtg 109560 gtggcacgtg tctataatct gccactgatt aggtgtgtga ttttcccaag caggggataa 109620 tagtagtacc tatgtcaaag gctgttatga ggattaaatg agctaacaca taatcgtgct 109680 tttttttttt tttttttttt ttgagacaga gtcttgcact gtcgcctggg ctggagtgca 109740 atggcacgat ctcggcccac tgcaacctct gcctcccagg ttcaagtgat tctcctgcct 109800 cagcctcctg agtagctggg attacaggct cctgccacca cacctggcta ttttcaatag 109860 agacggggtt tcactatgtt ggccaggcta gtctcaaaaa cctgacctcg tgatccaccc 109920 gctttggcct cccaaagtgc tgggattaca ggcatgagcc actgcacccg gctttttttt 109980 tttttttttg agatggaatc 110000 <210> 2 <211> 3263 <212> DNA <213> Homo sapiens <400> 2 gctcctgaga ccggcgggca cacgggggtc tgtggccccc gccgtagcag tggctgccgc 60 cgtcgcttgg ttcccgtcgg tctgcgggag gcgggttatg gcggcggcgg cagtgagagc 120 tgtgaatgaa ttctccgggt ggacgaggga agaagaaagg ctccggcggc gccagcaacc 180 cggtgcctcc caggcctccg cccccttgcc tggcccccgc ccctcccgcc gccgggccgg 240 cccctccgcc cgagtcgccg cataagcgga acctgtacta tttctcctac ccgctgtttg 300 taggcttcgc gctgctgcgt ttggtcgcct tccacctggg gctcctcttc gtgtggctct 360
<Desc/Clms Page number 107>
gccagcgctt ctcccgcgcc ctcatggcag ccaagaggag ctccggggcc gcgccagcac 420 ctgcctcggc ctcggccccg gcgccggtgc cgggcggcga ggccgagcgc gtccgagtct 480 tccacaaaca ggccttcgag tacatctcca ttgccctgcg catcgatgag gatgagaaag 540 caggacagaa ggagcaagct gtggaatggt ataagaaagg tattgaagaa ctggaaaaag 600 gaatagctgt tatagttaca ggacaaggtg aacagtgtga aagagctaga cgccttcaag 660 ctaaaatgat gactaatttg gttatggcca aggaccgctt acaacttcta gagaagatgc 720 aaccagtttt gccattttcc aagtcacaaa cggacgtcta taatgacagt actaacttgg 780 catgccgcaa tggacatctc cagtcagaaa gtggagctgt tccaaaaaga aaagacccct 840 taacacacac tagtaattca ctgcctcgtt caaaaacagt tatgaaaact ggatctgcag 900 gcctttcagg ccaccataga gcacctagtt acagtggttt atccatggtt tctggagtga 960 aacagggatc tggtcctgct cctaccactc ataagggtac tccgaaaaca aataggacaa 1020 ataaaccttc tacccctaca actgctactc gtaagaaaaa agacttgaag aattttagga 1080 atgtggacag caaccttgct aaccttataa tgaatgaaat tgtggacaat ggaacagctg 1140 ttaaatttga tgatatagct ggtcaagact tggcaaaaca agcattgcaa gaaattgtta 1200 ttcttccttc tctgaggcct gagttgttca cagggcttag agctcctgcc agagggctgt 1260 tactctttgg tccacctggg aatgggaaga caatgctggc taaagcagta gctgcagaat 1320 cgaatgcaac cttctttaat ataagtgctg caagtttaac ttcaaaatac gtgggagaag 1380 gagagaaatt ggtgagggct ctttttgctg tggctcgaga acttcaacct tctataattt 1440 ttatagatga agttgatagc cttttgtgtg aaagaagaga aggggagcac gatgctagta 1500 gacgcctaaa aactgaattt ctaatagaat ttgatggtgt acagtctgct ggagatgaca 1560 gagtacttgt aatgggtgca actaataggc cacaagagct tgatgaggct gttctcaggc 1620 gtttcatcaa acgggtatat gtgtctttac caaatgagga gacaagacta cttttgctta 1680 aaaatctgtt atgtaaacaa ggaagtccat tgacccaaaa agaactagca caacttgcta 1740 gaatgactga tggatactca ggaagtgacc taacagcttt ggcaaaagat gcagcactgg 1800 gtcctatccg agaactaaaa ccagaacagg tgaagaatat gtctgccagt gagatgagaa 1860 atattcgatt atctgacttc actgaatcct tgaaaaaaat aaaacgcagc gtcagccctc 1920 aaactttaga agcgtacata cgttggaaca aggactttgg agataccact gtttaaggaa 1980 atacctttgt aaacctgcag aacattttac ttaaaagagg aaacacaaga tcttcaatga 2040 acgtcatcgg ctacagaaac agcctaagtt tacaggactt tttagagtct tacatatttg 2100 tgcaccaaac ttgaagatga accagaaaac agacttaaac aaaatataca atgcaaatgt 2160
<Desc/Clms Page number 108>
aattttttgt tgtttaaggc cttgccttga tggtcacagt tatcccaatg gacactaagt 2220 tagagcacaa caaaacctga ttctggtctt ctttaccaat ataatcataa tgtaaataat 2280 aatttgtata ttgtgttgca gatgaaagta ttccaggaac agtgaatggt agaagacaca 2340 agaacatttg tttgtttgtc ttctgatgtt ttttcttaaa atagtaattt ctcctacttt 2400 tcttttctac tgttgtctta actacaggtg attggaatgc caaacactct taagtttatt 2460 ttcttttttc gttttataaa ttcagtgtgc caaatgaaac ttttttccta agtaactgta 2520 ataggaaaaa gtttattttg agagtttctt cttcataaat ctacagacat taaacaattg 2580 ttgtgttctt tttacctttt atttttctat taccttgcta ccaaacagtt tagatagcaa 2640 tataatagca aaaaagcaaa tatggtaaaa tagagaaggt ttgaaggttt gagttactct 2700 gtcatataac atgtagatca gtcttcatgt gacctgcagt attttttttt ctaatgtatt 2760 tgtcagaaat ctgttgtaga ctgttaactt cttcctgatg gaatttattt tctgcaagaa 2820 ttattctgat atttaagaga gccaatttta actgctgtga aaatgtttcc agtgcaagag 2880 aagggaaata ctaggaacta agacatttct aatttattgc ttattacttt cttaatttta 2940 caggataatt ataagcaagt ggaactacca tcttttattc ttaataatta ttaatccctt 3000 caatgaaact ttaaaaaaac tgaattttta tacatggcat acatttttct agttccttct 3060 gcttgcttta ttaactcaaa agttctagtt ctagtctgtt gatctgcctt ttgttctccc 3120 aaaatgtaca gtaattccat ttgtttgtat aaatatgcct ggattttcat tataaaaatg 3180 tcattgtagg gagtagagac tcatatcatg gccttttaaa tattgtaata aaggcaaata 3240 gatatttgcc cttagtttac tgg 3263 <210> 3 <211> 616 <212> PRT <213> Homo sapiens <400> 3 Met Asn Ser Pro Gly Gly Arg Gly Lys Lys Lys Gly Ser Gly Gly Ala
1 10 15 Ser Asn Pro Val Pro Pro Arg Pro Pro Pro Pro Cys Leu Ala Pro Ala
20 25 30 Pro Pro Ala Ala Gly Pro Ala Pro Pro Pro Glu Ser Pro His Lys Arg
35 40 45 Asn Leu Tyr Tyr Phe Ser Tyr Pro Leu Phe Val Gly Phe Ala Leu Leu
50 55 60 Arg Leu Val Ala Phe His Leu Gly Leu Leu Phe Val Trp Leu Cys Gln
65 70 75 80
<Desc/Clms Page number 109>
Arg Phe Ser Arg Ala Leu Met Ala Ala Lys Arg Ser Ser Gly Ala Ala
85 90 95 Pro Ala Pro Ala Ser Ala Ser Ala Pro Ala Pro Val Pro Gly Gly Glu
100 105 110 Ala Glu Arg Val Arg Val Phe His Lys Gln Ala Phe Glu Tyr Ile Ser
115 120 125 Ile Ala Leu Arg Ile Asp Glu Asp Glu Lys Ala Gly Gln Lys Glu Gln
130 135 140 Ala Val Glu Trp Tyr Lys Lys Gly Ile Glu Glu Leu Glu Lys Gly Ile 145 150 155 160 Ala Val Ile Val Thr Gly Gln Gly Glu Gln Cys Glu Arg Ala Arg Arg
165 170 175 Leu Gln Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu
180 185 190 Gln Leu Leu Glu Lys Met Gln Pro Val Leu Pro Phe Ser Lys Ser Gln
195 200 205 Thr Asp Val Tyr Asn Asp Ser Thr Asn Leu Ala Cys Arg Asn Gly His
210 215 220 Leu Gln Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr 225 230 235 240 His Thr Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Met Lys Thr Gly
245 250 255 Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Tyr Ser Gly Leu
260 265 270 Ser Met Val Ser Gly Val Lys Gln Gly Ser Gly Pro Ala Pro Thr Thr
275 280 285 His Lys Gly Thr Pro Lys Thr Asn Arg Thr Asn Lys Pro Ser Thr Pro
290 295 300 Thr Thr Ala Thr Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val 305 310 315 320 Asp Ser Asn Leu Ala Asn Leu Ile Met Asn Glu Ile Val Asp Asn Gly
325 330 335 Thr Ala Val Lys Phe Asp Asp Ile Ala Gly Gln Asp Leu Ala Lys Gln
340 345 350 Ala Leu Gln Glu Ile Val Ile Leu Pro Ser Leu Arg Pro Glu Leu Phe
355 360 365 Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro
370 375 380 Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn 385 390 395 400
<Desc/Clms Page number 110>
Ala Thr Phe Phe Asn Ile Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val
405 410 415 Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu
420 425 430 Leu Gln Pro Ser Ile Ile Phe Ile Asp Glu Val Asp Ser Leu Leu Cys
435 440 445 Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu
450 455 460 Phe Leu Ile Glu Phe Asp Gly Val Gln Ser Ala Gly Asp Asp Arg Val 465 470 475 480 Leu Val Met Gly Ala Thr Asn Arg Pro Gln Glu Leu Asp Glu Ala Val
485 490 495 Leu Arg Arg Phe Ile Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu
500 505 510 Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gln Gly Ser Pro
515 520 525 Leu Thr Gln Lys Glu Leu Ala Gln Leu Ala Arg Met Thr Asp Gly Tyr
530 535 540 Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro 545 550 555 560 Ile Arg Glu Leu Lys Pro Glu Gln Val Lys Asn Met Ser Ala Ser Glu
565 570 575 Met Arg Asn Ile Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys Ile
580 585 590 Lys Arg Ser Val Ser Pro Gln Thr Leu Glu Ala Tyr Ile Arg Trp Asn
595 600 605 Lys Asp Phe Gly Asp Thr Thr Val
610 615 <210> 4 <211> 23 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 4 cggagctcct cttggctgcc atg <210> 5 <211> 26 <212> ADN <213> Artificial Sequence <220>
<Desc/Clms Page number 111>
<223> Amorce <400> 5 agaagcgctg gcagagccac acgaag 26 <210> 6 <211> 27 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 6 aaggcgacca aacgcagcag cgcgaag 27 <210> 7 <211> 26 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 7 aggagcaagc tgtggaatgg tataag 26 <210> 8 <211> 27 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 8 tggttatggc caaggaccgc ttacaac 27 <210> 9 <211> 26 <212> ADN <213> Artificial Séquence <220> <223> Amorce <400> 9 caaacggacg tctataatga cagtac 26 <210> 10 <211> 25 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 10 ttaggaatgt ggacagcaac cttgc 25
<Desc/Clms Page number 112>
<210> 11 <211> 25 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 11 cttctctgag gcctgagttg ttcac 25 <210> 12 <211> 27 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 12 tgctagaatg actgatggat actcagg 27 <210> 13 <211> 24 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 13 agatgcagca ctgggtccta tccg 24 <210> 14 <211> 26 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 14 atgaacgtca tcggctacag aaacag 26 <210> 15 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 15 tagcagtggc tgccgccgt 19 <210> 16 <211> 20 <212> ADN <213> Artificial Sequence
<Desc/Clms Page number 113>
<220> <223> Amorce <400> 16 aagcggtcct tggccataac 20 <210> 17 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 17 ggcggcagtg agagctgtg 19 <210> 18 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 18 ctagctcttt cacactgttc 20 <210> 19 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 19 aacaggcctt cgagtacatc 20 <210> 20 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 20 ctgtgaacaa ctcaggcctc 20 <210> 21 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 21
<Desc/Clms Page number 114>
atgagaaagc aggacagaag 20 <210> 22 <211> 18 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 22 tgccaagtct tgaccagc 18 <210> 23 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 23 ctacaactgc tactcgtaag 20 <210> 24 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 24 cagtgctgca tcttttgcc 19 <210> 25 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 25 taggaatgtg gacagcaacc 20 <210> 26 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 26 aaagctgtta ggtcacttcc 20 <210> 27 <211> 20
<Desc/Clms Page number 115>
<212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 27 tggagatgac agagtacttg 20 <210> 28 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 28 ctggaatact ttcatctgc 19 <210> 29 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 29 atgaggctgt tctcaggcg 19 <210> 30 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 30 gtgagccgaa ctgcacattg 20 <210> 31 <211> 21 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 31 caaagtcgac agctacagtg c 21 <210> 32 <211> 20 <212> ADN <213> Artificial Sequence <220>
<Desc/Clms Page number 116>
<223> Amorce <400> 32 ggaactgtag ttgagtggga 20 <210> 33 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 33 agatgaggct ccgacctac 19 <210> 34 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 34 aatgccacac ttgtaatctc 20 <210> 35 <211> 22 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 35 tgtgaatata tcataatttg gg 22 <210> 36 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 36 tacagcagtt ctcatgatg 19 <210> 37 <211> 21 <212> ADN <213> Artificial Séquence <220> <223> Amorce <400> 37 gaccaaattg gtgcatgcat g 21
<Desc/Clms Page number 117>
<210> 38 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 38 acatttccaa tacatcccac 20 <210> 39 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 39 atttgtcatt tcacatgcac 20 <210> 40 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 40 ttagaatgac tatacctgac 20 <210> 41 <211> 18 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 41 tcaggttaag taagactc 18 <210> 42 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 42 ttcctatcta cctagtgac 19 <210> 43 <211> 20 <212> ADN <213> Artificial Sequence
<Desc/Clms Page number 118>
<220> <223> Amorce <400> 43 ttttatagca agttgccctg 20 <210> 44 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 44 cctatgaaga tcctggtac 19 <210> 45 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 45 tgtcatgatt ctaacaaggg 20 <210> 46 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 46 tctatttcac tcctgacatg 20 <210> 47 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 47 gtcatagggc ttaggcttc 19 <210> 48 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 48
<Desc/Clms Page number 119>
atcatactac ccacttttcc 20 <210> 49 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 49 tgtttgggaa gatgctactg 20 <210> 50 <211> 21 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 50 ctactgaaga taacgtacat g 21 <210> 51 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 51 cattgattgc catgtattgg 20 <210> 52 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 52 agaaggccag aaatactcag 20 <210> 53 <211> 22 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 53 gtacttaaat cggtaaatat gg 22 <210> 54 <211> 20
<Desc/Clms Page number 120>
<212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 54 ctcaagtctt aggaatgcag 20 <210> 55 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 55 gcacttaacc aggctgtatg 20 <210> 56 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 56 ctcagatgac tcacatagc 19 <210> 57 <211> 22 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 57 ctttactaga ctaattctcc tg 22 <210> 58 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 58 cagattcaag aagacagatc 20 <210> 59 <211> 20 <212> ADN <213> Artificial Sequence <220>
<Desc/Clms Page number 121>
<223> Amorce <400> 59 gcaataattc accacacttg 20 <210> 60 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 60 ggtagttctt gtttctgctc 20 <210> 61 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 61 caagtgtggt gaattattgc 20 <210> 62 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 62 gagctgaaaa gtattcagc 19 <210> 63 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 63 tgcaaaggac atagccagtg 20 <210> 64 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 64 agcctctgga gatagtatgc 20
<Desc/Clms Page number 122>
<210> 65 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 65 ctagaacagg ggtcacagtc 20 <210> 66 <211> 18 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 66 ttggacttct taaacttc 18 <210> 67 <211> 21 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 67 gcagtatgca agaaattgaa c 21 <210> 68 <211> 19 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 68 ggcctgtaat tttcttctg 19 <210> 69 <211> 21 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 69 gtactgaata gatacatgta g 21 <210> 70 <211> 19 <212> ADN <213> Artificial Sequence
<Desc/Clms Page number 123>
<220> <223> Amorce <400> 70 gtgtagcaga tcaacatag 19 <210> 71 <211> 20 <212> ADN <213> Artificial Sequence <220> <223> Amorce <400> 71 catcttcaag tttggtgcac 20 <210> 72 <211> 1689 <212> ADN <213> souris <220> <223> ADN Spg4 incomplet.
<400> 72 aggccgagag cgtccgcgtc ttccacaagc aggccttcga gtacatctcc attgccctgc 60 gcatcgacga ggaagagaaa gcaggacaga aggaacaagc tgtggaatgg tataagaaag 120 gtatcgaaga actggaaaaa ggaatcgctg ttatagttac gggccaaggt gaacagtatg 180 aaagagctag acgtcttcaa gccaaaatga tgactaattt agttatggcc aaggaccgtt 240 tacaacttct agagaagctg caaccagttt tgcaattttc caagtcacag acggacgtct 300 ataacgagag tactaacctg acatgccgca atggacatct ccagtcagaa agtggagcag 360 ttccgaagag gaaagacccc ttaacacatg ctagtaattc attgcctcga tcaaaaactg 420 tcctgaaaag tggctccgca gggctctccg gtcaccacag ggcgcctagt tgcagtggtt 480 tgtccatggt ttctggagca agaccgggac ctggtcctgc agctaccaca cataagggta 540 ctccaaaacc aaatagaacc aacaaacctt ctactcccac aactgcagtt cggaaaaaga 600 aagacttgaa aaattttagg aatgtggaca gcaatcttgc taaccttata atgaatgaaa 660 ttgttgacaa tgggacagct gttaagtttg atgacatagc cgggcaggag ctggcaaagc 720 aagcgctgca ggagattgtc atccttcctt ctctgcggcc tgagttgttc acagggctca 780 gagctcctgc tagaggcttg ttactcttcg gtccgccagg aaacggaaaa acaatgctgg 840 ctaaagcagt agctgcagag tctaatgcga cctttttcaa cataagtgct gccagtttaa 900 cttcaaaata tgtgggagaa ggagagaaat tggtgagagc tctctttgct gtggctcgag 960 aacttcaacc atctataatt tttatagatg aagttgacag tcttttgtgt gagagacggg 1020 aaggggagca cgacgctagc agacggctaa agacggaatt tttaatagaa tttgacgggg 1080 tgcaatctgc tggagatgac agagtacttg taatgggtgc aactaacagg ccccaagagc 1140 ttgatgaagc tgttctcagg cgtttcatta aacgggtata tgtgtcctta ccaaatgagg 1200 agacaagact ccttctgctt aaaaacctgt tgtgtaaaca aggaagtcca ctgacccaaa 1260 aagaactcgc acagcttgct agaatgaccg atggatactc tggaagtgat ctgaccgctt 1320 tggccaagga tgcagccctg ggtcctatcc gagaactgaa gccagagcag gtgaagaata 1380 tgtctgccag tgagatgaga aatattcgat tatctgactt cacagaatcc ttaaaaaaga 1440 taaaacgcag tgtgagtcct cagaccttag aagcatacat acgctggaac aaggattttg 1500 gagacaccac tgtttaaagg aatggatgcc tctgtgagcc catagaacat cgcacttcac 1560 aggaaacaag agctttggct acaggaaccc agacttcgtt tacaggacgt tttagagttt 1620 tcatttttgt gcaccaaact tgaagaggaa caagaagaca gacctaaata aaatatgcaa 1680 tatgaatgg 1689 <210> 73 <211> 504 <212> PRT
<Desc/Clms Page number 124>
<213> souris <220> <223> Spastin murine incomplète.
<400> 73 Ala Glu Ser Val Arg Val Phe His Lys Gln Ala Phe Glu Tyr Ile Ser 1 5 10 15 Ile Ala Leu Arg Ile Asp Glu Glu Glu Lys Ala Gly Gln Lys Glu Gln
20 25 30 Ala Val Glu Trp Tyr Lys Lys Gly Ile Glu Glu Leu Glu Lys Gly Ile
35 40 45 Ala Val Ile Val Thr Gly Gln Gly Glu Gln Tyr Glu Arg Ala Arg Arg
50 55 60 Leu Gln Ala Lys Met Met Thr Asn Leu Val Met Ala Lys Asp Arg Leu
65 70 75 80 Gln Leu Leu Glu Lys Leu Gln Pro Val Leu Gln Phe Ser Lys Ser Gln
85 90 95 Thr Asp Val Tyr Asn Glu Ser Thr Asn Leu Thr Cys Arg Asn Gly His
100 105 110 Leu Gln Ser Glu Ser Gly Ala Val Pro Lys Arg Lys Asp Pro Leu Thr
115 120 125 His Ala Ser Asn Ser Leu Pro Arg Ser Lys Thr Val Leu Lys Ser Gly
130 135 140 Ser Ala Gly Leu Ser Gly His His Arg Ala Pro Ser Cys Ser Gly Leu 145 150 155 160 Ser Met Val Ser Gly Ala Arg Pro Gly Pro Gly Pro Ala Ala Thr Thr
165 170 175 His Lys Gly Thr Pro Lys Pro Asn Arg Thr Asn Lys Pro Ser Thr Pro
180 185 190 Thr Thr Ala Val Arg Lys Lys Lys Asp Leu Lys Asn Phe Arg Asn Val
195 200 205 Asp Ser Asn Leu Ala Asn Leu Ile Met Asn Glu Ile Val Asp Asn Gly
210 215 220 Thr Ala Val Lys Phe Asp Asp Ile Ala Gly Gln Glu Leu Ala Lys Gln 225 230 235 240 Ala Leu Gln Glu Ile Val Ile Leu Pro Ser Leu Arg Pro Glu Leu Phe
245 250 255 Thr Gly Leu Arg Ala Pro Ala Arg Gly Leu Leu Leu Phe Gly Pro Pro
260 265 270 Gly Asn Gly Lys Thr Met Leu Ala Lys Ala Val Ala Ala Glu Ser Asn
275 280 285
<Desc/Clms Page number 125>
Ala Thr Phe Phe Asn Ile Ser Ala Ala Ser Leu Thr Ser Lys Tyr Val
290 295 300 Gly Glu Gly Glu Lys Leu Val Arg Ala Leu Phe Ala Val Ala Arg Glu 305 310 315 320 Leu Gln Pro Ser Ile Ile Phe Ile Asp Glu Val Asp Ser Leu Leu Cys
325 330 335 Glu Arg Arg Glu Gly Glu His Asp Ala Ser Arg Arg Leu Lys Thr Glu
340 345 350 Phe Leu Ile Glu Phe Asp Gly Val Gln Ser Ala Gly Asp Asp Arg Val
355 360 365 Leu Val Met Gly Ala Thr Asn Arg Pro Gln Glu Leu Asp Glu Ala Val
370 375 380 Leu Arg Arg Phe Ile Lys Arg Val Tyr Val Ser Leu Pro Asn Glu Glu 385 390 395 400 Thr Arg Leu Leu Leu Leu Lys Asn Leu Leu Cys Lys Gln Gly Ser Pro
405 410 415 Leu Thr Gln Lys Glu Leu Ala Gln Leu Ala Arg Met Thr Asp Gly Tyr
420 425 430 Ser Gly Ser Asp Leu Thr Ala Leu Ala Lys Asp Ala Ala Leu Gly Pro
435 440 445 Ile Arg Glu Leu Lys Pro Glu Gln Val Lys Asn Met Ser Ala Ser Glu
450 455 460 Met Arg Asn Ile Arg Leu Ser Asp Phe Thr Glu Ser Leu Lys Lys Ile 465 470 475 480 Lys Arg Ser Val Ser Pro Gln Thr Leu Glu Ala Tyr Ile Arg Trp Asn
485 490 495 Lys Asp Phe Gly Asp Thr Thr Val
500 <210> 74 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 74 attttttatt ttaaagcagg acag 24 <210> 75 <211> 24 <212> ADN <213> Homo sapiens
<Desc/Clms Page number 126>
<220> <223> Site accepteur d'épissage du gène SPG4.
<400> 75 aatttttttc tttcaggtga acag 24 <210> 76 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 76 cttctctgtt gcatagagaa gatg 24 <210> 77 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 77 actttttcct tgtcagaaag tgga 24 <210> 78 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 78 ttttgtatcc tttaagggta ctcc 24 <210> 79 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 79 aggtcttgtt tcttagtgga acag 24 <210> 80 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<Desc/Clms Page number 127>
<400> 80 agtatatatt ttttagttgt tcac 24 <210> 81 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 81 cttgtgattt ttaaaggcta aagc 24 <210> 82 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 82 taatgctttg ttttaggtgg gaga 24 <210> 83 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 83 cttgtatttc ctctagatga agtt 24 <210> 84 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 84 gattttttgc ttgtaggtac agtc 24 <210> 85 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 85 ggattttttt ttttaggcgt ttca 24
<Desc/Clms Page number 128>
<210> 86 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 86 ttttaatatt tttcagacaa gact 24 <210> 87 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 87 tccttccctt cctcagaatg actg 24 <210> 88 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 88 cttttatgtt ttacagaact aaaa 24 <210> 89 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site accepteur d'épissage du gène SPG4.
<400> 89 ctttttaaaa atctagatga gaaa 24 <210> 90 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 90 tgagaaaggt aactaggggg ctgg 24 <210> 91 <211> 24 <212> ADN <213> Homo sapiens
<Desc/Clms Page number 129>
<220> <223> Site donneur d'épissage du gène SPG4.
<400> 91 aggacaaggt aagattgtat ttgt 24 <210> 92 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 92 acttctaggt atcaattaat gtat 24 <210> 93 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 93 ccagtcaggt gggtttaggt taac 24 <210> 94 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 94 ctcataaggt attctgggac agta 24 <210> 95 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 95 gtggacaagt aagttttgcc atct 24 <210> 96 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<Desc/Clms Page number 130>
<400> 96 ggcctgaggt aagaacttta tatt 24 <210> 97 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 97 caatgctggt aagggttctc ttca 24 <210> 98 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 98 caaaatacgt gagtgctctg tttc 24 <210> 99 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 99 ttttataggt aagaacatat tttc 24 <210> 100 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 100 ttgatggtgt aagtgttgat tatg 24 <210> 101 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 101 gttctcaggt agggagattt atat 24
<Desc/Clms Page number 131>
<210> 102 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 102 atgaggaggt atgtatctgt gttt 24 <210> 103 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 103 cttgctaggt gagtaatttg gatt 24 <210> 104 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 104 tatccgaggt aggtatacaa gage 24 <210> 105 <211> 24 <212> ADN <213> Homo sapiens <220> <223> Site donneur d'épissage du gène SPG4.
<400> 105 ccagtgaggt atagtatttt acaa 24

Claims (32)

REVENDICATIONS
1. Acide nucléique purifié ou isolé du gène SPG4, caractérisé en ce qu'il comprend au moins 15 nucléotides consécutifs d'une séquence choisie parmi le groupe comprenant la séquence SEQ ID No. 1, les séquences nucléiques homologues ou variantes de l'acide nucléique de séquence SEQ ID No. 1, leur séquence complémentaire et la séquence de leur ARN correspondant.
2. Acide nucléique purifié ou isolé selon la revendication 1, caractérisé en ce qu'il comprend une séquence choisie parmi le groupe comprenant la séquence SEQ ID No. 1, la séquence SEQ ID No. 2, la séquence SEQ ID No. 72, les séquences nucléiques homologues ou variantes des séquences SEQ ID No. 1, SEQ ID No. 2 ou SEQ ID No. 72, leur séquence complémentaire et la séquence de leur ARN correspondant.
3. Acide nucléique purifié ou isolé selon la revendication 1 ou 2, caractérisé en ce qu'il comprend une mutation correspondant à un polymorphisme naturel chez l'Homme.
4. Sonde ou amorce, caractérisée en ce qu'elle comprend une séquence d'un acide nucléique selon l'une des revendications 1 à 3.
5. Sonde ou amorce selon la revendication 4, caractérisée en ce que sa séquence est choisie parmi les séquences SEQ ID No. 4 à SEQ ID No. 71.
6. Site accepteur ou donneur d'épissage, caractérisé en ce qu'il comprend une séquence d'un acide nucléique selon la revendication 1 choisie parmi les séquences SEQ ID No. 74 à SEQ ID No. 105.
7. Méthode pour le criblage de banques d'ADNc ou d'ADN génomique ou pour le clonage d'ADNc ou génomique isolé codant pour la spastin, caractérisée en ce qu'elle met en #uvre une séquence nucléique selon l'une des revendications 1 à 6.
8. Méthode selon la revendication 7, pour l'identification de la séquence génomique ou de l'ADNc du gène SPG4 de mammifère, notamment de souris.
9. Méthode pour l'identification de mutation portée par le gène SPG4 humain, caractérisée en ce qu'elle met en #uvre une séquence nucléique selon l'une des revendications 1 à 6.
10. Méthode selon la revendication 9, pour l'identification de mutation responsable de la paraplégie spastique familiale autosomique dominante.
11. Méthode pour l'identification des séquences d'acide nucléique promotrices et/ou régulatrices de l'expression du gène SPG4, caractérisée en ce qu'elle met en #uvre une séquence nucléique selon l'une des revendications 1 à 6.
<Desc/Clms Page number 133>
12. Acide nucléique identifié par une méthode selon l'une des revendications 8 à 11.
13. Polypeptide codé par un acide nucléique selon l'une des revendications 1 à 3 et 12.
14. Polypeptide selon la revendication 13, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant la séquence SEQ ID No. 3, la séquence SEQ ID No. 73, les séquences de polypeptides homologues et variants du polypeptide de séquence SEQ ID No. 3 ou SEQ ID No. 73, et les séquences de leurs fragments d'au moins 10 acides aminés consécutifs.
15. Polypeptide selon la revendication 14, caractérisé en ce qu'il comprend une séquence d'acides aminés choisie parmi le groupe comprenant la séquence SEQ ID No. 3 et la séquence SEQ ID No. 73, lesquelles séquences portant au moins une des mutations correspondant à un polymorphisme naturel chez l'Homme, et les séquences de leurs fragments d'au moins 10 acides aminés consécutifs.
16. Vecteur de clonage et/ou d'expression contenant une séquence d'acide nucléique selon l'une des revendications 1 à 3, et 12.
17. Vecteur selon la revendication 16, caractérisé en ce qu'il comporte les éléments necessaires à son expression dans une cellule hôte.
18. Cellule hôtetransformée parun vecteur selon la revendication 16 ou 17.
19. Mammifère, excepté l'Homme, caractérisé en ce qu'il comprend une cellule selon la revendication 18.
20. Mammifère, excepté l'Homme, selon la revendication 19, comprenant une cellule transformée, caractérisé en ce que la séquence de l'un au moins des deux allèles du gène SPG4 contient une au moins des mutations correspondant à un polymorphisme naturel chez l'Homme ou identifiées par une méthode selon la revendication 9 ou 10.
21. Utilisation d'une séquence d'acide nucléique selon l'une des revendications 4,5 et 12 comme sonde ou amorce, pour la détection et/ou l'amplification de séquences d'acide nucléique.
22. Utilisation d'une séquence d'acide nucléique selon l'une des revendications 1 à 6, et 12, pour le criblage de banque génomique ou d'ADNc.
23. Utilisation d'une séquence d'acide nucléique selon l'une des revendications 1 à 3, et 12, pour la production d'un polypeptide recombinant ou synthétique.
<Desc/Clms Page number 134>
24. Méthode de production d'un polypeptide recombinant, caractérisée en ce que l'on cultive une cellule transformée selon la revendication 18 dans des conditions permettant l'expression dudit polypeptide recombinant et que l'on récupère ledit polypeptide recombinant.
25. Polypeptide, caractérisé en ce qu'il est obtenu par une méthode selon la revendication 24.
26. Anticorps mono- ou polyclonaux ou leurs fragments, anticorps chimériques ou immunoconjugués, caractérisés en ce qu'ils sont capables de reconnaître spécifiquement un polypeptide selon l'une des revendications 13 à 15, et 25.
27. Méthode pour la détection et/ou la purification d'un polypeptide selon l'une des revendications 13 à 15, et 25, caractérisée en ce qu'elle met en oeuvre un anticorps selon la revendication 26.
28. Méthode de diagnostic génotypique de la PSF-AD associée au gène SPG4, caractérisée en ce que l'on met en #uvre une séquence d'acide nucléique selon l'une des revendications 1 à 6, et 12.
29. Méthode de diagnostic génotypique de PSF-AD associée à la présence d'au moins une mutation sur une séquence du gène SPG4 à partir d'un prélèvement biologique d'un patient, caractérisée en ce qu'elle comporte les étapes suivantes : a) le cas échéant, isolement de l'ADN génomique à partir de l'échantillon biologique à analyser, ou obtention d'ADNc à partir de l'ARN de l'échantillon biologique ; b) amplification spécifique de ladite séquence d'ADN du gène SPG4 susceptible de contenir une mutation à l'aide d'amorces selon l'une des revendications 4 et 5 ou d'un acide nucléique selon la revendication 12 ; c) analyse des produits d'amplification obtenus et comparaison de leur séquence avec la séquence normale correspondante du gène SPG4.
30. Méthode de diagnostic de la PSF-AD associée à une expression anormale d'un polypeptide codé par le gène SPG4, caractérisée en ce que l'on met en contact un ou des anticorps selon la revendication 26 avec le matériel biologique à tester, dans des conditions permettant la formation éventuelle de complexes immunologiques spécifiques entre ledit polypeptide et le ou lesdits anticorps, et en ce que l'on détecte et/ou quantifie les complexes immunologiques éventuellement formés.
31. Méthode de sélection d'un composé chimique ou biochimique capable d'interagir directement ou indirectement avec un polypeptide selon l'une des revendications 13 à 15, et 25, ou avec un acide nucléique selon l'une des
<Desc/Clms Page number 135>
revendications 1 à 6, et 12, et/ou permettant de moduler l'expression ou l'activité de ces polypeptides, caractérisée en ce qu'elle comprend la mise en contact d'une séquence d'acide nucléique selon l'une des revendications 1 à 6, et 12, d'un polypeptide selon l'une des revendications 13 à 15, et 25, d'un vecteur selon l'une des revendications 16 et 17, d'une cellule selon la revendication 18, d'un mammifère selon l'une des revendications 19 et 20 ou d'un anticorps selon la revendication 26, avec un composé candidat et, la détection d'une modification de l'activité dudit polypeptide.
32. Utilisation d'une séquence d'acide nucléique selon l'une des revendications 1 à 6, et 12, d'un polypeptide selon l'une des revendications 13 à 15, et 25, d'un vecteur selon l'une des revendications 16 et 17, d'une cellule selon la revendication 18, d'un mammifère selon l'une des revendications 19 et 20 ou d'un anticorps selon la revendication 26, pour l'étude de l'expression ou de l'activité du gène SPG4.
FR9911097A 1999-09-03 1999-09-03 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante Expired - Lifetime FR2798138B1 (fr)

Priority Applications (8)

Application Number Priority Date Filing Date Title
FR9911097A FR2798138B1 (fr) 1999-09-03 1999-09-03 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
US09/830,902 US6924126B1 (en) 1999-09-03 2000-09-04 Cloning, expression and characterization of the SPG4 gene responsible for the most frequent form of autosomal spastic paraplegia
CA2848454A CA2848454C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante.
CA2348657A CA2348657C (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
JP2001521734A JP2003508074A (ja) 1999-09-03 2000-09-04 最も一般的な形態の常染色体性優性遺伝性痙性対麻痺に応答し得るspg遺伝子のクローニング、発現および同定
PCT/FR2000/002433 WO2001018198A1 (fr) 1999-09-03 2000-09-04 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
US11/155,492 US20050266479A1 (en) 1999-09-03 2005-06-20 Cloning, expression and characterization of the SPG4 gene responsible for the most common form of autosomal dominant spastic paraplegia
JP2011158305A JP5965594B2 (ja) 1999-09-03 2011-07-19 最も一般的な形態の常染色体性優性遺伝性痙性対麻痺に応答し得るspg遺伝子のクローニング、発現および同定

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9911097A FR2798138B1 (fr) 1999-09-03 1999-09-03 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante

Publications (2)

Publication Number Publication Date
FR2798138A1 true FR2798138A1 (fr) 2001-03-09
FR2798138B1 FR2798138B1 (fr) 2004-05-21

Family

ID=9549552

Family Applications (1)

Application Number Title Priority Date Filing Date
FR9911097A Expired - Lifetime FR2798138B1 (fr) 1999-09-03 1999-09-03 Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante

Country Status (5)

Country Link
US (2) US6924126B1 (fr)
JP (2) JP2003508074A (fr)
CA (2) CA2348657C (fr)
FR (1) FR2798138B1 (fr)
WO (1) WO2001018198A1 (fr)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2647224C (fr) * 2006-03-30 2015-12-29 Duke University Identification d'un nouveau gene sous-tendant la paraplegie spastique familiale
EP1897891A1 (fr) 2006-09-11 2008-03-12 Institut National De La Sante Et De La Recherche Medicale (Inserm) Diagnose de paraplégie spastique héréditaire par detection d' une mutation dans le gene où la protéine KIAA1840
WO2009127211A1 (fr) * 2008-04-14 2009-10-22 Aarhus Universitet Procédés et kits de dépistage d'une démyélinisation spinale
JP6208104B2 (ja) * 2014-09-16 2017-10-04 株式会社日立製作所 生体認証システム、生体認証処理装置、生体認証方法、生体情報取得端末および情報端末
KR101889072B1 (ko) 2017-09-15 2018-08-16 한국생명공학연구원 디지털 PCR을 이용한 유전성 강직성 대마비(Hereditary spastic paraplegia, HSP) 관련 유전자 SPG4의 거대결손 검증법
CN117820470B (zh) * 2024-03-04 2024-05-31 暨南大学 人源性重组抗Spastin抗体及其制备方法和应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6197551B1 (en) * 1998-01-27 2001-03-06 Millennium Pharmaceuticals, Inc. Spoil-1 protein and nucleic acid molecules and uses therefor
JP4271735B2 (ja) * 1997-04-15 2009-06-03 メルク アンド カンパニー,インコーポレイティド 新規のldl−レセプター
AU756384B2 (en) * 1998-02-23 2003-01-09 Dana-Farber Cancer Institute, Inc. Method for identifying mismatch repair glycosylase reactive sites, compound and uses thereof

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DATABASE EMBL 4 August 1999 (1999-08-04), OHARA O.: "Homo sapiens mRNA for KIAA1083 protein", XP002140994 *
HAZAN J. ET AL.: "Spastin, a new AAA protein, is altered in the most frequent form of autosomal dominant spastig paraplegia", NAT. GENET., vol. 23, November 1999 (1999-11-01), pages 296 - 303, XP000914979 *
HEINZLEF O. ET AL.: "Mapping of a complicated familial spastic paraplegia to locus SPG4 on chromosome 2p", J. MED. GENET., vol. 35, no. 2, February 1998 (1998-02-01), pages 89 - 93, XP000914971 *
KIKUNO R. ET AL.: "Prediction of the coding sequences of unidentfied human genes. XIV. The complete sequences of 100 cDNA clones from brain which code for large proteins in vitro.", DNA RES., vol. 6, 30 June 1999 (1999-06-30), pages 197 - 205, XP000852618 *

Also Published As

Publication number Publication date
JP5965594B2 (ja) 2016-08-10
CA2848454A1 (fr) 2001-03-15
FR2798138B1 (fr) 2004-05-21
CA2348657C (fr) 2014-07-08
WO2001018198A1 (fr) 2001-03-15
CA2848454C (fr) 2018-04-17
US6924126B1 (en) 2005-08-02
JP2011254824A (ja) 2011-12-22
JP2003508074A (ja) 2003-03-04
US20050266479A1 (en) 2005-12-01
CA2348657A1 (fr) 2001-03-15

Similar Documents

Publication Publication Date Title
RU2735551C2 (ru) Композиции для модулирования экспрессии тау-белка
AU2023202878A1 (en) Methods for targeted insertion of DNA in genes
AU2016325030A1 (en) Novel biomarkers and methods of treating cancer
US20030235847A1 (en) Association of polymorphisms in the SOST gene region with bone mineral density
CN1423696A (zh) 人类精神分裂症基因
WO2006022629A1 (fr) Procédés d’identification de risque de diabète de type ii et leurs traitements
IL179831A (en) In vitro method for detecting the presence or possibility of autism or autism disorder, and in vitro method for selecting compounds with biological activity on autism or autism disorders
CN108624683B (zh) Usp48基因突变在acth型垂体腺瘤分子诊断中的应用
CA2348657C (fr) Clonage, expression et caracterisation du gene spg4 responsable de la forme la plus frequente de paraplegie spastique autosomique dominante
CN111278468A (zh) 用于脂肪营养不良的自体细胞疗法的人脂肪组织祖细胞
KR20240032895A (ko) 미토겐-활성화된 단백질 키나제 키나제 키나제 15 (map3k15) 억제제를 이용한 대사 장애 치료 방법
CA2433869C (fr) Gene d&#39;identification d&#39;individus atteints de dysautonomie familiale
KR20210116480A (ko) 기분 장애의 설치류 모델
US20030165826A1 (en) PG-3 and biallelic markers thereof
KR102647919B1 (ko) App 돌연변이 세포 및 이의 이용
US20040138441A1 (en) Novel gene functionally related to dyslexia
KR102326582B1 (ko) 청각장애의 진단용 마커 및 그의 용도
KR20220063226A (ko) 메타데린 발현 억제제
US20030219787A1 (en) Novel human gene functionally related to dyslexia
US20030203380A1 (en) Gene linked to osteoarthritis
US20020103115A1 (en) Isolated human transporter proteins, nucleic acid molecules encoding human transporter proteins, and uses thereof
US20040163137A1 (en) PG-3 and biallelic markers thereof
CN116606920A (zh) 一种定性分析和定量分析基因rilpl1的试剂盒
CN115362255A (zh) 用无七之子2(sos2)抑制剂治疗眼科疾患
KR20230057410A (ko) Pcsk9 및 ldlr 조절인자를 사용한 패혈증 치료

Legal Events

Date Code Title Description
PLFP Fee payment

Year of fee payment: 18

PLFP Fee payment

Year of fee payment: 19

PLFP Fee payment

Year of fee payment: 20