CA2503837A1 - Sequences peptidiques ppr capables de restaurer la fertilite male de plantes porteuses d'un cytoplasme inducteur de sterilite male - Google Patents
Sequences peptidiques ppr capables de restaurer la fertilite male de plantes porteuses d'un cytoplasme inducteur de sterilite male Download PDFInfo
- Publication number
- CA2503837A1 CA2503837A1 CA002503837A CA2503837A CA2503837A1 CA 2503837 A1 CA2503837 A1 CA 2503837A1 CA 002503837 A CA002503837 A CA 002503837A CA 2503837 A CA2503837 A CA 2503837A CA 2503837 A1 CA2503837 A1 CA 2503837A1
- Authority
- CA
- Canada
- Prior art keywords
- ppr
- sequence
- plant
- seq
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8287—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for fertility modification, e.g. apomixis
- C12N15/8289—Male sterility
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Botany (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
Abstract
L'invention concerne des séquences peptidiques PPR capables de restaurer la fertilité mâle de plantes porteuse d'un cytoplasme inducteur de stérilité male, des séquences nucléotidiques codant pour ces peptides, un procédé d'obtention de plantes mâle fertiles, des plantes obtenues par un tel procéd é.
Description
Séquences peptidiques PPR capables de restaurer la fertilité mâle de plantes porteuses d'un .cytoplasme inducteur de stérilité mâle L'invention concerne notamment des séquences peptidiques PPR capables de restaurer la fertilité mâle de plantes porteuse d'un cytoplasme inducteur de stérilité
male, des séquences nucléotidiques codant pour ces peptides, un procédé
d'obtention de plantes mâle fertiles, des plantes obtenues par un tel procédé.
La production à grande échelle d'hybrides de Brassica nécessite le contrôle du système de pollinisation et un transfert efficace du pollen entre les plantes parentales.
Pour de nombreuses plantes hermaphrodites en effet, pour obtenir des hybrides à
échelle commerciale, il est nécessaire d'empêcher l'autopollinisation. Ceci est relativement simple dans le cas du maïs par exemple dans la mesure où les organes producteurs de pollen sont séparés des organes femelles de la plante et une castration manuelle ou mécanique est suffisante. Par contre, dans d'autres espèces telles que les Brassica, le contrôle de la pollinisation par castration pour produire des hybrides n'est pas envisageable. L'emploi d'agents chimiques gamétocides peut s'avérer souvent coûteux parfois inefficace.
La stérilité mâle cytoplasmique (cms) qui est présente chez plusieurs plantes supérieures est un trait transmis héréditairement par voie maternelle et qui empêche la production d'un pollen fonctionnel, tout en maintenant la fertilité femelle (Vedel et a1,1994). Les mécanismes de stérilité font intervenir notamment l'expression de protéines mitochondriales particulières. Différents systèmes inducteurs de stérilité
mâle cytoplasmique sont par exemple rappelés dans le document US 20020100078.
On connaît de l'art antérieur différentes techniques pour introduire un gène restaurateur de fertilité d'une plante de radis vers une plante Brassica. Le brevet US
5,644,066 par exemple décrit une méthode d'introduction d'un gène restaurateur utilisant une technique de fusion de protoplastes. Le brevet US 5,973,233 et la demande US 2002/49998 décrivent des méthodes d'introduction d'un géne restaurateur de radis, tout en évitant l'introduction d'une partie génique non souhaitée induisant la production de gluconisolates .
male, des séquences nucléotidiques codant pour ces peptides, un procédé
d'obtention de plantes mâle fertiles, des plantes obtenues par un tel procédé.
La production à grande échelle d'hybrides de Brassica nécessite le contrôle du système de pollinisation et un transfert efficace du pollen entre les plantes parentales.
Pour de nombreuses plantes hermaphrodites en effet, pour obtenir des hybrides à
échelle commerciale, il est nécessaire d'empêcher l'autopollinisation. Ceci est relativement simple dans le cas du maïs par exemple dans la mesure où les organes producteurs de pollen sont séparés des organes femelles de la plante et une castration manuelle ou mécanique est suffisante. Par contre, dans d'autres espèces telles que les Brassica, le contrôle de la pollinisation par castration pour produire des hybrides n'est pas envisageable. L'emploi d'agents chimiques gamétocides peut s'avérer souvent coûteux parfois inefficace.
La stérilité mâle cytoplasmique (cms) qui est présente chez plusieurs plantes supérieures est un trait transmis héréditairement par voie maternelle et qui empêche la production d'un pollen fonctionnel, tout en maintenant la fertilité femelle (Vedel et a1,1994). Les mécanismes de stérilité font intervenir notamment l'expression de protéines mitochondriales particulières. Différents systèmes inducteurs de stérilité
mâle cytoplasmique sont par exemple rappelés dans le document US 20020100078.
On connaît de l'art antérieur différentes techniques pour introduire un gène restaurateur de fertilité d'une plante de radis vers une plante Brassica. Le brevet US
5,644,066 par exemple décrit une méthode d'introduction d'un gène restaurateur utilisant une technique de fusion de protoplastes. Le brevet US 5,973,233 et la demande US 2002/49998 décrivent des méthodes d'introduction d'un géne restaurateur de radis, tout en évitant l'introduction d'une partie génique non souhaitée induisant la production de gluconisolates .
2 Des systèmes restaurateurs de fertilité sont ainsi connus pour la production de semences hybrides. Mais jusqu'à présent, l'on n'avait pas réussi à cloner des gènes restaurateurs de fertilité capables de restaurer de manière souhaitée une fertilité mâle chez les B~assica porteuses d'une stérilité le mâle cytoplasmique .
Ainsi, l' invention vise à fournir les séquences nucléotidiques et les séquences peptidiques codées par ces séquences nucléotidiques, dont l'expression est essentielle pour le processus de restauration de la fertilité mâle chez les plantes.
L'invention vise également à fournir une méthode utilisant les séquences nucléotidiques décrites pour moduler la fertilité mâle chez les plantes porteuses d'un cytoplasme inducteur de stérilité.
Plus précisément, des études moléculaires ont démontré que le gène Orfl38, inducteur de la stérilité mâle cytoplasmique Ogura code pour un polypeptide de acides aminés et est co-transcrit avec le gène OrfB. Le gène Of~b est l'homologue de l'ATP8 dans les mitochondries de plantes (Gray et al). La fonction physiologique du produit du gène inducteur de cms est pour l'instant encore inconnue. Ce produit est présent dans tous les tissus et retrouvé dans des fractions membranaires de mitochondrie (Grelon et al, 1994).
Le déterminant génétique de la stérilité mate cytoplasmique (oyf 138) est transmis uniquement par le parent femelle. La stérilité mate conférée par ce système offre l'avantage d'être totale, c'est-à-dire qu'il n'y a pas de production de pollen. La production de graine uniquement hybride est réalisée en utilisant les vecteurs naturels (insectes, vent pollinisateur).
La cms Ogura, décrite initialement chez le radis (Ogura, 1968), fut introduite chez le colza (B~assica hapus) et le chou (Brassica ole~acea) par des croisements interspécifiques (Bannerot et al., 1974, 1977) et fut modifiée par fusion de protoplastes (Pelletier et al., 1983). Chez le radis, un système de stérilité
mate cytoplasmique appelé Koséna dont le déterniinant génétique est très proche de celui du système Ogura a été décrit par Iwabachi M (1999). Le système Kosena peut être considéré comme équivalent du système Ogura.
Un certain nombre de brevets concernent les systèmes de stérilité mâle cytoplasmique, parmi ceux-ci, il est possible de citer par exemple les brevets FR
2667078, US 5,789,566 et EP 549 726 (1NRA). Ces brevets apportent un système de
Ainsi, l' invention vise à fournir les séquences nucléotidiques et les séquences peptidiques codées par ces séquences nucléotidiques, dont l'expression est essentielle pour le processus de restauration de la fertilité mâle chez les plantes.
L'invention vise également à fournir une méthode utilisant les séquences nucléotidiques décrites pour moduler la fertilité mâle chez les plantes porteuses d'un cytoplasme inducteur de stérilité.
Plus précisément, des études moléculaires ont démontré que le gène Orfl38, inducteur de la stérilité mâle cytoplasmique Ogura code pour un polypeptide de acides aminés et est co-transcrit avec le gène OrfB. Le gène Of~b est l'homologue de l'ATP8 dans les mitochondries de plantes (Gray et al). La fonction physiologique du produit du gène inducteur de cms est pour l'instant encore inconnue. Ce produit est présent dans tous les tissus et retrouvé dans des fractions membranaires de mitochondrie (Grelon et al, 1994).
Le déterminant génétique de la stérilité mate cytoplasmique (oyf 138) est transmis uniquement par le parent femelle. La stérilité mate conférée par ce système offre l'avantage d'être totale, c'est-à-dire qu'il n'y a pas de production de pollen. La production de graine uniquement hybride est réalisée en utilisant les vecteurs naturels (insectes, vent pollinisateur).
La cms Ogura, décrite initialement chez le radis (Ogura, 1968), fut introduite chez le colza (B~assica hapus) et le chou (Brassica ole~acea) par des croisements interspécifiques (Bannerot et al., 1974, 1977) et fut modifiée par fusion de protoplastes (Pelletier et al., 1983). Chez le radis, un système de stérilité
mate cytoplasmique appelé Koséna dont le déterniinant génétique est très proche de celui du système Ogura a été décrit par Iwabachi M (1999). Le système Kosena peut être considéré comme équivalent du système Ogura.
Un certain nombre de brevets concernent les systèmes de stérilité mâle cytoplasmique, parmi ceux-ci, il est possible de citer par exemple les brevets FR
2667078, US 5,789,566 et EP 549 726 (1NRA). Ces brevets apportent un système de
3 stérilité mâle approprié au cas des cruciféracées en éliminant les gènes responsables des caractères indësirables du cytoplasme Ogura tout en conservant une stérilité mâle efficace. L'invention décrite dans les brevets cités ci-dessus se rapporte à
une séquence d'ADN dite « séquence de stérilité Ogura » issue du radis (Raplaahus sativus) conférant la stérilité mâle aux plantes dont les mitochondries sont porteuses de cette séquence et l'absence de séquences d'origine radis indésirables pour le bon comportement agronomique des plantes.
La cms Ogura est utilisée pour la production de graines hybrides commerciales de colza F1. Dans des plantes telles que colza, pour lesquelles les graines constituent la récolte, il est nécessaire, voire indispensable, de disposer de gènes nucléaires restaurateurs de fertilité permettant de supprimer la cms chez les hybrides.
Dans le cas de la cms Ogura, des restaurateurs nucléaires existent naturellement dans l'espèce radis et ont été introduits dans des plantes de colza Ogura mâle stériles, permettant la restauration de la fertilité mâle (Heyn, 1976). Il a été montré que cette restauration s'accompagne d'une diminution de la quantité de la protéine de l'ORF138, mais pas de l'ARNm correspondant (Krishnasamy & Malcaroff, 1994 ; Bellaoui et al., 1999).
Le locus restaurateur a été introduit par croisement dans le génome de colza, ainsi qu'une quantité inconnue d'informations génétiques associées du radis, et les méthodes de sélection classiques ont été utilisées pour améliorer les génotypes restaurateurs de la fertilité. Cependant, une quantité importante de matériel génétique du radis à été introduite à la place d'environ SOcM de génome de colza (Foisset et al., 1998), et est responsable des difficultés rencontrées pour l'amélioration des lignées restaurées. Dans ce contexte, il existe toujours un besoin de cloner le gène restaurateur de fertilité, désigné Rfo, afin d'éviter l'introduction d'autres gènes ou région génomiques non souhaités. En effet, l'isolement du gène Rfo permettra par exemple un meilleur contrôle de l'introduction du gène dans les variétés commerciales, sans l'introduction de caractères associés indésirables.
Les inventeurs ont ainsi réussi à identifier et cloner le locus Rfo, en utilisant une stratégie de clonage appropriée, associée à des cartographies génétique et physique comparatives entre AYabidopsis et le radis, concernant plus spécifiquement le locus Rfo.
une séquence d'ADN dite « séquence de stérilité Ogura » issue du radis (Raplaahus sativus) conférant la stérilité mâle aux plantes dont les mitochondries sont porteuses de cette séquence et l'absence de séquences d'origine radis indésirables pour le bon comportement agronomique des plantes.
La cms Ogura est utilisée pour la production de graines hybrides commerciales de colza F1. Dans des plantes telles que colza, pour lesquelles les graines constituent la récolte, il est nécessaire, voire indispensable, de disposer de gènes nucléaires restaurateurs de fertilité permettant de supprimer la cms chez les hybrides.
Dans le cas de la cms Ogura, des restaurateurs nucléaires existent naturellement dans l'espèce radis et ont été introduits dans des plantes de colza Ogura mâle stériles, permettant la restauration de la fertilité mâle (Heyn, 1976). Il a été montré que cette restauration s'accompagne d'une diminution de la quantité de la protéine de l'ORF138, mais pas de l'ARNm correspondant (Krishnasamy & Malcaroff, 1994 ; Bellaoui et al., 1999).
Le locus restaurateur a été introduit par croisement dans le génome de colza, ainsi qu'une quantité inconnue d'informations génétiques associées du radis, et les méthodes de sélection classiques ont été utilisées pour améliorer les génotypes restaurateurs de la fertilité. Cependant, une quantité importante de matériel génétique du radis à été introduite à la place d'environ SOcM de génome de colza (Foisset et al., 1998), et est responsable des difficultés rencontrées pour l'amélioration des lignées restaurées. Dans ce contexte, il existe toujours un besoin de cloner le gène restaurateur de fertilité, désigné Rfo, afin d'éviter l'introduction d'autres gènes ou région génomiques non souhaités. En effet, l'isolement du gène Rfo permettra par exemple un meilleur contrôle de l'introduction du gène dans les variétés commerciales, sans l'introduction de caractères associés indésirables.
Les inventeurs ont ainsi réussi à identifier et cloner le locus Rfo, en utilisant une stratégie de clonage appropriée, associée à des cartographies génétique et physique comparatives entre AYabidopsis et le radis, concernant plus spécifiquement le locus Rfo.
4 Des études de cartographie génétique comparatives ont démontré la colinéarité
entre deux segments chromosomiques entre des espèces étroitement liées. Divers études ont montré que des régions de grandes tailles, y compris des chromosomes, peuvent étre colinéaires, tandis que dans d'autres études, seulement certaines régions petites, limitées à quelques centimorgans, présentent une colinéarité (synthèse Schmidt, 2000 ; Schmidt 2002).
Plus particulièrement, les inventeurs ont réussi à obtenir des résultats significatifs dans l'identification et le clonage du locus Rfo impliqué dans la restauration de la fertilité, en utilisant une stratégie de cartographie génétique et physique et de clonage positionnel et en étudiant la microsynténie entre Arabidopsis et le radis.
Les inventeurs ont ainsi réussi à identifier les gènes codant des protéines issues de la famille des protéines PPR (classe de protéines présentant plusieurs répëtitions d'un motif appelé pentatricopeptide), capables de restaurer la fertilité chez des plantes Brassica porteuse du cytoplasme Ogura et/ou Kosena.
L'invention a pour objet selon un premier aspect une séquence peptidique PPR
(pentatricopeptide) capable de restaurer la fertilité mâle de plantes, comprenant au moins une séquence choisie parmi a) SEQ m N° 1 (protéine PPR désignée PPR-A), ou SEQ ID N°2 (protéine PPR
désignée PPR-B), ou SEQ >D N°3 (protéine PPR-C) b) une séquence peptidique homologue comportant au moins 80% d'identité
avec une séquence du a), c) un fragment peptidique biologiquement actif représentatif d'une séquence du a) ou b).
Par l'expression « restaurer la fertilité », on entend que la fertilité mâle obtenue chez une plante dans laquelle on a induit l'expression de PPR-A et/ou PPR-B et/ou PPR-C
(ou l'expression des variants de ces protéines indiqués en b) ou c)) est d'au moins 20, de préférence d'au moins 50, 70, 80, 90 % du niveau de fertilité d'une plante ne portant pas le cytoplasme inducteur de stérilité.
Par séquence peptidique homologue, on entend toute séquence peptidique qui diffère de la séquence SEQ m N° 1 ou SEQ ll~ N° 2 et SEQ m N° 3 par substitution, délétion, et/ou inserüon d'un acide aminé ou d'un nombre réduit d'acides aminés, à
des positions telles que ces séquences peptidiques homologues constituent une protéine PPR ayant une activité restaurateur de fertilité telle que décrite précédemment.
De préférence, une telle séquence peptidique homologue est identique à au moins 80 de la séquence SEQ ID N° 1 ou SEQ ID N°2 ou SEQ ID N°3, de préférence au moins 85, 90, 92, 95, 98, 99% de la séquence issue de la séquence nucléotidique matrice présentée dans les séquences SEQ ID N° l, SEQ ID N° 2 et SEQ ID N°3.
Par « fragment peptidique représentatif » de SEQ ID N°l, on entend tout fragment de la séquence SES ID N° 1 ou des séquences peptidiques homologues de la séquence SEQ ID N° l, qui conduit à la restauration de la fertilité définie précédemment.
Ces fragments peptidiques présentent typiquement au moins 100 acides aminés, de préférence au moins 300, 400, 500 acides aminés consécutifs de la séquence dont ils sont issus.
Ces fragments ont une activité restauratrice de fertilité de préférence d'au moins 20, 30, 50, 80 , 90%, voire plus de 100%, de l'activité restauratrice obtenue avec SEQ m N°l, ou SEQ ID N°2 ou SEQ ID N°3. Pour tester cette activité restauratrice des fragments, l'homme du métier dispose de méthodes connues, comme par exemple la fabrication de plantes transformées selon la méthode décrite ci après.
L'invention concerne ainsi les « variants naturels », c'est à dire les peptides PPR
restaurateurs de fertilité ou leurs fragments pouvant exister naturellement, correspondant notamment à des troncatures, substitutions, délétions et/ou additions de résidus d'acides aminés. Ces variants naturels, sont issus en général du polymorphisme génétique de la population, et ont une activité qui n'est pas substantiellement modifiée par rapport au peptide sauvage.
L'invention concerne aussi les peptides PPR comprenant au moins une mutation. Par « mutation », on entend désigner n'importe quel changement intervenu dans la séquence de peptides PPR, autres que ceux présents dans ses variants naturels, et/ou dans ses homologues, tout en conservant une activité restauratrice de fertilité.
Les méthodes de typage des polymorphismes des gènes PPR sont variables en fonction du type de polymorphisme faisant appel à
- la technique de PCR-RFLP (amplification suivie de digestion enzymatique du produit de PCR) quand le polymorphisme était situé sur un site de restriction enzymatique.
- PCR avec amorces spécifiques du site polymorphe : amplification différentielle des deux allèles en utilisant des amorces spécifiques de chaque allèle.
On peut aussi utiliser des tests de ligation d'oligonucléotides (ligation différentielle) qui utilisent des oligonucléotides spécifiques de chaque allèle, la ligation étant suivie d'une électrophorèse en gel de polyacrylamide. On peut aussi utiliser des techniques de détection des SNP (single nucleotid polymorphism).
L'invention concerne également une séquence nucléotidique isolée, codant pour une sëquence peptidique ci-dessus.
En particulier cette séquence peut être choisie parmi aune séquence nucléotidique choisie parmi SEQ ID N°4 (séquence nucléotidique codant pour SEQ ID N°1 et désignée pp~ A), ou SEQ ID N°5 (séquence nucléotidique codant pour SEQ ID N°2 et désignée ppr-B), ou SEQ ID
N°6 (séquence nucléotidique codant pour SEQ ID N°3 et désignée ppr-G~, b) une séquence nucléotidique complémentaire d'une séquence du a), c)une séquence nucléotidique homologue hybridant dans des conditions stringentes avec une séquence du a).
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à-dire à (état naturel, il s'agit de séquences qui ont été isolées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie (ADNc), leur environnement ayant été au moins partiellement modifië. Par "séquence nucléique", on entend un fragment d'ADN et/ou d'ARN naturel isolé, ou de synthèse, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment, un segment ou une région d'un acide nucléique.
Par "séquence nucléotidique homologue", on entend toute séquence nucléotidique qui diffère de la séquence SEQ ID N° 4 ou SEQ ID N°5 ou SEQ ID
N°6 par substitution, délétion, et/ou insertion d'un nuclëotide ou d'un nombre réduit de nucléotides, à des positions telles que ces séquences nucléotidiques homologues codent une protéine PPR ayant une activité restauratrice de fertilité telle que décrite précédemment. De préférence, une telle séquence nucléotidique homologue est identique à au moins 80 de la séquence SEQ m N° 4 ou SEQ m N°5 ou SEQ m N°6, de préférence au moins 85, 90, 92, 95, 98, 99%.
L'invention couvre les séquences nucléotidiques qui en raison de la dégénérescence du code génétique codent pour des protéines PPR ayant la séquence d'aminoacides des protéines de séquence a) à c) ci-dessus.
L'invention couvre les séquences nucléotidiques variants alléliques, notamment des séquences SNP.
Par <e pourcentage d'identité » entre deux séquences d'acides nucléiques (ou peptidiques), on entend désigner un pourcentage de nucléotides (ou d'aminoacides) identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage ëtant purement statistique et les différences entre les deux sëquences étant réparties au hasard et sur toute leur longueur. L'alignement optimal des séquences pour la comparaison peut être réalisé à l'aide d'algorithmes mathématiques. D'une manière préférée, non limitative, on peut citer différents algorithmes rappelés dans Altschul et al (1998) notamment les algorithmes présentés dans Altschul et al (1990), Karlin et Altschul (1993) . On pourra utiliser par exemple les programmes -BLAST, notamment BLASTN, BLAST2 (Tatusova et al., 1999 ), gapped BLAST
(Altschul et al., 1997), ou -FASTA (Altschul et al., 1990).
De manière préférentielle, une telle séquence nucléotidique homologue hybride spécifiquement à la séquence complémentaire de la séquence SEQ ID N° 4 ou SEQ
ID N°5 ou SEQ ID N°6, dans des conditions stringentes. Les paramètres définissant les conditions de stringence appropriées sont connues de l'homme du métier, notamment décrites dans Ausubel et al. (1995). De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent la détection d'au moins 90%, de préférence 95% ou de préférence 99% d'identité
entre fane des deux séquences et la séquence complémentaire de l'autre.
L'invention concerne également les séquences nucléotidiques mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10%
de mutation, sans altérer significaüvement l'activité PPR à l'origine de la restauration de fertilité.
L'ïnvention concerne également des sondes ou amorces, qui peuvent être utilisées dans des procédés de détection, d'identification, de dosage ou d'amplification de séquences nucléiques ci-dessus. Ces procédés peuvent faire intervenir 'des techniques connues de l'homme du métier, y compris les techniques d'amplification du type PCR utilisant des amorces nucléotidiques correspondant à des portions de la séquence SEQ m N° 4 ou SEQ ID N°5 ou SEQ ID N°6,.
Une amorce se définit, au sens de l'invention, conune étant un fragment d'acide nucléique simple brin ou un fragment double brin dénaturé comprenant au moins bases, de préférence au moins 15, 30 bases, utilisable pour amplifier une séquence nucléotidique ci-dessus.
Une sonde se définit, au sens de l'invention, comme étant un fragment d'acide nucléique simple brin ou un fragment double brin dénaturé comprenant au moins bases, de préférence au moins 15, 30 bases, et possédant une spécificité
d'hybridation dans des conditions déterminées pour former un complexe d'hybridation avec un acide nucléique cible. De telles sondes ou amorces seront en particulier utilisables dans des programmes de sélection assistée par marqueur, par exemple pour suivre l'introgression dans une plante d'un gène codant une protéine PPR selon l'invention.
Avantageusement, ces sondes ou amorces sont spécifiques des séquences correspondantes à l'alléle restaurateur de la fertilité mâle en ce sens qu'elles ne s'hybrident pas aux séquences correspondantes à l'allèle mainteneur de stérilité en condition de forte stringence.
De préférence, selon la longueur des oligonucléotides utilisés à cet effet, la température pour la réaction d'hybridation est comprise entre environ 25 et 65°C, en particulier entre 35 et 65°C dans une solution saline à une concentration d'environ 0,8 à 1 M. L'appariement avec les sondes spécifiques de l'invention peut s'effectuer à des températures supërieures à 50°C pour 1 à 2 mM MgCl2. La température d'hybridation d'un oligonucléotide étant calculée sur la base de 2°C par A ou T et de 4°C par G ou C, un oligonucléotide constitué par exemple d'une combinaison de 7 A et 5 C
s'hybride à 34°C. Cette règle bien connue par l'homme du métier permet de calculer la température d'hybridation envïsageable pour toutes les sondes ou amorces selon l'invention.
De préférence, les sondes conformes à l'invention peuvent être utilisées pour l' analyse d' échantillons de matériel génétique extraits de plantes à tester, ce peut être par exemple des analyses de type Southern ou Northena. Elles peuvent également être utilisées pour la détection ire situ de l'allèle recherché, par exemple des techniques de type FISH (Fluorescence in situ hybridization) ou BAC FISH (Hybridation ih situ sur clone BAC), etc.. .
Ainsi, dans un autre aspect, l'invention porte sur des kits de détection comprenant au moins une sonde et/ou amorce telle que définie précëdemment et des moyens de détection de 1a présence ou de l'absence de l'hybridation spécifique. Ces kits peuvent être utilisés dans des méthodes de détection basées sur l'amplification par PCR.
L'amplification peut porter, à partir du matériel génétique de la plante à
tester, sur la séquence responsable de la restauration de la fertilité mâle des plantes porteuses du cytoplasme inducteur de stérilité. Les conditions d'amplification seront définies selon le couple d'amorces choisi de manière à ce que ledit couple d'amorces ne s'hybride qu'avec sa séquence complémentaire présente dans l'allèle recherché.
L'amplification par les amorces comprises dans le kit permet de détecter la présence de la séquence d'intérêt dans la plante testée.
L'invention concerne également une construction nucléotidique, destinée à être introduite dans une plante dont on souhaite restaurer la fertilité, comprenant au moins une séquence nucléotidique décrite ci-dessus codant pour une protéine PPR à
activité
restauratrice de fertilité et une séquence promotrice capable de commander l'expression de cette séquence en quantité suffisante pour restaurer la fertilité.
Par protéine PPR à activité restauratrice de fertilité, on entend au moins une séquence peptidique a) à c) telle que définie ci-dessus. Avantageusement, des constructions nucléotidiques combinant au moins deux séquences PPR selon l'invention peuvent être utilisées pour la transformation des plantes stériles, et de manière préférentielle, une constTUCtion contenant à la fois les trois séquences PPR selon l'invention liées au promoteur endogène de la PPRB ou encore au promoteur LEA sont utilisés pour lesdites transformations. On pourra en particulier introduire dans une plante des séquences nucléotidiques codant pour au moins une des protéines PPR-A et PPR-B
et PPR-C (ou des protéines homologues ou des fragments représentatifs de PPR-A et PPR-B et PPR-C).
On rappelle qu'un promoteur est une séquence nucléotidique qui est capable de moduler ou contrôler le niveau de transcription d'un gène sous le contrôle de ce promoteur, et qui permet (ou fournit un site pour) la liaison de l'ARN
polymérise lors de la transcription. La position d'un promoteur est définie par rapport au site du début de la transcription. On connaît des séquences promoteurs consensus retrouvées chez les promoteurs de plantes, en particulier une boîte TATA située environ 19 à
27 bases en amont de ce site et une boîte CAAT située environ 70 à 80 bases en amont de ce site.
On pourra également utiliser des séquences nucléotidiques régulatrices, ne faisant pas partie du promoteur, et susceptibles de moduler l' expression du gëne de fertilitë, en particulier - des séquences leaders et des séquences enhancers, qui interviennent à un niveau post-transcriptionnel ou iraductionnel (notamment stabilisation d'ARN et effet sur la traduction), par exemple le leader EMCV (Elroy-Stein et al, 1989) et le leader TMV (Galbe et al., 1989).
- des boîtes de régulation intervenant à un niveau transcriptionnel, capables de commander au moins partiellement l'activité d'un promoteur ; ces dernières boites de régulation peuvent être inductibles par un facteur physiologique ou de l'environnement de la plante.
Le promoteur utilisé pourra être un promoteur constitutif (ce promoteur contrôle l'expression du gène Rfo dans l'ensemble des tissus de la plante), ou spécifique des anthères et suffisaient actif pour contrôler l'expression du gène Rfo spécifiquement dans les anthères (un tel promoteur est capable de contrôler l'expression d'ARN ou de polypeptides PPR dans les anthères à un niveau suffisant pour obtenir la production de pollen fonctionnel et une restauration de la fertilité ; on pourra par exemple utiliser le promoteur LEA (Hughes et Galau, 199 et 1991) ou le promoteur spécifique des Brassica décrit dans le brevet US 5 356 799).
Selon une réalisation, le promoteur est choisi parmi des promoteurs de gènes PPR de radis clonés et séquencés.
La préparation d'une telle construction ADN peut être réalisée de différentes manières appropriées par l'homme du métier. Brièvement, au moins une partie du gène Rfo capable de restaurer la fertilité (de préférence une séquence codant pour PPR-A ou PPR-B ou PPR-C) peut être clonée en aval du promoteur en utilisant des enzymes de restriction pour assurer son insertion dans une orientation appropriée au regard du promoteur de manière qu' elle soit exprimée. Une fois cet ADN
d'intérêt lié
opérationnellement au promoteur, la construction ainsi formée peut être clonée dans un plasmide ou un autre vecteur. La séquence promoteur contrôle la transcription du gène d'intérêt en un ARN messager fonctionnel. La construction nucléotidique préparée comprend typiquement également une région de terminaison de la transcription.
On comprend en outre que l'on peut transférer une construction nucléotidique comprenant non seulement un promoteur lié opérationnellement à un gène d'intërêt, mais aussi au moins une séquence capable de modifier l'activité du promoteur, en particulier une séquence enhancer et/ou une séquence leader.
Selon un autre aspect l'invention concerne un vecteur de clonage et/ou d'expression comprenant une construction nucléotidique telle que décrite précédemment.
Selon un autre aspect l'invention concerne une cellule hôte transformée avec les séquences nucléotidiques décrites ci-dessus.
L'invention vise également des anticorps capables de reconnaître spécifiquement les polypeptides selon l'invention ou tout fragment de ces derniers. Les anticorps sont produits par des méthodes bien connues de l'homme de métier basées sur la production naturelle d'anticorps en réaction contre l'introduction d'un polypeptide étranger à l'organisme en l'occurrence le polypeptide défini par la séquence SEQ ID
N°1, 2 ou 3, tout fragment de ces derniers ou tout polypeptide dérivé
ayant la même fonction physiologique dans la plante. De préférence, lesdits anticorps sont capables de reconnaître spécifiquement un polypeptide correspondant à l'allèle restaurateur de la fertilité.
Lesdits anticorps peuvent être utilisés dans des tests d'immunochimie pour détecter dans une population de plantes la présence des polypeptides définis par les séquences SEQ ID N° 1, 2 ou 3 ou des polypeptides dérivés. Parmi les techniques d'immunochirnie pouvant être utilisëes pour détecter les polypeptides définis ci-dessus ou tout polypeptide variant, on peut citer l'utilisation dans les tests ELISA
(Enzyme linked irnmuno-sorbent assay), les tests de Western-blots ainsi que les tests d'imrnunolocalisation in-situ. L'invention porte donc aussi sur un kit de détection de l'allèle restaurateur de fertilité dans les plantes comprenant un anticorps défini ci-dessus.
Selon un autre aspect l'invention concerne les cellules végétales transformées par un vecteur tel que dëfimi précédemment, à l'aide d'un hôte cellulaire susceptible d'infecter lesdites cellules végétales en permettant l'intégration dans le génome de ces dernières, des séquences nucléotidiques codant pour des protéines PPR
notamment A et B et C initialement contenues dans le vecteur utilisé.
Le terme transformation fait référence à une manipulation génétique de cellules végétales susceptibles d'être transformées telles que par exemple des cellules de cals, d'embryons, des cellules en suspension dans des cultures (cultures issues par exemple de cals, d'embryons, de tissus de feuilles, d'inflorescences jeunes, d'anthères).
Une plante transgénique Bf~assica peut être obtenue par différentes techniques de transformation de dicotylédones connues de l'homme du métier incluant, de manière non limitative, le transfert d'ADN médié par AgYObacte~ium tumefaciens, en utilisant un vecteur portant un ADN-T désarmé, ou des méthodes de transfert direct telles que les méthodes de transformation de protoplastes ou les méthodes biolistiques.
Les techniques pour cultiver et régénérer des plantes entières à partir des tissus ainsi transformés sont connues de l'homme du métier, par exemple décrites dans les références Hansen et Wright (1999), Komari et al. (1998). Les techniques de génie génétique pour la transformation génétique de cellules ou de tissus végétaux seront utilisëes pour le transfert d'une construction nucléotidique comprenant une séquence peptidique PPR, un promoteur, le cas échéant des séquences de terminaison de transcription. La transformation de plantes B~assica est notamment décrite dans Plant Cell Reports, 8 :238-242, 1989 ; Guerche P. et Primard C. (1995), Wang K, Herrera-Estrella A, Van Montagu Eds, Sertes Editor : James Lynch, Moloney M.M et al., (1989), et Bonadé-Bottino M. (1993).
La présente invention inclut les plantes génétiquement transformées par un vecteur conforme à l'invention. Ces plantes comprennent la construction nucléotidique ou le vecteur tels qu.e définis ci-dessus, lesquels comprennent toute ou partie d'une des séquences dëfiriies par les séquences SEQ m N°4 à SEQ m N°6.
Préférentiellement, les plantes transformées objets de la présente invention sont issues de plantes qui sont mâle-stériles avant transformation.
La prësente invention peut être mise en oeuvre dans le cadre de 1a sélection assistée par marqueurs (SAM). Cette méthode de sélection est bien plus efficace qu'une simple évaluation phénotypique puisque tous les loci correspondant à
différents caractères d'intérêt peuvent être analysés ensemble sur un seul échantillon d'ADN, indépendamment des conditions de culture de la plante échantillonnée. La sélection assistée par marqueurs permet de mettre en oeuvre les techniques de rétrocroisements accélérés consistant à suivre l'introgression de la séquence restauratrice objet de l'invention par la visualisation de l'hybridation avec une sonde ou de l'amplification avec un couple d'amorces. L'invention concerne ainsi également un procédé de dëtection des sëquences restauratrices chez des plantes, de préférence chez des crucifères et de manière privilégiée chez les plantes du genre BYassica.
La présente invention, concerne également un procédé d'utilisation du gëne Rfo dans un schéma de production d'hybrides à partir d'une plante restauratrice obtenue selon l'invention. La production d'hybrides nécessite le croisement entre une lignée mainteneuse amëliorée « A » et une lignée restauratrice améliorée « B »
obtenue selon la présente invention. Ceci permet d'obtenir rapidement des hybrides fertiles comportant les caractëristiques agronomiques intëressantes du parent « A » et du parent « B ».
Le procédé, objet de l'invention a pour avantage de n'introgresser que le gène Rfo en s'affranchissant des séquences adjacentes présentes dans le locus restaurateur originaire du radis et ainsi de supprimer dans la lignée restauratrice améliorée B et chez les hybrides les effets pléïotropiques de ces séquences entraînant des problèmes de verse accrue, de taux élevé de glucosinolates dans les graines, de fertilité femelle et de baisse de rendement.
Les techniques et les agents pour sélectionner les cellules végétales et/ou les tissus végétaux incorporant des séquences nucléotidiques marqueurs associées au gène d'intérêt sont également bien connues de l'homme de métier, et comprennent, de manière non exclusive, l'utilisation de gènes marqueurs tels que des gènes conférant des résistances à un antibiotique ou à des herbicides, ou d'autres systèmes de sélection positive, cités par exemple dans Gelvin 1998, en particulier le système basé
sur une sélection sur mannose, en présence du gène de la MPI (Mannose-6-phosphate isornérase) {Hansen et Wright, 1999), ou de systèmes de sélection couplés à
l'élimination des gènes marqueurs après sélection (Ebinuma et al., 1997). Les plantes transformées peuvent également être sélectionnées par criblage PCR en l'absence de gènes marqueurs de sélection (McGarvey et Kaper, 1991).
L'invention concerne également les tissus ou parties de plantes, plantes, ou graines contenant les séquences d'acide nucléique Rfo selon l'invention. Le terme "tissu de plante" fait rëférence à n'importe quel tissu d'une plante, dans une plante ou dans une culture. Ce terme inclut des plantes entières, des cellules de plantes, des organes de plantes, des graines de plantes, des protoplastes, des cals, des cultures de cellules et toutes autres cellules de plantes organisées en tant qu'unité fonctionnelle et/ou structurelle. Des parties de plantes régénérées telles que des fleurs, des graines, des feuilles, des tiges, des fruits, du pollen, des tubercules et analogues sont également dans le cadre de l'invention.
L'invention inclut des plantes transgéniques fertiles obtenues ainsi que leur descendance et le produit de cette descendance. Les plantes transgéniques hybrides, obtenues par le croisement d'au moins une plante selon l'invention avec une autre, font aussi partie de l'invention. Les plantes transgéniques selon l'invention comprennent notamment une plante transgénique T0 ou R0, c'est-à-dire la première plante régénérée à partir de cellules transformées, la plante transgénique Tl ou R1 c'est-à-dire la première génération de descendance, et les plantes de la descendance de générations suivantes obtenues qui comprennent et expriment de manière suffisante l'ADN Rfo pour restaurer la fertilité.
Pour confirmer ia présence de la construction nucléotidique selon l'invention, dans les plantes régénérées, on peut utiliser un grand nombre de techniques appropriées, par exemple l'analyse PCR ou des techniques d'hybridation Southern blot, pour déterminer la structure de l'ADN recombinant, la détection de l'ARN transcrit à partir de l'ADN du gène d'intérêt exprimé dans des cellules des anthères de plantes transformées, à l'aide de techniques Northern blot ou d'amplification RT-PCR, des techniques de repérage de la production de la protéine codée par le gène d'intérêt, telles que l'électrophorèse de protéines sur gel, des techniques Western blot.
Selon un autre aspect l'invention concerne un procédé d'obtention d'une plante exprimant au moins une partie du gène Rfo et présentant un phénotype mâle fertile, résultant de l'introduction d'une construction telle que décrite précédemment, dans au moins une cellule de plante, puis la culture de la cellule ainsi transformée de manière à régénérer une plante contenant dans son génome ladite cassette d'expression.
L'invention concerne ainsi également un procédé de restauration de la fertilité d'une plante Brassica, caractérisé en ce qu'il comprend l'introduction dans une plante mâle stérile d'une séquence nucléotidique codant pour une protéine PPR. Plus spécialement, la protéine PPR est une protéine de séquence choisie parmi les séquences peptidiques a) à c) définies précédemment, préférentiellement PPR-A, PPR-B ou PPR-C. On comprend que l'invention couvre un tel procédé utilisant au moins une séquence nucléotidique obtenue par un procédé de criblage de séquences issues du gène R_f'o et capables de restaurer la fertilité. Il s'agit en particulier de séquences nucléotidiques définies en a) à c) ci-dessus. L'homme du métier dispose dans la présente demande des techniques de criblage appropriées.
On peut également construire des plans de croisement tels que ceux dëcrits dans la demande US 0220083483 faisant intervenir un gène inducteur de stërilité mâle puis un gène restaurateur de fertilité.
Selon une réalisation, la plante est Brassica hapus.
L'invention concerne également un procédé d'introduction d'un gène restaurateur de fertilité issu d'une plante de radis, dans une plante Brassica, caractérisé en ce qu'il comprend le croisement ou la fusion cellulaire entre la plante Brassica exprimant un gène de stérilité mâle cytoplasmique Ogura etlou Kosena, qui induit la stérilité de cette plante BYassica et une plante exprimant au moins une partie de gène Rfo et présentant un phénotype mâle fertile, de manière à introduire le gène Rfo restaurateur de fertilité dans la plante du genre BYassica et à obtenir une plante hybride à fertilité
restaurée, la partie du gène Rfo introduite comprenant de préférence une séquence codant pour PPR-A ou PPR-B ou PPR-C.
On peut introduire une séquence codant pour PPR-A, PPR-B ou PPR-C
individuellement, ou des séquences codant pour PPR-A et/ou PPR-B etJou PPR-C
simultanément pour obtenir la restauration de la fertilité mâle. On entend bien entendu aussi des variants ou fragments fonctionnels de PPR-A, PPR-B ou PPR-C.
L'invention concerne aussi l'utilisation d'au moins une séquence nucléotidique codant pour PPR-A ou PPR-B ou PPR-C (ou un variant peptidique fonctionnel défini précédemment), pour restaurer la fertilité chez les B~assica.
L'invention concerne aussi un procédé d'obtention de semences hybrides par croisement entre une plante restauratrice de fertilité obtenue par un procédé
ci-dessus et une plante mâle stérile.
L'invention concerne aussi un procédé de criblage de séquences nucléotidiques polymorphes capables de restaurer la fertilité, caractérisé en ce qu'il comprend - la détermination de la restauration obtenue avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N°1, SEQ ID N°2, SEQ ll~
N°3 - la détermination de la restauration obtenue avec une séquence nucléotidique candidat (variant de SEQ D~ N°4, SEQ ID N°5, SEQ ff~ N°6) - la sélection de candidats permettant d'obtenir au moins 20°1°, de préférence au moins 80,90%, voire plus de 100% de la restauration avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N°1, SEQ a?
N°2, SEQ
m N°3.
L'invention concerne aussi un procédé de criblage pour détecter la présence d'une séquence nucléotidique codant pour une protéine PPR dans une plante, caractérisé en ce qu'il comprend une étape d'amplification utilisant au moins une séquence amorce telle que définie précédemment et/ou une étape d'hybridation utilisant au moins une séquence sonde telle que définie précédemment.
L'invention concerne aussi un procédé de production de variétés hybrides de colza dont la fertilité mâle est restaurée comprenant l'introduction d'une séquence nucléotidique selon l'invention dans une plante colza mâle stérile utilisée comme géniteur mâle et exprimant le gène PPR et le croisement entre ladite plante avec une lignée de colza male stërile utilisée conune femelle, et production de la variété
hybride issue du croisement.
L'invention couvre les semences hybrides dont la fertilité est restaurée par le gène PPR obtenues à partir des plantes obtenue par le procédé décrit plus haut et également l'utilisation d'une plante exprimant les séquences nucléotidiques selon l'invention pour restaurer de la fertilité d'une lignée de colza utilisée comme femelle dans un croisement ou dans la production de semences d'une variété hybride.
Dans un autre aspect, (invention porte sur un vecteur de clonage et/ou d'expression comprenant une séquence nucléotidique isolée telle que décrite ci-dessus.
L'invention porte également sur une cellule hôte recombinante caractérisée en ce qu'elle est transformée avec ce vecteur recombinant. La cellule hôte recombinante peut être choisie parmi les cellules eucaryotes ou procaxyotes, par exemple les bactéries, notamment E. coli ou Agrobacterium, par exemple Ag7-obacte~iurra tumefaciens, les levures, les cellules animales et préférentiellement les cellules végétales, plus spécificiquement les' cellules de brassicacées.
Dans tin aspect préférë, (invention vise un organisme multicellulaire végétal recombinant comprenant une cellule recombinante mentionné précédemment.
L'invention porte également sur une plante transgénique transformée avec un vecteur décrit plus haut. Cette plante transgénique est par exemple porteuse du cytoplasme inducteur de stérilité mate cytoplasmique transformée par le vecteur mentionné
ci-dessus. On pourra choisir la plante transgénique parmi les plantes des espèces suivantes : Brassica oleacera, Brassica napus, Brassica campestris ou encore Raphanus sativus.
L'invention se rapporte également à une construction nucléotidique, caractérisée en ce qu'elle consiste en les séquences SEQ ID N°4, SEQ ID N°5 et SEQ
ID N°6 liée opérationnellement à une séquence promotrice. Par séquence promotrice, on entend une séquence comprenant un ou plusieurs éléments de régulation de la.
transcription.
Cette séquence promotrice peut également inclure un ou plusieurs éléments insulateurs et/ou enhancers. De manière avantageuse, le promoteur choisi est le promoteur endogène de 1a PPR ou d'autres promoteurs spécifiques de plantes endogènes ou exogènes. Par promoteurs spécifiques de plante, on entend par exemple tout promoteur permettant une expression optimale des séquences de l'invention chez les plantes. A titre, d'exemple, on peut utiliser le promoteur CaMV35S ou GRE.
D'autres avantages de l'invention apparaîtront lors de la description détaillée qui suit, illustrée par les dessins dans lesquels ;
- la figure lA représente une cartographie des marqueurs étroitement liés au locus Rfo chez le radis.
- la figure 1B représente des résultats des tests BLAST avec les marqueurs AFLP par rapport au génome A.thaliaha.
- la figure 2 représente l'analyse de la microsynténie autour du locus Rfo entre le radis et A~abidopsis. La carte génétique est basée sur l'analyse de 6900 plantes en ségrégation avec Rfo. La carte physique d'AYabidopsis est déduite de la base de données AGI. Les traits sombres localisent physiquement les marqueurs sur le BAC d'A~abidopsis et les flèches les localisent sur la carte génétique.
- La figure 3 représente une carte haute résolution génétique et physique à
proximité du locus Rfo. A : contigs de BAC d'A.thaliasza correspondant à la région synthénique du locus Rfo (position des marqueurs indiquée par les triangles). B : carte génétique du locus Rfo chez le radis. C : contigs de BAC
de radis représentant la carte physique du locus Rfo. Les positions des marqueurs sont déterminées par cartographie génétique en utilisant les recombinants. On entend par recombinant une plante dont le génotype présente une recombinaison des marqueurs caractéristiques des parents de la population autour de Rfo. Le nombre de recombinants est indiqué sur la carte physique entre les marqueurs. La position des marqueurs sur les contigs BAC
est indiquée par des lignes pointillées verücales. Le locus Rfo est indiqué
par une bande noire. Le BAC 64-16-7, positif avec les marqueurs flanquant Rfo, délimite physiquement le locus Rfo.
- La figure 4 représente une carte physique du BAC 64-16-7 et une prédiction des gènes à partir de sa sëquence en utilisant le programme GENSCAN. La position, le nom et l'orientation des gènes sont indiqués par des bandes orientées. Les gènes ont été obtenus par comparaison avec le génome d'Arabidopsis. La position des marqueurs étroitement liés au gène Rfo est indiquée par les flèches verticales.
- La figure 5 montre des fleurs issues des lignées transgéniques Ogura cms Tanto et contrôle non transgénique. Dans la figure SA, les fleurs sont issues d'une plante transgénique restaurée montrant des anthères normale et une production de pollen. Dans la figure SB, les fleurs sont issues d'une plante non transgénique servant de témoin (contrôle non transgénique) montrant des filaments courts et les cavités de l'anthère (« locules ») vides sans pollen.
Les pétales ont été enlevés des deux fleurs pour une meilleure analyse des résultats.
De plus, dans liste de séquences, Ia séquence SEQ ID N°7 est une séquence de 22770 paires de bases comprise entre les marqueurs flanquants le cluster de PPR (les marqueurs M-F24-D7.9 et M-F24-D7.13).
La séquence nucléotidique des 3 PPR est extraite, dans l'ordre PPR C, PPR B, PPR
A.
Les séquences SEQ ID N° 8 à SEQ ID N° 31 correspondent aux séquences des amorces utilisées pour identifier les marqueurs de la figure 3 dans le sens de lecture S'-> 3'. L'ATG, le stop, ou les introns ont été prédits avec le logiciel informatique sur la séquence de référence de 22770 paires de bases.
Exemple 1 : Identification de la séquence peptidique PPR (pentatricopeptide) capable de restaurer la fertilitë mâle de plantes.
On décrit maintenant la méthode utilisée par les inventeurs. Ils ont d' abord identifié
des séquences génomiques de radis liées au locus Rfo. Ces marqueurs moléculaires ont été utilisés pour identifier des séquences d'Arabidopsis. La carte génétique obtenue autour de Rfo a été précisée en identifiant un grand nombre de plantes recombinantes à proximité du locus Rfo. On a alors utilisé une banque de BAC
du génome de radis pour construire une carte physique du locus sur laquelle un segment de 22 kb portant le gène Rfo a été identifié. Il en découle que le gène Rfo est un membre de la famille des gènes PPR.
Correspondance.~démontrée à l'aide de marqueurs, entre le locus Rfo du radis et certaines séauences du chromosome 1 d'A~abidopsis.
Le gène restaurateur de fertilité Rfo du radis a été cartographié et des marqueurs AFLP associés au gène Rfo ont été identifiés. Les inventeurs ont montré
que, à proximité du gène Rfo, la colinéarité de séquence entre le radis et Ay~abidopsis est limitée a un intervalle réduit. L' analyse AFLP a été faite en combinaison avec une analyse de ségrégation. L'ADN étudié est obtenu à partir de la descendance issue d'un croisement entre une lignée de radis Européen mâle stérile, 7ms, et une lignée de radis homozygote pour le gène Rfo. Dans cette analyse, 800 combinaisons d'amorces PstI-MseI ont été étudiées pour déterminer le polymorphisme, et trois marqueurs nouveaux AFLP, désignés R3, R15 et R5, ont été identifiés comme directement associés au gène Rfo. R3 et R15 sont parfaitement liés au gène Rfo dans une population de plus de 900 plantes en ségrégation, et RS se situe à 0,1 cM de Rfo (Fig.
1). Les marqueurs R3 et R15 sont homologues à des séquences portées par le BAC
F24D7 d'A~abidopsis par analyse BLAST, dans une région génomique de 20 kb, et le marqueur RS se retrouve dans la même région 150 kb plus loin. Il en découle que l'ADN génomique du radis à proximité du locus Rfo est probablement colinéaire avec l'ADN d'A~abidopsis du BAC F24D7.
Les marqueurs dérivés du chromosome 1 d'Arabidopsis se situent à proximité
du gène Rfo chez le radis.
D'autres tests de colinéarité de séquence entre le chromosome 1 d'Arabidopsis et le locus Rfo chez le radis ont fait intervenir des marqueurs PCR
dérivés de six clones BAC d'ölrabidopsis, couvrant une distance physique de kb. Les marqueurs ont été choisis dans des séquences codantes (CDS) prédites AGI .
Pour chaque marqueur, les amorces ont été choisies dans des axons, pour augmenter les chances d'amplification de l'ADN du radis. Les amorces sont également en bordure d'un intron présumé, de manière à augmenter les chances d'identifier un polymorphisme entre des radis mâle fertile et mâle stérile. Dans cette analyse, les amorces sont issues de 60 CDS et la PCR a été effectuée sur AYabidopsis et sur le radis fertile et stérile (tableau 1). Ces marqueurs ont été cartographiés par rapport au gène Rfo dans le radis. Dans cette première analyse, 11 marqueurs polymorphes entre le radis fertile et stérile ont été identifiés. Les marqueurs M-T12P18.15, M-F24D7.4, M-F24D7.9, M-F24D7.13, M-F24D7.16, M-F24D7.17, M-F2K11.1 sont strictement liés génétiquement avec le gène Rfo. Le marqueur M-F2K11.19 se situe à 0,6 cM
du gène Rfo . De l'autre côté, les marqueurs M-F22C12.1 et M-T12P18.9 se situent à 0.2 cM et 0,1 cM du gène Rfo respectivement. Les séquences des différentes amorces utilisées SEQ ID N°8 à SEQ ID N°31 sont indiquées dans la liste des séquences annexée.
Il découle de ces analyses que le gène Rfo est délimité génétiquement entre les marqueurs M-F2K11.19 et M-T12P18.9.
Construction d'une carte énéti ue à haute résolution du locus Rfo du radis.
Afin de positionner plus précisément les marqueurs liés avec le gène Rfo, il a été nécessaire d'identifier des plantes recombinantes pour les marqueurs à
proximité
du locus Rfo. Ce procédé impliquait l'analyse d'échantillons d'ADN de 6907 plantes dans les populations de marquage avec les marqueurs flanquants Rfo M-T12P18.9 et M-F2K11.19. Afin d'améliorer l'efficacité et la précision du criblage, les allèles amplifiés avec M-T12P18.9 et M-F2K11.19 ont été clonés, séquencés à partir de lignées fertile et stérile de radis et des amorces allèles-spécifiques ont été
conçues.
Les inventeurs ont ainsi conçu deux paires d'oligonuclëotides capables d'amplifier spécifiquement les locus M-T12P18.9 et M-F2K11.19 de la lignée fertile (respectivement SEQ ID N°8 et SEQ )D N°9 et SEQ Il7 N°28 et SEQ 117 N°29). Les plantes présentant des événements de recombinaison étroitement associés au gène Rfo ont été identifiées comme des lignées portant seulement le marqueur M-T12P18.9 ou le marqueur M-F2K11.19 liës en cis au gène Rfo.
Lors de cette analyse, 43 plantes présentant des événements de recombinaison dans l'intervalle M-T12P18.9 et M-F2K11.19 ont été identifiées. Ces plantes ont été
utilisées pour cartographier les marqueurs entre eux et par rapport au gène Rfo. Dans cette analyse, le gène Rfo a été cartographié dans un intervalle génétique de 0,029 cM
délimité par les marqueurs M-F24D7.13 et M-F24D7.9 (fig. 2). La construction d'une banque de BAC de radis homozygote pour le locus Rfo, et l'identification de fragment d'ADN portant les marqueurs flanquants du gène Rfo M-F24D7.13 et M-24D7.9, est le seul moyen fiable d'identifier et de cloner le gène Rfo.
Construction d'une carte physic~ue à haute résolution du locus Rfo chez le radis.
Afin de déterminer avec certitude la micro colinéarité entre le radis et A~abidopsis dans l'intervalle génétique M-F2K11.19 et M-T12P18.9, une banque de BAC a été construite à partir d'ADN nucléaire dérivé d'une lignée de radis homozygote pour le gène Rfo. La banque est constituée de 120 000 clones. Afin de vérifier la fiabilité de la banque, la taille des inserts de 100 clones BAC
échantillonnés au hasard a été déterminée par digestion avec NotI et PFGE. La taille des inserts varie entre 100 kb et 200 kb. La banque représente au moins 23 fois le génome haploïde du radis.
En utilisant une méthode systématique basée sur la PCR, la banque a été
criblée avec des marqueurs étroitement liés au gène Rfo (M-F16M19.21, M-F2K11.19, M-F2K11.1, R15, M-T12P18.9 et M-F22C12.1), et les BAC positifs ont été identifiés et isolés. Les clones BAC ont été alignés et ordonnés en une seule contig. L'ordre des clones BAC dans la contig est compatible avec la cartographie génétique des marqueurs autour du gène Rfo. Dans cette analyse, le locus Rfo a été
localisé physiquement sur un clone BAC, le BAC 64-16-7, positif avec les marqueurs flanquants du gène Rfo (Fig. 3).
Analyse de la séquence du BAC 64-16-7 Le BAC 64-16-7 (référencé SEQ ID N°32) a été séquencé en utilisant une technique de séquençage par « shotgun », et la séquence a été assemblée en une seule contig de 127 kb. La redondance de la séquence était d'au moins 10 fois la longueur de la sëquence du BAC. Deux tests supplémentaires ont été effectués pour vérifier la qualité de la séquence consensus. Premièrement, la carte de restriction prédite a été
comparée avec l'empreinte du BAC 64-16-7 et les résultats ont été cohérents.
De plus, les sëquences des marqueurs associés au gène Rfo ont été alignées avec la séquence du BAC 64-16-7, et on a pu vérifier que l'ordre génétique des marqueurs correspondait à l'ordre physique sur la séquence.
A l'issue de l'analyse génétique, le gène Rfo est localisé dans un intervalle génétique de 0,029 cM entre les marqueurs F24D7.9 et F24D7.13. Ces deux marqueurs délimitent le gène Rfo physiquement dans 22 kb sur la séquence du BAC
64-16-7. L'intervalle de séquence F24D7.9/F24D7.13 inclut les gènes codant pour trois protéines appartenant à la famille des protéines PPR (Fig. 4), désignés PPR-A, PPR-B et PPR-C. Il en découle que l'activité restauratrice est codée soit par le gène A
soit par le géne B soit par le gène C ou par la combinaison d'au moins deux de ces génes.
Matériel et méthodes Matériel végétal On a produit deux descendances en ségrégation pour le gène Rfo. Des familles F4 ont été produites à partir de génotypes hétérozygotes de radis (radis D), provenant d'Asie.
Une descendance F2 de 20 000 graines a été obtenue à partir d'hybrides Fl entre une lignée Européenne de radis (7ms) mate stérile et un génotype de radis homozygote pour le gène Rfo (D81.8) choisi parmi la famille F3 de radis D.
Méthode AFLP et mise au point de marqueurs CAPS
L'analyse AFLP (Vos et al., 1995) a été effectuée sur des échantillons d'ADN
de plantes mâle stériles et mâle fertiles (Giovanni et al. 1991 ; Michelinore et al., 1991), selon le protocole Keygene N.V. (Wageningen, Pays-Bas) en utilisant des enzymes de restrictions PstI et MseI, et un jeu d'amorces correspondant aux adaptateurs PstI et MseI avec deux ou trois nucléotides sélectifs à
l'extrémité 3' respectivement. Afin de convertir les marqueurs AFLP en marqueurs spécifiques de PCR, les produits ALFP ont été séparés des gels d'acrylamide dans lesquels ils étaient détectés initialement, puis réamplifiés par PCR, en utilisant les mêmes amorces et conditions que pour l'amplification AFLP, puis clonés en utilisant le vecteur pGEM-T easy (Promega). Les sëquences des fragments clonés ont été
comparées au génome d'Arabidopsis tlaaliataa en utilisant le programme BLAST.
Des amorces spëcifiques ont été conçues à partir de cette première séquence AFLP et ont été utilisées pour amplifier l'ADN de parents mâle fertile ou mâle stérile.
Les deux produits d'amplification différents ont été séquencés et comparés entre eux.
Les amorces spécifiques ont été conçues autour de la région présentant un polymorphisme entre le radis mâle fertile et mâle stérile, de manière à
détecter ce polymorphisme par une amplification PGR ou par une digestion après PCR.
Lorsqu'aucun polymorphisme de séquence n'a été trouvé entre les deux parents, la séquence AFLP a été amplifiée par PCR en utilisant le kit Clontech (Universal Genome Walker Kit). Différents fragments d'ADN génomique liés à un adaptateur ont été construits selon le protocole du fabricant ((Universal Genome Walker, Clontech, USA). Deux enzymes de restriction, DraI et EcoRV ont été
utilisés séparément pour générer deux types de fragments ADN. Deux amorces séquence-spécifique externes et emboîtées ont été conçues à proximité de chaque extrémité du marqueur connu .AFLP. Des amplifications primaire et secondaire ont été
réalisées avec les amorces séquences spécifiques et les amorces adaptateurs. Les principaux produits PCR ont ëté isolés et séquencés. Le polymorphisme identifié entre les deux parents dans ces séquences amplifiées a permis la mise au point de marqueurs PCR
dominants et codominants PréRaration d'ADN~our analyse PCR â haute définition Des plantes ont été cultivées dans des plaques de 104 puits (3 x 3 cm, Ets.
Baan, France) pendant 2 à 3 semaines.
Des j eunes feuilles ont été collectées dans des plaques de 96 puits (puits de ml, Costar, Corning) contenant des billes de verre (diamèire 3 mm, Polylabo), 3 billes par puits, et lyophilisées. Les plaques ont été rendues étanches à l'aide de joint Easy Peel (ABgene), et les feuilles lyophilisées ont été placées avec les billes dans un mélangeur.
L'ADN a été extrait à l'aide de 600 ~.L d'un tampon d'extraction contenant 0,5 M NaCI, 0,1 M Tris, 50 mM EDTA, et 20 mM de sodium metabisulfite (ajouté
avant l'utilisation). Les plaques ont été rendues étanches à l'aide de joints appropriés (Corning inc, NY, USA), et incubées dans un bain marie à 95°C pendant une heure.
Les plaques ont été centrifugées à 3000 rpm pendant 20 minutes. Le surnageant (280 ~,L) est transféré dans des plaques de 96 puits (0,65 mL par puits, ABgene, Advanced Biotechnbologies), contenant 35 ~,L d'acétate d'ammonium 10 M, 280 ~L d'iso-propanol, et mélangé. Les plaques sont centrifugées à 3000 rpm pendant 30 minutes.
Le surnageant est décanté par retournement de la plaque, les précipités d'ADN
sont lavés avec de l'éthanol 70% et séchés à l'air par incubation à 60°C
pendant environ 20 minutes. Les précipités d'ADN sont re-suspendus dans SO ~,L de tampon TE â
pH
8.0 contenant 25 p,glmL de RNase, à faible agitation à 37°C pendant une heure.
Construction de la banque BAC de radis~Zhang et al, 1995) Pour l'isolement d'ADN de haut poids moléculaire, sans contamination par de l'ADN cytoplasmique, les noyaux sont isolés â partir de feuilles de radis âgées de 10 jours et inclus dans un gel d'agarose. L'ADN est alors partiellement digéré
avec EcoRI et HindIII. Pour une digestion partielle par restriction, les morceaux d'agarose sont séparés en quatre ou huit morceaux puis incubés sur de la glace pendant une heure avec seulement du tampon de digestion de restriction (tampon enzymatique +
spermidine + BSA), puis avec l'enzyme de restriction qui est ajoutée à
différentes concentrations pour 30 minutes supplémentaires sur la glace et à 37°C
pendant environ 30 minutes. La réaction est arrêtée par addition d'EDTA O,SM. Les morceaux sont chargés sur un gel d'agarose à faible point de fusion 1% (Seakem agarose...) puis soumis à une ëlectrophorèse CHEF dans un CHEF DRII (BioRad), dans un tampon 1X TAE (10 h à 4,4Vlcm avec 3,Ss de durée d'interruption initiale et finale, et 5 heures à 4,SV/cm avec 2s pour temps d'interruption initiale et finale, à
12°C).
Les zones de compression contenant l'ADN d'approximativement 100 à 2001cb sont séparées du gel. Une deuxième sélection de taille est effectuée : la bande séparée est soumise à une seconde migration dans les mêmes conditions d'électrophorèse.
Ensuite l'ADN est élué de l'agarose par électro élution dans un tampon TAE 1X
(4h30 à 6V/cm avec 50s pour temps d'interruption initiale et finale). Après dialyse utilisant du TloEl, l'ADN est quantifié sur un gel d'agarose 0,6%.
L'ADN de radis sélectionné par la taille (x-y ng) en attente est lié à un vecteur pGUCI desphosphorylé et digéré par HindIII ou EcoRV (10 à 50 ng) avec l0U de ligase T4, à 16° pendant 16 heures, dans un volume total de 50~L. La ligature est dialysée à nouveau avec du TioEo.l, en utilisant un filtre à membrane Millipore 0,025 ~,m, pendant 2 heures à température ambiante dans une boîte de Pétri.
La transformation de cellules DH10B est effectuée par électroporation (BRL
Cell Parator) en utilisant 20~.L de cellules électro-compétentes, et 3~.L de mélange de ligature. Les cellules sont incubées pendant 1 heure à 37°C dans 0,4mL
de milieu SOC (0,5% d'extrait de levure, 2% de triptone, lOmM NaCl, 2,5mM KC1, lOMm MgClz, 10 mMMgS04, 20mM glucose), puis étalées sur des plaques d'agar LB
contenant 12,S~g/mL de chloramphénicol, 40~glmL Xgal et 0,12mg/mL de Il'TG.
Les plaques sont incubées pendant 24 heures à 37°C.
Des colonies blanches sont prélevées (Robot Q-Bot, Genetix) et transférées individuellement dans des plaques de micro titration à 384 puits (Genetix) contenant du milieu de conservation (36mM de K2HPO4, 13,2mM de KHZPOø, l,7mM de citrate de Na, 6,8mm de NH42S04, 0,4mM MgSOa, 4,4%V/V glycérol, 12,5p.g/mL
chloramphénicol, dans un milieu LB), puis cultivées une nuit à 37°C et conservées à -80°C.
117 120 clones ont été obtenus, 63 100 provenant de la restriction par EcoRI
et 81 020 provenant de la restriction par HindIII.
L'ADN plasmidique de 70 clones choisis au hasard est isolé (N.D. Young and Associates) et digéré avec Notl, et la taille des inserts est déterminée par électrophorèse CHEF, dans 0,5X TBE (18h à 6V/cm, avec 0,8s pour durée d'interruption initiale, 25s pour durée d'interruption finale, à 12°C).
La taille moyenne des inserts moyenne est de plus de 1001çb, avec la répartition suivante 13,2% avec une taille entre 150 et 200kb, 51,5% entre 100 et 150kb, 33,8%
entre 50 et 100kb, et 1,5% moins de de 501cb.
Criblage de la bangue BAC de radis Tous les 117 120 clones de la banque sont organisés sur 305 plaques à 384 puits. Poux chacun des 384 puits, les colonies sont transférées d'abord sur de l'agar LB puis dans une nouvelle plaque de 384 puits avec du milieu de conservation, pour dupliquer la banque. Après croissance une nuit à 37°C, les colonies sur les plaques LB sont récoltées à l'aide de 25.1 (à vérifier) de H20dd et l'ADN plasmidique est isolé en utilisant une méthode de lyse alcaline (N.B. Young).
L'ADN isolé des 384 colonies d'une plaque représente un pool. Afin d'identifier les clones BAC individuels portant les marqueurs CAPS, les pools sont criblés. Une fois qu'une plaque individuelle est identifiée, on prépare deux duplicata de cette plaque sur de l'agar LB ; tous les clones correspondant à chacune des colonnes sont prélevés ensemble à partir du premier duplicat et la PCR est réalisée sur ces 24 mélanges de clones. Après identification d'une colonne positive, on effectue une PCR sur chacune des 16 colonies correspondantes de cette colonne, de manière à
identifier un clone BAC positif.
Expériences de complémentation fonctionnelle.
Les inventeurs ont en outre mis au point un protocole pour sous cloner les gènes du cluster PPR à partir du clone BAC 64-16-7. Le sous-clonage de chaque gène PPR
(candidat pour Rfo) est effectué dans le vecteur binaire pEC2, afin de réaliser des expériences de transgénèse de plantes de colza mâle stériles et démontrer que c'est le gène candidat qui restaure effectivement la fertilité rnale.
1. PPR A : le clone BAC 64-16-7 est digéré par les enzymes de restriction NdeI
et SpeI et le fragment de 6,5 kb est rendu « blunt end » et cloné dans le site BcimHI
(rendu blunt end) du vecteur binaire. Ce fragment contient la partie codante de la PPR
A, 2,6 kb en amont et 1,8 kb en aval.
2. PPR B : le clone BAC 64-16-7 est digéré par l'enzyme de restriction SpeI et le fragment de 7,1 kb est rendu « blunt end » et cloné dans le site BafnHI (rendu blunt end) du vecteur binaire. Ce fragment contient la partie codante de la PPR B, 3,1 lcb en amont et 1,9 kb en aval.
3 PFR C : le clone BAC 64-16-7 est digéré par les enzymes de restriction BanzHI et SpeI (rendu « blunt end ») et le fragment de 7,5 kb est cloné dans le site BanzHI-HindIII (rendu blunt end) du vecteur binaire. Ce fragment contient la partie codante de la PPR C, 2 kb en amont et 3,6 kb en aval 4. PPRA et PPRB : le clone BAC 64-16-7 est digéré par l'enzyme de restriction BstEII et BamHI et le fragment de 21 kb est rendu « blunt end » et cloné dans le site BanzHI (rendu blunt end) du vecteur binaire. Ce fragment contient la PPR B et Ia PPRA.
entre deux segments chromosomiques entre des espèces étroitement liées. Divers études ont montré que des régions de grandes tailles, y compris des chromosomes, peuvent étre colinéaires, tandis que dans d'autres études, seulement certaines régions petites, limitées à quelques centimorgans, présentent une colinéarité (synthèse Schmidt, 2000 ; Schmidt 2002).
Plus particulièrement, les inventeurs ont réussi à obtenir des résultats significatifs dans l'identification et le clonage du locus Rfo impliqué dans la restauration de la fertilité, en utilisant une stratégie de cartographie génétique et physique et de clonage positionnel et en étudiant la microsynténie entre Arabidopsis et le radis.
Les inventeurs ont ainsi réussi à identifier les gènes codant des protéines issues de la famille des protéines PPR (classe de protéines présentant plusieurs répëtitions d'un motif appelé pentatricopeptide), capables de restaurer la fertilité chez des plantes Brassica porteuse du cytoplasme Ogura et/ou Kosena.
L'invention a pour objet selon un premier aspect une séquence peptidique PPR
(pentatricopeptide) capable de restaurer la fertilité mâle de plantes, comprenant au moins une séquence choisie parmi a) SEQ m N° 1 (protéine PPR désignée PPR-A), ou SEQ ID N°2 (protéine PPR
désignée PPR-B), ou SEQ >D N°3 (protéine PPR-C) b) une séquence peptidique homologue comportant au moins 80% d'identité
avec une séquence du a), c) un fragment peptidique biologiquement actif représentatif d'une séquence du a) ou b).
Par l'expression « restaurer la fertilité », on entend que la fertilité mâle obtenue chez une plante dans laquelle on a induit l'expression de PPR-A et/ou PPR-B et/ou PPR-C
(ou l'expression des variants de ces protéines indiqués en b) ou c)) est d'au moins 20, de préférence d'au moins 50, 70, 80, 90 % du niveau de fertilité d'une plante ne portant pas le cytoplasme inducteur de stérilité.
Par séquence peptidique homologue, on entend toute séquence peptidique qui diffère de la séquence SEQ m N° 1 ou SEQ ll~ N° 2 et SEQ m N° 3 par substitution, délétion, et/ou inserüon d'un acide aminé ou d'un nombre réduit d'acides aminés, à
des positions telles que ces séquences peptidiques homologues constituent une protéine PPR ayant une activité restaurateur de fertilité telle que décrite précédemment.
De préférence, une telle séquence peptidique homologue est identique à au moins 80 de la séquence SEQ ID N° 1 ou SEQ ID N°2 ou SEQ ID N°3, de préférence au moins 85, 90, 92, 95, 98, 99% de la séquence issue de la séquence nucléotidique matrice présentée dans les séquences SEQ ID N° l, SEQ ID N° 2 et SEQ ID N°3.
Par « fragment peptidique représentatif » de SEQ ID N°l, on entend tout fragment de la séquence SES ID N° 1 ou des séquences peptidiques homologues de la séquence SEQ ID N° l, qui conduit à la restauration de la fertilité définie précédemment.
Ces fragments peptidiques présentent typiquement au moins 100 acides aminés, de préférence au moins 300, 400, 500 acides aminés consécutifs de la séquence dont ils sont issus.
Ces fragments ont une activité restauratrice de fertilité de préférence d'au moins 20, 30, 50, 80 , 90%, voire plus de 100%, de l'activité restauratrice obtenue avec SEQ m N°l, ou SEQ ID N°2 ou SEQ ID N°3. Pour tester cette activité restauratrice des fragments, l'homme du métier dispose de méthodes connues, comme par exemple la fabrication de plantes transformées selon la méthode décrite ci après.
L'invention concerne ainsi les « variants naturels », c'est à dire les peptides PPR
restaurateurs de fertilité ou leurs fragments pouvant exister naturellement, correspondant notamment à des troncatures, substitutions, délétions et/ou additions de résidus d'acides aminés. Ces variants naturels, sont issus en général du polymorphisme génétique de la population, et ont une activité qui n'est pas substantiellement modifiée par rapport au peptide sauvage.
L'invention concerne aussi les peptides PPR comprenant au moins une mutation. Par « mutation », on entend désigner n'importe quel changement intervenu dans la séquence de peptides PPR, autres que ceux présents dans ses variants naturels, et/ou dans ses homologues, tout en conservant une activité restauratrice de fertilité.
Les méthodes de typage des polymorphismes des gènes PPR sont variables en fonction du type de polymorphisme faisant appel à
- la technique de PCR-RFLP (amplification suivie de digestion enzymatique du produit de PCR) quand le polymorphisme était situé sur un site de restriction enzymatique.
- PCR avec amorces spécifiques du site polymorphe : amplification différentielle des deux allèles en utilisant des amorces spécifiques de chaque allèle.
On peut aussi utiliser des tests de ligation d'oligonucléotides (ligation différentielle) qui utilisent des oligonucléotides spécifiques de chaque allèle, la ligation étant suivie d'une électrophorèse en gel de polyacrylamide. On peut aussi utiliser des techniques de détection des SNP (single nucleotid polymorphism).
L'invention concerne également une séquence nucléotidique isolée, codant pour une sëquence peptidique ci-dessus.
En particulier cette séquence peut être choisie parmi aune séquence nucléotidique choisie parmi SEQ ID N°4 (séquence nucléotidique codant pour SEQ ID N°1 et désignée pp~ A), ou SEQ ID N°5 (séquence nucléotidique codant pour SEQ ID N°2 et désignée ppr-B), ou SEQ ID
N°6 (séquence nucléotidique codant pour SEQ ID N°3 et désignée ppr-G~, b) une séquence nucléotidique complémentaire d'une séquence du a), c)une séquence nucléotidique homologue hybridant dans des conditions stringentes avec une séquence du a).
Il doit être compris que la présente invention ne concerne pas les séquences nucléotidiques génomiques dans leur environnement chromosomique naturel, c'est-à-dire à (état naturel, il s'agit de séquences qui ont été isolées, c'est-à-dire qu'elles ont été prélevées directement ou indirectement, par exemple par copie (ADNc), leur environnement ayant été au moins partiellement modifië. Par "séquence nucléique", on entend un fragment d'ADN et/ou d'ARN naturel isolé, ou de synthèse, désignant un enchaînement précis de nucléotides, modifiés ou non, permettant de définir un fragment, un segment ou une région d'un acide nucléique.
Par "séquence nucléotidique homologue", on entend toute séquence nucléotidique qui diffère de la séquence SEQ ID N° 4 ou SEQ ID N°5 ou SEQ ID
N°6 par substitution, délétion, et/ou insertion d'un nuclëotide ou d'un nombre réduit de nucléotides, à des positions telles que ces séquences nucléotidiques homologues codent une protéine PPR ayant une activité restauratrice de fertilité telle que décrite précédemment. De préférence, une telle séquence nucléotidique homologue est identique à au moins 80 de la séquence SEQ m N° 4 ou SEQ m N°5 ou SEQ m N°6, de préférence au moins 85, 90, 92, 95, 98, 99%.
L'invention couvre les séquences nucléotidiques qui en raison de la dégénérescence du code génétique codent pour des protéines PPR ayant la séquence d'aminoacides des protéines de séquence a) à c) ci-dessus.
L'invention couvre les séquences nucléotidiques variants alléliques, notamment des séquences SNP.
Par <e pourcentage d'identité » entre deux séquences d'acides nucléiques (ou peptidiques), on entend désigner un pourcentage de nucléotides (ou d'aminoacides) identiques entre les deux séquences à comparer, obtenu après le meilleur alignement, ce pourcentage ëtant purement statistique et les différences entre les deux sëquences étant réparties au hasard et sur toute leur longueur. L'alignement optimal des séquences pour la comparaison peut être réalisé à l'aide d'algorithmes mathématiques. D'une manière préférée, non limitative, on peut citer différents algorithmes rappelés dans Altschul et al (1998) notamment les algorithmes présentés dans Altschul et al (1990), Karlin et Altschul (1993) . On pourra utiliser par exemple les programmes -BLAST, notamment BLASTN, BLAST2 (Tatusova et al., 1999 ), gapped BLAST
(Altschul et al., 1997), ou -FASTA (Altschul et al., 1990).
De manière préférentielle, une telle séquence nucléotidique homologue hybride spécifiquement à la séquence complémentaire de la séquence SEQ ID N° 4 ou SEQ
ID N°5 ou SEQ ID N°6, dans des conditions stringentes. Les paramètres définissant les conditions de stringence appropriées sont connues de l'homme du métier, notamment décrites dans Ausubel et al. (1995). De préférence, les conditions d'hybridation spécifiques ou de forte stringence seront telles qu'elles assurent la détection d'au moins 90%, de préférence 95% ou de préférence 99% d'identité
entre fane des deux séquences et la séquence complémentaire de l'autre.
L'invention concerne également les séquences nucléotidiques mutées dans la mesure où elles comportent au moins une mutation ponctuelle et de préférence au plus 10%
de mutation, sans altérer significaüvement l'activité PPR à l'origine de la restauration de fertilité.
L'ïnvention concerne également des sondes ou amorces, qui peuvent être utilisées dans des procédés de détection, d'identification, de dosage ou d'amplification de séquences nucléiques ci-dessus. Ces procédés peuvent faire intervenir 'des techniques connues de l'homme du métier, y compris les techniques d'amplification du type PCR utilisant des amorces nucléotidiques correspondant à des portions de la séquence SEQ m N° 4 ou SEQ ID N°5 ou SEQ ID N°6,.
Une amorce se définit, au sens de l'invention, conune étant un fragment d'acide nucléique simple brin ou un fragment double brin dénaturé comprenant au moins bases, de préférence au moins 15, 30 bases, utilisable pour amplifier une séquence nucléotidique ci-dessus.
Une sonde se définit, au sens de l'invention, comme étant un fragment d'acide nucléique simple brin ou un fragment double brin dénaturé comprenant au moins bases, de préférence au moins 15, 30 bases, et possédant une spécificité
d'hybridation dans des conditions déterminées pour former un complexe d'hybridation avec un acide nucléique cible. De telles sondes ou amorces seront en particulier utilisables dans des programmes de sélection assistée par marqueur, par exemple pour suivre l'introgression dans une plante d'un gène codant une protéine PPR selon l'invention.
Avantageusement, ces sondes ou amorces sont spécifiques des séquences correspondantes à l'alléle restaurateur de la fertilité mâle en ce sens qu'elles ne s'hybrident pas aux séquences correspondantes à l'allèle mainteneur de stérilité en condition de forte stringence.
De préférence, selon la longueur des oligonucléotides utilisés à cet effet, la température pour la réaction d'hybridation est comprise entre environ 25 et 65°C, en particulier entre 35 et 65°C dans une solution saline à une concentration d'environ 0,8 à 1 M. L'appariement avec les sondes spécifiques de l'invention peut s'effectuer à des températures supërieures à 50°C pour 1 à 2 mM MgCl2. La température d'hybridation d'un oligonucléotide étant calculée sur la base de 2°C par A ou T et de 4°C par G ou C, un oligonucléotide constitué par exemple d'une combinaison de 7 A et 5 C
s'hybride à 34°C. Cette règle bien connue par l'homme du métier permet de calculer la température d'hybridation envïsageable pour toutes les sondes ou amorces selon l'invention.
De préférence, les sondes conformes à l'invention peuvent être utilisées pour l' analyse d' échantillons de matériel génétique extraits de plantes à tester, ce peut être par exemple des analyses de type Southern ou Northena. Elles peuvent également être utilisées pour la détection ire situ de l'allèle recherché, par exemple des techniques de type FISH (Fluorescence in situ hybridization) ou BAC FISH (Hybridation ih situ sur clone BAC), etc.. .
Ainsi, dans un autre aspect, l'invention porte sur des kits de détection comprenant au moins une sonde et/ou amorce telle que définie précëdemment et des moyens de détection de 1a présence ou de l'absence de l'hybridation spécifique. Ces kits peuvent être utilisés dans des méthodes de détection basées sur l'amplification par PCR.
L'amplification peut porter, à partir du matériel génétique de la plante à
tester, sur la séquence responsable de la restauration de la fertilité mâle des plantes porteuses du cytoplasme inducteur de stérilité. Les conditions d'amplification seront définies selon le couple d'amorces choisi de manière à ce que ledit couple d'amorces ne s'hybride qu'avec sa séquence complémentaire présente dans l'allèle recherché.
L'amplification par les amorces comprises dans le kit permet de détecter la présence de la séquence d'intérêt dans la plante testée.
L'invention concerne également une construction nucléotidique, destinée à être introduite dans une plante dont on souhaite restaurer la fertilité, comprenant au moins une séquence nucléotidique décrite ci-dessus codant pour une protéine PPR à
activité
restauratrice de fertilité et une séquence promotrice capable de commander l'expression de cette séquence en quantité suffisante pour restaurer la fertilité.
Par protéine PPR à activité restauratrice de fertilité, on entend au moins une séquence peptidique a) à c) telle que définie ci-dessus. Avantageusement, des constructions nucléotidiques combinant au moins deux séquences PPR selon l'invention peuvent être utilisées pour la transformation des plantes stériles, et de manière préférentielle, une constTUCtion contenant à la fois les trois séquences PPR selon l'invention liées au promoteur endogène de la PPRB ou encore au promoteur LEA sont utilisés pour lesdites transformations. On pourra en particulier introduire dans une plante des séquences nucléotidiques codant pour au moins une des protéines PPR-A et PPR-B
et PPR-C (ou des protéines homologues ou des fragments représentatifs de PPR-A et PPR-B et PPR-C).
On rappelle qu'un promoteur est une séquence nucléotidique qui est capable de moduler ou contrôler le niveau de transcription d'un gène sous le contrôle de ce promoteur, et qui permet (ou fournit un site pour) la liaison de l'ARN
polymérise lors de la transcription. La position d'un promoteur est définie par rapport au site du début de la transcription. On connaît des séquences promoteurs consensus retrouvées chez les promoteurs de plantes, en particulier une boîte TATA située environ 19 à
27 bases en amont de ce site et une boîte CAAT située environ 70 à 80 bases en amont de ce site.
On pourra également utiliser des séquences nucléotidiques régulatrices, ne faisant pas partie du promoteur, et susceptibles de moduler l' expression du gëne de fertilitë, en particulier - des séquences leaders et des séquences enhancers, qui interviennent à un niveau post-transcriptionnel ou iraductionnel (notamment stabilisation d'ARN et effet sur la traduction), par exemple le leader EMCV (Elroy-Stein et al, 1989) et le leader TMV (Galbe et al., 1989).
- des boîtes de régulation intervenant à un niveau transcriptionnel, capables de commander au moins partiellement l'activité d'un promoteur ; ces dernières boites de régulation peuvent être inductibles par un facteur physiologique ou de l'environnement de la plante.
Le promoteur utilisé pourra être un promoteur constitutif (ce promoteur contrôle l'expression du gène Rfo dans l'ensemble des tissus de la plante), ou spécifique des anthères et suffisaient actif pour contrôler l'expression du gène Rfo spécifiquement dans les anthères (un tel promoteur est capable de contrôler l'expression d'ARN ou de polypeptides PPR dans les anthères à un niveau suffisant pour obtenir la production de pollen fonctionnel et une restauration de la fertilité ; on pourra par exemple utiliser le promoteur LEA (Hughes et Galau, 199 et 1991) ou le promoteur spécifique des Brassica décrit dans le brevet US 5 356 799).
Selon une réalisation, le promoteur est choisi parmi des promoteurs de gènes PPR de radis clonés et séquencés.
La préparation d'une telle construction ADN peut être réalisée de différentes manières appropriées par l'homme du métier. Brièvement, au moins une partie du gène Rfo capable de restaurer la fertilité (de préférence une séquence codant pour PPR-A ou PPR-B ou PPR-C) peut être clonée en aval du promoteur en utilisant des enzymes de restriction pour assurer son insertion dans une orientation appropriée au regard du promoteur de manière qu' elle soit exprimée. Une fois cet ADN
d'intérêt lié
opérationnellement au promoteur, la construction ainsi formée peut être clonée dans un plasmide ou un autre vecteur. La séquence promoteur contrôle la transcription du gène d'intérêt en un ARN messager fonctionnel. La construction nucléotidique préparée comprend typiquement également une région de terminaison de la transcription.
On comprend en outre que l'on peut transférer une construction nucléotidique comprenant non seulement un promoteur lié opérationnellement à un gène d'intërêt, mais aussi au moins une séquence capable de modifier l'activité du promoteur, en particulier une séquence enhancer et/ou une séquence leader.
Selon un autre aspect l'invention concerne un vecteur de clonage et/ou d'expression comprenant une construction nucléotidique telle que décrite précédemment.
Selon un autre aspect l'invention concerne une cellule hôte transformée avec les séquences nucléotidiques décrites ci-dessus.
L'invention vise également des anticorps capables de reconnaître spécifiquement les polypeptides selon l'invention ou tout fragment de ces derniers. Les anticorps sont produits par des méthodes bien connues de l'homme de métier basées sur la production naturelle d'anticorps en réaction contre l'introduction d'un polypeptide étranger à l'organisme en l'occurrence le polypeptide défini par la séquence SEQ ID
N°1, 2 ou 3, tout fragment de ces derniers ou tout polypeptide dérivé
ayant la même fonction physiologique dans la plante. De préférence, lesdits anticorps sont capables de reconnaître spécifiquement un polypeptide correspondant à l'allèle restaurateur de la fertilité.
Lesdits anticorps peuvent être utilisés dans des tests d'immunochimie pour détecter dans une population de plantes la présence des polypeptides définis par les séquences SEQ ID N° 1, 2 ou 3 ou des polypeptides dérivés. Parmi les techniques d'immunochirnie pouvant être utilisëes pour détecter les polypeptides définis ci-dessus ou tout polypeptide variant, on peut citer l'utilisation dans les tests ELISA
(Enzyme linked irnmuno-sorbent assay), les tests de Western-blots ainsi que les tests d'imrnunolocalisation in-situ. L'invention porte donc aussi sur un kit de détection de l'allèle restaurateur de fertilité dans les plantes comprenant un anticorps défini ci-dessus.
Selon un autre aspect l'invention concerne les cellules végétales transformées par un vecteur tel que dëfimi précédemment, à l'aide d'un hôte cellulaire susceptible d'infecter lesdites cellules végétales en permettant l'intégration dans le génome de ces dernières, des séquences nucléotidiques codant pour des protéines PPR
notamment A et B et C initialement contenues dans le vecteur utilisé.
Le terme transformation fait référence à une manipulation génétique de cellules végétales susceptibles d'être transformées telles que par exemple des cellules de cals, d'embryons, des cellules en suspension dans des cultures (cultures issues par exemple de cals, d'embryons, de tissus de feuilles, d'inflorescences jeunes, d'anthères).
Une plante transgénique Bf~assica peut être obtenue par différentes techniques de transformation de dicotylédones connues de l'homme du métier incluant, de manière non limitative, le transfert d'ADN médié par AgYObacte~ium tumefaciens, en utilisant un vecteur portant un ADN-T désarmé, ou des méthodes de transfert direct telles que les méthodes de transformation de protoplastes ou les méthodes biolistiques.
Les techniques pour cultiver et régénérer des plantes entières à partir des tissus ainsi transformés sont connues de l'homme du métier, par exemple décrites dans les références Hansen et Wright (1999), Komari et al. (1998). Les techniques de génie génétique pour la transformation génétique de cellules ou de tissus végétaux seront utilisëes pour le transfert d'une construction nucléotidique comprenant une séquence peptidique PPR, un promoteur, le cas échéant des séquences de terminaison de transcription. La transformation de plantes B~assica est notamment décrite dans Plant Cell Reports, 8 :238-242, 1989 ; Guerche P. et Primard C. (1995), Wang K, Herrera-Estrella A, Van Montagu Eds, Sertes Editor : James Lynch, Moloney M.M et al., (1989), et Bonadé-Bottino M. (1993).
La présente invention inclut les plantes génétiquement transformées par un vecteur conforme à l'invention. Ces plantes comprennent la construction nucléotidique ou le vecteur tels qu.e définis ci-dessus, lesquels comprennent toute ou partie d'une des séquences dëfiriies par les séquences SEQ m N°4 à SEQ m N°6.
Préférentiellement, les plantes transformées objets de la présente invention sont issues de plantes qui sont mâle-stériles avant transformation.
La prësente invention peut être mise en oeuvre dans le cadre de 1a sélection assistée par marqueurs (SAM). Cette méthode de sélection est bien plus efficace qu'une simple évaluation phénotypique puisque tous les loci correspondant à
différents caractères d'intérêt peuvent être analysés ensemble sur un seul échantillon d'ADN, indépendamment des conditions de culture de la plante échantillonnée. La sélection assistée par marqueurs permet de mettre en oeuvre les techniques de rétrocroisements accélérés consistant à suivre l'introgression de la séquence restauratrice objet de l'invention par la visualisation de l'hybridation avec une sonde ou de l'amplification avec un couple d'amorces. L'invention concerne ainsi également un procédé de dëtection des sëquences restauratrices chez des plantes, de préférence chez des crucifères et de manière privilégiée chez les plantes du genre BYassica.
La présente invention, concerne également un procédé d'utilisation du gëne Rfo dans un schéma de production d'hybrides à partir d'une plante restauratrice obtenue selon l'invention. La production d'hybrides nécessite le croisement entre une lignée mainteneuse amëliorée « A » et une lignée restauratrice améliorée « B »
obtenue selon la présente invention. Ceci permet d'obtenir rapidement des hybrides fertiles comportant les caractëristiques agronomiques intëressantes du parent « A » et du parent « B ».
Le procédé, objet de l'invention a pour avantage de n'introgresser que le gène Rfo en s'affranchissant des séquences adjacentes présentes dans le locus restaurateur originaire du radis et ainsi de supprimer dans la lignée restauratrice améliorée B et chez les hybrides les effets pléïotropiques de ces séquences entraînant des problèmes de verse accrue, de taux élevé de glucosinolates dans les graines, de fertilité femelle et de baisse de rendement.
Les techniques et les agents pour sélectionner les cellules végétales et/ou les tissus végétaux incorporant des séquences nucléotidiques marqueurs associées au gène d'intérêt sont également bien connues de l'homme de métier, et comprennent, de manière non exclusive, l'utilisation de gènes marqueurs tels que des gènes conférant des résistances à un antibiotique ou à des herbicides, ou d'autres systèmes de sélection positive, cités par exemple dans Gelvin 1998, en particulier le système basé
sur une sélection sur mannose, en présence du gène de la MPI (Mannose-6-phosphate isornérase) {Hansen et Wright, 1999), ou de systèmes de sélection couplés à
l'élimination des gènes marqueurs après sélection (Ebinuma et al., 1997). Les plantes transformées peuvent également être sélectionnées par criblage PCR en l'absence de gènes marqueurs de sélection (McGarvey et Kaper, 1991).
L'invention concerne également les tissus ou parties de plantes, plantes, ou graines contenant les séquences d'acide nucléique Rfo selon l'invention. Le terme "tissu de plante" fait rëférence à n'importe quel tissu d'une plante, dans une plante ou dans une culture. Ce terme inclut des plantes entières, des cellules de plantes, des organes de plantes, des graines de plantes, des protoplastes, des cals, des cultures de cellules et toutes autres cellules de plantes organisées en tant qu'unité fonctionnelle et/ou structurelle. Des parties de plantes régénérées telles que des fleurs, des graines, des feuilles, des tiges, des fruits, du pollen, des tubercules et analogues sont également dans le cadre de l'invention.
L'invention inclut des plantes transgéniques fertiles obtenues ainsi que leur descendance et le produit de cette descendance. Les plantes transgéniques hybrides, obtenues par le croisement d'au moins une plante selon l'invention avec une autre, font aussi partie de l'invention. Les plantes transgéniques selon l'invention comprennent notamment une plante transgénique T0 ou R0, c'est-à-dire la première plante régénérée à partir de cellules transformées, la plante transgénique Tl ou R1 c'est-à-dire la première génération de descendance, et les plantes de la descendance de générations suivantes obtenues qui comprennent et expriment de manière suffisante l'ADN Rfo pour restaurer la fertilité.
Pour confirmer ia présence de la construction nucléotidique selon l'invention, dans les plantes régénérées, on peut utiliser un grand nombre de techniques appropriées, par exemple l'analyse PCR ou des techniques d'hybridation Southern blot, pour déterminer la structure de l'ADN recombinant, la détection de l'ARN transcrit à partir de l'ADN du gène d'intérêt exprimé dans des cellules des anthères de plantes transformées, à l'aide de techniques Northern blot ou d'amplification RT-PCR, des techniques de repérage de la production de la protéine codée par le gène d'intérêt, telles que l'électrophorèse de protéines sur gel, des techniques Western blot.
Selon un autre aspect l'invention concerne un procédé d'obtention d'une plante exprimant au moins une partie du gène Rfo et présentant un phénotype mâle fertile, résultant de l'introduction d'une construction telle que décrite précédemment, dans au moins une cellule de plante, puis la culture de la cellule ainsi transformée de manière à régénérer une plante contenant dans son génome ladite cassette d'expression.
L'invention concerne ainsi également un procédé de restauration de la fertilité d'une plante Brassica, caractérisé en ce qu'il comprend l'introduction dans une plante mâle stérile d'une séquence nucléotidique codant pour une protéine PPR. Plus spécialement, la protéine PPR est une protéine de séquence choisie parmi les séquences peptidiques a) à c) définies précédemment, préférentiellement PPR-A, PPR-B ou PPR-C. On comprend que l'invention couvre un tel procédé utilisant au moins une séquence nucléotidique obtenue par un procédé de criblage de séquences issues du gène R_f'o et capables de restaurer la fertilité. Il s'agit en particulier de séquences nucléotidiques définies en a) à c) ci-dessus. L'homme du métier dispose dans la présente demande des techniques de criblage appropriées.
On peut également construire des plans de croisement tels que ceux dëcrits dans la demande US 0220083483 faisant intervenir un gène inducteur de stërilité mâle puis un gène restaurateur de fertilité.
Selon une réalisation, la plante est Brassica hapus.
L'invention concerne également un procédé d'introduction d'un gène restaurateur de fertilité issu d'une plante de radis, dans une plante Brassica, caractérisé en ce qu'il comprend le croisement ou la fusion cellulaire entre la plante Brassica exprimant un gène de stérilité mâle cytoplasmique Ogura etlou Kosena, qui induit la stérilité de cette plante BYassica et une plante exprimant au moins une partie de gène Rfo et présentant un phénotype mâle fertile, de manière à introduire le gène Rfo restaurateur de fertilité dans la plante du genre BYassica et à obtenir une plante hybride à fertilité
restaurée, la partie du gène Rfo introduite comprenant de préférence une séquence codant pour PPR-A ou PPR-B ou PPR-C.
On peut introduire une séquence codant pour PPR-A, PPR-B ou PPR-C
individuellement, ou des séquences codant pour PPR-A et/ou PPR-B etJou PPR-C
simultanément pour obtenir la restauration de la fertilité mâle. On entend bien entendu aussi des variants ou fragments fonctionnels de PPR-A, PPR-B ou PPR-C.
L'invention concerne aussi l'utilisation d'au moins une séquence nucléotidique codant pour PPR-A ou PPR-B ou PPR-C (ou un variant peptidique fonctionnel défini précédemment), pour restaurer la fertilité chez les B~assica.
L'invention concerne aussi un procédé d'obtention de semences hybrides par croisement entre une plante restauratrice de fertilité obtenue par un procédé
ci-dessus et une plante mâle stérile.
L'invention concerne aussi un procédé de criblage de séquences nucléotidiques polymorphes capables de restaurer la fertilité, caractérisé en ce qu'il comprend - la détermination de la restauration obtenue avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N°1, SEQ ID N°2, SEQ ll~
N°3 - la détermination de la restauration obtenue avec une séquence nucléotidique candidat (variant de SEQ D~ N°4, SEQ ID N°5, SEQ ff~ N°6) - la sélection de candidats permettant d'obtenir au moins 20°1°, de préférence au moins 80,90%, voire plus de 100% de la restauration avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N°1, SEQ a?
N°2, SEQ
m N°3.
L'invention concerne aussi un procédé de criblage pour détecter la présence d'une séquence nucléotidique codant pour une protéine PPR dans une plante, caractérisé en ce qu'il comprend une étape d'amplification utilisant au moins une séquence amorce telle que définie précédemment et/ou une étape d'hybridation utilisant au moins une séquence sonde telle que définie précédemment.
L'invention concerne aussi un procédé de production de variétés hybrides de colza dont la fertilité mâle est restaurée comprenant l'introduction d'une séquence nucléotidique selon l'invention dans une plante colza mâle stérile utilisée comme géniteur mâle et exprimant le gène PPR et le croisement entre ladite plante avec une lignée de colza male stërile utilisée conune femelle, et production de la variété
hybride issue du croisement.
L'invention couvre les semences hybrides dont la fertilité est restaurée par le gène PPR obtenues à partir des plantes obtenue par le procédé décrit plus haut et également l'utilisation d'une plante exprimant les séquences nucléotidiques selon l'invention pour restaurer de la fertilité d'une lignée de colza utilisée comme femelle dans un croisement ou dans la production de semences d'une variété hybride.
Dans un autre aspect, (invention porte sur un vecteur de clonage et/ou d'expression comprenant une séquence nucléotidique isolée telle que décrite ci-dessus.
L'invention porte également sur une cellule hôte recombinante caractérisée en ce qu'elle est transformée avec ce vecteur recombinant. La cellule hôte recombinante peut être choisie parmi les cellules eucaryotes ou procaxyotes, par exemple les bactéries, notamment E. coli ou Agrobacterium, par exemple Ag7-obacte~iurra tumefaciens, les levures, les cellules animales et préférentiellement les cellules végétales, plus spécificiquement les' cellules de brassicacées.
Dans tin aspect préférë, (invention vise un organisme multicellulaire végétal recombinant comprenant une cellule recombinante mentionné précédemment.
L'invention porte également sur une plante transgénique transformée avec un vecteur décrit plus haut. Cette plante transgénique est par exemple porteuse du cytoplasme inducteur de stérilité mate cytoplasmique transformée par le vecteur mentionné
ci-dessus. On pourra choisir la plante transgénique parmi les plantes des espèces suivantes : Brassica oleacera, Brassica napus, Brassica campestris ou encore Raphanus sativus.
L'invention se rapporte également à une construction nucléotidique, caractérisée en ce qu'elle consiste en les séquences SEQ ID N°4, SEQ ID N°5 et SEQ
ID N°6 liée opérationnellement à une séquence promotrice. Par séquence promotrice, on entend une séquence comprenant un ou plusieurs éléments de régulation de la.
transcription.
Cette séquence promotrice peut également inclure un ou plusieurs éléments insulateurs et/ou enhancers. De manière avantageuse, le promoteur choisi est le promoteur endogène de 1a PPR ou d'autres promoteurs spécifiques de plantes endogènes ou exogènes. Par promoteurs spécifiques de plante, on entend par exemple tout promoteur permettant une expression optimale des séquences de l'invention chez les plantes. A titre, d'exemple, on peut utiliser le promoteur CaMV35S ou GRE.
D'autres avantages de l'invention apparaîtront lors de la description détaillée qui suit, illustrée par les dessins dans lesquels ;
- la figure lA représente une cartographie des marqueurs étroitement liés au locus Rfo chez le radis.
- la figure 1B représente des résultats des tests BLAST avec les marqueurs AFLP par rapport au génome A.thaliaha.
- la figure 2 représente l'analyse de la microsynténie autour du locus Rfo entre le radis et A~abidopsis. La carte génétique est basée sur l'analyse de 6900 plantes en ségrégation avec Rfo. La carte physique d'AYabidopsis est déduite de la base de données AGI. Les traits sombres localisent physiquement les marqueurs sur le BAC d'A~abidopsis et les flèches les localisent sur la carte génétique.
- La figure 3 représente une carte haute résolution génétique et physique à
proximité du locus Rfo. A : contigs de BAC d'A.thaliasza correspondant à la région synthénique du locus Rfo (position des marqueurs indiquée par les triangles). B : carte génétique du locus Rfo chez le radis. C : contigs de BAC
de radis représentant la carte physique du locus Rfo. Les positions des marqueurs sont déterminées par cartographie génétique en utilisant les recombinants. On entend par recombinant une plante dont le génotype présente une recombinaison des marqueurs caractéristiques des parents de la population autour de Rfo. Le nombre de recombinants est indiqué sur la carte physique entre les marqueurs. La position des marqueurs sur les contigs BAC
est indiquée par des lignes pointillées verücales. Le locus Rfo est indiqué
par une bande noire. Le BAC 64-16-7, positif avec les marqueurs flanquant Rfo, délimite physiquement le locus Rfo.
- La figure 4 représente une carte physique du BAC 64-16-7 et une prédiction des gènes à partir de sa sëquence en utilisant le programme GENSCAN. La position, le nom et l'orientation des gènes sont indiqués par des bandes orientées. Les gènes ont été obtenus par comparaison avec le génome d'Arabidopsis. La position des marqueurs étroitement liés au gène Rfo est indiquée par les flèches verticales.
- La figure 5 montre des fleurs issues des lignées transgéniques Ogura cms Tanto et contrôle non transgénique. Dans la figure SA, les fleurs sont issues d'une plante transgénique restaurée montrant des anthères normale et une production de pollen. Dans la figure SB, les fleurs sont issues d'une plante non transgénique servant de témoin (contrôle non transgénique) montrant des filaments courts et les cavités de l'anthère (« locules ») vides sans pollen.
Les pétales ont été enlevés des deux fleurs pour une meilleure analyse des résultats.
De plus, dans liste de séquences, Ia séquence SEQ ID N°7 est une séquence de 22770 paires de bases comprise entre les marqueurs flanquants le cluster de PPR (les marqueurs M-F24-D7.9 et M-F24-D7.13).
La séquence nucléotidique des 3 PPR est extraite, dans l'ordre PPR C, PPR B, PPR
A.
Les séquences SEQ ID N° 8 à SEQ ID N° 31 correspondent aux séquences des amorces utilisées pour identifier les marqueurs de la figure 3 dans le sens de lecture S'-> 3'. L'ATG, le stop, ou les introns ont été prédits avec le logiciel informatique sur la séquence de référence de 22770 paires de bases.
Exemple 1 : Identification de la séquence peptidique PPR (pentatricopeptide) capable de restaurer la fertilitë mâle de plantes.
On décrit maintenant la méthode utilisée par les inventeurs. Ils ont d' abord identifié
des séquences génomiques de radis liées au locus Rfo. Ces marqueurs moléculaires ont été utilisés pour identifier des séquences d'Arabidopsis. La carte génétique obtenue autour de Rfo a été précisée en identifiant un grand nombre de plantes recombinantes à proximité du locus Rfo. On a alors utilisé une banque de BAC
du génome de radis pour construire une carte physique du locus sur laquelle un segment de 22 kb portant le gène Rfo a été identifié. Il en découle que le gène Rfo est un membre de la famille des gènes PPR.
Correspondance.~démontrée à l'aide de marqueurs, entre le locus Rfo du radis et certaines séauences du chromosome 1 d'A~abidopsis.
Le gène restaurateur de fertilité Rfo du radis a été cartographié et des marqueurs AFLP associés au gène Rfo ont été identifiés. Les inventeurs ont montré
que, à proximité du gène Rfo, la colinéarité de séquence entre le radis et Ay~abidopsis est limitée a un intervalle réduit. L' analyse AFLP a été faite en combinaison avec une analyse de ségrégation. L'ADN étudié est obtenu à partir de la descendance issue d'un croisement entre une lignée de radis Européen mâle stérile, 7ms, et une lignée de radis homozygote pour le gène Rfo. Dans cette analyse, 800 combinaisons d'amorces PstI-MseI ont été étudiées pour déterminer le polymorphisme, et trois marqueurs nouveaux AFLP, désignés R3, R15 et R5, ont été identifiés comme directement associés au gène Rfo. R3 et R15 sont parfaitement liés au gène Rfo dans une population de plus de 900 plantes en ségrégation, et RS se situe à 0,1 cM de Rfo (Fig.
1). Les marqueurs R3 et R15 sont homologues à des séquences portées par le BAC
F24D7 d'A~abidopsis par analyse BLAST, dans une région génomique de 20 kb, et le marqueur RS se retrouve dans la même région 150 kb plus loin. Il en découle que l'ADN génomique du radis à proximité du locus Rfo est probablement colinéaire avec l'ADN d'A~abidopsis du BAC F24D7.
Les marqueurs dérivés du chromosome 1 d'Arabidopsis se situent à proximité
du gène Rfo chez le radis.
D'autres tests de colinéarité de séquence entre le chromosome 1 d'Arabidopsis et le locus Rfo chez le radis ont fait intervenir des marqueurs PCR
dérivés de six clones BAC d'ölrabidopsis, couvrant une distance physique de kb. Les marqueurs ont été choisis dans des séquences codantes (CDS) prédites AGI .
Pour chaque marqueur, les amorces ont été choisies dans des axons, pour augmenter les chances d'amplification de l'ADN du radis. Les amorces sont également en bordure d'un intron présumé, de manière à augmenter les chances d'identifier un polymorphisme entre des radis mâle fertile et mâle stérile. Dans cette analyse, les amorces sont issues de 60 CDS et la PCR a été effectuée sur AYabidopsis et sur le radis fertile et stérile (tableau 1). Ces marqueurs ont été cartographiés par rapport au gène Rfo dans le radis. Dans cette première analyse, 11 marqueurs polymorphes entre le radis fertile et stérile ont été identifiés. Les marqueurs M-T12P18.15, M-F24D7.4, M-F24D7.9, M-F24D7.13, M-F24D7.16, M-F24D7.17, M-F2K11.1 sont strictement liés génétiquement avec le gène Rfo. Le marqueur M-F2K11.19 se situe à 0,6 cM
du gène Rfo . De l'autre côté, les marqueurs M-F22C12.1 et M-T12P18.9 se situent à 0.2 cM et 0,1 cM du gène Rfo respectivement. Les séquences des différentes amorces utilisées SEQ ID N°8 à SEQ ID N°31 sont indiquées dans la liste des séquences annexée.
Il découle de ces analyses que le gène Rfo est délimité génétiquement entre les marqueurs M-F2K11.19 et M-T12P18.9.
Construction d'une carte énéti ue à haute résolution du locus Rfo du radis.
Afin de positionner plus précisément les marqueurs liés avec le gène Rfo, il a été nécessaire d'identifier des plantes recombinantes pour les marqueurs à
proximité
du locus Rfo. Ce procédé impliquait l'analyse d'échantillons d'ADN de 6907 plantes dans les populations de marquage avec les marqueurs flanquants Rfo M-T12P18.9 et M-F2K11.19. Afin d'améliorer l'efficacité et la précision du criblage, les allèles amplifiés avec M-T12P18.9 et M-F2K11.19 ont été clonés, séquencés à partir de lignées fertile et stérile de radis et des amorces allèles-spécifiques ont été
conçues.
Les inventeurs ont ainsi conçu deux paires d'oligonuclëotides capables d'amplifier spécifiquement les locus M-T12P18.9 et M-F2K11.19 de la lignée fertile (respectivement SEQ ID N°8 et SEQ )D N°9 et SEQ Il7 N°28 et SEQ 117 N°29). Les plantes présentant des événements de recombinaison étroitement associés au gène Rfo ont été identifiées comme des lignées portant seulement le marqueur M-T12P18.9 ou le marqueur M-F2K11.19 liës en cis au gène Rfo.
Lors de cette analyse, 43 plantes présentant des événements de recombinaison dans l'intervalle M-T12P18.9 et M-F2K11.19 ont été identifiées. Ces plantes ont été
utilisées pour cartographier les marqueurs entre eux et par rapport au gène Rfo. Dans cette analyse, le gène Rfo a été cartographié dans un intervalle génétique de 0,029 cM
délimité par les marqueurs M-F24D7.13 et M-F24D7.9 (fig. 2). La construction d'une banque de BAC de radis homozygote pour le locus Rfo, et l'identification de fragment d'ADN portant les marqueurs flanquants du gène Rfo M-F24D7.13 et M-24D7.9, est le seul moyen fiable d'identifier et de cloner le gène Rfo.
Construction d'une carte physic~ue à haute résolution du locus Rfo chez le radis.
Afin de déterminer avec certitude la micro colinéarité entre le radis et A~abidopsis dans l'intervalle génétique M-F2K11.19 et M-T12P18.9, une banque de BAC a été construite à partir d'ADN nucléaire dérivé d'une lignée de radis homozygote pour le gène Rfo. La banque est constituée de 120 000 clones. Afin de vérifier la fiabilité de la banque, la taille des inserts de 100 clones BAC
échantillonnés au hasard a été déterminée par digestion avec NotI et PFGE. La taille des inserts varie entre 100 kb et 200 kb. La banque représente au moins 23 fois le génome haploïde du radis.
En utilisant une méthode systématique basée sur la PCR, la banque a été
criblée avec des marqueurs étroitement liés au gène Rfo (M-F16M19.21, M-F2K11.19, M-F2K11.1, R15, M-T12P18.9 et M-F22C12.1), et les BAC positifs ont été identifiés et isolés. Les clones BAC ont été alignés et ordonnés en une seule contig. L'ordre des clones BAC dans la contig est compatible avec la cartographie génétique des marqueurs autour du gène Rfo. Dans cette analyse, le locus Rfo a été
localisé physiquement sur un clone BAC, le BAC 64-16-7, positif avec les marqueurs flanquants du gène Rfo (Fig. 3).
Analyse de la séquence du BAC 64-16-7 Le BAC 64-16-7 (référencé SEQ ID N°32) a été séquencé en utilisant une technique de séquençage par « shotgun », et la séquence a été assemblée en une seule contig de 127 kb. La redondance de la séquence était d'au moins 10 fois la longueur de la sëquence du BAC. Deux tests supplémentaires ont été effectués pour vérifier la qualité de la séquence consensus. Premièrement, la carte de restriction prédite a été
comparée avec l'empreinte du BAC 64-16-7 et les résultats ont été cohérents.
De plus, les sëquences des marqueurs associés au gène Rfo ont été alignées avec la séquence du BAC 64-16-7, et on a pu vérifier que l'ordre génétique des marqueurs correspondait à l'ordre physique sur la séquence.
A l'issue de l'analyse génétique, le gène Rfo est localisé dans un intervalle génétique de 0,029 cM entre les marqueurs F24D7.9 et F24D7.13. Ces deux marqueurs délimitent le gène Rfo physiquement dans 22 kb sur la séquence du BAC
64-16-7. L'intervalle de séquence F24D7.9/F24D7.13 inclut les gènes codant pour trois protéines appartenant à la famille des protéines PPR (Fig. 4), désignés PPR-A, PPR-B et PPR-C. Il en découle que l'activité restauratrice est codée soit par le gène A
soit par le géne B soit par le gène C ou par la combinaison d'au moins deux de ces génes.
Matériel et méthodes Matériel végétal On a produit deux descendances en ségrégation pour le gène Rfo. Des familles F4 ont été produites à partir de génotypes hétérozygotes de radis (radis D), provenant d'Asie.
Une descendance F2 de 20 000 graines a été obtenue à partir d'hybrides Fl entre une lignée Européenne de radis (7ms) mate stérile et un génotype de radis homozygote pour le gène Rfo (D81.8) choisi parmi la famille F3 de radis D.
Méthode AFLP et mise au point de marqueurs CAPS
L'analyse AFLP (Vos et al., 1995) a été effectuée sur des échantillons d'ADN
de plantes mâle stériles et mâle fertiles (Giovanni et al. 1991 ; Michelinore et al., 1991), selon le protocole Keygene N.V. (Wageningen, Pays-Bas) en utilisant des enzymes de restrictions PstI et MseI, et un jeu d'amorces correspondant aux adaptateurs PstI et MseI avec deux ou trois nucléotides sélectifs à
l'extrémité 3' respectivement. Afin de convertir les marqueurs AFLP en marqueurs spécifiques de PCR, les produits ALFP ont été séparés des gels d'acrylamide dans lesquels ils étaient détectés initialement, puis réamplifiés par PCR, en utilisant les mêmes amorces et conditions que pour l'amplification AFLP, puis clonés en utilisant le vecteur pGEM-T easy (Promega). Les sëquences des fragments clonés ont été
comparées au génome d'Arabidopsis tlaaliataa en utilisant le programme BLAST.
Des amorces spëcifiques ont été conçues à partir de cette première séquence AFLP et ont été utilisées pour amplifier l'ADN de parents mâle fertile ou mâle stérile.
Les deux produits d'amplification différents ont été séquencés et comparés entre eux.
Les amorces spécifiques ont été conçues autour de la région présentant un polymorphisme entre le radis mâle fertile et mâle stérile, de manière à
détecter ce polymorphisme par une amplification PGR ou par une digestion après PCR.
Lorsqu'aucun polymorphisme de séquence n'a été trouvé entre les deux parents, la séquence AFLP a été amplifiée par PCR en utilisant le kit Clontech (Universal Genome Walker Kit). Différents fragments d'ADN génomique liés à un adaptateur ont été construits selon le protocole du fabricant ((Universal Genome Walker, Clontech, USA). Deux enzymes de restriction, DraI et EcoRV ont été
utilisés séparément pour générer deux types de fragments ADN. Deux amorces séquence-spécifique externes et emboîtées ont été conçues à proximité de chaque extrémité du marqueur connu .AFLP. Des amplifications primaire et secondaire ont été
réalisées avec les amorces séquences spécifiques et les amorces adaptateurs. Les principaux produits PCR ont ëté isolés et séquencés. Le polymorphisme identifié entre les deux parents dans ces séquences amplifiées a permis la mise au point de marqueurs PCR
dominants et codominants PréRaration d'ADN~our analyse PCR â haute définition Des plantes ont été cultivées dans des plaques de 104 puits (3 x 3 cm, Ets.
Baan, France) pendant 2 à 3 semaines.
Des j eunes feuilles ont été collectées dans des plaques de 96 puits (puits de ml, Costar, Corning) contenant des billes de verre (diamèire 3 mm, Polylabo), 3 billes par puits, et lyophilisées. Les plaques ont été rendues étanches à l'aide de joint Easy Peel (ABgene), et les feuilles lyophilisées ont été placées avec les billes dans un mélangeur.
L'ADN a été extrait à l'aide de 600 ~.L d'un tampon d'extraction contenant 0,5 M NaCI, 0,1 M Tris, 50 mM EDTA, et 20 mM de sodium metabisulfite (ajouté
avant l'utilisation). Les plaques ont été rendues étanches à l'aide de joints appropriés (Corning inc, NY, USA), et incubées dans un bain marie à 95°C pendant une heure.
Les plaques ont été centrifugées à 3000 rpm pendant 20 minutes. Le surnageant (280 ~,L) est transféré dans des plaques de 96 puits (0,65 mL par puits, ABgene, Advanced Biotechnbologies), contenant 35 ~,L d'acétate d'ammonium 10 M, 280 ~L d'iso-propanol, et mélangé. Les plaques sont centrifugées à 3000 rpm pendant 30 minutes.
Le surnageant est décanté par retournement de la plaque, les précipités d'ADN
sont lavés avec de l'éthanol 70% et séchés à l'air par incubation à 60°C
pendant environ 20 minutes. Les précipités d'ADN sont re-suspendus dans SO ~,L de tampon TE â
pH
8.0 contenant 25 p,glmL de RNase, à faible agitation à 37°C pendant une heure.
Construction de la banque BAC de radis~Zhang et al, 1995) Pour l'isolement d'ADN de haut poids moléculaire, sans contamination par de l'ADN cytoplasmique, les noyaux sont isolés â partir de feuilles de radis âgées de 10 jours et inclus dans un gel d'agarose. L'ADN est alors partiellement digéré
avec EcoRI et HindIII. Pour une digestion partielle par restriction, les morceaux d'agarose sont séparés en quatre ou huit morceaux puis incubés sur de la glace pendant une heure avec seulement du tampon de digestion de restriction (tampon enzymatique +
spermidine + BSA), puis avec l'enzyme de restriction qui est ajoutée à
différentes concentrations pour 30 minutes supplémentaires sur la glace et à 37°C
pendant environ 30 minutes. La réaction est arrêtée par addition d'EDTA O,SM. Les morceaux sont chargés sur un gel d'agarose à faible point de fusion 1% (Seakem agarose...) puis soumis à une ëlectrophorèse CHEF dans un CHEF DRII (BioRad), dans un tampon 1X TAE (10 h à 4,4Vlcm avec 3,Ss de durée d'interruption initiale et finale, et 5 heures à 4,SV/cm avec 2s pour temps d'interruption initiale et finale, à
12°C).
Les zones de compression contenant l'ADN d'approximativement 100 à 2001cb sont séparées du gel. Une deuxième sélection de taille est effectuée : la bande séparée est soumise à une seconde migration dans les mêmes conditions d'électrophorèse.
Ensuite l'ADN est élué de l'agarose par électro élution dans un tampon TAE 1X
(4h30 à 6V/cm avec 50s pour temps d'interruption initiale et finale). Après dialyse utilisant du TloEl, l'ADN est quantifié sur un gel d'agarose 0,6%.
L'ADN de radis sélectionné par la taille (x-y ng) en attente est lié à un vecteur pGUCI desphosphorylé et digéré par HindIII ou EcoRV (10 à 50 ng) avec l0U de ligase T4, à 16° pendant 16 heures, dans un volume total de 50~L. La ligature est dialysée à nouveau avec du TioEo.l, en utilisant un filtre à membrane Millipore 0,025 ~,m, pendant 2 heures à température ambiante dans une boîte de Pétri.
La transformation de cellules DH10B est effectuée par électroporation (BRL
Cell Parator) en utilisant 20~.L de cellules électro-compétentes, et 3~.L de mélange de ligature. Les cellules sont incubées pendant 1 heure à 37°C dans 0,4mL
de milieu SOC (0,5% d'extrait de levure, 2% de triptone, lOmM NaCl, 2,5mM KC1, lOMm MgClz, 10 mMMgS04, 20mM glucose), puis étalées sur des plaques d'agar LB
contenant 12,S~g/mL de chloramphénicol, 40~glmL Xgal et 0,12mg/mL de Il'TG.
Les plaques sont incubées pendant 24 heures à 37°C.
Des colonies blanches sont prélevées (Robot Q-Bot, Genetix) et transférées individuellement dans des plaques de micro titration à 384 puits (Genetix) contenant du milieu de conservation (36mM de K2HPO4, 13,2mM de KHZPOø, l,7mM de citrate de Na, 6,8mm de NH42S04, 0,4mM MgSOa, 4,4%V/V glycérol, 12,5p.g/mL
chloramphénicol, dans un milieu LB), puis cultivées une nuit à 37°C et conservées à -80°C.
117 120 clones ont été obtenus, 63 100 provenant de la restriction par EcoRI
et 81 020 provenant de la restriction par HindIII.
L'ADN plasmidique de 70 clones choisis au hasard est isolé (N.D. Young and Associates) et digéré avec Notl, et la taille des inserts est déterminée par électrophorèse CHEF, dans 0,5X TBE (18h à 6V/cm, avec 0,8s pour durée d'interruption initiale, 25s pour durée d'interruption finale, à 12°C).
La taille moyenne des inserts moyenne est de plus de 1001çb, avec la répartition suivante 13,2% avec une taille entre 150 et 200kb, 51,5% entre 100 et 150kb, 33,8%
entre 50 et 100kb, et 1,5% moins de de 501cb.
Criblage de la bangue BAC de radis Tous les 117 120 clones de la banque sont organisés sur 305 plaques à 384 puits. Poux chacun des 384 puits, les colonies sont transférées d'abord sur de l'agar LB puis dans une nouvelle plaque de 384 puits avec du milieu de conservation, pour dupliquer la banque. Après croissance une nuit à 37°C, les colonies sur les plaques LB sont récoltées à l'aide de 25.1 (à vérifier) de H20dd et l'ADN plasmidique est isolé en utilisant une méthode de lyse alcaline (N.B. Young).
L'ADN isolé des 384 colonies d'une plaque représente un pool. Afin d'identifier les clones BAC individuels portant les marqueurs CAPS, les pools sont criblés. Une fois qu'une plaque individuelle est identifiée, on prépare deux duplicata de cette plaque sur de l'agar LB ; tous les clones correspondant à chacune des colonnes sont prélevés ensemble à partir du premier duplicat et la PCR est réalisée sur ces 24 mélanges de clones. Après identification d'une colonne positive, on effectue une PCR sur chacune des 16 colonies correspondantes de cette colonne, de manière à
identifier un clone BAC positif.
Expériences de complémentation fonctionnelle.
Les inventeurs ont en outre mis au point un protocole pour sous cloner les gènes du cluster PPR à partir du clone BAC 64-16-7. Le sous-clonage de chaque gène PPR
(candidat pour Rfo) est effectué dans le vecteur binaire pEC2, afin de réaliser des expériences de transgénèse de plantes de colza mâle stériles et démontrer que c'est le gène candidat qui restaure effectivement la fertilité rnale.
1. PPR A : le clone BAC 64-16-7 est digéré par les enzymes de restriction NdeI
et SpeI et le fragment de 6,5 kb est rendu « blunt end » et cloné dans le site BcimHI
(rendu blunt end) du vecteur binaire. Ce fragment contient la partie codante de la PPR
A, 2,6 kb en amont et 1,8 kb en aval.
2. PPR B : le clone BAC 64-16-7 est digéré par l'enzyme de restriction SpeI et le fragment de 7,1 kb est rendu « blunt end » et cloné dans le site BafnHI (rendu blunt end) du vecteur binaire. Ce fragment contient la partie codante de la PPR B, 3,1 lcb en amont et 1,9 kb en aval.
3 PFR C : le clone BAC 64-16-7 est digéré par les enzymes de restriction BanzHI et SpeI (rendu « blunt end ») et le fragment de 7,5 kb est cloné dans le site BanzHI-HindIII (rendu blunt end) du vecteur binaire. Ce fragment contient la partie codante de la PPR C, 2 kb en amont et 3,6 kb en aval 4. PPRA et PPRB : le clone BAC 64-16-7 est digéré par l'enzyme de restriction BstEII et BamHI et le fragment de 21 kb est rendu « blunt end » et cloné dans le site BanzHI (rendu blunt end) du vecteur binaire. Ce fragment contient la PPR B et Ia PPRA.
5. PPR C et PPR B : le clone BAC 64-16-7 est digéré par les enzymes de restriction EcoRI et ApaI (rendus « blunt end ») et le fragment de 16,8 kb est cloné dans le site BanzHI (rendu « blunt end ») du vecteur binaire. Ce fragment contient la PPR C
et la PPR B ainsi que 2,4 kb en amont et 3,6 kb en aval '
et la PPR B ainsi que 2,4 kb en amont et 3,6 kb en aval '
6. PPR C et PPR A : Le clone 1 BAC 64-16-7 est digéré par Notl, (rendus «
blunt end » ) est ligué au fragment de 7,5 kb BamHI et SpeI, portant la PPRC (rendu « blunt end ») et décrit en 4. Ce clone chimérique exprimera la PPRA et la PPR C
blunt end » ) est ligué au fragment de 7,5 kb BamHI et SpeI, portant la PPRC (rendu « blunt end ») et décrit en 4. Ce clone chimérique exprimera la PPRA et la PPR C
7. PPR A, PPR B et PPR C : le clone BAC 64-16-7 est digéré indépendernment par les enzymes de restriction EcoRI (<a~endu « blunt end ») et Kpn et par KpnI et SaII
(« rendu blunt end »). Les 2 fragments EcoRI-KpnI et KpnI-SaII de respectivement 9,8 kb et 13,5 kb seront clonés simultanément dans le site BazrzHI (rendu «
blunt end ») du vecteur binaire. Ce fragment contient la PPR C, la PPR B et la PPR A
ainsi que 2,4 kb en amont et 2,4 kb en aval Ces constructions sont introduites ensuite dans la souche d'Agrobacteriurn tunzefaciens C58C1-PMP90 afin de réaliser l'expérience de transformation des
(« rendu blunt end »). Les 2 fragments EcoRI-KpnI et KpnI-SaII de respectivement 9,8 kb et 13,5 kb seront clonés simultanément dans le site BazrzHI (rendu «
blunt end ») du vecteur binaire. Ce fragment contient la PPR C, la PPR B et la PPR A
ainsi que 2,4 kb en amont et 2,4 kb en aval Ces constructions sont introduites ensuite dans la souche d'Agrobacteriurn tunzefaciens C58C1-PMP90 afin de réaliser l'expérience de transformation des
8 PCT/FR2003/003224 plantes de colza mâle stériles. Les premiers résultats indiquent l'activité
restauratrice de PPR-A, PPR-B , PPR-C et des combinaisons desdïtes séquences.
Selon une réalisation, les inventeurs développent des marqueurs moléculaires pour la sélection génétique et la caractérisation de germoplasmes.
La séquence nucléique présentée dans l'exemple suivant correspond à la séquence complète du BAC64 qui comprend les séquences restauratrices de la fertilité.
Des sondes peuvent être désignées sur la séquence nucléique adjacente aux séquences restauratrice de la fertilité. Ces sondes peuvent être utilisées dans un programme de sélection de lignées restauratrices de la fertilité ou suivre l'évolution du locus Rfo dans une collection de germoplasme pour l'identification de nouvelles séquences restauratrices. Ces séquences sondes dësignées sur le BAC64 ont la même importance que l'utilisation des séquences restauratrices dans la sélection assistée par marqueurs ou dans les programmes de caractérisation de germoplasmes. Cette utilisation inclut la recherche dans les banques de mutants de délétion de colza de lignées restaurées qui ont perdu par exemple les séquences du radis lies en cis aux séquences restauratrices de la fertilité. Ce travail peut se faire dans 1e but de diminuer, par exemple, la taille de l'ADN du radis introduite chez le colza.
Tableau 1:
SAC Fonction des gnes Nom des marqueurs F16M19 Facteur de Traxlscription *M-F16M19.21 "Scarecrow", prsum F2K11 Protine Kinsine-like *M-F2I~11.1 Rcepteur protine kinase, *M-F2K11.19 prsum F24D7 Aminopeptidase prsume *
M-F24D7.4 Protine hypothtique *M-F24D7.9 UDP-N actylinuramoylanalyl-D-*M_F24D7.13 glutamate-2-6-diaminoligase Facteur de transcription *M-F24D7.16 prsum Kinsine-like protine *M-F24D7.17 T12P18 monodhydroascorbate rductase M-T12P18.4 prsume Protine anneau doigt de zinc *M-T12P18.9 prsume *M-T12P18.15 Protine inconnue F22C12 Protine hypothtique *M-F22C12.1 Protine ATPase H+-transporteur,M_F22C 12.12 prsum F15H21 Acyl-Coa synthtase, prsum M-F15H21.7 Endo-beta-1,4-glucanase, M-F15H21.9 prsum Marqueurs montrant un polymorphisme entre le radis fertile et stérile.
w cn W ~ u. u..~L u. ~ ~ u..~
~
fn f~(n CO 11~L 11IL LLlL !LiL
O
~ N ~ ~ IL
v ".., t1:
T
a/ ~1 ~LLL ~.Lf~~ C~(~ ~i(~ ~ Ui V
N
O
w ~ u.~ u_.u~ cnc~ cncn cn~n U
V
w u. ~ u. u..~ u. ~ u. cncn cn~n h cn cnv~ v~ v~~n m cn u.~ ~ t~
a ~
_ 11 IL11 lL LL~1.I~IL 11f~ (~(~
d.
T
I
~~ N
~i i 'r: ~ M '' '~
i L ~ '-. ' r~
=
d. I,rW O M r COc N ~ D D D D D O
N Q ~ N
I
O h f-lL tL LLp u.LL 11IL u.IL
~
~
exemple 2 : Restauration fonctionnelle d'un Colza Ogura cms (stérile) avec une construction nucléotidique contenant PPR B
Afin de démontrer que le gène PPR est fonctionnel in vivo, celui-cï a été
exprimé
dans 3 lignées différentes de Colza de printemps de type Ogura cms.
Le fragment SpeI de 7.1 kb a été sous cloné pour générer des sites EcoRI et XhoI, puis cloné dans le vecteur binaire pSCVnosnptlI : Firek et al, Plant Mol Biol 22: 129-142 (1993), Karirn,for "pSCV nos nptII" see text of BAG37 (pl 1, exarnple 2)).
Le plasmide résultant nommé pSCV PPRB a été intégré dans la souche C58pMP90 d'AgYObacte~iufn tumefaciens (C Koncz & J Schell, MGG 204: 383-396 (1986): The promoter of T(L)-DNA gene 5 controls the tissue-specific expression of chimaeric genes carried by a novel type of Agrobacterium binary vector.) afin de servir à la transformation des plantes.
Les jeunes plantes d'Ogura cms des lignées Pactol, Tanto et Tatyoon ont été
transformées par ia méthode de transformation par Agrobacteriutn comme décrite dans Moloney et al. (Plant Cell Reports 8: 238-242, 1989).
Les pousses transgéniques putatives ont été identifiées par PCR par utilisation d'amorces dans le gène codant pour le marqueur de sélection NptII (Bevan et al.
( 1983), Natune, 304 :184-187) et à l'extrémité 3' du gène codant pour PPRB.
Le gène NptII confère la résistance à la kanamycine Les amorces confirment la présence des deux extrémités des ADN-T utilisés pour la transformation.
Les plantes transgéniques ont ensuite été transférées en serre et isolées pour éviter tout risque de pollinisation croisée.
21 plantes transgéniques ont été identifiées et ont donc été marquées pour leurs phénotypes.
Au début de la floraison, toutes les plantes ont été inspectées pour la présence d' anthères normales et matures et la production de pollen (Table 3, Figure S).
De plus, toutes les plantes ont été marquées à nouveau quelques semaines après le début de la floraison pour confirmer la présence de pollen fonctionnel pax la présence de graines. Toutes les plantes ayant été isolées les unes des autres, seules les lignées restaurées et fonctionnelles donneront des graines.
Toutes les plantes produisant du pollen produisent également au moins quelques gxaines, bien que la quantité de graines soit variable entre les plantes (Table 3).
Il est donc clairement démontré que l'intégration de PPR B dans le génome de la plante stérile (stérilité du type Ogura cms) restaure la fertilité.
Tableau 3: Fertilité des plantes O~ura crns transformées avec la construction nucléotidigue contenant le transgène PPRB mis en évidence par analyse PCR.
Quantit Quantit Quantit produisant donnant de du des graines igne PCR positifpollen Bon Pauvre Pactol 6 6 6 0 Tanto 12 10 5 5 Tatyoon 3 3 2 1 Des protocoles analogues contenant des constructions avec PPRA seul, PPRC seul et une construction PPR.A+PPRB+ppRC ont montrés les mêmes résultats de restaurations de la fertilité sur les plantes Ogura cms.
Références Altschul et al., 1990, Basic local alignment search tool, J. Mol, Biol., 215 (3): 403-410.
Altschul et al., 1997, Gapped BLAST and PSI-BLAST : a new generation of database search programs, Nucleic Acids Research 25 (17) :3389-3402.
Altschul et al., 1998, Fundamentals of database searching (review), Bioinformatics A trends Guide, 5 :7-9 Ausubel et al., 1995, eds.Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, N.Y.
Bannerot et al., 1974, 1977 Bellaoui et al., 1999 Bevan et al. (1983), Nature, 304 :184-187.
Bonadé-Bottino M. (1993), Thèse d'Etat. Université de Paris-Sud. Centre d'Orsay.
Budar et Pelletier 2001 Ebinuma H et al., 1997, Selection of marker-free transgenic plants using the isopentenyl transferase Bene. Proc Nat1 Acad Sci USA, 94 : 2117-2121.
Elroy-Stein et al., 1989, Cap-independent translation of mRNA conferred by encephalomyocarditis virus 5' sequence improves the performance of the vaccinia virus/bacteriophage T7 hybrid expression system. Proc. Natl. Acad. Sci. USA, 86:6126-6130.
Gelvin S. B, 1998, The introduction and expression of transgenes in plants.
Carrent Opinion in Biotechnology, 9:227-232.
Galbe et al., 1989 Gallie, D.R., Sleat, D.E., Watts, 3.W., Turner, P.V. and Wilson, T.M.A, 1987.
The 5' leader of tobacco mosac virus RNA enhances the expression of foreign gene transcripts in vitro and in vivo. Nucleic Acids Res. 15: 3257-3273.
Gelvin 1998 Giovanni et al. 1991 Grelon et al, 1994 Guerche P. et Primard C. (1995), Transformation of plants and soif microorganisms Firek et al, Plant Mol Biol 22: 129-142 (1993) Foisset et al., 1998 Hansen G. and M.S., 1999, Wright Recent advances in the transformation of plants .
Trends in Plant Science, 4:6:226-231.
Hellens R, Mullineaux P and Klee H, 2000. Technical Focus:A guide to Agrobacterium binary Ti vectors Trends in Plant Science, 5:446-451.
Heyn 1976 Hughes et Galau, 1989 et 1991 Iwabachi M (1999) Plant Mol Biol Jan ; 39 (1) :183-8 James Lynch, Cambridge University Press UK p125-136 Karlin et Altschul, 1993, Applications and statistics for multiple high-scoring segments in molecular sequences, Proc. Natl. Acad. Sci. USA 90:5873-5877.
Krishnasamy & Makaroff, 1994 Komari ., T., 'Y.Hiei, Y.Ishida, T. Kumashiro, T. Kubo 1998. Advances in cereal gene transfer. Carrent Opinion in Plant Biology, 1:161-165.
Koncz C & Schell J, MGG 204: 383-396 (1986): The promoter of T(L)-DNA Bene 5 controls the tissue-specific expression of chimaeric genes carried by a novel type of Agrobacterium binary vector.
McGarvey P, Kaper JM. 1991 A simple and rapid method for screening transgenic plants using the PCR. Biotechniques. 11: 428-32.
Michelmore et al., 1991 Moloney M.M et al., 1989, Plant Cell reports 8 : 238-242 Ob ra 1968 Pelletier et al., 1983 Schmidt, 2000 ; Schmidt 2002 Tatusova et al., 1999, "Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247-250.
Vedel et a1,1994).
Wang K, Herrera-Estrella A, Van Montagu Eds, Plant and Microbial Biotechnology Research Series Zhang et al, 1995 LISTE DE SÉQUENCES
<110> GENOPLANTE-VALOR
<120> Séquences peptidiques PPR capables de restaurer la fertilité
mâle de plantes porteuses d'un cytoplasme inducteur de stérilité mâle <130> D20657 <150> FR 02/l3 512 <151> 2002-10-29 <160> 34 <170> PatentIn Ver. 2.1 <210> 1 <211> 751 <212> PRT
<213> Raphanus sativus <400> 1 Met Leu Ala Arg Val Cys Arg Phe Glu Ser Ser Ser Ser Ser Ser Val Ser Ala Ala Arg Phe Phe Cys Thr Gly Ser Tle Arg His Ala Leu Ala Glu Lys Ser Arg Asp Gly Glu Ser Gly Glu Ala Gly Phe Arg Gly Glu Ser Leu Lys Leu Arg Ser Gly Ser Tyr Glu Ile Lys Gly Leu Glu Asp Ala Ile Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Ile Asp Phe Asn Lys Leu Met Gly Ala Val Val Arg Met Glu Arg Pro Asp Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys G1n Ile Arg Cys Asp Ile Tyr Ser Phe Thr Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Leu Thr Lys Leu Gly Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys Leu Asp His Arg Val Ser Glu Ala Leu Asp Leu Phe His Gln Ile Cys Arg Pro Asp Val Leu Thr Phe Thr Thr Leu Met Asn Gly Leu Cys Arg Glu Gly Arg Va1 Val Glu Ala Val Ala Leu Leu Asp Arg Met V a 1 Glu Asn Gly Leu Gln Pro Asp Gln Ile Thr Tyr Gly Thr Phe Val A sp Gly Met Cys Lys Met Gly Asp Thr Val Ser Ala Leu Asn Leu Leu Arg Lys Met Glu Glu Ile Ser His Ile Lys Pro Asn Val Val Ile Tyr S er Ala Ile Ile Asp Gly Leu Cys Lys Asp Gly Arg His Ser Asp Ser H i s Asn Leu Phe Ile Glu Met Gln Asp Lys Gly Ile Phe Pro Asn Ile V al Thr Tyr Asn Cys Met Ile Gly Gly Phe Cys Ile Ser Gly Arg Trp S e r Ala Ala Gln Arg Leu Leu Gln Glu Met Leu Glu Arg Lys Tle Ser Pro Asn Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val Lys Glu G 1 y Lys Phe Phe Glu Ala Ala Glu Leu Tyr Asp Glu Met Leu Pro Arg G1 y Ile Tle Pro Asn Thr Ile Thr Tyr Asn Ser Met Ile Asp Gly Phe Cy s Lys Gln Asp Arg Leu Asp Ala Ala Glu Asp Met Phe Tyr Leu Met A1 a Thr Lys Gly Cys Ser Pro Asp Val Phe Thr Phe Thr Thr Leu Ile As p Gly Tyr Cys Gly Ala Lys Arg Tle Asp Asp Gly Met Glu Leu Leu Hi s Glu Met Pro Arg Arg Gly Leu Val Ala Asn Thr Val Thr Tyr Asn Th r Leu Ile His G1y Phe Cys Leu Val Gly Asp Leu Asn Ala Ala Leu As p Leu Ser Gln Gln Met Ile Ser Ser Gly Val Cys Pro Asp Ile Val Th r Cys Asn Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys Leu Lys As p Ala Leu Glu Met Phe Lys A1a Met Gln Lys Ser Lys Met Asp Leu As p Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Leu Thr Tyr As n Ile Leu Ile Cys Gly Leu Ile Asn Glu Gly Lys Phe Leu Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln 5er Arg Leu Asp Glu Ala Thr Gln Met Phe Val Ser Met G1y Ser Lys Ser Phe Ser 565 570 ~ 575 Pro Asn Val Val Thr Phe Asn Thr Leu Ile Asn Gly Tyr Cys Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly Arg Arg Gly Ile Val Ala Asp Ala Ile Ile Tyr Ile Thr Leu Ile Tyr Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Tle Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Tle Thr Tle Arg Asn Met Leu Thr Gly Phe Trp Ser Lys Glu Glu Leu Glu Arg Ala Val Ala Met Leu Glu Asp Leu Gln Met Ser Val Gly Met Ser Phe Asn Thr Phe Cys Phe Gln Ile Ser Leu Leu Thr Phe Ile Ile Leu G1u Lys Ser Cys Ser Leu Cys Cys Ser Tle Arg G1u Thr Phe Leu Asn Glu Trp Phe Gly Val Phe Val Leu Gln G1y Ile Ser Trp Arg Met Asn Glu Arg Met Lys Asp Thr Phe Leu Phe Gln Ile Tyr Lys Ala Leu Leu Ile Leu Phe Cys Arg <210> 2 <211> 687 <212> PRT
<213> Raphanus sativus <400> 2 Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser 5er Pro Ala Glu Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala Lys Ala Ser Gly Glu 5er Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu Lys Leu Gln Ser G1y Phe His Glu Ile Lys Gly Leu Glu Asp Ala Tle Z~sp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Tle Arg Cys Asp Tle Tyr Ser Phe Asn Ile Leu Tle Lys Cys Phe Cys Ser Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Ile Thr Lys Leu Gly Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys Val Glu Asp Arg Val Ser Glu Ala Leu Asp Phe Phe His Gln Met Phe G lu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn G ly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu Leu Asp Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr Gly Thr z le Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala Leu Asn L eu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn Val Val L le Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg His 5er 260 265 . 270 Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro Asp Leu Phe Thr Tyr Asn Ser Met I1e Val Gly Phe Cys Ser Ser Gly Arg Trp Ser Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu Arg Lys I 1e Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu P ro Arg Gly Tle I1e Pro Asn Thr Ile Thr Tyr Ser Ser Met Ile Asp G ly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr L eu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Tle Thr Phe Asn Thr Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg Ile Asp Asp Gly Met Glu Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr Tyr Asn Thr Leu Tle His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp Ile Val Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys Leu Lys Asp Ala Leu Glu Met Phe Lys Val Met Gln Lys Ser Lys Lys Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser Arg Leu Asp Glu Ala Thr G1n Met Phe Asp Ser Met Gly Ser Lys 5er Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys Lys Ala Gly Arg Val Asp Asp G1y Leu Glu Leu Phe Cys Glu Met Gly Arg Arg Gly Ile Va1 A1a Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys Gly Phe Arg Lys Val Gly Asn I1e Asn Gly Ala Leu Asp Tle Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly <210 > 3 <211> 654 <212 > PRT
<213 > Raphanus sativus <400> 3 Met Leu Ala Arg Val Tyr Arg Ser Gly 5er 5er Ser Ser Pro Ala Val Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg His Ala Leu Ala 20 ~ 25 30 Lys Lys Ser Arg Asp Gly Glu Ser Gly Phe Gly Gly Glu Ser Leu Lys I~eu Arg Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile Asp I~eu Phe Gly Asp Met Val Arg Ser Arg Pro Leu Pro Ser Val Ile Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Gly Arg Leu Asp Val Val Ile Ser Leu His Arg Lys Met Glu Met Arg Arg Val Pro Cys Asn 100 l05 110 Ala Tyr Ser Phe Thr I1e Leu Met Lys Cys Phe Cys Ser Cys Ser Lys I~eu Pro Phe Ala Leu Ser Thr Phe Gly Lys Tle Thr Lys Leu Gly Phe His Pro Thr Val Val Thr Phe Ser Thr Leu Leu His Gly Leu Cys Val Glu Asp Arg Ile Ser Glu Ala Leu Asp Leu Phe His G1n Met Cys Lys Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn Gly Leu Cys Arg Glu G ly Arg Val Val Glu Ala Val Ala Leu Leu Asp Arg Met Leu Glu Asp G ly Leu Gln Pro Asn Gln Ile Thr Tyr Gly Thr Ile Val Asp Gly Met Cys Lys Met Gly Asp Thr Val Ser A1a Leu Asn Leu Leu Arg Lys Met G lu Glu Val Ser His Tle Lys Pro Asn Val Val Ile Trp Pro Leu Glu Arg Arg Thr Cys Met Ile Asn Gly Phe Cys Ser Ser Gly Arg Trp Ser G lu Ala Gln G1n Leu Leu Gln Glu Met Leu Glu Arg Lys Lys Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn A1a Phe Val Lys Glu G ly Lys Phe Phe Glu Ala Glu G1u Leu Tyr Asp Glu Met Leu Pro Arg Gly I 1e Ile Pro Ser Thr Ile Thr Tyr Ser Ser Met Tle Asp Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr Leu Met Ala T hr Lys Gly Cys Ser Pro Asp Ile Ile Thr Phe Asn Thr Leu Ile Ala G 1y Tyr Cys Arg Ala Lys Arg Val Asp Asp Gly Ile Lys Leu Leu His G 1u Met Thr Glu Ala G1y Leu Val Ala Asn Thr Ile Thr Tyr Thr Thr L e u Ile His Gly Phe Cys Gln Val Gly Asp Leu Asn Ala Ala Gln Asp L eu Leu Gln Glu Met Val Ser Ser Gly Val Cys Pro Asn Val Val Thr C ys Asn Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys Leu Lys Asp A1a Leu Glu Met Phe Lys Ala Met Gln Lys Ser Lys Met Asp Ile
restauratrice de PPR-A, PPR-B , PPR-C et des combinaisons desdïtes séquences.
Selon une réalisation, les inventeurs développent des marqueurs moléculaires pour la sélection génétique et la caractérisation de germoplasmes.
La séquence nucléique présentée dans l'exemple suivant correspond à la séquence complète du BAC64 qui comprend les séquences restauratrices de la fertilité.
Des sondes peuvent être désignées sur la séquence nucléique adjacente aux séquences restauratrice de la fertilité. Ces sondes peuvent être utilisées dans un programme de sélection de lignées restauratrices de la fertilité ou suivre l'évolution du locus Rfo dans une collection de germoplasme pour l'identification de nouvelles séquences restauratrices. Ces séquences sondes dësignées sur le BAC64 ont la même importance que l'utilisation des séquences restauratrices dans la sélection assistée par marqueurs ou dans les programmes de caractérisation de germoplasmes. Cette utilisation inclut la recherche dans les banques de mutants de délétion de colza de lignées restaurées qui ont perdu par exemple les séquences du radis lies en cis aux séquences restauratrices de la fertilité. Ce travail peut se faire dans 1e but de diminuer, par exemple, la taille de l'ADN du radis introduite chez le colza.
Tableau 1:
SAC Fonction des gnes Nom des marqueurs F16M19 Facteur de Traxlscription *M-F16M19.21 "Scarecrow", prsum F2K11 Protine Kinsine-like *M-F2I~11.1 Rcepteur protine kinase, *M-F2K11.19 prsum F24D7 Aminopeptidase prsume *
M-F24D7.4 Protine hypothtique *M-F24D7.9 UDP-N actylinuramoylanalyl-D-*M_F24D7.13 glutamate-2-6-diaminoligase Facteur de transcription *M-F24D7.16 prsum Kinsine-like protine *M-F24D7.17 T12P18 monodhydroascorbate rductase M-T12P18.4 prsume Protine anneau doigt de zinc *M-T12P18.9 prsume *M-T12P18.15 Protine inconnue F22C12 Protine hypothtique *M-F22C12.1 Protine ATPase H+-transporteur,M_F22C 12.12 prsum F15H21 Acyl-Coa synthtase, prsum M-F15H21.7 Endo-beta-1,4-glucanase, M-F15H21.9 prsum Marqueurs montrant un polymorphisme entre le radis fertile et stérile.
w cn W ~ u. u..~L u. ~ ~ u..~
~
fn f~(n CO 11~L 11IL LLlL !LiL
O
~ N ~ ~ IL
v ".., t1:
T
a/ ~1 ~LLL ~.Lf~~ C~(~ ~i(~ ~ Ui V
N
O
w ~ u.~ u_.u~ cnc~ cncn cn~n U
V
w u. ~ u. u..~ u. ~ u. cncn cn~n h cn cnv~ v~ v~~n m cn u.~ ~ t~
a ~
_ 11 IL11 lL LL~1.I~IL 11f~ (~(~
d.
T
I
~~ N
~i i 'r: ~ M '' '~
i L ~ '-. ' r~
=
d. I,rW O M r COc N ~ D D D D D O
N Q ~ N
I
O h f-lL tL LLp u.LL 11IL u.IL
~
~
exemple 2 : Restauration fonctionnelle d'un Colza Ogura cms (stérile) avec une construction nucléotidique contenant PPR B
Afin de démontrer que le gène PPR est fonctionnel in vivo, celui-cï a été
exprimé
dans 3 lignées différentes de Colza de printemps de type Ogura cms.
Le fragment SpeI de 7.1 kb a été sous cloné pour générer des sites EcoRI et XhoI, puis cloné dans le vecteur binaire pSCVnosnptlI : Firek et al, Plant Mol Biol 22: 129-142 (1993), Karirn,for "pSCV nos nptII" see text of BAG37 (pl 1, exarnple 2)).
Le plasmide résultant nommé pSCV PPRB a été intégré dans la souche C58pMP90 d'AgYObacte~iufn tumefaciens (C Koncz & J Schell, MGG 204: 383-396 (1986): The promoter of T(L)-DNA gene 5 controls the tissue-specific expression of chimaeric genes carried by a novel type of Agrobacterium binary vector.) afin de servir à la transformation des plantes.
Les jeunes plantes d'Ogura cms des lignées Pactol, Tanto et Tatyoon ont été
transformées par ia méthode de transformation par Agrobacteriutn comme décrite dans Moloney et al. (Plant Cell Reports 8: 238-242, 1989).
Les pousses transgéniques putatives ont été identifiées par PCR par utilisation d'amorces dans le gène codant pour le marqueur de sélection NptII (Bevan et al.
( 1983), Natune, 304 :184-187) et à l'extrémité 3' du gène codant pour PPRB.
Le gène NptII confère la résistance à la kanamycine Les amorces confirment la présence des deux extrémités des ADN-T utilisés pour la transformation.
Les plantes transgéniques ont ensuite été transférées en serre et isolées pour éviter tout risque de pollinisation croisée.
21 plantes transgéniques ont été identifiées et ont donc été marquées pour leurs phénotypes.
Au début de la floraison, toutes les plantes ont été inspectées pour la présence d' anthères normales et matures et la production de pollen (Table 3, Figure S).
De plus, toutes les plantes ont été marquées à nouveau quelques semaines après le début de la floraison pour confirmer la présence de pollen fonctionnel pax la présence de graines. Toutes les plantes ayant été isolées les unes des autres, seules les lignées restaurées et fonctionnelles donneront des graines.
Toutes les plantes produisant du pollen produisent également au moins quelques gxaines, bien que la quantité de graines soit variable entre les plantes (Table 3).
Il est donc clairement démontré que l'intégration de PPR B dans le génome de la plante stérile (stérilité du type Ogura cms) restaure la fertilité.
Tableau 3: Fertilité des plantes O~ura crns transformées avec la construction nucléotidigue contenant le transgène PPRB mis en évidence par analyse PCR.
Quantit Quantit Quantit produisant donnant de du des graines igne PCR positifpollen Bon Pauvre Pactol 6 6 6 0 Tanto 12 10 5 5 Tatyoon 3 3 2 1 Des protocoles analogues contenant des constructions avec PPRA seul, PPRC seul et une construction PPR.A+PPRB+ppRC ont montrés les mêmes résultats de restaurations de la fertilité sur les plantes Ogura cms.
Références Altschul et al., 1990, Basic local alignment search tool, J. Mol, Biol., 215 (3): 403-410.
Altschul et al., 1997, Gapped BLAST and PSI-BLAST : a new generation of database search programs, Nucleic Acids Research 25 (17) :3389-3402.
Altschul et al., 1998, Fundamentals of database searching (review), Bioinformatics A trends Guide, 5 :7-9 Ausubel et al., 1995, eds.Current Protocols in Molecular Biology, Chapter 2 (Greene Publishing and Wiley-Interscience, N.Y.
Bannerot et al., 1974, 1977 Bellaoui et al., 1999 Bevan et al. (1983), Nature, 304 :184-187.
Bonadé-Bottino M. (1993), Thèse d'Etat. Université de Paris-Sud. Centre d'Orsay.
Budar et Pelletier 2001 Ebinuma H et al., 1997, Selection of marker-free transgenic plants using the isopentenyl transferase Bene. Proc Nat1 Acad Sci USA, 94 : 2117-2121.
Elroy-Stein et al., 1989, Cap-independent translation of mRNA conferred by encephalomyocarditis virus 5' sequence improves the performance of the vaccinia virus/bacteriophage T7 hybrid expression system. Proc. Natl. Acad. Sci. USA, 86:6126-6130.
Gelvin S. B, 1998, The introduction and expression of transgenes in plants.
Carrent Opinion in Biotechnology, 9:227-232.
Galbe et al., 1989 Gallie, D.R., Sleat, D.E., Watts, 3.W., Turner, P.V. and Wilson, T.M.A, 1987.
The 5' leader of tobacco mosac virus RNA enhances the expression of foreign gene transcripts in vitro and in vivo. Nucleic Acids Res. 15: 3257-3273.
Gelvin 1998 Giovanni et al. 1991 Grelon et al, 1994 Guerche P. et Primard C. (1995), Transformation of plants and soif microorganisms Firek et al, Plant Mol Biol 22: 129-142 (1993) Foisset et al., 1998 Hansen G. and M.S., 1999, Wright Recent advances in the transformation of plants .
Trends in Plant Science, 4:6:226-231.
Hellens R, Mullineaux P and Klee H, 2000. Technical Focus:A guide to Agrobacterium binary Ti vectors Trends in Plant Science, 5:446-451.
Heyn 1976 Hughes et Galau, 1989 et 1991 Iwabachi M (1999) Plant Mol Biol Jan ; 39 (1) :183-8 James Lynch, Cambridge University Press UK p125-136 Karlin et Altschul, 1993, Applications and statistics for multiple high-scoring segments in molecular sequences, Proc. Natl. Acad. Sci. USA 90:5873-5877.
Krishnasamy & Makaroff, 1994 Komari ., T., 'Y.Hiei, Y.Ishida, T. Kumashiro, T. Kubo 1998. Advances in cereal gene transfer. Carrent Opinion in Plant Biology, 1:161-165.
Koncz C & Schell J, MGG 204: 383-396 (1986): The promoter of T(L)-DNA Bene 5 controls the tissue-specific expression of chimaeric genes carried by a novel type of Agrobacterium binary vector.
McGarvey P, Kaper JM. 1991 A simple and rapid method for screening transgenic plants using the PCR. Biotechniques. 11: 428-32.
Michelmore et al., 1991 Moloney M.M et al., 1989, Plant Cell reports 8 : 238-242 Ob ra 1968 Pelletier et al., 1983 Schmidt, 2000 ; Schmidt 2002 Tatusova et al., 1999, "Blast 2 sequences - a new tool for comparing protein and nucleotide sequences", FEMS Microbiol Lett. 174:247-250.
Vedel et a1,1994).
Wang K, Herrera-Estrella A, Van Montagu Eds, Plant and Microbial Biotechnology Research Series Zhang et al, 1995 LISTE DE SÉQUENCES
<110> GENOPLANTE-VALOR
<120> Séquences peptidiques PPR capables de restaurer la fertilité
mâle de plantes porteuses d'un cytoplasme inducteur de stérilité mâle <130> D20657 <150> FR 02/l3 512 <151> 2002-10-29 <160> 34 <170> PatentIn Ver. 2.1 <210> 1 <211> 751 <212> PRT
<213> Raphanus sativus <400> 1 Met Leu Ala Arg Val Cys Arg Phe Glu Ser Ser Ser Ser Ser Ser Val Ser Ala Ala Arg Phe Phe Cys Thr Gly Ser Tle Arg His Ala Leu Ala Glu Lys Ser Arg Asp Gly Glu Ser Gly Glu Ala Gly Phe Arg Gly Glu Ser Leu Lys Leu Arg Ser Gly Ser Tyr Glu Ile Lys Gly Leu Glu Asp Ala Ile Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Ile Asp Phe Asn Lys Leu Met Gly Ala Val Val Arg Met Glu Arg Pro Asp Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys G1n Ile Arg Cys Asp Ile Tyr Ser Phe Thr Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Leu Thr Lys Leu Gly Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys Leu Asp His Arg Val Ser Glu Ala Leu Asp Leu Phe His Gln Ile Cys Arg Pro Asp Val Leu Thr Phe Thr Thr Leu Met Asn Gly Leu Cys Arg Glu Gly Arg Va1 Val Glu Ala Val Ala Leu Leu Asp Arg Met V a 1 Glu Asn Gly Leu Gln Pro Asp Gln Ile Thr Tyr Gly Thr Phe Val A sp Gly Met Cys Lys Met Gly Asp Thr Val Ser Ala Leu Asn Leu Leu Arg Lys Met Glu Glu Ile Ser His Ile Lys Pro Asn Val Val Ile Tyr S er Ala Ile Ile Asp Gly Leu Cys Lys Asp Gly Arg His Ser Asp Ser H i s Asn Leu Phe Ile Glu Met Gln Asp Lys Gly Ile Phe Pro Asn Ile V al Thr Tyr Asn Cys Met Ile Gly Gly Phe Cys Ile Ser Gly Arg Trp S e r Ala Ala Gln Arg Leu Leu Gln Glu Met Leu Glu Arg Lys Tle Ser Pro Asn Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val Lys Glu G 1 y Lys Phe Phe Glu Ala Ala Glu Leu Tyr Asp Glu Met Leu Pro Arg G1 y Ile Tle Pro Asn Thr Ile Thr Tyr Asn Ser Met Ile Asp Gly Phe Cy s Lys Gln Asp Arg Leu Asp Ala Ala Glu Asp Met Phe Tyr Leu Met A1 a Thr Lys Gly Cys Ser Pro Asp Val Phe Thr Phe Thr Thr Leu Ile As p Gly Tyr Cys Gly Ala Lys Arg Tle Asp Asp Gly Met Glu Leu Leu Hi s Glu Met Pro Arg Arg Gly Leu Val Ala Asn Thr Val Thr Tyr Asn Th r Leu Ile His G1y Phe Cys Leu Val Gly Asp Leu Asn Ala Ala Leu As p Leu Ser Gln Gln Met Ile Ser Ser Gly Val Cys Pro Asp Ile Val Th r Cys Asn Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys Leu Lys As p Ala Leu Glu Met Phe Lys A1a Met Gln Lys Ser Lys Met Asp Leu As p Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Leu Thr Tyr As n Ile Leu Ile Cys Gly Leu Ile Asn Glu Gly Lys Phe Leu Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln 5er Arg Leu Asp Glu Ala Thr Gln Met Phe Val Ser Met G1y Ser Lys Ser Phe Ser 565 570 ~ 575 Pro Asn Val Val Thr Phe Asn Thr Leu Ile Asn Gly Tyr Cys Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly Arg Arg Gly Ile Val Ala Asp Ala Ile Ile Tyr Ile Thr Leu Ile Tyr Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Tle Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Tle Thr Tle Arg Asn Met Leu Thr Gly Phe Trp Ser Lys Glu Glu Leu Glu Arg Ala Val Ala Met Leu Glu Asp Leu Gln Met Ser Val Gly Met Ser Phe Asn Thr Phe Cys Phe Gln Ile Ser Leu Leu Thr Phe Ile Ile Leu G1u Lys Ser Cys Ser Leu Cys Cys Ser Tle Arg G1u Thr Phe Leu Asn Glu Trp Phe Gly Val Phe Val Leu Gln G1y Ile Ser Trp Arg Met Asn Glu Arg Met Lys Asp Thr Phe Leu Phe Gln Ile Tyr Lys Ala Leu Leu Ile Leu Phe Cys Arg <210> 2 <211> 687 <212> PRT
<213> Raphanus sativus <400> 2 Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser 5er Pro Ala Glu Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala Lys Ala Ser Gly Glu 5er Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu Lys Leu Gln Ser G1y Phe His Glu Ile Lys Gly Leu Glu Asp Ala Tle Z~sp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Tle Arg Cys Asp Tle Tyr Ser Phe Asn Ile Leu Tle Lys Cys Phe Cys Ser Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Ile Thr Lys Leu Gly Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys Val Glu Asp Arg Val Ser Glu Ala Leu Asp Phe Phe His Gln Met Phe G lu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn G ly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu Leu Asp Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr Gly Thr z le Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala Leu Asn L eu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn Val Val L le Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg His 5er 260 265 . 270 Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro Asp Leu Phe Thr Tyr Asn Ser Met I1e Val Gly Phe Cys Ser Ser Gly Arg Trp Ser Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu Arg Lys I 1e Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu P ro Arg Gly Tle I1e Pro Asn Thr Ile Thr Tyr Ser Ser Met Ile Asp G ly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr L eu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Tle Thr Phe Asn Thr Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg Ile Asp Asp Gly Met Glu Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr Tyr Asn Thr Leu Tle His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp Ile Val Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys Leu Lys Asp Ala Leu Glu Met Phe Lys Val Met Gln Lys Ser Lys Lys Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser Arg Leu Asp Glu Ala Thr G1n Met Phe Asp Ser Met Gly Ser Lys 5er Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys Lys Ala Gly Arg Val Asp Asp G1y Leu Glu Leu Phe Cys Glu Met Gly Arg Arg Gly Ile Va1 A1a Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys Gly Phe Arg Lys Val Gly Asn I1e Asn Gly Ala Leu Asp Tle Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly <210 > 3 <211> 654 <212 > PRT
<213 > Raphanus sativus <400> 3 Met Leu Ala Arg Val Tyr Arg Ser Gly 5er 5er Ser Ser Pro Ala Val Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg His Ala Leu Ala 20 ~ 25 30 Lys Lys Ser Arg Asp Gly Glu Ser Gly Phe Gly Gly Glu Ser Leu Lys I~eu Arg Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile Asp I~eu Phe Gly Asp Met Val Arg Ser Arg Pro Leu Pro Ser Val Ile Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Gly Arg Leu Asp Val Val Ile Ser Leu His Arg Lys Met Glu Met Arg Arg Val Pro Cys Asn 100 l05 110 Ala Tyr Ser Phe Thr I1e Leu Met Lys Cys Phe Cys Ser Cys Ser Lys I~eu Pro Phe Ala Leu Ser Thr Phe Gly Lys Tle Thr Lys Leu Gly Phe His Pro Thr Val Val Thr Phe Ser Thr Leu Leu His Gly Leu Cys Val Glu Asp Arg Ile Ser Glu Ala Leu Asp Leu Phe His G1n Met Cys Lys Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn Gly Leu Cys Arg Glu G ly Arg Val Val Glu Ala Val Ala Leu Leu Asp Arg Met Leu Glu Asp G ly Leu Gln Pro Asn Gln Ile Thr Tyr Gly Thr Ile Val Asp Gly Met Cys Lys Met Gly Asp Thr Val Ser A1a Leu Asn Leu Leu Arg Lys Met G lu Glu Val Ser His Tle Lys Pro Asn Val Val Ile Trp Pro Leu Glu Arg Arg Thr Cys Met Ile Asn Gly Phe Cys Ser Ser Gly Arg Trp Ser G lu Ala Gln G1n Leu Leu Gln Glu Met Leu Glu Arg Lys Lys Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn A1a Phe Val Lys Glu G ly Lys Phe Phe Glu Ala Glu G1u Leu Tyr Asp Glu Met Leu Pro Arg Gly I 1e Ile Pro Ser Thr Ile Thr Tyr Ser Ser Met Tle Asp Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr Leu Met Ala T hr Lys Gly Cys Ser Pro Asp Ile Ile Thr Phe Asn Thr Leu Ile Ala G 1y Tyr Cys Arg Ala Lys Arg Val Asp Asp Gly Ile Lys Leu Leu His G 1u Met Thr Glu Ala G1y Leu Val Ala Asn Thr Ile Thr Tyr Thr Thr L e u Ile His Gly Phe Cys Gln Val Gly Asp Leu Asn Ala Ala Gln Asp L eu Leu Gln Glu Met Val Ser Ser Gly Val Cys Pro Asn Val Val Thr C ys Asn Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys Leu Lys Asp A1a Leu Glu Met Phe Lys Ala Met Gln Lys Ser Lys Met Asp Ile
9 5D 455 460 Asp A1 a Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln Thr Tyr Asn I1 e Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu Glu Ala 485 490 ~ 995 Glu G 1 u Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro Asp Thr Tle Tl-ir Tyr Asn Ser Val Ile His Gly Leu Cys Lys Gln Ser Arg Leu Asp G 1 u Ala Thr Gln Met Phe Asp Ser Met Gly Ser Lys Ser Phe Ser 5.30 535 540 Pro As n Va1 Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys Lys Ala Gly Ar g Val Asp Asp Gly Leu G1u Leu Phe Cys Glu Met Gly Arg Arg Gly I1 e Val Ala Asn Ala Ile Thr Tyr Ile Thr Leu Ile His Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Ile Phe Gln Glu Met Met A1 a Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn Met Leu Thr G1 y Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala Met Leu Glu Asp Leu Gln Met Ser Val Gly Tyr Gln Leu Glu Asp Glu <210> 4 <211> 2256 <212> ADN
<213> Raphanus sativus <400> 4 atgttggcta gggtttgcag attcgagtct tcctcttcgt cttctgtgtc tgcggctaga 60 tttttctgta cgggatcgat tcgtcatgct ctggccgaga aaagcaggga tggagagagt 120 ggcgaagcag gttttagagg agagagtttg aaactgcgaa gtggatctta tgaaatcaaa 180 gggttagagg atgcgattga tttgttcagt gacatgcttc gatctcgtcc tttaccttct 240 gtgattgatt tcaacaagct aatgggtgcg gtggtgagaa tggaacgccc ggatcttgtg 300 atttctctct atcaaaagat ggaaaggaaa cagattcgat gtgatatata cagcttcacc 360 attctgataa aatgtttctg cagttgctct aagctcccct ttgctttgtc tacatttggt 920 aagctcacca agcttggact ccaccctgat gttgttacct tcaccaccct gctccacgga 980 ttatgtcttg atcacagggt ttctgaagcc ttggatttgt ttcatcaaat ttgtagacca 540 gatgtcctaa cgttcaccac gctgatgaat ggtctttgcc gcgagggtcg agttgtcgaa 600 gccgtagctc tgcttgatcg gatggtggaa aatggtctcc agcctgacca gattacttac 660 ggaacatttg tagatgggat gtgtaagatg ggcgacactg tgtctgcatt gaatcttctg 720 aggaagatgg aggagataag ccacatcaaa cccaatgtgg ttatctatag tgccatcatt 780 gatggccttt gtaaagatgg acgccatagc gattctcata atcttttcat tgaaatgcaa 840 gacaagggaa tctttccaaa tatagttacc tacaactgta tgatcggtgg attttgcatc 900 tctggtagat ggagtgcagc ccagcggttg ttgcaagaaa tgttagaaag gaagatcagc 960 cctaatgttg taacttataa tgctttgatc aatgcatttg tcaaggaagg caagttcttc 1020 g aggctgcag aattatacga tgagatgctt ccaaggggta tcattcctaa tacaatcaca 1080 t ataattcaa tgatcgatgg gttttgcaaa caggatcgtc ttgatgctgc tgaggacatg 1190 ttttatttga tggctaccaa gggctgctct ccggacgtat tcactttcac tactctcata 1200 gacggatatt gtggggctaa gaggatagat gatggaatgg aacttctcca tgagatgcct 1260 a gaagaggat tagttgctaa cacagttact tacaacactc ttattcacgg gttctgtctg 1320 gtgggcgatc ttaatgctgc tctagacctt tcacagcaga tgatttctag tggtgtgtgc 1380 cctgatatcg ttacttgtaa cactttgctg gacggtctct gcgataatgg gaaactaaaa 1440 gatgcattgg aaatgtttaa ggctatgcag aagagtaaga tggatcttga tgctagtcac 1500 c ccttcaatg gtgtggaacc tgatgttcta acttacaata tattgatctg cggcttgatc 1560 a atgaaggga agtttttaga ggccgaggaa ttatacgagg agatgccaca cagaggtata 1620 gtcccagata ctatcaccta tagctcaatg atcgatggac tatgcaagca gagccgccta 1680 gatgaggcta cacaaatgtt tgtttcgatg ggtagcaaga gcttctctcc caacgtagtg 1740 a catttaaca cactcattaa tggctactgt aaggcaggaa gggttgatga tgggctggag 1800 cttttctgcg agatgggtcg aagagggata gttgctgatg caattattta catcactttg 1860 a tttatggtt ttcgtaaagt gggtaatatt aatggggctc tagacatttt ccaggagatg 1920 a tttcaagtg gtgtgtatcc tgataccatt actatccgca atatgctgac tggtttttgg 1980 a gtaaagagg aactagaaag ggcagtggca atgcttgagg atctgcagat gagtgtgggt 2040 a tgtcattca acacattttg ttttcaaatt tctttgctta cctttataat tttggagaag 2100 a gctgcagct tatgctgtag catcagggaa actttcttaa atgaatggtt tggtgtgttt 2160 gttttgcagg gtatcagttg gaggatgaat gaaagaatga aagacacttt tcttttccaa 2220 a tttacaagg ccttgttgat tttattttgt aggtga 2256 <210> 5 <211> 2064 <212> ADN
< 213> Raphanus sativus <400> 5 a tgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgagtc tgcggctaga 60 t tgttctgta cgagatcgat tcgtgatact ctggccaagg caagcggaga gagttgcgaa 120 g caggttttg gaggagagag tttgaagctg caaagtgggt ttcatgaaat caaaggttta 180 g aggatgcga ttgatttgtt cagtgacatg cttcgatctc gtcctttacc ttctgtggtt 240 gatttctgta aattgatggg tgtggtggtg agaatggaac gcccggatct tgtgatttct 300 ctctatcaga agatggaaag gaaacagatt cgatgtgata tatacagctt caatattctg 360 ataaaatgtt tctgcagctg ctctaagctc ccctttgctt tgtctacatt tggtaagatc 920 accaagcttg gactccaccc tgatgttgtt accttcacca ccctgctcca tggattatgt 480 gtggaagata gggtttctga agccttggat ttttttcatc aaatgtttga aacgacatgt 590 aggcccaatg tcgtaacctt caccactttg atgaacggtc tttgccgcga gggtagaatt 600 gtcgaagccg tagctctgct tgatcggatg atggaagatg gtctccagcc tacccagatt 660 acttatggaa caatcgtaga tgggatgtgt aagaagggag atactgtgtc tgcactgaat 720 ctgctgagga agatggagga ggtgagccac atcataccca atgttgtaat ctatagtgca 780 atcattgata gcctttgtaa agacggacgt catagcgatg cacaaaatct tttcactgaa 840 atgcaagaga aaggaatctt tcccgattta tttacctaca acagtatgat agttggtttt 900 tgtagctctg gtagatggag cg~cgcggag cagttgttgc aagaaatgtt agaaaggaag 960 atcagccctg atgttgtaac ttataatgct ttgatcaatg catttgtcaa ggaaggcaag 1020 ttctttgagg ctgaagaatt atacgatgag atgcttccaa ggggtataat ccctaataca 1080 atcacatata gttcaatgat cgatggattt tgcaaacaga atcgtcttga tgctgctgag 1140 cacatgtttt atttgatggc taccaagggc tgctctccca acctaatcac tttcaatact 1200 ctcatagacg gatattgtgg ggctaagagg atagatgatg gaatggaact tctccatgag 1260 atgactgaaa caggattagt tgctgacaca actacttaca acactcttat tcacgggttc 1320 tatctggtgg gcgatcttaa tgctgctcta gaccttttac aagagatgat ctctagtggt 1380 ttgtgccctg atatcgttac ttgtgacact ttgctggatg gtctctgcga taatgggaaa 1440 ctaaaagatg cattggaaat gtttaaggtt atgcagaaga gtaagaagga tcttgatgct 1500 agtcacccct tcaatggtgt ggaacctgat gttcaaactt acaatatatt gatcagcggc 1560 ttgatcaatg aagggaagtt tttagaggcc gaggaattat acgaggagat gccccacagg 1620 ggtatagtcc cagatactat cacctatagc tcaatgatcg atggattatg caagcagagc 1680 cgcctagatg aggctacaca aatgtttgat tcgatgggta gcaagagctt ctctccaaac 1740 gtagtgacct ttactacact cattaatggc tactgtaagg caggaagggt tgatgatggg 1800 ctggagcttt tctgcgagat gggtcgaaga gggatagttg ctaacgcaat tacttacatc 1860 actttgattt gtggttttcg taaagtgggt aatattaatg gggctctaga cattttccag 1920 gagatgattt caagtggtgt gtatcctgat accattacca tccgcaatat gctgactggt 1980 ttatggagta aagaggaact aaaaagggca gtggcaatgc ttgagaaact gcagatgagt 2040 atggatctat catttggggg atga 2064 <210> 6 <211> 1965 <212> ADN
<213> Raphanus sativus <400> 6 atgttggcta gggtttatag atccggatct tcttcttctc ctgctgtgtc tgcggctaga 60 ttgttctgta cgagatcgat tcgtcatgct ctggccaaga aaagcaggga tggagagagt 120 ggttttggag gagagagttt gaagctgcga agcggatttc acgaaatcaa agggttagaa 180 gatgcgattg atttgttcgg tgatatggta cgatctcgtc ctttaccttc agtaattgat 290 ttctgtaaat tgatgggagt tgtggtgagg atgggaaggc tcgatgttgt gatttctctc 300 cataggaaga tggaaatgag gcgggttcca tgtaacgcat acagcttcac catcctgatg 360 aagtgtttct gcagctgctc taagctgccg tttgctttgt ctacatttgg taagatcacc 420 a agcttggtt ttcatcccac tgttgttace ttcagcaccc tgctccacgg attatgtgtg 480 gaagacagga tctctgaagc cttggatttg tttcatcaaa tgtgtaaacc aaatgtcgta 540 a ccttcacca cgctgatgaa cggtctttgc cgtgagggtc gagttgtcga agctgtagct 600 ctgcttgatc ggatgctaga agatggtctc cagcctaacc agattactta tggaacaatc 660 gtggatggga tgtgtaagat gggagacact gtgtctgcat tgaatcttct gaggaagatg 720 gaggaggtga gccacatcaa acccaatgtg gtaatctggc ctttggaaag acggacgtgt 780 atgattaatg gattttgtag ctctggtaga tggagtgaag cccagcagtt gttgcaagaa 840 atgttagaaa ggaagaagat cagccctgat gttgtaactt ataatgcttt gatcaatgca 900 tttgtcaagg aaggcaaatt ctttgaggct gaagaattat acgatgagat gcttccaagg 960 ggtataatcc ctagtacaat cacatatagt tcaatgatcg atggattttg caaacagaat 1020 cgtcttgatg ctgctgagca catgttttat ttgatggcta ccaagggctg ctctccggac 1080 ataatcactt tcaatactct catagccgga tactgtagag ctaagagggt agatgatgga 1140 ataaaacttc tccatgagat gactgaagca ggattagttg ctaacacaat tacttacacc 1200 a ctcttattc acgggttctg tcaggtgggc gatcttaatg ctgctcaaga ccttctacag 1260 gagatggtct ctagtggtgt gtgccctaat gtcgttactt gtaacacttt gctggacggt 1320
<213> Raphanus sativus <400> 4 atgttggcta gggtttgcag attcgagtct tcctcttcgt cttctgtgtc tgcggctaga 60 tttttctgta cgggatcgat tcgtcatgct ctggccgaga aaagcaggga tggagagagt 120 ggcgaagcag gttttagagg agagagtttg aaactgcgaa gtggatctta tgaaatcaaa 180 gggttagagg atgcgattga tttgttcagt gacatgcttc gatctcgtcc tttaccttct 240 gtgattgatt tcaacaagct aatgggtgcg gtggtgagaa tggaacgccc ggatcttgtg 300 atttctctct atcaaaagat ggaaaggaaa cagattcgat gtgatatata cagcttcacc 360 attctgataa aatgtttctg cagttgctct aagctcccct ttgctttgtc tacatttggt 920 aagctcacca agcttggact ccaccctgat gttgttacct tcaccaccct gctccacgga 980 ttatgtcttg atcacagggt ttctgaagcc ttggatttgt ttcatcaaat ttgtagacca 540 gatgtcctaa cgttcaccac gctgatgaat ggtctttgcc gcgagggtcg agttgtcgaa 600 gccgtagctc tgcttgatcg gatggtggaa aatggtctcc agcctgacca gattacttac 660 ggaacatttg tagatgggat gtgtaagatg ggcgacactg tgtctgcatt gaatcttctg 720 aggaagatgg aggagataag ccacatcaaa cccaatgtgg ttatctatag tgccatcatt 780 gatggccttt gtaaagatgg acgccatagc gattctcata atcttttcat tgaaatgcaa 840 gacaagggaa tctttccaaa tatagttacc tacaactgta tgatcggtgg attttgcatc 900 tctggtagat ggagtgcagc ccagcggttg ttgcaagaaa tgttagaaag gaagatcagc 960 cctaatgttg taacttataa tgctttgatc aatgcatttg tcaaggaagg caagttcttc 1020 g aggctgcag aattatacga tgagatgctt ccaaggggta tcattcctaa tacaatcaca 1080 t ataattcaa tgatcgatgg gttttgcaaa caggatcgtc ttgatgctgc tgaggacatg 1190 ttttatttga tggctaccaa gggctgctct ccggacgtat tcactttcac tactctcata 1200 gacggatatt gtggggctaa gaggatagat gatggaatgg aacttctcca tgagatgcct 1260 a gaagaggat tagttgctaa cacagttact tacaacactc ttattcacgg gttctgtctg 1320 gtgggcgatc ttaatgctgc tctagacctt tcacagcaga tgatttctag tggtgtgtgc 1380 cctgatatcg ttacttgtaa cactttgctg gacggtctct gcgataatgg gaaactaaaa 1440 gatgcattgg aaatgtttaa ggctatgcag aagagtaaga tggatcttga tgctagtcac 1500 c ccttcaatg gtgtggaacc tgatgttcta acttacaata tattgatctg cggcttgatc 1560 a atgaaggga agtttttaga ggccgaggaa ttatacgagg agatgccaca cagaggtata 1620 gtcccagata ctatcaccta tagctcaatg atcgatggac tatgcaagca gagccgccta 1680 gatgaggcta cacaaatgtt tgtttcgatg ggtagcaaga gcttctctcc caacgtagtg 1740 a catttaaca cactcattaa tggctactgt aaggcaggaa gggttgatga tgggctggag 1800 cttttctgcg agatgggtcg aagagggata gttgctgatg caattattta catcactttg 1860 a tttatggtt ttcgtaaagt gggtaatatt aatggggctc tagacatttt ccaggagatg 1920 a tttcaagtg gtgtgtatcc tgataccatt actatccgca atatgctgac tggtttttgg 1980 a gtaaagagg aactagaaag ggcagtggca atgcttgagg atctgcagat gagtgtgggt 2040 a tgtcattca acacattttg ttttcaaatt tctttgctta cctttataat tttggagaag 2100 a gctgcagct tatgctgtag catcagggaa actttcttaa atgaatggtt tggtgtgttt 2160 gttttgcagg gtatcagttg gaggatgaat gaaagaatga aagacacttt tcttttccaa 2220 a tttacaagg ccttgttgat tttattttgt aggtga 2256 <210> 5 <211> 2064 <212> ADN
< 213> Raphanus sativus <400> 5 a tgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgagtc tgcggctaga 60 t tgttctgta cgagatcgat tcgtgatact ctggccaagg caagcggaga gagttgcgaa 120 g caggttttg gaggagagag tttgaagctg caaagtgggt ttcatgaaat caaaggttta 180 g aggatgcga ttgatttgtt cagtgacatg cttcgatctc gtcctttacc ttctgtggtt 240 gatttctgta aattgatggg tgtggtggtg agaatggaac gcccggatct tgtgatttct 300 ctctatcaga agatggaaag gaaacagatt cgatgtgata tatacagctt caatattctg 360 ataaaatgtt tctgcagctg ctctaagctc ccctttgctt tgtctacatt tggtaagatc 920 accaagcttg gactccaccc tgatgttgtt accttcacca ccctgctcca tggattatgt 480 gtggaagata gggtttctga agccttggat ttttttcatc aaatgtttga aacgacatgt 590 aggcccaatg tcgtaacctt caccactttg atgaacggtc tttgccgcga gggtagaatt 600 gtcgaagccg tagctctgct tgatcggatg atggaagatg gtctccagcc tacccagatt 660 acttatggaa caatcgtaga tgggatgtgt aagaagggag atactgtgtc tgcactgaat 720 ctgctgagga agatggagga ggtgagccac atcataccca atgttgtaat ctatagtgca 780 atcattgata gcctttgtaa agacggacgt catagcgatg cacaaaatct tttcactgaa 840 atgcaagaga aaggaatctt tcccgattta tttacctaca acagtatgat agttggtttt 900 tgtagctctg gtagatggag cg~cgcggag cagttgttgc aagaaatgtt agaaaggaag 960 atcagccctg atgttgtaac ttataatgct ttgatcaatg catttgtcaa ggaaggcaag 1020 ttctttgagg ctgaagaatt atacgatgag atgcttccaa ggggtataat ccctaataca 1080 atcacatata gttcaatgat cgatggattt tgcaaacaga atcgtcttga tgctgctgag 1140 cacatgtttt atttgatggc taccaagggc tgctctccca acctaatcac tttcaatact 1200 ctcatagacg gatattgtgg ggctaagagg atagatgatg gaatggaact tctccatgag 1260 atgactgaaa caggattagt tgctgacaca actacttaca acactcttat tcacgggttc 1320 tatctggtgg gcgatcttaa tgctgctcta gaccttttac aagagatgat ctctagtggt 1380 ttgtgccctg atatcgttac ttgtgacact ttgctggatg gtctctgcga taatgggaaa 1440 ctaaaagatg cattggaaat gtttaaggtt atgcagaaga gtaagaagga tcttgatgct 1500 agtcacccct tcaatggtgt ggaacctgat gttcaaactt acaatatatt gatcagcggc 1560 ttgatcaatg aagggaagtt tttagaggcc gaggaattat acgaggagat gccccacagg 1620 ggtatagtcc cagatactat cacctatagc tcaatgatcg atggattatg caagcagagc 1680 cgcctagatg aggctacaca aatgtttgat tcgatgggta gcaagagctt ctctccaaac 1740 gtagtgacct ttactacact cattaatggc tactgtaagg caggaagggt tgatgatggg 1800 ctggagcttt tctgcgagat gggtcgaaga gggatagttg ctaacgcaat tacttacatc 1860 actttgattt gtggttttcg taaagtgggt aatattaatg gggctctaga cattttccag 1920 gagatgattt caagtggtgt gtatcctgat accattacca tccgcaatat gctgactggt 1980 ttatggagta aagaggaact aaaaagggca gtggcaatgc ttgagaaact gcagatgagt 2040 atggatctat catttggggg atga 2064 <210> 6 <211> 1965 <212> ADN
<213> Raphanus sativus <400> 6 atgttggcta gggtttatag atccggatct tcttcttctc ctgctgtgtc tgcggctaga 60 ttgttctgta cgagatcgat tcgtcatgct ctggccaaga aaagcaggga tggagagagt 120 ggttttggag gagagagttt gaagctgcga agcggatttc acgaaatcaa agggttagaa 180 gatgcgattg atttgttcgg tgatatggta cgatctcgtc ctttaccttc agtaattgat 290 ttctgtaaat tgatgggagt tgtggtgagg atgggaaggc tcgatgttgt gatttctctc 300 cataggaaga tggaaatgag gcgggttcca tgtaacgcat acagcttcac catcctgatg 360 aagtgtttct gcagctgctc taagctgccg tttgctttgt ctacatttgg taagatcacc 420 a agcttggtt ttcatcccac tgttgttace ttcagcaccc tgctccacgg attatgtgtg 480 gaagacagga tctctgaagc cttggatttg tttcatcaaa tgtgtaaacc aaatgtcgta 540 a ccttcacca cgctgatgaa cggtctttgc cgtgagggtc gagttgtcga agctgtagct 600 ctgcttgatc ggatgctaga agatggtctc cagcctaacc agattactta tggaacaatc 660 gtggatggga tgtgtaagat gggagacact gtgtctgcat tgaatcttct gaggaagatg 720 gaggaggtga gccacatcaa acccaatgtg gtaatctggc ctttggaaag acggacgtgt 780 atgattaatg gattttgtag ctctggtaga tggagtgaag cccagcagtt gttgcaagaa 840 atgttagaaa ggaagaagat cagccctgat gttgtaactt ataatgcttt gatcaatgca 900 tttgtcaagg aaggcaaatt ctttgaggct gaagaattat acgatgagat gcttccaagg 960 ggtataatcc ctagtacaat cacatatagt tcaatgatcg atggattttg caaacagaat 1020 cgtcttgatg ctgctgagca catgttttat ttgatggcta ccaagggctg ctctccggac 1080 ataatcactt tcaatactct catagccgga tactgtagag ctaagagggt agatgatgga 1140 ataaaacttc tccatgagat gactgaagca ggattagttg ctaacacaat tacttacacc 1200 a ctcttattc acgggttctg tcaggtgggc gatcttaatg ctgctcaaga ccttctacag 1260 gagatggtct ctagtggtgt gtgccctaat gtcgttactt gtaacacttt gctggacggt 1320
10/58 ctct gcgata atgggaaact aaaagatgca ttggaaatgt ttaaggctat gcagaagagt 1380 aag atggata ttgatgctag tcaccccttt aatggtgtgg aacctgatgt tcaaacttac 1440 aat atattga tcagtggctt gatcaatgaa gggaagtttt tagaggccga ggaattatac 1500 gag gagatgc cacacagagg tatagtccca gatactatca cctataactc agtgatccat 1560 ggt ttatgca agcaaagccg cctagatgag gctacacaaa tgtttgattc gatgggtagc 1620 aag a gcttct ctccaaacgt agtgaccttt actacactca ttaatggata ctgtaaggca 1680 gga a gggttg atgatgggct ggagcttttc tgcgagatgg gtcgaagagg gatagttgct 1740 aac gcaatta cttacatcac tttgattcat ggttttcgta aagtgggtaa tattaatggg 1800 gct ctagata ttttccagga gatgatggca agtggtgtgt atcctgatac cattactatc 1860 cgc a atatgc tgactggttt atggagtaaa gaggaactaa aaagggcagt ggcaatgctt 1920 gag gatctgc agatgagtgt gggatatcag ttggaggatg aataa 1965 <210> 7 <211> 22770 <212> ADN
<213 > Raphanus sativus <400> 7 ccca aattat gttcaggatc ttagagatag tttattgtct ctctttattg gttttgtaat 60 aaat atttga cgttgtcagt tgttgtatat ggctgtcttt gtgtagtttt tttttaaaaa 120 aatt tgtgca tatatatttg atcgcatttg taaacatatt ttccagccaa gttccagtga 180 gtct tagatg cttcagtaac gaaatagata ataagtgttc atttggtatg tcttgctaat 240 tagt agttct gggcaaaaaa attggaaccc aagaaatgaa tcggaactga atagaaatac 300 ctat aactga accggacgga tccaaatcaa aatacccata attaaactgg actaaaactc 360 ttaa atattc gaatgattgc taaatttata tattcgaaat aaccgaacag aattgaaacc 420 gaac gaacac ttgaatatat aatcgaaagg gtatatatat atatatatat atattacata 480 cata taacat aattacataa caaaaaatat atataaaatt taaaaatcta ttaaaaatat 540 ctaa aatatt tgaaaaacta aattattata aaatatttga ttcatccaaa attatcctaa 600 tatg ttttat ccaaaatatc ctaagtattt gaaaatatcc aatttttttc aggcctcagc 660 ctca aataga agtttatatc ttcacttaca acattatcat tgaagggatg tgcgaggctg 720 ggaa agtgga agacgtacaa catttattca atagcctcag cctcaaagga ttgcagcccg 780 atgt tataac atacaatacg ataatctcag gattgggtac aaaacgtcta tactacagga 840 agcg gatgac ttatttataa aaatgaaaga agatgggtct ctttgagatg accgtaccta 900 tant gtgcta atcagagcac atcttagaaa tggtgacatt tctgtatcag eagaactcat 960 caaa gaaatg agaggttgcg ggttttctga agatgcttca acctttggtt tactcactaa 1020 tatg ttatat gatgggagat tggacaaaag cttcctcaac atgatttctt aaccctcgag 1080 agaa gagttg tgaggtgaat tgatttgtct gctatgagcc tatgacaaaa aagatctgat 1140 ccac ttgttg acgtaagatc agtactcaac tgaagtaagc tgagctctta taaaaatata 1200 gatt cctaaa gttgttatta gttttaatat gttcatcatt ttctttgtaa cttggttgat 1260 ttga cgtaac ctggaaaata ttgcggatat aattatgatg ccaattatga gctctgagca 1320 aata gggtcg agcaggaggg aaataggatt cccaaaaatt cattctgaat atttcagatt 1380 aggt agttta acatcaaaat gggagtttag gtagttggtt aatgccaata acttattgag 1490 tact tttaag gtatcaggat ggtctgctgg tatttgtatt agcagggcat taatctgctc 1500 ttgt tgattg ctctttgttg attgctttgt tgatgagaat taggatgccg aataccaaga 1560 aatg gttagt aattcaaaga aaaattgtag ctacctggtg aaaaagcagt ttcagtgata 1620 catgtgaaaa cctaaagtgc attgagatta ataagattgc tgcaaagcat ttgaaactcc 1680 attt tgctgt ctttcatttc tcataacaag aatgagttgg tttgtaattt gtgaacatgt 1740 cttt gtagga gagtcagagt gaagttacaa aaggaagatg tgaccttacc taatccagca 1800 ttcc agcaat tacttcgaat aagaaagtct tttttttttg gtttattctc ttttggtact 1860 cata gtcaga attggaaaat tctataacat agaatgtgtc agaccagctt aatcagtcgg 1920 tatt atcgtt ctatttaact tgatttcggt gaaaatcttt caacctactt ttatagggta 1980 atgt ttaact acttttatag gataatgttt tttttttgtt acattggaac attggttgat 2090 cagt ttagtt attgttaact gcccaaagag gagagaattt tttttttttt taaagaaatt 2100 atta gcttga cgggaccgac gcgctgagtg ggttcaactc tgaaccggaa attgtataat 2160 tcaa attgaa ccggttgttg taaatcaaat ggaaccggtt tactagccac tcagtcgaga 2220 gtgg ttttag agatcgacga agaacaaagt tcaggcgaag caaaaatgtt ggctagggtt 2280 tata gatccg gatcttcttc ttctcctgct gtgtctgcgg ctagattgtt ctgtacgaga 2340 tcga ttcgtc atgctctggc caagaaaagc agggatggag agagtggttt tggaggagag 2400 agtt tgaagc tgcgaagcgg atttcacgaa atcaaagggt tagaagatgc gattgatttg 2960 ttcg gtgata tggtacgatc tcgtccttta ccttcagtaa ttgatttctg taaattgatg 2520
<213 > Raphanus sativus <400> 7 ccca aattat gttcaggatc ttagagatag tttattgtct ctctttattg gttttgtaat 60 aaat atttga cgttgtcagt tgttgtatat ggctgtcttt gtgtagtttt tttttaaaaa 120 aatt tgtgca tatatatttg atcgcatttg taaacatatt ttccagccaa gttccagtga 180 gtct tagatg cttcagtaac gaaatagata ataagtgttc atttggtatg tcttgctaat 240 tagt agttct gggcaaaaaa attggaaccc aagaaatgaa tcggaactga atagaaatac 300 ctat aactga accggacgga tccaaatcaa aatacccata attaaactgg actaaaactc 360 ttaa atattc gaatgattgc taaatttata tattcgaaat aaccgaacag aattgaaacc 420 gaac gaacac ttgaatatat aatcgaaagg gtatatatat atatatatat atattacata 480 cata taacat aattacataa caaaaaatat atataaaatt taaaaatcta ttaaaaatat 540 ctaa aatatt tgaaaaacta aattattata aaatatttga ttcatccaaa attatcctaa 600 tatg ttttat ccaaaatatc ctaagtattt gaaaatatcc aatttttttc aggcctcagc 660 ctca aataga agtttatatc ttcacttaca acattatcat tgaagggatg tgcgaggctg 720 ggaa agtgga agacgtacaa catttattca atagcctcag cctcaaagga ttgcagcccg 780 atgt tataac atacaatacg ataatctcag gattgggtac aaaacgtcta tactacagga 840 agcg gatgac ttatttataa aaatgaaaga agatgggtct ctttgagatg accgtaccta 900 tant gtgcta atcagagcac atcttagaaa tggtgacatt tctgtatcag eagaactcat 960 caaa gaaatg agaggttgcg ggttttctga agatgcttca acctttggtt tactcactaa 1020 tatg ttatat gatgggagat tggacaaaag cttcctcaac atgatttctt aaccctcgag 1080 agaa gagttg tgaggtgaat tgatttgtct gctatgagcc tatgacaaaa aagatctgat 1140 ccac ttgttg acgtaagatc agtactcaac tgaagtaagc tgagctctta taaaaatata 1200 gatt cctaaa gttgttatta gttttaatat gttcatcatt ttctttgtaa cttggttgat 1260 ttga cgtaac ctggaaaata ttgcggatat aattatgatg ccaattatga gctctgagca 1320 aata gggtcg agcaggaggg aaataggatt cccaaaaatt cattctgaat atttcagatt 1380 aggt agttta acatcaaaat gggagtttag gtagttggtt aatgccaata acttattgag 1490 tact tttaag gtatcaggat ggtctgctgg tatttgtatt agcagggcat taatctgctc 1500 ttgt tgattg ctctttgttg attgctttgt tgatgagaat taggatgccg aataccaaga 1560 aatg gttagt aattcaaaga aaaattgtag ctacctggtg aaaaagcagt ttcagtgata 1620 catgtgaaaa cctaaagtgc attgagatta ataagattgc tgcaaagcat ttgaaactcc 1680 attt tgctgt ctttcatttc tcataacaag aatgagttgg tttgtaattt gtgaacatgt 1740 cttt gtagga gagtcagagt gaagttacaa aaggaagatg tgaccttacc taatccagca 1800 ttcc agcaat tacttcgaat aagaaagtct tttttttttg gtttattctc ttttggtact 1860 cata gtcaga attggaaaat tctataacat agaatgtgtc agaccagctt aatcagtcgg 1920 tatt atcgtt ctatttaact tgatttcggt gaaaatcttt caacctactt ttatagggta 1980 atgt ttaact acttttatag gataatgttt tttttttgtt acattggaac attggttgat 2090 cagt ttagtt attgttaact gcccaaagag gagagaattt tttttttttt taaagaaatt 2100 atta gcttga cgggaccgac gcgctgagtg ggttcaactc tgaaccggaa attgtataat 2160 tcaa attgaa ccggttgttg taaatcaaat ggaaccggtt tactagccac tcagtcgaga 2220 gtgg ttttag agatcgacga agaacaaagt tcaggcgaag caaaaatgtt ggctagggtt 2280 tata gatccg gatcttcttc ttctcctgct gtgtctgcgg ctagattgtt ctgtacgaga 2340 tcga ttcgtc atgctctggc caagaaaagc agggatggag agagtggttt tggaggagag 2400 agtt tgaagc tgcgaagcgg atttcacgaa atcaaagggt tagaagatgc gattgatttg 2960 ttcg gtgata tggtacgatc tcgtccttta ccttcagtaa ttgatttctg taaattgatg 2520
11/58 ggagttgtgg tgaggatggg aaggctcgat gttgtgattt ctctccatag gaagatggaa 2580 atgaggcggg ttccatgtaa cgcatacagc ttcaccatcc tgatgaagtg tttctgcagc 2640 t gctctaagc tgccgtttgc tttgtctaca tttggtaaga tcaccaagct tggttttcat 2700 c ccactgttg ttaccttcag caccctgctc cacggattat gtgtggaaga caggatctct 2760 gaagccttgg atttgtttca tcaaatgtgt aaaccaaatg tcgtaacctt caccacgctg 2820 atgaacggtc tttgccgtga gggtcgagtt gtcgaagctg tagctctgct tgatcggatg 2880 ctagaagatg gtctccagcc taaccagatt acttatggaa caatcgtgga tgggatgtgt 2990 a agatgggag acactgtgtc tgcattgaat cttctgagga agatggagga ggtgagccac 3000 a tcaaaccca atgtggtaat ctggcctttg gaaagacgga cgtcataccg atgctcaaaa 3060 t cttttcagt gaaatgcaag acaagggaat ctttcccaat ttatttacct acagctgtat 3120 gattaatgga ttttgtagct ctggtagatg gagtgaagcc cagcagttgt tgcaagaaat 3180 gttagaaagg aagaagatca gccctgatgt tgtaacttat aatgctttga tcaatgcatt 3290 t gtcaaggaa ggcaaattct ttgaggctga agaattatac gatgagatgc ttccaagggg 3300 t ataatccct agtacaatca catatagttc aatgatcgat ggattttgca aacagaatcg 3360 t cttgatgct gctgagcaca tgttttattt gatggctacc aagggctgct ctccggacat 3420 a atcactttc aatactctca tagccggata ctgtagagct aagagggtag atgatggaat 3480 a aaacttctc catgagatga ctgaagcagg attagttgct aacacaatta cttacaccac 3590 t cttattcac gggttctgtc aggtgggcga tcttaatgct gctcaagacc ttctacagga 3600 gatggtctct agtggtgtgt gccctaatgt cgttacttgt aacactttgc tggacggtct 3660 ctgcgataat gggaaactaa aagatgcatt ggaaatgttt aaggctatgc agaagagtaa 3720 g atggatatt gatgctagtc acccctttaa tggtgtggaa cctgatgttc aaacttacaa 3780 t atattgatc agtggcttga tcaatgaagg gaagttttta gaggccgagg aattatacga 3840 g gagatgcca cacagaggta tagtcccaga tactatcacc tataactcag tgatccatgg 3900 t ttatgcaag caaagccgcc tagatgaggc tacacaaatg tttgattcga tgggtagcaa 3960 g agcttctct ccaaacgtag tgacctttac tacactcatt aatggatact gtaaggcagg 9020 a agggttgat gatgggctgg agcttttctg cgagatgggt cgaagaggga tagttgctaa 4080 c gcaattact tacatcactt tgattcatgg ttttcgtaaa gtgggtaata ttaatggggc 4190 t ctagatatt ttccaggaga tgatggcaag tggtgtgtat cctgatacca ttactatccg 4200 c aatatgctg actggtttat ggagtaaaga ggaactaaaa agggcagtgg caatgcttga 9260 g gatctgcag atgagtgtgg gtatgtcatt caacaatttt gttttcaaat ttcgttgctt 4320 a cctttaagt ttctggagaa gagctgcagc ttttgctgta gcatcaggga agcttgcata 9380 a acggtttgg tgtgtttgtt ttgcaggata tcagttggag gatgaataaa agaagaaaaa 4440 a ttggcaaat tgggcaaatc acaagtttga aatagggaat tgggcgacct caagtttaaa 4500 t tagccaatt gggcaacttt ttgcatttgc ccatgtaaac ttatgtctaa atatcctttg 4560 g gacctttgt tagattcatt atttacatct ttgccatttc aattaaaata tatctaaaat 9620 a aaatttgtc acatcacatc tctcattctt taatttgtca caccacctct ctcattcttt 4680 t tctctttcc ttctttttct ctctccttct tttccacacc accaaccatc atctacgaaa 4740 a t catctccc tctccttctt ttcctctcat cttctttttt ctctctcatt cttttctaca 9800 c caccacctt tacaattaaa ttaactgaag aagaaaaatc attttttctt caactgaaga 4860 a taagaaaca attacgctca tgtacattcc aagcccctgt ttatgaaatt tatacatatg 9920 a cacctaaat gtaatattta tacactaaaa atgattaaaa tgaatgctta atatcataca 4980 a aaatactat atatcattta ttaattatta aaagtataaa tactaaaaat gtttattaaa 5040 atttaaaaat tgatttctta aaagtaatct aatgggaaaa attatctagg ttagatttca 5100 attttattgt ttggttttta aaaaaatatt tcattatctt ttaattgttt aaattatatt 5160 t cattatctt ttaataattt agtttttaaa aaatctttga ataatacaag ataatataat 5220 gt ctattttc tattaaaaca tcttatatcc atctaaaatt ctagttttca tggctgtgat 5280 tttattgaga aaaactaaac aattaataga aaatgtcatt tttctattga aaaattatct 5340 a gattttatt tcgattttat tgattttttt tgtaactgta ttatatattt cataataaaa 5400 at atgatgta ttttttttaa agaaatcttt cattatattt cattttagat gtctttaatg 5460 t caattattt attgtttaat ctttaattgt ttagtttttt aattgtttag ctttttatta 5520 t aaaaaatat ttaattgttt agttttttta ttataagatg tatttcactt atttatttca 5580 a catttcatt tctaaacaat cttaaatttt atatgaaaaa ttatgttgtc taaatgaatg 5640 t gcttcacat atatgaaaac acaattaaac taatatgtta atttatttta ttgaatttaa 5700 t gaaaatatt ttggtatatc agcttttaca aatgaaatgt tgttataaat tatttcattg 5760 t ttttaccac cttttagtta attagatcat ctataatgag attgacaaaa ttttagatta 5820 t aataccaat aggttattag caaaatattt aaattttata tagagtaaaa tgtgagttct 5880 aa ataattaa cgtataattg ttttggagag cactgtgctc tcgttgtatt cgtagaagta 5940 tt taaatttt atacttaata tgtatttaaa ctctccaatg caataaggga tataaacaaa 6000 aggtattcat agatgttatg tattcgtaca ccgatgtatt cgtatacctt aaatatatgt 6060 at acttatgt atacatatac ttgtgtattc 'gtacacctta agtattcgat gggttatgtt 6120 ggtattcgta tattttatgt atttgtacac cttatgtata cttatgtata tgtacacctt 6180
12/58 atgtat ttgt acatcttaag tattagatga gttatgttga tattcgtaca ccttatgtat 6240 tcgtac acct tctgtatacc ttaggtattc gtacacctta ggtatttgta cacctaaggt 6300 attcgt acac cttatgtata cttatgtata cgtacacctt atatattcga acaccttaga 6360 tattcg Caca tcttatgtat acgtatactt atttcttgag ttatagtgaa ttagattgta 6420 ttaaac gtta gacatagggt tccggattta tccaagggtt ccagattgtt tcagattctg 6480 gattta ccca atggttctgg atttacccaa gggttccgga tttaggattc aaggtttaga 6590 gtttag gatt ttaggtttag tgttttgttg atgattttta atatttaaga taaatgtaga 6600 caaatt tgtt cttcctacca ttttgacaaa aaatgaaaga tctatgtagg tttccaagtt 6660 tattaa attt acccagattt atgaaaatta tccataaatt tatataattt tatgaataat 6720 ttatca ttta tttgggtaaa tttcataaat atgaaagttt cttttatggg tcaaaatgta 6780 taattt attc ggattctgga tttacccaag ggttccggat ttacccaagg attccagatt 6890 taggat tcat ggtttagagt ttaggagttt atgtttagtg ttttgttgat gattttaaat 6900 atttaa gata agaagtttat gcgagagaat ttggtcaaac tcaggttgag tcttaacttc 6960 ttaaga rata aaaatcacta gatacttgac atggaggcac caaattatcc tatatttttt 7020 ggactt aatc ttggtgtacc cctagagtaa accttaaggt tcaccaacca atagaaatca 7080 ctcatt trac agttgatatc ttttaaaaaa gtaaacaaaa tattgtcgag ttatattaca 7140 ttttta aaat aaaaatatta aaaaataaaa ataataatat atgcaaaaaa aaagattttt 7200 taaaaa gatt ttaatttcgt caacaaaaca ctaaactcta aactctaaat cctaaaccct 7260 tggata aata ctaaacccta aattaaaaac attaaaccat aatagtattt ttaagattta 7320 atgttt tagt gtttagtgtt tttgatttag aatttaggat tatccaagtg tttatgattt 7380 atccaa gggt ttagggttta gaatttaggg tttagggttt agagtttaaa attatccaag 7440 ggtcta tggt atacccaagg gtttagggtt taggatttag ggtttagggt ttagaattta 7500 gggttt a ggg tttagagttt aaaattatcc aagggtttag ggtataccca agggtttagg 7560 gtttag gatt tagggtttaa ggtttagtgt tttttgacga tattaaaaat agttttcaaa 7620 aattca tttt ttgtaacggc tattattttt tttttatatt ttatttattt taaaaacata 7680 atataa cttg acaatatttt cttttctttt taaaaaaaat attaattatg aaatacttga 7740 ttccta t tgg ttgggtgaac ctaaatgttc actctagggg tgaacctaag gataactcta 7800 ttttttgggg tgaaatagca ctatagcgga tatctttttc aatagattat aagcacggct 7860 ctacctatga ctagtcaaga acttgggatg attggaaatc tgcaggttgt actcaatatg 7920 ggatta t att ggttctaaca agtagatatg atccttgaaa attaaagtta ttagatcagt 7980 tcatcg t gaa aggtgtaggg tttgtcattt tattaacaaa tttgtcattt cattaacaat 8040 ttttgtcatt ttataaacat gaaaattata acgaatgcac tttgctgcca gatcccaatt 8100 tgtcatt tta tttttgggaa aaaaatgtag catttcgtga gtgtttctat ttttggcaaa 8160 aacaaa a agt gtgagatcaa ttttgaccaa aaaaaaatgt aagattcacg taggtttcca 8220 aattta t taa atttacccaa ctatattaaa attaaatgta gacaaatttg ttttcctgcc 8280 attttg gcaa aaaatgaagg atctatgaag gtttccaagt ttattaaatt tactcagatt 8340 tatgata att atccataaat ttacataatt ttatgaatta tcatttattt gggtagattt 8400 cataaa t atg aaagtttctt ttatgagtca aaatgtataa tttattgggt aactttcata 8460 aatttta gaa tttacatcga ttttatatta attcgtatag atttatgttg actttatata 8520 tgaaaa a ata tgtattatat taaaagtagt tgctcatata tgatttttaa atattaaata 8580 tgatcc a aaa gtttaatgaa taaagaatgt ttatgggatt tacaaaagtt agttgttaaa 8640 agttag t ggg aaaaaaatta ttttttatag gcaaagtgga ttttgggtcc cacgaaatta 8700 cttttc c aac ttgccaagtt taataggcaa aaaggttaaa aatgtcataa atttattctc 8760 tctcta c tag gttgcccaat tgcctaatat aaatttgagg tggcctattt tcctaattca 8820 aactta a aag ttgccctttc ccctaattga cccataaaag aatgaaagac atttttcttt 8880 tccaaat tac aatccctaga taattttatt ttgtaggtgc attccatcgg ttatgattac 8940 agaata gcta cgcttctcta ttgattctta ttgcgccgtt ggtgacgttt tccatggaat 9000 caagta gtgt tttatctcct atcactaaca acatattcat agattttgtt tatcacttgt 9060 tctgtg t tcc tgatcatata cttgactcag tttctgtgat ttcatcaagt ttttgagaac 9120 agaaga a gca aaaaagaaaa cgagcagagc tgctcttaca atgttttaac cgtgagtgat 9180 aaattta ttt acataaaagt attttaaaaa tagatttaat caaccaattt aatatattat 9240 tttata t tta gttcattttt ttttgacatc ttttatattt agtttagaac acctctattt 9300 gagtac a aca tagattataa tgataaattt ataaaatagc ataatttttt attttcattg 9360 ttttatgata aaattctaaa taacaataat tataatatta ttatattact aattgcaaaa 9420 attaatt aat acattatttt ataataaata tttaaaacgt tgggtaggat tttgttagat 9480 ttttttc aac aaattttgtt atagctaaaa taaaattcaa atgtattgtt aaaattgatt 9540 ttttttt ttt ttgattatta agatttaata taaataaaca tatatgtcat attaaatatt 9600 taacta a gtg gtcctaatct ttgaactagg ggtgggcgtt cgggtaccta ttcgggtttc 9660 ggttcga gtc tattcggatt tcggattttt ggggtcaaag attttagccc cattcggtta 9720 tttcta a att acggttcggg ttcggttcgg atccttgcgg attcggttcg ggttcggata 9780
13/58 ac ccgtttaa attattttca aaattttaaa atttcattat atattttaaa cttttcgaaa 9840 tt t gtaaaca aaataatata ttacatataa atttcaataa tatgtgtcga agtaccaaaa 9900 ct t aacatgt aaattggttt gatttggata tttggataga aaatcaatca tattttatat 9960 at ttttggtg~ttttgagtat gctttaacta tttatacatg tactttttaa tgtttttata 10020 ta t tttctag tattttgaac aatttaaaag tattatatat attttagatg ctttttaata 10080 ta t attcaat ctaaaaatag ttaaatatat atgtatatta atctatttcg gatacattcg 10140 ga t atccaaa atattttggt tcggatcggg ttcggttttg gttctttaaa taccaaaaat 10200 tt a aacctat tcggatattc aattaatttc ggttcggatt tggtattact tttgcagatc 10260 gg a ttcggtt cggttctttg gattcagttt ttttgtccag ccctactctg aacagtagat 10320 aa a aaataga accctaaatt aataggttag attttggtta ggtctttcta attagtatgg 10380 ag a ttctcga ttccttctca ttgcagtgtg gtatgtccaa ctcattgttt atgtacatat 10940 cc a atttagt tttgagtcaa atgtttagtt acttaagagt tgaatgaaat aggggatgat 10500 at t gatggcc aaggttctcc caaagtaaat aaactttgtt tatattttaa gttagcttat 10560 aa c atcaata aaaatgtcat taactggttc aataaaaatg tcattaactg gttcctctaa 10620 tat aattatt taacacacct ggctgttgat aaatttttat gatcgtttaa taattttaga 10680 agt ggatagt ctgtaaatgg tctttgattg gtcgtcttga tttttaaaag tggactaaac 10740 aa g aaggctt agtaataaat actgaaccgg aactctactg gtttcaatag ctcggtttat 10800 ca a tttctct cggctctggg tttagtgaat catgtggccc tgtgggttta aacaaggaac 10860 tc a atcaatc aactggtgac aaatctgaac cggaaattgt ataattcaaa ctgaaccggt 10920 tct tgtaaaa caaatggaac ccgtttgtac tttatctctc gtttattttc tcagtcacga 10980 gt t tttttta gagatcgacg aagaacaaaa tttaggcgaa acaaaaataa aatgttggct 11040 agggtttgtg gattcaagtg ttcttcttct cctgctgagt ctgcggctag attgttctgt 11100 ac g agatcga ttcgtgatac tctggccaag gcaagcggag agagttgcga agcaggtttt 11160 gga ggagaga gtttgaagct gcaaagtggg tttcatgaaa tcaaaggttt agaggatgcg 11220 att gatttgt tcagtgacat gcttcgatct cgtcctttac cttctgtggt tgatttctgt 11280 aaa ttgatgg gtgtggtggt gagaatggaa cgcccggatc ttgtgatttc tctctatcag 11340 aa g atggaaa ggaaacagat tcgatgtgat atatacagct tcaatattct gataaaatgt 11400 tt c tgcagct gctctaagct cccctttgct ttgtctacat ttggtaagat caccaagctt 11460 gga ctccacc ctgatgttgt taccttcacc accctgctcc atggattatg tgtggaagat 11520 agg gtttctg aagccttgga tttttttcat caaatgtttg aaacgacatg taggcccaat 11580 gtc gtaacct tcaccacttt gatgaacggt ctttgccgcg agggtagaat tgtcgaagcc 11640 gta gctctgc ttgatcggat gatggaagat ggtctccagc ctacccagat tacttatgga 11700 aca atcgtag atgggatgtg taagaaggga gatactgtgt ctgcactgaa tctgctgagg 11760 aa g atggagg aggtgagcca catcataccc aatgttgtaa tctatagtgc aatcattgat 11820 agc ctttgta aagacggacg tcatagcgat gcacaaaatc ttttcactga aatgcaagag 11880 aaa ggaatct ttcccgattt atttacctac aacagtatga tagttggttt ttgtagctct 11940 ggt agatgga gcgacgcgga gcagttgttg caagaaatgt tagaaaggaa gatcagccct 12000 gat gttgtaa cttataatgc tttgatcaat gcatttgtca aggaaggcaa gttctttgag 12060 gct gaagaat tatacgatga gatgcttcca aggggtataa tccctaatac aatcacatat 12120 agt tcaatga tcgatggatt ttgcaaacag aatcgtcttg atgctgctga gcacatgttt 12180 tat ttgatgg ctaccaaggg ctgctctccc aacctaatca ctttcaatac tctcatagac 12240 gga tattgtg gggctaagag gatagatgat ggaatggaac ttctccatga gatgactgaa 12300 aca ggattag ttgctgacac aactacttac aacactctta ttcacgggtt ctatctggtg 12360 ggc gatctta atgctgctct agacctttta caagagatga tctctagtgg tttgtgccct 12420 gat atcgtta cttgtgacac tttgctggat ggtctctgcg ataatgggaa actaaaagat 12480 gca ttggaaa tgtttaaggt tatgcagaag agtaagaagg atcttgatgc tagtcacccc 12590 ttc aatggtg tggaacctga tgttcaaact tacaatatat tgatcagcgg cttgatcaat 12600 gaa gggaagt ttttagaggc cgaggaatta tacgaggaga tgccccacag gggtatagtc 12660 cca gatacta tcacctatag ctcaatgatc gatggattat gcaagcagag ccgcctagat 12720 gag gctacac aaatgtttga ttcgatgggt agcaagagct tctctccaaa cgtagtgacc 12780 ttt actacac tcattaatgg ctactgtaag gcaggaaggg ttgatgatgg gctggagctt 12840 ttc tgcgaga tgggtcgaag agggatagtt gctaacgcaa ttacttacat cactttgatt 12900 tgt ggttttc gtaaagtggg taatattaat ggggctctag acattttcca ggagatgatt 12960 tca agtggtg tgtatcctga taccattacc atccgcaata tgctgactgg tttatggagt 13020 aaa gaggaac taaaaagggc agtggcaatg cttgagaaac tgcagatgag tatggtatgt 13080 aag tttctgt tcagtctatg tattttttat ataaacaaga atgtatacat tcttttgtgt 13140 gta gcttcag attgatgata cacgttctgg aattaaccat tggtttggtt ttgcattgta 13200 gga t ctatca tttgggggat gaatgatcaa agattttctt ctgtttgcgc agcagagctt 13260 caa tgtcatt ttgtttctgc tgctgcatgt ataccctact aatgtttgat caaatcgttg 13320 aat agagtga tcatagtgaa aaattgtgtg gttagtaagt tattttgctg ctattctaat 13380 gac a gccttt tatgcgtcta ttgtctgggc ttaataaatt tgaccatttc caattaaatt 13440
14/58 ccata cactt gtttcacgca agattattgg tctgaactaa agaggcacac cttccagaag 13500 atttc aggtg ttaaaagatg tttaggtgtc tgcccgttct gtagctgtca ccatggttat 13560 cgtca agctc ggtcttcatg agagctgata gctgtgatgc catcttcctc ctcttcttca 13620 tattg gctct gtcctgcctt gtctgctccc atgtgggttc aggaggagat catgttcttt 13680 taatc ttggt ggaaatgttg ttgtcgctta tgcttctctg gttcgcctct tgacttgctt 13740 agctt cattc tttatctcca aattgctatg aaatcaattt accatacgta gaataaactt 13800 gcaga ttcat tctattattg cttaagcttt tgttaatcaa caaagaaacc agagacgaga 13860 aatac aaact ctataagctt ctcttttttc tttcttgata gtaaaaccgg ttagagagta 13920 gagat tgatc atatgaacta aaaatcgata ctaaaacggt ttggctccga cttataaacc 13980 ggaac cccac cgttttgcat ctctctctca aacatcacac aatgtccaag atgaagaagt 14090 atttg tgttg tcatctctct gggtgaggag atgcaaatgt tatattctaa ttgttttcag 19100 tgctt ggtct aactttttta agagattact cccagtggtt ggatcaaaga aagagtcaac 14160 attgc attgt gtaaggtgac gaaaactgag ttaaagtaag tgagaacaat acttcaatgc 14220 ttttc ttgtg acaacctgtg taatcatcgc atttgaatat atatgtatat gatgcttatg 19280 atgaa gctat gagaataggc aaatagggtc tgtgttattt ccctgcgatt ctagattctg 14340 atttg ttttt ccttcttaat atttagatta ggtggtcttg cttatcctgt tttagtatta 14900 gagtc ggagt tttggggatg aatcatcccg gatgatatat acaattgtgt attttatgaa 19460 tttca gtttt tagtggataa tgaacacgtt aacgtattgg gattattgta ttagagctgg 14520 gacta aactg ctctcgttga tttcttagca aacagaaaaa ctgctcttgt tgatcaacgt 14580 gtaga tgggt aactgagatg cccaacatgt gacaatccaa agtgcattga gattaatatg 14640 attgc t gcaa gcatttgaaa ctccattgtg ctgtccttca tttctcgtta ctagaatcag 14700 ttggt ttgta atttgtgaac ccgtctttgt ttttgcgtgg ctgtgatttt gaggtcgtca 14760 tggtg tttag attgacaatg cagatccatg cggtttcatg gtagcaggga gagttaagag 14820 tgaaa ttgca aaaagaagat aatacagcca ttatttgagt aagaacgtct cggttttttt 19880 gttgg gggta gcaataactt tatcacaatc agaacagcga tataacttgt tagagtggtg 14940 aaaag ctctc atacttatta taccttaagc ttactagtat tttcacacgg ctactagagt 15000 ggacat ctta aaactttcta tgtgtctagt tttagttata tctgaaaaag gaaaatgâca 15060 gaaaat tggt gtgttgtttc tctattggtt gcatatggcg ttactgaagc tctgttcggt 15120 ttattt gaaa tccagggtct gtcctttctt ttgtctaaat catcagtagt gatcttaagt 15180 tctta actcc attggttata atccttaacg ttctctattt aatttggcta tttcaaatca 15240 ttgatt cgag tgtgttttca ggttgtgaca aggaagctta tgccctgatg tccaacaata 15300 ttaaa catgg gttgcagacc ctgatctgat ctgtggactg tgattattgg ggaggcactg 15360 aagaa gcgtg tttcttgaga aagcacttaa cttcaagttc atatgagaca tatttatgga 15920 accaaa agtg ttggaaaagc tgcagtatag ccatcatcaa aagttgctga ttgttctcac 15480 aacgct ttga ttctgttctt gccaaagaaa cgaactaaaa gcgtattgtt gcttgtaaac 15540 cggtat ttag tatcgattct tatactatca atataattaa atcagaatac cttttataga 15600 tttac ctttg attttccttg gcatattact ttttgtgctt cctataatta tatttatttc 15660 CcCtaa ttat atactaacta attcaactaa tattagtcag aacctacatt aaaaatacaa 15720 caactt aatc tactccatct agaacaaggc acaaaaaagt gaatcgtggt ttggagagag 15780 aagaga gaga aaagagagaa aaagtgaatc gtggtttgga cccggcggtc ggtcggtgcg 15890 ttagcgtccg tgccgccgtc ggtgtctgtt ttctttaagc taaaatttag tctgatgttt 15900 ttcctctcta tctcctccgg catctgcttt gtccgaactc tggccagcca cctcagcggt 15960 ggttct gttc ttggagcaac gacgcggtgg tgggttgatg gcgcggtgaa gacatctttt 16020 gtttgggtct acttctggga gatggaggct accttagctc catcgacgcc ggccttcgta 16080 tccgcgacgg ggaagcctct tcggttccac cgtcatcggt tctagtctcc ggggtgtgat 16140 gatct c cact gtcttgcgcc gccggctttc ggctcctagt ttattagggt ttaggttttt 16200 ttttt t ttct tttcttctct ttgtggttcg tttgggtttg gttgaccgtg gtctcgtcgg 16260 aggagggtga aggtctccgg cgggaaggtt ggtgatgcat gtgaagcgtt ctctagggtg 16320 tgtgcg ataa actacggggg atgagatctc gtagcgacga ttgatgctct ctccgattag 16380 agccat ccta gatcgaaaaa gtgttcgcga tgaggatgtg tggagtttgt gagctccggt 16440 tgggtt ccgg tgaactgagg tgtggttccc cggtggtagc gtgaagcggt ggtggtgtgc 16500 tggcct gcgt gacgcgtgtc tctcgaggac gaggatgtga acacgtatct tgattctccc 16560 aaggtt agat ctacgcggcg gctgacatcc cgagcattcc gtagcgctag ggttttggtt 16620 tgttt gggct gtaggcccgt ttcggattgt aatttgggcc cgaagttagc gggctcgttt 16680 ggttgt aagc ttttgggctc tggcctttat ttaatataaa atcttgacgg aaaaaaaaaa 16740 atctactcca tctacgatta catcaaccaa atgaaagaat atgcatatat aatttataaa 16800 tcgtaa aacc aatgcaccca caaaatagaa aaacctcaaa atataccaac aatacattat 16860 acaaaa tata ttctatttct aataaaatta aaatattatt aataaatggt cgatagaaaa 16920 attaaa aaac ctaatttatt tactaaaagt tatacaaaac agattttaaa aacataatta 16980 aaaact aaaa taaaaagtag aagttatcta ttagtcacta atcgggttcc aagttttagt 17040
15/58 gan t ttgac ttttaaaata ttatttttta taaaacctaa atctgattta tcttggatca 17100 ccgga tttac cggttcaatc ttggatctgg gtcgggtttc aaaacactga atataaaact 17160 ttaattttcg gatcgattcc aagtcagatt ttttttatac gaatattttt gactaattat 17220 attta gtagc tactaaaaaa tataatatgt tgtaaacttt agaaataaag tttaaaataa 17280 tctttgaaat gcatatagta caagtatata gttacgtact tgacatattt aatatagtca 17390 ccaaa attat atcaaactaa attaataatt acaaatataa ttacaaaaac ataaaacaaa 17400 aatctcaaaa aaaaattaaa acaaaaatta cccgccatca aagggcgggt taaaatttag 17460 ttacaaagta aagaactaat tatccatttt tatcttgtgt aattccctga tgaataatta 17520 ggtttt tatc caattttatt ctgattctag aaatggttag ttacctaaaa gagttgagta 17580 agaccgggta cgaggttgat tctggccaag gttcatcccg ggaaaagtgt ttattccaac 17640 ctgaa caatt tggatcgtgc caaatacaac ccgaactaat ggttagtgcc aaatacgacc 17700 tgaact caat taaaacttta aaaacctacc cgaacttttt aaaatgtgca taaatctaca 17760 ttgaaa tatt attaaaaagt tgaaattaca taaactacta ttttttcatc gtattaaatt 17820 ttaaaa cttt ggtgataatt ttttctaatt tatataaata tataacatgt ttttacttat 17880 tatatcttca ataaacttat atcttactaa aatataaata ataaaatatt tataattaca 17940 tgatct caaa tatacttaaa attttgaagt tatttataaa aatttcttgt atagattatt 18000 tttatt ttta aaacttaagt gatttttttc aaaagttatt attatatatt ttaatatttt 18060 gttcaa tttt gaaaggtaaa aggttcaaaa tataaataac ttcaaaaatt ttgaacaaaa 18120 tattaaaata tataataata aatttgaaaa aaaattcact taagtttaaa aaataaaaat 18180 aatctataca ttttttattt ataaataact ttaaaatttt aagtatatct aagataattt 18240 aattat aaat attttattat ttatatttta gtaatataca agtttattga agatataata 18300 agtaaaaaca tgttatgtat ttatataaat cagaaaaaat tatcaccaaa gttttaaaat 18360 ttaata cgat gaaaaaataa taatttatgt aatttcaact ttttaataat atttcaatgt 18420 agattt atgc acgttttaaa aagttcgggt aggtttttaa agttttaatt gagttcaggt 18480 cgtatttggc actaaccatt agttcgggtt gtatttggca cgatccaaat tgttcaggtt 18540 ggaata ggca cttttcccgg ttcatcccaa gtgaaccaac tttgattaaa ccgttttggc 18600 aacagg agtt gaaccggtca gtgtaaaatc aatttgaacc gattatttaa ccaaccgaat 18660 tgacac ggtc attgttttct gatttcaaat cagtgatttg gttatagtcg ctcaagccaa 18720 aaagtt cacg acttgaccac tcctcactca ctcgtcgttg gcttcttggt aatctcaggc 18780 gaaatgttgg ctagggtttg cagattcgag tcttcctctt cgtcttctgt gtctgcggct 18890 agatttttct gtacgggatc gattcgtcat gctctggccg agaaaagcag ggatggagag 18900 agtggc gaag caggttttag aggagagagt ttgaaactgc gaagtggatc ttatgaaatc 18960 aaagggttag aggatgcgat tgatttgttc agtgacatgc ttcgatctcg tcctttacct 19020 tctgtgattg atttcaacaa gctaatgggt gcggtggtga gaatggaacg cccggatctt 19080 gtgatt tctc tctatcaaaa gatggaaagg aaacagattc gatgtgatat atacagcttc 19190 accatt ctga taaaatgttt ctgcagttgc tctaagctcc cctttgcttt gtctacattt 19200 ggtaag ctca ccaagcttgg actccaccct gatgttgtta ccttcaccac cctgctccac 19260 ggatta tgtc ttgatcacag ggtttctgaa gccttggatt tgtttcatca aatttgtaga 19320 ccagat gtcc taacgttcac cacgctgatg aatggtcttt gccgcgaggg tcgagttgtc 19380 gaagcc gtag ctctgcttga tcggatggtg gaaaatggtc tccagcctga ccagattact 19940 tacgga acat ttgtagatgg gatgtgtaag atgggcgaca ctgtgtctgc attgaatctt 19500 ctgagg aaga tggaggagat aagccacatc aaacccaatg tggttatcta tagtgccatc 19560 attgat ggcc tttgtaaaga tggacgccat agcgattctc ataatctttt cattgaaatg 19620 caagac aagg gaatctttcc aaatatagtt acctacaact gtatgatcgg tggattttgc 19680 atctct ggta gatggagtgc agcccagcgg ttgttgcaag aaatgttaga aaggaagatc 19740 agccct aatg ttgtaactta taatgctttg atcaatgcat ttgtcaagga aggcaagttc 1980D
ttcgag gctg cagaattata cgatgagatg cttccaaggg gtatcattcc taatacaatc 19860 acatat aatt caatgatcga tgggttttgc aaacaggatc gtcttgatgc tgctgaggac 19920 atgttt tatt tgatggctac caagggctgc tctccggacg tattcacttt cactactctc 19980 atagac ggat attgtggggc taagaggata gatgatggaa tggaacttct ccatgagatg 20040 cctaga agag gattagttgc taacacagtt acttacaaca ctcttattca cgggttctgt 20100 ctggtg ggcg atcttaatgc tgctctagac ctttcacagc agatgatttc tagtggtgtg 20160 tgccct gata tcgttacttg taacactttg ctggacggtc tctgcgataa tgggaaacta 20220 aaagat gcat tggaaatgtt taaggctatg cagaagagta agatggatct tgatgctagt 20280 caccccttca atggtgtgga acctgatgtt ctaacttaca atatattgat ctgcggcttg 20340 atcaat gaag ggaagttttt agaggccgag gaattatacg aggagatgcc acacagaggt 20400 atagtc ccag atactatcac ctatagctca atgatcgatg gactatgcaa gcagagccgc 2046D
ctagat gagg ctacacaaat gtttgtttcg atgggtagca agagcttctc tcccaacgta 20520 gtgaca ttta acacactcat taatggctac tgtaaggcag gaagggttga tgatgggctg 20580 gagctt ttct gcgagatggg tcgaagaggg atagttgctg atgcaattat ttacatcact 20640 ttgatt tatg gttttcgtaa agtgggtaat attaatgggg ctctagacat tttccaggag 20700
ttcgag gctg cagaattata cgatgagatg cttccaaggg gtatcattcc taatacaatc 19860 acatat aatt caatgatcga tgggttttgc aaacaggatc gtcttgatgc tgctgaggac 19920 atgttt tatt tgatggctac caagggctgc tctccggacg tattcacttt cactactctc 19980 atagac ggat attgtggggc taagaggata gatgatggaa tggaacttct ccatgagatg 20040 cctaga agag gattagttgc taacacagtt acttacaaca ctcttattca cgggttctgt 20100 ctggtg ggcg atcttaatgc tgctctagac ctttcacagc agatgatttc tagtggtgtg 20160 tgccct gata tcgttacttg taacactttg ctggacggtc tctgcgataa tgggaaacta 20220 aaagat gcat tggaaatgtt taaggctatg cagaagagta agatggatct tgatgctagt 20280 caccccttca atggtgtgga acctgatgtt ctaacttaca atatattgat ctgcggcttg 20340 atcaat gaag ggaagttttt agaggccgag gaattatacg aggagatgcc acacagaggt 20400 atagtc ccag atactatcac ctatagctca atgatcgatg gactatgcaa gcagagccgc 2046D
ctagat gagg ctacacaaat gtttgtttcg atgggtagca agagcttctc tcccaacgta 20520 gtgaca ttta acacactcat taatggctac tgtaaggcag gaagggttga tgatgggctg 20580 gagctt ttct gcgagatggg tcgaagaggg atagttgctg atgcaattat ttacatcact 20640 ttgatt tatg gttttcgtaa agtgggtaat attaatgggg ctctagacat tttccaggag 20700
16/58 atgatttcaa gtggtgtgta tcctgatacc attactatcc gcaatatgct gactggtttt 20760 tgga gtaaag aggaactaga aagggcagtg gcaatgcttg aggatctgca gatgagtgtg 20820 ggtatgtcat tcaacacatt ttgttttcaa atttctttgc ttacctttat aattttggag 20880 aaga gctgca gcttatgctg tagcatcagg gaaactttct taaatgaatg gtttggtgtg 20940 tttgttttgc agggtatcag ttggaggatg aatgaaagaa tgaaagacac ttttcttttc 21000 caaatttaca aggccttgtt gattttattt tgtaggtgaa ttccatcggt tatgattatt 21060 gtag ctacgc ttctctattg attcttattg ctacaattaa caacagtttc atagattttt 21120 tttt atcact tgttctgtga tttcatcaaa tttttaaaaa cagaaaaagc aaagaagaaa 21180 acga gcagag aaagctgcac tctctccagc tcgtggttaa aaaaaagaaa gctgcactct 21290 ctcc agctcg aactccggtt aacaatgatt ccacatccaa tttcggttaa cactgaattc 21300 acat ccaact ccgttcggct atgaccttgc ttcttttcgt agctccatct tccctcttgc 21360 aatcagaacc tccttctgca actccttagt cctctacctt gaaacaacaa ccaccatcct 21420 tcca tattcg ccatagggtt ttcttttggt taggtcttgc taattagtat ggagttgcct 21980 tatt ccttct cattgcagtg tgtggtatgt cctactcatt tgtgttgatt ttgttttatg 21590 ttct catcca atttaatttc gagccaatga aggcttatta ttaaaaaaaa cacctgccat 21600 atct taaacc ctcaacacag acaaacgcaa caaccactaa caaaaatttg tacacatctt 21660 cctc cacctt tagaatctct tctctcccct acacttacct gatgactcac aaagggttgt 21720 taaa cacctc caagtctctc gtacagaatt catgagctct ctgcaaatct atcttggcgg 21780 tgga agtaaa tctgattcat ggtttaatga tctcaccata gagagatatt aatgactctc 21840 tggt aacctg caaaagcaga gcaatacgag gaaagaacat ttagtgtgat cagaggaagc 21900 atct tgacat gtttcagtaa ctctcacaga tcagaatctc tgtttaatca tttggcaaaa 21960 gagg ctgttt ctcttctact tacctccatg ggaactcgct tgtgtctatt ccagcttgat 22020 gaag ctcatc aacgtattg~ aatgcttccc gacattcctc tcgatcatca tagaactctt 22080 tctt atcacc ttcaagctga tacgcttcgt ggcctttccc tgctaccacc tgcaaagaaa 22140 gtaa atcagt gtcaagaaac accattgcat aatgtaactt agaagctgag attactttaa 22200 agaa tttcaa tccagcaacc ttaataacac accagggaaa gtaaaaaagg tgtacagaga 22260 atgg gtttat ttaaatactt acaaccatgt caccttcttc acccatcgca acagcacaac 22320 gcac agctac acgtctaatg tcgtgaagga agagtctatg accatttgcc aatggaggat 22380 agta atcatg ttctccgtgt ttcagatact cttgcatcgt ccatccaatc ccagccaaca 22440 tgtc atccaa tatgtccact gaaatcacat ttaaagagtt ttctacctgt tacacatcaa 22500 gggt tataga ctcgagctaa tctcagattt actcacatgg atcttcattc cccggattat 22560 caga tgtcaa catcgtcaca tcactctttt cagttgcgat tttcgtcata accggtcgtt 22620 tccctctctc agtctcaccc gcacagccaa taactttaac aaatcagacg acaatacata 22680 taaa caccat aagaactagt ggatatggat taaatagacg taagatgtat ataccagtaa 22740 tgat tcttct tggcttaagc tctcgaaccg 22770 <210> 8 <211> 29 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2 K11.19 C4.11.A
<400> 8 ccggt ctggt tcttactcag aaacatctc 29 <210> 9 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2 K11.19 C4.2.4 <400> 9 ctaac ctgaa atgcgctgtc g 21
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2 K11.19 C4.11.A
<400> 8 ccggt ctggt tcttactcag aaacatctc 29 <210> 9 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2 K11.19 C4.2.4 <400> 9 ctaac ctgaa atgcgctgtc g 21
17/58 <210> 10 <211> 26 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2 K11 PFC1.1 <400> 10 ggatttgaga ttgatacatc agatgc 26 <210> 11 <211> 27 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2K11 PFCl _ 2 <900> 11 gtccattcat cttcgtcagc tctcatc 27 <210> 12 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce MF24-D7.17 F24- D7.17A
<400> 12 cagcttagtc ctgggtcaat g 21 <210> 13 <211> 26 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce MF24-D7.17 F24-D7.17BR
<400> 13 ccctatagaa tagccaaaga gtgtga 26 <210> 14 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de 1a séquence artificielle: Amorce M-F24-D7.16
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2 K11 PFC1.1 <400> 10 ggatttgaga ttgatacatc agatgc 26 <210> 11 <211> 27 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F2K11 PFCl _ 2 <900> 11 gtccattcat cttcgtcagc tctcatc 27 <210> 12 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce MF24-D7.17 F24- D7.17A
<400> 12 cagcttagtc ctgggtcaat g 21 <210> 13 <211> 26 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce MF24-D7.17 F24-D7.17BR
<400> 13 ccctatagaa tagccaaaga gtgtga 26 <210> 14 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de 1a séquence artificielle: Amorce M-F24-D7.16
18/58 <900> 14 gatgttt tat gcttaaccgg acgac 25 <210> 15 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de 1a séquence artificielle: Amorce M-F24-D7.16 <900> 15 agtggggaga tggatactac aatgg 25 <210> 16 <211> 2 5 <212> ADN
<213> 5 équence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24-D7.13 <400> 1 ~
ggccatgtga ttttattttg ttccg 25 <210> 17 <211> 2 5 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24-D7.13 <400> 17 tgaatcg cgg gattaaggca agaag 25 <210> 1 8 <211> 2 6 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-29-D7.13 <400> 18 gtggatc atg ctaacacacc tgatgg 26 <210> 1 9 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de 1a séquence artificielle: Amorce M-F24-D7.16 <900> 15 agtggggaga tggatactac aatgg 25 <210> 16 <211> 2 5 <212> ADN
<213> 5 équence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24-D7.13 <400> 1 ~
ggccatgtga ttttattttg ttccg 25 <210> 17 <211> 2 5 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24-D7.13 <400> 17 tgaatcg cgg gattaaggca agaag 25 <210> 1 8 <211> 2 6 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-29-D7.13 <400> 18 gtggatc atg ctaacacacc tgatgg 26 <210> 1 9 <211> 25 <212> ADN
19/58 <213> Séquence artificielle <220>
<223> Description de 1a séquence artificielle: Amorce M-24-D7.13 <400> 19 cgtttaatgt cgcgaagtga gagtc 25 <210> 20 <211> 26 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24-D7.9 <400> 20 gttcgttcgg tttcaattct gttcgg 26 <210> 21 <211> 25 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F29-D7.9 <400> 21 gacgttgtca gttgttgtat atggc 25 <210> 22 <211> 27 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-24-D7.7 R15-Fl <400> 22 atttggaagt tccttgacca tcatccg 27 <210> 23 <211> 27 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-24-D7.7 R15-Rl <400> 23 tactggtgac cgctatcgaa tgggtag 27
<223> Description de 1a séquence artificielle: Amorce M-24-D7.13 <400> 19 cgtttaatgt cgcgaagtga gagtc 25 <210> 20 <211> 26 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24-D7.9 <400> 20 gttcgttcgg tttcaattct gttcgg 26 <210> 21 <211> 25 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F29-D7.9 <400> 21 gacgttgtca gttgttgtat atggc 25 <210> 22 <211> 27 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-24-D7.7 R15-Fl <400> 22 atttggaagt tccttgacca tcatccg 27 <210> 23 <211> 27 <212> ADN
<213> Séqu ente artificielle <220>
<223> Description de la séquence artificielle: Amorce M-24-D7.7 R15-Rl <400> 23 tactggtgac cgctatcgaa tgggtag 27
20/58 <210> 24 <211> 20 <212> ADD7 <2l3> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24D7.4 F24D7.4.1 <900> 29 cactttactc aagttgaaca 20 <210> 25 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24D7.4 F24D7.4.2 <900> 25 atattctacc ctacggagtt 20 <210> 26 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.15 PFC24 .l <900> 26 ctctgccttg ctactgaggt ctcac 25 <210> 27 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.15 PFC24 .2 <400> 27 ggatgttgaa ttcatcctgg agaag 25 <210> 28 <21l> 24 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.9 PFC23 . 4
<223> Description de la séquence artificielle: Amorce M-F24D7.4 F24D7.4.1 <900> 29 cactttactc aagttgaaca 20 <210> 25 <211> 20 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F24D7.4 F24D7.4.2 <900> 25 atattctacc ctacggagtt 20 <210> 26 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.15 PFC24 .l <900> 26 ctctgccttg ctactgaggt ctcac 25 <210> 27 <211> 25 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.15 PFC24 .2 <400> 27 ggatgttgaa ttcatcctgg agaag 25 <210> 28 <21l> 24 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.9 PFC23 . 4
21/58 <900> 28 cacgcgactt gtcccatcgt cctg 24 <210> 29 <211> 24 <212> ADN
<213> Sê quence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.9 c23. abf <900> 29 gagcaaggag gttccttggt tcct 24 <210> 30 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F22C12.1 C' 8.B.2 <400> 30 gtctgctaca gtgaacgata g 21 <210> 31 <211> 22 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F22C12.1 C'8.A.1 <400> 31 gctagctctt atgcaagctc cc 22 <210> 32 <211> 127476 <212> ADN
<213> Séquence artificielle <220>
<223> Des cription de la séquence artificielle: Séquence BAC 64 <400> 32 aagctttaaatttttttaaaagtaacagctacaacttttaaagttaaaatccctactgct 60 aaaattctaaagtcatagtctaaagcgaaaattgttagcaatcagagcttcaatattttt 120 tttttctagccgtcggataatttttgaattcaaaataatatcagatattctagtctcctt 180 ttcctcgcatcctacaatctttcttcgaacccatgtttcaattagggagtactccattc 290 g aaattctctaattattttagtttttttctatcagagttttcttaaattttgaatctagt 300 a gtaaattatagaaaattattcagactgatcttaattcactggaatattactagactaac 360 g ctcattaaatcacgtattgcttgaataggtcaaacatacataaaaatcttctaaaatta 920 c ttttatatactttggcactatctatattattatttatgtagtgatttgacttatttgtc 480 c
<213> Sê quence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-T12P18.9 c23. abf <900> 29 gagcaaggag gttccttggt tcct 24 <210> 30 <211> 21 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F22C12.1 C' 8.B.2 <400> 30 gtctgctaca gtgaacgata g 21 <210> 31 <211> 22 <212> ADN
<213> Séquence artificielle <220>
<223> Description de la séquence artificielle: Amorce M-F22C12.1 C'8.A.1 <400> 31 gctagctctt atgcaagctc cc 22 <210> 32 <211> 127476 <212> ADN
<213> Séquence artificielle <220>
<223> Des cription de la séquence artificielle: Séquence BAC 64 <400> 32 aagctttaaatttttttaaaagtaacagctacaacttttaaagttaaaatccctactgct 60 aaaattctaaagtcatagtctaaagcgaaaattgttagcaatcagagcttcaatattttt 120 tttttctagccgtcggataatttttgaattcaaaataatatcagatattctagtctcctt 180 ttcctcgcatcctacaatctttcttcgaacccatgtttcaattagggagtactccattc 290 g aaattctctaattattttagtttttttctatcagagttttcttaaattttgaatctagt 300 a gtaaattatagaaaattattcagactgatcttaattcactggaatattactagactaac 360 g ctcattaaatcacgtattgcttgaataggtcaaacatacataaaaatcttctaaaatta 920 c ttttatatactttggcactatctatattattatttatgtagtgatttgacttatttgtc 480 c
22/58 atcttcttgattttatattttttaattatttttcattgattgttgtttatttgtcatatt540 ttccaaaattttaggtaattttctgatttcttatgtttttaataattttagttttaatta600 tttatcatattt tccacatttaggttatttatttgtcatgttcttaataattttatcggt660 aatttttatatatttattatattattatataatttaggtggtaatttgggtttattttat720 aatcaattgttaatcttaataagtaatttagggatttagctgataatttttattattttg780 agaataattaaa aaactaatgatagtatcatatttaaatttatattatatttaatatatt840 aattttaaaata ttatatatataagataaaaaataattatcagctaaatcactaaaatta900 cttattaagatt tattattgattataaatttaaaaaaactaaaattacggagagaatgaa960 atttaatattactaaagtaaatataagataaatttaactatgatattatcattagatttt1020 ttaaaatattct cgagaaaacaataaattatcagctaaatcagtaaaattatttattaag1080 atcgataaataattataaaatatgactaaatctaaaattatgtagagcatgcaatttaat1140 aatcaatcaaat attaaagtttacatgcaactattttaataaaatatatatttattacgt1200 aaaataatcttg aaaacattcccatatatataaaactatatacattgatttgtatttatt1260 ttaaaaatagta cgctgtaaaaatatttttggataacataatatagaatcgttttagata1320 atattgattata aaattaacgaaattcgttttaaatttatggataactatattatatgat1380 atatattaaaat ataattagtttaatattactaaacgtgaatatatgaatagggcgaacc1440 actccgtggata tttttatttcaaaacaatataattagaattagactcggtcaactggaa1500 tgtgtattatccatataggggatttttcaattgagaagatctatcgacctgagacgaaga1560 aaaatgtctatctattttatttagttattcagttgattcgttattaaaatggataacgac1620 aacaatt'tcata cgacatgcgtatttttgattttccaatggatttatattcttcattaat1680 ggaaattctttt gatgtagtgagtaatagttatggttgttcgctgtttaagaattcttgt1740 ttagacagttcgtaccatccatacataatgttttgatctaatattccaactcttccatgt1800 ttccatcgtagt atattgttccatggaactaagtggaagaaacatgtgtttctacaattc1860 taccacccagtcaatttcggctaattaatgagaaacctttctcttgttacattacatgaa1920 tcataaacaaaa tataatatacacatacatatatgtactaaagtaaatataagataaatt1980 taactatgatat taaaattagtttctttaaatttttctcaagatagcaataaattatcac2090 ctaaatcagtaa aattatttattaagattaataattaatcataaaatatgactaaaccta2100 aaattatggaga gtattaagtttaataattaattaaacattaaaatttagggtaattctc2160 tcaaataaccat tttaagtttttgtcacgaaaatagcactcaaaaagtaaaaagaccaaa2220 atagcctcttct tattttaaaaatttttatttttattttttaaaatttgaaaccctattc2280 caaaacccacct cttaactctaaactctaaactctaaatgtagattagctaacccttagg2340 gtataaatgtat attttaccctttaataaaaatttatttggtcattttcttccttgatag2900 ctatttttatga aaataaactaaaaaggattatctaatagaatttctctaaaatttatat2460 acaaaatttttt tatcaaaatttattttatcatgtaaagtaaacttgaaaacagtacata2520 ttcataacacta tatacattgatttatatttagttttaaaatactatgttgtaaaatatt2580 tttggataacat aatatagaatctttttagataatgatgattataaaattaatgaaattc2690 gtttaaaattta tggataattatatatttatatatatacacacattaaattagattcagt2700 ttaatattacca aaaccaaatataatataaacacacacacacacacacacacacacacac2760 acacacacacac acacacacacacacacacacacacacacacacacacacacacacacac2820 acacacacacac acacacacacacagatatatcacaaaatatataattgctcataaattt2880 tataatcatcat tatttaaaaagattttaaaattattttatccaaaaagatattacatcg2940 taatattttaaa aattaaaataaatccatgtatataattttatgtatatatgaaagtttt3000 caagtttatttt ccgtaataaaagatattttgttgaaattaaaagttattgtatataaaa3060 ataatatttaaa taattattaaatattttcaaaatataaaaataatttattttaatagtc3120 ttctgaatttat aatatatctatttacaaaatttggtaagattatcaagcccgtaagtgc3180 gggcaaaacacctagttatattatataattgaaaacaaggatatatcatataattgaaaa3240 caaggagaaaaa aatagttatttattagggggttttattcgttgatgtattgtaatagag3300 tttaaatctaac cataatctactgttatttgaatgatgatttaacattctattttaaata3360 tagtgttattcaatgaatgatttaaattcagtttttaaaatctagtgttattcaattttt3420 aaggattgtaat tttttttgtattttcaattgatttcaaatcatgagtctaatgaataaa3480 tgagtgaactca aaatcaaaggtacactaaagagattttagaattcttgaactttaaatt3540 ttaaaatatgat ggattgaaaatcactgatcgaataacactacctaagtttaataataga3600 atgactctaaat t tattttaattactagtttagatttcatgcatgttatacccttaagtt3660 cattgttataaa aaatagtaaataaaaatttgtcattactcaaaaacttattttattcat3720 attttatgtagc cacatacttatctttatttttctttggcgatagacttaccttaaaatc3780 gatagacaattagattttcataaatatgttatgtttggtaaaatatttattaaatattca3840 tagatttaatta gatttagtttctttgaccacatatttactaattttgatagattttttt3900 ttgttttgaccacctatttacttatttttgacagatttatttggatttcaactgatttat3960 tatcatttgaccataaatttaattaattttgacatatttaatatggatttgatagattta4020 tttattctttga c cacatgtgtaattacaatttgatagatttttgtatactttggtgaca4080 gattttatagttattcagtcacatattaattaaattcaccttaaccaaactggttattga9140
23/58 aaactggatctaaccattaaattctaaaattttatataatttaaattgaactaaaccaaa9200 atatttctaaccaataaattaagttaaccaaatcataacaaaaacttaatttaaaccaaa9260 gaagaaaaaaaccctaatctacaaaagaacatcacgtgtcattctttagcgagagattac4320 gtctcctatgtctttcattgttttcgtttttcactcatggctctggtaaaattgtttgtg4380 gtatctctggaatgcttcataatcaagaactctctttgcacactctaacgggaggcaaat4940 ccttatttccctatatttatttcatatgtcaatctctacagggcacatttttttaatttt4500 atatatcaaacaaaaaatcataaattaaaatggaaacgtgaatattttttatttgattta4560 tagaatttgataaaaatatttcaaaaatcaaaaaattgttttttcataatttcgcgaaaa9620 tcatcaaaatatgatttaaaacgattttaaaatatattttttccaaatttgaaaggtata9680 gaacttaaatatttgcccatggtttcactaatccatagggggtgttagggttttgttttg9740 aagagagaagatgatttgatttgggagtttaagttttggtcaaaaaaaagaattatgaaa4800 aaaagatataggagatcaagtgaatccattgaaaaattgtctctagagaaataggggaat9860 gggaatgggaaaagttgactcctctaccagaatatgacgtgaggaagctattccatagac9920 agcaagatgaa gaacacataacaatctaaccattgtcctcttctcgacactccaatattt9980 gcatctttccaatactaactgaagctgaaccatgttaggaccaacaacggtaggaacttc5040 tttctttccaaaactctgcgtgatcaacattacaaatgtcctcttctgaagctgaaccat5100 gtcctgtgatcgctatcacgaaattctgaaaaagagagacgaatgagctgcacatcaatt5160 agaggtgtcaa ctgggcgggctgggctgtccatggattagaccggtccaatttagtttag5220 gtaggctatgaacgctaattggtctaattgtacaaaagaccaattggtctatggtctaac5280 tgggcaacgac caaatggacaatgggtgtccataggcctcctagaaatatagttttccaa5390 tttattgaaaa acacaattttaacgaaaaatcaaaactttgcgatttaatagaaaaacat5900 aagtttacgattttagcggaaaatgtaattttacgttttggcgggaaaacgtaattttat5460 agttttggcgggaaaacgtaattttacggttttagcggaaaaacgtacttttatggtttt5520 ggtggaaaaacgtaaatatacgattttggcgggaaaaaggtaattttaccattttggcat5580 gaaaaacataatattcggttttggcatagaacgtaatttaatttttcagttttggcgaga5640 aaacatgattt ttttattttggcggagaaacttgatattttaatttttggcggaaaacaa5700 aataactaaat tttggcggaaaaacgtgatttctcaatttt ggcggaaaacatgatttat5760 cggttttggcc gaaagcacgattttccggttttggcgggaaatcacgatttccggttttg5820 gcgggaaatca cgattttccggttttagcggaaaaacgtgatttctcggttttcgcggaa5880 aaaaaattctc ggttttagcggaaaacatgatttctctgttttggtgaaaccgcgatttc5990 tcggtttagacttaccttttgtttgaccaaagctttgtgactctatgaagcatttgtgtt6000 tcttaattgaa ttgtgagtcttgtgacccctggtttgcatctcttcctttggttatattg6060 ataaacagtgctattcctccttttccaatttttgattttaatcctgattcgttttttatt6120 aaaccatattt tatcttccgatcattcaccattcactgccactaacattctcgataattc6180 aagcttcgttt atgaagataaattatttgaaactttctatctaattattttgcgtttatg6290 atctattgata atatgaatctcatctaatgttatttaagagttatgtcttttcataaact6300 gatattagttt tattttttcaacatacaactattaaattttataaagtagatataatatc6360 ttaataagaga ctcttttatttttaagaattgttcttttccattataagagttgtattt6920 tcataaaatga gttaacaataataatttaaaacatgcacataaacttcaatgtgtgtgtc6980 tttaccaacat gttaaaacttttaagttatgcggtatttttttcatgtaacaatcaaata6540 gtttatgagaatttatttttattattctcaattttatctctgtttaatgcaattttattt6600 tattttacatgaaaacatgtatttgtttattcaaagattttttctcttgtgaagaaatac6660 stcctttaaga atactaaaaatgttgcaaaatcgtatccttccaaatttgtaacacatgt6720 3ttttcttaaa aacaattatattttttttaaatgttattttataaaatatagcatattta6780 =atttataaat gagttcccgtgtgatatcgcacgggttccttacctagttaataataata6840 ~taagattgca ttaatacatagtaactgatggaaaccagtcgtagcttatgtctttgtgg6900 caaggctatg tgttaattaatattattactagattttgatccgcgcttttgaagcgcgg6960 ~atattttacg atgaaaaatttcactaataatttaacaaatattttggtaatttttaaag7020 igtgtatttaa aatatttttgcatttaaatcagtatttttaaattcaacccgattgtgat7080 :ataccggtta atccggagatctgacaattcaatttatgtttttaaaatattcatattaa7190 iaaatcactaa aacccgagactaaccgattgaactgatggatgatcaatatgtaatctaa7200 :tggatttaaa ttgtaatagtttcataatttgtaatcttataatcgaaattttaaagttc7260 ictattttgca atttatgaaattatgacgtttctacaaaattttaaagagaaaatgatag7320 itataaaataattaagattaattattttattatttggaaacattgatagtagtataaaaa7380 :atattgtttg gaaacattgataatagtataaagaaataagtatattgtttggaaacgtt7490 ~atagtagtat aaagaaataagtatattgtttggaaacatggatagtagtataaaaaaga7500 ~atattagtga tttaatgtatgtttaactataaagtataaaagtatatttaatttaaaaa7560 atacaaaata aatgttaggtccaacagaatgtttctgttttaataagatagattactct7620 ~taataaccaatggaaattaaatgggtactaaatcatataaaatataaaagtgctgtatc7680 ~attttcccttattgcc'tcattacttgatattttgttcgtgaatattatcgtttatagaa7740 ctatttcatt taaactatgtagagtagttattgtaggaggctaaaatctagcaattttt7800
24/58 tcaaaaaaaa ctagcaattgccaaatcttttgttctatttgatttacata7860 aaa aaaaatt tcttttgttc tatattttgcaaaccctatatatataatcttattcattaa7920 aga tgaataa tcggtttcac cctttctaaagataaaatagtttttgagttgctaaaacaa7980 aaa cactccc atagttatttattataattctaataggcaattctcaaaaaaaaatatagttcttgttata8040 cttaattttttttt aatgtcaatagaagaataaaatacaaattttaacgatatatttaat8100 tccgcatctatcta atcttatttatttcgtatatgttagtatactagatgatgttgaagt8160 tggtatttcatata tgaaagattatatatataattatgactttttcttgggttcaccccc8220 taggatgaaccttt aggttcaccaaccaatagaaaattgttattttaaatctaatatctt8280 ttaattaagaaaac aaaaataacctgccaaattatattatgcttttaaaataaataaaaa8390 gattaaataaata a caatagttctcaataaagattattttaaaaaatatttatt8400 aaataa tataagatttggagtttagtgtttaagatttatagtttagaatttatccaaatgtttagt8960 gtttttccaaggg ttagggtttacccaaaggtttagggtttacccaagggtttagggttt8520 aggattagagtttagggtttagtattttgttgagaacatgtttagtgttttttccaaagg8580 tttatggtttatc caagggtttaaggtttatgattagagtttagggtttagtattagagt8690 ttagggtttagtg t gacaacattaattttttttaattcgtttttatatactatt8700 tttgtt tttatttattttta aattttattttgaaaaaataatataatttgacaaattatttgtttt8760 cttaaataaaaga t tctaaaataacaagtttctattggttggtgcatagggggt8820 actaaa gaacccaaaaataa ctcattaaatcaatttatagcaaatactaacctagtctaacagatt8880 tccagtcaaattgt ttttaaggaaacccttacataatacgaaagattatacatatacaaa8940 agattataccatcc atatatagtaaattttaaattcgttgaacaaatttatagtcaaagt9000 tttgttatggaaac cattacattacgagaaatattttatatataaaaagttaaaaacaaa9060 atattatatcatcc atttatagtaaataataaaaactgttgaccaatatgcgttagaata9120 tagaaaattaatta tgaatacttataacaaaatatgtgttaccaaaaatggaagatctat9180 catgaatatatata aacacaactagaccaaacgatcaaatcacaataagaagaaaataca9290 aaaaggtaaatcaa gtaagaaagtcttttttttttcaagttagaaattcatatgcatgtc9300 aaggttagaagttt tcttttgaagaagactaaatttatttctttgaaaataagtatttaa9360 gcatctccaaatac tttttagtatacaaagttttaatttttttctaaatttatttattca9920 tattgtaaaagcgt atatgttttagtatatgtaaaagtacgtaatcagaatttgtttctt9980 aagagttattacactagaatctcgtctgatgttaattttgaaatctgtatttttttattt9590 ctgtgaaggatact tggacaaagagtttctgtaacctacacatacatatcatggcaacca9600 agaaaagtttatct attatgttgtctctgttaatggtcttgactctcataagcctttttc9660 ctacaatttcaggt aatattttttttaactttaggaagtatttattttatgattttatta9720 acttaaggcaaata gaaaatattctaccaattcgaaattctctgaaaagaaatcaagaag9780 tttttagatgattc gaaaattcaaaaagactaaggagttgagttaaaatatgttaatttg9890 ctaatttttaattt gaaagtaaaactaatgctaattatat'tgacttaaataggtaacgaa9900 ggagaatgtcaaca acaggggctatgtgagggcgcaaacccggaaaagacctgcaaagca9960 agatgtatttctct gaattacaatctcgggggaatttgcttaaaacatgcaaatggccca10020 gacaaaccaattac ttatttttgttgttgcaagatataaattaataatgtctgagactat10080 aatattttatcaat ttataaaattattagtttacaaaagttccctttttatttttattct10190 aaattatatcttta tataaaataagaaagtaattaattgaactgtatatacattaattaa10200 gccttagaaatttg aatttcatattatgttttatattgtttggtgtatatgttgtatatg10260 tttttagatctaaa tgtggttttagatatagttttactaaatactattaaaatatattga10320 attattaagaaaaa tatttataatgccatgatgaatattaaatagcattagaatgtttgg10380 tttggacatatcct tgtatcaccactttcttatattatgtgtcctatatttactaaaact10490 atgtcataccatat aaaattagaatgtttggtttggacatatccttgtatcaccactttc10500 ttacatttcacaaa ctatgtcataccatataaaattattttgagacatttgacttaggcc10560 cctcttacattagt taattatggatgataggttttaaaattcattcagaaattagagtta10620 agatttatgataat gtatagaataagtaatatatgaaaagaatgtttactaataaaggta10680 acatatactcggcc tccccactccatgcggaagcagaaggtgttatttgggcaatgcagg10790 agctgttaaaaccg agggaaaagagagattcagctgcgatcagactgtgagcaacttgtg10800 aaacttataaatac t ggaatggccagcattggcctctgagttggatgaaattgca10860 gatat gcactgtctaaaga gtttatgagcctctctatatgcgcaatcccgagaactcagaatgcc10920 cgagcggacggctt ggcaaaagggggacgtacacgcaagctcatcccgttcgttagtgac10980 tccgcacctacatg gctagcccctgaagctagtctaacggctgtagagtaatcttttatt11090 tttattcgatgtca aaaaaaaaaaaagatcttggtataaaatatatacatattatgattt11100 tatggactgataca attgtagtgacccaagtgcagatataagagtaaatgagtacaacct11160 tctacttgtaaaat attaagagatagtttgtgaaatgtaaagcttaggaccgccttctat11220 ttctctttggctgt cctttatgggtactgacggtggattataatggcgatatggtctctg11280 gcgagtattaagta t agatcacatttactgtccgatcttctttatgttttgattt11340 cttta gaccatgtctgttc ggcacagactatcccctcatcttgcgatagacctattttcttcttc11400 ttatcgggcctttg t ttgacccggttcttggaccggtatggattaaggtgaaacc11460 aataa
25/58 tacctccaat aat aatcatc cagtcctcgg tcatcagcca ggtcaggtgt ttattccgat 11520 ttggatggta tgtttgacgc cgaaggttta tgaaaaaccc agtaagagat tctggtttat 11580 tgaattagtt gtgagatttg attgatgtaa atcatgggat ttgattttcc cttcttagaa 11690 agtcaatctt ctt agcttgg caattatttc cttttgtggt ttctgtctca gaatataaca 11700 ttcttgtctt ctt ccttggt ttttcattct tttaatcaaa agaaaaggaa tggtcttttt 11760 ctctttctat atattttgtt tctattttga ataatgttca ttttcttttg tcattattgt 11820 agtatgattg ttcttcgcct tctatttctc aagtgtttta gctactattt tgagttattc 11880 tctttgactg ttt atatcga agtttatgtt tctgtcgagg ttcataatct tgagattttg 11990 ttcggttgtt tgattttgtt ttttatcgtt tgtttttctt ttagtttata tagtgatgtt 12000 tttgccttcg gcatcgtctt ttggtgagat ttctctcctt tgcgtctctg atatccttat 12060 acatttttgg ttt gtttgtt ctgttgatct tcttatttca tcatatggtg gccaaatgtc 12120 attatcctct cca accaatt tttaatttac ttattatgta gcaattatgt gacttgtgaa 12180 tataattgga aaa aacagtg gttgaccatg gtgtgaaaac attgtcggca aacaaaaagg 12290 cagattttaa tta tttttgt gtataaaatt acaatgcaaa aggtaatcag atgcaaacga 12300 atttaaaaac caa cgtttaa agatttgatt atgtgtggag gaagtttcta gcaacaatta 12360 tgatttccag gcgcataatt atgataattg cacacttgtg catgggagtg ggaccttggc 12920 aaaacttagc acaattatga taattgcact tgtcaataca taggaattta aatatcatta 12480 gtaatgagag ttctactaag aaaaaaaagt aatcaaacct atactaaaac gagaataaaa 12590 tcaaaagaga ggt ccacgtt gacaaaaaaa atcggccaat aggagtagag cttcacgcca 12600 cgtcagatgt gtcatttaag tcgttgggct tcgaattcca caggcccgac atcgttcaaa 12660 ttcgagaagc ccgtgaagcc catttcacat ctaagctccc tttccccttc ctcttcgcgt 12720 cttgctcctt tcctattaat cgatgtgaaa cagagtgaaa agatctaaga aacgtttgat 12780 gtagccctgg aag gaggcaa aaatttcatg ctgatttttg ccgtgttcgt cttctcactg 12890 ttaactttcc agt aaatatt ctctattcaa tccttgcttc ttttgtttga caactacgct 12900 tccagagacc gta gacagga agaggaggag cctctgtctt cctcaatccg aactgcagtt 12960 ccccattcgt ttt ctccctt tcggattccc tcttcattgc ctcccgatct cataaccatc 13020 tttcctaaag ctcattcatt actgcatgaa tcaaaagcca agcaacagtt tcaacttccg 13080 gtgctctcga ttc ttccatt catcgcactt acatagacta aatgatccct gcaaccatgg 13140 caaataaaac gtc ctcatca accagaaagg caagacggcg tgcgttatta taaaacaatg 13200 ttggccctcg att tcggcta atttcatttc tgggaattac gtgagtatca gtcttagtgt 13260 ctcttttcct ttc agtgtat catatatttt atgaactaat aacaagaatc atttgcaggc 13320 ggagtaagac ata gattctg caatgctctc ctctctgcca gagaagaaat tgcacagatt 13380 gaagaagtta atg cagatgt gcagaaacaa catccttaag gtaatctaaa aagggaacat 13490 tcagtatatc tct cttagtt tcttcatcaa attgaacacg agacattgga ggattgtttg 13500 ttagcgtatg ttt t cagaga gctccaaatc ctccatctac gacccttatc agttacttga 13560 tcaaacttga gat cacaaat acacgcatca actttaccga caacgctttc aagttccaaa 13620 ggttagtcat caa caacata tccgtttgaa cgttactatt ttcttatttt aacacacggc 13680 tgctctgaaa gccatcccag atatatcggc gagaaaagaa aagaagtttg cagcaactgc 13790 ctctatgaaa act gatttag agaagaagaa aattgagcaa tgtaagctag aaaagtggag 13800 gtacttttct cag gattgta ttatttgaag cttggatttt gaaacggaga ttatgcttct 13860 tgacttttgc agg aatcaca tacgagcaag gaaatctttt ccacaagagc aggccgccag 13920 agaaaaagtt gct gatcgag ctatttattt tttaaattgc acaacctttt gttttttcaa 13980 atattttgat tacagtcttt tcattattta tgcttaactg cttgaggaac taagctgcca 14040 agcaaggtac aag gttattt gaatataaaa gtccaacagt gtaaggaagt tgaaagttgt 14100 ttcttttttg ttcttttgtg ctatctttaa atcgatgaca aaacaactga tttatcctgt 19160 ttactatagg ctggtgcatg tggaacggta caatagacta tggagaattc atgatagaag 14220 caatagtgca cata aacaga ttcacggagt tcaattgcta acacagacac aatgaaaaaa 19280 aaacgtacaa gtaagactcc tttcctttat tgtttttttt atcgtttatg agtcgcttcg 19340 ccagttttgc tct ataactt ttttttacat tcattcctct ttaatctgta gctttgttct 14400 aaacttctaa gtcgtggtct ctcttaacat cttgaactct taattttgtc ttgagtcaaa 14460 gagagagatt gat t gctccc atgtctcatc tgttgagaag aaaaactgtc atggctcccg 14520 agaaatcctc tcagccgccg gacatggaga caaagttgga tctagagcca gagagtcaaa 14580 ggtaggaggt tatcttgatc cagcaaaatt aatcaaaaag ttcgtggaac tttttttttt 14640 tattaaaaag atcgtggaac tttgcataca aactttgaaa gcaagatctc agtctcagcc 14700 agcacaacaa tgaagtagga attttaccac aaaaaaaaac aatgaagtag gaaaccagca 14760 ttcctcctgc gagctcccat cctccaaagg ctaatgacca aactgttgac tctggccaaa 14820 acaacaagtt ccc cgttata agcgaaaaac ttatcaacaa cgtcatcgat tacaggatgc 14880 ttttattgtg atttttattg ttttgtcctt tagtttaggg ttaaattatc tgctatgttt 14940 ctagaaacaa tattttaaat cccattctgg atatcgtttc ggcataagtt tatatcatgt 15000 tcattaagat tctt tgacgt caaagtttaa gcaaaaaaaa gattctttga cgtctgctac 15060 aaattgtata agct caatct actatgtata acacccatta tctggaatgt ggagatcttt 15120
26/58 agacttcctt tttgttgaca ttggagtata gcagatcata tatgtatctt tttaagggca 15180 ttcccattat gttgggatcg gaagccataa ctgtgttatg ttcactgaca ctaaaaaatg 15240 atactccctc tgtttcgaat tatttgtcgt tttagagtag aattttcgtt ttaaaataag 15300 tgtcgttttc ggttttcaat gcaaaattta ttgacaatat tctctgttct atttttctat 15360 tggttgatat atggttaggt gtattgaaaa tggtgttttt attttgaaaa tatgtaaaac 15420 taaatgtttt ctt aatctgt gtacataaac ctagaacgac aagtaatatg aaacgaaggg 15480 agtatactgt caccaatgcc gttcaaatgt caaaacaatc taattatgtt ttttttcttc 15540 tcattatcgg tttagttatt gtcatagatt tttaatctaa taactatata agtcctccat 15600 ttaaaaattt aacacattca ttaaatttta ggtcattaat tagtatagtc atttaatgat 15660 gcatattatc atacaaaatg ttttaatttt ggaaagtcaa aataaattat taaccaagca 15720 gaaaaaatag ttactaatac aagaaaagga aaatgatata ttattttaaa taaatattct 15780 cagaattttt ataaatttat tacatttctg ataatttcaa aattaaaaga aaaaattgtt 15840 aactaaataa gatccttttt gtttggaata atgctagcat aaaaagctta ttatctttac 15900 ctttgtatcg gtt acaatga gcattataac attgcttgga cgattcaact taatagcaaa 1596D
cgtgaaagga caaccgagat caatgatagt atcgagagac accggagact gcagattttt 1602D
tcaactaaaa aaacaataac aatcatggtc gggtggtaag gaggcggacc tgagatacta 16D80 acatgttcag gtt cgaccca tctgctacgg aaaattaagt tatagtaatt atcttagtca 16140 cctaacacgg atatatgccc atgttttagg atccatttga atatccgaag agatggtcta 16200 tccgttggat gca cctcctt ttggggatta gtctaggctt ctccatggat ctgggatatc 16260 cctaggttaa taaaaaaaaa acaatatgtt tttttggtaa aataataaca aacgatagtt 16320 gttgaagatt aagtctaaaa gcagaaacat cactacccca gtcttttagt ggctatcata 16380 ttagactgta aaa gacacaa atggatcttg atgtatatat atcaaatttt ggagctctca 16440 aatagtggat gcgctctgtt acttcttttc cgccattttc cgcttagaat tttgagctta 16500 tagaagatca tgt aatacta aaacatttcc tcaagagaat aagagtaaaa cttaaaaaaa 16560 aaaacagagc acc caacaaa acagaccaag tacaatggga tgagaaaaat ctgtgaacaa 16620 ttacaacact aacgacatta gtgatgtctc tgactacgat gattactcga acgctgagat 16680 cccaccgact att ccagaaa catcagtctg cgatactttg ctgcgaaact actctaaatg 16740 tccactaaac aca ttaggtt caaagaattg tgtttagaga acggcaatcc tgaggcgcac 1680D
tatattgttc aat acttcgt ccacaaagaa aaacagacag gcctctttca tctacgccaa 16860 tcagccacta gga acaatgg aaataatatg catctttacg ttttgttaat gcttgctgaa 16920 ggtcactatc aaa ccggtaa aaaatatttg gataaactcc aatggaaaaa gaaacgatca 16980 acctccgatc att gctgtga aagaatcaag aactcactaa gtgcaatacc tgttcctatg 17D40 gagcagcggt act atgtaaa tatggtcaac cttaagccac atacaaattg cgatcccaat 17100 aacatggcta aagtatgcaa gcaatgttac taattcaaaa tgcttaacca atttgtccac 17160 tttgctacta ata aagaatg tttattttaa aaaatttgta caatattggt taaccacaat 17220 gtattttcta aat tcgtccg tattaaaata aaaattaagt ttagtaggtt ctattgcata 17280 tttaatttta ata acttcaa aagaatgaag tagtgctctg atagaaatta aagtgacaac 17390 ttaaaattgt ata aaaataa aaccatcgag tccttaacaa ctatcaactc cttaacaact 17400 taaaattaaa ata acaagtt gtctaaaaaa aggaaaaaat aaaaattaaa ataacaatgc 17460 aactaagact aaa attgtga tgaatatata attagtataa aattagtata cgaactttga 17520 cagttcaatc aat atgtcaa gcacttcaaa aacaaataaa ttgttttcat tttacaaatt 17580 gttttacttc att ttatctt tataaaggaa aattttgtcc atttcacaaa ttttagctct 17640 attttaaaaa ttg ttttctt agataaactt atttacaaaa gaaaaaaaca taacaattta 17700 aaaaataaat ttc acacttc aaccacttcc tattcccttt actcatatcc catttaaaaa 17760 tgtattatgc ttc ggctgaa ataaatgcac cgactttatt ttcatctttt aaaaaaaaaa 17820 tctaatatat tct catcttt ttcataaatt taatctttcc cactgtgaaa actttcacat 17880 tgtacaatat caa cataaga aaactcattt aaacatacca aataaattct taatattaat 17940 aaaagattct aaatctaaaa aaaaatatct aaacctattt tccacgcgta acgcggacaa 18000 agactctagt ata catgaaa tacaaagtaa acaagactct aaacacacct ttatttattt 18060 tgttttaaat aaa tcctaag aaattaagct tccactagca gtattcaaca aagttaattg 1812D
acagaggttc gggctgcaag gcccaataag taacaaacat atgaagaggc cgaaaagagg 18180 tccaaataat ata agctaaa tccaaatcaa tactgtccag cgtgaagaca acgcctgaaa 18290 aaaagaggaa aat ctaaagg aagcgtataa agtgacgtga gaaatcacga aatcactacc 18300 tatatataaa ctgaaaccaa gagagagaga tccctcttct cctccttgtc tccacaaacc 18360 ctaaagcgct tta tagtttc agtttctctc agaatcggaa tcgtttgctt cagtaagttc 18420 ctcttccaat cccttacttg ttgatacctg tttattcgta attaggttat gatcttttga 18480 ttcggttaga tga tggatga ttctctcttc gtaattaggg ttcttatttt tttcaagatc 18540 cgtgttctgc aag ctataga tttatctgtt gacgtttgaa agtatcgatt aatgcaattt 18600 cgtctttgtt cgt aatcagt ttgaagatcg gaaaaaacaa gaatgaggat tggtgtttct 18660 gagccagagc aat gcggttg cgacacgtgt gtccagcatc gcactttatg cactcaagaa 18720 accgaaccta gcaaagaagt gactggctca tcggttcctg ttagttcaga accagttcaa 18780
cgtgaaagga caaccgagat caatgatagt atcgagagac accggagact gcagattttt 1602D
tcaactaaaa aaacaataac aatcatggtc gggtggtaag gaggcggacc tgagatacta 16D80 acatgttcag gtt cgaccca tctgctacgg aaaattaagt tatagtaatt atcttagtca 16140 cctaacacgg atatatgccc atgttttagg atccatttga atatccgaag agatggtcta 16200 tccgttggat gca cctcctt ttggggatta gtctaggctt ctccatggat ctgggatatc 16260 cctaggttaa taaaaaaaaa acaatatgtt tttttggtaa aataataaca aacgatagtt 16320 gttgaagatt aagtctaaaa gcagaaacat cactacccca gtcttttagt ggctatcata 16380 ttagactgta aaa gacacaa atggatcttg atgtatatat atcaaatttt ggagctctca 16440 aatagtggat gcgctctgtt acttcttttc cgccattttc cgcttagaat tttgagctta 16500 tagaagatca tgt aatacta aaacatttcc tcaagagaat aagagtaaaa cttaaaaaaa 16560 aaaacagagc acc caacaaa acagaccaag tacaatggga tgagaaaaat ctgtgaacaa 16620 ttacaacact aacgacatta gtgatgtctc tgactacgat gattactcga acgctgagat 16680 cccaccgact att ccagaaa catcagtctg cgatactttg ctgcgaaact actctaaatg 16740 tccactaaac aca ttaggtt caaagaattg tgtttagaga acggcaatcc tgaggcgcac 1680D
tatattgttc aat acttcgt ccacaaagaa aaacagacag gcctctttca tctacgccaa 16860 tcagccacta gga acaatgg aaataatatg catctttacg ttttgttaat gcttgctgaa 16920 ggtcactatc aaa ccggtaa aaaatatttg gataaactcc aatggaaaaa gaaacgatca 16980 acctccgatc att gctgtga aagaatcaag aactcactaa gtgcaatacc tgttcctatg 17D40 gagcagcggt act atgtaaa tatggtcaac cttaagccac atacaaattg cgatcccaat 17100 aacatggcta aagtatgcaa gcaatgttac taattcaaaa tgcttaacca atttgtccac 17160 tttgctacta ata aagaatg tttattttaa aaaatttgta caatattggt taaccacaat 17220 gtattttcta aat tcgtccg tattaaaata aaaattaagt ttagtaggtt ctattgcata 17280 tttaatttta ata acttcaa aagaatgaag tagtgctctg atagaaatta aagtgacaac 17390 ttaaaattgt ata aaaataa aaccatcgag tccttaacaa ctatcaactc cttaacaact 17400 taaaattaaa ata acaagtt gtctaaaaaa aggaaaaaat aaaaattaaa ataacaatgc 17460 aactaagact aaa attgtga tgaatatata attagtataa aattagtata cgaactttga 17520 cagttcaatc aat atgtcaa gcacttcaaa aacaaataaa ttgttttcat tttacaaatt 17580 gttttacttc att ttatctt tataaaggaa aattttgtcc atttcacaaa ttttagctct 17640 attttaaaaa ttg ttttctt agataaactt atttacaaaa gaaaaaaaca taacaattta 17700 aaaaataaat ttc acacttc aaccacttcc tattcccttt actcatatcc catttaaaaa 17760 tgtattatgc ttc ggctgaa ataaatgcac cgactttatt ttcatctttt aaaaaaaaaa 17820 tctaatatat tct catcttt ttcataaatt taatctttcc cactgtgaaa actttcacat 17880 tgtacaatat caa cataaga aaactcattt aaacatacca aataaattct taatattaat 17940 aaaagattct aaatctaaaa aaaaatatct aaacctattt tccacgcgta acgcggacaa 18000 agactctagt ata catgaaa tacaaagtaa acaagactct aaacacacct ttatttattt 18060 tgttttaaat aaa tcctaag aaattaagct tccactagca gtattcaaca aagttaattg 1812D
acagaggttc gggctgcaag gcccaataag taacaaacat atgaagaggc cgaaaagagg 18180 tccaaataat ata agctaaa tccaaatcaa tactgtccag cgtgaagaca acgcctgaaa 18290 aaaagaggaa aat ctaaagg aagcgtataa agtgacgtga gaaatcacga aatcactacc 18300 tatatataaa ctgaaaccaa gagagagaga tccctcttct cctccttgtc tccacaaacc 18360 ctaaagcgct tta tagtttc agtttctctc agaatcggaa tcgtttgctt cagtaagttc 18420 ctcttccaat cccttacttg ttgatacctg tttattcgta attaggttat gatcttttga 18480 ttcggttaga tga tggatga ttctctcttc gtaattaggg ttcttatttt tttcaagatc 18540 cgtgttctgc aag ctataga tttatctgtt gacgtttgaa agtatcgatt aatgcaattt 18600 cgtctttgtt cgt aatcagt ttgaagatcg gaaaaaacaa gaatgaggat tggtgtttct 18660 gagccagagc aat gcggttg cgacacgtgt gtccagcatc gcactttatg cactcaagaa 18720 accgaaccta gcaaagaagt gactggctca tcggttcctg ttagttcaga accagttcaa 18780
27/58 cgtctcggtt ccacctcaga tcagtgttcc ggaacacata cgactccact cgctcctcct 18840 gaaccagcag cgcag tctgt tgatgcatcc tccacatcat cctccatatt cagttctgtt 18900 agttcccaac cagcg cgagc tctttgtccc accggttcac tgccagttcc tttatttggt 18960 tgttcatggc cacgt ccttg tagctgtact ggttgttcac tgctaggtcc ttctattcgt 19020 cgttcatctc ccttctttac tgcttcttcc ggatcatcaa tctcctcgtc aaggcaagcc 19080 aacgttacaa acagt ttcgg ttccgctgca tccgaaccat ctgtatctgg gccaatgaaa 19190 gctcctattt ttact tctgg ctcttcaacc gcttccacat cctcaactct accttcatta 19200 gttactccct cggacattac aagaggatca gtgcaagcgc ctgtccaagc taacacttcc 19260 aagactgctt ctgat tttca tccacctaac gttgccaaca ctggagtttg cgctgcttea 19320 aggactagca cgaacaatcc atttccagga tttagtgttg attacttgcc cagatgtccc 19380 tctaaccttt ctcga ccaaa cgcaccaact actacaccag ttcctggccc tagttcagtt 19490 ttggctggtg gtgaa actga acaaggtagt aggtatcctc gttatgcgcc tacaccagat 19500 gttgacggca agcagattat ttccatatct gcttccaact cacatggaca taaaagtcat 19560 gaagagttga ggtgggaaga ttacaaaaat ggagacaaag gtaaactaac tcacttactc 19620 aaatctttaa atacataacg tattatagca ttttatcttt tagatctctc tgtaattgac 19680 taatctcatg ttgca ggtgg ggttgggagg tttcatccgg ctcacaaacc tcgtaaagaa 19740 tcgaggtggg ataaa gaaaa aaatggagac aaaggtaact taactaactc actactcaga 19800 tgtttaatag cattt tctgt tttagatctc tctctctaat tgactactct catgttgcag 19860 ctggggttgg gtcgt ttcct cctcctgatc atacaccgtc ggtgtttact cctccaagca 19920 tacctgatcg tcctc ggatg agaactattg atctaacgaa ccgagacacg agtggttttc 19980 ctattggcta caaca ccccc gctgctttcc agagccccca tgaacccgtt ggtgtttctt 20040 ccccagcatc aggat gcaca gcgtgtggag ccgcgagtag ctcctctcct tcgagtcact 20100 tgggcttgaa capta ccaca aatcctccat catctgcgac atctcttccc gggctgttct 20160 tttccaccta tggtt ctttt cctttgctgt ttgcaacacc aaatcttgca gcttatggta 20220 caactccagc agtcc aagcc tatcctatga tgtttggaat accaaatctt gctgctcaag 20280 gtacagcaac tccat cagtt caagcgtatc ctatgatatt tggaatacca aatcttgctg 20390 ctcaaggtac aacag caact ccagcttttc aagcgtatcc tatgatattt ggaataccaa 20400 atgttgctgc tcaag gtaca acaacaacaa ctccagcggc tcaagcgtat cctatgatgt 20960 ttggaatacc aaatcttgct gctcaaggta caacaactcc agcggctcag ccctatccta 20520 cgatgtttgg aacac caagt cttgctgctc aaggtacaac aacagctcca gcagttcagc 20580 cctatcctac gatgt atggt acaccaaatt ttgtagctca aggtatgact ccagcagctc 20690 aggcctatcc cgtta atggt tcaagtcttc tcccatttgc cgccatgagt ctgcagtaat 20700 cgtgcctcgc tctgc atcaa agttgtgtct tcttttatct tgtagttcta aggtctttgt 20760 tttgcttaag agtca taaat caagtctcgt ccaactttat gaattttttt ttctaagtaa 20820 agattcagct aatca tggat gtaaacaagt ctcttaaaac atcattattt tgcttttatc 20880 aataaaagct ccttt ccttc tactgtaatt tttctctcct ctgttctaat aaacaaaaaa 20940 caacaaaaag aatca tgttc tttgttatct ctcactaagc catgcctcaa catgaacaca 21000 tgttgcaaag gcata ctgag aaactttaca aaaacaaact gcaaaactct attctctgat 21060 ctatcccaac cgcac aatca acacaatatc cgagaaaaat aaaatttcat gaacatatgt '21120 tcttgtcaac gcaag ctact gtccaagtaa cacttccaca tcctttagct tcggtggttg 21180 tagggcattt gttgc aagga ttttggaact gaacaaggta gtatatgtcc tcgttatgca 21290 gctacactgg aagga cgtaa cacatgtaac tgcttccaac tctcatggac ataaaagtta 21300 aggagagtat gaagta gaaa gattacataa aagggaaaca aaggtagctg actataacta 21360 aagatttaac aacttaaaag aaaagaactc ttttccttct actatatgtt ctcttatgtc 21420 ctatgatttt gtgaaa caac aaagaacaca caaaaatgtg tggcatgaat cattgctaca 21480 ctctccattc ccaatcctct gtttttgtgt tttcagacat ccaagttaca aatgcgttaa 21540 aattatgatt ttctcttcaa gtgaaatcat ctgatgattt catattttac atattccttc 21600 tcatgtgggg tttatagagg gatattttat gctgaatctc cccctctctt tagtgctaat 21660 tgttgaatca ttagaaaact gcaactcaca gatacggagt aatgtccaaa acaaacatag 21720 atgctgcatt aacatt acaa atattaagtt cgtctacttc atttgataca cggttaatca 21780 ttttaatatc taaagataat acttcaaaca cggcgatttt atttactacc caataaaaat 21840 gttagcggag ttaatgttca ccacaaataa aaatttatta tcaatcctat acgataacta 21900 tttgtttatc tcctct ttct caagcatata tatactttta tatgcacatt tacagtatac 21960 attatttaaa attaaa acaa gaggtaaact acaaaccgaa cttatgtcca acatgaaaag 22020 ttttttcaac ttccat gaat caatcgcatc acacttagat actgtagcat tgacaccggt 22080 agcaaataca tcacat atca catgcatttc aaattataga acaaacatat aaaaaagtta 22140 gattgtggat aaacaa tccg ctcgtagggc agctttgatt ttagagagat ttcctagtgc 22200 tattcttaca gcttgc cata ctaattaatg ttcccctttg ctactgatag tatatagtag 22260 tatactaaat ttctaa gaag gttaaacttt cattattatt caggaggttc agcccgtaag 22320 gcccataact aagaaa caca tagagagccc aagtccacta gacacttaat ttagctattt 22380 caaatcaatt taaaaa gaag attataagaa acgtccggcg tgaaatcaac gcctgaaaga 22440
28/58 aagaaagaaa a gaaaaaaaa atctggaaga agcgtacaag cgacgtgggg aaatcacgaa 22500 atcattacct a tataaactg aaaaagcaga gagatcccct cttcatctca tccctctacc 22560 gagtctctct a caaacccta aagctcgatt tcaagtttct cagactccga atcgttacca 22620 aagtaagtgc c ctttctatc tctcatctct tcctttaata ctttgcagaa tttgatttct 22680 tttccgccaa a agttctgat ctttgttgaa tactggttag ccctttattc gtaattaaag 22740 ttctgatctt t gatttgggt ttagatgatg atattacctc ttcgtaatta gggttctgag 22800 tttttgtttt tttttttgtt tttgataata tctgcgttgc ctctgttgca agtaattagg 22860 gttctgagtt t ttcttttta ataagctatc gattatctgt tgatcgattt taatataaat 22920 ttcgtctttg t ttggtatta gtttgaagat cgagaaacaa gaatgaggat tgatgtttct 22980 gagccagagc t atgcggttg cgacacttgt gtccagcatc ggactttcat tactcaagaa 23040 accgagccga g caaagaagt gattggctca tcggttcctg ttagttccga accagttcaa 23100 cctcttggtt c cacctcaga tgagagttca ggaacagaga cgactccact cgctcctcct 23160 ccagtcacca c accggttaa taatcctgaa ccagcagcgc agtctgttgg ctcaaccatc 23220 ccacctgctg t tacaccagt tagttccgaa caaccagcac aagctcttgg ttccacctcg 23280 gatcaaagtt c cggtacaga gaccactcca ctcgctcctc ctatcaccac gtcggttaag 23390 tctgttgact c gaccatctt cttcaagttc ccaccggtac aagcacaagc tcttgcccct 23400 actgcttccg gttcaacgca agcccctgct tttggttttg gtgcattcgc tgctcgcgta 23460 ccatctgcca c ctccggttg ttcagcattt agtttcgccc ctcctgttac atcggcacca 23520 gtgcaagctc t aggcacaac cactactact actactacta catccgcggc cgctcctgca 23580 tctccatttc a cagttcctc accaaccaca ttccaattcc ctcctgcttt tacatccctt 23640 gctgcttcta cttttccttc tgttgcatca tcaacttcat ctccacttga tgctcctccc 23700 tcaccattta gatggggatc actgcaagct aacacttccc caccctttag cttcttgcca 23760 gcgcaaggtt ct gacaagac tggttctgct tttactccac cgtttggcta ccctggtggt 23820 tttgccagac ct gatgttgg tgtctctcat ccagggtttg gtccctctaa ccattttgga 23880 ccaaacgcac ca actactac acctgttcct gttcgcagtc catttttggc tggtggtgga 23940 actgaacaag gtagtaggta tcctcgttat tcacctacac cagatgttga cggcaggctg 24000 ataatgtcca ta tctgcttc caactcacat ggacataaaa gtcatgaaga attgaggtgg 24060 gaagattaca aa aatggaga caaaggtaaa ctactcactt actcaaatct ttagtacata 24120 atgtatagct ttttatgttt tagatctctc tgtaattaac taatttcatg ttgcaggtgg 24180 gtttgggtgg tt tcctcctg ttcatacatc tcccttttcc tcaccaacgg tatcaccgtc 29290 gctatttgct cctccaagca tacctaatcg tcctcagatg agaactattg atctaacgaa 24300 ccgagacatg tgtggttttc ctattggcta caacacccce gctgctttcc agagaccccc 24360 tgaacccgct ggtgtttctt ccccagcatc tggatgcaca gcgtgtggag ccaegagtag 29420 gtcctctcct tctagtcact tgggcttgaa caataccaca aatcctccat cagctgcgac 24480 atctcttccc gg gatgttct tttctaccta tggttcttgt cctttgctgt ttggctcacc 29540 aaatcttgca acttatggta caacagcaat tccagcagtc caagcctatg ctattatgtt 24600 tggggctcca aattttactt ctcaaggtac aacggcaact ccagcttttc aagcctttcc 24660 tattatgttt gg gactccaa atcttgctgc tcaaggtact acaagagctc cagctgttca 24720 agcctatcct ac gatgtttg gcacgccaaa tattggagtt caaggttcaa ctccagcagc 24780 tcaaacctat cctttgatgt ttggcacccc aaatcttgct gctcaaggta caacaaatat 29840 tggagctcga ggtacaactc cagcagctca agcctatccg ttgatgtttg gcaccccaaa 24900 tcttgctgct ca aggtacaa caactccagc agttcagtcc tatcctacga tgtttggaac 24960 accaaatcta gctggtcaaa gtacaacaac aactcgagca ggtcagccat atcctacgac 25020 gtttgctgtt cctcaagctg cgacagctcc agcagttcag ccgtatgcta tgatgtttgg 25080 tacaccaagt ct cggagctc aagatatcac tccaggaggt caagcctatc ccgctcatgg 25140 tttaactctc cc attcgccg ccatgagtct gcagtaattg ctcctcgctc tgcatcaaac 25200 tcgtgtcttt ta tcttgtag ttctaaggtc tttgtttttt ccttaaagag tcataaacca 25260 agcgtcgtcc aa ctttgtga ttttcagcta tccatggatg taaacaagtc tcgtgtcttt 25320 tatcttttag tt ctaatatc tatcttttta aaacacaaac attatgttgg acctaacatt 25380 tattttgtaa gt ttttaaat taaatacaca tttatacttt atacttaaac atatattaag 25940 ttactaatat tt ctttcttt atactactat ccatgtttcc aaacaatata tttatttctt 25500 tatactacta tcaatgtttc caaacaatat atttttatac tactatcaat gtttccaaat 25560 aatacaataa tt aatcttag ttattttata tctatcattt tctctttaaa attttgtaaa 25620 aacgtcataa tt tcataaat tacaaaatag tgaactttaa aatttcgatt ataaaattac 25680 aaattatgaa ac tattacaa tttaaatcca attagattac atatcggtca tccatcagtt 25740 caatcggtta gt ctcgggtt ttagtgattt tttaatatga atattttaaa aacataaatt 25800 gaattgtcag at ctccggat taaccggtat aatcacaatc gggttgaatt taaaaatact 25860 gatttaaatg ca aaaatatt ttaaatacac actctttaaa aataaccaaa atatttgtta 25920 aattattagt ga aatttttc atcgtaaaat ataccgcgct tcaaaagcgc gggtcaaaat 25980 ctagtttctc gt taaactcg ctgctcaaaa taaattttca tgaacctatt ttcttgtcaa 26040 cgcaagcaac tgtccaagct atttttatat tacatgttct ttctctgggt tgttacaaca 26100
29/58 ctatcatttt gatatt c ttt ttgaatgaat agaaaaacca aaggtgggaa gtttacaact 26160 ttgtcaactc tataat t gtg ttattaagga ttccattccg ctaacaattt tagtttgcat 26220 aatagttttt tctctg a act ggtacaacac cagtaaacaa atgattgtct tctaaatcgc 26280 aggactaagt ctctgtt ctc ctacattgac tctaattaaa caaatgtgtc aacttgatga 26390 tttttacttg gtaaag a cat ctaccaatca ttgatgaaaa caataaca~t tcatgcacat 26400 tattcctctg aattag t aca acatctttct ttagtaattc ttttgaataa tattcaacaa 26460 gaagaaaact cctttt cttt ctactataaa gtctctatca ttctctcatg cagaacgcac 26520 acacaaaata aaatgg caag aatcataact acactctcta cacctctgtt tttcttcttc 26580 ctcttctccc tgctct ctca ccaaaccatt tctcaacccg aacacttgac tactttctgc 26640 aacccttccg acaact t cac acaaaccagt tcatacgaag caaaccgaga ccttctactc 26700 tcctctctcc gcgtca gttc ctccctegga acctattcaa acgccacagt cggtcgtagt 26760 cccaacacag tccacg g cat gttcctctgc agaggagaca ccaccgcagc gtcttgctca 26820 gactgcgtcc agaccg c tac aatcgagatc gctacaaact gtactcttaa caaagaagcg 26880 gtcatatact acgaag a gtg catggttcgg tactctaatg tttccttctt ctctgttctt 26990 gaggtcagac cgagca t cgt cctttactct cttcgctctg ctccaaactc gaatacgctc 27000 aatgaaacgt tagctg ataa attcaaccaa ctgattctca acgtgtcttc gtcctctttg 27060 gttccgtatt ttctgg a aga tcaagaactt gtgactcaag cagagggttc ttataagttt 27120 gagtcaatgg ttcagt gtag tcctggtctt gaccggttca actgtaccgt ttgtctcaga 27180 tttgcgctct taagag t ttc aacttgttgc ggttcaccaa gttctgctct gatctttact 27240 cctaaatgtc ttttga g gta tcaaacctct gttttgtcgt cgccgccacc gttgcctcca 27300 tcctctccac ctcctc t atc gttgccgccg cctccaccgt caccggctct atttttaccg 27360 cctcctggtt tatcgc a acc gccaccaccg ccgctggttt tcacgcggcc acagagcagc 27420 gggtcgtttt ctaacg t tat taaaggtgat catatttttg tatgtatttt tgtttagttt 27480 tgatcatatg actttct ttt tcaaaaaatt tgatcatatg agtatctttt tgatataatg 27590 tttatgtatc caacta caaa tattattgac agggttggct ctaattttat tccatttttt 27600 ttgtggcagg aaacca a ata tttgggagaa ttgctatgac gatggcagtt ttggtgtttg 27660 cacttgtgaa tttgtg a aca catttgatga ttttggattg aaataatttg caattccttt 27720 tatgtttgtc atgtgt t gtt gttgtcttct taagatcaaa agccacaaag tatgtgaata 27780 ttgaaaatca tgtttctttt ttgaacattt aaccatgttg attttgaaca tctaatcatt 27890 ttgatgtttg tttgca t ttg atcaacaaaa gaagaagagt tggaggctga tatatcaaat 27900 tataattaat ttctgt ttta catactcttt tgctatatca atacttttaa ttttccagca 27960 tgaccaattg ataact g ttt agtccattta tttataatca tgttttccta ataattaact 28020 gccaatattt aacata t aga tatctgcaaa gacatattag attataactg ctactacacc 28080 actacacatt ttaaga t tat cacgaaaaca acttctgttt ttgaatgttt aaaaaaatca 28140 aacacacgca caaata t att aatatgctat acaaattctt atataaaatt atggttttat 28200 ggtatgtgtt atacttt agc ataactgtat gtatataaat atatatgtat attatttata 28260 gtttgtattg caatat t ttt aataaactaa acaattatta tatttaaaat ttaaaataaa 28320 tcttcaattt gtattca taa atttatgatt agaaagttaa taataaaata gtaataatta 28380 atttcagaca tattta c aga aagtttaaaa aaatcaaaca cacgcagaaa tatattaata 28490 tgctatacaa attctt a tat aaaattatgg ttttatggta tgtgttatac tttagcataa 28500 ctgtatgtat ataaat a tat atgtatatta tttatagttt gtattgcaat atttttaata 28560 aactaaacaa ttattat att taaaatttaa aataaatctt caatttgtat tcataaattt 28620 atgattagaa agttaat aat aaaatagtaa taattaattt cagacatatt tacagaaaaa 28680 atacaaaaca acactat ata tgcgcttcaa gtacagatca agatttaata taggtctaac 28740 attttaccgg acccgaa aaa ccaaactaga acggatctga aaatacaggt tcagattcga 28800 gtttatgcta aaatatt tat tggatttttt ttatggagat ccacaagtct cggtttggat 28860 ctacgtccta caagaga ccc aatcaggtat tcgaaatact caaaaattat tatatattag 28920 gtaaatttgg atgatt g tgt gtattttaga tatttcagat atttttttaa atttcggatt 28980 caggttttta ggtataa ttt caggtttcgg gtaaatttta gatttccaaa aaatataatt 29040 tgggtgttcg ggtaaaa ttt gagatacctt tcgagttttc ggatctgatt ttgtgtaagt 29100 ttcgatatat tttctcc atg tatttttagg atttgcaggt actttttgag ttttcaaatt 29160 cagtttggat atgtcag gtt tttttcgggt cctatatacc caaatcaacc cgaatccgaa 29220 ataaaactga aattat g aat gttttacgta tattagaatt atatacttga accgacaaga 29280 gttcgacaag ctcctgg ccg agcagaccta aaaaactata gatatctata tggatctaga 29340 tcttcaggaa ccgaaa g atg cggacccaat aagacttgat ccgaggaccg gatgcctagg 29900 cctaatctga atagat a aat atgattacaa aaaatagatt tatagttata aagaaacgag 29460 tatatgccgg ccaactt taa attactatta tttctacagt aaatcaaata ggttttgatt 29520 aagatttata cacatat atg actacaacaa aatatgatta agaaaaaaac acaagtatta 29580 caattaaata tctagaa aaa gttaaacaaa aaatatacat gtctttttga aagggcgggt 29640 cagaatctag attctga aaa cccgaatgtt ctcaaatatt taaaaaaata gtttcattta 29700 aaataaaaaa tcatata aac tttttaaaat acataaaaac agattttatc aatacataac 29760
30/58 gggtctatga caaaaaaaac agtttaaaaa tattaaactt tttctttaaa ttaaaatact 29820 aaaaataaaa tract gtgaa ataattcaca agtttaacag caggttaata aacaaaaatc 29880 ataaaatacg aatcagaatt atttggagtc ttcaaaattt ttgtcatatt taaaataaca 29940 aaaattattc atacaataat tttagataaa tttcataaaa ttcttaacaa aatataattt 30000 atcaagtata aaaat attca tgacataaaa ttaatatttt caacaaaaat atacctgcag 30060 aatctagtgt actaattaaa tctgcataat tacccttagt gtctattttt ttaaaagaaa 30120 tcagcatgca acaaaaattc gttggtagat ggactgattc gcaacgaata catcacaaaa 30180 tcttagtttg cagtt ttacg ctaagcaatt atcaaactaa aacatctaat ctagtggtct 30240 catgcataaa tgcatactgt taaatattga atgacggttt accaaataaa aagttatgcg 30300 gtcgtcgata tcata ctgat atttcaagtt aagataactg ttttttttaa agcacacttg 30360 tttttagggt ttatcaactt atcattctgt aagcgcaata tgtacatata ttagcatact 30420 cggtcaatgt tatat gtttt cattgttaaa tgcagtcttc tccttccttc gtttgggcat 30980 agtatttaac ttttattagt attatagttt atcctagtga acccaattaa agtaagtttg 30540 atagatgtca acccttttaa gttgcttaaa ctaatcaaca cttgaaagtt cgtcacgaaa 30600 taatccaata cctat ctttt gagtgttgca gccatgctag tttggctcag atcatcttgt 30660 catgtataat ctccgctttg caaccgagtc tgggcgttat aaatggttag tagacaaatt 30720 cttttatgca atgca atata tatatgcgga tactgatata ttgactctgc actggctcta 3D780 aattttaggt tacat acctt atccggaatc atttgatata caacttatcg ctttgtacta 3089D
ccattttgga ttttgtgact ggctgacccg tttctgttag tcttgcctca ccctgtatgt 30900 gagatgtgga ataagcaact tattaaaccc aaacactaat attttggctt attttatatt 30960 gcaggaatcg aaatatattg gagaattttc attacagcca tggcaacttg ggtgttggca 31020 cttgtgggtc tatga tataa agttttattt atatttgtat tccacaattg tatgtgccgc 31080 tattttcttg tatagttaat aagaagcaac atacttgttt tctaagttat ctcaaaaaag 31140 tttgacgttc gatat gttta ctaaataaaa tcctaatgca tcaccatata ccttctttac 31200 tgtaagaatg aatcgtccaa aaacaactct gtgtttcaga caacaaatgt gtcaacttca 31260 tgtttttatt agctt catat ggtttaaaat aatagccagc cggaaggctg cttaacggaa 31320 ccaaaagcta ttatgacaga aaaaaacagg tgaaagagga gttaacatct tgcacaagtg 31380 attaacgaag tctta tttgc ttgagagatc aaggattgaa accttgattt tgcaaattta 31940 ttgctcttca atata acatc aaaataacag aaaatcttgc cattactatg ttttcaaagg 31500 cttacataca aaaga gaaaa aaaaagctta tcaaatgaga aacgttaagg aatatggcac 31560 agattaaacg ttccc cttag tgtgagctca atctatttgc gtacgtggca agtatttcaa 31620 ggaacactgt ttttg gttat ggcttttcaa aacaattgtt gcttaggtct agggcttacc 31680 attgccaatt ttatg tggaa atgctgaaga taaaaccaaa gcgtaaattg gcgtaaccac 31790 ttcttttact gctgt atctg cctgctacaa tgaatgtttg atgttcatag aaaattaagg 31800 gaaacagagg aggga cgctc taaaaagttc ctactaaatt aacatgtaat ccaaccttca 31860 aaacacactt gtctt tattc tttacattgt taaagcaatc aatacatttt cgtttaattc 31920 tccttggaaa tggtt ggctt ctccatgaac ttggagacaa ccataccaat agcaaagacg 3198D
agaggccaca ctgat acttt gacaggaccg tctcgtcccc tgtcagtaaa gctacaattg 32040 atcgtggaca ctatt aactg accaacaccg cagaaaaaca agatagcatc cgtggaactt 32100 ccaaagattc tgttgtagcc acgtggtgat ggatagtaga accaaggaaa aggcaacttg 32160 caacggaaac gagct ttatg ggctcgggtt ttgtaagaga agtcaaggat agataggata 32220 agagaaagag ttgac atgac taacgagatc aattgaagga agacagacaa acaaacaagt 32280 ttaggaggtg ttccc cggct atgatgccca cataggttaa agcttgtctc catctttgct 32340 accacgacat gtttc cttga aagctttccc gaaatctcca gtctgtttcc taacatcgga 32900 tggatctact ccgta gaaaa ctgtcgtcac gatttgttcc ttgcacttca aaatctccag 32960 caggtttttc aaaca ccagc tggaagaagc ataattcttg gaaagcacca cgatcgatat 32520 cactgatccc ctaat agctt ggcctctctc agtcccttga tcatcgaaca ttaaaatccc 32580 cttgctgttt aactgt ctcc gcaaatgact gataaaagtc ttagggacgt cgggtccgta 32640 gaaactcgca aagagttggt agctccaagt gcgagtccta aaagaagaag aagaagaagc 32700 catgggataa agtat tagct agggagagag ggttacaaga tcagatatac ccaaaaaaaa 32760 agtctgggga taagc catat atgatccaga aagcgccagt gttcactgtt taataaaaga 32820 ccgaacaagg gttttttggc attttcagta gccaacaaac ttctttgctc tttctcaaaa 32880 gtgtacaaga cttcct tgca cttcaagtct ctccaacagc tctatataag ctccatatcc 32940 atgaagcatt gttctttgag agcacaaacg atcaaatatc ttcgactagt ttttaggagc 33000 agagaagagc gggcat cttc gctttagttc cataatagaa acatcaaaat cttatagaaa 33060 acctcaaaag cttacgtgga cggcattaag ttaacacttg gtatttttag ttaattaggt 33120 tttacataga agaagaacag acatcgtatg ctttttagtt acacaattag ctactaaaca 33180 ccaacagctc agatt cattc tcaaatcttc ctcccccccc cccgtcctga tgaaccttga 33240 gtgagtcttc accgccttct gttgagtggt ttcattgaag ttgaagtgct aatcgtcggt 33300 cttttagcac ctgagg ccaa tcaacaaaag gttagatgac tcacgcagca agattgacac 33360 taaagaccat ataatgagat ttccattgtg atgcaaacta aagaagacat ccatatgcat 33420
ccattttgga ttttgtgact ggctgacccg tttctgttag tcttgcctca ccctgtatgt 30900 gagatgtgga ataagcaact tattaaaccc aaacactaat attttggctt attttatatt 30960 gcaggaatcg aaatatattg gagaattttc attacagcca tggcaacttg ggtgttggca 31020 cttgtgggtc tatga tataa agttttattt atatttgtat tccacaattg tatgtgccgc 31080 tattttcttg tatagttaat aagaagcaac atacttgttt tctaagttat ctcaaaaaag 31140 tttgacgttc gatat gttta ctaaataaaa tcctaatgca tcaccatata ccttctttac 31200 tgtaagaatg aatcgtccaa aaacaactct gtgtttcaga caacaaatgt gtcaacttca 31260 tgtttttatt agctt catat ggtttaaaat aatagccagc cggaaggctg cttaacggaa 31320 ccaaaagcta ttatgacaga aaaaaacagg tgaaagagga gttaacatct tgcacaagtg 31380 attaacgaag tctta tttgc ttgagagatc aaggattgaa accttgattt tgcaaattta 31940 ttgctcttca atata acatc aaaataacag aaaatcttgc cattactatg ttttcaaagg 31500 cttacataca aaaga gaaaa aaaaagctta tcaaatgaga aacgttaagg aatatggcac 31560 agattaaacg ttccc cttag tgtgagctca atctatttgc gtacgtggca agtatttcaa 31620 ggaacactgt ttttg gttat ggcttttcaa aacaattgtt gcttaggtct agggcttacc 31680 attgccaatt ttatg tggaa atgctgaaga taaaaccaaa gcgtaaattg gcgtaaccac 31790 ttcttttact gctgt atctg cctgctacaa tgaatgtttg atgttcatag aaaattaagg 31800 gaaacagagg aggga cgctc taaaaagttc ctactaaatt aacatgtaat ccaaccttca 31860 aaacacactt gtctt tattc tttacattgt taaagcaatc aatacatttt cgtttaattc 31920 tccttggaaa tggtt ggctt ctccatgaac ttggagacaa ccataccaat agcaaagacg 3198D
agaggccaca ctgat acttt gacaggaccg tctcgtcccc tgtcagtaaa gctacaattg 32040 atcgtggaca ctatt aactg accaacaccg cagaaaaaca agatagcatc cgtggaactt 32100 ccaaagattc tgttgtagcc acgtggtgat ggatagtaga accaaggaaa aggcaacttg 32160 caacggaaac gagct ttatg ggctcgggtt ttgtaagaga agtcaaggat agataggata 32220 agagaaagag ttgac atgac taacgagatc aattgaagga agacagacaa acaaacaagt 32280 ttaggaggtg ttccc cggct atgatgccca cataggttaa agcttgtctc catctttgct 32340 accacgacat gtttc cttga aagctttccc gaaatctcca gtctgtttcc taacatcgga 32900 tggatctact ccgta gaaaa ctgtcgtcac gatttgttcc ttgcacttca aaatctccag 32960 caggtttttc aaaca ccagc tggaagaagc ataattcttg gaaagcacca cgatcgatat 32520 cactgatccc ctaat agctt ggcctctctc agtcccttga tcatcgaaca ttaaaatccc 32580 cttgctgttt aactgt ctcc gcaaatgact gataaaagtc ttagggacgt cgggtccgta 32640 gaaactcgca aagagttggt agctccaagt gcgagtccta aaagaagaag aagaagaagc 32700 catgggataa agtat tagct agggagagag ggttacaaga tcagatatac ccaaaaaaaa 32760 agtctgggga taagc catat atgatccaga aagcgccagt gttcactgtt taataaaaga 32820 ccgaacaagg gttttttggc attttcagta gccaacaaac ttctttgctc tttctcaaaa 32880 gtgtacaaga cttcct tgca cttcaagtct ctccaacagc tctatataag ctccatatcc 32940 atgaagcatt gttctttgag agcacaaacg atcaaatatc ttcgactagt ttttaggagc 33000 agagaagagc gggcat cttc gctttagttc cataatagaa acatcaaaat cttatagaaa 33060 acctcaaaag cttacgtgga cggcattaag ttaacacttg gtatttttag ttaattaggt 33120 tttacataga agaagaacag acatcgtatg ctttttagtt acacaattag ctactaaaca 33180 ccaacagctc agatt cattc tcaaatcttc ctcccccccc cccgtcctga tgaaccttga 33240 gtgagtcttc accgccttct gttgagtggt ttcattgaag ttgaagtgct aatcgtcggt 33300 cttttagcac ctgagg ccaa tcaacaaaag gttagatgac tcacgcagca agattgacac 33360 taaagaccat ataatgagat ttccattgtg atgcaaacta aagaagacat ccatatgcat 33420
31/58 agtttacaca aaaga tcata gaatgtaact atgcataacg atttggtttt taggatacaa 33480 gttactatgc aaaaa agagc ttatgttact tgttaaggtc ttcgaggagg agctagtggc 33540 aattgacaga cgagaaggtc tggtggtttg gcctggtggt ttcaagatct gcttcggaat 33600 cttcgatgga atactagttc tgcttttaaa aataccaaaa caaaacaaac ataagaatct 33660 aaaaaaatat gtattcatat tgttctgtta aagtgtgcta gtagagggta cttacttgtc 33720 tttgggcacg gttttcacca tctttgctga tttctcgagc ttctcaggga ccaagtgtgg 33780 ttcaggttct tccgttattt caagaggctt cacggtttca gggaaaagag tcaactcgac 33890 tgcactgcat atggagccat cagtttctgt tcccatcgaa agacagctat cagagatatc 33900 actcaatctg tcctcagaat ctgcatcccc aaggccaatg agttcaatgt catcttcaat 33960 gtcaatttct tttgacccac cggcaaactt agatagctgg tgaagatcct ttcgatgttt 34020 aagttcgtcc gatgaacgcg cgtgaaccgg aatcagaatg cttgctactg tattctgagc 34080 agttgtcaaa atctgaggct gctctcccaa aagaaccagg tgcctttcct cgtcgagcat 39140 ttggtgaagg tcctatagag tgtcttctag gtgatgaagg ccccaacaat cttagattgc 34200 ttaaaccacg tttcg geacg gttgtactgt tacttttttg cttctgaaca ttttgaagct 39260 cttcatcttt cttgg caata acatccttca agcttgatac ctgttacatc aaatggtatc 34320 aagataagta taactttgtt ctctatttac ttccaatggg caagattaaa ttttgagaga 34380 gatagaaaga aaataagcac ctgttccatg aggtgtctaa catctcgtcc ctctttatta 39490 cttttagctg cacctaattc cacaccagaa actctttcag cgaacttcag agtgctaacc 34500 gtctcagcat aagaatctcc atcaggattg acttgaacaa acataagagt cttagcctgt 34560 cctcctacaa gacaaaacaa aaaagtcaag acaaagggtt aaggaaccat caacataaag 34620 ccaacgggta tatcat gcaa tacgtgtagc ccaaatctta aaactttttc ttcaaagagg 39680 gttaagaaag tacccaaaga actttgaagg acttgcgtca atttgctgtt tctatacggc 34790 acatgggggt tcttat gcgc tagagcaaat atgacatctc caagggctga cagtgattta 39800 tttatatgct gagcct cctt gagcctctct ccagttacct ccgagcgatc gaccctctca 34860 cttccagcaa gatcgaccaa gtgcaaacta ccacgcaaaa cagaatcggt ttccacgtcg 34920 acaccacgta catgaacaga aagaacgctg tatacaatag gcaacaatgt catttctata 39980 atcctgagga agcgaggctt agataatgtc agaagataaa aaaatttaca aaccagtgtg 35040 atctactact cctttcattg agagctgtgg,caccaacggt tctgttcatg agcccaatat 35100 tcatcagctc aagcacatct tcagttgatc tcacagaatg catgcttgca tctgggacag 35160 ctaacccatt tggtaaggca gtattccaaa cccctaatgt acgcaagtta aggaaatttt 35220 ctatggaagc agcatatgca aacatataga taaatatgta agcatatgtg aatgtacata 35280 ttccaagtaa aattta gcaa caatattagc ttagagaagg atatcttcga ttagaaccac 35340 catcagaaag tatgtcacga acttgctcat tgtatatctc aaccatttga acacctactt 35400 catacacaac agtgttttgt ctaagctgag ttaagtgaaa caagtcattc agagctctgt 35460 aattgacacc ccagtgttct tttgaagtga tgcttggccc actctgtgtt agcaaaatgg 35520 aaatatgtgc gttaga gagt aataatgttt ggctgaaaca taaaaggagc aaagtcaagc 35580 atggcgttta ccattgtata agtttttcca gatcccgtct gaccatacgc aaatatacac 35640 acattataac catcaa gaat tgatcgaatt aatggtcgag tatctaggaa aacctcctct 35700 gcattaaaaa aaaaca gatt taggagaaat taatattaca taaagtcctt aacaagctaa 35760 tctatataca taagaggaag gaggtttaga ccttgagttg ctgcttgacc gaaaacttta 35820 ttgaacttaa acaacc gatg ggtatctttc ccttgcttaa acggatttgc aaccaccaat 35880 tcaccgttct caccaa tgta ctctatagaa gtctgtccac tgttttgccc cggaaggaat 35990 aatcttatcc ggcaat agac tctgatattt cctggaaaat aaatgcaaga gaagaacaga 36000 gtcatatctt taatggtcga gtgcaaaccc aaagtacact aacccaaagt gttttacctt 36060 tcaattcctg cacttc attg tacagtcttc ggttttcttc aaggaccaca tggtaatttt 36120 ttgctgcatc agccactcct ttgagcttta aaccttggaa aaatattaca aatatgaagc 36180 catgtatttc agactagaaa aactgaccaa acagccatac aaaattggtg acataaatga 36240 tacttaccat agtaatttag gtcctcaaag tatttctttt gtgtccttaa gacttcttgc 36300 tttatagaca ctgaagtagc attcaaagcc ttcatgattc acaaaaacta tgtcatttaa 36360 aagaactacc agggtattta ttgtttagaa tactatattt taaagccaaa cctgcaaagc 36920 accaaactgg ttgtct atga agctttggta ggtggactct ctgttctccc atttttgaga 36480 tttagatagg tacaacttct cgagttcttt gaccttccta gttgattcgg caacttgtaa 36540 ctctgcatcc tttaat ttac tctccaactc aactgtactg ttttgtgctt ttgcttctaa 36600 ctccaagcac tggttt gcat gcgcctcttt caccaccttg agttcttgct tcagcttacg 36660 aatctcagca tcactgcgct ctttttcctt tttcaaacgc accacatctt tttcttctga 36720 cttttctctt tcttct attc tgcttttttc aagctaaaga gcacaacaaa cccattattg 36780 ggaaaactct gagctaaaat aatttaatac acaacacaag cggaatgaaa atcgatgcat 36890 gagtcacgta tttaagtaaa aggggcatac acaacgactt atgatataat ttcaacatct 36900 agaggattgg cttaaa cgtc aattttcaca agtactatgc aggttaagta tgtattaagg 36960 agacgataca tattgaatca ataacatacc tttgtacgct ccatacaatt cgaaacaatc 37020 tacaacaaag aaaataacag aaagaccaat caataagcga aatagaaata aactgaaatc 37080
32/58 agagacaaca gtacctcgtt ttcctgagtt gccccagctg ccaaggtttc taagaccttt 37140 attcttgacc tgtatttat c ttcacgtacc ctgaagagta tattttgctg cacatatcat 37200 aaacatgttt cattacttgg tcagaaggat tatattaaca cgtgcataca aagaaaaaaa 37260 gagtattatg tactcttac g tttttcaggt tatcagcttg atttgagatt ctctgttcta 37320 tcacttgcac aagtgcgct c aagagtgatg ccattgcctg aacaacaaac cgcaaaaggg 37380 agaaacatgt ggatcataag aagaaatgtt ccatgaacta aggattcaaa ttttaggcaa 37990 accagattaa agttatcaa g agaaggaagg catcagtagc taaatctttg tcttacatga 37500 gacacatgtc cattcatctt cttcacgctc tcatctagaa gtttatccag catgtcaaat 37560 agtgtccgag taggagcat t ctacaaacaa agggataaag ggataaaagc taaacggttg 37620 tacacagtct actaaaaat a agttagaata ctttactcgt aaactgtcag atttcagtaa 37680 ttctgaaatt ttagcatct g atgtatcaat ctcaaatcct tccttcgact ggaatccatc 37740 aataaagttg cggtcatct c ctctggaatc cgaatggtct tctggcaagc tccatctcct 37800 cctcgcacct agtgagttt t tatcattacc accatcggaa aaacttgctt taagggcctt 37860 aagggactga aaaactggca gcatatcccc ctgcattttt actttctatt aggaggcata 37920 actccataaa gaaagacga g agacggcaga gagaagaaaa tatatggggg caaaaatcat 37980 ggaatcttat caagaatag c aaatcagaca atagccatga tgagaacagc gttgcagcca 38040 gatgatgtca aaaacaagg c ttgttttaac tgttaacaaa aattatctac cctgaattgg 38100 ttcggtttta taaaagcca a ggtggtaaac ccacaatctc tttacctatg tgatgcaata 38160 atactatata aaccaacca a ccagatgttc tctaattttc aaatcatttt ttctacagaa 38220 acgaaaagtt atatccata g aacaaaacaa acctgttcta tgtctgacac ctcgaatctg 38280 ggcagggcca tttcatccat agcagtcaga aaccgctcaa ctctaacata agcaggctca 38340 aagctgcctc cctatagaa t agccaaagag tgtgagtctt agcagaaaaa taaaaaatag 38900 agaaaaataa aaacagaag c ttagcaccaa aaaaagatat ataagccaaa tggtcaacaa 38960 aataaaaatt cataagtat a ccattctcat tgaaccagga ctaagctgat tcaaaaggtt 38520 acacaagaca gttccatcc c tcaagcatgc tctcacttcg tcctccgaag cttccgatgg 38580 taaattcaaa taaggaagt g tctgatttaa ccattccacc aaattctgat gacctgaggg 38690 caacaaaatg aagaagaaa t atacaagaac ggtgagaaca gaagccatct tccattcatg 38700 tctacaccta aaatgagct t aaacttcgcc attttcttat aatcacatga ataatctctg 38760 tcattactca aagttctga g agataaatac aagaaaaagg gaatagatga cgacatttac 38820 ctttcttact accatccaa g cttgaacgac tttcagaccc gtcgaagctg agaaaactag 38880 ttacatcgga gggagcata g acgccactca tattggcgtc ctgttcgaga ttaatgttca 38990 ttccaactca gagatcacg c tcagttccca tgattgtagt tgagaggagg agaccctaaa 39000 gcaactaaga aagttttgt c aataaaaaca acacaaacgt actaattcgc cgtgtaaaat 39060 attgaaaaag gggctccct t catcaatcta accttctaat ataatcaaac taagacgttt 39120 caatttcaga taagaccgt t taaaattata atcaatgatg atgaaagtta attccccttg 39180 tgttaaccag aatgcggac c aaatcaatta cgcagatcca agccatgaaa agagaattaa 39240 aggatacgaa cctgagaaa a gctaatagat aaagctctgg agggtggaag caacgcaaaa 39300 gaaaaaaaaa tggcgactg g tactgaagga aaatgctgag attcacggcg aggaagggga 39360 gagaaggcgt ttgaatctc c tcgccgggag agaaatttcg aatttttcca gccgcagcga 39920 ttttgctcac tcttttcct c ctttcttttc tcgtctcttc cttttttttt agattccgag 39480 aaaaaacaaa tgctaatta c ggttccaact tcgaaaatag agaaaaatgt tttttctttt 39540 ccttagaatt aattttaaa a aaaaaacatt tacaatacaa tttatgtttg attttgcttt 39600 acgttataga tgttttggt g ggccctaccc ttttttcaga aaaggctctt cccgctttcc 39660 tcactccaaa atttttata t aaatttttta cataaatatc cgattgatta tgcggcccaa 39720 ttaagcccac gtataagcc c gtttaactta aaatgtcctt caacttgttg atcattctac 39780 ctaaattttc atgtctgtt c tttatatttg tttactagga taatattttt ggtgtgtatg 39840 atgctttttt atttgattt a tgaggaggaa ctgtagttag ttataaaaat gggttaacca 39900 gctctagagt ttttctttg c caaaaaaaaa aagctgaaaa ttatgaatta tgaatctgct 39960 tagcttcgat caaaccaac g aggcatagtt atgacatggg ctttaaccgt gctttatata 40020 ttcactgatg agaagaagc a accctcaata tgccaaacgt gtctgttgcg gagaggaagt 40080 ctcagcttat gtgatccat a ttgataattt gatatggccc aaacatttga ttaaaggaca 40140 tacagaggta ccatatata g tatcattttc ttaatacttt tatgttttca tgcatttggg 40200 ggaagggtgt gataattgt a tgaaacaacc ttaaccacag ttcacgaaag agttaaagcc 40260 tacgttagag aaaatatct a agagagacct tcgttatctt ttgttatagt actttgtaac 40320 atacataaaa catagtaca c tgtacgtatt attctctata tcaaattcat cttgcacttg 40380 cactttcaat tgatatcag a gagaatcact gaaatcactg gtaagatctt gaagacaaaa 40440 tagatgatgt agtacagta g gaagcatggt cattgaaatt gttagtgcac caaaaacaga 40500 attttagaag ttaaaataa a aaaattactc aaggtgttca aatacctttt tttttgtgca 40560 cttttcattt accagtctt a aaatactaca taaattagta caagaagtat actacaggaa 40620 gcgaagatgt ttaattgact tgaagactag aattggagcc ggcctaaagt tgaactagaa 90680 gttacttaga gaccataca a tcaaagattt actttggaga aaaagaaact catcaatgga 40740
33/58 aatttttcaa aaggctt tga ataagatttg gaaaaactat aaaggagatt tgtggaaatt 40800 tatcctttgg atagtta gct atggtgagtc aagaaatcta cggagtataa ttatgtâcta 90860 gatgtttgtc cgcgact tcg cggatgataa tattatatga aaagtacatg ttatgtttat 40920 aacgttatag tgttata ata gttgaatagt aattagaaat tttaaatttt agaatttaat 40980 gttgacaatt ttttttt aga atttaatagt ttgataatca aaaatttcag tatatatttt 41090 tagaagagct gtgaagt ttt gagatagttc aacaacaaaa atgtgtcaca aaaatatttt 41100 tcttaattgc aagtatt gtt acaattgatt taagtaattg gttttaaatt tccttttagt 41160 ttattttaac atgtgaa aaa acaaaaaaaa aacattttag ccataaaaat atattttgtg 91220 tagttccaaa aatatgg tta gaggtctcta tagttctgac atcttctttg atgatttttt 91280 atgtttctct ttgtttgtat gattgttttc aatttatttt aaattcagca aaaaataatt 91340 gttttatgtg tttcttt caa aaaatctggc aaaataaaag ttcggatgta actaaaaact 41900 cagatttatt ttataaa tga gttaggtagt ctttccgttt caaaatgtta catgttttgt 91960 attttcttaa taattgt gta aaaaccttaa acatcactta aaatgataca gagggagtat 91520 taaatttaag tattaaa tgc ataactttca gtgattatcg atttttcatg attctaacca 41580 ataagaaatc agtaaat gta attaattttt tttgaaattt tcaattaatc attattaatt 41640 gataacaatt gtattga aaa tataaaccaa tgtatctttc tgaaacaaaa tttttttctt 41700 agaatatgta tctttat gaa atggaggaaa tattaaacag tatgtaaatc aaaagtctat 41760 agataattga ttgtaaa act aatttttatt ttaacactct aaaattatta aaaactaaaa 41820 tatcaactat tgaaatt gta agatttcacc aatgaatgta tatgtaacaa aaaatcactt 41880 aaataattta tatttta ata tataaataaa cagtgtgtta taattttata tgatttaaat 41940 gacttattta tttttaa gca taaaacgata agtcacttat tatattttaa tagataagat 42000 ataattgtgc gataatt tat atgattttta aatcattata aatgtacatt tatacagtta 42060 taattagatc tagaaac att taccattttg catctaaaca agatatgctc aagatttata 42120 tgaataattt tgataaa agt cttaaatgat tcagaaactc taataaaatg attttatagg 42180 ccaaagttaa aaaaatg ttt taaagtaatt tcaaaatatt tgtaaatgat ttataaatct 42240 tgtgtgggtt ttaaaaa aca aaaacaatta taataatgct ctatatacaa atctaagttt 92300 ttatataaaa atatata aaa atattttaaa taattataac aataaattat aaagaaaaaa 42360 aattgacgaa atattat ata ttctttatat aattatgcaa ttagtgacca taaactatta 42420 tttgtaatat tacttgt gtt ttttagtaac ttgcattaat tgattctaga attttctttt 42480 atttttagat ttgaata aaa taaatattta ataaaagtta tcaaccaatc aaactataac 42590 aatttcttga aacttca cat atgattgaca cgtcagtaaa gtgacttctc aattaatata 42600 tatagggata agtgtgt ctt gtatcgatat catttaggga tattaaaatg agtttcctta 426b0 atgggtttta aatgggg ttt taatataaat aaatgcacat ttacacccat ttagtttatg 92720 tgatttaaat gggtagt ttt gttaagacac atttattaaa tggtgtttca cttaaaatta 42780 gtggtgatcc tattaac cca tttaacttaa tacatactcc ctctgttttt taaagatgta 42840 tgttttggtg ttttcac aca tattaagaaa acacattaat tatacatcat ttttagaaat 42900 tatcaaattc caatgca ttt taaccaatag tctttcaata aattcaatca attttattga 429b0 aatttgcaat tttgtat agg aaacataaaa aaatacatct ttgtgaaaca atttattttt 43020 ctaaaacatc tatcttt aaa aaacagaggg agtatttatt aattcgattt tgtgtttttg 43080 gcggaaaact tgatttt gtg ttttgactag aaacacacaa ttttacggtt atgacatgaa 43140 gtaatgattt tgcggca gaa aaacgtgatt ttgtggtttc ggcgggaatt ttgatttttc 43200 ggtttttgtg agaaaat tag attttgcggt tttttgtgag aaaagcttga tttcaatttt 43260 gacggaaaac ataattt tgt ggtgggaaaa taaatttttc ttattttgtc ggaaaatgta 43320 attttacgga tttcgca gga aaatgagagt ttactgtttt agtgagaaac atgattatgt 43380 ggttttagcg agaaaaa tca attttaacca tgttcttttt gtaaaatggc ggcagcgtcc 43440 cgcgtcttaa aaataca ctt gatcttgaat gaatcattcc tttcgctgtt tattgattaa 43500 gacgctaaca gtacggc caa ttaaaattaa cggggatttg tgacgctgta aaatccagcg 435b0 tcagaataaa tggagat gcg gtggtttttt atgaaacgca gaagcatcaa tcaaacgagg 43620 atgccttaaa aagctgt ttc ctttgtattt tttttaacgc cgaacgctgc cgctgcgtct 43680 aaaaaagaac agagatt tgt gtttttagca agaaaatcca attttgtggt tttcgtacaa 43740 aattttgatt ttgaggt ttt ggctggaaaa tctgattgta ttgttttttt gtgggaagtt 43800 taattttgca gatttgg cgg agaaaagaaa ttttgtgttt tggtagaaaa acatgattat 43860 gtgcttttgg tgagaaa atc tgattttgtg ttttggcagg aaaataattt tgtggttttt 43920 gaagaaaaat ctaattt tgc ctaattttga tttaatcgct taatttccgc gttgatcgcg 43980 aaaagttgaa acacaat taa ttattttcta ctcattattg acagattttg tgttaatatt 44040 cattaccaag taattac agt tagctattaa attcaaaacc attgttcaaa cccaaaacat 44100 atacatacta catttga gga tttctttgta tcaaacaaac actgatctaa atgttttgac 441b0 aaatcaaaag gatattg ttt taaattatct ataaaagttt atataattat gtctaaaaac 44220 ttgtgtcatc attttta gaa ttagctaaac atattataaa tatttaaatt gtatttaaaa 44280 ttagacttca cgatatt ttg gtaactcgct aggcacggtt ttaccactgg acaagcgcct 94340 aacgcgattc cgaacaa gga tatatcatat taacatccct gataccacct taatcataag 94400
34/58 gattttggga tttaatttaa g ttgacacaa agtataaggg ctaagagttt ataaaggttt 44460 ttgggttgtg tacctcacta c cttgaacat gtttagttta agtgtaacat gtaaaaatgg 49520 gaattgaatt ctatgaaatc t aatctctcg ctgttgctca gtagttcagt ggtaatagag 44580 tgattgagtg ttaactaata a ttggtcgta gttcaactta aactgagtaa tattttttct 44690 ttgttaagaa tactttgatt a tttttggtt gaattaattt gtgacataaa caaaacataa 44700 tatctgtatg tgttatttta t gtatcatac tcatcttaca cttttaattg gtattaattt 49760 tacaagtttt aatgtacgat t tacgtacgt atcttacgta aatggacatg tgcatttttc 49820 tattgttcat gttcatgcga g aactatcat ccatagatcg tgcaaaagag tggtggggaa 44880 aaataacttc tttataaaat t ataactttt aattaatgcg ataaaaaggc aagagaatgt 49940 agtttcgaat taattacacc a catcatatc catcaaaatc atgaaattta gaatttttta 95000 gcaccatgca cgtggacagt a attttaacg gaaatcaatt agtcaaacaa tcaaggcacc 45060 cagctgttcc ttatgaagaa a aacaaaagc ttttgatgaa actaaaatgt cattttacag 95120 aacatatact atatagtaat a gttgtagct actactgatt gttgtcatga ctgtttcaga 45180 gtgtagaaca ccatctgata t aaacatgca tgcatgtata tatgttcatt caaatggtga 95290 aatgtatttg cgtacgcata a gcaaaaaga caatgaaaca agtcaaacaa cacaagacta 45300 tgggtctaac tggtgaccac c tcgggaata gtaggaacaa aaaggaaaag aattgatggg 45360 aataaaatta tgggaatgat g aggaacggt tattccatat caaatttggt gaggaataaa 45420 tttgttcttt aattctctac a ataaaagga atgagaagga atgaaaagga atgactattc 45480 ctaatgaatg gtaaaatttg t taggaacat taaggaatgc attattcctc ttcattcctt 45540 ggtcaccggt tagaccctat a tgtggatta tgcatatcat atacacgtga aaggtacctt 45600 taactatcaa attgattttg t agactcctt caaaccaatc taggtcactt cgaactgtag 95660 attatccctt acttattaat a cagaagcat ttttaggata taacctttat tttgtatttt 45720 attcacaagt ttgccattat a ggtgatctg tcattaccat agctcttctc agctttcgtt 95780 tttaataacc ctttgcttac t agagaaatt actctatatg ccattagtac acatatgaca 45840 taattggctt gataacatac c aatttaata agatgggttt ttgttctttt gtgagatttg 45900 ctcgccgatg atgtcgggta t ctcgccgga tatctgagtt tgacgacaag tttagagctc 45960 taaggttgga gagtaaagta a t caaagtgg gtaatcatcc tttatcagat tatctgataa 46020 atcgaaaatg tgagatttga g t ggaatgtt ttagggatgt ttacggagag attcgtgtcg 46080 gagatggtga gagagacgat t ttttttgtg actttttcga ggatgtcaaa gagacaagag 46140 gtggtggaga caggggtgga a gagacagtg agatcagtga ggttaacgag acgagcgggt 96200 agagtcatga gaggccgttg c ggcagcgga ggaatgaaga gacggcggag aaggagtgga 46260 gtgcgtcagg gaggcgatgt g cgagtaggt gggagcttcg aaggttacta cggcagattc 96320 gttcggtcct gtcgttttgg gt ggtacctt tgatcaattg ctcaatggac atcagacttc 46380 aaggttaatt gttgttttca g t ctgtggtt tctgcttaag aatcgaacta atttgtcgaa 96940 atatttgttt gtggtgatgg a g aaatcagg cggtggagat agccatggat cgaatagtag 46500 cggggtatgt gatatcccga t gttgatgaa caaacaaata agccatctct ccctcttgaa 96560 tctgctctca tctctccctt t t cgcctaga ttagtttagc atcctacacc atttgatata 46620 gcaagtcatt cgagaacgag g a atctagca acttatgtga ggttgaagtc tcttttatgg 96680 ctaaaattga ttgtactgaa tg tttctgtg gtttaaaact gaaactgttt agctttgttg 46740 atgagctgga aagttcaagg tctcaaagac attaaagagt tcaattccct gcttatgtga 46800 gattggagtt taagtccagt t gccttatta gttcttatca tgagttgcaa agacgtgtta 46860 ttgtgatctc aaggcaaaag g a agactctt tttttatcgt cttatatagt gagtttgtaa 46920 agctgaaact tttatgcatt ggtttggctt gaattcttgc tgtctgaact cactaatgtc 46980 ttggcttgaa ttctcagcga g cttgctgtc tgaactcact aatgtcttgg cttgaatttt 47040 cagcgagctt tcgtctacct ta cttgctct gtttttttct tctttcatgg cagctctgtt 47100 tatttttctt ctccttcaac a c gttaccat ctaaacatgg tttttaaata aatattttgc 47160 attttgttat cctttcatat a t caaaatta tcaaatcgag ttgtcattac taagatggtt 47220 tcttccagct atacatacac a t gctataga acacgacttc tttctcttca agacatgtgt 47280 tgattatact atacagtgtg gt tctatata attcttttta attaagatat cagtacttta 47340 cagtttgatt atctttctag c a agatgtta cgagggtgag atattagcaa ttctgaaaat 47400 atgcattttc actgttgtta ta ctcatatg tataatcgct ttatcttggt cacagaataa 47460 aaatacttaa atatgaactc a t acatttca ttgtcaatcg tgtaatgttg catataaaac 47520 atacgaggtt atattctaat tt caaaaaag tacaaaagca aagtcgtgag tgatcagatc 47580 attgtgaatc aggagtaaat c a ctatcaaa ggatcaatag ttatataaac cagcagcgat 47640 tcacacatac ataccatttt ca tctcattg atgctaggcc taatacatgt tactttaaaa 47700 aaaaatggaa aatgaggttt ggtatataat atggcctttt ggtaacatac cgtcaataca 47760 tgcattcgtt agttatgctt aa attttacg gaaatattaa attgtgttca aagtgaattt 47820 atgtgaggtg aatataatta a gttgccatt atgtttaggt atattctaaa acaaaatatt 47880 ggtattcatg tgcccagaaa at ctcgctca cacaacaaag agatacactt atggtccaaa 47940 tactataacg tatcaatcta a a ttaaaaaa aatctcaaag ttgaaaaata ttctgtagga 48000 atttgataat gtattccaat t t cttacaca ttaggtatcc atatcgatgt actaatatat 48060
35/58 agaggtgttc agtctgat ag aactaaccaa ttaaaaccaa acaaaatcga agtagaaaaa 98120 aaagatttag atttgata gt tcaaaagaag tcgagccgat gttatcttta aaaaataaca 48180 ccgaaaaatt gattaact aa aaaattagta tatttatatg taatttttgt aataaaatta 4824D
acattaaata atatatacaa atttatttta ttaatatggt attcataatc aaaacattga 48300 ttaaatattt ttttattt tt ttaagttaaa atggttattt tatttttcat tttcatcaaa 48360 ttaaataaaa catatttttg tttttattga taacttcttg tgataaaata taattatgta 48920 ataatccttt ggtattatta ctttttactt ttatttgaat atttaaataa aatatatatt 98980 aatgttttaa taaatctg at ttatattcat ataatctaat ttttttaaaa ataaatatat 48590 ttatggtttc ttggtata aa accgaatgaa ccaaaaatta atggtatata aacgaaccaa 9860D
accaaattat atataatt tc aatatgatag cgaattttta taaattgaaa aatcaaaaaa 48660 aaaaaaaact gagatagt at ttaattctgg aggcctgatt aatattataa atatttgtca 48720 ttaattctct gtgtggtt ag tacatactat atgagcaagt tatgcaatgc acctttttct 48780 gtctcattta gtttactg ta gtacatttta ttgtacataa tattgtagat gttatcaata 48890 atgtattctg caaactat aa atgaatatgt aatgtttttt tagtaacacc aatgaatatg 48900 taatgtaact tatgctat tt tacaatagtt tcattccgcg catagcgcag gtctctacct 48960 agttctatta gtactaag ta aaccgaatac aggtgtggac gtcacattat tacaagctaa 49020 gcttaattgg ttaaagta at taagttcggt tggttttagg atttatgata gaatcataga 99080 gagtggctgg tgctgaca at gttattaatg cttaattaat aagctggacc accaaaaatg 49140 gactgttcga taatcaactg aagactctga tccactcaat aaatgcgagc atctctttca 49200 ttataaaata ggttttattt atttttttgg aacaaaaata ggttttattt atcttcacat 49260 gttcttacat ccaatgttgg aatatatcat tttatcttca cttatgtctg cgccatgtta 49320 tttgtaacgc aaaaaaat tg ttctcttcac tggttatagt taacataaca tgtaacaaat 49380 aaaaaacatg taaaataatt acatatttag ctgcctagga attgggggta tagattaaat 99440 attatttata attaaatc ct ttataacaaa agtcaaagtg atcctttttg gagtgaaaat 4950D
tagaatçtct ctgatataaa atactttgtg gatatctcaa ctaaaaaagt tagaaaggaa 49560 ctgagtatct caaaatga gg gatttctcaa ttagatattc accttagata cttttgcaat 49620 aggattactc tcttagcta g aatcatgttt acttgtcctc gcgaggacca caatgtacaa 49680 ataacacgga tgacatgtt c atacaaaatt atgaataatc tgtattagga aattactgaa 49740 aaggttattc cttcaatttc acattaattg tcattctata atttaaattt tgtttaattt 49800 tagtactttt tatgttttaa tgtatttatt tgttagtttt tctaattttg tctatgttat 49860 ttttgtttat caattaagat aagtcaaata aatactctta catttgtgaa taaatgtcac 49920 tttgatattt ttaacaca ga ttaaaaaaat gacaaaaata aatataaatt attattaatt 99980 acacatttct gatcaata at atttgagata aataaaatta tttataaaat caatgcagtt 5004D
tacaattaat tttcaattga aagtaaatat aatttgtatt gaaattgtaa aatgatattt 50100 ttgtgtaaca aaaaaattag aatgacaatt attatgaaat aaatggaatc aatgactcat 50160 tattattttc tgtacatcta aactagtgct atcatgcgct ttaatgtgac ggaaaagtat 50220 ggcaattagt acgagaacct ctaagagcat tttcaacaga ccctcaaatc ctcaaatttt 50280 aaggtttttg tttcttcaa c agatccttaa atcttcaaat tttgaaggcc tgaatagtga 50340 aacctcaaat ttgaggttcc actattcagg ccctcaaaac actatttact tttcagttta 509D0 gttcttataa atttgtaact tacatatatt tgtactaata ttaattttct tattatttta 50460 atccttgtaa ctatatttca cttaaatctt taaatatatc ttatatatac agatatatat 5D520 acatatatat acatatatat tattacataa aatatgaaaa tatgttaaaa ctaaaataaa 50580 ataaataaac aaaaaatatt acttaaaaga tatttattat ttcacaaaac atttatatta 50640 aattgaacaa tatattacaa attaattttg tgttataata aattgtattt ataaatatta 50700 tgttttataa tttcagtgt g tatgtactat ctatctatga aaaatataat aatgatagtt 50760 gatttatatt aaagttaggg actgaaatgc aaattacata aaattttaaa aataaatttg 50820 aggatccttg ttggagtaa c ccaccttcaa accctcattt tgaggatcat tggcccttaa 50880 aatgaagttc cttgttgga g atgctcttag agcaacttta tcggcagcaa aatcacgtat 50940 cttaaagggg gggaccacgt actttttgca aaacccatga cagacgttgg ttaaataaga 51000 gacgtttgtg ctgcgtttgt taacctgttt gcggactcta ctgacacgta gtgatccgcg 51060 actggctcaa ttattattat ttttttttaa atcagaaaaa tgcaaaaaaa aaattaaaaa 51120 taaataaatt aaaaaccta a caaacgtatc accgataatg atgccctaac tgactagggg 51180 tagtatatgg ttcagtatgt taattcaaac acattaaaga tttagaatca aatgataaat 51290 aatactattt ggccgtgta a tcatacaaga aataaataaa acagtgaaaa aaaccttact 51300 cctttttcaa ggttcagac a cgacaagaag tagtcctagt taggggtgct tattttgaga 51360 gatgcgaaga ttttattaa a aacatactat agcttacggt attaaatagc tcttggtttc 51420 ttgcacagtg ttttaaata t ctcatttaaa tacatatttt tgtcaaaact caaacatata 51980 caatcacagt tgattctct t cctgactcta attaattttc accaacatct ttgatccaag 51540 cttcaatctc tctcaatat g caaccttatt gtttgactcg catggaacag agtctcaaat 51600 aactttagga aagtttgagc aagtgttaac attcgaaatc aatgcagaaa ctatatgaaa 51660 tgcaagcttt tttgtctgtt tcccgggaga tccttgatct ataaccttaa atttcgtgtt 51720
acattaaata atatatacaa atttatttta ttaatatggt attcataatc aaaacattga 48300 ttaaatattt ttttattt tt ttaagttaaa atggttattt tatttttcat tttcatcaaa 48360 ttaaataaaa catatttttg tttttattga taacttcttg tgataaaata taattatgta 48920 ataatccttt ggtattatta ctttttactt ttatttgaat atttaaataa aatatatatt 98980 aatgttttaa taaatctg at ttatattcat ataatctaat ttttttaaaa ataaatatat 48590 ttatggtttc ttggtata aa accgaatgaa ccaaaaatta atggtatata aacgaaccaa 9860D
accaaattat atataatt tc aatatgatag cgaattttta taaattgaaa aatcaaaaaa 48660 aaaaaaaact gagatagt at ttaattctgg aggcctgatt aatattataa atatttgtca 48720 ttaattctct gtgtggtt ag tacatactat atgagcaagt tatgcaatgc acctttttct 48780 gtctcattta gtttactg ta gtacatttta ttgtacataa tattgtagat gttatcaata 48890 atgtattctg caaactat aa atgaatatgt aatgtttttt tagtaacacc aatgaatatg 48900 taatgtaact tatgctat tt tacaatagtt tcattccgcg catagcgcag gtctctacct 48960 agttctatta gtactaag ta aaccgaatac aggtgtggac gtcacattat tacaagctaa 49020 gcttaattgg ttaaagta at taagttcggt tggttttagg atttatgata gaatcataga 99080 gagtggctgg tgctgaca at gttattaatg cttaattaat aagctggacc accaaaaatg 49140 gactgttcga taatcaactg aagactctga tccactcaat aaatgcgagc atctctttca 49200 ttataaaata ggttttattt atttttttgg aacaaaaata ggttttattt atcttcacat 49260 gttcttacat ccaatgttgg aatatatcat tttatcttca cttatgtctg cgccatgtta 49320 tttgtaacgc aaaaaaat tg ttctcttcac tggttatagt taacataaca tgtaacaaat 49380 aaaaaacatg taaaataatt acatatttag ctgcctagga attgggggta tagattaaat 99440 attatttata attaaatc ct ttataacaaa agtcaaagtg atcctttttg gagtgaaaat 4950D
tagaatçtct ctgatataaa atactttgtg gatatctcaa ctaaaaaagt tagaaaggaa 49560 ctgagtatct caaaatga gg gatttctcaa ttagatattc accttagata cttttgcaat 49620 aggattactc tcttagcta g aatcatgttt acttgtcctc gcgaggacca caatgtacaa 49680 ataacacgga tgacatgtt c atacaaaatt atgaataatc tgtattagga aattactgaa 49740 aaggttattc cttcaatttc acattaattg tcattctata atttaaattt tgtttaattt 49800 tagtactttt tatgttttaa tgtatttatt tgttagtttt tctaattttg tctatgttat 49860 ttttgtttat caattaagat aagtcaaata aatactctta catttgtgaa taaatgtcac 49920 tttgatattt ttaacaca ga ttaaaaaaat gacaaaaata aatataaatt attattaatt 99980 acacatttct gatcaata at atttgagata aataaaatta tttataaaat caatgcagtt 5004D
tacaattaat tttcaattga aagtaaatat aatttgtatt gaaattgtaa aatgatattt 50100 ttgtgtaaca aaaaaattag aatgacaatt attatgaaat aaatggaatc aatgactcat 50160 tattattttc tgtacatcta aactagtgct atcatgcgct ttaatgtgac ggaaaagtat 50220 ggcaattagt acgagaacct ctaagagcat tttcaacaga ccctcaaatc ctcaaatttt 50280 aaggtttttg tttcttcaa c agatccttaa atcttcaaat tttgaaggcc tgaatagtga 50340 aacctcaaat ttgaggttcc actattcagg ccctcaaaac actatttact tttcagttta 509D0 gttcttataa atttgtaact tacatatatt tgtactaata ttaattttct tattatttta 50460 atccttgtaa ctatatttca cttaaatctt taaatatatc ttatatatac agatatatat 5D520 acatatatat acatatatat tattacataa aatatgaaaa tatgttaaaa ctaaaataaa 50580 ataaataaac aaaaaatatt acttaaaaga tatttattat ttcacaaaac atttatatta 50640 aattgaacaa tatattacaa attaattttg tgttataata aattgtattt ataaatatta 50700 tgttttataa tttcagtgt g tatgtactat ctatctatga aaaatataat aatgatagtt 50760 gatttatatt aaagttaggg actgaaatgc aaattacata aaattttaaa aataaatttg 50820 aggatccttg ttggagtaa c ccaccttcaa accctcattt tgaggatcat tggcccttaa 50880 aatgaagttc cttgttgga g atgctcttag agcaacttta tcggcagcaa aatcacgtat 50940 cttaaagggg gggaccacgt actttttgca aaacccatga cagacgttgg ttaaataaga 51000 gacgtttgtg ctgcgtttgt taacctgttt gcggactcta ctgacacgta gtgatccgcg 51060 actggctcaa ttattattat ttttttttaa atcagaaaaa tgcaaaaaaa aaattaaaaa 51120 taaataaatt aaaaaccta a caaacgtatc accgataatg atgccctaac tgactagggg 51180 tagtatatgg ttcagtatgt taattcaaac acattaaaga tttagaatca aatgataaat 51290 aatactattt ggccgtgta a tcatacaaga aataaataaa acagtgaaaa aaaccttact 51300 cctttttcaa ggttcagac a cgacaagaag tagtcctagt taggggtgct tattttgaga 51360 gatgcgaaga ttttattaa a aacatactat agcttacggt attaaatagc tcttggtttc 51420 ttgcacagtg ttttaaata t ctcatttaaa tacatatttt tgtcaaaact caaacatata 51980 caatcacagt tgattctct t cctgactcta attaattttc accaacatct ttgatccaag 51540 cttcaatctc tctcaatat g caaccttatt gtttgactcg catggaacag agtctcaaat 51600 aactttagga aagtttgagc aagtgttaac attcgaaatc aatgcagaaa ctatatgaaa 51660 tgcaagcttt tttgtctgtt tcccgggaga tccttgatct ataaccttaa atttcgtgtt 51720
36/58 cttcgtcgtg tgtagcca tt agaatcagtt atgtgttttt ttttcttttt aagctaccag 51780 cattaattta tattttct tg tgtatatact ccgctcctaa caattaattg ttgtcctttt 51840 ggcacatcgt taaaattg ga acgaaacaga aaaaattagc ataacctttg cgcaaagatg 51900 atacgcacaa ataaaaaa at agtccaaatt tttagttagc aaaaaaaaca attaaccgtt 51960 gttgttggcc aaaataagtc ttggttggat ttatatgaat gttatatcta tattattaaa 52020 tcagaagtac acatatagaa tgccctttag tttttagtat tatttacact tctatgccac 52080 taacgttaaa taatactt cc tattttaatg ctgtcttttc cactttgatt aatgcatttt 52140 ctaaaattaa atttgaat ta aatacacaat taaataatac ttcctatttt aatgctttgt 52200 attttccact tacattaa tg tattttctaa aattaaattt gaattaaata tatttcatta 52260 acttttcaat taaatcaa tt tcaaattaaa aaaatacatt tttgttggac aaacaattca 52320 tggaaattat aatatcaa ct cttcatttaa caaatctgaa cgaaaagaat attatcaaat 52380 ttgaaccgaa actagata ct atccaaacgg atttaccatt ttggtatcta gagaaccata 52440 accaaacctt atctgaac ga aatatttcag agattcgaat gtatttaaat catatttata 52500 tacttcaata tgttagct at tttcgagtta atatccaata tataagttat tttaagttgt 52560 ttaaaatatt tgaaatat aa aaaatagtcg aaagtaaaca tctaaagtag ataaacaata 52620 atcaaaacac caaaatactt aaaatatata tatttattat tcatccaaat attcaagtta 52680 aacctatttt aaattttt aa tttaggtatt ttgacttaca ttactcaaat ttacatgtta 52740 tattttttaa gatttaggga tatttaaaga tatataaatt taaaaaattt aaaaataatt 52800 taaacgggtt atcaaacc cg caaagatccg aataaaaccg gaaccaaagt ttataaatac 52860 ctgaatagag ctagaatctt taaactcaaa atttcaaacc cgaatagatt ttaaccgaat 52920 tcgagtggat atgcaaat at gcatccctag cttagtcaat ataaaacgat caaatattac 52980 aaatatacta tttagtat aa ataaataaaa actgaaaatt aatacacgtg cggtcgcacg 53090 ggtcaagatc tagtttat ga attatgatac taactaatag attggtcaat gccctttata 53100 tattatttta aatctgat ta tatattttga aataggttat taatacgttc ttaagaatta 53160 tggttttata ctacttta ac ttgaactgaa ttccattcta caacacataa taatatacta 53220 tatttaaacc attcacag at cgtggtcaat aaaaccatat ataattgatc aactaatata 53280 ttgtggtcag atctaact cg tataccctgt taaaaaaatg atcacatatg ttttgatttc 53340 atgttaagtt tcatccat aa accaatagtg ggtaagcatg tgtgttgatt atagatagtg 53900 taagtttcct tagtttac tt aatttcgaat gtataacttc cactcaaaag tatagtacaa 5346D
agagaaagaa caacttag tt tttcttttga caaataaaat acaaatagag agaggtgttt 53520 ggaacacaat attcaacc ta aaggcaagta cccacttctt ttgtttctta aagattatat 53580 tgaacatgaa ccaagtta ag atatctccaa tgataacttc atttttttct tcgaaatttg 53690 aagtcattca aaaaatga ag caacaâgttt ttcaataatt tgcttcattt tcttcaaaaa 53700 aatatattct atatattc tc tatcactatt ttatatttaa ttattagtaa cactttatac 53760 ttttcaaatt tactagtt tt actcatttat tttgttttaa caataatccg actctaatag 53820 taagttaaac attattat at gatataatta ttacacatga cataaataag taaacataca 53880 cttttagatt ttataaag aa acaccaaata caaatatctt aaatgattaa tcagaatatt 53990 ataaaagcca aaattgag tt tattttattc taatttcttc taaatcaaac atagaattct 59000 taaaatttaa taatatca tg tctttcgtta ttaacatcta attagatgaa agcaataata 54060 taaattttga aattaaat gg gtggcattta aacatacaaa ataacaataa attaaaatta 59120 tagatcagtt tgtaaaca aa aaaatatatt ctaaaaatga acaattgaac attatttttt 54180 caattgaaga aatactgt tc aattctcaaa attttaagaa ataaagaaaa aaataaagta 54290 ccactacagt aaaaaata aa gcaaaaatat aaaatgaagt actattgaag atgatcttac 54300 acaacatatg atataaag tt ggcgagttag ctaattccca aagattaaag ccaccgaaaa 54360 actacattcc gactattt tt tttgttacca ctcctttaaa ataaaactac ttttaaaaat 54420 tcctcgtata tttatgta tt ttatgataat ataaagtgtt tgtttaccta agaatgtatc 54480 taattcacct ctctattt ac atgtataata gcatttagag ataaaatatt attaaacaca 54540 ttcttatttc ttttacga aa ttataaattg ttatttttct ttatttatgg agaaagtaac 59600 atttctctat atttagct tt tattttgaaa ttgataattt agagaaatat atctttttat 54660 aaaaaaaaat ctatgtta ta aaaagaaagt aaactatatt ggagaatgga gatggtctaa 54720 gtgtcataaa gaaattct ga gaccatcctt tctttttttt tttgatcaaa ccagacttgc 54780 atttatctta aaagagtt ta aactccatta gaggaggata caacaaggct acaaggagcc 54840 aaccaaagtg ataaactg at aacacaaaag ataaaattga tacaaatcac aaaaagaaac 54900 cataaaaatc°gcatgaca ac gatttcataa gcttctttaa taatcgtacc aagtgtaacc caaacggtca caaacact gc atcaacagca gaggggagca ttagctggga ggaagatcct 55020 ttgagtacca gcaacgct tt atcttccatt tcactccata caagaggaaa tattgggaag 55080 agaaacaact ccaaacag ga gacaattggg agaccaatac ccgtcaagat cagattcaac 55190 aggcaagata tgtcaacg ag ttttccttcc agctgcaaca aagaagagaa acacaagata 55200 acagcaccaa aaaccagg ct tgacacaata aaggaactgc atactgcagt aagaaatcgc 55260 actgaaacga catagatg cc actaaaaggc acaaaggtag aaccgaagga agctctgtcc 55320 atcagaacat taccaatt aa aaccaatgac ctcaagttca aagtcgccca tacaactcgc 55380
agagaaagaa caacttag tt tttcttttga caaataaaat acaaatagag agaggtgttt 53520 ggaacacaat attcaacc ta aaggcaagta cccacttctt ttgtttctta aagattatat 53580 tgaacatgaa ccaagtta ag atatctccaa tgataacttc atttttttct tcgaaatttg 53690 aagtcattca aaaaatga ag caacaâgttt ttcaataatt tgcttcattt tcttcaaaaa 53700 aatatattct atatattc tc tatcactatt ttatatttaa ttattagtaa cactttatac 53760 ttttcaaatt tactagtt tt actcatttat tttgttttaa caataatccg actctaatag 53820 taagttaaac attattat at gatataatta ttacacatga cataaataag taaacataca 53880 cttttagatt ttataaag aa acaccaaata caaatatctt aaatgattaa tcagaatatt 53990 ataaaagcca aaattgag tt tattttattc taatttcttc taaatcaaac atagaattct 59000 taaaatttaa taatatca tg tctttcgtta ttaacatcta attagatgaa agcaataata 54060 taaattttga aattaaat gg gtggcattta aacatacaaa ataacaataa attaaaatta 59120 tagatcagtt tgtaaaca aa aaaatatatt ctaaaaatga acaattgaac attatttttt 54180 caattgaaga aatactgt tc aattctcaaa attttaagaa ataaagaaaa aaataaagta 54290 ccactacagt aaaaaata aa gcaaaaatat aaaatgaagt actattgaag atgatcttac 54300 acaacatatg atataaag tt ggcgagttag ctaattccca aagattaaag ccaccgaaaa 54360 actacattcc gactattt tt tttgttacca ctcctttaaa ataaaactac ttttaaaaat 54420 tcctcgtata tttatgta tt ttatgataat ataaagtgtt tgtttaccta agaatgtatc 54480 taattcacct ctctattt ac atgtataata gcatttagag ataaaatatt attaaacaca 54540 ttcttatttc ttttacga aa ttataaattg ttatttttct ttatttatgg agaaagtaac 59600 atttctctat atttagct tt tattttgaaa ttgataattt agagaaatat atctttttat 54660 aaaaaaaaat ctatgtta ta aaaagaaagt aaactatatt ggagaatgga gatggtctaa 54720 gtgtcataaa gaaattct ga gaccatcctt tctttttttt tttgatcaaa ccagacttgc 54780 atttatctta aaagagtt ta aactccatta gaggaggata caacaaggct acaaggagcc 54840 aaccaaagtg ataaactg at aacacaaaag ataaaattga tacaaatcac aaaaagaaac 54900 cataaaaatc°gcatgaca ac gatttcataa gcttctttaa taatcgtacc aagtgtaacc caaacggtca caaacact gc atcaacagca gaggggagca ttagctggga ggaagatcct 55020 ttgagtacca gcaacgct tt atcttccatt tcactccata caagaggaaa tattgggaag 55080 agaaacaact ccaaacag ga gacaattggg agaccaatac ccgtcaagat cagattcaac 55190 aggcaagata tgtcaacg ag ttttccttcc agctgcaaca aagaagagaa acacaagata 55200 acagcaccaa aaaccagg ct tgacacaata aaggaactgc atactgcagt aagaaatcgc 55260 actgaaacga catagatg cc actaaaaggc acaaaggtag aaccgaagga agctctgtcc 55320 atcagaacat taccaatt aa aaccaatgac ctcaagttca aagtcgccca tacaactcgc 55380
37/58 attccaaccc attcaactga ataaaggtaa gcggagagag aggagctatg atgaacctgg 55490 aaggctgtaa ccggagggtg g gaaggaagg tcgggacaag atctgagaac agaccattcc 55500 acgagccgac aaggaaacga c ctgcacaca agagggacgc caccaccaca gatctttgtc 55560 gccattgttg aacaatgaag c tttaaatca agggtgtggg taagagcttg aagagaaggc 55620 ttagtggagg tgacgcggat g cgaagaaga gaaaggagag cgtctggagg gtctggaggt 55680 aacggcggag gagcgacggg a gagagaact tcaaccggag gatactcgta cggcagcgta 55790 tctgcaggag gtctgtaaac caacggagca gcattcacca tcagggccat ggaggaggag 55800 cagagctgct tcaaagggag t ctgaaggag cgacggagct gaagcggtgg agatccatcc 55860 aaaacggcat acctcgggac g cgggcctga gagaaataat tagggcgaac tgagaaaagt 55920 tagcagttct ttgagaccat c ctttctctc tcgatcaatt caaccacaac aatagtaact 55980 tcaaaataca aaatactatt t aacttttct atttttaaat ttttttatca ataaaaaaca 56090 ctatttaact atttttatta t tctacccgt atatggaagg ttcaagataa atgttaatgg 56100 gctttgttgt cttctccctt c ccgaaactg aaccagtgtc atgtaaaaat caccaactca 56160 taagtcaaac cctataattc c gttctgctt ttttccttgt ctacaattga tggctaccgt 56220 agaaaacaga atgatgccgg a aaatctaaa gaagcacctc gctgtttcag ttcgaaacat 56280 tcaatggagt tacggaatct t ttggtctgt ctctgcttct caaccagggt acatctccta 56340 atctttaccc tttcctctga a gtttacagt tttcttggct ttctccacga tattgagaca 56400 ttgttgtttc taatcaagaa c tgacacaaa atatctgggc acatttcaac tttcattctt 56460 tctcatttca aactttatct g tatgttgtg ggttaaacat aaaaaagact gttggagtgg 56520 ggagatggat actacaatgg a gacattaag actaggaaga cggttcaagc atcggaagtc 56580 aaagctgacc agttgggtct t gagagaagt gagcagctta gagagcttta cgaatctctc 56640 tccctagcgg agtcttcaac c tcctgtggt tctcaggtca atagacgggc ttccgcctcc 56700 tctttgtctc cggaagatct c accgacact gagtggtatt acttagtatg catgtctttc 5b7b0 gtcttcaaca ttggtgaagg g taaatctgt ctttctccta atcccatcat caatcaaacc 56820 atttttttaa aaaaaacgac gtgaccctaa cttttattat gtactcttta ttctaatttt 5b880 tgattaaaaa aattatgtac t atatttctc cttagaaaac tgatagaaaa tgtatactat 56990 tacaaaattt caaagatcaa t gtatttttg tatagatatg aattaagatt agtcaaactt 57000 acttataaga gtactttgat t ttgtctaac aaaaaagaca aacatccttt attatcatgt 570b0 ctccttcagt tctcatcttc c acgatagct tattccgaca tggacgagtt tgattgttaa 57120 aaacgcaatg tttttacgtt t gcgtgttta caaagtatca accttaatat gagttataaa 57180 tgatgatata tagacgcatt t ttgtcgtcc ggttaagcat aaaacatcta tactattaaa 57290 gtacaagcac atttggattt t tactcagtt tacccctatt aaagaagctt tcttttgtat 57300 tcattaatga tattttggac a ttctgtatt ggtttctttt ttaattgttt ttggtttgtt 57360 attaaccacc ggtttcctaa t tcaattttg gtatgtgatt attccgtgtt tgatactgca 57420 tcattttaat atttttccaa c cggacatgt ttgaaactgc atcgtttttt ctcaaactat 57480 ttaatggttt ggttttaaac t gctttttcc taaatataat cccaactatc taacaaaaat 57540 tatttataaa aaataaaaat t gtttattgg ttcaaccagt ggttcaaccg gtaaccggat 57600 ttcgatttta atagttttta t tggattttt taattttttt tttttcaaac ccgaactgaa 57bb0 tttatctttg atcaaccggt a atccgttca accgcaggtc taagtcgaat ttcaaaacac 57720 cgatcaaaac tataaaactg t tatattggt ttatatttaa aatatctaat tcaaaattaa 57780 aaacctaaaa atacatgtat a atatagttt tatcaaacat aaatctggat ataaaataca 57840 tatatgagac gaattatata a acacatata caaaacgaat tatataaatg tgattatata 57900 aaattttcac ctaacataaa c ccgcgcttt gaaagcgcgg atcaaaatct agtaaaatga 579b0 ttaaaaaacc aaactaattt t tccgtcttt ttattattgt agagttcccg gaggagtgtt 58020 ggcgaacggg caaccaatat g gttatgtaa cgctcatacc gccgatagta aagtcttcac 58080 tcgctctctt cttgctaaag t aagtttttg ggtagtttct atttgcaact ggaaatgcta 58140 acgctataac taaaacgttt t ttcttgtgg ccgcttttgc tcttttaaga gtgcttcgct 58200 tttgacagtg gtttgcttcc c atttcttgg aggagttctt gagatcggca cgaccgaaca 58260 tgtaagccaa tatttttata t ttatcctat aaactcagcc gtttcgacgc ataggagttc 58320 aaaccaatca acatgcagat a catattatc ctgttaattt tttcgttttt ttttgttcaa 58380 atatcctgtt aattttttca t ctatcaaaa attagcacaa aaggtaaaag tatttctagc 58440 aagtatatta aacaatataa t ttacattga tttgataaat agaaatagta cataaaaaag 58500 tcccatctga caaaaggttt a aattctccg acatttctaa tcaatattgt cataaagctg 58560 ttatatttcc agcgcttaat a gtgaataat gaaagttaaa agggctaatt tattattttt 58b20 tgttaaatta ttttaggttg c agagaactt aaacgtgata caatgcgtga agacattgtt 58680 ccttgaagct cctcatggaa c tttatcaac gagatccgat tatcaagaaa ttttcgatcc 58740 tttaagccac gataaataca t t ccagtgtt tggaactgaa gcttttccga caacttccac 58800 aagcgtgtat gagcaagaac c agatgatca tgattcgttc atcaacggtg gtggtgcatc 58860 ccaggtacaa agctggcagt t tgtgggtga agaactcagt aattgcgttc accaaccgct 58920 taattctagc gattgcgttt c ccagacttt tgttggaaca accgggagag ttacttgcgg 58980 tccaaggaag agtaggaatc a acggttaga tcagattcaa gaacagaata accgagtaaa 59040
38/58 tatggacgac gatgttcat t accaaggcgt gatctcgacg attttcaaaa caacgcatca 59100 gctagttctt ggaccgcagt ttcagaactt tgataagcgg tctagtttca cacggtggag 59160 gaggtcatca ttgtctgca a aaacgttggg agagaagtcg caaaatatgt taaagaagat 59220 tatatccgag gttcctcgg a tgcaccaaaa gaaggcgttg ttaccagaca caccagaaga 59280 tagcgggttt aaggttggg g atgaaaccgc gaaccacgcc ttgtccgaga ggaaacgccg 59390 cgagaaattg aatgatcggt tcataacgtt gagatcaatg attccttcaa ttagtaaggt 59900 aacctaatcc aacactttg c ttcaatagcg ttttgaattt acgacaagcg ttttgaattt 59960 actacacgcg ttttgcatg t gcatgctaaa atattacatt atattttcaa ggaaagtaat 59520 cttatatctt gtggattctt cagaccgata aggtgtcgat tcttgatgat acgatcgagt 59580 atcttcaaga acttcaaag a cgggttcaag aattggaatc ttgcagagaa tctgacggta 59690 aagaaatgcg aatggctat g aaaaggaaga aaatggagga tgaagatgaa agagtatcgg 59700 cgaattgttt gaaaagcaa g aggaaggaga gtgagagtga tgtgaatgtt gaagaagatg 59760 aaccggctga taccggtta t gctggtctaa cagataattt aaggatcggt tcgtttggca 59820 atgaggtggt tattgagct t aggtgtgctt ggagagaagg gatattgctt gagataatgg 59880 atgtcattag tgatctcaa t ttggactctc actcggtaca gtcttcaacc ggggatgggt 59990 tattgtgttt aactgtcaa t tgcaaggtac agctactaac acaagctaaa tttctgttac 60000 ctaaccggaa tttgagtaa a ccgaaactga tatatatttt aatgctgatt gcagcataaa 60060 gggacaaaaa tagccacaa c aggagtgatt caaaatgcac ttcaaagagt tgcatggata 60120 tgttaaaggt ctcacaatgt tttagattga cagaattagc ttttattccg gtttaatttt 60180 ctaatctttg gtactcaga t atttaaaccg gatttttttt tgagattttg aaaatcttgg 60290 cagatccttt gaaattctg g taaaatataa tttcttttgg ttcataacgt agtcgtagac 60300 taatatgagt tccttagtt g atatataatg aaggtaaatc agatgatgcg aaatgaaaca 60360 ctcggcttag ttagtacag t atctattctt gatgatagta cggtttgcaa aagaaaatag 60420 aagtaaaatt agtagcaaa t gcctatgttg tgactagtta aagattctac caaacaaatc 60980 atatactaaa atctaaata g atagaagata gttcgatttc aatattcttt tggtatattt 60540 aggaaagtaa tgttttaaa g tatagtttga aaatataaag ataagattgg ttggtcaaaa 60600 gctgctagga aagtgtttt g ttcacaaaat acaatgcctt agtaaaaaga agtaatgtca 60660 tttcaaataa ttgcagcta a caccactgag aaatttgaac atgcgttaca tattttaaca 60720 attactttat cataaaaag a aggaagaaaa tcttagcaca aggagttgga ctgtatttgg 60780 atttcgtatg gtagcatcc a aaataaagtc tatcttttga gtaagaagat gttaacttta 60890 ctgcaaagaa tacagaacg a ggtgttagaa aattggtttg agacctttct tgatttagaa 60900 caagaataat aaaggagaa a ttctttaatg agattggttg acatggtaga tggtctctaa 60960 catgatccat cagttggtg a agttgacgct tcgtagatgg ttgtttagta aaacacaata 6100 ttaatttgtt cgagaagat t atggacctat gcatagaacc ttttttttgg ttaaccaaca 61080 acatgtgttg atccaacta g tgtctataaa ggtggctata taccaactag tttgtataca 61140 tcaattaata tgtataaat t cgactgtgac atgcataacg atccagctat agcatgcata 61200 agttaagact atatagcat g tgtctctaat gtacgatcca gctatttgtg ggacaccata 61260 ataactataa ttcaaggct g atttctaaag ctagaaagac tatggacccg agtatctgga 61320 acatcctagc taactacta t atgtagtagt tctactacaa catatatgac cacattgtgc 61380 aaacctgcat atataatga a aaaaatctga ctacatcatg cataaatcca gttataataa 61940 catacaaaat ccaaccttc a tttcagagcc gttgcaatta cagtaatcag tcatttgtgt 61500 tacactttcg ataacataa a gagaaaactg atcttgagcc aaagctggct gactcgagcc 61560 aattgttagc atatgaaact agtattagac atggacattt ggatccttga gtgggatttt 61620 ggtaggttct acttgaatc c ggatcttttg cgtcagatat ttggatcaat atatttaagt 61680 acttgaactt tttcggttt g gggttcgggt aagtttcaac cgggtcaaaa tcgttttgtg 61740 tcacaaaact aaatacatg t acagaacctt gagtgggatt ttggtaggtt ctacttgaat 61800 ccggatcttt tgcgtcaga t atttggatca atatatttaa gtacttgaac ttttttggtt 61860 tggggttcgg gtaagtttc a accgggtcaa agtcgttttg tgtcacaaaa ctaaatacat 61920 gtacagagcc ggtaaattt a tgttatatgt tggattcgat cggttcagat atttaggacc 61980 cgaaacatat tcatagact t gaaaaatatt aaaacctaaa agaatatccg caaatattta 62040 aatatctgaa aatacagta a ttttatgtga aacccgatcc gaacacatga aatttgagca 62100 aaatatccaa aatatattt c taaaatttca aaattatact cgaaaaccca aacccaaaag 62160 ttgaaacaaa aaaattgta a tgccgaatgt atacccatga tacatgaaat gtttgatgta 62220 tacaattttt tggatattt c ggatatccga ttgaatctcg agtagtgtca agacccaaaa 62280 tgagacctgc agatgaaaa a aatacccaac atgtatttta ttatatacct gaatctgaac 62340 caaacatagg ttggaatga g tttgatttag gctggattgt acagtatgtg ggtcaactgg 62400 tcgacacggt tcatgcaaa c tgatagagag cggaagctat gtaacttcaa gatcaagggt 62960 ttgatcgaga agccaataa c gtatttttga agataacttc aaaaacggga taagagggcg 62520 cgaatactct tcgcagtgt t cgttaaaact ctttagggtt gcgaatactc ttcgcagtgc 62580 ttgtgaaagc tcttaagaa a atcaatatct ttattaattc aagtctgtct tacaaaagcc 62690 atagtagagt tctttatat a gaactcttaa accgtcatag aaattttaaa cctaaataga 62700
39/58 aaaggaaaaa cataaacctt aagt aaaaag gaaataacta gaaagaagga aacttgtcgt 62760 ttaagttatg atgctgctgc atca ggtcct cccggttgag aaggatttgc ccacgaatct 62820 ggatcatcat tgtcgccttt gaac ggagac aaatgcttga tgttgaagac gtcagacgta 62880 cgaaggtgtg aaggcaacct gava cgatac acattcggat tgatgcgttc caccacttcg 62990 actggaccaa gctttttaga cttc aattta ttgtaatcac gcaaggggag tcgttcttta 63000 gttaagtaca cccaaacgag atca cctggt tcgaagatca gctcacaacg cttggtgtct 63060 gctgcaagtt tgtatttagt cgta gccgat tccaaatgag actgcgcgag cttatggacg 63120 tcttgaaggt tggtaataaa gtca atggcc tctccatgaa ggcgagtttt gtctggtgca 63180 gtcgaaagat ccaacggacc acga ggaaca ataccataca caacacaaaa acggtgagaa 63290 acctgtactg cgattagtgg catg attgtg tgcaaactcc gcctgtccaa gcttagtgtc 63300 ccacgacttt atgttatctc ccac aagaca acgaagtaaa ttacccaaag aacggtttac 63360 aacctccgtt tgaccatcag tctg aggatg gtaagccaag ctcatgtcaa gagaagtacc 63920 tactaatttc cataacgaac gccg aaagtg actgagaaac cgtgtgtctc gatcggagac 63980 aataaatgcg ggagcgagag cgag agcgag ggcaggagca agggagggag cgggagcgag 63590 ggagcgggag cgagggagcg agggagggag ggaacgggag cgagggagcg agagagggag 63600 ggaacgggag cgagggagcg aggg cgaaag agcgagcgag ggagcgaggg cgagcgaggg 63660 agagatcgag ggagagagcg agcgagagag cgagatagcg agagcgagag agcgagagag 63720 cgacagagag agggcgggag agag aaagag ggagagagag agagagggag agagggagcg 63780 ggagcggggg agcgggagcg cgaggagcgg gagcgcgcgg agcgggagcg cgaggagcgg 63890 gagcgagagc gcgagggagg caggaacgga gggaacagga acgcgcggaa caaaaacagg 63900 ggaccgggag cgggagagag ggagggagca agggagggag cgagggaggg agcgagagcg 63960 agggagggag cgagagcgag agag cgagtg cgagagagcg agcgagggag caagggcgag 69020 cgagggagag atcgagggag agat cgagcg agagagcgag acagtgagag cgagatagcg 69080 agagcgagag cgagagagcg aggg cgagag cgagggcgag agagcgaggg cgagagagcg 69140 agggcgagag cgagcgagcg aggg cgagag cgagcgagag cgaggtagag agcgagagcg 69200 agggagagag cgagagcgag ggat agagcg agggcgagag cgagagcgag ggagagagcg 64260 agggagagag ggagagcggg agca ggagcg ggagcgggag cgggagcggg agcgggagcg 69320 agggagagag ggagagggag cgag ggagag agggagcgag ggagagaggg agtctttcca 64380 gcacaaggcg gccgntcgag catg aattnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 69440 nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnagcg 64500 tgagcgtgag ggagggaggg aggg agggag ggagggatgg agagagagag cgagagagag 69560 agagagaggg agcgagggag cgag agagag agagcgaggg agcgagggag agagcgaggg 64620 agcgagagat ggatcgagag agag ggagcg agagagcggg agagagagag gagggagcga 69680 gagagagaga gcgagagcgg ggg a gcgaga gcgggggagc gagagagaga gagagagagc 69790 gggggagcga gagcggggga gcga gagcgg gggagcgaga gcgggggagc gagcggggga 69800 gcgagcgggg gagcgagcga gcga gggagc gagagagaga gcgagcgaga gagagagcga 64860 gcgagagaga gagcgagcga gag a gagagc gagggagcga gagagagagc gagggagcga 64920 gagagagagc gagggagcga ggg a gagaga gagcgagtga gagagagagc gagggaacga 64980 gggagcgagg gagagagagc gag a gagaga gagcgaggga acgagagaga gagcgaagga 65090 gcgaaagaga gagcgaggga gcga gagaga gagagggaga cagagagagg gagagagaga 65100 gatcttataa caacctgatc aag a gtaata atagctggag agagaccgcc atgaacacaa 65160 aatatcttgt tttcaacaac agct gaaaga ctattgaaca cagaaaacta attatgaaga 65220 ttatattctc aaactgaaat tatt ttatat acatagcaaa aaaaatgttg aatagtccat 65280 agagatacca gattaatcca tac a cctaat ctgcattgtt cttagctcat gagatatctc 65340 aaccaccaac ccttgcataa tatt ttcaac gacatcagag actacacctt cagcttcacc 65400 accacaatcc aaccaaagac atg a tggctt tatcagatca gcctcaacga cctgatccaa 65460 tgcttttgga gagtcacagc aga g taaact ccagtcaaaa cgtctcaacg tctcatgtat 65520 cagatcttct tctctaaagg aag ctggtac attgacgact ctcgagctct gagacggctt 65580 gaaaggccaa aacttgatgt cttg acggta aatctcgcgg agaatttcgt ctgtgtagtc 65640 aagaacaaga agaagctggt cgtt gttgtg attaccgtgt gagaattcgt ctagtagtga 65700 tgtttcttcg ttgcatctcg cca t aagatt ggtccagttc agtcttgaag cttggagaag 65760 ttgcttcaca aactcgtgaa cag a gtcttt ctcgacaaga tcaaaagata acagtccaat 65820 ctgctcttct gcgcatgaaa agt a aagaga tagtgagact taagtgatta aaagatgaaa 65880 tcattgatcg atcagagata aga gactaac tgtttctgag gccaactgtt tcatctaaca 65940 tatgaatcct ctctagtaca gag a caggac tcggttgctc ttgttcctgt ctttttatac 66000 tcgactcctg caacgattta gag a aagaga ttaaaacatc aaatccgttg cagagagaca 66060 tctacggttt cttaaagaac gta cagctga tgagctctct agatatctat cttcctctag 66120 tccgtcttct acaggagctc tca ggcttgt gttctcactg agagacctta cattgtagct 66180 gtgcggattt ggatcgaaaa cct c caagtc ctccttgtcc aaggaccaca acttgaagct 66240 ctctcttctc ttctccagcc tct ctcttct ctctttgagt tttgtctgta agctactcag 66300 tgctttagga acttcataaa ccg gtgaaga atctgatctc tcctgttgcc tttccactgt 66360
40/58 gaacctcctt ggcgaaacat ccttctcaat gcttagcttg aagacatcag actcaacacg 66420 tttcttgcgc ctaaacactg gtgactccgg gcttctatag ccaactgcac tgctagaaac 66980 atcgccagaa gcctcggtgt ctttgttaga tccaacaaca agcttcaact tcttggttag 66590 atgtttgaat ctcaagtact ttctgtcgtc aaccaagctt ggtagtctag gcttcaagag 66600 aacgatctca tccaaatcat cagccagtga aggagattta tcacgccgtt ccttcacatg 66660 aggtctctcc aagtcttgac cttttttggc tgagaacgag ttaggatctt gtaagagtgt 66720 aatgaacaac tctttgttcg a gcttagaat atctaatgct tccatgaact gcttggaccg 66780 gtcttttcct ttctcctctg ccttggaact gatcaatgtt tcagcagctt cattcacaca 66890 aacttgaagg ttaatctctg agctcttctt tttacaatct ctcccattct tcagatccat 66900 ttgcttagcc ttctcaactt cactcaaaga agtttcctcc tttgcattct tgatcctctt 66960 tatctctctc tctagtaaac cctgaacagg ttttgattca tagctctcgt cttctctttc 67020 agaactaaag gatcttctcc t cgttttagg cttacatgag ttctctcctt ccacaatccg 67080 ctgaacatat caagagattc agttttctgc ttccaaaaaa agccaactca aaaaaactaa 67190 acaattttgt aaaaacttac atcatgacac tgacatctct catgaagtct cttgagcaaa 67200 tcaagttggc ttttagtata aacattacct gcaaacaaac aagaagcaaa attttaaaac 67260 taagatcatg aagtgatcca agaaacacac ttaacagtac tactaaccag cagagtctct 67320 gatgggtttc ttctgtgaac tcagtctctt attaccagat ttaacatgtc tgaaatcgaa 67380 gaagttaatc agtttccaac cacaaccaga cttgtaactc tcgtagacaa gagggctttt 67490 agggaaaatt ggagttccag gactcttgct gcttcttggt gatctccttt tctccattga 67500 ttatcaaata actcaaatca ttcaaatatc atgtctactt caatctagta aaaaaaaaaa 67560 cgattcccaa taacctgaaa cacacacaga aaccctgatc ttttagacaa aatatgaaaa 67620 ataccaacat aaacaaaaaa aaaacagagg attcttgaag ttgtgtccga aaattacatc 67680 ttcaggatac aaactgtcaa ttttactttc tgggtttcat ttttattccc tactctaaac 67790 cctaaactga gatttcagtt t cttcactaa aaaagccttc ctttagtgta ataatgtaat 67800 atgtacatgt atatatgcgc ttgtacagac ttatctatca gagatttgct taccactaag 67860 ctttgaggtt gaaatgggac agaaaaaaat gcaaactttt tctttataca gtcagtggag 67920 ccaatcaagc actgagcttt gtcatggact gatgaacttt ttttaagagt taaaaaaacc 67980 gcaaattttg tttccacata caaaagaaaa agggctaaaa catgattgag gttgaagatc 68040 ttttgcgaaa attaaaggga cccttgtctc ttcctctacc cttctaatta aaaaaaagga 68100 tatttttctg tattcaagaa aaattgtaag gacaataagt gaggattact gtttattctt 68160 ggagatgggt cctctcacca ttaaagaggc ttttagtctc gtcctggaga aggagggaga 68220 ggaggaggaa gatgaagtaa gactctttat aaaataagat atatgattgg aagagaaatg 68280 taaataatca aaagaccaat t gaaaataga tctttattag accatctgac atttttattt 68340 tgttttcttt ttaacaggca agcagacatt ttcttgacag tgggattttt atttatttct 68400 agtaaaaatt tacaactacg tttttaatta gcaaaataaa taagcgaaaa tgaagggcag 68460 gagagggacg tgagaatgaa agagactgta attttgcaga tcgtttcaca tataagacaa 68520 tgctttcaaa taaagctttt atttctgtca tcttcttatc tacaaatgca tgggggaata 68580 ggatattcat gcatcaattt agctaaaatt agataattag tatttgaact cagaaatcat 68640 tcaaacctaa taatttagct cgattatttc taaacttaga tattcaaatt tcaaaattat 68700 gatatatatc ttgatgaagt t aaataatga gttggatgct aaactaatta caacatcatg 68760 caatatatat aactgaggca atagagatct tatatctgat gtgttagttg aactagcatg 68820 tcattcatca ttgaactttg tcaacagaga tattaacctt agtaaatttt gaatatgtaa 68880 ttaaaaaaaa ttgaattgac gtgtatgttt gcacataatt tagccttaag aattaattgt 68940 tgtatttgaa ataagttgag atatgaataa atcattctcc ctataaatgt gttttgtgtg 69000 tggacaagac ttggattgaa gacttggatt caccctctat ggtaaacttt taaatttgcc 69060 atctcactaa taaccaatca aagtgtcaac tagattaata attaaaaaat attaaataac 69120 taaccaaaat agttagaaaa ataaatagtg tcaattttaa taatgctaat gtctctatcc 69180 aatccataaa ctcaaactct aaaccctaaa ttctaaatta taaatccaaa ttctatatca 69290 taaatccaaa tattaaactc taaacccaaa ttttaaatct taaacccaaa ccataaatca 69300 taaacccaaa cctataacct aaacccaaac ctatacccta aacccaaaac ataaatacaa 69360 aacccaaacc ctatactcta aatatttgga ttaatattga tgttgttctt ttgaaattta 69420 aggttaagaa ttaaagtttg ggttacggtc tatagggttt gggttacggt ctagggtttg 69480 gatttagggt ctacggtttg ggtttagagt ttatggtttg agtttagagt ctaggatttg 69540 ggtttagggt ctagtgtttg agtttagggt atagttttgg gtttagattt agattttttg 69600 gtttataatt tatggtttgg gtttatggtt taaaatttga gtttagggta tagagtttga 69660 gtttataatt taaaatttag agtttggaat ttggatttag gtcatagagt ttgagtttaa 69720 ggattaaatt gtgatattag cattattaaa tatgacatta tttatttttt aattaacaaa 69780 tattaattta gttggcattt tgattggtca ttaggaaagt ggtgaattta aagattcaac 69840 atagggggtg aacccaattt ttatctttta tgtgtgtgaa tgtttgatga aacatataca 69900 ttacagagtt gaaaaaaaag aaacatatac attacagatt acagtaggtt tatgtggtta 69960 aaacattgat ttatcactgt gcgtaaaagg tctgtcacaa aagtgtacct tttctttttg 70020
41/58 gctcaaactt ttcctttctt t ttatcggaa atataaccgt tagaatagaa ctcaagtaaa 70080 tgaaataagt agtacatctg c ttttaatgt ttgttattat tttagtccta ggcctcggca 70190 tttcggtatc ggttcgattc a gatatttcg aattttaggt agttcggata gaaggttaga 70200 ggattcactg agtacttaac t tcttttcga ttcggtttag ttcggatagt ttggggttcg 70260 gttcgatagt aaaactagaa a ccaaaaagt acccgaaata attttggttc tcatttggtt 70320 ccagttcgga ttcggatagc t cggataaat attagttatt taggataaaa tatcaaataa 70380 ttatgatgat ttaaataaaa t gttagaata ttttggatta ttttggatat ttcggataaa 70440 attatccgga tacttttggt t aatttggat atttcggaca ttttataata atgtagttat 70500 cttcaaatat ttttgaattc t tttaagaaa ttttttaatt ataaatatat atatatatac 70560 atttagttat gttatatgta t atataatta atatttttat atatttgggt atccgctcga 70620 ttctcggttc ggttccggtt cggttatttc ggatatagaa atatagacac catacggata 70680 tttgaaggtc ctcggttcgg t tcgggtccg gatatttcgg tgcggttctt cggttccggt 70740 ttttttgtcc aagcctagtt a gtccttctt gaacatttac caattactag ttccaagtac 70800 aaaaatgaat atagtttaat t ttcttcaca cactaatctt gttaactagt aacgtaaaga 70860 ctcttatact tcccatctat g tcatattac gtgttgacac atgcacattt aatacgtgtg 70926 tatacattta tatatcaaca a gttaatgtg tatatttcaa tagtatatat ttatagactg 70980 gtgaacaaaa taatataatc t atagagcag ccgatcccaa tactgcatgt tctttcttct 71090 tttctttttt catattttgc t atcgcgtct atccgtctat ggttggttat cttacaagta 71100 tctttttaga aattâttata t caaactacg cttattcttc agatgataaa cgaggaaata 71160 aaatacactg gaatatatta ctaacacaat agtacaaaaa atgaccacgt acttgtttta 71220 gtagttatat tccaaatgcc a atgcatgtt cacgaagaat ctggcaactt tatttagtcc 71280 taatgagtta tgtgcgtgaa t gaataaatc attatgagat ctacaattct acatgcgttt 71390 tttgtatgat caaatattat a ttatatgaa aaatagacac caaatattta tacatataat 71400 ttatataggt ttcaattttt t aactatgac ttgttaattg ttattgtcgt agttgagatg 71960 gtgacaacga ctgttttgga cttttaattc accattcacg aacttttgta attatcgttt 71520 ttgcatagaa caaagcattg g tcttttcaa atgcgtgtat tttactgcta tcggagttgt 71580 atatcaataa tgttttttat gaaaaatata tttaaataaa actatacatc attgaaaatg 71640 ttattatttt tctttactat c agtcagttt cttatttgct tatttattct gttatttcac 71700 tagtgacaaa ttcaagtctt t tgcaaacgt gtaagtttag cttaagtctt tttttaagtc 71760 taagtcaatt aagaattata a cttatgtat tatgttagta caatctaatc gtattttata 71820 aaaatggtgt ataccattaa t atgattggt tgactagtaa cggtatacgc gtggttgtcc 71880 acttatctta agctactaaa a aaagttatt aataatcaaa ttcatctaac tttacaccaa 71990 agtttctctc cgccgtccaa t agaatatta ctatttatgc caagttgtca taatacatac 72000 atatgatata ttacaatcgt t tgtcaattg tcatacacgt aaattcagta gacgaactat 72060 tttagatagt gtgccgacaa a ggtatcacg acgtattaca tcttctcatc atttacttta 72120 tttttgtaat atcaaaacac gaaaaaatcg accaatattt ccaacttccc caaatataca 72180 agcaagacaa atgcactttt t agaataaga aactcatgca gtcatgtgaa gcaaagttga 72240 atgcagaata tgaagtttac c aagcaatta attaagatgt tatcatacaa taagttacat 72300 gttagacaca atataagctc t aaattctta aggaaactgg agcactgttt atatatatat 72360 atatatatat atatatatat a tatatatat atatatatat acagtattgc ctaattaatg 72420 agagtttctc attctataaa c taatacagt agaacctcta taaattaata atctataaat 72480 taataatctc tataaattaa t aaattttag cggttccaag ttgggccggt gttaaatata 72540 acacaaatcg ataaaataat a agataataa tatttttaaa atttctatgt aaatatatag 72600 tctccttaaa atcataaatt a ataatttat ctatatataa ttttatataa gttaaatatt 72660 atattgttgg ttttatattc a caatgaaaa ttctttactt ttcttaacat ttcaatatat 72720 tttgataaca tttagtaaaa t tataccaaa aacaacttaa caattctatg aaacataaaa 72780 ttatacataa aataagataa t aaaacaata ttgaagtcaa gtttataaaa tttaaataat 72890 gtacatacgg taaaataaaa t attttcttt tttatataaa taaaaataga aaaatagaaa 72900 aaatctaaat aaagaaactt t tgtaaatta atatctctat aaattaataa aatttcaaag 72960 tcccaacatt attatttata gaggttttac tgtataatgt tatattacga tataatatgt 73020 caagattacc aatcttgaca t attatatag taatatgtta attaatcaaa ctacattgct 73080 tataaaaaca ccaacgtatt a accatatct tgtaacacgt attatctaaa gactgtgaca 73140 tggttgagtt ttagttttat t aatattgtg aatggcagtc gcatgtagta atgtacacga 73200 tacccacgtt aattaagtca t ttcttggta ttttatgata cattaagaaa acagtagtta 73260 tattacttat gtacatttag catgtgtacc tcacgtgtta tgaaatgagc cgggtaaatg 73320 aagaaacgag gctcaagtgg a aaagggacc acaaagggtg ttatgtatta aaccaactca 73380 actgtaaatg gcggtggtcg t ttcaaatta aagtggccat gtgattttat tttgttccgt 73490 cagtgaccaa gatactggac ctggttaaca taagaagaat caaatagaac tctttcaata 73500 tactagaact taaaaagaaa t acaaactag acttcattgc aatgttgatt tgtggctggt 73560 gcttgttctg tttagtttga a catctacag ctaatagaaa ggtgtctatc attgctcaaa 73620 gtgttacaaa aaagttttgg a tgcagttat atatatgtag ctaccggtga ccattttagc 73680
42/58 tgctgccttc tttgaccatg agagggggat attgaaggga accgacccat tttttcgtac 73740 catcagtaca agtctggttc gacttcctcg attagattta ggccgttttc caatttttct 73800 atattttaaa ttatttccga gttttagttc attctcacac aagtcaaaca accataatac 73860 gatttgaata gataatcaga gattcgagct aataagcgag tttgttataa gctattacat 73920 gttaaacccg ttctctatct acccaaatcc accatctttt cttcttgcct taatcccgcg 73980 attcaattat gtctttacct ttcttgcatt tgtaactaaa tcttttattt aagtttgtaa 74040 acttttatta aaaattaaga ttgaaatcaa acctttattt ttgttatata tttgagatcc 79100 atatattgta ctgttttata atcacatata taattcttea ataataatat aattataagt 74160 accaatttga ttttaataaa atttaaatta gtaataaagt ttcaacaacc aaattttcta 74220 aatcgataat tctacagcca aaacataaag tgaaaaatct tacctgtcaa acccaaatta 74280 aaacaatagt caaagtcttg tcttaaacaa tcagagccta aatcatttgt aatcttactc 79390 tattttttat tattttataa tatagtaaaa attagattac tataatgaaa tactatttat 79400 tttttactca ttactctagt ttttttactt taaaacaaaa taaagttata gtaaaattct 79960 aacaccttta taatttgtaa aaccaaaata atattttaca caagaggtgc tctggtacga 79520 aggtcttttc agagtgttgg atagtttttc tgcttgtgct caagcgtctg tgcagcaaca 79580 tggtctgttc tgcgtccttc gggatatgcc tctctacttg ggcatgtcgt tttatcctac 79640 ccaatggttt catttggtcg gtgtctatgt ttggttctag tgctctactt atatttttga 74700 gatccttaca tcgggtgtaa tattcgagta aggttagttc atgcatgcaa acccaatcgt 79760 ggactagagc agtggattag tcggatcagt gttctcgtgg cttcggtaaa ttgtgaacaa 74820 tatattaaga aactttatga tccctaatct cttgttttag taatgttaag tggctgaagt 74880 gaagtctttc aactgacatc atttgttgct aattcatcct agttagtagt ttgttgccgt 74940 atctttctgg tctcgttgtt tagatagtcc gtagtaatcg cgtatagttc ttttgttcag 75000 gtttttgtct cttgaatgtt ctttccgcca actttctggc tttgtctttc taactttgcc 75060 gattttctat tgtaactcat gttttatttc ttcaataaac aaccaaagtt gtagtagtcc 75120 agtgataatt tttttggagc tcagcgtgta tccatatttg ttctgagttt gatacttgtt 75180 ggaaactaag tatcactgct tagccagcca gtgtttgggt ttcgaccaaa gtatcactgt 75240 ttagccagtg agtgtttggg tttcgaccaa aatgatttac aattggtcta tccctaacaa 75300 taaggaatgg gcacaaacca aatacttgct gattttcaaa tgcttgatac ttggcttggt 75360 tcgttcaaat aatcatattc acgatttgga atttacttgt ttaaaacaaa gtacttacta 75420 tatcaagtac ttaagagaaa aatagtactt gcaagttact tgatccgatt tattgttaaa 75480 atcaagtact tgttttaaaa ctatttatta cttcaaaact gtaagtaacc aaaaaaaaat 75540 cttatactcc ctctgttttt caatatatga tgtttttatt gaatgcacaa agattaagaa 75600 atttacattc ttgtaaaaag aattttaaaa tatatgattt taaaatcatt caatcaatta 75660 taaaattttt attggttgaa cagttttcaa taaaataaaa ttttacctta aaacctcaaa 75720 atattatata ttttgaaaca acataacact tctaaaacat catataattt gaaacggagg 75780 gagtaaaaaa taactagacg aattttgcta tcttttttta atcaaaaaac ttattttatc 75840 aaatctaata tgtttatctg atttttgtta caataaaaga caatatattt ttaatagata 75900 attaaaaatt ctagaaacaa gtagcgaata atatgtaaac aataagtata taacaagtta 75960 tacggcttat tatccgattt aacaatgtca aatacttgat ttttaaagcg aaacaagaca 76020 aacaagccaa gtaaaaagaa tcatggctca catagttttt aaatttaagt ggattaaggt 76080 tttgaaactg taaaaactta tgccaatgtt gattaaacaa aaagatatat ttaggaacga 76140 gtaacaaatc caaacaagtc gattaacttt ttttttaaag acttgaaatt tggtttgtat 76200 ttgcaagttt tttatttgaa gtatttgtta cttgaccatc actgcgaata cttgatttta 76260 cggagaaagt acaagacgag ttgcgagtaa aaggcgaatt tccagtattt gtgcctagtt 76320 atacttaaca tcagttggaa agtactccaa acctaactaa acagcgtagt gacagcttcg 76380 cactaaatcc attttttaca ataagtacat tccgactaga ataggaatcg accggatagt 76440 gaaaatgaaa aaaaaaaaga aaagaaatct ccaataaatt cctaagatga caagatacag 76500 gaatcaaatc aacctattat ctgttaccat tttaagtggg ctattttggt gggcttggtc 76560 attattacgc caaacccacc tcgtatcact aacactcgaa acgcaccgta ttgtcgtttg 76620 gcaacaaaaa aaaactctta tccccttcga aaaacctttc ttcatcacac tccctctcct 76680 gtctctccaa tggccttcac tttcttctct cctcaccccg tcttcctctc tctaggtcga 76740 accacctctt ccttctcctc ctacaaaccg gcatactcac cattctcccg aaatccccgt 76800 aataatcttc agttagcggc gggccccacc cgtcgtagct cttacccgaa cccggcggat 76860 gacgacccgc ccgaagcccc ggaggattcg atgcacggcg tctccaagtt tcagcagata 76920 cagcgccaag ccgctcgagc gcggaagctg gaggaagaag acttcgagaa gaaccgaaac 76980 acgtacctct cggccatcgc tgacgtggaa gacgcgcccg agacgggacg cgatgacgtg 77040 gagtctggag gcgatctgtt ctcggacatc gatagagcca tctcaatgaa acgtagcgag 77100 ttcgttaaaa aaggactgct ccaacctaac cctcccaaaa cggcgtcgtc taagaagatc 77160 gacgaggaag aagaagaaga cgacgctgtt gatgagcttg acgaagaaga agctgtggat 77220 ttagacgaga tcgataaact gactggatta accgaagctt ccgacgaaga agactgggtc 77280 gacgaggaag ggaaccctag gatcatcagc aagaagaagg agcatcaatt cgagttcgat 77340
43/58 ttggatgatt tcggcgaatc caaggcgaga atcgtggagc ctaagttcag actgagctta 77400 gccgagctct tggacgagag caaagtggtg ccgatctcag tctacggcga cttagacgtc 77460 gagatcaccg gaatccagca cgattcgcga ggcgtaagcg ccggagatct cttcgtgtgc 77520 tgcgacggag gagacgactc cgtcctgagc gaagctgaca agagaggagc ggtggcggtt 77580 gtggctagca aagag atcga tattgaagat acgttaggct gtagagcgct cgtcatcgtc 77690 gaagacaccg aagca gtctt ggctgcgtta gcttcttcgt tttataggca tccgtcgaag 77700 gacatggcgg ttatcggagt cacggggact aacgggaaga cgaccaccac gtatttgatt 77760 aaaagcctct atgaa gctat gggtgtgaga acaggaatgt tcagcagtgt ttcttgttac 77820 gtccatggag ataacaagat ggattcaacg acgacgagtc ctgatgctgt tttggttcag 77880 agtatgatgg cgaag atgtt gcataatgga accgaagctc tggttatgga agcttctcct 77940 caagaactcg cttcagggaa atgcgacgaa gttgatttcg acattgcggt cttcacgaat 78000 ttagccagag aggat agtgg ctttcgcggt actgatgagg agtatagaga tgctgaagcc 78060 aagttgtttg caaga atggt cgacccggaa agacacagga aagtggttaa cattgacgat 78120 ccaaacgcag cgtttttcgt ccagcaaggg aaccctgatg ttcctgttgt gacgtttgca 78180 atggagaaca cgaaa gcgga tgttcacccg ttgaagtttg agctgtcttt gtttgagaca 78290 caggttttgc tcaat acacc tcagggtata ctggaaattt cgtctggttt gttaggacgg 78300 cataacattt ataacattct tgctgctgtt gctgtcggga tagctgtcgg agctcctctt 78360 gaggatattg ttaga ggtgt tgaggaagtc gatgctgtcc cggggaggtg tgagttgatt 78420 gatgaggaac aagcttttgg tgttattgtg gatcatgcta acacacctga tggtttgtca 78480 aggctgcttg attcggttcg agagcttaag ccaagaagaa tcattactgg tatatacatc 78590 ttacgtctat ttaat ccata tccactagtt cttatggtgt ttatatgtat tgtcgtctga 78600 tttgttaaag ttatt ggctg tgcgggtgag actgagagag ggaaacgacc ggttatgacg 78660 aaaatcgcaa ctgaa aagag tgatgtgacg atgttgacat ctgataatcc ggggaatgaa 78720 gatccatgtg agtaa atctg agattagctc gagtctataa cccttgatgt gtaacaggta 78780 gaaaactctt taaat gtgat ttcagtggac atattggatg acatgttggc tgggattgga 78890 tggacgatgc aagagtatct gaaacacgga gaacatgatt actatcctcc attggcaaat 78900 ggtcatagac tcttc cttca cgacattaga cgtgtagctg tgcgttgtgc tgttgcgatg 78960 ggtgaagaag gtgacatggt tgtaagtatt taaataaacc cattctctgt acaccttttt 79020 tactttccct ggtgt gttat taaggttgct ggattgaaat tctttaaagt aatctcagct 79080 tctaagttac attat gcaat ggtgtttctt gacactgatt tactttcttt gcaggtggta 79190 gcagggaaag gccac gaagc gtatcagctt gaaggtgata agaaagagtt ctatgatgat 79200 cgagaggaat gtcgg gaagc attacaatac gttgatgagc ttcatcaagc tggaatagac 79260 acaagcgagt tcccatggag gtaagtagaa gagaaacagc ctcttttgcc aaatgattaa 79320 acagagattc tgatc tgtga gagttactga aacatgtcaa gatgcttcct ctgatcacac 79380 taaatgttct ttcct cgtat tgctctgctt ttgcaggtta ccagagagtc attaatatct 79990 ctctatggtg agatc attaa accatgaatc agatttactt ccaccgccaa gatagatttg 79500 cagagagctc atgaa ttctg tacgagagac ttggaggtgt ttaacaaccc tttgtgagtc 79560 atcaggtaag tgtag gggag agaagagatt ctaaaggtgg aggaagatgt gtacaaattt 79620 ttgttagtgg ttgtt gcgtt tgtctgtgtt gagggtttaa gatatggcag gtgttttttt 79680 taataataag ccttc attgg ctcgaaatta aattggatga gaacataaaa caaaatcaac 79740 acaaatgagt aggac atacc acacactgca atgagaagga ataaggcaac tccatactaa 79800 ttagcaagac ctaac caaaa gaaaacccta tggcgaatat ggaaggatgg tggttgttgt 79860 ttcaaggtag aggactaagg agttgcagaa ggaggttctg attgcaagag ggaagatgga 79920 gctacgaaaa gaagc aaggt catagccgaa cggagttgga tgtgaattca gtgttaaccg 79980 aaattggatg tggaa tcatt gttaaccgga gttcgagctg gagagagtgc agctttcttt 80040 tttttaacca cgagctggag agagtgcagc tttctctgct cgttttcttc tttgcttttt 80100 ctgtttttaa aaatt tgatg aaatcacaga acaagtgata aaaaaaaatc tatgaaactg 80160 ttgttaattg tagca ataag aatcaataga gaagcgtagc tacaataatc ataaccgatg 80220 gaattcacct acaaa ataaa atcaacaagg ccttgtaaat ttggaaaaga aaagtgtctt 80280 tcattctttc attca tcctc caactgatac cctgcaaaac aaacacacca aaccattcat 80390 ttaagaaagt ttccctgatg ctacagcata agctgcagct cttctccaaa attataaagg 80400 taagcaaaga aattt gaaaa caaaatgtgt tgaatgacat acccacactc atctgcagat 80460 cctcaagcat tgcca ctgcc ctttctagtt cctctttact ccaaaaacca gtcagcatat 80520 tgcggatagt aatggtatca ggatacacac cacttgaaat catctcctgg aaaatgtcta 80580 gagccccatt aatat taccc actttacgaa aaccataaat caaagtgatg taaataattg 80640 catcagcaac tatcc ctctt cgacccatct cgcagaaaag ctccagccca tcatcaaccc 80700 ttcctgcctt acagt agcca ttaatgagtg tgttaaatgt cactacgttg ggagagaagc 80760 tcttgctacc catcgaaaca aacatttgtg tagcctcatc taggcggctc tgcttgcata 80820 gtccatcgat cattgagcta taggtgatag tatctgggac tatacctctg tgtggcatct 80880 cctcgtataa ttcct cggcc tctaaaaact tcccttcatt gatcaagccg cagatcaata 80940 tattgtaagt tagaacatca ggttccacac cattgaaggg gtgactagca tcaagatcca 81000
44/58 tcttactctt ctgcatagcc ttaaacattt ccaatgcatc ttttagtttc ccattatcgc 81060 agagaccgtc cagcaa agtg ttacaagtaa cgatatcagg gcacacacca ctagaaatca 81120 tctgctgtga aaggtc taga gcagcattaa gatcgcccae cagacagaac ccgtgaataa 81180 gagtgttgta agtaact gtg ttagcaacta atcctcttct aggcatctca tggagaagtt 81240 ccattccatc atctatcctc ttagccccac aatatccgtc tatgagagta gtgaaagtga 81300 atacgtccgg agagca g ccc ttggtagcca tcaaataaaa catgtcctca gcagcatcaa 81360 gacgatcctg tttgca a aac ccatcgatca ttgaattata tgtgattgta ttaggaatga 81420 taccccttgg aagcatctca tcgtataatt ctgcagcctc gaagaacttg ccttccttga 81480 caaatgcatt gatcaa agca ttataagtta caacattagg gctgatcttc ctttctaaca 81540 tttcttgcaa caaccg ctgg gctgcactcc atctaccaga gatgcaaaat ccaccgatca 81600 tacagttgta ggtaac rata tttggaaaga ttcccttgtc ttgcatttca atgaaaagat 81660 tatgagaatc gctatg gcgt ccatctttac aaaggccatc aatgatggca ctatagataa 81720 ccacattggg tttgat gtgg cttatctcct ccatcttcct cagaagattc aatgcagaca 81780 cagtgtcgcc catctt acac atcccatcta caaatgttcc gtaagtaatc tggtcaggct 81890 ggagaccatt ttccac catc cgatcaagca gagctacggc ttcgacaact cgaccctcgc 81900 ggcaaagacc attcat cagc gtggtgaacg ttaggacatc tggtctacaa atttgatgaa 81960 acaaatccaa ggcttc agaa accctgtgat caagacataa tccgtggagc agggtggtga 82020 aggtaacaac atcagg gtgg agtccaagct tggtgagctt accaaatgta gacaaagcaa 82080 aggggagctt agagca actg cagaaacatt ttatcagaat ggtgaagctg tatatatcac 82140 atcgaatctg tttcct ttcc atcttttgat agagagaaat cacaagatcc gggcgttcca 82200 ttctcaccac cgcacc catt agcttgttga aatcaatcac agaaggtaaa ggacgagatc 82260 gaagcatgtc actgaa caaa tcaatcgcat cctctaaccc tttgatttca taagatccac 82320 ttcgcagttt caaact ctct cctctaaaac ctgcttcgcc actctctcca tccctgcttt 82380 tctcggccag agcatg acga atcgatcccg tacagaaaaa tctagccgca gacacagaag 82440 acgaagagga agactc gaat ctgcaaaccc tagccaacat ttcgcctgag attaccaaga 82500 agccaacgac gagtga gtga ggagtggtca agtcgtgaac tttttggctt gagcgactat 82560 aaccaaatca ctgatt tgaa atcagaaaac aatgaccgtg tcaattcggt tggttaaata 82620 atcggttcaa attgat ttta cactgaccgg ttcaactcct gttgccaaaa cggtttaatc 82680 aaagttggtt cacttg ggat gaaccgggaa aagtgcctat tccaacctga acaatttgga 82790 tcgtgccaaa tacaac ccga actaatggtt agtgccaaat acgacctgaa ctcaattaaa 82800 actttaaaaa cctacc cgaa ctttttaaaa cgtgcataaa tctacattga aatattatta 82860 aaaagttgaa attaca taaa ttattatttt ttcatcgtat taaattttaa aactttggtg 82920 ataatttttt ctgatt tata taaatacata acatgttttt acttattata tcttcaataa 82980 acttgtatat tactaa aata taaataataa aatatttata attaaattat cttagatata 83040 cttaaaattt taaagt tatt tataaataaa aaatgtatag attattttta ttttttaaac 83100 ttaagtgaat tttttt tcaa atttattatt atatatttta atattttgtt caaaattttt 83160 gaagttattt atattt tgaa ccttttacct ttcaaaattg aacaaaatat taaaatatat 83220 aataataact tttgaa aaaa atcacttaag ttttaaaaat aaaaataatc tatacaagaa 83280 atttttataa ataact tcaa aattttaagt atatttgaga tcatgtaatt ataaatattt 83340 tattatttat atttta gtaa gatataagtt tattgaagat ataataagta aaaacatgtt 83400 atatatttat ataaat taga aaaaattatc accaaagttt taaaatttaa tacgatgaaa 83460 aaatagtagt ttatgt aatt tcaacttttt aataatattt caatgtagat ttatgcacat 83520 tttaaaaagt tcgggt aggt ttttaaagtt ttaattgagt tcaggtcgta tttggcacta 83580 accattagtt cgggtt gtat ttggcacgat ccaaattgtt caggttggaa taaacacttt 83640 tcccgggatg aacctt ggcc agaatcaacc tcgtacccgg tcttactcaa ctcttttagg 83700 taactaacca tttcta gaat cagaataaaa ttggataaaa acctaattat tcatcaggga 83760 attacacaag ataaaa atgg ataattagtt ctttactttg taactaaatt ttaacccgcc 83820 ctttgatggc gggtaa tttt tgttttaatt tttttttgag atttttgttt tatgtttttg 83880 taattatatt tgtaat tatt aatttagttt gatataattt tggtgactat attaaatatg 83940 tcaagtacgt aactat atac ttgtactata tgcatttcaa agattatttt aaactttatt 84000 tctaaagttt acaaca tatt atatttttta gtagctacta aatataatta gtcaaaaata 84060 ttcgtataaa aaaaat ctga cttggaatcg atccgaaaat taaagtttta tattcagtgt 84120 tttgaaaccc gaccca gatc caagattgaa ccggtaaatc cggtgatcca agataaatca 84180 gatttaggtt ttataa aaaa taatatttta aaagtcaaaa atcactaaaa cttggaaccc 84240 gattagtgac taatag ataa cttctacttt ttattttagt ttttaattat gtttttaaaa 84300 tctgttttgt ataact ttta gtaaataaat taggtttttt aatttttcta tcgaccattt 84360 attaataata ttttaa tttt attagaaata gaatatattt tgtataatgt attgttggta 84420 tattttgagg tttttc tatt ttgtgggtgc attggtttta cgatttataa attatatatg 84480 catattcttt catttg gttg atgtaatcgt agatggagta gatttttttt tttccgtcaa 84540 gattttatat taaata aagg ccagagccca aaagcttaca accaaacgag cccgctaact 84600 tcgggcccaa attaca atcc gaaacgggcc tacagcccaa acaaaccaaa accctagcgc 84660
45/58 tacggaatgc tcgggatgtc agccgccgcg tagatctaac cttgggagaa tcaagatacg 84720 tgttcacatc ctcgtcctcg agagacacgc gtcacgcagg ccagcacacc accaccgctt 84780 cacgctacca ccggggaacc acacctcagt tcaccggaac ccaaccggag ctcacaaact 84840 ccacacatcc tcatcgcgaa cactttttcg atctaggatg gctctaatcg gagagagcat 84900 caatcgtcgc tacgagatct catcccccgt agtttatcgc acacacccta gagaacgctt 84960 cacatgcatc accaaccttc ccgccggaga ccttcaccct cctccgacga gaccacggtc 85020 aaccaaaccc aaacgaacca caaagagaag aaaagaaaaa aaaaaaaacc taaaccctaa 85080 taaactagga gccgaaagcc ggcggcgcaa gacagtggag atcatcacac cccggagact 85140 agaaccgatg acggtggaac cgaagaggct tccccgtcgc ggatacgaag gccggcgtcg 85200 atggagctaa ggtagcctcc atctcccaga agtagaccca aacaaaagat gtcttcaccg 85260 cgccatcaac ccaccaccgc gtcgttgctc caagaacaga accaccgctg aggtggctgg 85320 ccagagttcg gacaaagcag atgccggagg agatagagag gaaaaacatc agactaaatt 85380 ttagcttaaa gaaaacagac accgacggcg gcacggacgc taacgcaccg accgaccgcc 85940 gggtccaaac cacgattcac tttttctctc ttttctttct cttctctctc caaaccacga 85500 ttcacttttt tgtgccttgt tctagatgga gtagattaag ttgttgtatt tttaatgtag 85560 gttctgacta atattagttg aattagttag tatataatta ggggaaataa atataattat 85620 aggaagcaca aaaagtaata tgccaaggaa aatcaaaggt aaatctataa aaggtattct 85680 gatttaatta tattgatagt ataagaatcg atactaaata ccggtttaca agcaacaata 85740 cgcttttagt tcgtttcttt ggcaagaaca gaatcaaagc gttgtgagaa caatcagcaa 85800 cttttgatga tggctatact gcagcttttc caacactttt ggttccataa atatgtctca 85860 tatgaacttg aagttaagtg ctttctcaag aaacacgctt cttcagtgcc tccccaataa 85920 tcacagtcca cagatcagat cagggtctgc aacccatgtt taatattgtt ggacatcagg 85980 gcataagctt ccttgtcaca acctgaaaac acactcgaat caatgatttg aaatagccaa 86040 attaaataga gaacgttaag gattataacc aatggagtta agaacttaag atcactactg 86100 atgatttaga caaaagaaag gacagaccct ggatttcaaa taaaccgaac agagcttcag 86160 taacgccata tgcaaccaat agagaaacaa cacaccaatt ttctgtcatt ttcctttttc 86220 agatataact aaaactagac acatagaaag ttttaagatg tccactctag tagccgtgtg 86280 aaaatactag taagcttaag gtataataag tatgagagct tttcaccact ctaacaagtt 86390 atatcgctgt tctgattgtg ataaagttat tgctaccccc aacaaaaaaa ccgagacgtt 86400 cttactcaaa taatggctgt attatcttct ttttgcaatt tcactcttaa ctctccctgc 86460 taccatgaaa ccgcatggat ctgcattgtc aatctaaaca ccatgacgac ctcaaaatca 86520 cagccacgca aaaacaaaga cgggttcaca aattacaaac caactgattc tagtaacgag 86580 aaatga~gga cagcacaatg gagtttcaaa tgcttgcagc aatcatatta atctcaatgc 86640 actttggatt gtcacatgtt gggcatctca gttacccatc tacacgttga tcaacaagag 86700 cagtttttct gtttgctaag aaatcaacga gagcagttta gtcccagctc taatacaata 86760 atcccaatac gttaacgtgt tcattatcca ctaaaaactg aaattcataa aatacacaat 86820 tgtatatatc atccgggatg attcatcccc aaaactccga ctctaatact aaaacaggat 86880 aagcaagacc acctaatcta aatattaaga aggaaaaaca aatcagaatc tagaatcgca 86990 gggaaataac acagacccta tttgcctatt ctcatagctt catcataagc atcatataca 87000 tatatattca aatgcgatga ttacacaggt tgtcacaaga aaagcattga agtattgttc 87060 tcacttactt taactcagtt ttcgtcacct tacacaatgc aatgttgact ctttctttga 87120 tccaaccact gggagtaatc tcttaaaaaa gttagaccaa gcactgaaaa caattagaat 87180 ataacatttg catctcctca cccagagaga tgacaacaca aatacttctt catcttggac 87240 attgtgtgat gtttgagaga gagatgcaaa acggtggggt tccggtttat aagtcggagc 87300 caaaccgttt tagtatcgat ttttagttca tatgatcaat ctctactctc taaccggttt 87360 tactatcaag aaagaaaaaa gagaagctta tagagtttgt atttctcgtc tctggtttct 87420 ttgttgatta acaaaagctt aagcaataat agaatgaatc tgcaagttta ttctacgtat 87480 ggtaaattga tttcatagca atttggagat aaagaatgaa gctaagcaag tcaagaggcg 87540 aaccagagaa gcataagcga caacaacatt tccaccaaga ttaaaagaac atgatctcct 87600 cctgaaccca catgggagca gacaaggcag gacagagcca atatgaagaa gaggaggaag 87660 atggcatcac agctatcagc tctcatgaag accgagcttg acgataacca tggtgacagc $7720 tacagaacgg gcagacacct aaacatcttt taacacctga aatcttctgg aaggtgtgcc 87780 tctttagttc agaccaataa tcttgcgtga aacaagtgta tggaatttaa ttggaaatgg 87840 tcaaatttat taagcccaga caatagacgc ataaaaggct gtcattagaa tagcagcaaa 87900 ataacttact aaccacacaa tttttcacta tgatcactct attcaacgat ttgatcaaac 87960 attagtaggg tatacatgca gcagcagaaa caaaatgaca ttgaagctct gctgcgcaaa 88020 cagaagaaaa t ctttgatca ttcatccccc aaatgataga tcctacaatg caaaaccaaa 88080 ccaatggtta attccagaac gtgtatcatc aatctgaagc tacacacaaa agaatgtata 88140 cattcttgtt tatataaaaa atacatagac tgaacagaaa cttacatacc atactcatct 88200 gcagtttctc aagcattgcc actgcccttt ttagttcctc tttactccat aaaccagtca 88260 gcatattgcg gatggtaatg gtatcaggat acacaccact tgaaatcatc tcctggaaaa 88320
46/58 tgtctagag c cccattaata ttacccactt tacgaaaacc acaaatcaaa gtgatgtaag 88380 taattgcgt t agcaactatc cctcttcgac ccatctcgca gaaaagctcc agcccatcat 88940 caacccttc c tgccttacag tagccattaa tgagtgtagt aaaggtcact acgtttggag 88500 agaagctct t gctacccatc gaatcaaaca tttgtgtagc ctcatctagg cggctctgct 88560 tgcataatc c atcgatcatt gagctatagg tgatagtatc tgggactata cccctgtggg 88620 gcatctcct c gtataattcc tcggcctcta aaaacttccc ttcattgatc aagccgctga 88680 tcaatatat t gtaagtttga acatcaggtt ccacaccatt gaaggggtga ctagcatcaa 88740 gatccttct t actcttctgc ataaccttaa acatttccaa tgcatctttt agtttcccat 88800 tatcgcaga g accatccagc aaagtgtcac aagtaacgat atcagggcac aaaccactag 88860 agatcatct c ttgtaaaagg tctagagcag cattaagatc gcccaccaga tagaacccgt 88920 gaataagag t gttgtaagta gttgtgtcag caactaatcc tgtttcagtc atctcatgga 88980 gaagttcca t tccatcatct atcctcttag ccccacaata tccgtctatg agagtattga 89090 aagtgatta g gttgggagag cagcccttgg tagccatcaa ataaaacatg tgctcagcag 89100 catcaagac g attctgtttg caaaatccat cgatcattga actatatgtg attgtattag 89160 ggattatac c ccttggaagc atctcatcgt ataattcttc agcctcaaag aacttgcctt 89220 ccttgacaa a tgcattgatc aaagcattat aagttacaac atcagggctg atcttccttt 89280 ctaacattt c ttgcaacaac tgctccgcgt cgctccatct accagagcta caaaaaccaa 89340 ctatcatac t gttgtaggta aataaatcgg gaaagattcc tttctcttgc atttcagtga 89400 aaagatttt g tgcatcgcta tgacgtccgt ctttacaaag gctatcaatg attgcactat 89460 agattacaa c attgggtatg atgtggctca cctcctccat cttcctcagc agattcagtg 89520 cagacacag t atctcccttc ttacacatcc catctacgat tgttccataa gtaatctggg 89580 taggctgga g accatcttcc atcatccgat caagcagagc tacggcttcg acaattctac 89690 cctcgcggc a aagaccgttc atcaaagtgg tgaaggttac gacattgggc ctacatgtcg 89700 tttcaaaca t ttgatgaaaa aaatccaagg cttcagaaac cctatcttcc acacataatc 89760 catggagca g ggtggtgaag gtaacaacat cagggtggag tccaagcttg gtgatcttac 89820 caaatgtag a caaagcaaag gggagcttag agcagctgca gaaacatttt atcagaatat 89880 tgaagctgt a tatatcacat cgaatctgtt tcctttccat cttctgatag agagaaatca 89940 caagatccg g gcgttccatt ctcaccacca cacccatcaa tttacagaaa tcaaccacag 90000 aaggtaaag g acgagatcga agcatgtcac tgaacaaatc aatcgcatcc tctaaacctt 90060 tgatttcat g aaacccactt tgcagcttca aactctctcc tccaaaacct gcttcgcaac 90120 tctctccgc t tgccttggcc agagtatcac gaatcgatct cgtacagaac aatctagccg 90180 cagactcag c aggagaagaa gaacacttga atccacaaac cctagccaac attttatttt 90290 tgtttcgcc t aaattttgtt cttcgtcgat ctctaaaaaa aactcgtgac tgagaaaata 90300 aacgagaga t aaagtacaaa cgggttccat ttgttttaca agaaccggtt cagtttgaat 90360 tatacaatt t ccggttcaga tttgtcacca gttgattgat tgagttcctt gtttaaaccc 90420 acagggcca c atgattcact aaacccagag ccgagagaaa ttgataaacc gagctattga 90480 aaccagtag a gttccggttc agtatttatt actaagcctt cttgtttagt ccacttttaa 90590 aaatcaaga c gaccaatcaa agaccattta cagactatcc acttctaaaa ttattaaacg 90600 atcataaaa a tttatcaaca gccaggtgtg ttaaataatt atattagagg aaccagttaa 90660 tgacatttt t attgaaccag ttaatgacat ttttattgat gttataagct aacttaaaat 90720 ataaacaaa g tttatttact ttgggagaac cttggccatc aatatcatcc cctatttcat 90780 tcaactctt a agtaactaaa catttgactc aaaactaaat tggatatgta cataaacaat 90840 gagttggac a taccacactg caatgagaag gaatcgagaa tctccatact aattagaaag 90900 acctaacca a aatctaacct attaatttag ggttctattt tttatctact gttcagagta 90960 gggctggac a aaaaaactga atccaaagaa ccgaaccgaa tccgatctgc aaaagtaata 91020 ccaaatccg a accgaaatta attgaatatc cgaataggtt taaatttttg gtatttaaag 91080 aaccaaaac c gaacccgatc cgaaccaaaa tattttggat atccgaatgt atccgaaata 91140 gattaatat a catatatatt taactatttt tagattgaat atatattaaa aagcatctaa 91200 aatatatat a atacttttaa attgttcaaa atactagaaa atatataaaa acattaaaaa 91260 gtacatgta t aaatagttaa agcatactca aaacaccaaa aatatataaa atatgattga 91320 ttttctatc c aaatatccaa atcaaaccaa tttacatgtt aagttttggt acttcgacac 91380 atattattga aatttatatg taatatatta ttttgtttac aaatttcgaa aagtttaaaa 91440 tatataatg a aattttaaaa ttttgaaaat aatttaaacg ggttatccga acccgaaccg 91500 aatccgcaa g gatccgaacc gaacccgaac cgtaatttag aaataaccga atggggctaa 91560 aatctttga c cccaaaaatc cgaaatccga atagactcga accgaaaccc gaataggtac 91620 ccgaacgcc c acccctagtt caaagattag gaccacttag ttaaatattt aatatgacat 91680 atatgttta t ttatattaaa tcttaataat caaaaaaaaa aaaaatcaat tttaacaata 91740 catttgaat t ttattttagc tataacaaaa tttgttgaaa aaaatctaac aaaatcctac 91800 ccaacgttt t aaatatttat tataaaataa tgtattaatt aatttttgca attagtaata 91860 taataatat t ataattattg ttatttagaa ttttatcata aaacaatgaa aataaaaaat 91920 tatgctatt t tataaattta tcattataat ctatgttgta ctcaaataga ggtgttctaa 91980
47/58 ac taaatata aaagatgtca aaaaaaaatg aactaaatat aaaataatat attaaattgg 92090 tt gattaaat ctatttttaa aatactttta tgtaaataaa tttatcactc acggttaaaa 92100 ca ttgtaaga gcagctctgc tcgttttctt ttttgcttct tctgttctca aaaacttgat 92160 ga aatcacag aaactgagtc aagtatatga tcaggaacac agaacaagtg ataaacaaaa 92220 tc tatgaata tgttgttagt gataggagat aaaacactac ttgattccat ggaaaacgtc 92280 ac caacggcg caataagaat caatagagaa gcgtagctat tctgtaatca taaccgatgg 92390 aa tgcaccta caaaataaaa ttatctaggg attgtaattt ggaaaagaaa aatgtctttc 92400 at tcttttat gggtcaatta ggggaaaggg caacttttaa gtttgaatta ggaaaatagg 92460 cc acctcaaa tttatattag gcaattgggc aacctagtag agagagaata aatttatgac 92520 at ttttaacc tttttgccta ttaaacttgg caagttggaa aagtaatttc gtgggaccca 92580 aa atccactt tgcctataaa aaataatttt tttcccacta acttttaaca actaactttt 92640 gt aaatccca taaacattct ttattcatta aacttttgga tcatatttaa tatttaaaaa 92700 tc atatatga gcaactactt ttaatataat acatattttt tcatatataa agtcaacata 92760 aa tctatacg aattaatata aaatcgatgt aaattctaaa atttatgaaa gttacccaat 92820 aa attataca ttttgactca taaaagaaac tttcatattt atgaaatcta cccaaataaa 92880 tg ataattca taaaattatg taaatttatg gataattatc ataaatctga gtaaatttaa 92990 ta aacttgga aaccttcata gatccttcat tttttgccaa aatggcagga aaacaaattt 93000 gt ctacattt aattttaata tagttgggta aatttaataa atttggaaac ctacgtgaat 93060 ct tacatttt tttttggtca aaattgatct cacacttttt gtttttgcca aaaatagaaa 93120 ca ctcacgaa atgctacatt tttttcccaa aaataaaatg acaaattggg atctggcagc 93180 aa agtgcatt cgttataatt ttcatgttta taaaatgaca aaaattgtta atgaaatgac 93290 aa atttgtta ataaaatgac aaaccctaca cctttcacga tgaactgatc taataacttt 93300 aa ttttcaag gatcatatct acttgttaga accaatataa tcccatattg agtacaaect 93360 gc agatttcc aatcatccca agttcttgac tagtcatagg tagagccgtg cttataatct 93920 at tgaaaaag atatccgcta tagtgctatt tcaccccaaa aaatagagtt atccttaggt 93980 tc acccctag agtgaacatt taggttcacc caaccaatag gaatcaagta tttcataatt 93540 aa tatttttt ttaaaaagaa aagaaaatat tgtcaagtta tattatgttt ttaaaataaa 93600 ta aaatataa aaaaaaaata atagccgtta caaaaaatga atttttgaaa actattttta 93660 at atcgtcaa aaaacactaa accttaaacc ctaaatccta aaccctaaac ccttgggtat 93720 ac cctaaacc cttggataat tttaaactct aaaccctaaa ccctaaattc taaaccctaa 93780 ac cctaaatc ctaaacccta aacccttggg tataccatag acccttggat aattttaaac 93840 tc taaaccct aaaccctaaa ttctaaaccc taaacccttg gataaatcat aaacacttgg 93900 at aatcctaa attctaaatc aaaaacacta aacactaaaa cattaaatct taaaaatact 93960 at tatggttt aatgttttta atttagggtt tagtatttat ccaagggttt aggatttaga 94020 gt ttagagtt tagtgttttg ttgacgaaat taaaatcttt ttaaaaaatc tttttttttg 94080 ca tatattat tatttttatt ttttaatatt tttattttaa aaatgtaata taactcgaca 94190 at attttgtt tactttttta aaagatatca actgtgaaat gagtgatttc tattggttgg 94200 tg aaccttaa ggtttactct aggggtacac caagattaag tccaaaaaat ataggataat 94260 tt ggtgcctc catgtcaagt atctagtgat ttttatgtct taagaagtta agactcaacc 94320 tg agtttgac caaattctct cgcataaact tcttatctta aatatttaaa atcatcaaca 94380 aa acactaaa cataaactcc taaactctaa accatgaatc ctaaatctgg aatccttggg 94990 ta aatccgga acccttgggt aaatccagaa tccgaataaa ttatacattt tgacccataa 94500 aa gaaacttt catatttatg aaatttaccc aaataaatga taaattattc ataaaattat 94560 at aaatttat ggataatttt cataaatctg ggtaaattta ataaacttgg aaacctacat 94620 ag atctttca ttttttgtca aaatggtagg aagaacaaat ttgtctacat ttatcttaaa 94680 ta ttaaaaat catcaacaaa acactaaacc taaaatccta aactctaaac cttgaatcct 94790 aa atccggaa cccttgggta aatccagaac cattgggtaa atccagaatc tgaaaéaatc 94800 tg gaaccctt ggataaatcc ggaaccctat gtctaacgtt taatacaatc taattcacta 94860 ta actcaaga aataagtata cgtatacata agatgtacga atatctaagg tgttcgaata 94920 ta taaggtgt acgtatacat aagtatacat aaggtgtacg aataccttag gtgtacaaat 94980 ac ctaaggtg tacgaatacc taaggtatac agaaggtgta cgaatacata aggtgtacga 95040 at atcaacat aactcatcta atacttaaga tgtacaaata cataaggtgt acatatacat 95100 aa gtatacat aaggtgtaca aatacataaa atatacgaat accaacataa cccatcgaat 95160 acttaaggtg tacgaataca caagtatatg tatacataag tatacatata tttaaggtat 95220 ac gaatacat cggtgtacga atacataaca tctatgaata ccttttgttt atatccctta 95280 tt gcattgga gagtttaaat acatattaag tataaaattt aaatacttct acgaatacaa 95340 cgagagcaca gtgctctcca aaacaattat acgttaatta tttagaactc acattttact 95400 ct atataaaa tttaaatatt ttgctaataa cctattggta ttataatcta aaattttgtc 95460 aa tctcatta tagatgatct aattaactaa aaggtggtaa aaacaatgaa ataatttata 95520 ac aacatttc atttgtaaaa gctgatatac caaaatattt tcattaaatt caataaaata 95580 aattaacata ttagtttaat tgtgttttca tatatgtgaa gcacattcat ttagacaaca 95640
48/58 taatttttca tataaaattt aagattgttt agaaatgaaa tgttgaaata aataagtgaa 95700 atacatctta taataaaaaa actaaacaat taaatatttt ttataataaa aagctaaaca 95760 attaaaaaac taaacaatta aagattaaac aataaataat tgacattaaa gacatctaaa 95820 atgaaatata atgaaagatt tctttaaaaa aaatacatca tatttttatt atgaaatata 95880 taatacagtt acaaaaaaaa tcaataaaat cgaaataaaa tctagataat ttttcaatag 95940 aaaaatgaca ttttctatta attgtttagt ttttctcaat aaaatcacag ccatgaaaac 96000 tagaatttta gatggatata agatgtttta atagaaaata gacattatat tatcttgtat 96060 tattcaaaga ttttttaaaa actaaattat taaaagataa tgaaatataa tttaaacaat 96120 taaaagataa tgaaatattt ttttaaaaac caaacaataa aattgaaatc taacctagat 96180 aatttttccc attagattac ttttaagaaa tcaattttta aattttaata aacattttta 96240 gtatttatac ttttaataat taataaatga tatatagtat ttttgtatga tattaagcat 96300 tcattttaat catttttagt.gtataaatat tacatttagg tgtcatatgt ataaatttca 96360 taaacagggg cttggaatgt acatgagcgt aattgtttct tattcttcag ttgaagaaaa 96420 aatgattttt cttcttcagt taatttaatt gtaaaggtgg tggtgtagaa aagaatgaga 96480 gagaaaaaag aagatgagag gaaaagaagg agagggagat gattttcgta gatgatggtt 96590 ggtggtgtgg aaaagaagga gagagaaaaa gaaggaaaga gaaaaagaat gagagaggtg 96600 gtgtgacaaa ttaaagaatg agagatgtga tgtgacaaat tttattttag atatatttta 96660 attgaaatgg caaagatgta aataatgaat ctaacaaagg tcccaaagga tatttagaca 96720 taagtttaca tgggcaaatg caaaaagttg cccaattggc taatttaaac ttgaggtcgc 96780 ccaattccct atttcaaact tgtgatttgc ccaatttgcc aattttttct tcttttattc 96840 atcctccaac tgatatcctg caaaacaaac acaccaaacc gtttatgcaa gcttccctga 96900 tgctacagca aaagctgcag ctcttctcca gaaacttaaa ggtaagcaac gaaatttgaa 96960 aacaaaattg ttgaatgaca tacccacact catctgcaga tcctcaagca ttgccactgc 97020 cctttttagt tcctctttac tccataaacc agtcagcata ttgcggatag taatggtatc 97080 aggatacaca ccacttgcca tcatctcctg gaaaatatct agagccccat taatattacc 97140 cactttacga aaaccatgaa tcaaagtgat gtaagtaatt gcgttagcaa ctatccctct 97200 tcgacccatc tcgcagaaaa gctccagccc atcatcaacc cttcctgcct tacagtatcc 97260 attaatgagt gtagtaaagg tcactacgtt tggagagaag ctcttgctac ccatcgaatc 97320 aaacatttgt gtagcctcat ctaggcggct ttgcttgcat aaaccatgga tcactgagtt 97380 ataggtgata gtatctggga ctatacctct gtgtggcatc tcctcgtata attcctcggc 97940 ctctaaaaac ttcccttcat tgatcaagcc actgatcaat atattgtaag tttgaacatc 97500 aggttccaca ccattaaagg ggtgactagc atcaatatcc atcttactct tctgcatagc 97560 cttaaacatt tccaatgcat cttttagttt cccattatcg cagagaccgt ccagcaaagt 97620 gttacaagta acgacattag ggcacacacc actagagacc atctcctgta gaaggtcttg 97680 agcagcatta agatcgccca cctgacagaa cccgtgaata agagtggtgt aagtaattgt 97740 gttagcaact aatcctgctt cagtcatctc atggagaagt tttattccat catctaccct 97800 cttagctcta cagtatccgg ctatgagagt attgaaagtg attatgtccg gagagcagcc 97860 cttggtagcc atcaaataaa acatgtgctc agcagcatca agacgattct gtttgcaaaa 97920 tccatcgatc attgaactat atgtgattgt actagggatt ataccccttg gaagcatctc 97980 atcgtataat tcttcagcct caaagaattt gccttccttg acaaatgcat tgatcaaagc 98040 attataagtt acaacatcag ggctgatctt cttcctttct aacatttctt gcaacaactg 98100 ctgggcttca ctccatctac cagagctaca aaatccatta atcatacagc tgtaggtaaa 98160 taaattggga aagattccct tgtcttgcat ttcactgaaa agattttgag catcggtatg 98220 acgtccgtct ttccaaaggc cagattacca cattgggttt gatgtggctc acctcctcca 98280 tcttcctcag aagattcaat gcagacacag tgtctcccat cttacacatc ccatccacga 98340 ttgttccata agtaatctgg ttaggctgga gaccatcttc tagcatccga tcaagcagag 98900 ctacagcttc gacaactcga ccctcacggc aaagaccgtt catcagcgtg gtgaaggtta 98460 cgacatttgg tttacacatt tgatgaaaca aatccaaggc ttcagagatc ctgtcttcca 98520 cacataatcc gtggagcagg gtgctgaagg taacaacagt gggatgaaaa ccaagcttgg 98580 tgatcttacc aaatgtagac aaagcaaacg gcagcttaga gcagctgcag aaacacttca 98640 tcaggatggt gaagctgtat gcgttacatg gaacccgcct catttccatc ttcctatgga 98700 gagaaatcac aacatcgagc cttcccatcc tcaccacaac tcccatcaat ttacagaaat 98760 caattactga aggtaaagga cgagatcgta ccatatcacc gaacaaatca atcgcatctt 98820 ctaacccttt gatttcgtga aatccgcttc gcagcttcaa actctctcct ccaaaaccac 98880 tctctccatc cctgcttttc ttggccagag catgacgaat cgatctcgta cagaacaatc 98940 tagccgcaga cacagcagga gaagaagaag atccggatct ataaacccta gccaacattt 99000 ttgcttcgcc tgaactttgt tcttcgtcga tctctaaaac cactctcgac tgagtggcta 99060 gtaaaccggt tccatttgat ttacaacaac cggttcaatt tgaattatac aatttccggt 99120 tcagagttga acccactcag cgcgtcggtc ccgtcaagct aataatttct ttaaaaaaaa 99180 aaaaaattct ctcctctttg ggcagttaac aataactaaa ctgatcaacc aatgttccaa 99240 tgtaacaaaa aaaaaacatt atcctataaa agtagttaaa cattacccta taaaagtagg 99300
49/58 ttgaaagatt ttcaccgaaa tcaagttaaa tagaacgata ataccgactg attaagctgg 99360 tctgacacat tctatgttat agaattttcc aattctgact atgagtacca aaagagaata 99920 aaccaaaaaa aaaagacttt cttattcgaa gtaattgctg gaatgctgga ttaggtaagg 99980 tcacatcttc cttttgtaac ttcactctga ctctcctaca aagacatgtt cacaaattac 99540 aaaccaactc attcttgtta tgagaaatga aagacagcaa aatggagttt caaatgcttt 99600 gcagcaatct tattaatctc aatgcacttt aggttttcac atgtatcact gaaactgctt 99660 tttcaccagg tagctacaat ttttctttga attactaacc atttcttggt attcggcatc 99720 ctaattctca tcaacaaagc aatcaacaaa gagcaatcaa caagagcaga ttaatgccct 99780 gctaatacaa ataccagcag accatcctga taccttaaaa gtgctcaata agttattggc 99840 attaaccaac tacctaaact cccattttga tgttaaacta cctaatctga aatattcaga 99900 atgaattttt gggaatccta tttccctcct gctcgaccct atttgctcag agctcataat 99960 tggcatcata attatatccg caatattttc caggttacgt caaatcaacc aagttacaaa 100020 gaaaatgatg aacatattaa aactaataac aactttagga atctatattt ttataagagc 100080 tcagcttact tcagttgagt actgatctta cgtcaacaag tggatcagat cttttttgtc 100190 ataggctcat agcagacaaa tcaattcacc tcacaactct tctctcgagg gttaagaaat 100200 catgttgagg aagcttttgt ccaatctccc atcatataac atattagtga gtaaaccaaa 100260 ggttgaagca tcttcagaaa acccgcaacc tctcatttct ttgatgagtt ctgctgatac 100320 agaaatgtca ccatttctaa gatgtgctct gattagcaca ttataggtac ggtcatctca 100380 aagagaccca tcttctttca tttttataaa taagtcatcc gcttcctgta gtatagacgt 100440 tttgtaccca atcctgagat tatcgtattg tatgttataa catcgggctg caatcctttg 100500 aggctgaggc tattgaataa atgttgtacg tcttccactt tcccagcctc gcacatccct 100560 tcaatgataa tgttgtaagt gaagatataa acttctattt gaggctgagg cctgaaaaaa 100620 attggatatt ttcaaatact taggatattt tggataaaac atattaggat aattttggat 100680 gaatcaaata ttttataata atttagtttt tcaaatattt tagatatttt taatagattt 100790 ttaaatttta tatatatttt ttgttatgta attatgttat atgtatgtaa tatatatata 100800 tatatatata taccctttcg attatatatt caagtgttcg ttcggtttca attctgttcg 100860 gttatttcga atatataaat ttagcaatca ttcgaatatt taagagtttt agtccagttt 100920 aattatgggt attttgattt ggatccgtcc ggttcagtta taggtatttc tattcagttc 100980 cgattcattt cttgggttcc aatttttttg cccagaacta ctaattagca agacatacca 101040 aatgaacact tattatctat ttcgttactg aagcatctaa gactcactgg aacttggctg 101100 gaaaatatgt ttacaaatgc gatcaaatat atatgcacaa atttttttaa aaaaaaacta 101160 cacaaagaca gccatataca acaactgaca acgtcaaata tttattacaa aaccaataaa 101220 gagagacaat aaactatctc taagatcctg aacataattt gggattctaa attcagattc 101280 tatataacta ctagatctta aggagaagcc ttgaaagtta gctaagtgtg cctgattgca 101390 tcacagggaa ggaccaatcg ctgctgttct tggtcgaatc tctatgctca tcatcaccgg 101400 tcaaatgtat ctcatcggtg gtgccgaaat cgaattcttt attggatccg gaggaggaat 101460 gttgagctgc ttcttgatca gacgcttcag ggaacgttgt tctcagcttc ttatcaacgc 101520 atctaatgaa atgatccgca tcaagatcga acgaaaccgg tttgttcggt ctcacaatct 101580 tgttctgctc tttaggagtt gtaacagact tggagcaacg cagtttacca gggctcagca 101640 gctttggtgg atcagagact tgaaactgag cgagtccgtc aggaaacgga gaagtcgcac 101700 cagaaccgga cataaccgag ctgggggaga taagctgagc gagtggacta ccgggaggaa 101760 gttggtaaaa ctgaaactcg tagttagaca ccggagacct gacaccgtag ttactgctgg 101820 agttaaagag ctgagcgaaa gggacttcag gcgaagacgg tgtggtggtg gttaagtaga 101880 aagactcgtc gagaggcggc gtgaccggag ctgaagacgg ttcggttgtg taagtagaga 101990 aaaccggagg agaaaccagc tgaggttcgt gagcgtaagg tccgatggcg aagatcgaag 102000 gaegttcttc gctgttgttg ttgttgttgt ggctgttaga aggtagagga ctaaaggaga 102060 ggatccctac aggtgactgt gtagcggaag gaggttctga ttggaagaag gaagctggag 102120 aggaaggtgg ggctatgaaa ggaagagccg tcataaccga acgataaccg gaattggatg 102180 tggaatcggt aggaaccggt tcaggagcaa gagcagcttt cccgattcgt tttcttctct 102240 gtgttgaagg tctgaaacat atgaaacgat tccaccatct tcgcttcttc tgctattcaa 102300 attttttttt tttgattgaa gtcacataaa caaattagaa tctattgtga atgagtcaat 102360 agagaaacgt agctatggag ttcgcctaca aactttgttc gatctaatgc ttttgcgata 102420 acgaaatcat tatacagttc tctagatgat cactaaaacc tcgagaaaat gagctaaatc 102480 cgatgaaata gggactcaca tgaatcgggg aaggttggtg atgaacacga tcatcagagg 102540 aagcgaacgc agtagcggct gcgtttatag tctccaaaac gttgtttcca ctcgcgccgc 102600 ctctcatctt cctctgatct tatataactt tccggagaaa acaaaacaga gcattcgaat 102660 ttctctcaaa gtatcaatac acagaaaaaa aaggactatg aaaatcaatg tctcctgtga 102720 gtaaagttga aaaacaattt ataaataacg aagacacgca acccgaaagt tctgggaata 102780 ttgtttctct cttgagaaaa tatatagata cacaaaccag catacgtgtg tgttatatgt 102840 atgtgtatgt gtgtcaaggt ttgaggtcaa aacacggcaa agaacaaaag gcgtgcctac 102900 tattcatttt gtaaattgat gtgatttgaa gggtaattag gtctattaaa cttgcgaaga 102960
50/58 atttgacttc tttccttttt tgtttttttt tgtttttttt tcaaattaat tttaagataa 103020 atttaaattt atcagttttt atttcattct gatttaaaga ttttcatttt atcgtgaata 103080 tttcactact tttctggtca ctatttcact aattatagat tagtacaaga ataaaatgag 103140 attagcaaat tgatggtgct gttcgtttgc tcatctgggt gatccatcta ggtgaagatg 103200 caagttgatg tttgttttgt acattaaaat gctacatcca gatggatcac ccaactgcat 103260 ttatgaaaat tcatctcaaa ttctcaccca aatgagggtg agtcttcacg gagcatctgg 103320 atgaaggtga gtcttcacca aaaatttgat aaatttttcg ttaaaacaaa ataaattctt 103380 gccaaaaccg aaaaatgcaa ttttccgtca aaattagaaa acacaatttc tcgtcaaaat 103490 ctgaaaaaca taatttcgcc aaaaccagaa aacgtaattt cccgtcaaaa tcgaaaaatg 103500 caatatcccg ccaaaatcgg aaaaaggcaa tttcccacca aaaatcggaa aacccaattt 103560 ctcgccaaga ccaaaaaaca cactttcacg ccaaaaccga gaaaacgcaa ttttccgtca 103620 aaaccgaaaa acacaatttc ccgccaaaac cgacaaacat aatttcccac caaaatcgaa 103680 aaacgcaatt tcccgtccaa accggaaaaa cacaatttct cgtcaaaacc ggaaaacgta 103740 attttcccgc caaaaccgga aaaacgtaat tttccgccaa aaccggaaaa acgtaatttc 103800 tcgtgaaaac cggaaaacgc attttcccgc caaaaccgga aaaacgtaat tttccgccaa 103860 aaccggaaaa acgtaatttc tcgccaaaac tggaaaacac aatttcccac caaaaccgag 103920 aaaacgcaat ttcccgccaa aactgagaag acacaatttc tcgtgaaaac cggaaaaacg 103980 caatttctgg ccaaaaccgg gaaaacgcaa tgtcccgcca aaaccggaaa atgtaatttc 109040 tcgccaaaac cggaaaaaca cactttccca ccaaaaccga gaaaacgcaa tttctcgcca 109100 aaaacgaaat tttccggcaa aaccgaaaat gtagtttccc gtcaaaattg gaaaaacaca 104160 atttttcgtc aaaaccggaa aaatgcaata tcccgccaaa attttaaaaa caattctatt 104220 ttaattattt taataacaag ttcatctcga tgtagatgca agttgaaaaa agcaaacaaa 109280 catagttgca tttagatgat tcatctggat ggataaacga aatgcagaga cgaacaacat 104340 ctagatgaag tatttggata aggcatcaag atagaccatc tggatgcatt tttgagatgt 104400 acaaacgaac agggccatat tcttacgaac ataaagattg agatgttttt gttttatttt 109460 ttatttttca tgacgagata agtgtcacag aaacgcacgt gtgggagaat cgaatctatc 109520 tcttttagtt ttaggtttct cgtgtgcaca ttagtgtggg gctaaactaa gtaatttaaa 109580 attattaaat aaattatata ttttgaatta gaaatgatgt cacaacttct ggcccctaaa 109640 aacattatta tctcacaaag ccaatttcaa cttgttttgc acggtggctt gacttcatgt 109700 tttgggtctt gtttactttt ctatctctcc atacccaata attaaacgaa tttcctataa 109760 atgctttatg gaaaccataa ttcaatcttt tggcacatta taatttaatc gttaaatagc 109820 ccgcagaagc tgatagccac tttgtaactt gttagaaaat ggattactgt ttgtatttgt 109880 ccaattgact gattcttggt tccaaaaagg ggacataact tattgaatca tttacacaaa 109940 aacggaagac aggcacagtt aatgtgattt ggtgcaaaaa tgtttagctg tctgtcaatc 105000 aaataaatac gcagatcttt ccagattctt gaaatttttc atattagttg ggaaattcat 105060 tttaatatcc caaaaatata gaatttgaaa gagttttctg ttaaattata ataggtgagg 105120 gttataaaaa cataattact acttaacatt acaataaata gataacataa aaatgaagaa 105180 aaagatcaaa agaattaaaa agacgttttt aaataagatt tttttaaaaa gtttaagaca 105240 ttaaaaaatt gttttatcat taatctaatt tttgtattta aattttaatt ttaatgtgga 105300 gctacattaa tattaatatt atgttatcaa atattttttt aggatccttt agtattgatg 105360 ttgttagaat taagtctaaa aagttaacta tgaaaaagat agaaaaacta gaaaatgatg 105420 acttttacta ccaagtttaa gaatacacta ggttttggtc cgcactttaa aagtgcgaga 105980 cttttttgtt ataatttagt acaaaaaatt caaagatgat atttataaaa acattttatt 105590 attatattga aactctgata tggattgtcg atatcaaaat caaaataagt ttttcctacc 105600 atatatctta ggggtgggca cttcgattat cttctcggtt cgattcagga tcgggttggt 105660 ttgtttagtt tggttctagt aatttctaac tgaagtaaat catagttagt ttggttcggt 105720 ttctcggttc ggtttagttt caaaccgaac cattcgggtt ggaaaatctt caatcgaatt 105780 atttgaaaaa gatttcggtt cgatttgaat cggtatcggg tcgattagtt ccgtttgact 105890 cggttcggtt tgaatttttt gtccacccct gatatatcta aaccgtgcat ttcttgaaat 105900 atcttatcgt ggtaaccgat gatccatact ttaacagcga ggttattttg tttgtacatt 105960 ttaatttgaa aatataaata ttttgatccg tgtttctgaa gccaagtaat ttatggtttg 106020 aaattatagt aaatttacat ttttctattt tatcatatat aatttatgtt aagattcaca 106080 tagatattat attttaatta tttttcagtg agttcaaact ttgtatcttt aataaaattt 106140 gaatatgcga taaattatca ttttttccag cttaaaggtg gatgagtaat catttattag 106200 aaatgttatt ttctgtccta ttattattat tataaaatat tgctttcaat ttgattttaa 106260 aactagaaat ggaacactta ttttggaatt tgtaaaaata aatataatag tataatatat 106320 agtatcgaat aatttcaaag ttattttcat ataataaaaa tgtatatgta tcgttctttt 106380 gtttgaattt aactaattag gtatgtgcag taaagtgcca tcactaagtt atgttataat 106440 catataaact ccacctatct atgttagcaa tgatgataat atatattgaa acaaaaaaaa 106500 taaaaatgta aatttacata ggaaaaaaac gtatatgtac tatcacatat acaaataaaa 106560 atgtgactat ttaattcaaa ttctatgtga aactatatta ggctgaatat tttttgttca 106620
51/58 gattttctaa agatctcttc aaaatatttt aggtaattta aatattaaat atttaatata 106680 tttcagtggc atttctgtaa atagtttgaa aaactaaagg aatgtttgaa aaatatatgc 10674D
tgttttaatt gtattgattt gtcatgttat ttttggtagt cattggtaaa ctttttactt 106800 ggttactctc tccgtcttca aaaaaaaatt ataaagaaaa tataactaat attcataatt 106860 aaatttatta tttatttaaa aatatacttt ctgataacta tcagctaaca atatttaatt 106920 aatttaaata ttctcaatta atgtttttaa aaaatataca aaatagcttt aaaatatata 106980 aaaagtctat ttttgtgaaa caaaaaaaaa tctagaaaaa tttattttca gggaatagtt 107090 tttaggaaaa aacactttct agaaaactat agcaacttca atagttttct ggcttaatac 107100 ttttaatata atgttgtctg aaactaaaaa tcaaacctta ctgaaattat aataagctga 107160 aacagtttac aaaccaaaaa atcaacattt agttctcatg taaaagtaaa tttccggcct 107220 aagaaactga tttatccaaa agtaattcta tactactccc accataataa tatatgtcat 107280 atttggtttc aatatttaca aacctgtaac ttttttaagt aacttggaca atagagagat 107390 gtaagcacat atatttttat tgaaatgatc ttttgttaaa tattttacca tctatttata 107400 aacaaatgta aagttattta gttcgtagac tcgtagttat accaggaaaa tgaatttgag 107460 ctttgtgaat tagatttatg tcgttatctg aaatgaaata gaaagaatat catcgttaaa 107520 gttgagcaca ttagttagca aaagaaaaaa ctgagcacat tattgtccat ttttttcttt 107580 taagacttgt cggcagttca atgagttagg tcatcaaccg cacttccgga ctcgtgcttt 107640 gacacatgtc accaacccac cttgcactca aagacacaac acagtttaaa aataagagat 107700 catgaaactg ggatacaatt atactcttat tcaattttga taattgtact cttattcaat 107760 attgacaaca attagtttca aaaaaaaaat ttgacaacaa tttttttttt gcaatgagat 107820 aataagatga caccagcttt cacgtgcatc aaagttggat gaaaaaggac aagaagttta 107880 cgtgatattt cttccaaagt aaaagccaca ccaaaataaa agttaagaac cataaaagtc 10794D
aaattaaaat aatatactcc aagattcgaa cttatcatta aaagttcctt tactgcaaat 108000 ttacaaagca agcaacagca gattcaataa aggttcaaat ttaatggcag ggcatcaggt 108060 ttggtgtaga aaatcatttg gcaagataga ctagaaatga taagaacaga acctgaattt 108120 caaagagaag gtacgagctt cagcattgta agaggatgtc actttgacga ctggcgtccc 108180 agcttgaggg tacctaaaat atcaatattg tatatcctta ttagaatgaa aacgataata 108290 ttcacaagac attccacagt agaaatatga ctaaccattg caagaaatta gcaaaatctg 108300 cattgtttgc atcacgcata gcagcaaaga agtcttcaca ggtcacagct tgctcatcgt 108360 gtctttgaaa ataaagatca attccctgta acatatgcac acacagaagt gagcgtaagg 108420 accacgaaat aagacctaga tactggatac acaaaaaaga gtattggaaa tcaacctttc 108480 ggaaaccctc acttcctagt agagttttgt acatcctcac aacctcagct ccctaagaaa 108540 acattatata gtcaccttca gagactcggt atatttggct gtgtcattac atatcaattt 108600 atggcgcaac cttatctggg aaagttgggg ctagtgcgaa gtgacatagg tgttgataga, 108660 attccagact gcattaaaga tctccaacgg ttaaaaaatc aaagtatatt ttgctgtcca 108720 aaacttgcat aactgcccga gcttcctagg tcgctcacaa cactaagagt atatagatgt 108780 gaatcactgg agacaatata gtaccgttcc ctttaggttc tgagattgag gatatctatt 108840 tccctgactg ctacagattg ggtcgtgaag caaggagagt aattacccag catccgttgc 108900 aggaatgcct acctggcata cacatatacc tgcagggttc cagtacctac ctatctgttc 108960 aaaagcctac ctatttaagt tttgtgtggt ggttttccct aaacatggaa atggtagaac 109020 atagtggtat tgaattactg tgttacatac gcatgaatgg ttgccctacg aagaggagaa 109080 cattttcttt tgatcttcca atccaatcag aacatctgtt tatatttcac gccatagtgt 109140 ttaaggaaga agacctacag catgaacaat atcgccagat atgtttcctg ttcagcacca 109200 catcccagga agtcgaaatt attgaatgtg gcgtccagat cgtgagggac agaagtggca 109260 gaaaaagaag cgacgccgat gctgtgaata taaatcacaa caacaactgt tggaagacga 109320 cgatgaaagt ctctacggta gccttgacta tatatgatgc accaagagta gctaccatta 109380 aggattttgc°taagtctctt tcttcacttt ttattttcct attgagtttg attccgagtg ttccttttta tagcttacta aaggaacata aagacttgat aagtgattat ttcacatcat 109500 tcttttcctt ctgagttcga tttgaagtgt tacttttgtg taacttcctt ttaagacttg 109560 ggtatgtgat cttgtcgttg tatttactca tcagacaatg ttcagtagtt gtgtatagac 109620 ttcagctacc tactcgtttt gcattttgtt aacttttcaa agaaattcta cgtctgctgg 109680 gaagatgttg acgttgccca aactgctctt gtttagctgt tgagattttc aagtgttctt 109740 ttgaatagct tttattgttt tacaccttga ctacagttat taggaagtat acctgggaaa 109800 gtgtcttctt cctcgtatat ttagggtcct aatatgttgt ggggctccat ttagaacaaa 109860 acaatagctg ttctgtttta atggtttatg aaaatgcaga aacgtctcaa tggaatgata 109920 tgatcatatg ttgtggacag gcacatacag agtacattta tatgaatcat gggcttgttg 109980 gaagaactag acttcattag aaagagatga agtttccttc aaaagaagtc tcgcctgaac 110040 aagaagaaag cagaacaagc caaaagcgac aacaacaagg atccataaaa agttccagtt 110100 tcaggtaata acttgcgtag aataagtgac aaaatattta gtttgaatat ggcacacaag 110160 attagacaag aagacgttga cgaaaaaaaa aaaaaaaaca agaagaccat aaccggttga 110220 atgccggttt aaaacttaac atctaaccgg taaccggact agccattctc atttgaaaac 110280
tgttttaatt gtattgattt gtcatgttat ttttggtagt cattggtaaa ctttttactt 106800 ggttactctc tccgtcttca aaaaaaaatt ataaagaaaa tataactaat attcataatt 106860 aaatttatta tttatttaaa aatatacttt ctgataacta tcagctaaca atatttaatt 106920 aatttaaata ttctcaatta atgtttttaa aaaatataca aaatagcttt aaaatatata 106980 aaaagtctat ttttgtgaaa caaaaaaaaa tctagaaaaa tttattttca gggaatagtt 107090 tttaggaaaa aacactttct agaaaactat agcaacttca atagttttct ggcttaatac 107100 ttttaatata atgttgtctg aaactaaaaa tcaaacctta ctgaaattat aataagctga 107160 aacagtttac aaaccaaaaa atcaacattt agttctcatg taaaagtaaa tttccggcct 107220 aagaaactga tttatccaaa agtaattcta tactactccc accataataa tatatgtcat 107280 atttggtttc aatatttaca aacctgtaac ttttttaagt aacttggaca atagagagat 107390 gtaagcacat atatttttat tgaaatgatc ttttgttaaa tattttacca tctatttata 107400 aacaaatgta aagttattta gttcgtagac tcgtagttat accaggaaaa tgaatttgag 107460 ctttgtgaat tagatttatg tcgttatctg aaatgaaata gaaagaatat catcgttaaa 107520 gttgagcaca ttagttagca aaagaaaaaa ctgagcacat tattgtccat ttttttcttt 107580 taagacttgt cggcagttca atgagttagg tcatcaaccg cacttccgga ctcgtgcttt 107640 gacacatgtc accaacccac cttgcactca aagacacaac acagtttaaa aataagagat 107700 catgaaactg ggatacaatt atactcttat tcaattttga taattgtact cttattcaat 107760 attgacaaca attagtttca aaaaaaaaat ttgacaacaa tttttttttt gcaatgagat 107820 aataagatga caccagcttt cacgtgcatc aaagttggat gaaaaaggac aagaagttta 107880 cgtgatattt cttccaaagt aaaagccaca ccaaaataaa agttaagaac cataaaagtc 10794D
aaattaaaat aatatactcc aagattcgaa cttatcatta aaagttcctt tactgcaaat 108000 ttacaaagca agcaacagca gattcaataa aggttcaaat ttaatggcag ggcatcaggt 108060 ttggtgtaga aaatcatttg gcaagataga ctagaaatga taagaacaga acctgaattt 108120 caaagagaag gtacgagctt cagcattgta agaggatgtc actttgacga ctggcgtccc 108180 agcttgaggg tacctaaaat atcaatattg tatatcctta ttagaatgaa aacgataata 108290 ttcacaagac attccacagt agaaatatga ctaaccattg caagaaatta gcaaaatctg 108300 cattgtttgc atcacgcata gcagcaaaga agtcttcaca ggtcacagct tgctcatcgt 108360 gtctttgaaa ataaagatca attccctgta acatatgcac acacagaagt gagcgtaagg 108420 accacgaaat aagacctaga tactggatac acaaaaaaga gtattggaaa tcaacctttc 108480 ggaaaccctc acttcctagt agagttttgt acatcctcac aacctcagct ccctaagaaa 108540 acattatata gtcaccttca gagactcggt atatttggct gtgtcattac atatcaattt 108600 atggcgcaac cttatctggg aaagttgggg ctagtgcgaa gtgacatagg tgttgataga, 108660 attccagact gcattaaaga tctccaacgg ttaaaaaatc aaagtatatt ttgctgtcca 108720 aaacttgcat aactgcccga gcttcctagg tcgctcacaa cactaagagt atatagatgt 108780 gaatcactgg agacaatata gtaccgttcc ctttaggttc tgagattgag gatatctatt 108840 tccctgactg ctacagattg ggtcgtgaag caaggagagt aattacccag catccgttgc 108900 aggaatgcct acctggcata cacatatacc tgcagggttc cagtacctac ctatctgttc 108960 aaaagcctac ctatttaagt tttgtgtggt ggttttccct aaacatggaa atggtagaac 109020 atagtggtat tgaattactg tgttacatac gcatgaatgg ttgccctacg aagaggagaa 109080 cattttcttt tgatcttcca atccaatcag aacatctgtt tatatttcac gccatagtgt 109140 ttaaggaaga agacctacag catgaacaat atcgccagat atgtttcctg ttcagcacca 109200 catcccagga agtcgaaatt attgaatgtg gcgtccagat cgtgagggac agaagtggca 109260 gaaaaagaag cgacgccgat gctgtgaata taaatcacaa caacaactgt tggaagacga 109320 cgatgaaagt ctctacggta gccttgacta tatatgatgc accaagagta gctaccatta 109380 aggattttgc°taagtctctt tcttcacttt ttattttcct attgagtttg attccgagtg ttccttttta tagcttacta aaggaacata aagacttgat aagtgattat ttcacatcat 109500 tcttttcctt ctgagttcga tttgaagtgt tacttttgtg taacttcctt ttaagacttg 109560 ggtatgtgat cttgtcgttg tatttactca tcagacaatg ttcagtagtt gtgtatagac 109620 ttcagctacc tactcgtttt gcattttgtt aacttttcaa agaaattcta cgtctgctgg 109680 gaagatgttg acgttgccca aactgctctt gtttagctgt tgagattttc aagtgttctt 109740 ttgaatagct tttattgttt tacaccttga ctacagttat taggaagtat acctgggaaa 109800 gtgtcttctt cctcgtatat ttagggtcct aatatgttgt ggggctccat ttagaacaaa 109860 acaatagctg ttctgtttta atggtttatg aaaatgcaga aacgtctcaa tggaatgata 109920 tgatcatatg ttgtggacag gcacatacag agtacattta tatgaatcat gggcttgttg 109980 gaagaactag acttcattag aaagagatga agtttccttc aaaagaagtc tcgcctgaac 110040 aagaagaaag cagaacaagc caaaagcgac aacaacaagg atccataaaa agttccagtt 110100 tcaggtaata acttgcgtag aataagtgac aaaatattta gtttgaatat ggcacacaag 110160 attagacaag aagacgttga cgaaaaaaaa aaaaaaaaca agaagaccat aaccggttga 110220 atgccggttt aaaacttaac atctaaccgg taaccggact agccattctc atttgaaaac 110280
52/58 aactaataag cgaagaaaat tcagctcaag tcaacacact gagtgaaagg actttaccat 110340 cttcacatct ggctcatcgg gagagacttt catcgatact ctgctctcat ggcttcttct 110400 tcctcttctt cctcgcctcg cacatggaga taccgcgtct tcacgagctt ccacggacct 110460 gacgtccgca aaaccttcct cactcaccta cgcaagcagt ttaactgcaa cgggatatcg 110520 atgttcgacg atcaagggat cgagagaggc cacaccatcg cccctgctct cacacaagcg 110580 atcagagaat cgaggatctc tatcgtggtg ttaacgaagc actatgcttc ttccaggtgg 110640 tgtttggatg agcttttggg gattctgaaa tgcaaggaag agatcgggca gatagtgatg 110700 accatcttct acggagtaga tccttccgat gttcggaaac aaaccggaga tttcgggaaa 110760 gtcttcaagg acacatgccg tcgtaaaaca gaggaagaga ggcgaagatg gagccaagct 110820 ttgaccgatg tgggaaacat agctggggaa cactttctca actggtttgt ttgctttttc 110880 ttcactcttg tacctttctt gattctcaca tatgaacgta atctcttgtt ttagggacaa 110940 ggaatcggag atgattgaaa agattgcgag agatgtctca aacaagctta atgctacaat 111000 ctctagggat tttgaagaca tggttggtat tgaagcacac ttggataaga tgcagtcttt 111060 gttacattta gatgatgagg atggagctat gtttgctgga atctgtggcc ctgctggcat 111120 tggtaagact accattgcta gggctctaca tagtcgactc tctagcagtt ttcatcttac 111180 ttgttttatg gagaatcttc gaggaagctg taatagtggt ctcgacgagt atggattgaa 111240 actgcgttta caagagctac ttctttcaaa gatttttaac cagaatgata tgaggatata 111300 ccatttaggt gcgataccgc aaagaatgtg tgaccaaaaa gttcttatca ttcttgatga 111360 tgtggacgat ctgcagcagc ttgaggctct ggctgatgaa actaactggt ttggtgatgg 111420 aagcaggatt gtggtgacca cggaagatca agagcttttg gagcaacatg gtatcaacaa 111480 tacatactat gtggatcttc cgactgacga cgaggctcgt aagatttttt gtagatatgc 111540 tttcagacgg agcttaacac catatggttt tgaaactctt gtcgaaagaa caacagagct 111600 ttgtggcaaa cttccttttg gtctccgtgt tcaattttac gcggaaagaa agaagacgac 111660 tgggaaagta tattgcaaag gctagaaaat agcaatatac caaagatcga tgcagtactt 111720 agagttggat acgacagttt acatgagaac gaacaaactc tgtttctcct cattgccatc 111780 ttcttcaact accaagacga tggtcacgtg aaaacaatgc tcgctgacac taacttggat 111840 gtcagactcg gcttgaaaac tctcgcttat aagtctctca caaaaatatc tagccaagga 1119D0 aaaatagtga tgcacaagtt actacaacaa gtgggcagac aagcagttca aagacaagag 111960 ccttggaaac gtcggatctt aattgatcct caagagatct gcgatgttct tgagccttgg 112020 aaacgccaag tcctaactga taccgatgag attcgcgatg tccttgaaaa tgattctgta 112080 cgttcatttt cttctatctg ttacaccggt tcatttagca aaggcctata gatgttacca 112140 ccttttgttc taacataatt tcctttattt tgaatttttt ttttagggta gtagaaattt 112200 gatgggggta tcttttgata tgtctacaat cttacacgac atggatatta gcgcaagagc 112260 ttttacaagt atgcgtaatc ttcgatttct caaggtctac aaaacaagat gtgatacaaa 11232D
tgttagagtg catttacccg aggacatgga gtttccacct cgtctgaggt tattacactg 112380 ggaggtatac ccgagaaagt ttcttcctcg tacattttgt actgaacatc ttgtggaact 112440 ctatttaaga gataccgagc tcgagcaatt atgggaggga acccaggttg gttattttat 112500 tttattttct gtttgtgtgt actttggata gtgtttaatg gtttttactg gtttgtgaaa 112560 ttttatataa atctaaatgg aatatagaaa acaatgaacc ttaaaaacca aatatgtgga 112620 agttacagta gcatcgtcaa ttttgttaag agtttcaaac atatgtatga ttcccatcat 11268D
ttcataacat taatatggta ttgtgctgtt ttacattcag cccctcacaa atctcaagaa 112740 gatgtttttg ggttcgtgcc tgtatcttaa ggaacttccg gatcttgcaa aagctacaaa 112800 cctagagaaa ttgaggttgg atcggtgcag gagtttggta gagattcatt cctctgttgg 112860 aaaccttcat aaactagaga gtttggaagt ggctttctgt tataatctac aggttgttcc 112920 gaatcttttc aacttggcat ctcttgaatc attcatgatg gtgggatgct accaactgag 112980 gagtcttcca gatatttcta cgaccatcac agaactctca atcccagaca cactgttaga 113090 agagtttact gaaccaatta ggctctggtc tcaccttcag agactcgata tatatggctg 113100 tggggaaaat ttggagcaag tgcgaagtga catagctgtt gagagaattc cagactgcat 113160 caaagatctc caacggttag aagaactaac tatattttgc tgtccaaaac ttgtatcact 113220 gccagagctc cctaggtcgc tcacattact aatagtatac gaatgtgatt cactggagac 113280 actagcacct ttccctttag gttctgagat tgaagctctc tcttttcccg aatgcttcag 113390 attggatcga gaagcaagga gagtaattac ccagctgcaa tcatcatggg tatgcctacc 113400 tggaagaaat atacctgcgg agttccatca ccgggttata ggaaatttct tggccatatg 113460 ctcaaatgca taccgattta agctttgtgc cgtggtttcc cctaaacagg tgatggtgga 113520 agatgaagat atagaattac tgtgtcacat actcataaat ggttgcccca tgaagagccc 113580 cattaagagc atatataatc ttaggattag aatccaatca gaacatctgt ttatatttcc 113690 ctccacaatg ctcaaggaag accgacagct tggacaatac agtgagatat tgttcaaatt 113700 tagcaccaca tctcagaaca ctgaaattat taaatgtggt gtccaaatct tgagggacag 113760 aagaagctgt gattctaagt cagaacaaga cgacgatgaa agtctctaca gcagccttga 113820 ctatgatgca ccaagagtag ataccattaa gtattttgct aagcttctct cttcactttt 113880 tattttcctt ttaagtttga ttccgagtgt tcttttttac agcttactaa aggaacataa 113940
tgttagagtg catttacccg aggacatgga gtttccacct cgtctgaggt tattacactg 112380 ggaggtatac ccgagaaagt ttcttcctcg tacattttgt actgaacatc ttgtggaact 112440 ctatttaaga gataccgagc tcgagcaatt atgggaggga acccaggttg gttattttat 112500 tttattttct gtttgtgtgt actttggata gtgtttaatg gtttttactg gtttgtgaaa 112560 ttttatataa atctaaatgg aatatagaaa acaatgaacc ttaaaaacca aatatgtgga 112620 agttacagta gcatcgtcaa ttttgttaag agtttcaaac atatgtatga ttcccatcat 11268D
ttcataacat taatatggta ttgtgctgtt ttacattcag cccctcacaa atctcaagaa 112740 gatgtttttg ggttcgtgcc tgtatcttaa ggaacttccg gatcttgcaa aagctacaaa 112800 cctagagaaa ttgaggttgg atcggtgcag gagtttggta gagattcatt cctctgttgg 112860 aaaccttcat aaactagaga gtttggaagt ggctttctgt tataatctac aggttgttcc 112920 gaatcttttc aacttggcat ctcttgaatc attcatgatg gtgggatgct accaactgag 112980 gagtcttcca gatatttcta cgaccatcac agaactctca atcccagaca cactgttaga 113090 agagtttact gaaccaatta ggctctggtc tcaccttcag agactcgata tatatggctg 113100 tggggaaaat ttggagcaag tgcgaagtga catagctgtt gagagaattc cagactgcat 113160 caaagatctc caacggttag aagaactaac tatattttgc tgtccaaaac ttgtatcact 113220 gccagagctc cctaggtcgc tcacattact aatagtatac gaatgtgatt cactggagac 113280 actagcacct ttccctttag gttctgagat tgaagctctc tcttttcccg aatgcttcag 113390 attggatcga gaagcaagga gagtaattac ccagctgcaa tcatcatggg tatgcctacc 113400 tggaagaaat atacctgcgg agttccatca ccgggttata ggaaatttct tggccatatg 113460 ctcaaatgca taccgattta agctttgtgc cgtggtttcc cctaaacagg tgatggtgga 113520 agatgaagat atagaattac tgtgtcacat actcataaat ggttgcccca tgaagagccc 113580 cattaagagc atatataatc ttaggattag aatccaatca gaacatctgt ttatatttcc 113690 ctccacaatg ctcaaggaag accgacagct tggacaatac agtgagatat tgttcaaatt 113700 tagcaccaca tctcagaaca ctgaaattat taaatgtggt gtccaaatct tgagggacag 113760 aagaagctgt gattctaagt cagaacaaga cgacgatgaa agtctctaca gcagccttga 113820 ctatgatgca ccaagagtag ataccattaa gtattttgct aagcttctct cttcactttt 113880 tattttcctt ttaagtttga ttccgagtgt tcttttttac agcttactaa aggaacataa 113940
53/58 agacttgata agtgattatt tcacatcatt cttttccttg tgagttcaat ttcaggtggt 114000 tcctttgtat aacttccttt taagactggg gtatgtgatc atgtcctagt catctttgta 114060 ttttacattt ttacccgtca agacaatgtt cattagttgt gtatggactt cagctatcta 114120 gtcgtttttt aattttgttc acgttgttga caagatgttg aagttttcaa gtgctctttt 119180 gtatagcttt tacacattga ctacggttat tacttattag gaagtatacc caggaaagtg 119290 tcttcttcct cgtatatgtt gtgggactcc atttagaaca gaacaatagc tgtgtttttt 119300 tttgttcttt gcttgacttg ggaatggttt ttgaaacagc taagcgacga acatcttaaa 119360 agtcaaccca cgtgacgtct tcttcttcac atatggctca tccgtagaga cttttttttt 119920 tctttgacat cgtagagact ttcatcgcta actctaattc tcatggcttc taaatcttct 114980 tcctcttcct cgtctcgcac atggagatac cgcgtcttcg caagcttcca cggacctgac 114590 gtccgcaaaa ccttcctcac tcatctacgc aagcagttca ccaacaacgg gatttcgatg 114600 ttcgacgatc aagcgatcga gagaggccac accattgctc cttctctcgc acaagcgatc 114660 agagaatcaa ggatctctat cgttgtgttt agaactatgc ttcttccagg tggtgtttgg 114720 atgagctttt gggaattctg aaatgcaagg aagagatggg gcagatagtg atgaccatct 114780 tctatggagt agatccttct gatgttcgga aacaaaccgg agatttcggg aaagtcttca 114890 aggaaacatg ccgtcgcaaa acagaggaag agaggcgaag atggagccaa gctttgaccg 114900 atgtgggaaa cattgccggg gaacactttc tcaactggtt tgtttgcttt ttcttcactc 114960 tttgtatctt tcttgattct catatatgaa cttaatctct tgttttaggg acaaggaatc 115020 ggagatgatt gaaaagattg ctagagatgt ctcaaacaaa cttaatgcta ccatctctag 115080 ggactttgaa gacatggttg gtattgaagc acacttggat gagatgaact ctttgttaca 115140 tttagatgat gaggatggag ctatgtttgt tggaatctgt ggccctgcag gcattggcaa 115200 gactaccatt gctagggctt tacatagccg actctccagc actttccagc atacctgttt 115260 tatggagaac cttagaggaa gctgtaacag tggtactgac gagtatggat tgaagttgcg 115320 tttacaagag ctacttcttt ccaagatttt taaccaaaat ggtgtaaaac tatttcattt 115380 aggtgccata aaggaaaggt tatgcgacct aaaagttctt atcgttcttg atgatgtgga 115940 cgatctgcag cagcttgagg ctttggctga cgatactaac tggtttggtg atggaagcag 115500 gattatcgta accacggaag atcaagagat tttggagcaa catggtatca gcaatacata 115560 ccgtgtggat ttcccaactc aagtagatgc tcgtcagatc ttttgtagat ttgcttttag 115620 acagctctct gcaccccatg gttttgaaaa acttgttgac agagtaataa agctttgcag 115680 caaccttcct ttgggtctcc gtgtcatggg ctcgtcttta cgcagaaaga aagtagacga 115740 ctgggaaggt atactgcaga gactagagaa tagctttgat caaaagattg atgcagtact 115800 tagagtcgga tataacagtt tgcataagga tgaccagttc ctgtttctcc tcattgcatg 115860 cttcttcaac tacaaagacg atgatcacgt gaaagcaatg ctcgttgata gtaacttgga 115920 tgttagactc ggcttgaaaa atctcgtgta taaatctctc atacagatat ccgcagaagg 115980 aaccatagta atgcacaagt tattacaaca agtgggtaga gaagcggttc atttgcaaga 116040 tcctaggaaa cgccaaatcc taatagattc tcaccagatt tgtgatgtcc tcgaaaatga 116100 ttctgtaagt tgtttttttt ctcctttctt ctttttatat gattatgcta atattttatt 116160 ttatttggaa atataatgat tttaggatgg tacaagtgtg atgggtatat cctttgatac 116220 atccacaatc ccaaacggag tgtatataag cgcgcaaggg tttagacgaa tgcgtgatct 116280 tcggtttctc agcatctacg agacaagacg tgatcctaat gttagagtgc atttacctga 116340 ggacatgagt tttccacctc ttctaaggtt attacactgg gaggtatatc caggaaagtg 116400 tcttcctcat actcttaggc ccgaacatct tgtggaactc tgttttgtta acagcatgct 116460 cgagcagctt tggcaaggag tccaggtttg ttacttatat ttgaacacac tggtttaaag 116520 tttagaaatc tatataacta aatgtgaagt aattttgagg aaaaaaagta cttttgatat 116580 ttttttaaaa acataaacaa taatataaaa aatgagtatc atgttgtttg aaaaaatgga 116640 tagcaatata ttaaaaaaaa ataataattt actgttaatt aagaaaaatt agaagtctat 116700 tatataatca taaaacaaga tttaaacttt atatacatat ttaaaataaa aataacttaa 116760 aaatgattta tatcgaaaat tgattcaaaa atttacatat atttaaaatt tgatttttac 116820 taaaatattt tccactaacc ttataaaata tttggaatgt atataaaatg tacaatacaa 116880 agccaaattt taaatacçaa gttaaattat ggtttttata attcacatta agtttgaaaa 116940 tataattcac atttaaaaaa tattttttct aaaataatca tcaaataaaa tttatttata 117000 tacatatttc aaataaaaat aataatttat aaaattgatt tatatcaaaa attgattcaa 117060 aaatatacat atgctcaaaa attgattttt actaaaatat ttttcaataa ccactataaa 117120 aaaaaatatt ttctatatat atatatatat atataaatac aataaaactc taatttcaaa 117180 caccaactta aattatggta tttctatttc ttttaaaaat ataatatatg tgatagttta 117240 tataataata cgtataaaaa ctattataca atgacataat acaaaatagt gacatagaaa 117300 acaaatagta atttttcttt gaaaaacaac atccgcgcgg gtgcgtaaac aaagtctagt 117360 tatcattata tatttgataa aatttacaag ttttatattt tatctaagct ttggcaagga 117420 gtgcaggttt gttattacgt ttgaacaccg tctggttttt aaatttagaa attttatcat 117980 tgtatattga ttgttttaca ttcagcctct tacaaatctc aagaagatgg acttgtccgg 117540 gtcactgagt ttgaaggaag tccctgatct ttcaaatgct acaagtctca agagattaaa 117600
54/58 tctaacaggt tgctggagtt tggtagagat tccttcctct attggagacc ttcataaact 117660 ggaggagctg gagatgaatt tatgtgtaag tgtacaggtt tttccgactc tactcaactt 117720 ggcatctctt gaatcactca ggatggtagg atgctggcaa ctaagcaaaa ttcctgatct 117780 tccaaccaac atcaaatcac ttgtagtcgg ggaaacaatg ctacaagagt ttcctgaatc 117890 agtcaggctt tggtctcacc ttcatagtct caacatatat ggcagtgtcc tcacagtgcc 117900 acttttggaa accacgtcgc aagaattctc cctcgctgct gctacgattg agaggattcc 117960 agattggatc aaagatttta atgggctaag gtttctttac atagctggct gcacgaaact 118020 tggatcactg ccagagctcc ctccctcgct tagaaaacta atagtagaca actgtgagtc 118080 actagagacg 'gtctgttttc cttgcgacac tccaacaact gattatctct acttccccaa 118190 ctgcttcatg ttgtgccaag aagcaaagag agtaatcaca cagcaatcat tgagagctta 118200 cttcccagga aaagagatgc ctgctgcaga gttcgatgat catcgatcat ttggaagttc 118260 cttgaccatc atccgtccgg ctatctgcaa gtttaggatt tgcctggtgc tttctcctgc 118320 accggatatg gaagaagctt atttcaaatt actgtttcgc atacgtgcaa aaggttgtcc 118380 cagtgatgat gacatgcttt cgttagatct. cgctaaaatc caaggggagc atctttttat 118990 atttcacatt gagtttgttg aacatcacga ggagatggtg ttcaaattca gcacctcatc 118500 ccacgaagtc gacgttattg aatgcggtgt acaggtcttg acagatgaaa ccagcagaag 118560 aagcaatgaa tcttgttcag aacaagtgtc tgaagacggg gatgatattc tatcggatga 118620 tgataagagc aatgagattt atgaacccag agtaaagata tttacgggtt atacaatgtt 118680 tctttcttta gtttttacgt tccttttgag tttgatttca agtctaattc tgtatagatt 118790 cctaaagaac taaaacttga gtgtatgata ttgtttgtgt tggactttct atctatctac 118800 ccattcgata gcggtcacca gtagtaattt cacccgttta aaattttgtt catcatggat 118860 tcatggatac agttggaggc tagatagatg gtgactttac cattgttggg agaatgctct 118920 tgttgtctcg agtttcttat tgattgaaaa tctaattccc cttggtgata tgtaatctgg 118980 aaaactatgt tagatcgtaa gttgataatg aaaggatcca tcaaattatc caacttgaaa 119090 aataacacat actgtgtcta ctttgcatgg acttcctcat tttggaaact cgtaggtgca 119100 aatagtaaaa taagtaaata actatgggtg aatgttcatt ctttcaactt gatataaaag 119160 aaaaacatca tttcgttaga gaaaaagtac ataacataaa aagaaaaaca tgtgacgttc 119220 aggataagtt tattattgta aagtgcatgc gttgaatgta aaaagctcat aacatgataa 119280 ttcggagcta cgagtagaaa tgtctttaaa aaggatttga ttcttgatgt ggtctctcaa 119390 gcagccaagc tcttagaggc aatctcaaat acattttcag ataacccatt agctgacatt 119400 atcatctcca actgtgcctg tcaaaccacc acaaaacaca aacacaacag cttcattcat 119460 ccagacatct tctcttagga ttataaaacc aacaaaaatg ctaatgattt tgttgtgtgt 119520 gtgagagaaa aagagagact tagttacctt ggccagagct tgtcgggttt catcgtagcg 119580 cttccacctc gaaaacgcag ataccatacg agaagcaacc tagaccacac aggaaagaaa 119640 aaaaaagaaa caagttgtaa aggttgttta tttttgtcaa gaaagttaat acgggagtca 119700 aacctgagga ttgattttgt ctaactggac aacaatgtca cccaagaact tgtaacctga 119760 tccatctttt gcatggaaat tcactggcga accgcagaac cctccaatga gcgagtaaac 119820 ctgaatggtc gtcgcattgt ttcatcgtta gcatacatct gagaaagaaa gttgcggaac 119880 gaataagagt tttgagaatt cacttgcctt gtttggattg cgcagatcaa aagctgggtg 119990 atccaaaagc ttcttgacat tctccacatt cccgggaatg tcggatgatg cttgaaggag 120000 gaaccattta ttaacaacct gagatcagaa gccagataaa gctcagtatg gcatatttta 120060 aacatggagg cagagggaag taacgtgtga cattgaagat ctataccaag taatcgccct 120120 gccacttgtt atagaaatca gcaagaacct catcacgggt ttgacccggc ttttgtgcaa 120180 gagctgccaa agcagcaatt tggtctgtca aattggtggc cgacttgtat tcacccaatg 120240 caagttccac gtatgctgga tcctcaagcg atgcaagata agctggcatt atttcaacaa 120300 agcaaacaca caaagaagtt agtgacttcc gcacaaagag agactcgttt aacttaataa 120360 tgactcgcaa atgccaacct agagcagtgt tcttcaaagc acgcctagcc atattggggt 120920 ggtcaaagac ataagcctca gtgctcctat tgttctcaac ctgcacaaaa atataacaac 120980 agtttgaaaa gtttcagtga ataaacagcg agttcaaacg aaataaaaaa acaggaactt 120540 cctaacttca gccgacactg aettgggtct caaaagattt actatgtaga aagaagaaga 120600 catactatct ttagaagctc agttttaagt tcagatgcaa gctgctttct aacaaacttt 120660 ctaacggcat gaacagcatc aggatecgcc acggccatca tgtccataat ctctccctcc 120720 ccaggtaatg ttattgcctt ggctataaat tcctacacca atagattaag aaaaagataa 120780 aagattaaga agtcgtatcc taatgtacgc ttccttgttt gactacgtgg tccataaggg 120890 aatgtatagt cgtaccttgt ccaagctcga gtcagaaagc acgctgccga gaccctgaat 120900 gaactttggg tttagaacca atggtttgtt ttgttggaaa tcagaaacta agttcagcat 120960 gagcttcctt gccagaactt gacctgcctc ccacctaaaa atacagaata aatgaatgaa 121020 cgaactgcgc gtaaatgaaa aaagatctaa aatgttgtgg aaaggcacat accgattgaa 121080 ttcatctgaa tcatgggcta agaggaagaa cagatcatca tcagagagat cagtctcaac 121140 acgaactggg gcactgaatc ctctaaacag agacggcaca ggtttttctg atatatcaga 121200 gaacacaaac tcttcttctt tctgtacgta aacaaaacat aaggtccgga aagaaattga 121260
55/58 aaacactgga cgtggaatag agtggagggc gatgtaacgt agactacata cattacaaaa 121320 ggtcacgtaa cgtattgctt taagaaagga attctgaact aaccttggtc actcgaagga 121380 ttgtgctgct gcttgaaatg gtctgaagtg taccattatg gtaaacagag gaaagtgtaa 121990 tgtcttttcc acttgagtcc agaagaccaa caaccactgg aataaatgtt ggttcttttg 121500 ttggctggcc cggagtcggg ggtatctcct gactggaaaa gttatcaatt acaaagcaag 121560 ccaatgtgtc aacagcagat tcaataaagg ttcaattgta acggcagggt atcaagtttg 121620 gtgtagaagg tcatttggca aaacagacta gaaatgttaa gaacagaacc tgaatttcaa 121680 agagaaggta cgagcttcag cattgtaaga ggatgccact ttgacgactg gcgttccagc 121740 ttgagagtac ctaaaatatc aatattgtat atccttatta ttaggatgaa aacaataatc 121800 ttcacaagac attcacggtt gaaatatgac ttaccattgc aagaaattag caaaatctgc 121860 attgtttgca tcacgcatag cagcaaagaa gtcttcacag gtcacagctt gctcatcatg 121920 tctttgaaaa taaagatcaa taccctgtaa catatgcaca aacagaggtg agcgtaagga 121980 aaacgaaata agacctagat actggataca caagaaaaaa gagtattgga aagcaacctt 122090 tcggaaaccc tcacttccta gtagagtttt gtacatcctc acaacctcag ctccctaaga 122100 aaacattata tagtcagcta aggttttttg cttactgcat ataacagcaa cattatcatc 122160 gagacaaacc ttttcataaa cctgaaacga aaacaaaaac caaatcattc tgttagaatc 122220 aatacataag ggactgatag gaaatgaaac taaatagaga aaaataatct tagattccct 122280 accgtcactg atagagcagg gtgatagcca ggcacgtaat ccaagattgg aacagttgca 122340 aaaaacacaa gcacgttaga ttggaaccca atacaaatag taaccagatg aaagcctata 122900 acagaatccc agacttctta gcaaacagaa acttgcctgt gtagaagttg tccatctgca 122460 cagaaagtta aaagagcaat gtttatcaac acgaacgtaa catgcacaac atagtttcag 122520 gaaaagatat gtaacaagac tctgaccttg atgtatgaat gtgggcgaac aggatgtgcc 122580 ataggaccag catcctggat aattaaacaa cagaggattg gcttagaaaa aacgagataa 122690 acccatgtag tgacctaaag gagcacaaga ctaggtacct gcgggaattg atagatcctg 122700 agctttgaaa catcagcaat acgctttaca gtacggcttc ccatatcaga tgaaaactcc 122760 tgtaaggaat tggagaaaaa taatcattag ctagagaaaa atttacaaca cgaatcttca 122820 tattatgaag gataatttat gtacctgatc acggaagaca gttagacctt cctttagact 122880 gagttggaac cagtcacggc atgtcaccct atcatcacaa atagagtttc agttataaag 122940 acaagcatat aagcaaaact ggaagatcca accaacaaga atcaaatcat ttgtaaattt 123000 taataactaa taaggtaaga taaatgaggc tgacctgttg cctgtccaat tgtggaagta 123060 ctgcacagca aaaatgaaag acacggcata agatttcaat agaaaaaaac atgcacaaca 123120 taaaatttca ataaacagca taatgtacga ttacatactt catgaccaat aactcccaaa 123180 attgcagcat aatctgcatc tgttgcagtt tctggagatg ccaggacaag cttggaatta 123240 aaaatctgca aggtagagaa gctcatatat ttccatcaag acaaaatatc agcacaagta 123300 cgttattgtt ataaagtaaa gtagaattac gttcaaactc ttgttttcca tggctcccct 123360 gaaaatggaa aataaatcaa ttagtttgat tattctcgac agtaagaaaa gtaaaaagac 123420 agggaagcat gagctcttta ttttggatag aattcactat ttgttcatac atgttaaaat 123480 ctggaacggc gacaatgttg aagagatcca ggtcatactc aaggccaaac acctagagga 123540 accggttaag acacaaaaaa acatcagatt cgatacctaa caaatacatg caatactaaa 123600 aaaacttttc aaagtactta catcttcatc ccacttcatg gccgccttca gagaatacat 123660 ggcatgagca gtctttggta gatcttctgc aggagtccag attttcagag atacctccct 123720 accagagcgt gtagtaaatg tatcatctct gctcgctagc tgtccagcca ccagagcaaa 123780 tagatagcat ggcttcttga aaggatcctc ccataaggca aagtgccgac ctccctacaa 123840 attaacgaag aggatatgcg ttcagtaatg acaaagtgag aggacattta ttccagaaaa 123900 gggtcactat tttgctaacc tctacatctc cttgagaaat gaggtttccg ttggacaaca 123960 gtacaggata gagtgacttg tcagcttcaa cacggcatgt gtacttcgcc ataatatcag 124020 gacggtccta atcattgcat attaaaaaca ctatgtaaga acatcaattg tactttctca 124080 acaagagtca tcttatatag aagtggcaac caacctggta aaatgtgatt ttccggaaac 124140 cctctgcttc acattgtgtg caaaaattcc cagatgactt gtagagcccc taacagaata 124200 aacttaaaaa ggttaaaact gttctggtag atcattaaag atagcaggaa aagaaaaaag 124260 ttgaaggaac agatgcagaa aagtttacat caagtgaagt attcttgtgg gggtatatct 124320 cagtatcaat ttccagaaca aaggactcct cggccggcag tgaaggcaga gtgagatgac 124380 gagaatccaa ctggtaatcc ccttcctaat caaagtgaaa gagagaccaa gtaactaaac 124440 caaactgatt tacatatatt ctaccctacg gagttgattt tactaatata aaaatgaaaa 124500 ttagtactac atagaataaa agagtatgta tgcttaaatt gataccttta gaagcttccc 124560 ctcaaccttg acagagagta gcttcaagtc atgcccattc aagaccaagg gagcagaaga 124620 tcctgggcaa cagaatactt gttcagaatg tgatgtgaaa aaaaatggaa gaaacaaaga 124680 tgaatgttct gcttgagtaa agtgttaatg tcaaaaacta gtaatgtact agactgttgt 124740 acctttaact cgaggggaaa ctttgatctt ggagctaaca attgtcttct cttcacctag 124800 agagaagctt agatccacct aaacaaacaa acaaacaaaa agaggttcag attaaaacaa 124860 tggtgattct acacataggc tcaaactgaa ttttaaagaa gggaagcata cagtttcaaa 124920
56/58 gtagtaatca ggcttggtgt agtccttgag aaagatttcc ttaggtgcat ccattttgga 124980 ttcttcaact gattcggtgg caacagaaca aatcagcctc ctgctgctgt ctcgcttata 125090 tctctgacat atacaacaaa aaagatggat ttaattttgc ttcataaaaa tccagcattg 125100 gggttatatt tatcatagag gaaggaaaga gagagttaca tcgacagaat atgatagaaa 125160 ctgattcttg ctcaaacaag taacctgaga cagagaaaca aaactgaaga ccaatctcaa 125220 ctttaagtaa cagttcagtt ggttgagaaa acgaaagaaa cacaaaacct gggaagtaag 125280 aaagggtctg tattgagtaa gtctctttgc tgaattacgt aacggaagtg aaccgcttct 125340 taagggaccc tacaaacaag agaaaactga aagataaatt aaactacaaa agcgaaatta 125400 agggaaatga atacaaaagc aaagctaaac cctaaacaac atatgcatat tatacgagtg 125460 atcaaaaaag tcaaagctag tggccatata caaactcaat catttcgatt tagaatcttt 125520 aaccaaagga accaaaaaac attaatccaa aacgcaattg taaaacttta acaaacatta 125580 atcgatttgg acctttaacc gaaggaacaa caaaagaaat caaaacaaga gagacagaga 125640 gagagtttag agagtaatca caggaggagc acgagagatc aaaccgagaa ggttgaacct 125700 agtggccaaa gacgacgagc ttcgacaagg aagtatcaat cgagccataa cacccaaaaa 125760 tcaagctatt aaaaccctag aaaacactct ccactacaga gaatcaatca aaacacacag 125820 taagagaaaa ccagagcgac aaggctaggg ctgcggactt tataagggat gtgttaatcg 125880 gatagcattt aaatgaaaaa gaaaattatg gccacgaaaa ttcaatatta atattaacaa 125940 acaaacaaac aaaaaattga tcttgcgatt cgagtgatga tcaaaatcga taggaggaag 126000 aagacgagat taatacccga gatctgcgat tatcagatga aggaggcaca actcatataa 126060 tcacaagaag aaaaatgctt tgctttgtgt gctctgctga tatatttata taaccaaaaa 126120 aaaaagatat ttttcgctaa caaaagaaaa aggataaaaa ggaataacag aaattatttg 126180 tattttatta ttgtgtctta tccaatttcc tatcgctgca ctttagcacc tcgaggttac 126240 tctattccaa aaaaaatcag tgtttctgaa aaaaaaaaat atttccaaaa catataactg 126300 tgactaataa aatttaattg gttaacaaat atagaaaata actaatgaca aaaaaataat 126360 gtataagact attagtaatc aaaattttat attttttttg gatatagtaa gaactcgaaa 126420 acatacattt tttgaaatag agagtaattt atttttggtc aacaactcaa ctgaagaaga 126480 gaggtgtatt ttactatttc aaccggataa agaagaggtt acaacaaatc gatgctaatt 126540 ctagttaacc aataaccaaa atcgcaattt tctctaacat atcatggtaa acagagtttg 126600 acaaagactt gttgaagtat agttggcttc ataagcggtg catttaagaa caacttattt 126660 gaaaaattaa aatttcatca ataacattat tgatctgttt cagcatatta tatcggcaac 126720 aatatgcaat tgcctcaacc acatagaaat ggcctagaac catagaaaaa aaaatctcaa 126780 caaatagctt ttttcttgta taaaaacaac cccttatagc ctaattagct aatgccttca 126890 cagctttctc tgctgcgtca tccaaatcat cagctgttat gagtttcatt ccactttcct 126900 tgaggattct ctttccttgt tcaacatttg ttccttccag acgaaccacc actggtact t 126960 tcagtgacac ctatcatgtg gggtttggtt tcgcacaaaa ctctatcaat taactattta 127020 tgtttatata tgatgaaata tgtatgcttc gttttgctca cctctttagc agcattcaca 127080 attccactag caatcacatc acatttcatt atcccaccga atatgttcac caatattgct 127190 ttcactttat cgtccgatgt cagtatctta aacgcctcca ccacctatta ttatcacagc 127200 cttttggtta aactggttta aacctaacaa gcttgatagc cagagatact acgaagaaca 127260 tgttttcctt acctggtgtt cagaagcgtt tccaccaacg tcaaggaaat ttgcgggagt 127320 cccaccgtgc agtttaatga tgtccatggt tgccatggcc aatccagcac cattcaccat 127380 gcacgccaat ctctccatct aaaccgatat agttcaggtc cacttttgca gcagccacct 127440 acgagatgaa acgacacact ttccttcatc aagctt 127476 <210> 33 <211> 2164 <212> ADN
<213> Raphanus sativus <220>
<223> Séquence correspondant à la séquence n° 6 avec introns <400> 33 atgttggcta gggtttatag atccggatct tcttcttctc ctgctgtgtc tgcggctaga 60 ttgttctgta cgagatcgat tcgtcatgct ctggccaaga aaagcaggga tggagagagt 120 ggttttggag gagagagttt gaâgctgcga agcggatttc acgaaatcaa agggttagaa 180 gatgcgattg atttgttcgg tgatatggta cgatctcgtc ctttaccttc agtaattgat 240 ttctgtaaat tgatgggagt tgtggtgagg atgggaaggc tcgatgttgt gatttctctc 300 cataggaaga tggaaatgag gcgggttcca tgtaacgcat acagcttcac catcctgatg 360
<213> Raphanus sativus <220>
<223> Séquence correspondant à la séquence n° 6 avec introns <400> 33 atgttggcta gggtttatag atccggatct tcttcttctc ctgctgtgtc tgcggctaga 60 ttgttctgta cgagatcgat tcgtcatgct ctggccaaga aaagcaggga tggagagagt 120 ggttttggag gagagagttt gaâgctgcga agcggatttc acgaaatcaa agggttagaa 180 gatgcgattg atttgttcgg tgatatggta cgatctcgtc ctttaccttc agtaattgat 240 ttctgtaaat tgatgggagt tgtggtgagg atgggaaggc tcgatgttgt gatttctctc 300 cataggaaga tggaaatgag gcgggttcca tgtaacgcat acagcttcac catcctgatg 360
57/58 aagtgtttct gcagctgctc taagctgccg tttgctttgt ctacatttgg taagatcacc 420 aagcttggtt ttcatcccac tgttgttacc ttcagcaccc tgctccacgg attatgtgtg 480 gaagacagga tctctgaagc ettggatttg tttcatcaaa tgtgtaaacc aaatgtcgta 540 accttcacca cgctgatgaa cggtctttgc cgtgagggtc gagttgtcga agctgtagct 600 ctgcttgatc ggatgctaga agatggtctc cagcctaacc agattactta tggaacaatc 660 gtggatggga tgtgtaagat gggagacact gtgtctgcat tgaatcttct gaggaagatg 720 gaggaggtga gccacatcaa acccaatgtg gtaatctggc ctttggaaag acggacgtca 780 taccgatgct caaaatcttt tcagtgaaat gcaagacaag ggaatctttc ccaatttatt 890 tacctacagc tgtatgatta atggattttg tagctctggt agatggagtg aagcccagca 900 gttgttgcaa gaaatgttag aaaggaagaa gatcagccct gatgttgtaa cttataatgc 960 tttgatcaat gcatttgtca aggaaggcaa attctttgag gctgaagaat tatacgatga 1020 gatgcttcca aggggtataa tccctagtac aatcacatat agttcaatga tcgatggatt 1080 ttgcaaacag aatcgtcttg atgctgctga gcacatgttt tatttgatgg ctaccaaggg 1140 ctgctctccg gacataatca ctttcaatac tctcatagcc ggatactgta gagctaagag 1200 ggtagatgat ggaataaaac ttctccatga gatgactgaa gcaggattag ttgctaacac 1260 aattacttac accactctta ttcacgggtt ctgtcaggtg ggcgatctta atgctgctca 1320 agaccttcta caggagatgg tctctagtgg tgtgtgccct aatgtcgtta cttgtaacac 1380 tttgctggac ggtctctgcg ataatgggaa actaaaagat gcattggaaa tgtttaaggc 1490 tatgcagaag agtaagatgg atattgatgc tagtcacccc tttaatggtg tggaacctga 1500 tgttcaaact tacaatatat tgatcagtgg cttgatcaat gaagggaagt ttttagaggc 1560 cgaggaatta tacgaggaga tgccacacag aggtatagtc ccagatacta tcacctataa 1620 ctcagtgatc catggtttat gcaagcaaag ccgcctagat gaggctacac aaatgtttga 1680 ttcgatgggt agcaagagct tctctccaaa cgtagtgacc tttactacac tcattaatgg 1790 atactgtaag gcaggaaggg ttgatgatgg gctggagctt ttctgcgaga tgggtcgaag 1800 agggatagtt gctaacgcaa ttacttacat cactttgatt catggttttc gtaaagtggg 1860 taatattaat ggggctctag atattttcca ggagatgatg gcaagtggtg tgtatcctga 1920 taccattact atccgcaata tgctgactgg tttatggagt aaagaggaac taaaaagggc 1980 agtggcaatg cttgaggatc tgcagatgag tgtgggtatg tcattcaaca attttgtttt 2040 caaatttcgt tgcttacctt taagtttctg gagaagagct gcagcttttg ctgtagcatc 2100 agggaagctt gcataaacgg tttggtgtgt ttgttttgca ggatatcagt tggaggatga 2160 ataa 2169 <210> 34 <211> 2191 <212> ADN
<213> Raphanus sativus <220>
<223> Séquence correspondant à la séquence n° 5 avec introns <400> 34 atgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgagtc tgcggctaga 60 ttgttctgta cgagatcgat tcgtgatact ctggccaagg caagcggaga gagttgcgaa 120 gcaggttttg gaggagagag tttgaagctg caaagtgggt ttcatgaaat caaaggttta 180 gaggatgcga ttgatttgtt cagtgacatg cttcgatctc gtcctttacc ttctgtggtt 290 gatttctgta aattgatggg tgtggtggtg agaatggaac gcccggatct tgtgatttct 300 ctctatcaga agatggaaag gaaacagatt cgatgtgata tatacagctt caatattctg 360 ataaaatgtt tctgcagctg ctctaagctc ccctttgctt tgtctacatt tggtaagatc 420 accaagcttg gactccaccc tgatgttgtt accttcacca ccctgctcca tggattatgt 480 gtggaagata gggtttctga agccttggat ttttttcatc aaatgtttga aacgacatgt 540 aggcccaatg tcgtaacctt caccactttg atgaacggtc tttgccgcga gggtagaatt 600 gtcgaagccg tagctctgct tgatcggatg atggaagatg gtctccagcc tacccagatt 660 acttatggaa caatcgtaga tgggatgtgt aagaagggag atactgtgtc tgcactgaat 720 ctgctgagga agatggagga ggtgagccac atcataccca atgttgtaat ctatagtgca 780 atcattgata gcctttgtaa agacggacgt catagcgatg cacaaaatct tttcactgaa 840 atgcaagaga aaggaatctt tcccgattta tttacctaca acagtatgat agttggtttt 900 tgtagctctg gtagatggag cgacgcggag cagttgttgc aagaaatgtt agaaaggaag 960 atcagccctg atgttgtaac ttataatgct ttgatcaatg catttgtcaa ggaaggcaag 1020 ttctttgagg ctgaagaatt atacgatgag atgcttccaa ggggtataat ccctaataca 1080
<213> Raphanus sativus <220>
<223> Séquence correspondant à la séquence n° 5 avec introns <400> 34 atgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgagtc tgcggctaga 60 ttgttctgta cgagatcgat tcgtgatact ctggccaagg caagcggaga gagttgcgaa 120 gcaggttttg gaggagagag tttgaagctg caaagtgggt ttcatgaaat caaaggttta 180 gaggatgcga ttgatttgtt cagtgacatg cttcgatctc gtcctttacc ttctgtggtt 290 gatttctgta aattgatggg tgtggtggtg agaatggaac gcccggatct tgtgatttct 300 ctctatcaga agatggaaag gaaacagatt cgatgtgata tatacagctt caatattctg 360 ataaaatgtt tctgcagctg ctctaagctc ccctttgctt tgtctacatt tggtaagatc 420 accaagcttg gactccaccc tgatgttgtt accttcacca ccctgctcca tggattatgt 480 gtggaagata gggtttctga agccttggat ttttttcatc aaatgtttga aacgacatgt 540 aggcccaatg tcgtaacctt caccactttg atgaacggtc tttgccgcga gggtagaatt 600 gtcgaagccg tagctctgct tgatcggatg atggaagatg gtctccagcc tacccagatt 660 acttatggaa caatcgtaga tgggatgtgt aagaagggag atactgtgtc tgcactgaat 720 ctgctgagga agatggagga ggtgagccac atcataccca atgttgtaat ctatagtgca 780 atcattgata gcctttgtaa agacggacgt catagcgatg cacaaaatct tttcactgaa 840 atgcaagaga aaggaatctt tcccgattta tttacctaca acagtatgat agttggtttt 900 tgtagctctg gtagatggag cgacgcggag cagttgttgc aagaaatgtt agaaaggaag 960 atcagccctg atgttgtaac ttataatgct ttgatcaatg catttgtcaa ggaaggcaag 1020 ttctttgagg ctgaagaatt atacgatgag atgcttccaa ggggtataat ccctaataca 1080
58/58 atcacatata gttcaatgat cgatggattt tgcaaacaga atcgtcttga tgctgctga g 1190 cacatgtttt atttgatggc taccaagggc tgctctccca acctaatcac tttcaatact 1200 ctcatagacg gatattgtgg ggctaagagg atagatgatg gaatggaact tctccatga g 1260 atgactgaaa caggattagt tgctgacaca actacttaca acactcttat tcacgggtt c 1320 tatctggtgg gcgatcttaa tgctgctcta gaccttttac aagagatgat ctctagtggt 1380 ttgtgccctg atatcgttac ttgtgacact ttgctggatg gtctctgcga taatgggaa a 1940 ctaaaagatg cattggaaat gtttaaggtt atgcagaaga gtaagaagga tcttgatgct 1500 agtcacccct tcaatggtgt ggaacctgat gttcaaactt acaatatatt gatcagcgg c 1560 ttgatcaatg aagggaagtt tttagaggcc gaggaattat acgaggagat gccccacagg 1620 ggtatagtcc cagatactat cacctatagc tcaatgatcg atggattatg caagcagag c 1680 cgcctagatg aggctacaca aatgtttgat tcgatgggta gcaagagctt ctctccaaac 1740 gtagtgacct ttactacact cattaatggc tactgtaagg caggaagggt tgatgatggg 1800 ctggagcttt tctgcgagat gggtcgaaga gggatagttg ctaacgcaat tacttacat c 1860 actttgattt gtggttttcg taaagtgggt aatattaatg gggctctaga cattttcca g 1920 gagatgattt caagtggtgt gtatcctgat accattacca tccgcaatat gctgactggt 1980 ttatggagta aagaggaact aaaaagggca gtggcaatgc ttgagaaact gcagatgagt 2040 atggtatgta agtttctgtt cagtctatgt attttttata taaacaagaa tgtatacatt 2100 cttttgtgtg tagcttcaga ttgatgatac acgttctgga attaaccatt ggtttggttt 2160 tgcattgtag gatctatcat ttgggggatg a 2191
Claims (31)
1. Séquence peptidique PPR (pentatricopeptide) capable de restaurer la fertilité
mâle de plantes, caractérisée en ce qu'elle comprend au moins une séquence parmi a) SEQ ID N o1, SEQ ID N o2 ou SEQ ID N o3, b) une séquence peptidique comportant au moins 80% d'identité avec une séquence du a), c) un fragment peptidique biologiquement actif représentatif d'une séquence du a) ou b).
mâle de plantes, caractérisée en ce qu'elle comprend au moins une séquence parmi a) SEQ ID N o1, SEQ ID N o2 ou SEQ ID N o3, b) une séquence peptidique comportant au moins 80% d'identité avec une séquence du a), c) un fragment peptidique biologiquement actif représentatif d'une séquence du a) ou b).
2. Séquence nucléotidique isolée, caractérisée en ce qu'elle code pour une séquence peptidique selon la revendication 1.
3. Séquence nucléotidique isolée permettant de restaurer la fertilité mâle des plantes, caractérisée en ce qu'elle comprend une séquence nucléotidique choisie parmi a)SEQ ID N o4, SEQ ID N o5, SEQ D7 N o6, b) une séquence nucléotidique complémentaire d'une séquence du a), c)une séquence nucléotidique homologue hybridant dans des conditions stringentes avec une séquence du a).
4. Construction nucléotidique, caractérisée en ce qu'elle comprend au moins une séquence nucléotidique selon la revendication 2 ou 3, liée opérationnellement à une séquence promotrice.
5. Construction nucléotidique selon la revendication 4, caractérisée en ce que le promoteur est un promoteur constitutif.
6. Construction nucléotidique selon la revendication 4, caractérisée en ce que le promoteur est un promoteur spécifique des anthères suffisamment actif pour contrôler l'expression du gène PPR spécifiquement dans les anthères.
7. Construction nucléotidique selon la revendication 4, caractérisée en ce que le promoteur est choisi parmi des promoteurs de gènes PPR de radis clonés et séquencés.
8. Amorces permettant de mettre en évidence la présence ou l'absence des SEQ
ID
No 4 à 6 au sein d'un échantillon, caractérisées en ce qu'elles comportent une séquence comprenant au moins 15 bases consécutives d'une des séquences SEQ ID
No 4 à 6.
ID
No 4 à 6 au sein d'un échantillon, caractérisées en ce qu'elles comportent une séquence comprenant au moins 15 bases consécutives d'une des séquences SEQ ID
No 4 à 6.
9. Sondes permettant de mettre en évidence la présence ou l'absence des SEQ ID
No 4 à 6 au sein d'un échantillon, caractérisées en ce qu'elles sont spécifiques des séquences correspondant à l'allèle restaurateur de la fertilité mâle en conditions de forte stringence.
No 4 à 6 au sein d'un échantillon, caractérisées en ce qu'elles sont spécifiques des séquences correspondant à l'allèle restaurateur de la fertilité mâle en conditions de forte stringence.
10. Cellule de plante, plante, ou partie de plante transformée par une séquence nucléotidique selon la revendication 2 ou 3.
11. Plante selon la revendication 10, caractérisée en ce qu'elle est choisie parmi le genre Brassica, notamment Brassica napus.
12. Procédé de restauration de la fertilité d'une plante du genre Brassica, caractérisé
en ce qu'il comprend l'introduction dans une plante mâle stérile d'une séquence nucléotidique selon la revendication 2.
en ce qu'il comprend l'introduction dans une plante mâle stérile d'une séquence nucléotidique selon la revendication 2.
13. Procédé de restauration de la fertilité d'une plante Brassica, caractérisé
en ce qu'il comprend l'introduction dans une plante mâle stérile d'une séquence nucléotidique codant pour une protéine selon la revendication 1, de préférence pour PPR-A ou PPR-B ou PPR-C.
en ce qu'il comprend l'introduction dans une plante mâle stérile d'une séquence nucléotidique codant pour une protéine selon la revendication 1, de préférence pour PPR-A ou PPR-B ou PPR-C.
14. Procédé selon la revendication 13, caractérisé en ce que la plante est une Brassica, notamment Brassica napus.
15. Procédé d'introduction d'un gène restaurateur de fertilité issu de radis, dans une plante Brassica, caractérisé en ce qu'il comprend le croisement ou la fusion cellulaire entre la plante Brassica exprimant un gène de stérilité mâle cytoplasmique Ogura et/ou Kosena, qui induit la stérilité de cette plante Brassica et une plante exprimant au moins une partie de gène Rfo et présentant un phénotype mâle fertile, de manière à
introduire le gène Rfo restaurateur de fertilité dans la plante du genre Brassica et à
obtenir une plante hybride à fertilité restaurée, la partie du gène Rfo introduite comprenant de préférence une séquence codant pour PPR-A ou PPR-B ou PPR-C.
introduire le gène Rfo restaurateur de fertilité dans la plante du genre Brassica et à
obtenir une plante hybride à fertilité restaurée, la partie du gène Rfo introduite comprenant de préférence une séquence codant pour PPR-A ou PPR-B ou PPR-C.
16. Procédé de restauration de la fertilité d'une plante Brassica selon l'une des revendications 12 ou 13, caractérisé en ce qu'il comprend l'introduction de séquences codant pour PPR-A ou PPR-B ou PPR-C individuellement, ou de PPR-A et PPR-B et PPR-C simultanément pour obtenir la restauration de la fertilité mâle.
17. Procédé d'obtention de semences hybrides par croisement entre une plante restauratrice de fertilité selon l'une des revendications 10 ou 11 et une plante mâle stérile.
18. Utilisation d'une séquence peptidique choisie parmi PPR-A, PPR-B, ou PPR-C
ou la combinaison d'au moins deux de ces séquences pour restaurer la fertilité
chez les Brassica.
ou la combinaison d'au moins deux de ces séquences pour restaurer la fertilité
chez les Brassica.
19. Procédé de criblage de séquences nucléotidiques polymorphes capables d'améliorer l'efficacité de la restauration de fertilité, caractérisé en ce qu'il comprend :
- la détermination de la restauration obtenue avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N o1, SEQ ID N o2, SEQ ID N o3 - la détermination de la restauration obtenue avec une séquence nucléotidique candidat selon la revendication 3a) ou 3b), - la sélection de candidats permettant d'obtenir au moins 20%, de préférence au moins 80, 90% de la restauration avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N o1, SEQ ID N o2, SEQ ID N o3.
- la détermination de la restauration obtenue avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N o1, SEQ ID N o2, SEQ ID N o3 - la détermination de la restauration obtenue avec une séquence nucléotidique candidat selon la revendication 3a) ou 3b), - la sélection de candidats permettant d'obtenir au moins 20%, de préférence au moins 80, 90% de la restauration avec une séquence nucléotidique codant pour un peptide choisi parmi SEQ ID N o1, SEQ ID N o2, SEQ ID N o3.
20. Procédé de criblage pour détecter la présence d'une séquence nucléotidique codant pour une protéine PPR dans une plante, caractérisé en ce qu'il comprend une étape d'amplification utilisant au moins une séquence amorce selon la revendication 8 et/ou une étape d'hybridation d'au moins une séquence sonde selon la revendication 9.
21. Procédé de production de variétés hybrides de colza dont la fertilité mâle est restaurée comprenant les étapes suivantes :
a) Introduction d'une séquence nucléotidique selon la revendication 3 dans une plante de colza mâle stérile utilisée comme géniteur mâle et exprimant le gène PPR, b) Croisement entre la plante obtenue à l'étape a) avec une lignée de colza mate stérile utilisée comme femelle, et c) Production de la variété hybride issus du croisement de l'étape b).
a) Introduction d'une séquence nucléotidique selon la revendication 3 dans une plante de colza mâle stérile utilisée comme géniteur mâle et exprimant le gène PPR, b) Croisement entre la plante obtenue à l'étape a) avec une lignée de colza mate stérile utilisée comme femelle, et c) Production de la variété hybride issus du croisement de l'étape b).
22. Semences hybrides dont la fertilité est restauré par le gène PPR obtenues à partir des plantes obtenues par le procédé selon la revendication 21.
23. Utilisation d'une plante exprimant les séquences nucléotidiques selon la revendication 3 pour restaurer de la fertilité d'une lignée de colza utilisée comme femelle dans un croisement ou dans la production de semences d'une variété
hybride.
hybride.
24. Vecteur de clonage et/ou d'expression comprenant une séquence nucléotidique isolée selon la revendication 3.
25. Cellule hôte recombinante caractérisée en ce qu'elle est transformée avec un vecteur recombinant selon la revendication 24.
26. Cellule hôte recombinante selon la revendication 25 caractérisée en ce qu'elle est choisie parmi les bactéries, notamment E. coli ou Agrobacterium, les levures, les cellules animales et préférentiellement les cellules végétales, plus spécificiquement les cellules de brassicacées.
27. Organisme multicellulaire végétal recombinant, caractérisé en ce qu'il comprend une cellule recombinante selon l'une quelconque des revendications 25 et 26.
28. Plante transgénique transformée avec un vecteur selon la revendication 24.
29. Plante transgénique porteuses du cytoplasme inducteur de stérilité orale cytoplasmique transformée un vecteur selon la revendication 24.
30. Plante transgénique selon la revendication 29 caractérisée en ce qu'elle est choisie parmi les plantes des espèces suivantes : Brassica oleacera, Brassica napus, Brassica campestris ou encore Raphanus sativus.
31. Construction nucléotidique selon l'une quelconque des revendications 4 à
7, caractérisée en ce qu'elle consiste en les séquences SEQ ID N o4, SEQ ID N o5 et SEQ
ID N o6 liée opérationnellement à une séquence promotrice.
7, caractérisée en ce qu'elle consiste en les séquences SEQ ID N o4, SEQ ID N o5 et SEQ
ID N o6 liée opérationnellement à une séquence promotrice.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR02/13512 | 2002-10-29 | ||
FR0213512 | 2002-10-29 | ||
PCT/FR2003/003224 WO2004039988A1 (fr) | 2002-10-29 | 2003-10-29 | Sequences peptidiques ppr capables de restaurer la fertilite male de plantes porteuses d'un cytoplasme inducteur de sterilite male |
Publications (1)
Publication Number | Publication Date |
---|---|
CA2503837A1 true CA2503837A1 (fr) | 2004-05-13 |
Family
ID=32187576
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CA002503837A Abandoned CA2503837A1 (fr) | 2002-10-29 | 2003-10-29 | Sequences peptidiques ppr capables de restaurer la fertilite male de plantes porteuses d'un cytoplasme inducteur de sterilite male |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP1556495A1 (fr) |
AU (1) | AU2003288341A1 (fr) |
CA (1) | CA2503837A1 (fr) |
WO (1) | WO2004039988A1 (fr) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7314971B2 (en) * | 2001-07-12 | 2008-01-01 | Basf Plant Science Gmbh | Nuclear fertility restorer genes and methods of use in plants |
CN102640700A (zh) * | 2012-05-04 | 2012-08-22 | 湖南省作物研究所 | 甘蓝型油菜ogu cms恢复系及其转育方法和应用 |
CN106967803B (zh) * | 2017-03-21 | 2020-09-29 | 北京市农林科学院 | 一种检测萝卜Ogura-CMS育性恢复基因的高通量分子标记及应用 |
CN113355453B (zh) * | 2021-08-09 | 2021-10-29 | 华智生物技术有限公司 | 一种甘蓝型油菜萝卜细胞质不育恢复基因Rfo的SNP分子标记及其应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2108230C (fr) * | 1992-10-14 | 2006-01-24 | Takako Sakai | Methodes pour l'introduction d'un gene restaurateur de la fertilite et pour la production d'hybride f1 de brassicacees |
GB9513881D0 (en) * | 1995-07-07 | 1995-09-06 | Zeneca Ltd | Improved plants |
CA2193938A1 (fr) * | 1996-12-24 | 1998-06-24 | David G. Charne | Oleagineux du genre brassica renfermant un gene restaurateur de la fertilite ameliore encodant la sterilite male cytoplasmique ogura |
EP1382612B1 (fr) * | 2001-04-25 | 2011-07-27 | Institut National de la Recherche Agronomique | Proteine participant a la restauration de fertilite de la sterilite male cytoplasmique et gene codant ladite proteine |
EP1404814B1 (fr) * | 2001-07-12 | 2013-06-19 | McGill University | Genes nucleaires restaurateurs de fertilite et procedes d'utilisation associes pour les plantes |
-
2003
- 2003-10-29 WO PCT/FR2003/003224 patent/WO2004039988A1/fr not_active Application Discontinuation
- 2003-10-29 CA CA002503837A patent/CA2503837A1/fr not_active Abandoned
- 2003-10-29 EP EP03780246A patent/EP1556495A1/fr not_active Withdrawn
- 2003-10-29 AU AU2003288341A patent/AU2003288341A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
WO2004039988A9 (fr) | 2005-04-07 |
EP1556495A1 (fr) | 2005-07-27 |
WO2004039988A1 (fr) | 2004-05-13 |
AU2003288341A1 (en) | 2004-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102613296B1 (ko) | 신규한 crispr 효소 및 시스템 | |
CN106998665B (zh) | 单倍体植物的产生 | |
AU2023204276A1 (en) | Novel CRISPR-associated transposases and uses thereof | |
KR102253223B1 (ko) | 식물 내 담배 특이 니트로사민 감소 | |
CN113015797A (zh) | Rna-指导的核酸酶及其活性片段和变体及其使用方法 | |
RU2756102C2 (ru) | Гены протеаз табака | |
CN115175556B (zh) | 与大豆中锈病抗性相关联的新颖的遗传基因座 | |
CN107223155A (zh) | 单倍体诱导系 | |
CN106687594A (zh) | 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法 | |
MXPA06002155A (es) | Plantas de arroz que tienen una tolerancia incrementada a los herbicidas de imidazolinona. | |
TW201144442A (en) | Production of DHA and other LC-PUFAs in plants | |
CN108882689A (zh) | 烟草植物体及其制备方法 | |
KR20170020416A (ko) | 식물 내의 질산염 함량 조절 | |
CN111295447B (zh) | 玉米优良事件mzir098 | |
AU2002322469B2 (en) | Nuclear fertility restorer genes and methods of use in plants | |
CN110892074A (zh) | 用于增加香蕉的保质期的组成物及方法 | |
CN109788738A (zh) | 小麦 | |
CN111542610A (zh) | 精确基因组编辑的新策略 | |
CN115485386A (zh) | 低生物碱含量的烟草属植物体及其制备方法 | |
CN107163113B (zh) | 水稻半卷叶控制基因srl9及其叶形改良的用途 | |
KR20220165764A (ko) | 니코티아나 타바쿰에서 니코틴 수준을 조절하는 방법 | |
CN114514321A (zh) | 调节植物中的糖和氨基酸含量(sultr3) | |
CA2503837A1 (fr) | Sequences peptidiques ppr capables de restaurer la fertilite male de plantes porteuses d'un cytoplasme inducteur de sterilite male | |
KR101760932B1 (ko) | 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법 | |
KR101760934B1 (ko) | 양파의 임성회복 관련 분자 마커 및 웅성-가임 또는 웅성-불임의 선별방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EEER | Examination request | ||
FZDE | Discontinued |