PT1040192E

PT1040192E - Plantas transgénicas resistentes a insectos e métodos para melhoramento da actividade 8-endotoxina contra insectos

Info

Publication number: PT1040192E
Application number: PT98964762T
Authority: PT
Inventors: Susan M Brussock; Leigh English; Thomas M Malvar; James W Bryson; Caroline A Kulesza; Frederick S Walters; Stephen L Slatin; Michael A Von Tersch; Charles Romano
Original assignee: Monsanto Technology Llc
Priority date: 1997-12-18
Filing date: 1998-12-17
Publication date: 2006-12-29
Also published as: ATE335822T1; EP1801220A2; ATE555123T1; CA2314429A1; EP1040192A1; AU2001399A; CN1286728A; WO1999031248A9; DK1040192T3; EP1040192B1; ES2273447T3; AR023762A2; CN100340666C; DE69835538D1; BR9814294A; WO1999031248A1; EP1749834B1; CY1106323T1; EP1749834A1; EP1801220A3

Description

1 ΡΕ1040192

DESCRIÇÃO "PLANTAS TRANSGÉNICAS RESISTENTES A INSECTOS E MÉTODOS PARA MELHORAMENTO DA ACTIVIDADE DE δ—ENDOTOXINA CONTRA INSECTOS" 1.0 Fundamento do Invento 1.1 Campo do Invento

Este invento está relacionado com métodos para a produção de δ-endotoxinas recombinantes, manipuladas geneticamente, derivadas de Bacillus thuringiensis que são úteis no controlo da lagarta da raiz do milho do sul (Diabrotica undecimpunctata howardi Barber) e lagarta da raiz do milho do leste (Diabrotica virgifera virgifera LeConte). 1.2 Descrição da Técnica Anterior

Quase todos os campos de cultura, plantas e áreas de culturas comerciais são susceptiveis a ataque de uma ou mais pragas de insectos. Particularmente problemáticas são as pragas de Coleópteros e Lepidópteros. Por exemplo, culturas hortícolas tais como alcachofras, couve-rábano, rúcula, alho-porro, espargos, lentilhas, feijões, alface (e.g. de repolho, de folhas, árabe), beterrabas, "bokchoy", 2 ΡΕ1040192 malanga, brócolos, tipos de melão (e.g., meloa, melancia, melão de Crenshaw, melão de Inverno, melão), couves de Bruxelas, couve, cardinhos, cenouras, couve napa, couve-flor, quiabo, cebolas, aipo, salsa, grão de bico, pastinaca, chicória, ervilhas, couve chinesa, pimentos, couve-de-folhas, batatas, pepino, abóboras, cucurbitácias, rabanetes, cebolas de cabeça seca, rutabaga, beringela, salsifi, escarola, chalotas, endivia, soja, alho, espinafre, cebolinhos, abóbora, verduras diversas para saladas, beterraba sacarina, batata-doce, nabo, acelgas, rábano selvagem, tomates, couve-lombarda, nabos, e diversas ervas aromáticas são sensíveis a infestações de uma ou mais das seguintes pragas de insectos: lagarta medidora da alfafa, lagarta das pastagens Pseudaletia, lagarta Spodoptera da beterraba, traça da alcachofra, lagarta dos rebentos da couve, lagarta medidora da couve, teia da couve, traça Helicoverpa do milho, lagarta das folhas do aipo, lagarta de listas cruzadas (Evergestis) da couve, broca do milho europeia (Ostrinia) , traça-das-crucíferas (traça-diamante) , lagarta verde do trevo, lagarta da couve importada (para os EUA), lagarta do melão, enrolador da folha omnívoro (Platynota), lagarta (Diaphania) do pepino, complexo das lagarta da casca do melão, lagarta do sapal (Estigmene), lagarta medidora da soja, lagarta dos rebentos do tabaco, lagarta do fruto do tomateiro, lagarta (Manduca) do tomateiro, nemátodo do tomate, lagarta da mucuna, e a lagarta da traça de listas amarelas (Spodoptera). Da mesma 3 ΡΕ1040192 forma, os pastos e forragens como a alfafa, ervas de pastagem e silagem são muitas vezes atacadas por pragas como lagartas da traça Pseudaletia, lagartas da beterraba, lagarta da alfafa, lagarta europeia, diversas lagartas medidoras e tecedeiras, assim como lagartas de traça de listas amarelas. Pomares e vinhas como maçãs, damascos, cerejas, nectarinas, pêssegos, peras, ameixas de consumo em fresco, ameixas de consumo em seco, marmelos, amêndoas, castanhas, avelãs, noz americana, pistácios, nozes, citrinos, amoras silvestres, arando, amoras de Boysen, mirtilo, groselha, framboesa americana, framboesa, morangos, uvas, pêra-abacate, bananas, kiwi, caquis, romãs, ananás, frutos tropicais são muitas vezes susceptiveis ao ataque e desfoliação pela traça esfinge "achema", amorbia, traças Pseudaletia, rosca dos citrinos, lagarta da banana, lagarta de cabeça preta Rhopobota naevana, enrolamento do arando, lagartas da família Geometridae, lagartas da cereja, rosca dos citrinos, anel do mirtilo, lagarta de tenda do leste, lagarta da teia do Outono, enrolamento da aveleira, lagarta da teia da aveleira, enrolamento das frutícolas, traça da uva, enroladora da vinha, esqueletizadora da parra (Harrisina americana), lagarta verde da fruta, gummosos-batrachedra commosae, traça cigana, lagarta da casca da noz americana, lagartas da família Sphingidae, lagartas medidoras, lagartas da laranja de umbigo, o enrolador de folhas de bandas oblíquas {Tortricidae) , o enrolador de folhas omnívoro Playnota 4 ΡΕ1040192 stultana, lagarta medidora, traça Tortrix das laranjas, lagarta "orangedog" (Papilio cresphontes), traça da fruta oriental, enrolador de folhas (Pandemis pyrusana), broca do pessegueiro, casulo da noz de pecan (Acrobasis nuxvorella) , enrolador da folha de lista vermelha, lagarta de bossa vermelha (Schizura concinna), rosca de pele enrugada, lagarta do sapal (Estigmene acrea), lagarta medidora, lagarta de tenda, "thecla-thecla basillides", lagarta dos rebentos do tabaco, traça pandemis, traça de tufos dos gomos da macieira, enrolador de folhas variegado (Platynota flavedana) , lagarta das nozes, lagarta de tenda do oeste, e traça de listas amarelas.

Campos de culturas como a canola/semente de colza, primola da noite, prado-espuma, milho (forrageiro, doce, para pipocas), algodão, lúpulos, jojoba, amendoins, arroz, açafroa, gramineas (centeio, aveia, cevada, trigo, etc.), sorgo, sojas, girassol, e tabaco são muitas vezes alvo de infestação por insectos que incluem a larva da traça Pseudaletia, broca asiática e outras do milho, traça listada do girassol, traça da beterraba, lagarta Helicoverpa, lagarta medidora da couve, lagarta da raiz do milho (incluindo as variedades do Sul e do Oeste), lagarta roedora da folha do algodão, traça-das-cruciferas (traça-diamante) , broca do milho europeia, lagarta verde do trevo, traça da cabeça do girassol, lagarta da espiga do sorgo, lagarta da couve importada, lagartasmedidoras (incluindo Anacamptodes spp.), o enrolador de folhas de bandas 5 ΡΕ1040192 oblíquas (Tortricidae) , lagarta da folha omnívora Cnephasia longana, lagarta da vagem, lagarta do sapal, broca do milho do Sudoeste, lagarta medidora da soja, broca malhada, traça do girassol, lagarta dos rebentos do tabaco, larva do tabaco (Manduca sexta), lagarta da soja.

Plantas de canteiro, flores, plantas ornamentais, vegetais e plantas de viveiro são frequentemente atacadas por um grande número de pragas de insectos como a lagarta Pseudaletia, a traça da azálea, a lagarta da beterraba (Spodoptera exígua), traça-das-crucíferas (traça-diamante) , a traça Ello (Erinnyis ello), lagarta do feto da Flórida, traça de Io (Automeris io) , lagartas medidoras, traça do oleandro, enrolador de folhas omnívoro Playnota stultana, lagarta medidora omnívora Sabulodes caberata, e lagarta dos rebentos do tabaco. Árvores de floresta, fruteiras, ornamentais e produtoras de nozes, assim como arbustos e outras de viveiro são muitas vezes susceptíveis ao ataque de diversos insectos como a lagarta da vagem, lagarta dos rebentos de cabeça preta Aderis variana, traça de cauda castanha ou portésia (Euproctis chrysorrhoea) , lagarta do carvalho da califórnia, traça de tufo do abeto de Douglas, lagarta medidora do olmeiro, lagarta da teia do Outono, enroladora das frutícolas, lagarta do bordo (Acer) de listas verdes, traça cigana, lagarta dos rebentos de Pinus banksiana, teia da acácia mimosa, borboleta do pinheiro, lagarta de bossa vermelha, a lagarta de sela, lagarta de sela proeminente, 6 ΡΕ1040192 lagartas medidoras da Primavera e do Outono, lagarta dos rebentos do abeto Spruce, lagarta da teia, lagarta tortrix, e traça de tufo do oeste. Da mesma forma ervas para relvados são muitas vezes atacadas por pragas como a lagarta das pastagens (Pseudaletia), teia da relva e teia da relva tropical.

Devido às culturas agrícolas com interesse comercial serem muitas vezes o alvo do ataque por insectos, em muitos casos são desejáveis métodos ambientalmente sensíveis para o controlo ou erradicação da infestação por insectos. Isto é particularmente importante para agricultores, viveiristas, plantadores e áreas comerciais e residenciais em que se pretenda controlar populações de insectos usando composições amigas do ambiente.

As formulações insecticidas ambientalmente sensíveis mais largamente usadas e desenvolvidas nos últimos anos têm sido compostas por pesticidas microbianos derivados da bactéria Bacillus thuringiensis. B. thuringiensis é uma bactéria Gram-positiva que produz proteínas formadoras de cristais, ou corpos de inclusão, que são especificamente tóxicas para determinadas ordens e espécies de insectos. Muitas estirpes diferentes de B. thuringiensis mostraram produzir proteínas insecticidas formadoras de cristais. Composições incluindo estirpes de B. thuringiensis que produzem proteínas insecticidas têm sido comercializadas e usadas como insecticidas aceitáveis em termos ambientais devido a serem muito tóxicas para o insecto alvo especí- 7 ΡΕ1040192 fico, mas serem inofensivas para plantas e outros organismos não alvo. 1.2.1 ô-Entotoxinas

As δ-endotoxinas são usadas para controlar uma larga gama de lagartas e escaravelhos comedores de folhas, assim como mosquitos. Estes cristais paraspóricos proteicos, também referidos como proteínas cristais insecticidas, proteínas do cristal, inclusões Bt, inclusões cristalinas, corpos de inclusão e toxinas Bt, são uma grande colecção de proteínas insecticidas produzidas por B. thuringiensis que são tóxicas quando da ingestão por um hospedeiro insecto susceptível. Ao longo da última década, a pesquisa na estrutura e função das toxinas de B. thuringiensis cobriu a totalidade das principais categorias de toxinas e, apesar destas toxinas diferirem na estrutura e função específicas, são assumidas semelhanças gerais na estrutura e função. Baseado no conhecimento acumulado das toxinas de B. thuringiensis, foi criado um modo generalizado de actuação para as toxinas de B. thuringiensis que inclui: ingestão pelo insecto, solubilização no tubo digestivo do insecto (uma combinação de estômago e intestino delgado), resistência às enzimas digestivas por vezes com digestão parcial "activando" de facto a toxina, ligação às células do tubo digestivo, formação de um poro nas células de insecto e a disrupção da homeostasia celular (English and Slatin, 1992) . ΡΕ1040192 1.2.2 Genes Codificadores de Proteínas do Cristal

Muitas das δ-endotoxinas estão relacionadas com vários graus de semelhanças nas suas sequências de aminoácidos. Historicamente, as proteínas e os genes que as codificam foram classificados largamente com base no seu espectro de actividade insecticida. A revisão por Hõfte and Whiteley (1989) discute os genes e proteínas que foram identificadas em B. thuringiensis antes de 1990 e descrevem a nomenclatura e esquema de classificação que tem sido tradicionalmente aplicado aos genes e proteínas de B. thuringiensis. Os genes cryl codificam as proteínas Cryl tóxicas para lepidópteros. Os genes cryll codificam proteínas Cryll que são tóxicas para lepidópteros e dípteros. Os genes crylll codificam proteínas CrylII tóxicas para coleópteros, enquanto que os genes crylV codificam proteínas CrylV tóxicas para dípteros.

Com base no grau de semelhança de sequências, as proteínas foram ainda classificadas em subfamílias; às proteínas mais estreitamente relacionadas dentro de cada família foram atribuídas letras tais como CrylA, CrylB, CrylC, etc. Às proteínas ainda mais estreitamente relacionadas dentro de cada divisão foram dados nomes tais como CrylCl, CryIC2, etc.

Recentemente, foi desenvolvida uma nova nomenclatura que sistematicamente classifica as proteínas Cry com ΡΕ1040192 base na homologia da sua sequência de aminoácidos em lugar das especificidades para os insectos alvo. 0 esquema de classificação para muitas toxinas conhecidas, não incluindo variações alélicas em proteínas individuais, está sumari-zada na Tabela 1.

Tabela 1 δ-ENDOTOXINAS de B. THORINGIENSIS CONHECIDAS, NÚMEROS DE ACESSO GenBaNK e Nomenclatura Revista* Nova Antiga Acesso GenBank # OylAíd CãrylÀtA) Ml!» OyIAi2 Cr?W® mm? CrylJMái €?$&(«) mmm GfylAftt xnm mmm a&m wsm OylAb! ctmm mmm CrylâM OyUm mmt CíviàbS CryíA(b) umn Cr>-?Àb4 C^lAífÃ DÍK>! *7 o$im C^IÃCfe) mm* C0im CrylA(b) Mmm C^IAps) XI32J3 CiylA^) m&m c wim QyíÂ(&) mmm €íy!A|b) OtfíMl CàylA<è) mam CryíÀ&2 c&m msm Ctfim DyM(e) mim C^!ác4 CiyIA{e> mmm 10 ΡΕ1040192

Tabela 1 (continuação)

Nova Antiga Acesso GenBank # CrylAeS CryiA(c) M7324I CrylÀcô CrylÀ(c) 1143606 CrylAc? CryíA(c) U87793 CtylAcS CryíA(c) mim CrylAc9 CryíA(c) ummi CrylAc !0 Cry!A(c) AJ002514 GrylAdl CryíA(d) M732S0 CrylAel OrylA(e) M652S2 CrylBal CrylB X0671Í Ciy 1 Bs2 X95704 CrylBbl ET5 02020 CrylBcl Crylfe(e) Z46442 CrylBdl CryEI 070726 CrylCal CrylC X075.lt Cry s C«2 CrylC XI3620 CryICa3 CrylC M7325I Cryí€a4 CrylC A27642 CrylCaS Cry.EC x%m- CrylCaé CrylC X96683 CrylCa? CryíC X%6§4 CryiCfol CrylCíb) M97880 Cryl Dal CrylD X54I60 CrylDfa] PrtB Z22S11 QylEal CrylE xmm CrylBaS CrylE X56Í44 OtylEaS CrylE M732S.2 QyiEat 094323 CrylEèl Cryll(Í5) M73253 CrylFal CrylP M0197 11 ΡΕ1040192

Tabela 1 (continuação) Nova Antiga Acesso GenBank # CíylFa2 CryíF M63897 CryíFbl Frtl> 222:0.: GrylGal PftA. Z22510 CrylGá2 CrvIM YÍSÍ26, CfvlGfel Çryffi U70725 CrylHal PrtC Z22513 CtyíRM 105780 Cryllal CryV X62821 Oyim CryV M98544 Crylía3 CryV L36338 Ctylla4 CiyV L49-39I CryilaS CryV YÕS920 Qyllhl CryV 007642 Crylíal BT4 LI52019 CryUbl BTí 05!52? OylKal U28S0I Cry2Aal CrylIA M31738 Cry2As2 CrylíÁ M23T23 Qy2Aa3 DM084 Cry2AhJ CrylIB M23724 Ciy2Ab2 CrylIB X55416 Cry2Ac! CsrylíC X572S2 CryjÂal CrylílA M22472 Cíy3Aa2 CrylílA 102978 Cry3Aa3 CrylílA Υ08420 Cry3Âa4 CrylílA M3ÕS03 Gry3Aa5 CrylílA M37207 Oy3AaÔ CrylHA 010985 CryãBa] CiyUIB XI703 12 ΡΕ1040192

Tabela 1 (continuação)

Nova Antiga Acesso GenBank # Ciy3Bi2 CjrvliíB Ν' ÂQ72M OyJBb.1 CryIÍIB2 MS9794 Qy3Bb2 CrylIIC(b) 1)31633 C?y3Csl OylIID XS9797 , Cty4Aal CiyrvA Y00423 Cry4Aa2 CrytVÀ D0Ô248 €ry4Ba! GylVB XQ7423 Qy4Ba2 CryíVB XO 7082 Cry4Ba3 CiylVB M29242 Cry4Ba4 CjyíVB DQ0247 CrySAal CryYÂ(a) 1.07025 CrySAM CiyVA(b) LD7026 CrySBal. FSMQ3 UI 9725 CtytSAíi I CryVIA LO7022 CtyâBal ôryVÍB mm Cry7Aal CryíífC M6447S Cry7Abl CryUiCb U0436? CrySAal CiylIIE U04364 CrySBal CryíIIO 1)04365 CrySCat CiylIIF 004366 Qy9Aa! CsylO x$mn Cry9Aâ2 CrylO X58534 CjyOBal CrylX X750I0 CryfCal OyiH XI752? CYyODaí N14I D8556Ô CrymAal QyfYC unmi €iy'11 Aal CrylVD mm? CryUAâl CrvIVD M22m QyilBal legBCf X869Q8 aAdaptado de: http://epunix.biols. susx. ac. uk/Home/Nil_ _Crickmore/Bt/índex.html 13 ΡΕ1040192 1.2.3 Composições Polpeptídicas Bioinsecticidas A utilidade das proteínas cristais bacterianas como insecticidas foi estendida para além das larvas de lepidópteros e dípteros quando da descrição do primeiro isolamento de uma estirpe de B. thuringiensis tóxica para coleópteros (Krieg et al., 1983; 1984). Esta estirpe (descrita na Patente U.S. 4 766 203, especificamente aqui incluída como referência), designada B. thuringiensis var. tenebrionis, está descrita como sendo tóxica para larvas dos insectos coleópteros Agelastica alni (escaravelho da folha do amieiro azul) e Leptinotarsa decemlineata (escaravelho da batateira do Colorado). A Patente US 5 024 837 também descreve estirpes híbridas de B. thuringiensis var. kurstaki que mostraram actividade contra insectos lepidópteros. A patente US 4 797 279 (correspondendo a EP 0221024) descreve um B. thuringiensis híbrido contendo um plasmídeo derivado de B. thuringiensis var. kurstaki codificador de um gene codificador da proteína do cristal tóxica para lepidópteros e um plasmídeo derivado de B. thuringiensis tenebrionis codificador um gene codificador da proteína do cristal tóxica para coleópteros. A estirpe híbrida de B. thuringiensis produz proteínas do cristal características das produzidas por B. thuringiensis kurstaki e B. thuringiensis tenebrionis. A Patente U.S. 4 910 016 (correspondendo a EP 0303379) descreve um isolado de B. thuringiensis identificado como B. thuringiensis MT 104 que possui actividade insecticida contra coleópteros e lepidópteros. 14 ΡΕ1040192 1.2.4 Técnicas de Genética Molecular que Facilitam a Engenharia de Proteínas A revolução na genética molecular da última década tem facilitado uma abordagem lógica e organizada da manipulação de proteínas com propriedades melhoradas. Métodos de mutagénese dirigida e ao acaso, o advento de metodologias da reacção em cadeia da polimerase (PCR™) e avanços relacionados na técnica forneceram uma extensa colecção de ferramentas para alteração da sequência de aminoácidos e das sequências genéticas subjacentes para uma variedade de proteínas de interesse comercial, médico e agrícola.

Após o aumento rápido do número e tipos de proteínas do cristal que foram identificadas na última década, os investigadores começaram a teorizar acerca de usar tais técnicas para melhorar a actividade insecticida de várias proteínas do cristal. Teoricamente, os melhoramentos das δ-endotoxinas deverão ser possíveis usando os métodos de que os engenheiros de proteínas a trabalharem na técnica dispõem e foi lógico assumir que seria possível isolar variantes melhoradas das proteínas cristais selvagens até agora isoladas. Ao fortalecer-se um ou mais dos passos de actuação da toxina referidos, moléculas melhoradas deverão proporcionar melhoria da actividade e, portanto, representam um avanço na técnica. Se os resíduos de aminoácidos específicos na proteína forem identificados como sendo responsáveis por um passo específico no modo de acção, 15 ΡΕ1040192 então estes resíduos podem ser alvo de mutagénese para melhoramento do desempenho. 1.2.5 Análise Estrutural de Proteínas do Cristal A combinação de análises estruturais de toxinas de B. thuringiensis seguido de uma investigação da função de tais estruturas, motivos e similares ensinou que regiões específicas das proteínas cristais endotoxinas são, em geral, responsáveis por funções particulares.

Encontrou-se que o domínio 1, por exemplo, de Cry3Bb e CrylAc é responsável pela actividade de canal iónico, o passo inicial na formação de um poro (Walters et al., 1993; Von Tersch et al., 1994). Encontrou-se que os domínios 2 e 3 são responsáveis pela ligação ao receptor e especificidade insecticida (Aronson et al., 1995; Caramori et al., 1991; Chen et al. 1993; de Maagd et al., 1996; Ge et al., 1991; Lee et al., 1992; Lee et al., 1995; Lu et al., 1994; Smedley and Ellar. 1996; Smith e Ellar, 1994;

Rajamohan et al., 1996; Wu and Dean, 1996). As regiões no domínio 2 e 3 podem também influenciar a actividade de canal iónico de algumas toxinas (Chen et al., 1993, Wolfersberger et al., 1996; Von Tersch et al., 1994). 1.3 Deficiências na Técnica Anterior

Infelizmente, se bem que muitos laboratórios tenham tentado produzir proteínas do cristal mutagenizadas, poucas tiveram êxito na obtenção de proteínas do cristal 16 ΡΕ1040192 mutagenizadas com melhor toxicidade para lepidópteros. Em quase todos os exemplos de toxinas de B. thuringiensis manipuladas geneticamente na literatura, a actividade biológica da proteína do cristal mutada não é melhor do que a da proteína selvagem e, em muitos casos, a actividade diminui ou é mesmo destruída (Almond and Dean, 1993; Aronson et ai., 1995; Chen et ai., 1993, Chen et ai., 1995; Ge et ai., 1991; Kwak et ai., 1995; Lu et ai., 1994; Rajamohan et ai., 1995; Rajamohan et ai., 1996; Smedley and Ellar, 1996; Smith and Ellar, 1994; Wolfersberger et ai., 1996; Wu and Aronson, 1992).

Para uma proteína do cristal tendo aproximada-mente 650 aminoácidos na sequência da sua toxina activa e para a possibilidade de 20 aminoácidos diferentes em cada posição nesta sequência, a probabilidade de arbitrariamente criar uma nova estrutura com êxito é remota, mesmo que uma função geral possa ser atribuída a um segmento de 250-300 aminoácidos. De facto, os trabalhos anteriormente descritos relativamente à mutagénese do gene da proteína do cristal têm estado relacionados com o estudo da estrutura e função das proteínas do cristal, usando mutagénese para alterar algum passo no modo de acção, em vez de manipulação para melhoramento das toxinas.

Colectivamente, os sucessos limitados na técnica para desenvolver toxinas sintéticas com actividade insecti-cida melhorada têm abafado o progresso nesta técnica e confundido a pesquisa de endotoxinas ou proteínas do cristal melhoradas. Em vez de seguir regras simples e previsíveis, 17 ΡΕ1040192 a manipulação com êxito de uma proteína do cristal pode envolver estratégias diferentes, dependendo da proteína do cristal a ser melhorada e das pragas de insectos alvo. Deste modo, o processo é altamente empírico.

Assim, a tecnologia de DNA recombinante tradicional não é claramente a experimentação de rotina para a obtenção de proteínas cristais insecticidas melhoradas. 0 que falta nos trabalhos anteriores são métodos racionais para a produção de proteínas do cristal de B. thuringiensis geneticamente manipuladas, possuidoras de actividade insec-ticida melhorada e, em particular, toxicidade melhorada para uma larga gama de pragas de insectos lepidópteros. 2.0 Sumário do Invento 0 presente invento pretende ultrapassar estes e outros obstáculos inerentes de trabalhos anteriores ao proporcionar δ-endotoxinas de B. thuringiensis modificadas por engenharia genética (Cry*) e, em particular, δ-endotoxinas Cry3 modificadas (designadas endotoxinas Cry3*). São igualmente proporcionadas sequências de ácido nucleico compreendendo um ou mais genes que codificam tais proteínas modificadas.

Em particular, o presente invento está relacionado com um polipeptídeo Cry3Bb de B. thuringiensis modificado, compreendendo alterações de um a cinco amino-ácidos na sequência primária do polipeptídeo Cry3Bb de SEQ 18 ΡΕ1040192 ID NO:98, em que as referidas alterações de aminoácidos são seleccionadas entre:

Aspl03 é substituída por ácido glutâmico; Thrl54 é substituída por glicina ou fenilalanina; Prol55 é substituída por histidina; Leul56 é substituída por histidina; Leul58 é substituída por arginina; Serl60 é substituída por asparagina; Lysl61 é substituída por prolina; Argl62 é substituída por histidina; Aspl65 é substituída por glicina; Lysl89 é substituída por glicina; Ser223 é substituída por prolina; Tyr230 é substituída por leucina ou serina; His231 é substituída por arginina, asparagina, serina ou treonina; Thr241 é substituída por serina; Tyr287 é substituída por fenilalanina; Asp288 é substituída por asparagina; Ile289 é substituída por treonina ou valina; Arg290 é substituída por asparagina, leucina ou valina; Leu291 é substituída por arginina; Tyr292 é substituída por fenilalanina; Ser293 é substituída por arginina ou prolina; Phe305 é substituída por serina; Ser311 é substituída por alanina, isoleucina ou treonina; Leu312 é substituída por prolina ou valina; Asn313 e substituída por arginina, histidina, treonina ou valina; Thr314 é substituída por asparagina; Leu315 é substituída por prolina; Gln316 é substituída por ácido aspártico, leucina, metionina ou triptofano; Glu317 é substituída por alanina, asparagina, lisina ou valina, Tyr318 é substituída por cisteína; Gln348 é substituída por arginina; Val365 é substituída por alanina; e Alal04 é eliminada. São igualmente descritos novos métodos para a construção de proteínas Cry3*, sequências de ácido nucleico 19 ΡΕ1040192 sinteticamente modificadas codificadoras de tais proteínas e composições que surjam a partir delas. São igualmente proporcionado vectores de expressão de cry3* sintéticos e vários métodos de utilização dos genes e vectores melhorados. As proteínas Cry3* do invento possuem melhores propriedades insecticidas. São descritos métodos de projecção de toxinas formadoras de canais que têm sido usados para produzir uma série específica de toxinas designada Cry3Bb* com melhor actividade biológica. Estas proteínas Cry3Bb* melhoradas estão enumeradas na Tabela 2 juntamente com as respectivas alterações de aminoácidos de Cry3Bb selvagem (WT), as alterações nucleotídicas presentes no gene cry3Bb* alterado codificador da proteína, o número de vezes de aumento da bioactividade relativamente a Cry3Bb WT, o local estrutural da alteração e o ou os métodos usados para criar as novas toxinas. preferidos in cry3Bb.11223, cry3Bb.11227, cry3Bb.11231, cry3Bb.11235, cry3Bb.11239, cry3Bb.11035, cry3Bb.11051, cry3Bb.11082, cry3Bb.11098. los de gene luem cry3Bb.6C cry3Bb.11224, cry3Bb.11228, cry3Bb.11232, cry3Bb .11236, cry3Bb.11241, cry3Bb .11036, cry3Bb. 11057, cry3Bb.11083, s codificadore Ί, cry3Bb. 11221, cry3Bb.11225, cry3Bb.11229, cry3Bb.11233, cry3Bb. 11237, cry3Bb.11242, cry3Bb. 11046, cry3Bb.11058, cry3Bb.11084, 3 de Cry2Bb* cry3Bb.11222, cry3Bb. 11226, cry3Bb.11230, cry3Bb.11234, cry3Bb.11238, cry3Bb.11032, cry3Bb.11048, cry3Bb.11081, cry3Bb.11095 e - 20 - ΡΕ1040192

Tabela 2 _Proteínas Cry3Bb* Apresehtahdo Melhor Aciividade Contra Larvas SCRW_

Designação da Designação Alterações da sequência Alterações de Local Número de Método proteína do plasmídeo de nucleótidos cry3Bb* aminoácidos estrutural vezes do usado Cry3Bb* crySBb* Cry3Bb* das aumento de _alterações actividade HT_

ΡΕ1040192 - 21 -

Tabela 2 (Continuação) Designação da Designação Alterações da sequência de Alterações de Local Número de Método usado proteína do plasmídeo nucleótidos cry3Bb* aiinoácidos estrutural vezes do Cry3Bb* cry3Bb* Cry3Bb* das aumento de alterações actividade WT Cry3Bb.ll228 pEG1714 C93Zr,A938C,T942G,G949A) S311L,N313T, Ip!,a8 4.1* T954C E3I7K . Cry3Bb,li229 pEGUIS T931 A, A933C, 1“942Α, T945A, S3liT,E3l7K, ipi;a$ 2.5x 2,4 G949A, A953G. T954C Y318C Cry3BbJI230 pEG)7!6 _TBiaA933C,C534G,TM5G1 S3IIA.L3I2V, $Ι,α8 4.7x 2,48 C946T,A947G,C951A,T954C Q316W Cry3Bb.ll23l pEGl717 WKmiGMMC, H23IR.SJUL, ot6;ip!,a8 7.9* 2,4.1,8, T942G} G949A, T954C N3I3T.0I7K 10 Cry3Bb.H232 pEGl7l8 T931 A, A933G, T935C,T936A, S3IIT.U12P, ΐρΐ,αϋ 5.1* 4 A938C, T939C, Í942C J945A, N313T, E317N GWIT.T9S4C Cry3Bb.li233 pEG!7!9 TBIC,A933C(T936G,TM2C, C943TJ945A,C946G,G948C( S3!IA,Q316D |Ι,α8' 2.2x 2,4 - 22 - ΡΕ1040192

Tabela 2 (Continuação)

Designação da Designação Alterações da Alterações de Local estrutural Número de vezes Método proteína Cry3Bb* do plasmídeo sequência de aminoácidos das alterações do aumento de usado _cryúfiõ* nucleótidos cryíBb* Cry3Bb* actividade WI

TBIA,C932T.A933C,T506C. S3!lt

T942G, 'Γ945Λ. T954C

T9}|A,«A933C/!W, S3IH.N3I3H Ã937Q, A938T, C94IA, T942C, 3.1x M 5,4x 2,4

A933C,TM,A«7C.A9MT1 NJIJV,TJ!4N, C941 A,T942C,T945À,C946A, Q3l6MtE3l7V

IM 2,4 » ΡΕ1040192 - 23 -

Tabela 2 (Continuação)

Designação da Designação proteína do plasmídeo Cry3Bb* crySBb* Alterações da sequência de nucleótidos cry3Bb* Alterações de aminoácidos Cry3Bb* Local estru- Número de vezes do Método tural das aumento de usado alterações actividade WT Cry3Db.U239 pBGI725 N313R.13I5P, 2Jx 2,4 T944C J945A, A§47T, G948Tt Q3I6UE317A A950C.T954C Cry3Bb.lt24! pEGI726 AtMICjaOT. ' Y2S7F, D2SSN, l«?|l 2,3.4.6 GMlMWT.m mi 07IGtAS79T Cf}'3Bb lI242 pEGí727 C868G, G869T R290V la?|l 1U 2,3,4,6, l Crj3Bt),11032 pEGISHI km DI03G «4 3Jx 2,4,8 Cry3Bb.ll035 pEGI046 0479Λ, A48IC,A482Ct SI60N.KI61P, α4 2.7x 8 PI62H, D165G Ciy3Bb.ll036 pEG1047 ktmm I289V, S293P k?|l 43» 4 Cry3Bb.l!046 pEOIOSl G479A, A481C, A482C, SliWIÓIP, α4; Ια?,βϊ 2ix 2,4,8,10 A484C G485A, A4S6C, PIÔ2H, D165G, A494G, A865G,T8?7C !289V, S293P ΡΕ1040192 - 24 -

Tabela 2 (Continuação) Designação da Designação proteína Cry3Bb* do plasmídeo cry3Bb* Alterações da sequência de nucleótidos cry3Bb* Alterações de aminoácidos Cry3Bb* Local estrutural das alterações Número de vezes Método do aumento de usado actividade WT »11941! pEG1054 Τ309Α,Δ3Ι0,Λ3Ι1,Δ312 D!03E,MI04 l«2a,2b 4,3x 8 Cry38b.!105l pEGI057 A565G, A566G K189G Ía4,5 3.0x 2,3,4 Cry3Bb.l 1057 pEOlOfô T3M0JIU3I2, DIÔ3MAI04, Ia2a,2bia4 3.4x 2,4,8,10' G479A.A4SIC.AW2C. S!60N,Ki61P, A4MC,C48SA.A486Ç,A4940 PI62H;D!65G Cry3Bb.l 1058 pECil063 ' T3<M,à31Ô,è3ll,à312, DI03E,âAlfl4, Ia2a,2b,la3,4 3.5x 1,8,10 A460T,C46!T,A462TfC464A> T!54FfP155H, T46SC, T466C, T467A, A468T, U56H,L158R A469T» G470C, T472C, T473G, G474T,A477r,A478T,G470C Cry3Bb.!1081 pEG!084 A494GtT93!A>A933C,T942A, D!65G,S3!IT, <x4; ΙβΙ,α8 í.lx 2,4,8,10 T945A, G949A, T954C E317K. ΡΕ1040192 - 25 -

Tabela 2 (Continuação)

Designação da Designação proteína Cry3Bb* do plasmídec cry3Bb* Alterações da sequência de nucleótidos cry3Bb* Alterações de aminoácidos Cry3Bb* Local estrutural das alterações Número de vezes do aumento de actividade WT Método usado Cry3Bb.ll082 pEGIOSS A4ÍMG, A865G, T877C.T91_4C, DI65G, I289V, α4;Ια7,βΙ; (31; m UH T931G, A933C, C934G, T945G, S293P, F305S, IPU1;|12; 9, IO C946T,A947G,G95IA,T954C, S3MA.13I2V. p3b AI043G, TI094C Q316W,Q348R, V365A Cry3Bb.ll083 pEG!086 A865G.T877C, AI043G I289V, S293P, Wíl;P 7.4x 4,5,9,10 Q348R Cr}'3Bb.ll084 pEGI087 A494G, C932T D165G.S3IIL α4;ΙβΙ,α8 7.2χ 2,4,8,10 Crv3Bb.ll095 pEG!095 AI043G Q348R P2 4.6x ' 5,9 Cry3Bb.ll098 pEGI098 A494G, T687C, A692G, C9321; DI65G.H23IR, α4;α6, Ιβ),α8 7,9x 2,4,7,8 A938C, T942G, G949A. T954C S3IIL.N3I3T, E317K 26 ΡΕ1040192

Numa variedade de realizações ilustrativas, os inventores demonstraram êxito na geração de toxinas com actividade insecticida melhorada usando estes métodos. Em particular, os inventores identificaram métodos únicos de análise e projecção de toxinas tendo propriedades insec-ticidas melhoradas in vitro e in vivo.

Face à presente descrição, a mutagénese de um ou mais codões dentro da sequência de uma toxina pode resultar na geração de um hospedeiro de proteínas insecticidas relacionadas tendo actividade melhorada. Se bem que tenham sido descritos exemplos de mutações para cada uma das estratégias de projecção empregues no presente invento, os inventores consideram que também podem ser feitas mutações nas proteínas do cristal insecticidas incluindo as regiões das ansas, regiões das hélices, locais activos das toxinas, regiões envolvidas na oligomerização de proteínas e similares, que darão origem a proteínas do cristal bioinsecticidas funcionais. Todas essas mutações são consideradas dentro do âmbito desta descrição.

Numa realização ilustrativa, são obtidos os genes cry3Bb* mutagenizados que codificam variantes Cry3Bb*, geralmente baseados na sequência Cry3Bb selvagem mas que possuem uma ou mais alterações na sequência de aminoácidos da proteína usando uma ou mais estratégias de projecção aqui descritas e reivindicadas.

Os genes mutados codificadores das proteínas do cristal são modificados de forma a alterar um, dois, três, 27 ΡΕ1040192 quatro ou cinco ou mais aminoácidos na sequência primária do polipeptideo codificado.

Para efectuar tais alterações na sequência primária dos polipeptideos codificados, pode ser desejável mutagenizar ou deletar um ou mais nucleótidos das sequências de ácido nucleico dos genes codificadores de tais polipeptídeos. Frequentemente, vários resíduos de nucleótidos podem ser alterados para produzir o polipeptideo pretendido. Como tal, os inventores consideram que em determinadas realizações pode ser desejável alterar apenas um, dois, três, quatro ou cinco ou mais nucleótidos na sequência primária. Noutras realizações, em que são desejáveis mais alterações, a mutagénese pode envolver alteração ou deleção de 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 ou mesmo 20 ou mais resíduos de nucleótidos na sequência do gene. A alteração de um grande número dos codões na sequência nucleotídica de um gene codificador de endotoxina pode ser particularmente desejável e muitas vezes necessário para se atingir os resultados pretendidos, particularmente na situação de "plantizar" uma sequência de DNA de forma a expressar um DNA de origem não vegetal numa célula vegetal transformada. Tais métodos são rotina para os especializados no campo da genética de plantas e frequentemente muitos resíduos de uma sequência génica primária são alterados para facilitar a expressão do gene na célula vegetal. De preferência, as alterações na sequência dos genes não introduzem alterações na sequência 28 ΡΕ1040192 de aminoácidos ou introduzem apenas substituições conservadas na sequência de aminoácidos, de forma que o polipeptideo produzido na célula veqetal da sequência nucleotidica "plantizada" seja ainda totalmente funcional e tenha as qualidades pretendidas quando expresso na célula vegetal.

Genes e respectivas proteínas codificadas alterados de acordo com o invento podem ser operacionalmente ligados a outras sequências de ácidos nucleicos codificadores de proteínas ou expressos como proteínas de fusão. São consideradas tanto as proteínas de fusão N-terminal como C-terminal. Virtualmente qualquer sequência de DNA codificadora de proteínas ou peptídeos, ou suas combinações, podem ser fundidos com uma sequência mutante cry3* de forma a codificar uma proteína de fusão. Isto inclui sequências de DNA que codificam peptídeos alvo, proteínas para expressão recombinante, proteínas a que um ou mais peptídeos alvo são ligados, subunidades proteicas, domínios derivados de uma ou mais proteínas do cristal e similares. Tais modificações nas sequências nucleotídicas primárias para aumentar, atingir ou optimizar a expressão da sequência génica numa célula hospedeira, tecido ou localização celular particular, são bem conhecidas dos familiarizados com a engenharia de proteínas e biologia molecular e será facilmente aparente para estes especialistas, tendo acesso aos ensinamentos desta especificação, como facilitar tais trocas na sequência nucleo-tídica para produzir os polipeptídeos e polinucleótidos aqui descritos. 29 ΡΕ1040192

Num aspecto, o invento descreve e reivindica

células hospedeiras compreendendo uma ou mais das proteínas do cristal modificadas aqui descritas e, em particular, células de B. thuringiensis estirpes EG11221, EG11222, EG11223, EG11224, EG11225, EG11226, EG11227, EG11228, EG11229, EG11230, EG11231, EG11232, EG11233, EG11234, EG11235, EG11236, EG11237, EG11238, EG11239, EG11241, EG11242, EG11032, EG11035, EG11036, EG11046, EG11048, EG11051, EG11057, EG11058, EG11081, EG11082, EG11083, EG11084, EG11095 e EG11098 que compreendem segmentos de DNA recombinante codificadores de proteínas do cristal Cry3Bb* sinteticamente modificadas que demonstram actividade insecticida melhorada.

Igualmente , o invento também descreve e reivin- dica culturas celulares de B. thuringiensis EG11221, EG11222, EG11223, EG11224, EG11225, EG11226, EG11227, EG11228, EG11229, EG11230, EG11231, EG11232, EG11233, EG11234, EG11235, EG11236, EG11237, EG11238, EG11239, EG11241, EG11242, EG11032, EG11035, EG11036, EG11046, EG11048, EG11051, EG11057, EG11058, EG11081, EG11082, EG11083, EG11084, EG11095 e EG11098.

Tais culturas celulares podem ser culturas biologicamente puras consistindo numa única estirpe ou, como alternativa, podem ser culturas celulares consistindo numa ou mais estirpes. Tais culturas celulares podem ser cultivadas nas condições em que uma ou mais estirpes 30 ΡΕ1040192 adicionais de B. thuringiensis ou de outras bactérias são simultaneamente cocultivadas com uma ou mais das culturas descritas ou, em alternativa, uma ou mais das culturas celulares do presente invento podem ser combinadas com uma ou mais estirpes de B. thuringiensis ou de outras bactérias após a cultura independente de cada uma delas. Tais procedimentos podem ser úteis quando são pretendidas suspensões de células contendo duas ou mais proteínas do cristal diferentes.

As presentes culturas foram depositadas nas condições que asseguram que o acesso às culturas será disponibilizado durante a pendência deste pedido de patente a quem seja determinado pelo Comissário de Patentes e Marcas Registadas a ser autorizado em 37 C.F.R. §1.14 e 35 U.S.C. §122. , Os depósitos são disponibilizados de acordo com as leis internacionais de patentes nos países em que as contrapartes do presente pedido ou sua progénie sejam solicitadas. No entanto, deverá ser compreendido que a disponibilidade de um depósito não constitui uma licença para a realização do presente invento com prejuízo dos direitos de patente concedidos pela acção governamental.

Ainda, os presentes depósitos de culturas serão armazenados e disponibilizados de acordo com as condições do Tratado de Budapeste para o depósito de microrganismos, i.e., serão guardados com todo o cuidado necessário para os manter viáveis e não contaminados, durante um período de pelo menos cinco anos após o pedido mais recente para a 31 ΡΕ1040192 finalização de uma amostra do depósito e em qualquer caso, durante um período de pelo menos 30 (trinta) anos após a data de depósito ou durante a viqência de qualquer patente que possa descrever as culturas. O depositante reconhece o dever de substituir os depósitos se o depositário for incapaz de fornecer uma amostra quando pedida, devido à condição dos depósitos. Todas as restrições relativas à disponibilidade ao público dos presentes depósitos de culturas serão irrevogavelmente removidas quando da concessão de uma patente que os descreva.

As culturas apresentadas na Tabela 3 foram depositadas na colecção permanente do Agricultural Research Service Culture Collection, Northern Regional Research Laboratory (NRRL) sob os termos do Tratado de Budapeste.

Tabela 3

Estirpes do Presente Invento Depositadas Sob os Termos do Tratado de

Budapeste

Estirpe Data do Depósito Proteína Numero de Acesso (Número NRRL) BOI 1032 5/27/97 Cry3Bb,U032 B-2! 744 BOI 103Í EG1103Í 5ãim smm CrySBbJ 1035 Qy3Bfe/ll036 B-21745 B-21746 egíkib: EGIÍ046 5/2 im 5/27/97 Ciy38bJl®37 CryCffih. 11046 B-21747 32 ΡΕ1040192

Tabela 2 (Continuação)

Estirpe Data do Depósito Proteína Numero de Acesso (Número NRRL) BGllíMS 5/27/97 Cry3BbJ 1048 B-2J.749 EGI1051 5/27/97 Cry3Bb,11051 B-21750 EG11057 s/27/97 Cry3Bb. 11057 B-2175J EG1105S 5/27/97 Gry3fíb,HQS8 B-2I752 ΕΟΠΜΙ mim OrylBbJ 108! 8-21753 EG 11082 5/27/97 Çry3Bb,l 1082 B-21754 EG11083 S/27/97 Cty3Bb. 11083 B-2175.5 EG11084 5/27/97 Cry3Bb,11084 B-217S6 EG! 1095 5/27/97 OrOBbJ 1.095 B-21757 EG! 1204 5/27/97 Qy3Bb. 11204 B-21758 EG! 1221 5/27/9? CrySBbJ 1221 B-217S9 EG11222 5/27/97 Qy38feJ1222 B-21760 E0I1223 5/27/97 Cry3Bkll223 B-21761 EGU224 5/27/97 Cry3&feJ1224 B4Í762 E01122S 5/27/97 Cry 3 B621225 11-2176.3 EG1Í226 5/27/97 CrySBb.l 1226 B-21764 EG! 1227 5/27/97 Cfy3Bb.it 227 B-1276S EG 11228 S/27/97 Oy3Bh, 11228 B-12766 EG 11229 S/27/97 Cry3BbJ1229 B-2I767 EG! 1230 5/27/97 Oy3Bb.ll 230 B-21768 BOI 123! 5/27/97 Cry3Bb.ll23I B-21769 EG11232 S/27/97 €fy3Bb.H232 B-12770 EGi tm S/27/97 Ciy3Bkl!233 B-21771 EG! 1234 S/27/97 Ciy3BbJ1234 B-21772 EG! 1235 5/27/97 Cry3BbJÍ23S 8-21 '773 EG 11236 5/27/97 Csy3Bb. 11236 8-21774 &nm7 mm Oy3Sb>11237 B~2Í775 EG11238 5/27/97 CrySBbJ 1238 Β-2Ϊ776 33 ΡΕ1040192

Tabela 2 (Continuação)

Estirpe Data do Depósito Proteína Número de Acesso (Número NRRL) ECH1239 5?W97 Ciy3Bb.!1239 B*217?7 mi 1241 5/27/97 Cty3Bb.l 1241 B-2177S ΕΟΠ.242 5/27/97 CryIBb.,11242 B-21779 São igualmente descritos métodos de controlo ou erradicação de uma população de insectos num ambiente. Tais métodos, de um modo geral, compreendem o contacto da população de insectos a ser controlada ou erradicada com uma quantidade eficaz como insecticida de uma composição de proteínas cristal Cry3*. As composições de Cry3* preferidas incluem composições polipeptídicas Cry3A*, Cry3B* e Cry3C*, sendo as composições Cry3B * particularmente preferidas. Exemplos de tais polipeptídeos incluem proteínas seleccionadas do grupo consistindo em Cry3Bb.60, Cry3Bb.11221, Cry3Bb.11222, Cry3Bb.11223, Cry3Bb.11224, Cry3Bb.11225, Cry3Bb.11226, Cry3Bb.11227, Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11231, Cry3Bb.11232, Cry3Bb.11233, Cry3Bb.11234, Cry3Bb.11235, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb.11238, Cry3Bb.11239, Cry3Bb.11241, Cry3Bb.11242, Cry3Bb.11032, Cry3Bb.11035, Cry3Bb.11036, Cry3Bb.11046, Cry3Bb.11048, Cry3Bb.11051, Cry3Bb.11057, Cry3Bb.11058, Cry3Bb.11081, Cry3Bb.11082, Cry3Bb.11083, Cry3Bb.11084, Cry3Bb.11095 e Cry3Bb.11098. 34 ΡΕ1040192

Nas realizações preferidas, estas composições de proteínas cristais Cry3Bb* compreendem a sequência de aminoácidos de qualquer uma de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:3 0, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:3 8, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:10 0, SEQ ID NO:102 ou SEQ ID NO:108. 2.1 Métodos para a Produção de Proteínas Cry* Modificadas

Os polipeptídeos Cry* modificados do presente invento são preparáveis por um processo que, de um modo geral, envolve os passos de obtenção de uma sequência de ácido nucleico codificadora de um polipeptídeo Cry*; análise da estrutura do polipeptídeo para identificar locais "alvo" particulares para mutagénese da sequência génica subjacente; introdução de uma ou mais mutações na sequência de ácido nucleico para produzir uma alteração de um ou mais resíduos de aminoácido na sequência polipeptí-dica codifiada; e expressão numa célula hospedeira transformada da sequência de ácido nucleico mutagenizada sob condições eficazes para obter a proteína Cry* modificada codificada pelo gene cry*. 35 ΡΕ1040192

Meios para obtenção das estruturas dos cristais dos polipeptideos do invento são bem conhecidas. Exemplos de séries de soluções de alta resolução para estruturas de cristais estão apresentados na Secção 9.0 da descrição e incluem a estrutura cristalina dos polipeptideos Cry3A e Cry3B aqui descritos. A informação proporcionada na Secção 9.0 permite a análise descrita em cada um dos métodos apresentados, a qual se baseia na estrutura cristalina 3D para diriqir a mutagénese dos polipeptideos para regiões particulares das sequências de aminoácidos primárias das δ-endotoxinas, de modo a serem obtidos mutantes com maior actividade insecticida ou maior especificidade insecticida.

Um primeiro método para a produção de uma δ-endotoxina Cry3Bb de B. thuringiensis modificada tendo actividade ou especificidade insecticida melhorada aqui descrito envolve a obtenção de uma estrutura cristalina 3D de alta resolução da endotoxina, localização na estrutura do cristal de uma ou mais regiões de água ligada, em que a água ligada forma uma superfície contígua hidratada separada por não mais de aproximadamente 16 Ã; aumento do número de moléculas de água nesta superfície através do aumento da hidrofobicidade de um ou mais aminoácidos da proteína na região; e obtenção da δ-endotoxina modificada assim produzida. Exemplos de δ-endotoxinas incluem Cry3Bb.11032, Cry3Bb.11227, Cry3Bb.11241, Cry3Bb.11051, Cry3Bb.11242 e Cry3Bb.11098. 36 ΡΕ1040192

Um segundo método para a produção de uma δ- endo-toxina Cry3Bb de B. thuringiensis modificada tendo activi-dade insecticida melhorada compreende a identificação de uma região em ansa numa δ-endotoxina; modificação de um ou mais aminoácidos na ansa para aumentar a hidrofobicidade dos aminoácidos; e obtenção da δ-endotoxina modificada assim produzida. A δ-endotoxina produzida por este método inclui Cry3Bb.11241, Cry3Bb.11242, Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11231, Cry3Bb.11233, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb.11238 e Cry3Bb.11239.

Um método para aumentar a mobilidade das hélices do canal iónico de uma δ-endotoxina Cry3B de B. thuringiensis é igualmente proporcionado pelo presente invento. O método, de um modo geral, compreende disrupção de uma ou mais ligações de hidrogénio formadas entre um primeiro aminoácido de uma ou mais hélices formadoras de canais e um segundo aminoácido da δ-endotoxina. As ligações de hidrogénio podem ser formadas inter- ou intramolercular-mente e a disrupção pode consistir na substituição de um primeiro ou segundo aminoácido com um terceiro aminoácido cuja distância espacial é superior a cerca de 3 Ã, ou cujo ângulo de ligação da orientação espacial não é igual a 180+60 graus relativamente ao local da ligação de hidrogénio do primeiro ou segundo aminoácido. As δ-endotoxinas produzidas por este método e aqui descritas incluem Cry3Bb.11222, Cry3Bb.11223, Cry3Bb.11224, Cry3Bb.11225, Cry3Bb.11226, Cry3Bb.11227, Cry3Bb.11231, Cry3Bb.11241 e Cry3Bb.11242 e Cry3Bb.11098. 37 ΡΕ1040192 É também aqui descrito um método para aumentar a flexibilidade de uma região em ansa num dominio formador de canais de uma δ-endotoxina Cry3Bb de B. thuringiensis. Este método compreende a obtenção de uma estrutural de cristal de uma δ-endotoxina Cry3Bb tendo uma ou mais regiões em ansa; identificação dos aminoácidos compreendendo a região em ansa; e alteração de um ou mais dos aminoácidos para reduzir o bloqueio espacial na região da ansa, em que a alteração aumenta a flexibilidade da região da ansa na δ-endotoxina. Exemplos de δ-endotoxinas produzidas usando este método incluem Cry3Bb.11032, Cry3Bb.11051, Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11231, Cry3Bb.11232, Cry3Bb.11233, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb.11238, Cry3Bb.11239, Cry3Bb.11227, Cry3Bb.11234, Cry3Bb.11241, Cry3Bb.11242, Cry3Bb.11036 e Cry3Bb.11098.

Um outro aspecto do invento é um método para aumentar a actividade de uma δ-endotoxina, compreendendo a redução ou eliminação da ligação da δ-endotoxina a um açúcar num tubo digestivo do insecto alvo. A eliminação ou redução pode ser conseguida através da remoção de uma ou mais hélices α do dominio 1 da δ-endotoxina, por exemplo, para remoção das hélices a, a2a/b e a3. Um exemplo de δ-endotoxina produzida usando o método é Cry3Bb.60.

Como alternativa, a redução ou eliminação pode ser conseguida através da substituição de um ou mais aminoácidos dentro da ansa pi , a8, com um ou mais aminoácidos 38 ΡΕ1040192 tendo maior hidrofobicidade. Tal método dá origem a δ-endotoxinas tais como Cry3Bb.11228, Cry3Bb.11230, Cry3Bb.11231, Cry3Bb.11237 e Cry3Bb.11098, as quais são aqui descritas detalhadamente.

Como alternativa, a redução ou eliminação é conseguida através da substituição de um ou mais aminoáci-dos específicos, com um outro aminoácido. Tais substituições estão descritas na Tabela 2 e nos exemplos aqui apresentados. Um exemplo é a δ-endotoxina aqui designada como Cry3Bb.11221.

Um método de identificação de uma região de uma δ-endotoxina Cry3Bb para mutagénese dirigida compreende: obtenção de uma estrutura cristalina da δ-endotoxina; identificação a partir da estrutura cristalina de um ou mais aminoácidos expostos na superfície da proteína; substituição ao acaso de um ou mais dos aminoácidos expostos na superfície para obter uma pluralidade de polipe-ptídeos mutados, em que pelo menos 50% dos polipeptídeos mutados possuem menor actividade insecticida; e identificação a partir da pluralidade de polipeptídeos mutados de uma ou mais regiões da δ-endotoxina Cry3Bb para mutagénese dirigida. 0 método pode ainda compreender determinação das sequências de aminoácidos de uma pluralidade de polipeptí-deos mutados tendo menor actividade e identificação de um ou mais resíduos de aminoácidos necessários para a actividade insecticida. 39 ΡΕ1040192

Numa outra realização, o invento proporciona um processo para a produção de uma δ-endotoxina Cry3Bb tendo actividade insecticida melhorada. 0 processo, de um modo geral, envolve os passos de obtenção de uma estrutura cristalina de alta-resolução da proteína; determinação da distribuição da superfície electrostática da proteína; identificação de uma ou mais regiões de elevada diversidade electrostática; modificação da diversidade electrostática da região através da alteração de um ou mais aminoácidos na região; e obtenção de uma δ-endotoxina Cry3Bb com melhor actividade insecticida. Numa realização, a diversidade electrostática pode baixar relativamente à diversidade electrostática de uma δ-endotoxina Cry3Bb nativa. Exemplos de δ-endotoxinas com menor diversidade electrostática incluem Cry3Bb.11227, Cry3Bb.11241 e Cry3Bb.11242. Como alternativa, a diversidade electrostática pode ser aumentada relativamente à diversidade electrostática de uma δ-endotoxina Cry3Bb nativa. Um exemplo de δ-endotoxina com maior diversidade electrostática é Cry3Bb.11234.

Ainda, o invento também proporciona um método de produção de uma δ-endotoxina Cry3Bb tendo maior capacidade insecticida, o qual envolve a obtenção de uma estrutura cristalina de alta resolução; identificação da presença de um ou mais locais de ligação a metais na proteína; alteração de um ou mais aminoácidos no local de ligação; e obtenção de uma proteína alterada, em que a proteína possui maior actividade insecticida. A alteração pode envolver a eliminação de um ou mais locais de ligação a metais. Exem- 40 ΡΕ1040192 pios de δ-endotoxinas incluem Cry3Bb.11222, Cry3Bb.11224, Cry3Bb.11225 e Cry3Bb.11226.

Um outro aspecto do invento envolve um método de identificação de uma δ-endotoxina Cry3Bb de B. thuringien-sis tendo maior actividade de canal. Este método, de forma geral, envolve a obtenção de uma δ-endotoxina Cry3Bb suspeita de ter melhor actividade de canal; e determinação de uma ou mais das seguintes caracteristicas na δ-endotoxina e comparação de tais caracteristicas com as obtidas para a δ-endotoxina selvagem não modificada: (1) a velocidade de formação de canais, (2) a velocidade de crescimento da condutância dos canais ou (3) a duração do estado de canal aberto. A partir desta comparação, pode-se então seleccionar uma δ-endotoxina que tenha maior velocidade de formação de canais comparativamente com a δ-endotoxina selvagem. Exemplos de δ-endotoxinas Cry3Bb preparadas por este método incluem Cry3Bb.60, Cry3Bb.11035, Cry3Bb.11048, Cry3Bb.11032, Cry3Bb.11223, Cry3Bb.11224, Cry3Bb.11226, Cry3Bb.11221, Cry3Bb.11242, Cry3Bb.11230 e Cry3Bb.11098. É igualmente proporcionado um método para a produção de uma δ-endotoxina Cry3Bb tendo melhor actividade insecticida que envolve a alteração de um ou mais amino-ácidos, que não sejam de superfície, situados perto ou no ponto de maior convergência de duas ou mais regiões de ansa da δ-endotoxina Cry3Bb, de forma que a alteração diminua a mobilidade de uma ou mais regiões das ansas. A mobilidade 41 ΡΕ1040192 pode, por conveniência, ser determinada por comparação da desnaturação térmica da proteína modificada com a δ-endotoxina Cry3Bb selvagem. Cry3Bb.11095 é um exemplo de proteína do cristal produzida por este método.

Um outro aspecto do invento envolve um método para a preparação de uma δ-endotoxina Cry3Bb modificada, tendo actividade insecticida melhorada compreendendo a modificação de um ou mais aminoácidos na ansa para aumentar a hidrofobicidade dos referidos aminoácidos; e alteração de um ou mais dos referidos aminoácidos para reduzir restrições espaciais na região da ansa, em que a alteração aumenta a flexibilidade da região da ansa na endotoxina. Exemplos de δ-endotoxinas Cry3Bb produzidas podem ser seleccionados do grupo consistindo em Cry3Bb.11057, Cry3Bb.11058, Cry3Bb.11081, Cry3Bb.11082, Cry3Bb.11083, Cry3Bb.11084, Cry3Bb.11231, Cry3Bb.11235 e Cry3Bb.11098. 0 invento também proporciona um método para melhorar a actividade insecticida de uma δ-endotoxina Cry3Bb de B. thuringiensis que, de um modo geral, compreende a inserção de um ou mais locais sensíveis a proteases numa ou mais regiões de ansa do domínio da δ-endotoxina. De preferência, a região da ansa é a3,4, e um exemplo de δ-endotoxina assim produzida é Cry3Bb.11221. 2.2 Composições de Polipeptídeos

As proteínas do cristal produzidas por cada um 42 ΡΕ1040192 dos métodos aqui descritos também representam aspectos importantes do invento. Tais > proteínas do cristal, de preferência, incluem uma proteína ou peptídeo seleccionado do grupo consistindo em Cry3Bb.60, Cry3Bb.11221, Cry3Bb.11222, Cry3Bb.11223, Cry3Bb.11224, Cry3Bb.11225, Cry3Bb.11226, Cry3Bb.11227, Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11231, Cry3Bb.11232, Cry3Bb.11233, Cry3Bb.11234, Cry3Bb.11235, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb.11238, Cry3Bb.11239, Cry3Bb.11241, Cry3Bb.11242, Cry3Bb.11032, Cry3Bb.11035, Cry3Bb.11036, Cry3Bb.11046, Cry3Bb.11048, Cry3Bb.11051, Cry3Bb.11057, Cry3Bb.11058, Cry3Bb.11081, Cry3Bb.11082, Cry3Bb.11083, Cry3Bb.11084, Cry3Bb.11095 e Cry3Bb.11098.

Em realizações preferidas, a proteína compreende uma sequência de aminoácidos contígua seleccionada do grupo consistindo em SEQ ID NO: 2 , SEQ ID NO:4, SEQ ID NO : 6, SEQ ID NO: 8, SEQ ID NO :10 , SEQ ID NO : 12, SEQ ID NO: : 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 100 , SEQ ID NO: 102 e SEC ! ID NO : 108 . São muito preferidas as proteínas do cristal codificadas pela sequência de ácido nucleico SEQ ID N0:1, 43 ΡΕ1040192 SEQ ID NO: 3 , SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO: 13 , SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO: 21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:2 7, SEQ ID NO: 29 , SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO: 37 , SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO: 45 , SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO: 53 , SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO: 61 , SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:99, SEQ ID NC 1:101 ou SEQ ID NO:107, ou uma sequência de ácido nucleico que híbrida com a sequência de ácido nucleico de SEQ ID NO: ] SEQ ID NO:3, SEQ ID NO :5, SEQ ID NO: 7 , SEQ ID NO:9, SEQ ID NO : 11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO:17 , SEQ ID NO:19 , SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:4 7, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:99, SEQ ID NO:101 ou SEQ ID NO : 107 em condições de restringência moderada.

As sequências de aminoácidos, peptídeos e proteínas dentro do âmbito do presente invento incluem, e nao estão limitados às sequências descritas em SEQ ID NO: 2, SEQ ID NO:4, SEQ ID NO :6, SEQ ID NO:8, SEQ ID NO: 10 , SEQ ID NO:12, SEQ ID NO : 14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:2 0, SEQ ID NO : 22, SEQ ID NO:2 4, SEQ ID NO:26, SEQ ID NO:2 8, SEQ ID NO : 3 0 , SEQ ID NO : 32 , SEQ ID NO:34, SEQ ID 44 ΡΕ1040192 NO: : 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: : 44, SEQ ID NO: 46, SEQ ID NO: 00 SEQ ID NO: 50, SEQ ID NO: : 52, SEQ ID NO: k·. LO SEQ ID NO: 56, SEQ ID NO: 00 LO SEQ ID NO: : 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 00 SEQ ID NO: : 10 0, SEQ ID NO:102 e SEQ ID NO: 108, e alterações nas sequências de aminoácidos, incluindo alterações, deleções, mutações e homólogos. São aqui proporcionadas composições que compreendem entre 0,5% e 99% por peso da proteína do cristal, ou mais de preferência entre 5% e 75%, ou entre 25% e 50% por peso da proteína do cristal. Tais composições podem ser facilmente preparadas usando técnicas de produção e purificação de proteínas conhecidas dos familiarizados com a matéria e os métodos aqui descritos. Tal processo para a preparação de uma proteína do cristal Cry3Bb* envolve, de um modo geral, os passos de cultura de uma célula hospedeira que expressa a proteína Cry3Bb* (como seja uma célula de B. thuringiensis EG11221, EG11222, EG11223, EG11224 , EG11225 , EG11226, EG11227, EG11228, EG11229, EG11230, EG11231, EG11232, EG11233, EG11234, EG11235, EG11236, EG11237, EG11238, EG11239, EG11241, EG11242, EG11032, EG11035, EG11036, EG11046, EG11048, EG11051, EG11057, EG11058, EG11081, EG11082, EG11083, EG11084, EG11095 e EG11098) em condições eficaz es para a produção da proteína do cristal e depois obtenção da proteína do cristal assim produzida. A proteína pode estar presente em células 45 ΡΕ1040192 intactas e, como tal, podem não ser necessário quaisquer passos subsequentes de isolamento ou purificação de proteínas. Como alternativa, as células podem ser rebentadas, sonicadas, lisadas, destruídas ou plasmolisadas para libertar uma ou mais proteínas do cristal a partir dos detritos celulares residuais. Em tais casos, pode ser desejável isolar, concentrar ou ainda purificar os cristais resultantes contendo as proteínas antes de serem usadas como seja, por exemplo, na formulação de composições insectici-das. A composição pode ainda ser purificada para consistir quase totalmente em proteína pura ou, como alternativa, ser purificada ou isolada num grau tal que a composição compreenda as proteínas do cristal numa quantidade entre 0,5% e 99% por peso, ou numa quantidade entre 5% e 95% por peso, ou numa quantidade entre 15% e 85% por peso, ou numa quantidade entre 25% e 75% por peso, ou numa quantidade entre 40% e 60% por peso. 2.3 Vectores Recombinantes Expressando Genes Cry3*

Uma realização importante do invento é um vector recombinante que compreende um segmento de ácido nucleico codificador de uma ou mais das novas proteínas cristais de B. thuringiensis aqui descritas. Tal vector pode ser transferido e replicado num hospedeiro procariótico ou eucariótico, sendo as células bacterianas as particularmente preferidas como hospedeiros procariotas e as células vegetais sendo as particularmente preferidas como hospedeiros eucarióticos. 46 ΡΕ1040192

Επί realizações preferidas, o vector recombinante compreende um segmento de ácido nucleico codificador da sequência de aminoácidos de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:3 0, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:3 8, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:6 6, SEQ ID NO:68, SEQ ID NO:10 0 , SEQ ID NO:102 ou SEQ ID NO:108. Segmentos de ácido nucleico muito preferidos são aqueles que possuem a

sequência : SEQ ID NO: 1, SEQ ID NO: 3 , SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:3 9, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:4 7, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:99, SEQ ID NO:101 ou SEQ ID NO:107.

Uma outra realização importante do invento é uma célula hospedeira transformada que expressa um ou mais destes vectores recombinantes. A célula hospedeira pode ser procariótica ou eucariótica, e células hospedeiras parti- 47 ΡΕ1040192 cularmente preferidas são aquelas que expressam um ou mais segmentos de ácido nucleico compreendendo o vector recom-binante, o qual codifica uma ou mais proteínas do cristal de B. thuringiensis compreendendo sequências de aminoácidos modificadas numa ou mais regiões de ansa do domínio 1, ou entre a hélice α 7 do domínio 1 e a cadeia β 1 do domínio 2. As células bacterianas são particularmente preferidas como hospedeiros procarióticos e as células vegetais são particularmente preferidas como hospedeiros eucarióticos.

Numa realização importante, o invento descreve e reivindica uma célula hospedeira em que as sequências de aminoácidos modificadas compreendem uma ou mais regiões de ansa entre as hélices α 1 e 2, hélices α 2 e 3, hélices α 3 e 4, hélices α 4 e 5, hélices α 5 e 6 ou hélices α 6 e 7 do domínio 1, ou entre a hélice α 7 do domínio 1 e a cadeia β 1 do domínio 2. Uma célula hospedeira particularmente preferida é aquela que compreende a sequência de aminoácidos de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 , SEQ ID NO O i—1 SEQ ID NO: : 12, SEQ ID NO: : 14, SEQ ID NO : 16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: : 22, SEQ ID NO : 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: : 30, SEQ ID NO : 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: : 38, SEQ ID NO : 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: : 46, SEQ ID NO oo SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: : 54, SEQ ID NO : 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: : 62, SEQ ID NO : 6 4, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: : 100 , SEQ ID NO: 102 ou SEQ ID NO : 108 e < ] mais de preferência, uma que compreenda a sequência de ácido 48 ΡΕ1040192

nucleico SEQ ID NO: 1 , SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:3 9, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:4 7, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:99, SEQ ID NO :101 ou SEQ ID NO:107. São aqui descritas e reivindicadas células hospedeiras bacterianas transformadas com um segmento de ácido nucleico codificador de uma proteína do cristal Cry3Bb de acordo com o presente invento e, em particular, uma célula de B. thuringiensis tendo a designação EG11222, EG11228, EG11234, EG11241, EG11048, EG11083, EG11223, EG11229, EG11235, EG11242, EG11051, EG11224, EG11230, EG11236, EG11032, EG11057, EG11225, EG11231, EG11237, EG11035, EG11058, EG11084, EG11095 ou EG11098. EG11226, EG11232, EG11238, EG11036, EG11081, EG11221, EG11227, EG11233, EG11239, EG11046, EG11082,

Numa outra realização, o invento engloba um método de utilização de um segmento de ácido nucleico do presente invento que codifica um gene cry3Bb*. O método, de um modo geral compreende os passos de: (a) preparação de um vector recombinante em que o gene cry3Bb* está posicionado sob o controlo de um promotor; (b) introdução no vector 49 ΡΕ1040192 recombinante numa célula hospedeira: (c) cultura da célula hospedeira em condições eficazes para permitir a expressão da proteína do cristal Cry3Bb* codificada pelo referido gene cry3Bb*; e (d) obtenção da proteína do cristal ou peptídeo Cry3Bb*.

Uma larga variedade de formas estão disponíveis para a introdução de um gene de B. thuringiensis expressando uma toxina no microrganismo hospedeiro em condições gue permitem a manutenção estável e expressão do gene. Pode-se proporcionar construções de DNA que incluem sinais reguladores da transcrição e da tradução para a expressão do gene da toxina, o gene da toxina sob o seu controlo de regulação e uma sequência de DNA homóloga de uma sequência do organismo hospedeiro, pelo que ocorrerá integração, e/ou um sistema de replicação que seja funcional no hospedeiro, pelo que ocorrerá a integração ou manutenção estável.

Os sinais de iniciação da transcrição incluirão um promotor e um local de iniciação da transcrição. Nalguns casos, poderá ser desejável proporcionar expressão regulada da toxina, pelo que a expressão da toxina ocorrerá apenas após lançamento no ambiente. Isto pode ser conseguido com operadores ou uma região de ligação a um activador ou estimuladores, os quais são capazes de fazer indução quando de uma alteração do ambiente físico ou químico dos microrganismos. Por exemplo, pode ser empregue uma região reguladora sensível à temperatura, pelo que os organismos podem ser cultivados no laboratório sem expressão de uma 50 ΡΕ1040192 toxina, mas quando da libertação no ambiente a expressão será iniciada. Outras técnicas podem empregar um meio nutritivo específico no laboratório, o qual inibe a expressão da toxina, pelo que o meio nutritivo no ambiente permitirá a expressão da toxina. Para a iniciação da tradução, estará presente um local de ligação ao ribossoma e um codão de iniciação.

Podem ser empregues várias manipulações para estimular a expressão do RNA mensageiro, particularmente através da utilização de um promotor activo, assim como através do emprego de sequências, as quais aumentam a estabilidade do RNA mensageiro. A região de terminação da transcrição e da tradução envolverá um ou mais codões de paragem, uma região terminadora e, facultativamente, um sinal de poliadenilação. Uma sequência "leader" hidrofóbica pode ser empregue no extremo amina da sequência polipeptídica traduzida de forma a promover a secreção da proteína através da membrana interna.

Na direcção da transcrição, nomeadamente na direcção 5' para 3' da sequência codificadora, a construção envolverá a região reguladora da transcrição, caso exista, e o promotor, em que a região reguladora pode estar 5' ou 3' relativamente ao promotor, o local de ligação ao ribossoma, o codão de iniciação, o gene estrutural tendo uma grelha de leitura aberta em fase com o codão de iniciação, um ou mais codões de paragem, a sequência sinal de poliadenilação, caso exista, e a região terminadora. 51 ΡΕ1040192

Esta sequência, como cadeia dupla, pode ser usada por si só na transformação de um microrganismo hospedeiro, mas incluirá de forma geral uma sequência de DNA envolvendo um marcador, em que a segunda sequência de DNA pode ser ligada à construção de expressão da toxina durante a introdução do DNA no hospedeiro.

Por marca pretende-se significar um gene estrutural que proporciona selecção destes hospedeiros que foram modificados ou transformados. Geralmente, a marca proporcionará vantagem selectiva, por exemplo, proporcionando resistência biocida, e.g., resistência a antibióticos ou a metais pesados; complementação, de forma a proporcionar prototrofia a um hospedeiro auxotrófico, ou similares. De preferência, a complementação é empregue, de forma a que o hospedeiro modificado possa não só ser seleccionado, como também seja competitivo no campo. Uma ou mais marcas podem ser empregues no desenvolvimento das construções, assim como para a modificação do hospedeiro. Os organismos podem ainda ser modificados ao proporcionar-se uma vantagem competitiva contra outros microrganismos selvagens no campo. Por exemplo, os genes que expressam agentes quelan-tes de metais, e.g., sideróforos, podem ser introduzidos no hospedeiro juntamente com o gene estrutural expressando a toxina. Desta forma, o aumento da expressão de um sideró-foro poderá proporcionar uma vantagem competitiva para o hospedeiro produtor de toxinas, de forma a que possa eficazmente competir com os microrganismos selvagens e estavelmente ocupar um nicho no ambiente. 52 ΡΕ1040192

Sempre que não esteja presente um sistema de replicação funcional, a construção incluirá também uma sequência de pelo menos 50 pares de bases (pb), de preferência pelo menos cerca de 100 pb, mais de preferência pelo menos cerca de 1000 pb, e geralmente não mais de cerca de 2000 pb de uma sequência homóloga com uma sequência no hospedeiro. Desta forma, é aumentada a probabilidade de recombinação legitima, de forma a que o gene seja integrado no hospedeiro e estavelmente mantido no hospedeiro. É desejável, que o gene da toxina esteja em estreita proximidade com o gene que proporciona complementação assim como o gene que proporciona vantagem competitiva. Desta forma, no caso de se perder o gene de uma toxina, o organismo resultante com grande probabilidade também perderá o gene de complementação e/ou o gene que proporciona vantagem competitiva, de forma a que seja incapaz de competir no ambiente com o gene mantendo a construção intacta.

Um grande número de regiões reguladoras da transcrição estão disponíveis a partir de uma variedade de microrganismos hospedeiros, tais como bactérias, bacterió-fagos, cianobactérias, algas, fungos e similares. Várias regiões reguladoras da transcrição incluem as regiões associadas ao gene trp, gene lac, gene gal, os promotores XL e XR, o promotor tac, os promotores naturais associados ao gene da δ-endotoxina, quando funcionais no hospedeiro. Ver por exemplo, Patentes U.S. 4332898, 4342832 e 4356270 (cada uma das quais é aqui especificamente incorporada como 53 ΡΕ1040192 referência) . A região de terminação pode ser a região de terminação normalmente associada à região de iniciação da transcrição ou uma região de iniciação da transcrição diferente, de forma a que as duas regiões sejam compatíveis e funcionais no hospedeiro.

Quando se pretenda a manutenção ou integração epissómica estável, empregar-se-á um plasmídeo que tenha um sistema de replicação funcional no hospedeiro. 0 sistema replicativo pode derivar do cromossoma, de um elemento epissómico normalmente presente no hospedeiro ou num hospedeiro diferente ou de um sistema replicativo derivado de um vírus que seja estável no hospedeiro. Existe um grande número de plasmídeos, tais como pBR322, pACYC184, RSF1010, pR01614 e similares. Ver, por exemplo, Olson et al. (1982); Bagdasarian et al. (1981), Baum et al., 1990 e Patentes U.S. 4356270; 4362817; 4371625 e 5441884, aqui incluídos especificamente como referência. O gene de B. thuringiensis pode ser introduzido entre a região de iniciação da transcrição e da tradução e a região de terminação da transcrição e da tradução, de forma a estar sob o controlo regulador da região de iniciação. Esta construção será incluída num plasmídeo, o qual possuirá pelo menos um sistema de replicação, mas pode incluir mais de um, neste caso um sistema replicativo é empregue para clonagem durante o desenvolvimento do plasmídeo e o segundo sistema replicativo é necessário para o funcionamento no hospedeiro final. Ainda, podem estar 54 ΡΕ1040192 presente uma ou mais marcas, as quais foram anteriormente descritas. Quando se pretende integração, o plasmideo incluirá de preferência uma sequência homóloga do genoma do hospedeiro.

Os transformantes podem ser isolados de acordo com meios convencionais, geralmente empregando uma técnica de selecção, a qual permite a selecção do organismo pretendido face aos organismos não modificados ou organismos de transferência, quando presentes. Os transformantes podem ser então testados relativamente à actividade pesticida. Caso se pretenda, as sequências de DNA indesejáveis ou auxiliares podem ser selectivamente removidas da bactéria recombinante usando sistemas de recombinação específicos de local, tais como os descritos na Patente U.S. 5441884 (especificamente incluída aqui como referência) . 2.4 Segmentos de DNA cry3

Um gene cry3* de B. thuringiensis codificador de uma proteína do cristal tendo uma ou mais mutações numa ou mais regiões do peptídeo representa um aspecto importante do invento. De preferência, o gene cry3* codifica uma sequência de aminoácidos em que um ou mais resíduos de aminoácidos foram alterados com base nos métodos aqui descritos e, particularmente, as alterações que foram feitas com o objectivo de alterar a actividade ou especificidade insecticida da proteína do cristal. 55 ΡΕ1040192

De acordo com o presente invento, sequências de ácido nucleico incluem e não estão limitadas a DNA, incluindo e não limitado a mRNA e tRNA; sequências complementares da cadeia codificadora, nucleósidos e sequências de ácido nucleico adequadas, tais como as descritas em SEQ ID NO: 1, SEQ ID N0:3, SEQ ID N0:5, SEQ ID N0:7, SEQ ID N0:9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO : 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO:21 , SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:2 7, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID \—1 LO O SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:6 7, SEQ ID NO:99, SEQ ID NO:101 ou SEQ ID NO : 10 7, e alterações nas sequências ; de ácido nucleico incluindo alterações, deleções, mutações e homólogos capazes de expressar as toxinas modificadas de B. thuringiensis do presente invento.

Como tal, o presente invento também está relacionado com segmentos de DNA que não possuem DNA genómico total e que codificam as novas proteínas do cristal modificadas sinteticamente aqui descritas. Os segmentos de DNA codificadores destes peptídeos podem codificar proteínas, polipeptídeos, subunidades, domínios funcionais e similares dos produtos de genes relacionados ou não com as proteínas do cristal. Ainda, estes segmentos de DNA podem ser sintetizados totalmente in vitro usando métodos bem conhecidos dos familiarizados com a matéria. 56 ΡΕ1040192

Tal como aqui é usado, o termo "segmento de DNA" refere-se a uma molécula de DNA que foi isolada sem a presença de DNA genómico total de uma espécie particular. Assim, um segmento de DNA codificador de uma proteína do cristal ou peptídeo refere-se a um segmento de DNA que contem sequências codificadoras de proteínas do cristal ainda que isolado ou purificado a partir de DNA genómico total da espécie de onde o segmento de DNA é obtido, o qual no caso vertente é o genoma de bactérias Gram-positivas do género Bacillus e, em particular, a espécie de Bacillus conhecida como B. thuringiensis. Estão incluídos no termo "segmento de DNA", segmentos de DNA e fragmentos mais pequenos de tais segmentos e também vectores recombinantes, incluindo, por exemplo, plasmídeos, cosmídeos, fagomideos, fagos, virus e similares.

De forma semelhante, um segmento de DNA compreendendo um gene codificador de proteína do cristal isolada ou purificada refere-se a um segmento de DNA que pode incluir, para além das sequências codificadoras de peptídeos, outros elementos tais como sequências reguladoras, isolados sem outros genes naturais ou sequências codificadoras de proteínas. Neste aspecto, o termo "gene" é usado por simplicidade para referir uma unidade funcional codificadora de proteína, polipeptídeo ou peptídeo. Conforme será compreendido pelos familiarizados com a matéria, este termo funcional inclui sequências genómicas, sequências de operão e segmentos de genes mais pequenos manipulados geneti- 57 ΡΕ1040192 camente ou podem ser adaptados para expressar proteínas, polipeptídeos ou peptídeos. "Substancialmente isolado sem outras sequências codificadoras" significa que o gene com interesse, neste caso um gene codificador de uma proteína do cristal bacteriana, forma a parte significativa da região codificadora do segmento de DNA e que o segmento de DNA não possui grandes porções de DNA codificador natural, como sejam fragmentos cromossómicos grandes ou outros genes funcionais ou regiões codificadoras de operões. Certamente, isto refere-se ao segmento de DNA como originalmente isolado e não exclui genes, genes recombinantes, adaptadores sintéticos ou regiões codificadoras mais tarde adicionadas ao segmento pela mão humana.

Sao particularmente preferidas as sequências de DNA codificadoras das proteínas do cristal Cry3Bb.60, Cry3Bb.11221, Cry3Bb.11222, Cry3Bb.11223, Cry3Bb.11224, Cry3Bb.11225, Cry3Bb.11226, Cry3Bb.11227, Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11231, Cry3Bb.11232, Cry3Bb.11233, Cry3Bb.11234, Cry3Bb.11235, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb.11238, Cry3Bb.11239, Cry3Bb.11241, Cry3Bb.11242, Cry3Bb.11032, Cry3Bb.11035, Cry3Bb.11036, Cry3Bb.11046, Cry3Bb.11048, Cry3Bb.11051, Cry3Bb.11057, Cry3Bb.11058, Cry3Bb.11081, Cry3Bb.11082, Cry3Bb.11083, Cry3Bb.11084, Cry3Bb.11095 e Cry3Bb.11098 e, em particular, genes cry3Bb* tais como cry3Bb.60, cry3Bb.11221, cry3Bb.11222, cry3Bb.11223, cry3Bb.11224, cry3Bb.11225, 58 ΡΕ1040192 cry3Bb.11226, cry3Bb. 11227, cry3Bb.11228, cry3Bb.11229, cry3Bb.11230, cry3Bb.11231, cry3Bb.11232, cry3Bb.11233, cry3Bb.11234, cry3Bb.11235, cry3Bb.11236, cry3Bb. 11237, cry3Bb.11238, cry3Bb.11239, cry3Bb.11241, cry3Bb.11242, cry3Bb.11032, cry3Bb.11035, cry3Bb .11036, cry3Bb. 11046, cry3Bb.11048, cry3Bb.11051, cry3Bb. 11057, cry3Bb.11058, cry3Bb.11081, cry3Bb.11082, cry3Bb.11083, cry3Bb.11084, cry3Bb.11095 e cry3Bb.11098. Em realizações particulares, o

invento diz respeito a segmentos de DNA isolados e vectores recombinantes que incluem sequências de DNA codificadoras de peptideos Cry que incluem na sua sequência de aminoácidos uma sequência de aminoácidos essencialmente como descrito em SEQ ID N0:2, SEQ ID N0:4, SEQ ID N0:6, SEQ ID NO: 8, SEQ ID NO:10, SEQ ID N0:12, SEQ ID N0:14, SEQ ID

NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:2 4, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:6 4, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:100, SEQ ID NO:102 ou SEQ ID NO:108. 0 termo " uma sequência essencialmente : como descrito em SEQ ID NO : 2, SEQ ID NO: 4, SEQ ID NO:6, SEQ ID NO: 8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:2 4, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID 59 ΡΕ1040192

NO :40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID

NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID

NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID

NO:6 4, SEQ ID NO:66, SEQ ID NO:68, SEQ ID N0:100, SEQ ID NO:102 ou SEQ ID NO:108" significa que a sequência corresponde substancialmente a uma porção da sequência de SEQ ID NO: 2 , SEQ ID NO:4, SEQ ID NO :6, SEQ ID NO:8, SEQ ID O \—1 O SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:3 4, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:6 6, SEQ ID NO:68, SEQ ID NC u 100, SEQ ID NO :102 ou SEQ ID NO:10 8 e tem relativamente : poucos aminoácidos que não são idênticos ou equivalentes biologicamente funcionais dos aminoácidos de qualquer uma destas sequências. O termo "equivalente biologicamente funcional" é óbvio na técnica e está ainda aqui definido detalhadamente (e.g., ver Exemplos de Realizações).

Assim, as sequências que tenham entre 70% e 75% ou entre 75% e 80%, ou mais de preferência entre 81% e 90%, ou mesmo mais de preferência entre 91% ou 92% ou 93% e 97% ou 98% ou 99% de identidade de sequência de aminoácidos ou equivalência funcional dos aminoácidos de SEQ ID NO:2, SEQ ID NO: 4, SEQ ID NO:6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO: 12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID 60 ΡΕ1040192 NO:2 0, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:2 8, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID O QO O S SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:6 6, SEQ ID NO:6 8, SEQ ID NO:100, SEQ ID NO:102 ou SEQ ID NO:108 serão sequências que são "es sencialmente como descrito em SEQ ID NO: 2, SEQ ID NO:4, SEQ ID NO: 6, SEQ ID NO :8, SEQ ID NO: 10, SEQ ID NO:12, SEQ ID NO:14 , SEQ ID NO:16, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO:22 , SEQ ID NO:24 , SEQ ID NO:26, SEQ ID NO:2 8, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID O 0Ω O iz; SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:6 6, SEQ ID NO:6 8, SEQ ID NO:100, : SEQ id : NO:102 ou SEQ ! ID NO:108 ff Será igualmente entendido que as sequências de aminoácidos e de ácidos nucleicos podem incluir resíduos adicionais, tais como aminoácidos N- ou C-terminais ou sequências 5' ou 3' e ainda são essencialmente como descrito numa das sequências aqui descritas, desde que a sequência preencha os critérios atrás descritos, incluindo a manutenção de actividade proteica biológica no caso de estar em questão a expressão proteica. A adição de sequências terminais aplica-se, particularmente, a sequências de ácido nucleico que podem, por exemplo, incluir várias sequências não codificadoras flanqueantes das porções 5' ou 61 ΡΕ1040192 3' da região codificadora ou podem incluir várias sequências internas, i.e., intrões, os quais existem nos genes.

Os segmentos de ácido nucleico do presente invento, independentemente do comprimento da sua sequência codificadora, podem ser combinados com outras sequências de DNA, tais como promotores, sinais de poliadenilação, locais para enzimas de restrição adicionais, múltiplos locais de clonagem, outros segmentos codificadores e similares, de forma a que o seu comprimento global possa variar consideravelmente. Está portanto contemplado que possa ser empregue um fragmento de ácido nucleico de qualquer tamanho, estando o comprimento total preferencialmente limitado pela facilidade de preparação e utilização do protocolo de DNA recombinante pretendido.

Por exemplo, podem ser preparados fragmentos de ácido nucleico que incluam um pequeno segmento contíguo codificador da sequência peptídica descrita em SEQ ID NO:2,

SEQ ID NO: 4 , SEQ ID NO : 6, SEQ ID NO:8 , SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:2 0, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:2 8, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:6 0, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:6 6, SEQ ID NO:6 8, SEQ ID NO:100, SEQ ID NO:102 ou SEQ ID NO: 108, OU que seja idêntica ou complementar das sequências de DNA que 62 ΡΕ1040192 codificam o peptídeo descrito em SEQ ID NO:2 , SEQ ID NO : 4, SEQ ID NO: 6 , SEQ ID NO: 8, SEQ ! ID NO: 10, SEQ ID NO : 12, SEQ ID NO: 14, SEQ ID NO: 16, SEQ ID NO:18, SEQ ID NO: 20 , SEQ ID NO:22, SEQ ID NO: 24 , SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:3 0, SEQ ID NO: 32 , SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO: 40 , SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO: 48 , SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO: 56 , SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO: 64 , SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:100 , SEQ ID NO: 102 ou SEQ ID NO:108, e particularmente os segmentos de DNA descritos em SEQ ID NO:1 , SEQ ID NO : 3, SEQ ID NO: 5, r SEQ ID : NO: 7, SEQ ID NO:9 , SEQ ID NO: 11 , SEQ ID NO:13, SEQ ID NO: 15 , SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO: 23 , SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:2 9, SEQ ID NO: 31 , SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:3 7, SEQ ID NO: 39 , SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO: 47 , SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO: 55 , SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO: 63 , SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:9 9, SEQ : ID NO:101 ou SEQ ID i NO:107 . São muito preferidos os segmentos de ácido nucleico do presente invento que compreendem um ou mais genes cry do invento, ou uma porção de um ou mais genes cry do invento. Para determinadas aplicações, são preferidas pequenas sequências de ácido nucleico contíguas, tais como as de aproximadamente 14 ou 15 ou 16 ou 17 ou 18 ou 19 ou 20, ou 30-50, 51-80, 81-100 ou mais nucleótidos de comprimento. Como alternativa, nalgumas realizações, e 63 ΡΕ1040192 particularmente nas que envolvem a preparação de vectores recombinantes, transformação de células hospedeiras adequadas e preparação de células veqetais transgénicas, são preferidos segmentos de ácido nucleico mais longos, particularmente os que incluem a totalidade da região codificadora de um ou mais genes cry. Como tal, os segmentos preferidos podem incluir os que possuem até cerca de 20000 ou mais nucleótidos de comprimento ou, como alternativa, sequências mais curtas como as com cerca de 19000, cerca de 18000, cerca de 17000, cerca de 16000, cerca de 15000, cerca de 14000, cerca de 13000, cerca de 12000, cerca de 11000, cerca de 10000, cerca de 9000, cerca de 8000, cerca de 7000, cerca de 6000, cerca de 5000, cerca de 4500, cerca de 4000, cerca de 3500, cerca de 3000, cerca de 2500, cerca de 2000, cerca de 1500, cerca de 1000, cerca de 500 ou cerca de 200 ou mais pares de bases de comprimento. Certamente, estes números não se destinam a ser exclusivos de todos os possíveis comprimentos intermédios na gama entre cerca de 20000 e cerca de 15 nucleótidos, uma vez que todos estes comprimentos intermédios são considerados úteis e caem dentro do âmbito do presente invento. Será facilmente compreendido que "comprimentos intermédios", nestes contextos, significam qualquer comprimento entre os limites seleccionados tais como 14, 15, 16, 17, 18 Oh s—1 20, etc. ; 21, 2 ,2, 23, 24 , 25, 26, 27, 28, 29, etc., ; 30, 31, 32, 33, 34, 35, 36 . . . etc .; 50, 51, 52 , 53 ____ etc. ; 60, i—1 62, 63 etc.; 70, 80, 90, 100, 110, 120, . 130 etc. ; 200, 210 , 220, 230, 240, 250, . . . etc.; incluindo todos os números inteiros em toda a gama entre cerca e 14 e 64 ΡΕ1040192 cerca de 10000, incluindo os inteiros nas gamas de 200-500; 500-1000; 1000-2000; 2000-3000; 3000-5000 e similares.

Numa realização preferida, os segmentos de ácido nucleico compreendem uma sequência entre cerca de 1800 e cerca de 18000 pares de bases de comprimento e compreendem um ou mais genes que codificam um polipeptídeo Cry3* modificado aqui descrito que tem maior actividade contra pragas de insectos coleópteros.

É igualmente entendido que este invento nao está limitado a sequências de ácido nucleico particulares que codificam peptideos do presente invento ou que codificam a sequência de aminoácidos de ; SEQ ID NO: 2, SEQ ID NO :4, SEQ ID NO: 6, SEQ ID NO:8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:3 0, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:3 8, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:10 0 , SEQ ID NO:102 ou SEQ ID NO:108, incluindo as sequências de DNA que sao particularmente descritas em SEQ ID NO: 1, SEQ ID NO:3, SEQ ID NO : 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID 65 ΡΕ1040192 NO: 49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO: 5 7, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:99, SEQ ID NO:101 ou SEQ ID NO:107. Vectores recombinantes e segmentos de DNA isolados podem portanto incluir, de forma variável, as próprias regiões codificadoras de peptídeos, regiões codificadoras portadoras de alterações ou mutações seleccionadas na região codificadora básica, ou sequências codificadoras de polipeptídeos maiores que, no entanto, incluem estas regiões codificadoras de peptídeos ou que podem codificar proteínas ou peptídeos equivalentes do ponto de vista funcional, possuidoras de variantes das sequências de aminoácidos.

Os segmentos de DNA do presente invento incluem peptídeos equivalentes biologicamente funcionais. Tais sequências podem surgir como consequência da redundância de codões e da equivalência funcional que se sabe ocorrer naturalmente nas sequências de ácido nucleico e proteínas codificadas. Como alternativa, proteínas ou peptídeos funcionalmente equivalentes podem ser criados via aplicação de tecnologia de DNA recombinante, em que as alterações na estrutura proteica podem ser manipuladas com base em considerações das propriedades dos aminoácidos a ser alterados. As alterações projectadas pelo homem podem ser introduzidas através da aplicação de técnicas de mutagénese dirigida, e.g., para introduzir melhoramentos na antigenicidiade da proteína ou para testar mutantes de forma a examinar a actividade ao nível molecular. ΡΕ1040192 - 6 6 -

Caso se pretenda, pode-se também preparar proteínas e peptídeos de fusão, e.g. em que as regiões codificadoras dos peptídeos são alinhadas dentro da mesma unidade de expressão com outras proteínas ou peptídeos tendo as funções pretendidas, como seja para a purificação ou imunodetecção (e.g., proteínas que possam ser purificadas por cromatografia de afinidade e regiões codificadoras de marcas enzimáticas, respectivamente).

Os vectores recombinantes formam outros aspectos do presente invento. São considerados particularmente úteis os vectores em que a porção codificadora do segmento de DNA, codificadora de uma proteína de tamanho completo ou peptídeo mais pequeno, esteja posicionada sob o controlo de um promotor. 0 promotor pode ser na forma do promotor naturalmente associado ao gene codificador de peptídeos do presente invento, tal como pode ser obtido através do isolamento de sequências não codificadoras 5' localizadas a montante do segmento codificador ou exão, por exemplo, usando tecnologia recombinante de clonagem e/ou PCR™, em associação com as composições aqui descritas. 2.5 Vectores , Células Hospedeiras e Expressão Proteica

Noutras realizações, é considerado que serão adquiridas determinadas vantagens através do posicionamento do segmento de DNA codificador sob o controlo de um promotor recombinante ou heterólogo. Tal como aqui é usado, um promotor recombinante ou heterólogo destina-se a referir 67 ΡΕ1040192 um promotor que não está normalmente associado a um segmento de DNA codificador de uma proteína ou peptídeo cristal no seu ambiente natural. Tais promotores podem incluir promotores normalmente associados a outros genes e/ou promotores isolados a partir de qualquer célula bacteriana, vírus, célula eucariótica ou célula vegetal. Naturalmente, será importante empregar um promotor que eficazmente dirija a expressão do segmento de DNA no tipo de célula, organismo ou mesmo animal escolhido para expressão. A utilização de combinações de promotor e tipo de célula para a expressão proteica é de um modo geral conhecida dos familiarizados com a técnica da biologia molecular, por exemplo, ver Sambrook et al., 1989 . Os promotores empregues podem ser constitutivos ou induzíveis e podem ser usados nas condições adequadas para dirigir nível elevado de expressão do segmento de DNA introduzido, tal como é vantajoso na produção em larga escala de proteínas ou peptídeos recombinantes. Sistemas promotores adequados contemplados para usar em elevados níveis de expressão incluem, mas não estão limitados ao sistema vector de expressão de Pichia (Pharmacia LKB Technology).

Associado às realizações de expressão para preparar proteínas ou peptídeos recombinantes, é considerado que os segmentos de DNA mais longos serão mais frequentemente usados, sendo mais preferidos os segmentos de DNA codificadores da totalidade da sequência peptídica. No entanto, será óbvio que a utilização de segmentos de DNA mais pequenos para dirigir a expressão de peptídeos do cristal 68 ΡΕ1040192

ou regiões centrais epitópicas, tal como pode ser usado para gerar anticorpos anti-proteínas do cristal, também estão dentro do âmbito do invento. São considerados como particularmente úteis os segmentos de DNA que codificam antigénios peptídicos entre cerca de 8, 9, 10 ou 11 ou mais aminoácidos, e até os que incluem cerca de 30, 40 ou 50 ou mais aminoácidos de comprimento, ou mais de preferência, entre cerca de 8 e cerca de 30 aminoácidos de comprimento, ou mesmo mais de preferência, entre cerca de 8 e cerca de 20 aminoácidos de comprimento são considerados particularmente úteis. Tais epitopos peptídicos podem ser sequências de aminoácidos que compreendem uma sequência de aminoácidos contíguas de SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, SEQ ID

NO: 8, SEQ ID NO:10, SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:2 4, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:34, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:6 4, SEQ ID NO:66, SEQ ID NO:68, SEQ ID NO:100, SEQ ID NO:102 ou SEQ ID NO:108. 2.6 Células Hospedeiras Transformadas e Plantas Transgénicas

Numa realização, o invento proporciona uma planta transgénica tendo incorporado no seu genoma um transgene que codifica uma sequência de aminoácidos seleccionada do grupo consistindo em SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO:6, 69 ΡΕ1040192

SEQ ID NO: 8 , SEQ ID NO:10, SEQ I D NO : 12, SEQ ID NO: 1—1 SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO:20 , SEQ ID NO : 22, SEQ ID NO: 24, SEQ ID NO : 26 , SEQ ID NO : 2 8, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO : 3 4 , SEQ ID NO : 36, SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO : 42 , SEQ ID NO : 44, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO : 50 , SEQ ID NO : 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO : 58 , SEQ ID NO : 6 0, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO : 66, r SEQ ID NO: co > SEQ H u o 1—* O O SEQ ID NO:102 ou SEQ ID NO:108.

Um outro aspecto do invento é uma planta trans-génica tendo incorporado no seu genoma um transgene cry3Bb*, desde que o transgene compreenda uma sequência de ácido nucleico seleccionada do grupo consistindo em SEQ ID NO:l, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:11, SEQ ID NO: 13 , SEQ ID NO : 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:2 7, SEQ ID NO: 29 , SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO: 37 , SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO: 45 , SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO: 53 , SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO: 61 , SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:6 7, SEQ ID NO:99, SEQ ID NO:101 ou SEQ ID NO:107. T ambém é descrita e ; reivindicada a progénie de tal planta transgénica , assim como as suas sementes e sementes que surjam das plantas derivadas de tal planta transgénica, da segunda geraçao e gerações subsequentes. O invento também descreve e reivindica células 70 ΡΕ1040192 hospedeiras, nativas e geneticamente manipuladas, que expressam os novos genes cry3Bb* para produzir polipeptí-deos Cry3Bb*. Exemplos preferidos de células hospedeiras bacterianas incluem B. thuringiensis EG11221, EG11222 EG11223, EG11224 , EG11225, EG11226, EG11227, , EG11228 EG11229, EG11230, EG11231, EG11232, EG11233, EG11234 EG11235, EG11236, EG11237, EG11238, EG11239, EG11241 EG11242, EG11032, EG11035, EG11036, EG11046, EG11048 EG11051, EG11057, EG11058, EG11081, EG11082, EG11083 EG11084, EG11095 e EG11098. Métodos de utilização de tais células para pro duzir proteínas cristais Cry3 * sao igualmente descritos

Tais métodos, de um modo geral, envolvem a cultura da célula hospedeira (como seja B. thuringiensis EG11221, EG11222, EG11223, EG11224 , EG11225, EG11226, EG11227, EG11228, EG11229, EG11230, EG11231, EG11232, EG11233, EG11234, EG11235, EG11236 , EG11237, EG11238, EG11239, EG11241, EG11242, EG11032, EG11035, EG11036, EG11046, EG11048, EG11051, EG11057, EG11058, EG11081, EG11082, EG11083, EG11084, EG11095 ou EG11098) em condições eficazes para produzir uma protéina cristal Cry3* e obtenção de proteína do cristal Cry3* a partir da referida célula.

Ainda num outro aspecto, o presente invento proporciona método para a produção de uma planta transgénica que expressa um segmento de ácido nucleico codificador das novas proteínas do cristal recombinantes do presente invento. O processo de produção de plantas transgénicas é 71 ΡΕ1040192 bem conhecido na técnica. Em geral, o método compreende transformação de uma célula hospedeira adequada com um ou mais segmentos de DNA que contêm um ou mais promotores operacionalmente ligados a uma região codificadora que codifica uma ou mais das proteínas do cristal descritas para B. thuringiensis. Tal região codificadora está, de um modo geral, operacionalmente ligada a uma região de terminação da transcrição, pelo que o promotor é capaz de dirigir a transcrição da região codificadora na célula e portanto proporcionar à célula a capacidade de produzir a proteína recombinante in vivo. Como alternativa, no caso em que é desejável controlar, regular ou diminuir a quantidade de uma proteína do cristal recombinante particular expressa numa célula transgénica particular, o invento também proporciona a expressão do mRNA complementar da sequência codificadora de proteína do cristal. A utilização de mRNA complementar de sequência codificadora como meio de controlar ou diminuir a quantidade de uma determinada proteína com interesse numa célula é conhecido na técnica.

Um outro aspecto do invento compreende uma planta transgénica que expressa um gene ou um segmento de gene codificador de uma ou mais das novas composições poli- peptídicas aqui descritas. Como aqui é usado, 0 termo "planta transgénica" destina-se a referir uma planta que tem sequências de DNA incluídas, incluindo mas não estando limitado a genes que talvez não estejam normalmente presentes, sequências de DNA normalmente não transcritas em RNA ou traduzidas numa proteína ("expressas"), ou quaisquer outros genes ou sequências de DNA que se pretenda intro- 72 ΡΕ1040192 duzir na planta não transformada, como sejam genes que possam normalmente estar presentes na planta não transformada mas que se pretende manipular geneticamente ou que tenha expressão alterada.

Considera-se que nalguns casos o genoma de uma planta transgénica do presente invento tenha sido aumentado através da introdução estável de um ou mais transgenes codificadores de Cry3Bb* nativos, modificados sinteticamente ou mutagenizados. Nalguns casos, mais de um transgene será incluído no genoma da célula vegetal hospedeira transformada. Assim acontece quando mais de um segmento de DNA codificador de proteína do cristal é incluído no genoma de tal planta. Em determinadas situações, pode ser desejável ter uma, duas, três, quatro ou mesmo mais proteínas do cristal de B. thuringiensis (nativas ou manipuladas por engenharia genética) incorporadas e estavel-mente expressas na planta transgénica transformada.

Um gene preferido que pode ser introduzido inclui, por exemplo, uma sequência de DNA codificadora de uma proteína do cristal de origem bacteriana e, particularmente, uma ou mais das aqui descritas, as quais são obtidas a partir e Bacillus spp. Sequências de ácido nucleico altamente preferidas são as obtidas a partir de B. thuringiensis ou qualquer uma das sequências que tenham sido geneticamente manipuladas para diminuir ou aumentar a actividade insecticida da proteína do cristal em tal célula hospedeira transformada. 73 ΡΕ1040192

Meios para a transformação de uma célula vegetal e preparação de uma linha celular transgénica são conhecidos e são aqui discutidos. Vectores, plasmídeos, cosmí-deos, YACs (cromossomas artificiais de levedura) e segmentos de DNA para usar na transformação de tais células certamente compreenderão, de um modo geral, operões, genes ou sequências derivadas de genes do presente invento, nativas ou derivadas sinteticamente e, particularmente, as codificadoras das proteínas cristais descritas. Estas construções de DNA podem ainda incluir estruturas tais como promotores, estimuladores, poli-adaptadores ou mesmo sequências de genes as quais possuem actividade reguladora positiva ou negativa sobre genes particulares com interesse conforme pretendido. 0 segmento de DNA ou gene pode codificar uma proteína do cristal nativa ou modificada, que será expressa nas células recombinantes resultantes e/ou conferirá um fenótipo melhorado à planta regenerada.

Tais plantas transgénicas podem ser desejáveis para aumentar a resistência a insecticida de uma planta monocotiledónea ou dicotiledónea, através da incorporação em tal planta, de um segmento de DNA transgénico codificador de uma proteína do cristal Cry3*Bb que é tóxica para insectos coleópteros. Plantas particularmente preferidas incluem cereais tais como milho, trigo, centeio, arroz, cevada e aveia; legumes tais como feijão de soja; tubérculos tais como batatas; culturas de fibras tais como linho e algodão; turfa e gramímeas de pastagens; plantas ornamentais; arbustos; árvores; vegetais, bagas, citrinos, frutos, cactos, suculentas e outras culturas com impor- 74 ΡΕ1040192 tância comercial incluindo plantas de jardim e de interiores.

Num aspecto relacionado, o presente invento também engloba uma semente produzida pela planta transformada, uma progénie derivada de tal semente e uma semente produzida pela progénie da planta transgénica original, produzida de acordo com o processo descrito. Tal progénie e sementes terão um ou mais genes de proteínas do cristal incorporados no seu genoma e tais plantas de progénie herdarão de forma Mendeliana as características proporcionadas pela introdução de um transgene estável. Todas essas plantas transgénicas possuindo incorporados no seu genoma segmentos de DNA transgénicos codificadores de uma ou mais proteínas ou polipeptídeos cristais Cry3Bb* são aspectos deste invento. Transgenes particularmente preferidos para a realização do invento incluem segmentos de ácido nucleico compreendendo um ou mais genes cry3Bb*. 2.7 Equivalentes Biológicos Funcionais

Podem ser efectuadas modificações e alterações na estrutura dos peptídeos do presente invento e segmentos de DNA que os codificam e ainda obter uma molécula funcional que codifique uma proteína ou peptídeos com características desejáveis. Segue-se uma discussão baseada na alteração dos aminoácidos de uma proteína para criar uma molécula de segunda geração equivalente, ou mesmo melhorada. Em realizações particulares do invento, as proteínas do cristal mutagenizadas são consideradas como úteis no aumento da 75 ΡΕ1040192 actividade insecticida da proteína e, consequentemente, no aumento da actividade insecticida e/ou expressão do transgene recombinante numa célula vegetal. As alterações de aminoácidos podem ser conseguidas através da alteração dos codões da sequência de DNA, de acordo com os codões apresentados na Tabela 4.

Tabela 4

Aminoácidos Codões

Alanina Ala A GCA GCC GCG GCU Cisteína Cys C UGC UGU Ácido Aspártico Asp D GAC GAU Ácido glutâmico Glu E GAA GAG Fenilalanina Phe F UUC UUU Glicina Gly G GGA GGC GGG GGU Histidina His H CAC CAU Isoleucina Ile I AUA AUC AUU Lisina Lys K AAA AAG Leucina Leu L UUA UUG CUA CUC CUG CUU Metionina Met M AUG Asparagina Asn N AAC AAU Prolina Pro P CCA CCC CCG CCU Glutamina Gin Q CAA CAG Arginina Arg R AGA AGG CGA CGA CGC CGG CGU Serina Ser S AGC AGU UCA UCC UCG UCU Treonina Thr T ACA ACC ACG ACU Valina Vai V GUA GUC GUG GUU Triptofano Trp W UGG Tirosina Tyr Y UAC UAU 76 ΡΕ1040192

Por exemplo, determinados aminoácidos podem ser substituídos por outros aminoácidos numa estrutura proteica sem perda apreciável da capacidade de ligação interactiva com estruturas tais como, por exemplo, regiões de ligação a antigénios dos anticorpos ou locais de ligação nas moléculas de substrato. Uma vez que é a capacidade interactiva e a natureza de uma proteína que define a actividade biológica funcional da proteína, podem ser feitas determinadas substituições na sequência de aminoácidos da proteína e, certamente, na sua sequência de DNA codificadora subjacente e, no entanto, obter-se uma proteína com propriedades semelhantes. É assim contemplado pelos inventores que várias alterações podem ser feitas nas sequências peptídicas das composições descritas, ou sequências de DNA correspondentes que codificam os referidos peptídeos, sem perda apreciável da sua utilidade ou actividade biológica.

Na preparação de tais alterações, pode ser considerado o índice hidropático dos aminoácidos. A importância do índice hidropático dos aminoácidos na função biológica interactiva de uma proteína é, de um modo geral, entendido na técnica (Kyte and Doolittle, 1982, aqui incluído como referência). É aceite que o carácter hidropático relativo do aminoácido contribui para a estrutura secundária da proteína resultante, o que por sua vez define a interacção da proteína com outras moléculas, por exemplo, enzimas, substratos, receptores, DNA, anticorpos, antigénios e similares. 77 ΡΕ1040192 A cada um dos aminoácidos foi atribuído um índice hidropático com base nas suas características de hidro-fobicidade e de carga (Kyte and Doolittle, 1982), estas são: isoleucina (+4,5); valina (+4,2); leucina (+3,8); fenilalanina (+2,8); cisteína/cistina (+2,5); metionina (+1,9); alanina (+1,8); glicina (-0,4); treonina (-0,7); serina (-0,8); triptofano (-0,9); tirosina (-1,3); prolina (-1,6); histidina (-3,2); glutamato (-3,5); aspartato (-3,5); asparagina (-3,5); lisina (-3,,9) ; e arginina (-4,5) . É conhecido na técnica gue determinados aminoácidos podem ser substituídos por outros aminoácidos tendo um índice ou pontuação hidropática semelhante e ainda resultar numa proteína com actividade biológica semelhante, i.e., ainda obter uma proteína funcionalmente eguivalente em termos biológicos. Ao serem feitas tais alterações, prefere-se que a substituição seja entre aminoácidos cujos índices hidropáticos estão dentro de ±2, sendo particularmente preferidos os que estão dentro de ±1 e os que estão dentro de ±0,5 são mesmo mais particularmente preferidos. É igualmente entendido na técnica que a substituição de aminoácidos semelhantes pode ser feita eficazmente com base na hidrofilicidade. A Patente U.S. 4554101, aqui especificamente incluída como referência, estabelece que hidrofilicidade média local mais elevada de uma proteína, conforme determinado pela hidrofilicidade dos 78 ΡΕ1040192 seus aminoácidos adjacentes, está correlacionada com uma propriedade biológica da proteína.

Conforme detalhado na Patente U.S. 4554101, foram atribuídos aos resíduos de aminoácidos os valores de hidrofilicidade que se seguem: arginina (+3,0); lisina (+3,0); aspartato (3,0 ± 1); glutamato (3,0 ± 1); serina (+0,3); asparagina (+0,2); glutamina (+0,2); glicina (0); treonina (-0,4); prolina (-0,5 ± 1); alanina (-0,5); histidina (-0,5); cisteína (-1,0); metionina (-1,3); valina (-1,5); leucina (-1,8); isoleucina (-1,8); tirosina (-2,3); fenilalanina (-2,5); triptofano (-3,4).

Deve ser entendido que um aminoácido pode ser substituído por um outro tendo um valor de hidrofilicidade semelhante e ainda obter um equivalente biológico e, em particular, uma proteína imunologicamente equivalente. Em tais alterações, é preferida a substituição de aminoácidos cujos valores de hidrofilicidade estão dentro de ±2, sendo particularmente preferidos os que estão dentro de ±1 e ainda mais particularmente preferidos os que estão dentro de ± 0,5.

Conforme descrito atrás, as substituições de aminoácidos são, de um modo geral baseadas na semelhança relativa dos substituintes das cadeias laterais de aminoácidos, por exemplo, na sua hidrofobicidade, hidrofilici-dade, carga, tamanho e similares. Exemplos de substituições que têm em consideração várias das características anterio- 79 ΡΕ1040192 res são conhecidas dos familiarizados com a matéria e incluem: arginina e lisina; glutamato e aspartato; serina e treonina; glutamina e asparagina; e valina, leucina e isoleucina. 3.0 Breve Descrição dos Desenhos

Os desenho fazem parte da presente especificação e são incluídos para demonstrar determinados aspectos do presente invento. 0 invento pode ser melhor compreendido com referência a um ou mais dos desenhos em combinação com a descrição detalhada de realizações específicas aqui apresentadas. FIG. 1 Representação esquemática da estrutura monomérica de Cry3Bb. FIG. 2 Visão estereoscópica da estrutura monomérica de Cry3Bb com moléculas de água associadas (representadas por pontos). FIG. 3A. Representação esquemática do domínio de

Cry3Bb. FIG. 3B. Diagrama das posições das 7 hélices que compreendem o domínio 1. FIG.4. 0 domínio 1 de Cry3Bb está organizado em sete hélices α ilustradas na FIG. 3A (representação 80 ΡΕ1040192 esquemática) e FIG. 3B (diagrama esquemático) . Estão apresentadas as hélices a e os resíduos de aminoácidos. FIG. 5A. Representação esquemática do domínio 2 de Cry3Bb.

Fig. 5B. Diagrama das posições das 11 cadeias β que compõem as 3 folhas β do domínio 2. FIG. 6. O domínio 2 de Cry3Bb é uma colecção de três folhas β anti-paralelas ilustradas na FIG. 5. Os aminoácidos que definem estas folhas estão apresentados abaixo (a8, aminoácidos 322-328, também está incluído no domínio 2); FIG. 7A. Representação esquemática do domínio 3 de Cry3Bb. FIG. 7B. Diagrama das posições das cadeias β que compreendem o domínio 3. FIG. 8. O domínio 3 (FIG. 7) é uma colecção pouco estruturada de cadeias β e ansas; não estão presentes folhas β. As cadeias β possuem os aminoácidos limitados abaixo: FIG. 9A. Uma visão "lateral" da estrutura dimé-rica de Cry3Bb. Os feixes helicoidais do domínio 1 podem ser observados no meio da molécula. 81 ΡΕ1040192 FIG. 9B. Uma visão "de topo" da estrutura dimé-rica de Cry3Bb. Os feixes helicoidais do domínio 1 podem ser observados no meio da molécula. FIG. 10. Uma representação gráfica do crescimento na condutância com tempo de canais formados por Cry3A e Cry3Bb em bicamadas lipídicas planares. Cry3A forma canais com condutâncias mais elevadas muito mais rapidamente do que Cry3Bb. FIG. 11. Um mapa de pEG1701 que contem o gene cry3Bb com o terminador crylF. FIG. 12. Os resultados dos ensaios de 1 dose, em duplicado, contra larvas SCRW das proteínas Cry3Bb alteradas na região 1B2,3. FIG. 13. Os resultados dos ensaios de 1 dose, em duplicado, das proteínas Cry3Bb alteradas na região 1B6,7 contra larvas SCRW. FIG. 14. Os resultados dos ensaios de 1 dose, em duplicado, das proteínas Cry3Bb alteradas na região 1B10.11 contra larvas SCRW. FIG. 15. Registos de canais isolados dos canais formados por Cry3Bb.11230 e Cry3Bb WT em bicamadas lipídicas planares. Cry3Bb.11230 forma canais com estados 82 ΡΕ1040192 abertos e fechados bem resolvidos enquanto Cry3Bb raramente o faz. FIG. 16. Registos de canais isolados dos canais formados por Cry3Bb e Cry3Bb.60, uma forma truncada de Cry3Bb. Cry3Bb.60 forma canais mais rapidamente do que Cry3Bb e, ao contrário de Cry3Bb, produz canais com estados abertos e fechados bem resolvidos. FIG. 17A. Alinhamento das sequências de amino-ácidos de cry3A, Cry3B e Cry3C. FIG. 17B. Mostra-se a continuação do alinhamento da sequência de aminoácidos de Cry3A, Cry3B e Cry3C apresentado na FIG. 17A. FIG. 17C. Mostra-se a continuação do alinhamento da sequência de aminoácidos de Cry3A, Cry3B e Cry3C apresentado na FIG. 17A. 4.0 Descrição das Realizações Ilustrativas 0 invento define novas proteínas insecticidas δ-endotoxinas de B. thuringiensis (Bt) e as estratégias bioquímicas e biofísicas usadas para projectar as novas proteínas. As delta-endotoxinas são uma classe de proteínas insecticidas produzidas por B. thuringiensis que formam canais catiónicos selectivos em bicamadas lipídicas planares (English and Slatin, 1992). As novas δ-endotoxinas são 83 ΡΕ1040192 baseadas na estrutura parental da δ-endotoxina Cry3Bb acti-va em coleópteros. Tal como outros membros da classe de δ-endotoxinas activa em coleópteros, incluindo Cry3A e Cry3B, Cry3Bb apresenta excelente actividade insecticida contra o escaravelho da batata do Colorado (Leptinotarsa decemli-neata). No entanto, ao contrário de Cry3A e Cry3B, Cry3Bb é igualmente activo contra a rosca das raízes do milho do Sul ou SCRW (Diabrotica undecimpunctata howardi Barber) e a rosca das raízes do milho Ocidental ou WCRW (Diabrotica virgifera virgifera LeConte). As novas proteínas insecti-cidas aqui descritas foram especificamente projectadas para melhorar a actividade biológica da proteína parental Cry3Bb. Ainda, as próprias estratégias de projecção são novos inventos capazes de serem aplicados no melhoramento de δ-endotoxinas de B. thuringiensis em geral. As δ-endo-toxinas de B. thuringiensis são igualmente membros de uma classe mais larga de toxinas bacterianas que formam canais iónicos (ver English and Slatin 1992, para uma revisão). Os inventores, pensam, assim, que estas estratégias de projecção podem ser igualmente aplicadas a qualquer proteína formadora de canais biologicamente activa para melhorar as suas propriedades biológicas.

As proteínas Cry3Bb projectadas foram manipuladas usando uma ou mais das seguintes estratégias incluindo (1) identificação e alteração de locais sensíveis a proteases e processamento proteolítico; (2) análise e manipulação de água ligada; (3) manipulação de ligações de hidrogénio à volta de regiões móveis; (4) análise da ansa e projecção de 84 ΡΕ1040192 nova ansa à volta das hélices flexíveis; (5) projecção de ansas à volta de cadeias β e folhas β; (6) identificação e nova projecção de superfícies electrostáticas complexas; (7) identificação e remoção de locais de ligação a metais; (8) alteração da estrutura quaternária; (9) identificação e projecção de resíduos estruturais; e (10) combinações de quaisquer dos locais definidos pelas estratégias 1-9. Estas estratégias de projecção permitem a identificação e nova projecção de locais específicos em Cry3Bb, criando em última análise novas proteínas com actividades insecticidas melhoradas. Estas novas proteínas são designadas Cry3Bb e referidas como Cry3Bb seguido de um ponto final e um sufixo (e.g., Cry3Bb.60, Cry3Bb.11231). As novas proteínas estão apresentadas na Tabela 2 juntamente com os locais específicos na molécula que foram modificados, as alterações dos aminoácidos nesses locais que melhoram a actividade biológica, as actividades insecticidas melhoradas e o método de projecção usado para identificar aquele local específico. 4.1 Algumas Vantagens do Invento

Os estudos de mutagénese com os genes cry falharam a identificação de um número significativo de proteínas do cristal mutantes possuidoras de actividade insecticida de largo espectro melhorada, ou seja com melhor toxicidade para uma gama de espécies de insectos que são pragas. Uma vez que as culturas agrícolas são tipicamente ameaçadas por pragas de insectos de mais de uma espécie, são desejáveis proteínas do cristal mutantes que apresentem melhor toxici- 85 ΡΕ1040192 dade contra múltiplas pragas de insectos de múltiplas espécies. Insucessos anteriores na identificação de tais mutantes podem ser atribuídos à escolha dos locais alvo de mutagénese. Por exemplo, relativamente à proteína relacionada, CrylC, os locais dentro dos domínios 2 e 3 têm sido os principais alvos dos esforços de mutagénese, principalmente devido a se pensar que estes domínios como importantes para a ligação a receptores e na determinação da especificidade insecticida (Aronson et al., 1995; Chen et al., 1993; de Maagd et al., 1996; Lee et al., 1992; Lee et al., 1995; Lu et al., 1994; Smedley and Ellar, 1996; Smith and Ellar, 1994; Rajamohan et al., 1995; Rajamohan et al., 1996) .

Pelo contrário, os presentes inventores pensaram que a toxicidade das proteínas Cry3 e, especificamente, a toxicidade da proteína Cry3Bb, pode ser melhorada contra uma gama mais larga de pragas de insectos ao serem atingidas regiões envolvidas na função de canal, em lugar das regiões da molécula directamente envolvidas nas interacções com receptores, nomeadamente os domínios 2 e 3. Assim, os inventores optaram por ter como alvo de mutagénese regiões dentro do domínio 1 de Cry3Bb com o objectivo de isolar mutantes Cry3Bb com um espectro mais alargado de toxicidade. De facto, no presente invento são descritos mutantes Cry3Bb que apresentam melhor toxicidade contra várias pragas de coleópteros.

Pelo menos uma, e provavelmente mais de uma, 86 ΡΕ1040192 hélice α do domínio 1 está envolvida na formação de canais iónicos e poros dentro do epitélio do tubo digestivo do insecto (Gazit and Shai, 1993; Gazit and Shai, 1995). Em lugar de ter como alvo de mutagénese as sequências codificadoras de hélices α do domínio 1 como outros o fizeram (Wu and Aronson, 1992; Aronson et al. , 1995; Chen et al., 1995), os presentes inventores optaram por atingir exclusivamente sequências codificadoras dos resíduos de amino-ácidos adjacentes ou situados dentro das regiões de ansa previstas de Cry3Bb que separam as hélices a. Os resíduos de aminoácidos dentro destas regiões de ansa ou os resíduos de aminoácido que tapam o extremo de uma hélice α e adjacentes a estas regiões de ansa podem afectar as relações espaciais entre estas hélices a. Consequentemente, a substituição destes resíduos de aminoácidos podem resultar em alterações discretas na estrutura terciária ou mesmo na estrutura quaternária, que têm um impacto positivo na função do canal iónico. Os resíduos de aminoácidos nas regiões em ansa do domínio 1 estão expostas ao solvente e assim estão disponíveis para várias interacções moleculares. A alteração destes aminoácidos poderá resultar numa maior estabilidade da proteína através da eliminação ou oclusão dos locais sensíveis a proteases. As substituições de aminoácidos que alteram a carga da superfície do domínio 1 poderão alterar a eficiência do canal iónico ou alterar interacções com a membrana de bordadura em escova ou com outras porções da molécula de toxina, permitindo uma ligação ou inserção mais eficaz. 87 ΡΕ1040192

De acordo com este invento, as substituições de bases são feitas nos resíduos de ácido nucleico cry3Bb subjacentes de forma a alterar codões particulares dos polipeptídeos correspondentes e, particularmente, nas regiões de ansa entre as hélices α. A actividade insecticida de uma proteína do cristal determina por último o nível de proteína do cristal necessária para o controlo eficaz de insectos. A potência de uma proteína insecticida deverá ser maximizada o mais possível de forma a proporcionar uma utilização económica e eficiente no campo. A potência melhorada de uma proteína insecticida numa formulação de bioinsecticida espera-se que melhor o desempenho no campo do produto bioinsecticida. Como alternativa, um aumento da potência de uma proteína insecticida numa formulação bioinsecticida pode promover o uso de quantidades reduzidas de bioinsecticida por unidade de área de cultura tratada, permitindo assim uma utilização mais eficaz em termos de custos do produto bioinsecticida. Quando expresso in planta, espera-se que a produção de proteínas cristais com melhor actividade insecticida melhor a resistência a pragas de insectos susceptíveis. 4.2 Métodos de Cultura de B. thuringiensis para Produzir Proteínas do Cristal

As estirpes de B. thuringiensis aqui descritas podem ser cultivadas usando meios e técnicas de fermentação conhecidos. Quando completado o ciclo de fermentação, as bactérias podem ser colhidas separando primeiro os esporos ΡΕ1040192 de B. thuringiensis e cristais do caldo de fermentação por meios conhecidos. Os esporos de B. thuringiensis e cristais podem ser formulados num pó molhável, num concentrado liquido, grânulos ou outras formulações através da adição de tensioactivos, dispersantes, veiculos inertes e outros componentes para facilitar a manipulação e aplicação em pragas alvo particulares. Os processos de manipulação e aplicação são bem conhecidos na técnica. 4.3 Células Hospedeiras Recombinantes Para a Expressão de Genes cry*

As sequências nucleotidicas do presente invento podem ser introduzidas numa larga variedade de hospedeiros microbianos. A expressão de genes das toxinas resulta, directamente ou indirectamente, na produção intracelular e manutenção do pesticida. Com hospedeiros adequados, e.g., Pseudomonas, os microrganismos podem ser aplicados nos locais de insectos coleópteros, onde proliferarão e serão ingeridos pelos insectos. 0 resultado é um controlo dos insectos indesejáveis. Como alternativa, o microrganismo possuidor do gene da toxina pode ser tratado em condições que prolonguem a actividade da toxina produzida na célula. A célula tratada pode então ser aplicada no ambiente das pragas alvo. 0 produto resultante retém a toxicidade da toxina de B. thuringiensis. Células hospedeiras adequadas, em que as células contendo pesticida serão tratadas para prolongar a actividade da toxina na célula quando a célula tratada é apli- 89 ΡΕ1040192 cada no ambiente das pragas alvo, podem incluir procariotas ou eucariotas, normalmente estando limitado às células que não produzem substâncias tóxicas para organismos superiores, tais como mamíferos. No entanto, poderão ser usados organismos que produzem substâncias tóxicas para organismos superiores, em que a toxina é instável ou o nível de aplicação suficientemente baixo para evitar qualquer possibilidade de toxicidade para um hospedeiro mamífero. Como hospedeiros, serão de particular interesse os procariotas e os eucariotas inferiores, tais como fungos. Procariotas ilustrativos, tanto Gram-negativos como Gram-positivos, incluem Enterobacteriaceae, tais como Escherichia, Erwinia, Shigella, Salmonella e Proteus; Bacillaceae; Rhizobiceae, tais como Rhizobium; Spirillaceae, tais como fitobactérias, Zymomonas, Serratia, Aeromonas, Vibrio, Desulfovibrio, Spirillum; Lactobacillaceae; Pseudomonadaceae, tais como Pseudomonas e Acetobacter; Azotobacteraceae, Actinomyceta-les e Nitrobacteraceae. Entre os eucariotas estão fungos, tais como Phycomycetes e Ascomycetes, o que inclui leveduras, tais como Saccharomyces e Schizosaccharomyces; e leveduras Basidiomycetes, tais como Rhodotorula, Aureobasi-dium, Sporobolomyces e similares.

Características de particular interesse na selec-ção de uma célula hospedeira para fins de produção incluem facilidade de introdução do gene de B. thuringiensis no hospedeiro, disponibilidade de sistemas de expressão, eficiência de expressão, estabilidade do pesticida no hospedeiro e a presença de capacidades genéticas auxiliado- 90 ΡΕ1040192 ras. Características com interesse para usar como micro-cápsula de pesticida incluem qualidades protectoras para o pesticida, tais como paredes celulares espessas, pigmentação e armazenamento intracelular ou formação de corpos de inclusão; afinidade foliar; ausência de toxicidade para mamíferos; atracção por pragas para ingestão; facilidade de morte e fixação sem destruição da toxina; e similares. Outras considerações incluem facilidade de formulação e manipulação, economia, estabilidade de armazenamento e similares.

Organismos hospedeiros de particular interesse, tais como Rhodotorula sp., Aureobasidium sp., Saccharomyces sp., e Sporobolomyces sp.; organismos filoplanos tais como Pseudomonas sp., Erwinia sp. e Flavobacterium sp.; ou organismos tais como Escherichia, Lactobacilli sp., Bacillus sp., Streptomyces sp., e similares. Organismos específicos incluem Pseudomonas aeruginosa, Pseudomonas fluorescens, Saccharomyces cerevisiae, B. thuringiensis, Escherichia coli, B. subtilis, B. megaterium, B. cereus, Streptomyces lividans e similares. O tratamento da célula microbiana, e.g., um microrganismo contendo o gene da toxina de B. thuringiensis, pode ser por meios químicos e físicos, ou através de uma combinação de meios químicos e/ou físicos, desde que a técnica não afecte de forma prejudicial as propriedades da toxina, nem diminua a capacidade celular na protecção da toxina. São exemplos de reagentes químicos os agentes de 91 ΡΕ1040192 halogenação, particularmente halogéneos de n° atómico 17-80. Mais particularmente, o iodo pode ser usado em condições suaves e durante tempo suficiente para se atingir os resultados pretendidos. Outras técnicas adequadas incluem tratamento com aldeídos, como seja formaldeído e glutaral-deído; anti-infecciosos, tais como cloreto de zefirano e cloreto de cetilpiridino; álcoois, tais como isopropílico e etanol; vários fixadores histológicos, tais como iodo de Lugol, fixador de Bouin e fixador de Helly, (ver e.g., Humason, 1967) ; ou uma combinação de agentes físicos (calor) e químicos que preservam e prolongam a actividade da toxina produzida na célula quando a célula é administrada ao animal hospedeiro. São exemplos de meios físicos radiação de comprimento de onda curto como seja radiação γ e radiação X, congelação, radiação UV, liofilização e similares. As células empregues geralmente estarão intactas e essencialmente na forma proliferativa quando tratadas, em lugar da forma de esporo, se bem que nalguns casos possam ser empregues esporos.

Sempre que o gene da toxina de B. thuringiensis seja introduzido através de um vector adequado num microrganismo hospedeiro e o referido hospedeiro seja aplicado no ambiente num estado vivo, é essencial que sejam usados determinados microrganismos hospedeiros. São seleccionados microrganismos hospedeiros que ocupam a "fitosfera" (filo-plano, filosfera, rizosfera e/ou rizoplano) de uma ou mais culturas com interesse. Estes microrganismos são assim seleccionados de forma a serem capazes de competir com 92 ΡΕ1040192 êxito no ambiente particular (cultura e outros habitats de insectos) com os microrganismos selvagens, proporcionar manutenção estável e expressão do gene que expressa o poli-peptídeo pesticida e, de preferência, proporcionar protec-ção melhorada do pesticida relativamente à degradação ambiental e inactivação.

Conhece-se um grande número de microrganismos que habitam o filoplano (a superfície das folhas das plantas) e/ou rizosfera (o solo que envolve as raízes da planta) de uma larga variedade de culturas importantes. Estes microrganismos incluem bactérias, algas e fungos. São de particular interesse os microrganismos, tais como bactérias, e.g., género Bacillus (incluindo as espécies e subespécies de B. thuringiensis kurstaki HD-1, B. thuringiensis kurstaki HD-73, B. thuringiensis sotto, B. thuringiensis berliner, B. thuringiensis thuringiensis, B. thuringiensis tolworthi, B. thuringiensis dendrolimus, B. thuringiensis alesti, B. thuringiensis galleriae, B. thuringiensis aiza-wai, B. thuringiensis subtoxicus, B. thuringiensis entomo-cidus, B. thuringiensis tenebrionis e B. thuringiensis san diego) ; Pseudomonas, Erwinia, Serratia, Klebsiella, Zantho-monas, Streptomyces, Rhizobium, Rhodopseudomonas, Methyli-philius, Agrobacterium, Acetobacter, Lactobacillus, Arthro-bacter, Azotobacter, Leuconostoc e Alcaligenes; fungos, particularmente leveduras, e.g., géneros Saccharomyces, Cryptococcus, Kluyveromyces, Sporobolomyces, Hodotorula e Aureobasidium. São de particular interesse as espécies bacterianas da fitosfera tais como Pseudomonas syringae, 93 ΡΕ1040192

Pseudomonas fluorescens, Serratia marcescens, Acetobacter xylinum, Agrobacterium tumefaciens, Rhodobacter sphaeroi-des, Xanthomonas campestris, Rhizobium melioti, Alcaligenes eutrophus e Azotobacter vinlandii; e espécies de leveduras da fitosfera tais como Rhodotorula rubra, R. Glutinis, R. marina, R. aurantiaca, Cryptococcus albidus, C. diffluens, C. laurentii, Saccharomyces rosei, S. pretoriensis, S. cerevisiae, Sporobolomyces roseus, S. odorus, Kluyveromyces veronae e Aureobasidium pollulans. 4.4 Definições

De acordo com o presente invento, sequências de ácido nucleico incluem e não estão limitadas a DNA (incluindo e não limitado a DNA genómico ou extragenómico), genes, RNA (incluindo e não limitado a mRNA e tRNA), nucle-ósidos, e segmentos de ácido nucleico adequados obtidos a partir de fontes nativas, obtidos por síntese química, modificados quimicamente ou de outra forma preparados pela mão do homem. As palavras e as frases que se seguem têm o significado descrito abaixo.

Um, uma, uns, umas: De acordo com a convenção das leis vigentes sobre patentes, as palavras "um, uma, uns, umas" quando usadas neste pedido de patente, incluindo as reivindicações, significam "um ou mais".

Largo espectro: Refere-se a uma larga gama de espécies de insectos. ΡΕ1040192

Actividade de largo espectro: A toxicidade contra uma larga gama de espécies de insectos.

Expressão: A combinação de processos intracelulares, incluindo transcrição e tradução sofrida por uma molécula de DNA codificadora como seja um gene estrutural para produzir um polipeptideo.

Actividade insecticida: A toxicidade contra insectos.

Especificidade insecticida: A toxicidade apresentada por uma ou mais proteínas do cristal, microrganismo ou planta, contra múltiplas espécies de insectos.

Especificidade intra-ordem: A toxicidade de uma proteína do cristal particular contra uma espécie de insecto dentro de uma Ordem de insectos (e.g., Ordem Coleoptera).

Especificade inter-ordem: A toxicidade de uma proteína do cristal particular contra espécies de insectos de diferentes Ordens (e.g., Ordens Coleoptera e Diptera). LC50: A concentração letal de proteína do cristal que causa 50% de mortalidade dos insectos tratados. LC95: A concentração letal de proteína do cristal que causa 95% de mortalidade dos insectos tratados. 95 ΡΕ1040192

Promotor: Um local de reconhecimento numa sequência de DNA ou grupo de sequências de DNA que proporciona um elemento de controlo da expressão para um gene estrutural e a que a RNA polimerase se liga especificamente e inicia a síntese de RNA (transcrição) daquele gene.

Regeneração: 0 processo de crescimento de uma planta a partir de uma célula vegetal (e.g., protoplasto vegetal ou explante).

Gene estrutural: Uum gene que é expresso para produzir um polipeptídeo.

Transformação: Um processo de introdução de uma sequência de DNA exógena (e.g., um vector, uma molécula de DNA recombinante) numa célula ou protoplasto em que aquele DNA exógeno é incorporado num cromossoma ou é capaz de replicação autónoma. Célula transformada: Uma célula cujo DNA foi alterado através da introdução de uma molécula de DNA exógeno naquela célula. Célula transgénica: Qualquer célula derivada ou regenerada a partir de uma célula transformada ou derivada de uma célula transgénica. Exemplos de células transgénicas incluem calos de plantas derivados de uma célula vegetal transformada e células particulares tais como folha, raiz, 96 ΡΕ1040192 caule, e.g., células somáticas, ou células reprodutoras (germinais) obtidas a partir de uma planta transgénica.

Planta transgénica: Uma planta ou sua progénie derivada de uma célula vegetal ou protoplasto transformado, em que o DNA vegetal contem uma molécula de DNA exógena não presente originalmente numa planta nativa não transgénica da mesma estirpe. Os termos "planta transgénica" e "planta transformada" têm por vezes sido usados como termos sinónimos para definir uma planta cujo DNA contem uma molécula de DNA exógeno. No entanto, é cientificamente mais correcto referir-se a uma planta ou calo regenerado, obtido a partir de uma célula ou protoplasto vegetal transformado, como sendo uma planta transgénica e essa utilização será aqui seguida.

Vector: uma molécula de DNA capaz de se replicar numa célula hospedeira e/ou a que foi operacionalmente ligada um outro segmento de DNA de forma a fazer-se a replicação do segmento ligado. Um plasmideo é um exemplo de vector.

Tal como aqui são usadas, as designações "CrylII" e Cry3" são sinónimas, tal como o são as designações "CryIIIB2" e Cry3Bb". Igualmente, os inventores utilizaram o termo genérico Cry3Bb* para significar qualquer uma das variantes de Cry3Bb que compreendem as sequências de aminoácidos modificadas na proteína. De forma semelhante, cry3Bb* pretende significar quaisquer segmentos e/ou genes que codificam uma proteína Cry3Bb*, etc. 97 ΡΕ1040192 4.5 Preparação de Polinucleotídeos cry3*

Uma vez analisada a estrutura do peptídeo pretendido a ser mutagenizado usando uma ou mais das estratégias de projecção aqui descritas, será desejável introduzir uma ou mais mutações na proteína ou, em alternativa, na sequência de DNA codificadora da proteína com o objectivo de produzir uma proteína alterada com propriedades bioinsecticidas alteradas.

Com este objectivo, o presente invento inclui métodos de mutagénese dirigida e mutagénese ao acaso de um segmento de ácido nucleico codificador de uma proteína do cristal como aqui descrito. Em particular, são descritos métodos para a mutagénese de segmentos de ácido nucleico codificadores das sequências de aminoácidos usando uma ou mais estratégias de projecção aqui descritas. Usando os métodos de ensaio aqui descritos, pode-se identificar mutantes conseguidos com estes processos que tenham melhorado as propriedades insecticidas ou alterado a especificidade, intra-ordem e inter-ordem.

Os métodos de mutagenização de um segmento de DNA codificador de uma proteína do cristal são bem conhecidos dos familiarizados com a matéria. Podem ser feitas modificações ao acaso ou através de procedimentos de mutagénese dirigida. 0 ácido nucleico pode ser modificado através da alteração da sua estrutura pela adição ou deleção de um ou mais nucleótidos da sequência. 98 ΡΕ1040192 A mutagénese pode ser realizada de acordo com qualquer uma das técnicas conhecidas na especialidade como seja, mas não lhe estando limitado, a síntese de um oligonucleótido tendo uma ou mais mutações na sequência de uma proteína do cristal particular. Um "hospedeiro adequado" é qualquer hospedeiro que expresse Cry3Bb, como seja, mas não estando limitado a B. thuringiensis e E. coli. 0 rastreio da actividade insecticida, no caso de Cry3Bb inclui e não está limitado a actividade tóxica para coleópteros que pode ser testada por técnicas conhecidas na especialidade.

Em particular, a mutagénese específica é uma técnica útil na preparação de peptídeos individuais ou proteínas ou peptídeos equivalentes biologicamente funcionais, através de mutagénese específica do DNA subjacente. A técnica ainda proporciona uma capacidade rápida de preparar e testar variantes de sequência, por exemplo, incorporando uma ou mais das considerações discutidas, através da introdução de uma ou mais alterações na sequência nucleotídica do DNA. A mutagénese específica permite a produção de mutantes através da utilização de sequências oligonucleotídicas específicas que codificam a sequência de DNA da mutação pretendida, assim como um número suficiente de nucleótidos adjacentes, para proporcionar uma sequência iniciadora com tamanho e complexidade suficientes para formar um duplex estável de ambos os lados da junção da deleção atravessada. Tipicamente, prefere-se uma sequência 99 ΡΕ1040192 iniciadora de 17 a 75 nucleótidos ou mais de comprimento, com 10 a 25 ou mais resíduos de ambos os lados da junção da sequência a ser alterada.

Em geral, a técnica de mutagénese dirigida é bem conhecida na especialidade, conforme exemplificado por várias publicações. Conforme será apreciado, a técnica tipicamente emprega um vector fágico que existe na forma de cadeia simples e de cadeia dupla. Tipicamente os vectores úteis na mutagénese dirigida incluem vectores tais como o fago M13. Estes fagos podem ser facilmente comprados e o seu uso é, de um modo geral, bem conhecido dos familiarizados com a técnica. Os plasmídeos de cadeia dupla são também empregues de rotina em mutagénese dirigida, o que elimina o passo de transferência do gene com interesse de um plasmídeo para um fago.

Em geral, a mutagénese dirigida de acordo com o que aqui é descrito é realizada obtendo primeiro um vector de cadeia simples ou separando as duas cadeias de um vector de cadeia dupla que inclui na sua sequência uma sequência de DNA que codifica o peptídeo pretendido. Geralmente, prepara-se por síntese química uma sequência iniciadora oligonucleotídica portadora da sequência alterada pretendida. Esta sequência iniciadora é então emparelhada com o vector de cadeia simples e sujeita à acção de enzimas de polimerização de DNA, tais como fragmento Klenow da polimerase I de E. coli, de forma a completar a síntese da cadeia portadora da mutação. Assim, forma-se um 100 ΡΕ1040192 heteroduplex em que uma cadeia codifica a sequência não alterada original e a segunda cadeia é portadora da mutação pretendida. Este vector heteroduplex é então usado para transformar ou transfectar células adequadas, tais como células de E. coli, e seleccionados clones que incluem vectores recombinantes portadores do arranjo da sequência mutada. Um esquema de selecção genética foi descrito por Kinkel et al. , (1987) para enriquecimento em clones contendo o oligonucleótido mutagénico. Como alternativa, a utilização de PCR™ com enzimas termostáveis comerciais tais como polimerase Taq pode ser contemplada para incorporar uma sequência oligonucleotidica mutagénica num fragmento de DNA amplificado, o qual pode então ser clonado num vector de clonagem ou expressão adequado. Os processos de mutagénese mediada por PCR™ de Tomic et al., (1990) e Upender et al. (1995) proporcionam dois exemplos de tais protocolos. Um PCR™ empregando uma ligase termostável para além de uma polimerase termostável pode também ser empregue para incorporar um oligonucleótido mutagénico fosforilado num fragmento de DNA amplificado, o qual pode então ser clonado num vector de clonagem ou expressão adequado. O processo de mutagénese descrito por Michael (1994) proporciona um exemplo de tal protocolo. A preparação de variantes da sequência dos segmentos de DNA codificadores do peptídeo seleccionado usando mutagénese dirigida é proporcionada como um meio de produzir espécies potencialmente úteis e não pretende ser limitante uma vez que existem outras formas através das 101 ΡΕ1040192 quais as variantes da sequência dos peptídeos e das sequências de DNA codificadoras dos mesmos. Por exemplo, os vectores recombinantes codificadores da sequência peptidica pretendida podem ser tratados com agentes mutagénicos, tais como hidroxilamina, para se obter variantes da sequência.

Tal como aqui usado, o termo "processo de muta-génese dirigida com oligonucleótidos" refere-se a processos dependentes de matriz e propagação mediada pelo vector que resulta num aumento na concentração de uma molécula de ácido nucleico especifica relativamente à sua concentração inicial, ou num aumento na concentração de um sinal detectável, como seja amplificação. Tal como aqui é usado, o termo "processo de mutagénese dirigida com oligonu-cleótidos" pretende referir-se a um processo que envolve a extensão de uma molécula iniciadora dependente de matriz. O termo "processo dependente de matriz" refere-se a à síntese de ácido nucleico, de uma molécula de RNA ou DNA, em que a sequência da nova cadeia de ácido nucleico sintetizada é ditada pelas regras conhecidas de emparelhamento de pares de bases (ver, por exemplo, Watson, 1987).

Tipicamente, as metodologias mediadas por vectores envolvem a introdução do fragmento de ácido nucleico num vector de DNA ou RNA, a amplificação clonal do vector e a recuperação do fragmento de ácido nucleico amplificado. Exemplos de tais metodologias são proporcionados na Patente U.S. 4237224. 102 ΡΕ1040192

Uma série de processos dependentes de matriz estão disponíveis para amplificar as sequências alvo com interesse presentes na amostra. Um dos métodos de amplificação melhor conhecidos é a reacção em cadeia da polimerase (PCR™) que está descrito detalhadamente nas Patentes U.S. 4683195, 4683202 e 4800159. Resumidamente, em PCR™, são preparadas duas sequências iniciadoras que são complementares de regiões em cadeias complementares opostas da sequência alvo. Um excesso de trifosfatos de desoxi-nucleótidos é adicionado a uma mistura de reacção juntamente com uma DNA polimerase (e.g., polimerase Taq) . Se a sequência alvo estiver presente numa amostra, as sequências iniciadoras ligar-se-ão ao alvo e a polimerase fará com que as sequências iniciadoras sejam prolongadas ao longo da sequência alvo através da adição de nucleótidos. Através do aumento e abaixamento da temperatura da mistura de reacção, as sequências iniciadoras prolongadas dissociar-se-ão do alvo para formar produtos de reacção, as sequências iniciadoras em excesso ligar-se-ão ao alvo e aos produtos de reacção e o processo é repetido. De preferência, pode ser realizado um processo de amplificação por PCR™ com transcriptase reversa de forma a quantificar a quantidade de mRNA amplificado. As metodologias de reacção em cadeia da polimerase são conhecidas na técnica.

Um outro método de amplificação é a reacção em cadeia com ligase (referido como LCR), descrito no Pedido de Patente Europeia Publ. N° 320308. Em LCR, são preparados dois pares de sondas complementares e, na presença da 103 ΡΕ1040192 sequência alvo, cada par ligar-se-á às cadeias complementares opostas da sequência alvo de forma a que elas sejam contíguas. Na presença de uma ligase, os dois pares de sondas ligar-se-ão para formar uma única unidade. Através da aplicação de ciclos de temperatura, tal como em PCR™, as unidades ligadas associadas dissociam-se do alvo e depois servem como "sequências alvo" para a ligação dos pares de sonda em excesso. A patente U.S. 4883750 descreve um método alternativo de amplificação semelhante a LCR para a ligação de pares de sondas a uma sequência alvo.

Qbeta Replicase™ descrito no Pedido de Patente Internacional Publicação N° PCT/US87/00880 pode também ser usado no presente invento como outro método de amplificação. Neste método, uma sequência replicativa de RNA que possui uma região complementar de um alvo é adicionada a uma amostra na presença de uma RNA polimerase. A polimerase copiará a sequência replicativa que pode então ser detec-tada.

Um método de amplificação isotérmico, em que as endonucleases de restrição e ligases são usadas para se conseguir a amplificação das moléculas alvo possuidoras de 5'-[α-tio]trifosfatos de nucleótidos numa das cadeias de um local de restrição (Walker et al., 1992), pode igualmente ser útil na amplificação de ácidos nucleicos no presente invento.

Amplificação com deslocamento de cadeia ("Strand 104 ΡΕ1040192

Displacement Amplification", SDA) é um outro método de amplificação isotérmica de ácidos nucleicos que envolve múltiplos ciclos de deslocamento de cadeias e síntese, i.e., translação de corte "nick translation"). Um método semelhante, designado Reacção de Reparação de Cadeias ("Repair Chain Reaction", RCR) é um outro método de amplificação que pode ser útil no presente invento e envolve o emparelhamento de várias sondas ao longo de uma região que se pretende amplificar, seguido de uma reacção de reparação em que apenas duas das quatro bases estão presentes. As outras duas bases podem ser adicionadas como derivados biotinilados para detecção fácil. Uma abordagem semelhante é usada em SDA.

As sequências podem também ser detectadas usando uma reacção cíclica de sondas ("Cyclic probe reaction", CPR). Em CPR, uma sonda tendo sequências 3' e 5' de DNA não específicas de Cry e uma sequência interna de um RNA específico de Cry é hibridada com DNA que está presente numa amostra. Quando da hibridação, a reacção é tratada com RNase H e os produtos da sonda identificados como produtos distintos geradores de um sinal que são libertados após digestão. A matriz original é emparelhada com uma outra sonda de ciclização e a reacção repetida. Assim, CPR envolve a amplificação de um sinal gerado por hibridação de uma sonda com um ácido nucleico expresso específico de cry.

Ainda outros métodos de amplificação descritos no Pedido de Patente da Grã-Bretanha N° 2202328 e no Pedido de 105 ΡΕ1040192

Patente Internacional Publicação N° PCT/US89/01025 podem ser usados de acordo com o presente invento. No primeiro pedido de patente, sequências iniciadoras "modificadas" são usadas numa síntese tipo PCR™, dependente de matriz e de enzimas. As sequências iniciadoras podem ser modificadas através da marcação com um grupo de captura (e.g., biotina) e/ou um grupo detector (e.g., enzima). No último pedido, é adicionado um excesso de sondas marcadas a uma amostra. Na presença da sequência alvo, a sonda liga-se e é clivada cataliticamente. Após clivagem, a sequência alvo é libertada intacta para ser ligada pela sonda em excesso. A clivagem da sonda marcada sinaliza a presença da sequência alvo.

Outros processos de amplificação de ácido nu-cleico incluem sistemas de amplificação baseados em transcrição (TAS) (Kwoh et al., 1989; Pedido de Patente Internacional Publicação N° WO 88/10315) incluindo amplificação baseada na sequência de ácidos nucleicos (NASBA) e 3SR. Em NASBA, os ácidos nucleicos podem ser preparados para amplificação através de extracção convencional com fenol/cloro-fórmio, desnaturação pelo calor de uma amostra, tratamento com tampão de lise e minicolunas de centrifugação para o isolamento de DNA e RNA ou extracção de RNA com cloreto de guanidina. Estas técnicas de amplificação envolvem empare-lhamento de uma sequência iniciadora, o qual possui sequências específicas das proteínas do cristal. Após polime-rização, os híbridos de DNA/RNA foram digeridos com RNase H, enquanto que as moléculas de DNA foram novamente 106 ΡΕ1040192 desnaturadas pelo calor. Em qualquer dos casos, o DNA de cadeia simples é convertido em cadeia dupla pela adição de uma segunda sequência iniciadora especifica das proteínas do cristal, seguido de polimerização. As moléculas de DNA de cadeia dupla são então repetidamente transcritas por uma polimerase, como seja a de T7 ou de SP6. Numa reacção isotérmica cíclica, os RNAs foram sujeitos a transcrição reversa num DNA de cadeia dupla e transcritos novamente com uma polimerase, como seja a de T7 ou SP6. Os produtos resultantes, truncados ou completos, indicam sequências específicas de proteínas do cristal. O Pedido de Patente Europeia Publicação No 329822 descreve um processo de amplificação de ácido nucleico envolvendo a síntese cíclica de RNA de cadeia simples ("ssRNA"), ssDNA e DNA de cadeia dupla (dsDNA), que podem ser usados de acordo com o presente invento. O ssRNA constitui uma primeira matriz para um primeiro oligonucleótido iniciador, o qual é prolongado pela transcriptase reversa (DNA polimerase dependente de RNA). O RNA é então removido do duplex de DNA:RNA resultante pela acção da ribonuclease H (RNase H, uma RNase específica de RNA num duplex com DNA ou RNA) . O ssDNA resultante é uma segunda matriz para uma segunda sequência iniciadora, a qual também inclui as sequências de um promotor de RNA polimerase (exemplificado pela RNA polimerase de T7) 5' relativamente à sequência de homologia com a matriz. Esta sequência iniciadora é então prolongada pela DNA polimerase (exemplificada pelo fragmento grande "Klenow" da DNA polimerase I de E. coli), 107 ΡΕ1040192 resultando numa molécula de DNA de cadeia dupla ("dsDNA"), tendo uma sequência idêntica à do RNA original entre as sequências iniciadoras e tendo ainda, num extremo, uma sequência de promotor. Esta sequência de promotor pode ser usada pela RNA polimerase adequada para produzir muitas cópias de RNA do DNA. Estas cópias podem então entrar novamente no ciclo que conduz a amplificação muito rápida. Com a escolha adequada das enzimas, esta amplificação pode ser feita isotermicamente sem a adição de enzimas em cada ciclo. Devido à natureza cíclica deste processo, a sequência de partida pode ser escolhida para ser na forma de DNA ou RNA. 0 Pedido de Patente Internacional Publicação N° WO 89/06700, aqui incluído como referência na sua totalidade, descreve o esquema de amplificação de sequências de ácido nucleico baseado na hibridação de uma sequência de promotor/sequência iniciadora com um DNA alvo de cadeia simples ("ssDNA") seguido da transcrição de muitas cópias de RNA da sequência. Este esquema não é cíclico; i.e., novas matrizes não são produzidas a partir dos transcritos de RNA resultantes. Outros métodos de amplificação incluem "RACE" (Frohman, 1990) e "PCR™ unilateral" (Ohara, 1989) que são conhecidos dos familiarizados com a técnica. Métodos baseados na ligação de dois (ou mais) oligonucleótidos na presença de ácido nucleico tendo a sequência do "di-oligonucleótido" resultante, amplificando assim o di-oligonucleótido (Wu and Dean, 1996, aqui 108 ΡΕ1040192 incluído como referência na sua totalidade) , podem também ser usados na amplificação de sequências de DNA do presente invento. 4.6 Variantes Resistentes a Fagos

Em determinadas realizações, pode-se pretender preparar uma ou mais variantes dos mutantes de B. thuringiensis resistentes a fagos preparados pelos métodos aqui descritos. Para tal, uma alíquota de uma lisado fágico é espalhado em agar nutritivo e deixado secar. Uma alíquota da estirpe bacteriana sensível a fagos é então semeada directamente sobre o lisado seco e deixada a secar. As placas são incubadas a 30°C. As placas são incubadas durante 2 dias e, nessa altura, numerosas colónias podem ser cultivadas em agar. Algumas destas colónias são picadas e subcultivadas em placas de agar nutritivo. Estas culturas aparentemente resistentes são testadas relativamente à resistência por riscado cruzado com o lisado de fagos. Uma linha do lisado de fagos foi riscada na placa e deixada a secar. As culturas pressupostamente resistentes foram então riscadas ao longo da linha de fagos. As culturas bacte-rianas resistentes não mostram qualquer lise ao longo da linha de fagos após incubação durante a noite a 30°C. A resistência aos fagos foi então confirmada semeando uma camada da cultura resistente numa placa de agar nutritivo. A estirpe sensível foi também semeada da mesma forma para servir como controlo positivo. Após secagem, semeou-se uma gota do lisado fágico no centro da placa e deixou-se secar. 109 ΡΕ1040192

As culturas resistentes não apresentaram lise na área onde o lisado fágico foi colocado após incubação a 30°C durante 24 horas. 4.7 Composições de Proteínas do Cristal como Insecticidas e Métodos de Utilização A Ordem Coleoptera compreende numerosas espécies de escaravelhos incluindo escaravelhos do solo, escaravelhos reticulados, escaravelhos das espécies Anthrenus werbasci e Dermestes lardarius, escaravelhos da espécie Anoplophora glabripennis, escaravelhos das folhas, gorgulhos, joaninhas, escaravelhos da família Cantharidae, escaravelhos da Lucanidae e escaravelhos hidrofílicos da família Hydrophilidae e uma série de outros escaravelhos. Uma breve taxonomia da Ordem é dada no local da rede http://www.ncbi.nlm.nih.gov/Taxonomy/tax.html. São particularmente importantes entre os Coleó-pteros as pragas agrícolas incluídas nas infra-ordens Chrysomeliformia e Cucujiformia. Os membros da infra-ordem Chrysomeiiformia, incluindo os escaravelhos das folhas (Chrysomelidae) e os gorgulhos (Curculionidae) , são particularmente problemáticos para a agricultura e são responsáveis por uma variedade de danos causados por insectos em culturas agrícolas e plantas. A infra-ordem Cucujiformia inclui as famílias Coccinellidae, Cucujidae, Lagridae, Meloidae, Rhipiphoridae e Tenebrionidae. Dentro desta infra-ordem, os membros da família Chrysomelidae (que 110 ΡΕ1040192 inclui os géneros Exema, Chrysomela, Oreina, Chrysolina, Leptinotarsa, Gonioctena, Oulema, Monozia, Ophraella, Cerotoma, Diabrotica e Lachnaia), são conhecidas pelo seu potencial destruidor de culturas agrícolas.

Demonstrou-se que as toxinas do presente invento são eficazes no combate de uma variedade de membros da ordem Coleoptera, os inventores consideram que os insectos de muitos géneros de coleópteros podem ser controlados ou erradicados usando as composições de polipeptídeos aqui descritas. Igualmente, os métodos aqui descritos para a geração de polipeptídeos modificados tendo uma maior especificidade para insectos podem também ser úteis no alargamento da gama de actividade insecticida dos polipeptídeos modificados contra outras espécies de insectos dentro e fora da ordem Coleoptera.

Como tal, os inventores consideram que as composições de proteínas cristais aqui descritas encontrarão particular utilidade como insecticidas para aplicação tópica e/ou sistémica a culturas agrícolas, incluindo mas não estando limitado a arroz, trigo, alfafa, milho, soja, tabaco, batata, cevada, canola, beterraba sacarina, cana sacarina, linho, centeio, cevada, algodão, girassol; gramíneas, tais como pastagens e turfas; frutos, citrinos, nozes, árvores, arbustos e vegetais; assim como plantas ornamentais, cactos, suculentas e similares. É descrita e reivindicada uma composição compre- 111 ΡΕ1040192

endendo uma quantidade eficaz como insecticida da composição da proteína do cristal Cry3Bb*. A composição, de preferência, compreende a sequência de aminoácidos de SEQ

ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 , SEQ ID NO: 8, SEQ ID O i—1 O 5 SEQ ID NO:12, SEQ ID NO:14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO:20, SEQ ID NO:22, SEQ ID NO:24, SEQ ID NO:26, SEQ ID NO:28, SEQ ID NO:30, SEQ ID NO:32, SEQ ID NO:3 4, SEQ ID NO:36, SEQ ID NO:38, SEQ ID NO:40, SEQ ID NO:42, SEQ ID NO:44, SEQ ID NO:46, SEQ ID NO:48, SEQ ID NO:50, SEQ ID NO:52, SEQ ID NO:54, SEQ ID NO:56, SEQ ID NO:58, SEQ ID NO:60, SEQ ID NO:62, SEQ ID NO:64, SEQ ID NO:6 6, SEQ ID NO:68, SEQ ID NC >:100, SEQ ID NO :102 ou SEQ ID NO:108 ou seus equivalentes biologicamente funcionais.

A composição insecticida pode também compreender uma proteína do cristal Cry3Bb* que é codificada por uma sequência de ácido nucleico tendo a sequência de SEQ ID NO:l, SEQ ID NO: 3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO: 2 7, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID

NO: 3 5, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID

NO: 43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID

NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID

NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID

NO:67, SEQ ID NO:69, SEQ ID NO:99 ou SEQ ID NO:108, ou como alternativa, uma sequência de ácido nucleico que hibrida com a sequência de ácido nucleico de NO:l, SEQ ID NO:3, SEQ ID NO: 5, SEQ ID NO:7, SEQ ID NO:9, SEQ ID NO:ll, SEQ ID ΡΕ1040192 NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:2 9, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:3 7, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:57, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:6 9, SEQ ID NO: 99 ou SEQ ID NO : 10 7 em condições de restringência moderada.

As composições insecticidas podem compreender um ou mais tipos de células de B. thuringiensis, ou uma ou mais culturas de tais células, ou como alternativa, uma mistura de uma ou mais células de B. thuringiensis que expressam uma ou mais das novas proteínas do cristal do invento em combinação com uma outra composição insecticida. Em certos aspectos pode ser desejável preparar composições que possuem uma pluralidade de proteínas do cristal, nativas ou modificadas, para tratamento de um ou mais tipos de insectos susceptíveis. As células de B. thuringiensis do invento podem ser tratadas antes da formulação para prolongar a actividade insecticida quando as células são aplicadas no ambiente dos insectos alvo. Tal tratamento pode ser por meios químicos ou físicos ou uma combinação de meios químicos e/ou físicos, desde que as técnicas não afectem de forma prejudicial as propriedades do insecticida nem diminuam a capacidade celular de protecção do insecticida. São exemplos de reagentes químicos os que geram halogéneos, particularmente halogéneos de n° atómico 113 ΡΕ1040192 17-80. Mais particularmente, o iodo pode ser usado em condições suaves e durante tempo suficiente para se conseguir os resultados pretendidos. Outras técnicas adequadas incluem o tratamento com aldeídos, tais como formaldeido e glutaraldeído, anti-infecciosos, tais como cloreto de zefirano; álcoois, tais como isopropílico e etanol; vários fixadores histológicos, como sejam fixador de Bouin e fixador de Helly (ver Humason, 1967) ; ou uma combinação de agentes físicos (calor) e químicos que prolongam a actividade da δ-endotoxina produzida na célula quando a célula é aplicada ao ambiente das pragas alvo. São exemplos de meios físicos radiação de comprimento de onda curto como seja radiação gama e radiação X, congelação, radiação UV e liofilização.

Os inventores consideram que quaisquer métodos de formulação conhecidos dos familiarizados com a matéria poderão ser empregues usando as proteínas aqui descritas para preparar tais composições bioinsecticidas. Poderá ser desejável formular preparações de células totais, extractos celulares, suspensões celulares, homogenatos celulares, lisados celulares, sobrenadantes celulares, filtrados celulares ou sedimentos de células de uma cultura celular (de preferência uma cultura de células bacterianas como seja uma cultura de células de B. thuringiensis descrita na Tabela 3) que expressa um ou mais segmentos de DNA cry3Bb* para produzir as proteínas ou peptídeos Cry3Bb* codificados. Os métodos para a preparação de tais formulações são conhecidos dos familiarizados com a matéria e podem 114 ΡΕ1040192 incluir, e.g., desidratação, liofilização, homogeneização, extracção, filtração, centrifugação, sedimentação ou concentração de uma ou mais culturas de células bacterianas, tais como células de B. thuringiensis descritas na Tabela 3, que expressam os peptídeos Cry3Bb* com interesse.

Numa realização preferida, a composição bioinsec-ticida compreende uma suspensão fluida de óleo contendo células bacterianas lisadas ou não lisadas, esporos ou cristais que possuem uma ou mais das novas proteínas do cristal aqui descritas. De preferência, as células são células de B. thuringiensis, no entanto, qualquer célula hospedeira bacteriana expressando os novos segmentos de ácido nucleico aqui descritos e produtora de uma proteína do cristal é considerada útil, como seja Bacillus spp., incluindo B. megaterium, B. subtilis, B. cereus, Escherichia spp., incluindo E. coli e/ou Pseudomonas spp., incluindo P. ceppacia, P. aeruginosa e P. fluorescens. Como alternativa, a suspensão fluida de óleo pode consistir numa combinação de uma ou mais das seguintes composições: células bacterianas lisadas ou não lisadas, esporos, cristais e/ou proteínas do cristal purificadas.

Numa segunda realização preferida, a composição bioinsecticida compreende uma granulado ou pó dispersável em água. Este granulado ou pó pode compreender células bacterianas lisadas ou não lisadas, esporos ou cristais que contenham uma ou mais das novas proteínas do cristal aqui descritas. As fontes preferidas para estas composições 115 ΡΕ1040192 incluem células bacterianas tais como células de B. thuringiensis, no entanto as bactérias dos géneros Bacillus, Escherichia e Pseudomonas que foram transformadas com um segmento de DNA aqui descrito e expressando a proteína do cristal são igualmente consideradas como úteis. Como alternativa, o granulado ou pó pode consistir numa combinação de uma ou mais das seguintes composições: células bacterianas lisadas ou não lisadas, esporos, cristais e/ou proteínas do cristal purificadas.

Numa terceira realização importante, a composição bioinsecticida compreende um pó molhável, líquido pulve-rizáve, emulsão, colóide, solução aquosa ou orgânica, poeira, pastilhas ou concentrado coloidal. Tal composição poderá conter células bacterianas não lisadas ou lisadas, esporos cristais ou extractos celulares como descrito atrás, que contêm uma ou mais das novas proteínas do cristal aqui descritas. As células bacterianas preferidas são células de B. thuringiensis, no entanto, bactérias tais como células de B. megaterium, B. subtilis, B. cereus, E. coli ou Pseudomonas spp. transformadas com um segmento de DNA aqui descrito e expressando a proteína do cristal são também consideradas como úteis. Tais formas secas das composições insecticidas podem ser formuladas para dissolver imediatamente quando são molhadas ou, como alternativa, dissolvidas numa forma de libertação controlada, libertação sustida ou outra forma dependente do tempo. Como alternativa, tal composição pode consistir numa combinação de uma ou mais das seguintes composições; células bacte- 116 ΡΕ1040192 rianas lisadas ou não lisadas, esporos, cristais e/ou proteínas do cristal purificadas.

Numa quarta realização importante, a composição insecticida compreende uma solução aquosa ou suspensão ou cultura celular de células bacterianas lisadas ou não lisadas, esporos, cristais ou uma mistura de células bacterianas lisadas ou não lisadas, esporos, e/ou cristais, tais como os descritos atrás que contêm uma ou mais das proteínas do cristal aqui descritas. Tais soluções aquosas ou suspensões podem ser proporcionadas como uma solução stock concentrada que é diluída antes da aplicação, ou como alternativa, como uma solução diluída pronta a aplicar.

Para estes métodos, envolvendo a aplicação de células bacterianas, o hospedeiro celular contendo um ou mais genes de proteínas do cristal pode ser cultivado em qualquer meio nutritivo conveniente, em que a construção de DNA proporciona uma vantagem selectiva na presença de um meio selectivo de forma a que todas, ou substancialmente todas, as células mantenham o gene de B. thuringiensis. Estas células podem ser então colhidas de acordo com formas convencionais. Como alternativa, as células podem ser tratadas antes da colheita.

Quando as composições insecticidas compreendem células de B. thuringiensis, esporos e/ou cristais contendo uma ou mais proteínas do cristal modificadas com interesse, tais composições podem ser formuladas numa variedade de 117 ΡΕ1040192 formas. Elas podem ser empregues como pós molháveis, grânulos ou poeiras, através da mistura com vários materiais inertes, tais como minerais inorgânicos (filo-silicatos, carbonatos, sulfatos, fosfatos e similares) ou materiais botânicos (pó de carolo, farelo de arroz, cascas de avelã e similares). As formulações podem incluir adjuvantes difusores-colantes, agentes estabilizadores, outros aditivos pesticidas ou tensioactivos. As formulações liquidas podem ser de base aquosa ou não aquosa e empregues como espumas, suspensões, concentrados emulsionáveis ou similares. Os ingredientes podem incluir agentes reoló-gicos, tensioactivos, emulsionantes, dispersantes ou polímeros.

Como alternativa, as novas proteínas do cristal derivadas de Cry3Bb mutagenizadas podem ser preparadas in vitro através de sistemas de expressão bacterianos nativos ou recombinantes e isoladas para subsequente aplicação no campo. Tal proteína pode ser na forma de lisados brutos de células, suspensões, colóides, etc., ou, como alternativa, pode ser purificada, refinada, tamponada e/ou ainda processada, antes de ser formulada numa formulação biocida activa. Igualmente, em certas circunstâncias, poderá ser desejável isolar cristais e/ou esporos a partir de culturas bacterianas expressando a proteína do cristal e aplicar soluções, suspensões ou preparações coloidais de tais cristais e/ou esporos como composição bioinsecticida activa. 118 ΡΕ1040192

Um outro aspecto importante do invento é um método de controlo de insectos coleópteros que sejam susceptiveis às novas composições aqui descritas. Tal método, de um modo geral, compreende o contacto do insecto ou população de insectos, colónia, etc., com uma quantidade eficaz em termos insecticidas de uma composição de proteina do cristal Cry3Bb*. 0 método pode utilizar proteinas do cristal Cry3Bb* tais como as descritas em SEQ ID NO:2, SEQ ID NO: 4, SEQ ID NO: 6, r SEQ ID I NO:8, SEQ ID NO: 10, SEQ ID NO: : 12, SEQ ID NO : 14, SEQ ID NO: 16, SEQ ID NO: 18, SEQ ID NO: : 2 0, SEQ ID NO : 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: : 2 8, SEQ ID NO : 3 0, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: : 36, SEQ ID NO : 3 8, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: : 44, SEQ ID NO : 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: : 52, SEQ ID NO : 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: : 60, SEQ ID NO : 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: : 68, SEQ ID NO : 100, SEQ ID NO : 102 ou SEQ ID NO : 108 ou seus equivalentes biologicamente funcionais.

Como alternativa, o método pode utilizar uma ou mais proteínas do cristal Cry3Bb* que sejam codificadas pelas sequências de ácido nucleico de SEQ ID N0:1, SEQ ID

NO: 3, SEQ : ID NO:5 , SEQ ID NO: 7, SEQ ID NO : 9, SEQ ID NO: 11, SEQ ! ID NO:13, SEQ ID NO:15 , seq : ID NO:17, SEQ ID NO: 19, SEQ ID NO: 21, ! SEQ ID NO: 23 , SEQ ID NO:25 , SEQ ID NO :27, SEQ ID NO: 29, SEQ ID NO : 31, SEQ ID NO : 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO : 3 9, SEQ ID NO : 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO : 4 7, SEQ ID NO : 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO : 55, SEQ ID NO : 5 7, SEQ ID NO: 59, SEQ ID 119 ΡΕ1040192

NO :61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO: 6 9, SEQ ID NO:99, SEQ ID NO:101 ou SEQ ID NO:107 ou por uma ou mais sequências de ácido nucleico que hibridam com as sequências de SEQ ID NO:l, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO: 7, SEQ : ID NO:9, SEQ ID NO :H, SEQ ID NO: : 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 99, SEQ ID NO: : 101 ou SEQ ID NO: 107, em i condiç ões de restri: ngênc ia moderada ou elevada 1 Os métodos para identificação de sequências que hibridam com as descritas nas condições de restringência moderada ou elevada são conhecidos dos familiarizados com a matéria e são aqui discutidos.

Independentemente do método de aplicação, a quantidade de um ou mais dos componentes activos é aplicada numa quantidade que seja eficaz como insecticida, a qual variará dependendo de factores tais como, por exemplo, os insectos coleópteros específicos a serem controlados, a planta ou cultura específica a ser tratada, as condições ambientais e o método, velocidade e quantidade de aplicação da composição activa como insecticida.

As composições insecticidas descritas podem ser 120 ΡΕ1040192 preparadas através da formulação da célula bacteriana, cristal e/ou suspensão de esporos, ou componente proteico isolado com o veiculo aceitável em termos agrícolas. As composições podem ser formuladas antes da administração por meios adequados tais como nas formas liofilizada, seca sob congelação, ou num veículo aquoso, meio ou diluente adequado, como seja soro fisiológico ou outro tampão. As composições formuladas podem estar na forma de uma poeira ou material granulado, ou como uma suspensão em óleo (vegetal ou mineral) ou água ou emulsões de óleo/água ou como pó molhável, ou em combinação com qualquer outro material veículo adequado para aplicação agrícola. Veículos adequados para agricultura podem ser sólidos ou líquidos e são conhecidos na técnica. O termo "veículo aceitável em termos agrícolas" cobre todos os adjuvantes, e.g., componentes inertes, dispersantes, tensioactivos, substâncias gomosas, aglutinantes, etc., que são normalmente usados na tecnologia de formulação de insecticidas; estes são conhecidos dos familiarizados com a formulação de insecticidas. As formulações podem ser misturadas com um ou mais adjuvantes líquidos e preparados por vários meios, e.g., através de mistura homogénea, combinação e/ou moagem da composição insecticida com adjuvantes adequados usando técnicas de formulação convencionais.

As composições insecticidas deste invento são aplicadas no ambiente do insecto coleóptero alvo, tipicamente na folhagem da planta ou cultura a ser protegida, por métodos convencionais, de preferência por vaporização. A 121 ΡΕ1040192 força e duração da aplicação insecticida será estabelecida relativamente a condições especificas para as pragas, culturas a serem tratadas e condições ambientais particulares. A proporção de ingrediente activo relativamente ao veículo dependerá naturalmente da natureza química, solubilidade e estabilidade da composição insecticida, assim como da formulação particular contemplada.

Outras técnicas de aplicação, e.g. pulverização, aspersão, imbebição, injecção no solo, ladrilhamento do solo, revestimento das sementes, revestimento de plântulas, vaporização, arejamento, nebulização e atomização são igualmente praticáveis e podem ser necessárias em determinadas circunstâncias, tais como e.g., com insectos que causam infestação de raízes ou caules, ou para aplicação a vegetação delicada ou plantas ornamentais. Estes procedimentos de aplicação são igualmente bem conhecidos dos familiarizados com a matéria. A composição insecticida do invento pode ser empregue no método do invento de forma isolada ou combinada com outros compostos, incluindo e não estando limitados a outros pesticidas. 0 método do invento pode também ser usado conjuntamente com outros tratamentos tais como os que incluem tensioactivos, detergentes, polímeros ou formulações de libertação controlada. As composições insecticidas do presente invento podem ser formuladas para uso sistémico ou tópico. 122 ΡΕ1040192 A concentração da composição insecticida que é usada para aplicação ambiental, sistémica ou foliar variará largamente dependendo da natureza da formulação particular, meios de aplicação, condições ambientais e grau de actividade biocida. Tipicamente, a composição bioinsecti-cida estará presente na formulação aplicada numa concentração de pelo menos 1% por peso e pode ir até 99% por peso inclusive. As formulações secas das composições podem ser de 1% a 99% ou mais por peso da composição, enquanto que as formulações liquidas podem, de um modo geral, compreender entre 1% e 99% ou mais do ingrediente activo por peso. As formulações que compreendem células bacterianas intactas conterão de um modo geral 104 a 1012 células/mg. A formulação insecticida pode ser administrada a uma planta particular ou área alvo, numa ou mais aplicações conforme necessário, com uma taxa de aplicação no campo típica por hectare variando entre 1 g e 1 Kg, 2 Kg, 5 Kg ou mais de ingrediente activo. 4.8 Segmentos de Ácido Nucleico como Sondas de Hibridação e Sequências Iniciadoras

Para além da sua utilização na direcção da expressão de proteínas ou peptídeos do cristal do presente invento, as sequências de ácido nucleico aqui consideradas também possuem uma variedade de outras utilizações. Por exemplo, elas apresentam também utilidade como sondas ou sequências iniciadoras em aplicações de hibridação de ácido 123 ΡΕ1040192

nucleico. Como tal, considera-se que os segmentos de ácido nucleico que compreendem uma região da sequência consistindo em pelo menos uma sequência contígua de 14 nucleó-tidos de comprimento possuidora da mesma sequência, ou sendo complementar, de um segmento de DNA contíguo de 14 nucleótidos de comprimento de SEQ ID N0:1, SEQ ID NO:3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO:9, SEQ ID NO: V i—1 i—1 SEQ ID NO: : 13, SEQ ID NO : 15, SEQ ID NO : 17, SEQ ID NO: :19, SEQ ID NO: : 21, SEQ ID NO : 23, SEQ ID NO : 25, SEQ ID NO: : 2 7, SEQ ID NO: : 29, SEQ ID NO : 31, SEQ ID NO : 33, SEQ ID NO: : 35, SEQ ID NO: :37, SEQ ID NO : 39, SEQ ID NO : 41, SEQ ID NO: : 43, SEQ ID NO: : 45, SEQ ID NO : 47, SEQ ID NO : 49, SEQ ID NO: : 51, SEQ ID NO: : 53, SEQ ID NO : 55, SEQ ID NO : 57, SEQ ID NO: : 59, SEQ ID NO: : 61, SEQ ID NO : 63, SEQ ID NO : 65, SEQ ID NO: : 6 7, SEQ ID NO: : 69, SEQ ID NO:9 9, SEQ ID NO: : 101 ou SEQ ID NO: 107 econtrará utilidade particular. Sequências contíguas mais longas, idênticas ou complementares, e.g., as de cerca de 20, 30, 40, 50, 100, 200, 500, 1000, 2000, 5000, 10000, etc., (incluindo todos os comprimentos intermediários e até sequências de tamanho completo, inclusive, serão também usadas em determinadas realizações). A capacidade de tais sondas de ácido nucleico para especificamente hibridarem com sequências codificadoras de proteínas do cristal permitirá a sua utilização na detecção da presença de sequências complementares numa determinada amostra. No entanto, podem ser previstas outras utilizações, incluindo a utilização da informação de sequências para a preparação de sequências iniciadoras 124 ΡΕ1040192 mutantes ou sequências iniciadoras para usar na preparaçao de outras construções genéticas.

As moléculas de ácido nucleico tendo regiões da sequência consistindo em segmentos de nucleótidos contíguos de 10-14, 15-20, 30, 50 ou mesmo 100-200 nucleótidos ou

mais, idênticos ou complementares das sequências de DNA de SEQ ID NO:1, SEQ ID NO:3, SEQ ID NO:5, SEQ ID NO:7, SEQ ID NO: 9, SEQ ID NO:11, SEQ ID NO:13, SEQ ID NO:15, SEQ ID NO:17, SEQ ID NO:19, SEQ ID NO:21, SEQ ID NO:23, SEQ ID NO:25, SEQ ID NO:27, SEQ ID NO:29, SEQ ID NO:31, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:37, SEQ ID NO:39, SEQ ID NO:41, SEQ ID NO:43, SEQ ID NO:45, SEQ ID NO:47, SEQ ID NO:49, SEQ ID NO:51, SEQ ID NO:53, SEQ ID NO:55, SEQ ID NO:5 7, SEQ ID NO:59, SEQ ID NO:61, SEQ ID NO:63, SEQ ID NO:65, SEQ ID NO:67, SEQ ID NO:69, SEQ ID NO:99, SEQ ID NO:101 ou SEQ ID NO: 107 são particularmente consideradas como sondas de hibridação para usar em, e.g., transferências Southern e Northern. Os fragmentos mais pequenos, de um modo geral, encontrarão utilização nas em ensaios de hibridação, em que o comprimento da região complementar pode variar, como seja entre cerca de 10-14 e cerca de 100 ou 200 nucleótidos, mas podem ser igualmente usados segmentos complementares contiguos maiores, de acordo com o tamanho das sequências complementares que se pretende detectar. A utilização de uma sonda de hibridação de aproximadamente 14 nucleótidos de comprimento permite a 125 ΡΕ1040192 formação de uma molécula duplex que é estável e selectiva. Moléculas tendo sequências complementares contíguas ao longo de segmentos superiores a 14 bases de comprimento são geralmente preferidas, se bem que, para aumentar a estabilidade e selectividade do híbrido, e assim melhorar a qualidade e grau de moléculas híbridas específicas obtidas, seja geralmente preferido projectar moléculas de ácido nucleico tendo segmentos complementares de genes de 15 a 20 nucleótidos contíguos ou mesmo mais caso se pretenda.

Certamente, podem também ser obtidos fragmentos por outras técnicas tais como, e.g., por fricção mecânica ou digestão com enzimas de restrição. Pequenos segmentos ou fragmentos de ácido nucleico podem ser facilmente preparados por exemplo através da síntese directa do fragmento por meios químicos, como é normalmente praticado usando um sintetizador de oligonucleótidos automático. Igualmente, podem ser obtidos fragmentos através da aplicação de tecnologia de reprodução de ácidos nucleicos, como seja tecnologia de PCR™ das Patentes U.S. 4683195 e 4683202, através da introdução de sequências seleccionadas em vectores recombinantes para a produção recombinante e por outras técnicas de DNA recombinante conhecidas de um modo geral dos familiarizados com a biologia molecular.

Assim, as sequências nucleotídicas do invento podem ser usadas pela sua capacidade para selectivamente formarem moléculas de cadeia dupla com segmentos complementares de fragmentos de DNA. Dependendo da aplicação 126 ΡΕ1040192 pretendida, pretender-se-á empregar condições diferentes de hibridação para se conseguir graus variáveis de selecti-vidade da sonda contra a sequência alvo. Para aplicações que necessitem de elevada selectividade, tipicamente desejar-se-á empregar condições relativamente restringentes para formar híbridos, e.g., seleccionar-se-á condições de concentração salina baixa e/ou temperatura elevada, tais como as proporcionadas por NaCl aproximadamente 0,02M a 0,15M, a temperaturas entre cerca de 50°C e cerca de 70°C. Tais condições selectivas toleram pouco ou nenhum desempa-relhamento entre a sonda e a cadeia matriz ou alvo e serão particularmente adequadas para isolamento de segmentos de DNA codificadores de proteína do cristal. A detecção de segmentos de DNA por hibridação é bem conhecida dos familiarizados com a matéria e os ensinamentos das Patentes U.S. 4965188 e 5176995 são exemplos dos métodos de análises de hibridação. Os ensinamentos tais como os encontrados nos textos de Maloy et al., 1994; Segai 1976; Prokop, 1991; e Kuby, 1994, são particularmente relevantes.

Certamente, para algumas aplicações, por exemplo quando se pretende preparar mutantes empregando uma cadeia de sequência iniciadora mutante hibridada com uma matriz existente ou quando se pretende isolar sequências codificadoras de proteína do cristal de espécies relacionadas, equivalente funcionais, ou similares, tipicamente serão necessárias condições de hibridação menos restringentes de forma a permitir a formação do heteroduplex. Nestas circunstâncias, pode-se desejar empregar condições tais 127 ΡΕ1040192 como concentração salina de aproximadamente 0,15M a 0,9M, a temperaturas variando entre cerca de 20°C e cerca de 55°C. Espécies que originem hibridação cruzada podem assim ser facilamente identificadas como sinais de hibridação positivos relativamente a hibridações testemunha. Em qualquer dos casos, é geralmente apreciado que condições menos restringentes podem ser tornadas mais restringentes através da adição de quantidades crescentes de formamida, a qual serve para destabilizar o duplex híbrido da mesma forma que o aumento da temperatura. Assim, as condições de hibridação podem ser facilmente manipuladas, e portanto será, de um modo geral, um método de eleição dependendo dos resultados pretendidos.

Em determinadas realizações, será vantajoso empregar sequências de ácido nucleico do presente invento em combinação com um meio adequado, como seja uma marca, para determinar a hibridação. Uma larga variedade de indicadores adequados são conhecidos na técnica, incluindo ligandos fluorescentes, radioactivos, enzimáticos ou outros, tais como avidina/biotina, que são capazes de dar um sinal detectável. Nas realizações preferidas, pretende-se empregar uma marca fluorescente ou uma marca enzimática, como seja urease, fosfatase alcalina ou peroxidase, em vez de reagentes radioactivos ou outros indesejáveis para o ambiente. No caso das marcas enzimáticas, são conhecidos substratos indicadores colorimétricos que podem ser empregues para proporcionar um meio visível para o olho humano ou espectrofotometricamente, para identificar hibridação 128 ΡΕ1040192 específica com amostras contendo ácido nucleico complementar .

Em geral, pretende-se que as sondas de hibridação aqui descritas sejam úteis tanto como reagentes em soluções de hibridação como em realizações que empregam uma fase sólida. Nas realizações envolvendo uma fase sólida, o DNA a testar (ou RNA) é adsorvido ou de outra forma fixado a uma matriz ou superfície seleccionada. Este ácido nucleico de cadeia simples fixado é então sujeito a hibridação específica com sondas seleccionadas nas condições pretendidas. As condições seleccionadas dependerão das circunstâncias particulares baseado em critérios particulares necessários (dependendo, por exemplo, do teor G+C, tipo de ácido nucleico alvo, fonte de ácido nucleico, tamanho da sonda de hibridação). Após lavagem da superfície hibridada, de forma a remover as moléculas de sonda ligadas inespecificamente, detecta-se a hibridação específica através da marca. 4.9 Características das ô-Endotoxinas Cry3 Modificadas 0 presente invento proporciona novos polipeptí-deos que definem a totalidade ou uma porção de uma proteína do cristal cry3Bb.11222, cry3Bb.11226, cry3Bb.11230, cry3Bb.11234, cry3Bb.11238, codificada por cry3Bb.60, cry3Bb.11221, cry3Bb.11223, cry3Bb.11224, cry3Bb.11225, cry3Bb.11227, cry3Bb.11228, cry3Bb.11229, cry3Bb.11231, cry3Bb.11232, cry3Bb.11233, cry3Bb.11235, cry3Bb.11236, cry3Bb.11237, cry3Bb.11239, cry3Bb.11241, cry3Bb.11242, 129 ΡΕ1040192 cry3Bb.11032, cry3Bb.11035, cry3Bb.11036, cry3Bb.11046, cry3Bb.11048, cry3Bb.11051, cry3Bb.11057, cry3Bb.11058, cry3Bb.11081, cry3Bb.11082, cry3Bb.11083, cry3Bb.11084, cry3Bb.11095 e cry3Bb.11098 de B. thuringiensis. 4.10 Nomenclatura da Proteína do Cristal Os inventores atribuíram arbitrariamente as designações Cry3Bb.60, Cry3Bb.11221, Cry3Bb.11222, Cry3Bb.11223, Cry3Bb.11224, Cry3Bb.11225, Cry3Bb.11226, Cry3Bb.11227, Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11231, Cry3Bb.11232, Cry3Bb.11233, Cry3Bb.11234, Cry3Bb.11235, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb.11238, Cry3Bb.11239, Cry3Bb.11241, Cry3Bb.11242, Cry3Bb.11032, Cry3Bb.11035, Cry3Bb.11036, Cry3Bb.11046, Cry3Bb.11048, Cry3Bb.11051, Cry3Bb.11057, Cry3Bb.11058, Cry3Bb.11081, Cry3Bb.11082, Cry3Bb.11083, Cry3Bb.11084, Cry3Bb.11095 e Cry3Bb.11098 às novas proteínas do invento. Igualmente as designações arbitrárias de cry3Bb.60, cry3Bb.11221, cry3Bb.11222, cry3Bb.11223, cry3Bb.11224, cry3Bb.11225, cry3Bb. 11226, cry3Bb .11227, cry3Bb.11228, cry3Bb.11229, cry3Bb.11230, cry3Bb.11231, cry3Bb.11232, cry3Bb.11233, cry3Bb.11234, cry3Bb.11235, cry3Bb.11236, cry3Bb. 11237, cry3Bb.11238, cry3Bb.11239, cry3Bb.11241, cry3Bb.11242, cry3Bb.11032, cry3Bb.11035, cry3Bb.11036, cry3Bb .1104 6, cry3Bb.11048, cry3Bb.11051, cry3Bb.11057, cry3Bb.11058, cry3Bb.11081, cry3Bb.11082, cry3Bb.11083, cry3Bb.11084, cry3Bb.11095 e cry3Bb.11098 130 ΡΕ1040192 foram atribuídas às novas sequências de ácido nucleico que codificam estes polipeptídeos, respectivamente. Ainda que a atribuição formal das designações de gene e proteína baseado na nomenclatura revista das endotoxinas de proteína do cristal (Tabela 1) possa ser feita pelo comité para a nomenclatura de B. thuringiensis, quaisquer novas designações das composições do presente invento são consideradas como estando no âmbito da presente descrição. 4.11 Células Hospedeiras Transformadas e Plantas Transgénicas

Uma bactéria, uma célula de levedura ou uma célula vegetal ou uma planta transformada com um vector de expressão do presente invento é igualmente considerada. Uma bactéria, célula levedura, célula vegetal ou planta trans-génica derivada de uma célula transformada ou transgénica é igualmente um aspecto do invento.

Tais células hospedeiras transformadas são muitas vezes desejáveis para usar na produção de endotoxinas e na expressão das várias construções de genes de DNA aqui descritas. Nalguns aspectos do invento, é muitas vezes desejável modular, regular ou de outra fora controlar a expressão dos segmentos de genes aqui descritos. Tais métodos são de rotina para os familiarizados com a técnica da genética molecular. Tipicamente, quando se pretende uma expressão aumentada de um gene particular, podem ser empregues várias manipulações para aumentar a expressão do RNA mensageiro, particularmente usando um promotor activo, 131 ΡΕ1040192 assim como empregando sequências que aumentam a estabilidade do RN A mensageiro na célula hospedeira particular transformada.

Tipicamente, a região de iniciação e terminação da tradução envolverá um ou mais codões de paragem, uma região terminadora e, facultativamente, um sinal de poli-adenilação. Na direcção da transcrição, nomeadamente na direcção 5' para 3' da sequência codificadora, a construção envolverá a região reguladora da transcrição, se existir, e o promotor, em que a região reguladora pode estar 5' ou 3' relativamente ao promotor, local de ligação ao ribossoma, codão de iniciação, gene estrutural tendo a grelha de leitura em fase com o codão de iniciação, um ou mais codões de paragem, sequência do sinal de poliadenilação, se existir, e a região do terminador. Esta sequência como cadeia dupla pode ser usada por si só para a transformação de um microrganismo hospedeiro, mas, de um modo geral, incluirá uma sequência de DNA envolvendo uma marca, em que a segunda sequência de DNA pode ser ligada à construção de expressão da δ-endotoxia durante a introdução do DNA no hospedeiro.

Por marca pretende-se significar um gene estrutural que proporciona selecção dos hospedeiros que tenham sido modificados ou transformados. A marca proporcionará normalmente vantagem selectiva, por exemplo, proporcionando resistência a biocida, e.g., resistência a antibióticos ou a metais pesados; complementação, de forma a proporcionar 132 ΡΕ1040192 prototrofia a um hospedeiro auxotrófico, ou similares. De preferência, emprega-se complementação, de forma a que o hospedeiro modificado possa não só ser seleccionado, como também ser competitivo no campo. Podem ser empregues uma ou mais marcas no desenvolvimento das construções, assim como na modificação do hospedeiro. Os organismos podem ainda ser modificados ao ser proporcionada uma vantagem competitiva contra outros microrganismo selvagens no campo. Por exemplo, genes que expressam agentes quelantes de metais, e.g., sideróforos, podem ser introduzidos no hospedeiro juntamente com o gene estrutural expressando a δ-endo-toxina. Desta forma, o aumento da expressão de um side-róforo pode proporcionar uma vantagem competitiva para o hospedeiro produtor da δ-endotoxina, de forma a que possa competir eficazmente com os microrganismos selvagens e estavelmente ocupar um nicho no ambiente.

Quando não existir um sistema de replicação funcional, a construção também incluirá uma sequência de pelo menos 50 pares de bases (pb), de preferência pelo menos cerca de 100 pb, e geralmente não mais de cerca de 1000 pb de uma sequência homóloga de uma sequência do hospedeiro. Desta forma, a probabilidade de recombinação legitima é aumentada, de forma que o gene será integrado no hospedeiro e estavelmente mantido pelo hospedeiro. De forma desejável, o gene da δ-endotoxina estará em estreita proximidade com o gene que proporciona complementação, assim como com o gene que proporciona vantagem competitiva. Assim, no caso de um gene de δ-endotoxina ser perdido, o 133 ΡΕ1040192 organismo resultante provavelmente também perderá o gene de complementação e/ou o gene que proporciona vantagem competitiva, de forma que será incapaz de competir no ambiente com o gene mantendo a construção intacta. 0 gene codificador da proteína do cristal pode ser introduzido entre a região de iniciação da transcrição e da tradução e a região de terminação da transcrição e da tradução, de forma a permanecer sob o controlo regulador da região de iniciação. Esta construção será incluída num plasmídeo, o qual incluirá pelo menos um sistema de replicação, mas pode incluir mais de um, em que um sistema de replicação é empregue para a clonagem durante o desenvolvimento do plasmídeo e o segundo sistema de replicação é necessário para o funcionamento no hospedeiro final. Ainda, estarão presentes uma ou mais marcas, as quais foram anteriormente descritas. Sempre que se pretenda integração, o plasmídeo incluirá de preferência uma sequência homóloga do genoma do hospedeiro.

Os transformantes podem ser isolados de acordo com meios convencionais, geralmente empregando uma técnica de selecção, o que permite a selecção do organismo pretendido contra organismos não modificados ou organismos de transferência, quando presentes. Os transformantes podem então ser testados relativamente a actividade pesticida. Células hospedeiras adequadas, em que as células contendo pesticida serão tratadas para prolongar a acti- 134 ΡΕ1040192 vidade de δ-endotoxina na célula quando a célula tratada é aplicada no ambiente de uma ou mais pragas alvo, podem incluir procariotas ou eucariotas, normalmente estando limitadas às células que não produzem substâncias tóxicas para organismos superiores, tais como mamíferos. No entanto, organismos que produzem substâncias tóxicas contra organismos superiores poderão ser usados, em que a δ-endotoxina é instável ou o nível de aplicação suficientemente baixo de forma a evitar qualquer possibilidade de toxicidade para um hospedeiro mamífero. Como hospedeiros, são de particular interesse os procariotas e os eucariotas inferiores, tais como fungos. Exemplos de procariotas, tanto Gam-negativos como Gram-positivos, incluem Enterobac-teriaceae, tais como Escherichia, Erwinia, Shigella, Salmo-nella e Proteus; Bacillaceae; Rhizobiceae, tais como Rhizo-bium; Spirillaceae, tais como fitobactérias, Zymomonas, Serratia, Aeromonas, Vibrio, Desulfovibrio, Spirillum; Lactobacillaceae; organismos do filoplano tais como membros das Pseudomonadaceae (incluindo Pseudomonas spp. e Aceto-bacter spp.); Azotobacteraceae e Nitrobacteraceae; Flavobacterium spp; membros das Bacillaceae tais como Lactobacillus spp., Bifidobacterium spp., e similares. Células hospedeiras particularmente preferidas incluem Pseudomonas aeruginosa, Pseudomonas fluorescens, Bacillus thurigiensis, Escherichia coli, Bacillus subtilis e similares.

Entre os eucariotas estão fungos, tais como

Phycomycetes e Ascomycetes, o que inclui leveduras, tais 135 ΡΕ1040192 como Schizosaccharomyces; e Basidiomycetes, Rhodotorula, Aureobasidium, Sporobolomyces, Saccharomyces spp. e Sporobolomyces spp. e similares.

Características de interesse particular na selec-ção de uma célula hospedeira com o objectivo de produção incluem a facilidade de introdução do gene da δ-endotoxina no hospedeiro, disponibilidade de sistemas de expressão, eficiência de expressão, estabilidade do pesticida no hospedeiro e presença de capacidades genéticas auxiliares. Características com interesse para usar como microcápsula de pesticida incluem qualidades protectoras para o pesticida, como sejam paredes celulares espessas, pigmentação e armazenamento intracelular ou formação de corpos de inclusão; afinidade foliar; ausência de toxicidade para mamíferos; capacidade para induzir a ingestão por pragas; facilidade de matar e fixação sem destruição da δ-endotoxina; e similares. Outras considerações incluem facilidade de formulação e manipulação, economia, estabilidade no armazenamento e similares. A célula estará geralmente intacta e substancialmente na forma proliferativa quando tratada, em vez de uma forma de esporo, se bem que nalguns casos os esporos possam ser empregues. 0 tratamento da célula microbiana recom-binante pode ser feito como descrito infra. As células tratadas, de um modo geral, terão maior estabilidade estrutural que aumentará a resistência a condições ambientais. 136 ΡΕ1040192

Os genes ou outros segmentos de ácido nucleico, conforme aqui descrito, podem ser inseridos nas células hospedeiras usando uma variedade de técnicas que são bem conhecidas dos familiarizados com a matéria. Por exemplo, existe um grande número de vectores de clonagem compreendendo um sistema de replicação em E. coli e uma marca que permite a selecção das células transformadas para preparação da inserção de genes estranhos em organismos superiores, incluindo plantas. Os vectores compreendem, por exemplo, pBR322, série pUC, série M13mp, pACYC184, etc. Assim, a sequência codificadora da δ-endotoxina pode ser inserida no vector num local de restrição adequado. 0 plasmideo resultante é usado para transformação em E. coli. As células de E. coli são cultivadas num meio nutritivo adequado, depois colhidas e lisadas. 0 plasmideo é recuperado. A análise da sequência, análise de restrição, electroforese e outros métodos de bioqumica-biologia molecular são geralmente realizados como métodos de análise. Após cada uma das manipulações, a sequência de DNA usada pode ser clivada e ligada à sequência de DNA seguinte. Cada sequência de plasmideo pode ser clonada no mesmo plasmideo ou noutros plasmideos. Dependendo do método de inserção dos genes pretendidos na planta, outras sequências de DNA podem ser necessárias. Métodos para a transformação de células vegetais com DNA incluem transformação de plantas mediada por Agrobacterium, transformação de protoplastos, transferência de genes para pólen, injecção de órgãos reprodutores, 137 ΡΕ1040192 injecção de embriões maduros e bombardeamento com partículas. Cada um destes métodos possui vantagens e desvantagens distintas. Assim, um método particular de introdução de genes numa estirpe vegetal particular pode não ser necessariamente o mais eficaz para uma outra estirpe vegetal, mas são conhecidos quais os métodos úteis para uma estirpe vegetal particular.

Pensa-se que métodos adequados incluam virtualmente qualquer método através do qual DNA possa ser introduzido numa célula, como seja través da infecção por Agrobacterium, libertação directa do DNA como tal, por exemplo, pela transformação de protoplastos mediada por PEG (Omirulleh et al., 1993), através de internalização de DNA mediada por desidratação/hidratação, por electroporação, por agitação com fibras de silicone Carbide, por aceleração de partículas revestidas com DNA, etc. Em determinadas realizações, os métodos de aceleração são preferidos e incluem, por exemplo, bombardeamento com microprojécteis e similares. A tecnologia para introdução do DNA nas células é conhecida dos familiarizados com a técnica. Foram descritos quatro métodos gerais para introdução de um gene nas células: (1) métodos químicos (Graham and van der Eb, 1973; Zatloukal et al., 1992); (2) métodos físicos tais como microinjecção (Capecchi, 1980), electroporação (Wong and Neumann, 1982; Fromm et al., 1985) e pistola de genes (Johnston and Tang, 1994; Fynan et al., 1993); (3) vectores 138 ΡΕ1040192 virais (Clapp, 1993; Lu et ai., 1993; Eglitis and Anderson, 1988; Eglitis et al., 1988); e (4) mecanismos mediados por receptores (Curiel et al., 1991; 1992; Wagner et al., 1992) .

Existe um grande número de técnicas para a inserção de DNA numa célula hospedeira vegetal. Estas técnicas incluem transformação com T-DNA usando Agrobac-terium tumefaciens ou Agrobacterium rhizogenes como agente de transformação, fusão, injecção ou electroporação assim como outros métodos possíveis. Se forem usadas agrobacté-rias na transformação, o DNA a ser inserido tem de ser clonado em plasmídeos especiais, nomeadamente num vector intermediário ou num vector binário. Os vectores intermediários podem ser integrados no plasmídeo Ti ou Ri por recombinação homóloga devido às sequências homólogas de sequências no T-DNA. 0 plasmídeo Ti ou Ri também compreende a região vir necessária para a transferência do T-DNA.

Os vectores intermediários não se podem replicar em agrobactérias. 0 vector intermediário pode ser transferido para Agrobacterium tumefaciens por meio de um plasmídeo auxiliar (conjugação). Os vectores binários podem replicar-se em E. coli e em agrobactérias. Eles compreendem um gene de marca de selecção e um adaptador ou poli-adaptador flanqueados pelas regiões de fronteira direita e esquerda de T-DNA. Eles podem ser usados para transformar directamente agrobactérias (Holsters et al., 1978). A agrobactéria usada como célula hospedeira deverá compre- 139 ΡΕ1040192 ender um plasmídeo portador de uma região vir. A região vir é necessária para transferência do T-DNA para a célula vegetal. Outro T-DNA pode estar incluso. A bactéria assim transformada é usada para a transformação de células vegetais. Explantes vegetais podem, com vantagem, ser cultivados com Agrobacterium tumefaciens ou Agrobacterium rhizogenes para a transferência do DNA para a célula vegetal. Plantas completas podem ser regeneradas a partir do material da planta infectada (por exemplo, pedaços de folha, segmentos de caule, raízes, mas também protoplastos ou células cultivadas em suspensão) num meio adequado, o qual pode conter antibióticos ou biocidas para selecção. As plantas assim obtidas podem então ser testadas quanto à presença do DNA inserido. Não são necessários requisitos especiais para os plasmídeos no caso de injecção e electroporação. É possível usar plasmídeos normais, tais como, por exemplo, derivados de pUC. Se, por exemplo, o plasmídeo Ti ou Ri for usado para a transformação da célula vegetal, então pelo menos a fronteira direita, mas muitas vezes as fronteiras direita e esquerda do T-DNA do plasmídeo Ti ou Ri, tem de ser ligada como região flanqueante dos genes a serem inseridos. A utilização do T-DNA para a transformação das células vegetais foi intensivamente pesquisada e suficientemente descrita no Pedido de Patente Europeia N° EP 120516; Hockema (1985); Na et al., 1985, Herrera-Estrella et al., (1983), Bevan et al., (1983) e Klee et al., (1985).

Um vector cassete do plasmídeo Ti particularmente 140 ΡΕ1040192 útil para a transformação de plantas dicotiledóneas consiste no promotor CaMA35S (EN35S) e no extremo 3' incluindo sinais de poliadenilação derivados de um gene de soja codificador da subunidade a' de β-conglicinina. Entre estes dois elementos está um multi-adaptador contendo múltiplos locais de restrição para a inserção de genes com interesse. 0 vector, de preferência, contem um segmento de pBR322 que proporciona uma origem de replicação em E. coli e uma região de recombinação homóloga com o T-DNA sem braços na estirpe ACO de Agrobacterium; a origem oriV derivada do plasmideo RK1 de larga gama de hospedeiros; o gene de resistência à estreptomicina/espectinomicina derivado de Tn7; e um gene NPTII, contendo o promotor CaMV35S e o extremo 3' da nopalina sintetase (NOS), o qual proporciona resistência à canamicina em células vegetais transformadas.

Facultativamente, o promotor CaMV35S pode ser substituído pelo promotor da manopina sintetase (MAS) de 1,5 Kb (Velten et al., 1984). Após incorporação de uma construção de DNA no vector, este é introduzido numa estirpe ACO de A. tumefaciens que contem um plasmideo Ti sem braços. Os vectores do plasmideo Ti cointegrados são seleccionados e, subsequentemente, podem ser usados para transformar uma planta dicotiledónea. A. tumefaciens ACO é uma estirpe "disarmed" (sem 141 ΡΕ1040192 braços) semelhante a pTiBôSE descrita por Fraley et al. (1985). Para a construção de ACO a estirpe Agrobacterium de partida foi a estirpe A208 que contem um plasmideo Ti tipo nopalina. 0 plasmideo Ti foi destituídos dos braços de forma semelhante ao descrito por Fraley et al. (1985) para que essencialmente todo o T-DNA nativo fosse removido exceptuando a fronteira esquerda e algumas centenas de pares de bases do T-DNA dentro da fronteira esquerda. 0 restante T-DNA prolongando-se até um ponto para lá da fronteira esquerda foi substituído com um novo segmento de DNA incluindo (da esquerda para a direita) um segmento de pBR322, a região oriv derivada do plasmideo RK2 e o gene de resistência da canamicina de Tn601. Os segmentos de pBR322 e oriv são semelhantes a estes segmentos e proporcionam uma região de homologia para formação cointegrada.

Uma vez integrado no genoma o DNA inserido, permanece aí de forma relativamente estável e, como regra, não torna a sair. Normalmente contem uma marca de selecção que confere às células vegetais transformadas resistência a um biocida ou um antibiótico, como seja canamicina, G418, bleomicina, higromicina ou cloranfenicol, inter alia. A marca individualmente empregue deverá assim permitir a selecção das células transformadas versus células que não contêm o DNA inserido. 4.11.1 Electroporação A aplicaçao de breves pulsos eléctricos de alta 142 ΡΕ1040192 voltagem a uma variedade de células animais e vegetais conduz à formação de poros com dimensões de nanómetros na membrana plasmática. 0 DNA é internalizado directamente para o citoplasma celular através destes poros ou como consequência da redistribuição dos componentes membranares que acompanha o enceramento dos poros. A electroporação pode ser extremamente eficiente e pode ser usada para a expressão transitória dos genes clonados e para o estabelecimento de linhas celulares portadoras de cópias integradas do gene com interesse. A electroporação, ao contrário da transfecção mediada por fosfato de cálcio e fusão de protoplastos, frequentemente origina linhas celulares portadoras de uma ou, no máximo algumas, cópias integradas do DNA estranho. A introdução de DNA por meio de electroporação, é bem conhecida dos familiarizados com a matéria. Neste método, determinadas enzimas que degradam a parede celular, como sejam enzimas que degradam pectina, são empregues para tornar as células recipientes alvo mais susceptiveis a transformação por electroporação do que as células não tratadas. Como alternativa, as células recipientes são tornada mais susceptiveis à transformação, por ferimento mecânico. Para efectuar a transformação por electroporação pode-se empregar tecidos friáveis, tais como culturas de células em suspensão ou calos embriogénicos, ou como alternativa pode-se transformar directamente embriões imaturos ou outros tecidos organizados. Degradar-se-á parcialmente as paredes celulares das células escolhidas 143 ΡΕ1040192 através da sua exposição a enzimas que degradam pectina (pectoliases) ou ferimento mecânico de forma controlada. Tais células serão então recipientes da transferência de DNA por electroporação, a qual pode ser realizada nesta fase e as células transformadas depois identificadas através de um protocolo de selecção ou rastreio adequado, dependendo da natureza do DNA incorporado. 4.11.2 Bombardeamento com MicroProjécteis

Um outro método vantajoso para a introdução de segmentos de DNA transformantes em células vegetais é o bombardeamento com microprojécteis. Neste método, as partículas podem ser revestidas com ácidos nucleicos e introduzidas por uma força propelente. Exemplos de partículas incluem as constituídas por tungsténio, ouro, platina e similares.

Uma vantagem do bombardeamento com microprojéc-teis, para além de ser um meio eficaz de transformar estavelmente e de forma reprodutível monocotiledóneas, é que nem o isolamento de protoplastos (Cristou et al., 1988) nem a susceptibilidade a Agrobacterium ê necessária. Um exemplo de realização de um método para a introdução de DNA em células de milho através da aceleração é um Biolistic Particle Delivery system, que pode ser usado para impulsionar partículas revestidas com DNA ou células através de um écran, como seja um écran de aço inoxidável ou Nytex, numa superfície de filtro coberta com células cultivadas em 144 ΡΕ1040192 suspensão. 0 écran dispersa as partículas de forma a não serem libertados nas células recipientes em grandes agregados. Pensa-se que um écran interposto entre o dispositivo que lança os projécteis e as células a serem bombardeadas reduz o tamanho dos agregados de projécteis e pode contribuir para uma frequência mais elevada de transformação através da redução dos danos infligidos às células recipientes por projécteis que sejam demasiado grandes.

Para o bombardeamento, as células em suspensão são, de preferência, concentradas em filtros ou meio de cultura sólido. Como alternativa, embriões imaturos ou outras células alvo podem ser arranjadas em meio de cultura sólido. As células a serem bombardeadas são posicionadas a uma distância apropriada abaixo da placa de paragem do macropro jéctil. Caso se pretenda, um ou mais écrans são igualmente posicionados entre o dispositivo de aceleração e as células a serem bombardeadas. Através da utilização de técnicas aqui descritas pode-se obter até 1000 ou mais focos de células que expressam transitoriamente um gene de uma marca. O número de células num foco que expressam o produto do gene exógeno 48 horas pós-bombardeamento muitas vezes varia entre 1 e 10 e em média entre 1 e 3.

Na transformação por bombardeamento, pode-se optimizar as condições de cultura pré-bombardeamento para dar números máximos de transformantes estáveis. Tanto os parâmetros físicos como biológicos para o bombardeamento 145 ΡΕ1040192 são importantes nesta tecnologia. Os factores físicos são os que envolvem a manipulação do precipitado de DNA/micro-projéctil ou os que afectam o voo e velocidade dos macro-ou microprojécteis. Factores biológicos incluem todos os passos envolvidos na manipulação de células antes e imediatamente após o bombardeamento, o ajuste osmótico das células alvo para ajudar a aliviar o trauma associado ao bombardeamento e também a natureza do DNA transformante, como seja DNA linearizado ou plasmídeos super-enrolados intactos. Pensa-se que as manipulações pré-bombardeamento sejam especialmente importantes para a transformação com êxito dos embriões imaturos.

Assim, considera-se que se pode pretender ajustar vários parâmetros do bombardeamento em estudos de pequena escala para optimizar totalmente as condições. Particularmente, pode-se ajustar os parâmetros físicos tais como a distância da abertura, distância do voo, distância do tecido e pressão do hélio. Pode-se também minimizar os factores de redução de trauma (TRFs) através da modificação de condições que influenciam o estado fisiológico das células recipientes e que podem portanto influenciar as eficiências de transformação e integração. Por exemplo, o estado osmótico, hidratação do tecido e fase de subcultura ou ciclo celular das células recipientes podem ser ajustados para uma transformação óptima. A execução de outros ajustamentos de rotina será conhecida dos familiarizados com a matéria face à presente descrição. 146 ΡΕ1040192 4.11.3 Transferência Mediada por Agrobacterium A transferência mediada por Agrobacterium é um sistema largamente aplicado para a introdução de genes em células vegetais devido ao DNA ser introduzido nos tecidos de plantas completas, ultrapassando assim a necessidade de regeneração de uma planta intacta a partir de um proto-plasto. A utilização de vectores de integração em plantas, mediada por Agrobacterium, para introduzir DNA nas células vegetais é conhecida na técnica. Ver, por exemplo, os métodos descritos (Fraley et al. , 1985; Rogers et al., 1987) . Ainda, a integração de DNA Ti é um processo relativamente preciso resultando em poucos rearranjos. A região do DNA a ser transferido é definida pelas sequências de fronteira e o DNA interveniente é geralmente introduzido no genoma da planta como descrito (Spielman et al., 1986; Jorgensen et al., 1987).

Os modernos vectores de transformação de Agrobacterium são capazes de se replicarem em E. coli assim como em Agrobacterium, permitindo manipulações adequadas conforme descrito (Klee et al. , 1985). Ainda, avanços tecnológicos recentes em vectores para a transferência de genes mediada por Agrobacterium melhorou o arranjo de genes e os locais de restrição nos vectores para facilitar a construção de vectores capazes de expressar vários genes codificadores de polipeptídeos. Os vectores descritos (Rogers et al., 1987) possuem regiões multi-adaptadoras flanqueadas por um promotor e um local de poliadenilação para a 147 ΡΕ1040192 expressão directa dos genes inseridos codificadores de polipeptideos e são adequados para os presentes objectivos. Ainda, Agrobacterium contendo genes Ti com e sem braços pode ser usada nas transformações. Nas estirpes vegetais em que a transformação mediada por Agrobacterium é eficiente, é o método de eleição devido à natureza fácil e definida da transferência de genes. A transformação, mediada por Agrobacterium, de discos foliares e de outros tecidos tais como cotilédones e hipocótilos parece estar Imitada a plantas naturalmente infectadas por Agrobacterium. A transformação mediada por Agrobacterium é mais eficiente em plantas dicotiledóneas. Poucas monocotiledóneas parecem ser hospedeiros naturais de Agrobacterium, se bem que tenham sido produzidas plantas transgénicas em espargos usando vectores de Agrobacterium como descrito (Bytebier et al. , 1987). Assim, culturas de cereais economicamente importantes, tais como arroz, milho e trigo, geralmente devem ser transformadas usando métodos alternativos. No entanto, conforme referido atrás, a transformação de espargos usando Agrobacterium pode também ser conseguida (ver, por exemplo, Bytebier et al., 1987).

Uma planta transgénica, formada usando os métodos de transformação por Agrobacterium tipicamente, contem tipicamente um único gene num só cromossoma. Tais plantas transgénicas podem ser referidas como sendo heterozigóticas para o gene adicionado. No entanto, apesar de a utilização da palavra "heterozigótico" geralment implicar a presença 148 ΡΕ1040192 de um gene complementar no mesmo locus do segundo cromossoma de um par de cromossomas e não haver tal gene numa planta contendo um gene adicionado como aqui, pensa-se que um termo mais preciso para tal planta é um segregante independente, devido ao gene exógeno adicionado segregar independentemente durante a mitose e a meiose.

Mais preferida é uma planta transgénica que é homozigótica para o gene estrutural adicionado, i.e., uma planta transgénica que contem dois genes adicionados, um gene no mesmo locus em cada um dos cromossomas de um par. Uma planta transgénica homozigótica pode ser obtida por conjugação (autofertilização) sexuada de uma planta transgénica segregante independente que contem um único gene adicionado, germinação de algumas das sementes produzidas e análise das plantas resultantes produzidas de forma a ter actividade carboxilase aumentada relativamente a um controlo (nativa, não transgénica) ou uma planta transgénica segregante independente.

Deve ser considerado que duas plantas transgé-nicas diferentes podem também ser conjugadas para produzir progénie que contem dois genes exógenos adicionados com segregação independente. A autofertilização de progénie adequada pode produzir plantas que são homozigóticas para ambos os genes exógenos adicionados que codificam um polipeptideo com interesse. 0 cruzamento com uma planta parental e o cruzamento com uma planta não transgénica são igualmente considerados. 149 ΡΕ1040192 A transformação de protoplastos vegetais pode ser conseguida usando métodos baseados na precipitação com fosfato de cálcio, tratamento com polietilenoglicol, electroporação e combinações destes tratamentos (ver, e.g., Potrykus et ai., 1985; Lorz et al. , 1985; Fromm et al. , 1985; Uchimiya et al., 1986; Callis et al. , 1987; Marcotte et al., 1988) . A aplicação destes sistemas a diferentes estirpes vegetais depende da capacidade para regenerar a estirpe vegetal particular a partir de protoplastos. Métodos ilustrativos da regeneração de cereais a partir de protolastos foram descritos (Fujimura et al., 1985; Toriyama et al., 1986; Yamada et al., 1986; Abdullah et al., 1986).

Para transformar estirpes vegetais que não podem ser regeneradas com êxito a partir de protoplastos, podem ser utilizadas outras vias para introduzir DNA nas células ou tecidos intactos.

Por exemplo, a regeneração de cereais a partir de embriões imaturos ou explantes pode ser efectuada como descrito (Vasil, 1988). Ainda, pode ser utilizada a "pistola de partículas" ou tecnologia de microprojécteis de alta velocidade (Vasil, 1992). o DNA é levado

Usando esta última tecnologia 150 ΡΕ1040192 através da parede celular e para o citoplasma na superfície de pequenas partículas de metal como descrito (Klein et al., 1987; Klein et al., 1988; McCabe et al., 1988). As partículas de metal penetram através de várias camadas de células e assim permitem a transformação de células dentro dos explantes de tecidos. 4.11.4 Expressão de Genes em Plantas

Se bem que nos últimos anos tenha sido feito grande progresso relativamente à preparação de plantas transgénicas que expressam proteínas bacterianas, tais como proteínas do cristal de B. thuringiensis, os resultados da expressão de genes bacterianos nativos em plantas são muitas vezes desapontantes. Ao contrário da genética microbiana, os primeiros geneticistas de plantas pouco sabiam sobre factores que afectam a expressão heteróloga de genes estranhos em plantas. Nos últimos anos, no entanto, vários factores potenciais foram implicados como responsáveis, em grau variável, pelo nível de expressão proteica a partir de uma sequência codificadora particular. Por exemplo, os cientistas sabem agora que a manutenção de um nível significativo de um mRNA particular na célula é de facto um factor crítico. Infelizmente, as causas dos baixos níveis de mRNA codificador de proteínas heterólogas são muitas. Em primeiro lugar, a síntese de RNA de tamanho completo pode não ocorrer numa frequência elevada. Isto poderá, por exemplo, ser causado pela terminação prematura de RNA durante a transcrição ou devido ao processamento inesperado 151 ΡΕ1040192 de mRNA durante a transcrição. Em segundo lugar, o mRNA de tamanho completo pode ser produzido na célula vegetal, mas depois processado ("splicing", adição de poliA) no núcleo de forma a criar um mRNA não funcional. Se o RNA não for correctamente sintetizado, terminado e poliadenilado, não pode transitar para o citoplasma para ser traduzido. De forma semelhante, no citoplasma, se os mRNAs tiverem semi-vidas reduzidas (as quais são determinadas pela sua sequência primária ou secundária) será produzido produto proteico insuficiente. Ainda, existe um efeito, cuja dimensão é incerta, da eficiência de tradução na semi-vida do mRNA. Ainda, todas as moléculas de RNA enrolam-se numa estrutura particular, ou talvez em famílias de estruturas, que é determinada pela sua sequência. A estrutura particular de qualquer RNA deverá conduzir a uma maior ou menor estabilidade no citoplasma. A estrutura per se é, provavelmente, também um determinante do processamento de mRNA no núcleo. Infelizmente, é impossível prever, e quase impossível determinar, a estrutura de qualquer RNA (excepto o tRNA) in vitro ou in vivo. No entanto, é provável que a alteração dramática da sequência de um RNA tenha um grande efeito na sua estrutura enrolada. É provável que a estrutura per se ou características estruturais particulares tenham um papel na determinação da estabilidade do RNA.

Para ultrapassar estas limitações na expressão dos genes estranhos, os investigadores identificaram sequências e sinais particulares em RNAs que tenham o potencial para terem um efeito específico na estabilidade 152 ΡΕ1040192 do RNA. Em determinadas realizações do invento, existe pois o objectivo de optimizar a expressão dos segmentos de ácido nucleico in planta. Um método particular de o fazer, é através da alteração do gene bacteriano para remover sequências ou motivos que diminuam a expressão numa célula vegetal transformada. 0 processo de manipulação de uma sequência codificadora para expressão óptima in planta é muitas vezes referido como "plantização" de uma sequência de DNA.

As sequências ricas em A+T são particularmente problemáticas. Infelizmente, uma vez que B. thuringiensis tem um genoma rico em A+T, sequências de genes da proteína do cristal nativa devem, muitas vezes, ser modificadas para a expressão óptima numa planta. 0 motivo com a sequência ATTTA (ou AUUUA tal como surge no RNA) tem sido implicado como uma sequência destabilizante em mRNA de células de mamífero (Shaw and Kamen, 1986). Muitos mRNAs com uma vida curta têm regiões não traduzidas 3' ricas em A+T, e estas regiões muitas vezes possuem a sequência ATTTA, por vezes presentes em múltiplas cópias ou como multímeros (e.g., ATTTATTTA...). Shaw e Kamen mostraram que a transferência do extremo 3' de um mRNA instável para um RNA estável (globina ou VAI) diminui dramaticamente a semi-vida de RNAs estáveis. Mostraram ainda que um pentâmero de ATTTA possui um profundo efeito destabilizador num mensageiro estável e que este sinal poderá exercer o seu efeito quer esteja localizado no extremo 3' quer dentro da sequência codificadora. No entanto, o número de sequências ATTTA e/ou o contexto da sequência em que ocorre também parece ser 153 ΡΕ1040192 importante na determinação da sua função como sequências destabilizantes. Shaw e Kanen mostraram que um trimero de ATTTA tem muito menos efeito do que um pentâmero na estabilidade do mRNA e um dimero ou um monómero não tem efeito na estabilidade (Shaw and Kamen, 1987). Note-se que os multimeros de ATTTA tais como um pentâmero criam automaticamente uma região rica em A+T. Demonstrou-se que este é um efeito citoplasmático, não um efeito nuclear. Noutros mRNAs instáveis, a sequência ATTTA pode estar presente apenas numa única cópia, mas está muitas vezes contida numa região rica em A+T. Dos dados de células animais até agora obtidos, parece que ATTTA, pelo menos nalguns contextos, é importante na estabilidade, mas não é ainda possível prever quais as situações em que ATTTA é um elemento destabilizador ou se qualquer um destes efeitos tem probabilidade de ocorrer em plantas.

Alguns estudos sobre a degradação de mRNA em células animais podem também indicar que a degradação de RN A pode começar nalguns casos com ataque nucleolítico em regiões ricas em A+T. Não é claro se estas clivagens ocorrem em sequências ATTTA. Existem também exemplos de mRNA que possuem estabilidade diferencial, dependendo do tipo de célula em que são expressos ou da fase do ciclo celular em que são expressos. Por exemplo, os mRNAs das histonas são estáveis durante a síntese de DNA mas instáveis se a síntese de DNA for interrompida. 0 extremo 3' de alguns mRNAs de histonas parece ser responsável por este efeito (Pandey and Marzluff, 1987) . Não parece ser mediado por ATTTA nem é claro o que controla a estabilidade 154 ΡΕ1040192 diferencial deste mRNA. Um outro exemplo é a estabilidade diferencial do mRNA de IgG em linfócitos B durante a maturação das células B (Genovese and Milcarek, 1988). Um exemplo final é a instabilidade de um mRNA de globina mutante β-talassémica. Nas células da medula óssea, onde este gene é normalmente expresso, o mRNA mutante é instável, enquanto que o mRNA selvagem é estável. Quando o gene mutante é expresso em células HeLa ou L in vitro, o mRNA mutante não mostra instabilidade (Lim et al., 1988). Estes exemplos também proporcionam evidência de que a estabilidade do mRNA pode ser mediado pelo tipo de células ou factores específicos do ciclo celular. Ainda, este tipo de instabilidade não está ainda associado a equências específicas. Tendo em conta estas incertezas, não é possível prever quais os RNAs que têm probabilidade de serem instáveis numa determinada célula. Ainda, mesmo o motivo ATTTA pode actuar diferencialmente dependendo da natureza da célula em que o RNA está presente. Shaw and Kamen (1987) descreveram que a activação de uma proteína cinase C pode bloquear a degradação mediada por ATTTA. A adição de uma cadeia de poliadenilato ao extremo 3' é comum à maior parte dos mRNAs eucarióticos, tanto vegetais como animais. 0 conceito normalmente aceite da adição de poli A é que o transcrito nascente se estende para lá do extremo 3' maduro. Neste transcrito estão contidos sinais de poliadenilação e formação correcta do extremo 3' . Este processamento no extremo 3' envolve a clivagem do mRNA e a adição de poli A ao extremo 3' maduro. Ao pesquisar-se sequências de consenso perto da cauda poli 155 ΡΕ1040192 A em mRNAs vegetais e animais, foi possível identificar sequências de consenso que aparentemente estão envolvidas na adição de poli A e na clivagem do extremo 3'. As mesmas sequências de consenso parecem ser importante para ambos os processo. Estes sinais são tipicamente uma variação da sequência AATAAA. Nas células animais, foram identificadas algumas variantes desta sequência que são funcionais; nas células vegetais parece existir uma larga gama de sequências funcionais (Wickens ad Stephenson, 1984; Dean et al., 1986). Devido a todas estas sequências de consenso serem variações de AATAAA, elas são sequências ricas em A+T. Esta sequência é tipicamente encontrada 15 a 20 pb antes da cauda poli A num mRNA maduro. Os estudos em células animais indicam que esta sequência está envolvida na adição de poli A e na maturação 3' . Mutações dirigidas nesta sequência podem destruir estas funções (Conway and Wickens, 1998 ; Wickens et al., 1987) . No entanto, foi também observado que sequências até 50 a 100 pb 3' relativamente ao sinal poli A putativo são igualmente necessárias; i.e., um gene que tem uma AATAAA normal mas que sofreu substituições ou foi destruído a jusante não é correctamente poliadenilado (Gil and Proudfoot, 1984; Sadofsky and Alwine, 1984; McDevitt et al. , 194). Ou seja, o próprio sinal poli A não é suficiente para um processamento completo e adequado. Não é ainda conhecido quais as sequências específicas a jusante que são necessárias para além do sinal poli A, ou se existe uma sequência específica que possui esta função. Assim, a análise de sequências pode apenas identificar potenciais sinais poli A. 156 ΡΕ1040192

Nos mRNAs naturais que são normalmente poliadeni-lados, foi observado que através da destruição deste processo, pela alteração do sinal poli A ou de outras sequências no mRNA, podem ser obtidos efeitos profundos ao nivel do mRNA funcional. Isto foi observado em vários mRNAs naturais, com resultados que até agora são específicos dos genes.

Foi demonstrado que nos mRNAs naturais a poliadenilação correcta é importante na acumulação de mRNA e a destruição deste processo pode afectar significativamente os níveis de mRNA. No entanto, não temos conhecimento suficiente para prever o efeito de alterações num gene normal. Num gene heterólogo, é ainda mais difícil prever as consequências. No entanto, é possível que os locais putativos identificados sejam disfuncionais. Ou seja, estes locais podem não actuar como locais poli A correctos. Ou seja, estes locais podem não actuar como locais poli A adequados, mas funcionarem como locais aberrantes que dão origem a mRNAs instáveis.

Em todos os sistemas celulares animais, AATAAA é de longe o sinal mais vulgarmente identificado em mRNAs a montante do poli A, mas pelo menos quatro variantes foram também encontradas (Wickens and Stephenson, 1984) . Nas plantas não foi feita análise tão extensa, mas é claro que múltiplas sequências semelhantes a AATAAA podem ser usadas. Os locais vegetais na Tabela 5 designados por "maior" e "menor" referem-se apenas ao estudo de Dean et al., (1986) que analisaram apenas três tipos de genes vegetais. A 157 ΡΕ1040192 designação de locais de poliadenilação como "maior" e "menor" refere-se apenas à frequência da sua ocorrência como locais funcionais em genes naturais que foram analisados. No caso das plantas esta é uma base de dados muito limitada. É difícil prever com certeza que um local designado maior ou menor funcione parcial ou completamente quando encontrados num gene heterólogo como os codificadores das proteínas do cristal do presente invento.

Tabela 5

Locais de Poliadenilação nos Genes Vegetais PA AATAAA Local de consenso maior PIA AATAAT Local vegetal maior P2A AACCAA Local vegetal menor P3A ATATAA 11 P4A AATCAA 11 P5A ATACTA 11 P6A ATAAAA 11 P7A ATGAAA 11 P8A AAGCAT 11 P9A ATTAAT 11 Pl OA ATACAT 11 PI IA AAAATA 11 P12A ATTAAA Local animal menor P13A AATTAA 11 P14A AATACA 11 P15A CATAAA 11 158 ΡΕ1040192 0 presente invento proporciona um método para a preparação de genes vegetais sintéticos que expressam o seu produto proteico em niveis significativamente superiores aos genes selvagens, que têm até aqui sido normalmente empregues na transformação de plantas. Num outro aspecto, o presente invento também proporciona novos genes vegetais sintéticos que codificam proteínas não vegetais.

Como descrito atrás, a expressão de genes de B. thuringiensis nativos em plantas é muitas vezes problemática. A natureza das sequências codificadoras dos genes de B. thuringiensis distingue-as dos genes vegetais assim como de muitos outros genes heterólogos expressos em plantas. Em particular, os genes de B. thuringiensis são muito ricos (-62%) em adenina (A) e timina (T) , enquanto que os genes vegetais e a maior parte dos genes bacterianos que foram expressos em plantas têm na ordem de 45-55% A+T.

Devido à degenerescência do código genético e ao número limitado de escolhas de codões para qualquer aminoácido, a maior parte do "excesso" de A+T das sequências codificadoras estruturais de algumas espécies de Bacillus é encontrada na terceira posição dos codões. Ou seja, os genes de algumas espécies de Bacillus possuem A ou T como terceiro nucleótido em muitos codões. Assim o teor A+T, em parte, pode determinar o enviesamento da utilização de codões. Ainda, é óbvio que os genes evoluem para uma 159 ΡΕ1040192 função óptima no organismo em que estão a evoluir. Isto significa que as sequências nucleotidicas particulares encontradas num gene de um organismo, onde podem não desempenhar qualquer papel excepto codificar um segmento particular de aminoácidos, têm o potencial de ser reconhecidos como elementos de controlo do gene num outro organismo (como sejam promotores ou terminadores da transcrição, locais de adição de poliA, locais de "splicing" de intrões ou sinais de degradação de mRNA específicos) . É talvez surpreendente que tais sinais mal lidos não sejam uma característica comum da expressão de genes heterólogos, mas isto pode ser explicado, em parte, pelo teor A+T relativamente homogéneo (-50%) de muitos organismos. Este teor A+T mais a natureza do código genético coloca restrições na probabilidade de ocorrência de qualquer sequência oligonucleotídica particular. Assim, um gene de E. coli com um teor de A+T de 50% tem menos probabilidade de possuir qualquer segmento rico em A+T particular do que um gene de B. thuringiensis.

Tipicamente, para se obter um nível elevado de expressão dos genes de δ-endotoxinas em plantas, sequências codificadoras estruturais ("gene estrutural") existentes que codificam a δ-endotoxina são modificadas através da remoção de sequências ATTTA e de sinais de poliadenilação putativos por mutagénese dirigida do DNA compreendendo o gene estrutural. Prefere-se que substancialmente todos os sinais de poliadenilação e sequências ATTTA sejam 160 ΡΕ1040192 removidos, se bem que sejam observados níveis de expressão elevados apenas com a remoção parcial das sequências atrás identificadas. Como alternativa, se for preparado um gene sintético que codifique a expressão da proteína com interesse, são seleccionados codões de forma a evitar a sequência ATTTA e sinais de poliadenilação putativos. Para fins do presente invento os sinais de poliadenilação putativos incluem, mas não estão necessariamente limitados a AATAAA, AATAAT, AACCAA, ATATAA, AATCAA, ATACTA, ATAAAA, ATGAAA, AAGCAT, ATTAAT, ATACAT, AAAATA, ATTAAA, AATTAA, AATACA e CATAAA. Na substituição das sequências ATTTA e sinais de poliadenilação, são de preferência utilizados codões que evitem os codões raramente encontrados nos genomas vegetais. A sequência de DNA seleccionada é varrida para identificar regiões com mais de quatro nucleótidos consecutivos de adenina (A) ou timina (T) . As regiões A+T são varridas relativamente a potenciais sinais de poliadenilação vegetais. Se bem que a ausência de cinco ou mais nucleótidos consecutivos A ou T elimine a maior parte dos sinais de poliadenilação, caso exista mais de um dos dos sinais de poliadenilação menor identificados num espaço de dez nucleótidos de distância então a sequência de nucleótidos desta região é de preferência alterada para remover estes sinais, mantendo ao mesmo tempo a sequência de aminoácidos original codificada. 161 ΡΕ1040192 0 segundo passo é considerar os cerca de 15 a cerca de 30 ou mais resíduos de nucleótidos na vizinhança da região rica em A+T identificada no passo um. Se o teor A+T da região envolvente for inferior a 80%, a região deverá ser examinada relativamente a sinais de poliade-nilação. A alteração da região baseada em sinais de poli-adenilação está dependente de (1) número dos sinais de poliadenilação presentes e (2) presença de um sinal de poliadenilação vegetal maior. A região prolongada é analisada relativamente à presença de sinais de poliadenilação vegetais. Os sinais de poliadenilação foram removidos por mutagénese dirigida da sequência de DNA. A região prolongada é igualmente avaliada relativamente a múltiplas cópias da sequência ATTTA que são igualmente removidas por mutagénese. É igualmente preferido que as regiões compreendendo muitas bases A+T ou G+C consecutivas sejam destruídas uma vez que se prevê que estas regiões possuam uma maior probabilidade de formar estruturas em gancho de cabelo devido a autocomplementaridade. Assim, a inserção de pares de bases heterogéneos poderá reduzir a probabilidade de formação de estruturas secundárias por autocomplementaridade que se sabe inibirem a transcrição e/ou tradução nalguns organismos. Na maior parte dos casos, os efeitos adversos podem ser minimizados usando sequências que não contenham mais de cinco A+T ou G+C. 162 ΡΕ1040192 4.11.5 Oligonucleótidos Sintéticos para Mmdtagénese

Quando se usa oligonucleótidos na mutagénese, pretende-se manter a seguência de aminoácidos na grelha de leitura adequada, sem introdução de locais de restrição comuns tais como BglII, HindIII, Saci, Kpnl, EcoRI, Ncol, PstI e Sall no gene modificado. Estes locais de restrição são encontrados em locais de inserção de poli-adaptadores de muitos vectores de clonagem. Certamente, a introdução de novos sinais de poliadenilação, sequências ATTTA ou segmentos consecutivos de mais de cinco A+T ou G+C, deverá ser evitada. 0 tamanho preferido dos oligonucleótidos é cerca de 40 a 50 bases, mas fragmentos variando entre cerca de 18 e cerca de 100 bases têm sido utilizados. Na maior parte dos casos, um mínimo de cerca de 5 a cerca de 8 pares de bases de homologia com o DNA matriz em ambos os extremos do fragmento sintetizado são mantidos para assegurar a hibridação adequada da sequência iniciadora com a matriz. Os oligonucleótidos deverão evitar sequências com mais de cinco pares de bases A+T ou G+C. Os codões usados na substituição dos codões selvagem deverão, de preferência, evitar o dubleto TA ou CG sempre que possível. Os codões são seleccionados de uma tabela de codões preferidos das plantas (como seja a Tabela 6 abaixo) de forma a evitar que sejam raramente encontrados nos genomas vegetais e deverão ser feitos esforços para seleccionar codões para se ajustarem ao teor G+C de aproximadamente 50%. ΡΕ1040192 163

Tabela 6

Utilização de Codões Preferida em Plantas

Aminoácido Codao Percentagem de utilização em plantas ARG CGA 7 CGC 11 CGG 5 CGU 25 AGA 29 AGG 23 LEU CUA 8 CUC 20 CUG 10 CUU 28 UUA 5 UUG 30 SER UCA 14 UCC 26 UCG 3 UCU 21 AGC 21 AGU 15 TRE ACA 21 ACC 41 ACG 7 ACU 31 ΡΕ1040192 164

Tabela 6 (Continuação)

Aminoácido Codão Percentagem de utilização em plantas PRO CCA 45 CCC 19 CCG 9 CCU 26 ALA GCA 23 GCC 32 GCG 3 GCU 41 GLI GGA 32 GGC 20 GGG 11 GGU 37 ILE AUA 12 AUC 45 AUU 43 VAL GUA 9 GUC 20 GUG 28 GUU 43 LIS AAA 36 AAG 64 ASN AAC 72 AAU 28 GLN CAA 64 CAG 36 165 ΡΕ1040192

Tabela 6 (Continuação)

Aminoácido Codão Percentagem de utilização em plantas HIS CAC 65 CAU 35 GLU GAA 48 GAG 52 ASP GAC 48 GAU 52 TIR UAC 68 UAU 32 CIS UGC 78 UGU 22 FEN UUC 56 UUU 44 MET AUG 100 TRP UGG 100

Prevê-se que as regiões com muitas bases A+T ou G+C consecutivas possuam uma maior probablidade de formar estruturas em gancho de cabelo devido a autocomple-mentaridade. A disrupção destas regiões através da inserção de pares de bases heterogéneas é preferida e deverá reduzir a probabilidade da formação de estruturas secundárias autocomplementares tais como ganchos de cabelo que são conhecidas nalguns organismos como inibindo a transcrição (terminadores da transcrição) e tradução (atenuadores). 166 ΡΕ1040192

Como alternativa, pode ser preparado um gene totalmente sintético para uma determinada sequência de aminoácidos sendo evitadas regiões de cinco ou mais nucle-ótidos A+T ou G+C consecutivos. São seleccionados, sempre que possível, codões evitando os dubletos TA e CG nos codões. A utilização de codões pode ser normalizada face a uma tabela de utilização de codões preferidos de plantas (como seja a Tabela 6) e o teor G+C de preferência é ajustado a cerca de 50%. A sequência resultante deverá ser analisada para assegurar que existe o mínimo possível de sinais de poliadenilação vegetais putativos e sequências ATTTA. Os locais de restrição normalmente encontrados nos vectores de clonagem deverão ser preferencialmente evitados. No entanto, a colocação de vários locais de restrição únicos ao longo do gene é útil para a análise da expressão de genes ou construção de variantes dos genes. 4.11.6 Construções de Genes "Plantizados" A expressão de um gene vegetal que exista na forma de DNA de cadeia dupla envolve a transcrição de RNA mensageiro (mRNA) a partir de uma cadeia do DNA pela enzima RNA polimerase e o subsequente processamento do transcrito primário de mRNA dentro do núcleo. Este processamento envolve uma região não traduzida 3' que adiciona nucleó-tidos poliadenilados ao extremo 3' do RNA. A transcrição de DNA em mRNA é regulada por uma região de DNA geralmente referida como "promotor". A região do promotor contem uma sequência de bases que sinaliza a RNA polimerase para se 167 ΡΕ1040192 associar ao DNA e iniciar a transcrição de mRNA usando uma das cadeias de DNA como matriz para produzir uma cadeia correspondente de RNA.

Uma série de promotores que são activos em células vegetais têm sido descritos na literatura. Estes incluem os promotores da nopalina sintetase (NOS) e octo-pina sintetase (OCS) (os quais existem em plasmídeos indutores de tumores de Agrobacterium tumefaciens), os promotores 19S e 35S do virus do mosaico da couve-flor (CaMV), o promotor induzido pela luz da subunidade pequena da ribulose bi-fosfato carboxilase (ssRUBISCO, um polipeptideo vegetal muito abundante) e o promotor da manopina sintetase (MAS) (Velten et al., 1984 e Velten and Schell, 1985). Todos estes promotores têm sido usados para criar vários tipos de construções de DNA, as quais têm sido expressas em plantas (ver, e.g., Pedido de Patente Internacional Publicação N° WO 84/02913).

Os promotores que causam a transcrição de RNA em células vegetais podem ser usados no presente invento. Tais promotores podem ser obtidos a partir de plantas ou de virus de plantas e incluem, mas não estão limitados ao promotor CaMV35S e a promotores isolados a partir de genes vegetais tais como genes ssRUBISCO. Conforme descrito abaixo, prefere-se que o promotor particular seleccionado seja capaz de causar expressão suficiente de forma a resultar na produção de uma quantidade eficaz de proteína. ΡΕ1040192

Os promotores usados nas construções de DNA (i.e. genes vegetais quiméricos) do presente invento podem ser modificados, caso se pretenda, para alterar as caracte-rísticas de controlo. Por exemplo, o promotor CaMV35S pode ser ligado à porção do gene ssRUBISCO que reprime expressão de ssRUBISCO na ausência de luz, para criar promotor que seja activo nas folhas mas não nas raízes. 0 promotor quimérico resultante pode ser usado como aqui descrito. Para fins desta descrição, o termo promotor "CaMV35S" inclui assim variações do promotor CaMV35S, e.g., promotores obtidos através da ligação a regiões do operador, mutagénese ao acaso ou controlada, etc. Ainda, os promotores podem ser alterados de forma a conterem múltiplas "sequências estimuladoras" para ajudar ao aumento da expressão génica. 0 RN A produzido por uma construção de DNA do presente invento também contem uma sequência líder 5' não traduzida. Esta sequência pode ser obtida a partir de uma promotor seleccionado de forma a expressar o gene e pode ser especificamente modificada de forma a aumentar a tradução do mRNA. As regiões não traduzidas 5' podem ser igualmente obtidas a partir do RNA virai, a partir de genes eucarióticos adequados ou a partir de uma sequência de gene sintético. 0 presente invento não está limitado a construções como as apresentadas nos exemplos que se seguem. Assim, a sequência líder não traduzida pode ser parte do extremo 5' da região não traduzida da sequência codificadora da proteína da cápside virai ou parte da 169 ΡΕ1040192 sequência do promotor, ou pode derivar de um promotor ou sequência codificadora não relacionada. Em qualquer dos casos, prefere-se que a sequência flanqueante do local de iniciação esteja de acordo com as reqras de sequências de consenso da tradução descritas por Kozak (1984) para uma maior eficácia de iniciação da tradução.

As construções de DNA cry do presente invento podem também conter uma ou mais sequências codificadoras estruturais totalmente sintéticas que foram alteradas para estimular o desempenho do gene cry em plantas. Os genes estruturais do presente invento podem facultativamente codificar uma proteína de fusão compreendendo um peptídeo amino-terminal de trânsito para o cloroplasto ou sequência sinal secretória. A construção de DNA também contem uma região não traduzida 3'. A região 3' não traduzida contem um sinal de poliadenilação que funciona em plantas para causar a adição de nucleótidos de poliadenilato ao extremo 3' do RNA virai. São exemplos de regiões 3' adequadas (1) as regiões transcritas 3' não traduzidas contendo o sinal de poliadenilação dos genes do plasmídeo indutor de tumores (Ti) de Agrobacterium, tais como o gene da nopalina sintetase (NOS) e (2) gene vegetais, como sejam genes da proteína de armazenamento da soja (7 S) e a subunidade pequena do gene RuBP carboxilase (E9). 170 ΡΕ1040192 4.12 Métodos para a Produção de Plantas Transgénicas Resistentes a Insectos

Através da transformação de uma célula hospedeira adequada, como seja uma célula vegetal, com um segmento contendo o gene cry* recombinante, a expressão da proteína do cristal codificada (i.e., uma proteína do cristal bacteriana ou polipeptídeo tendo actividade insecticida contra coleópteros) pode resultar na formação de plantas resistentes a insectos.

Como exemplo, pode-se utilizar um vector de expressão contendo uma região codificadora de uma proteína do cristal de B. thuringiensis e uma marca seleccionável adequada para transformar uma suspensão de células vegetais embrionárias, como sejam células de trigo ou milho, usando um método como seja o bombardeamento de partículas (Maddock et ai., 1991; Vasil et ai., 1992) para introduzir nas células recipientes o DNA que reveste microprojécteis. As plantas transgénicas são então regeneradas a partir de calos embrionários transformados que expressam as proteínas insecticidas. A formação de plantas transgénicas pode também ser conseguida usando outros métodos de transformação celular que são conhecidos na técnica, como seja transferência de DNA mediada por Agrobacterium (Fraley et al., 1983) . Como alternativa, o DNA pode ser introduzido em plantas por transferência de DNA directa em pólen (Zhou et 171 ΡΕ1040192 al., 1983; Hess, 1987; Luo et al., 1988), por injecção do DNA em órgãos reprodutores de uma planta (Pena et al., 1987) ou por injecção directa do DNA nas células de embriões imaturos seguido de re-hidratação dos embriões desidratados (Neuhaus et al. , 1987; Benbrook et al., 1986). A regeneração, desenvolvimento e cultura de plantas a partir de transformantes isolados de protoplastos vegetais ou a partir de vários explantes transformados são conhecidos na técnica (Weissbach and Weissbach, 1988) . Este processo de regeneração e crescimento tipicamente inclui os passos de selecção das células transformadas, cultura das células individualizadas através das fases usuais do desenvolvimento embrionário, através da fase de plântula com raiz. Os embriões e sementes transgénicos são regenerados de forma semelhante. Os rebentos transgénicos com raiz resultantes são depois plantados num meio de crescimento de plantas adequado, como seja o solo. 0 desenvolvimento ou regeneração de plantas contendo o gene exógeno estranho que codifica um polipeptídeo com interesse introduzido por Agrobacterium em explantes de folhas pode ser conseguido pelos métodos conhecidos na técnica e como descritos (Horsch et al., 1985). Neste processo, os transformantes são cultivados na presença de um agente de selecção e num meio que induza a regeneração de rebentos na estirpe vegetal a ser transformada como descrito (Fraley et al., 1983). 172 ΡΕ1040192

Este procedimento tipicamente produz rebentos dentro de dois a quatro meses e esses rebentos são então transferidos para um meio indutor de raízes adequado contendo o agente selectivo e um antibiótico para evitar o crescimento bacteriano. Os rebentos que enraizarem na presença do agente selectivo para formar plântulas são então transplantados para o solo ou outros meios para permitir a produção de raízes. Estes processo varia dependendo da estirpe vegetal particular empregue, tais variações sendo conhecidas na técnica.

De preferência, as plantas regeneradas são auto-polinizadas para proporcionar plantas transgénicas homozi-góticas, como discutido anteriormente. Como alternativa, pólen obtido a partir de plantas regeneradas é cruzado com plantas crescidas a partir de sementes de linhas importantes em termos agronómicos e, de preferência, singe-neicas. Pelo contrário, pólen de plantas dessas linhas importantes é usado para polinizar plantas regeneradas. Uma planta transgénica do presente invento contendo um poli-peptídeo pretendido é cultivada usando métodos bem conhecidos dos familiarizados com a técnica.

Tais plantas podem formar células germinais e transmitir uma ou mais características transformadas para as plantas da progénie. Igualmente, as plantas transgénicas podem ser crescidas de forma normal e cruzadas com plantas que possuem os mesmos factores hereditários transformados ou outros factores hereditários. Os indivíduos híbridos 173 ΡΕ1040192 resultantes possuem as propriedades fenotípicas correspondentes. Uma planta transgénica deste invento tem assim uma maior quantidade de uma região codificadora (e.g., um gene cry alterado) que codifica o polipeptídeo Cry mutado com interesse. Uma planta transgénica preferida é um segregante independente e pode transmitir aquele gene e a sua acti-vidade à sua progénie. Uma planta transgénica mais preferida é homozigótica para aquele gene e transmite o gene a toda a descendência na reprodução sexuada.

As sementes de uma planta transgénicas podem ser semeadas no campo ou numa estufa e as plantas transgénicas sexualmente maduras resultantes são auto-polinizadas para gerar plantas homozigóticas. A progénie derivada destas plantas tornam-se linhas homozigóticas que, por exemplo, são avaliadas relativamente a uma maior capacidade insec-ticida contra insectos coleópteros, de preferência no campo, numa série de condições ambientais. Os inventores consideram que o presente invento encontrará utilidade particularmente na criação de plantas transgénicas de interesse comercial incluindo várias forragens, cereais, fibras, tubérculos,legumes, plantas ornamentais, cactos, suculentas, frutos, bagas e vegetais, assim como uma série de árvores e plantas de nozes e frutos. 4.13 Métodos para a Produção de Variantes Combinatórias Cry3*

Mutantes de proteínas do cristal contendo substituições num ou mais domínios podem ser construídos via uma 174 ΡΕ1040192 série de técnicas. Por exemplo, sequências de genes estreitamente relacionados podem ser facilmente combinadas usando a técnica baseada em PCR™ descrita por Stemmer (1994). Como alternativa, se estiverem disponíveis locais de restrição adequados, as mutações de um gene cry podem ser combinadas com as mutações de um segundo gene cry através de metodologias de suclonagem de rotina. Se não houver disponível um local de restrição, pode-se gerar um por mutagénese dirigida com oligonucleótidos usando qualquer um de uma série de processos conhecidos dos familiarizados com a matéria. Como alternativa, o PCR™ com extensão sobre-ponível aos locais de "splicing"(Horton et al., 1989) pode ser usado para combinar mutações em diferentes regiões de uma proteína do cristal. Neste processo, fragmentos de DNA sobreponíveis gerados por PCR™ e contendo diferentes mutações dentro das suas sequências únicas podem ser emparelhados e usados como matriz para a amplificação usando sequências iniciadoras flanqueantes para gerar uma sequência híbrida do gene. Finalmente, os mutantes cry* podem ser combinados usando simplesmente um mutante cry como matriz para a mutagénese dirigida com oligonucleótidos usando qualquer um de uma série de protocolos, tais como os aqui descritos. 4.14 Isolamento de Genes Homólogos e de Fragmentos de Genes

Os genes de δ-endotoxinas de acordo com o presente invento incluem não só as sequências de tamanho completo aqui descritas como também fragmentos destas sequên- 175 ΡΕ1040192 cias, ou proteínas de fusão, as quais retêm a actividade insecticida característica das sequências aqui especifi-camente exemplificadas.

Deverá ser óbvio para os familiarizados com a matéria que as δ-endotoxinas insecticidas podem ser identificadas e obtidas através de vários meios. Os genes específicos, ou porções dos mesmos, podem ser obtidos a partir de uma depositário de culturas ou construídos sinteticamente, por exemplo, usando um sintetizador de DNA. As variações destes genes podem ser facilmente construídas usando técnicas convencionais para obtenção de mutações pontuais. Igualmente, fragmentos destes genes podem ser preparados usando exonucleases ou endonucleases de acordo com processos convencionais. Por exemplo, enzimas tais como .Ba 131 ou mutagénese dirigida podem ser usadas para sistematicamente cortar nucleótidos dos extremos destes genes. Igualmente, genes que codificam fragmentos activos podem ser obtidos usando uma variedade de outras enzimas de restrição. As proteases podem ser usadas directamente para se obter fragmentos activos destas δ-endotoxinas. δ-Endotoxinas equivalentes e/ou genes codificadores destas δ-endotoxinas equivalentes podem ser igualmente isolados a partir de estirpes de Bacillus e/ou bibliotecas de DNA usando os ensinamentos aqui proporcionados. Por exemplo, anticorpos contra as δ-endotoxinas aqui descritas e reivindicadas podem ser usados para identificar e isolar outras δ-endotoxinas a partir de uma 176 ΡΕ1040192 mistura de proteínas. Especificamente, podem ser induzidos anticorpos contra porções das δ-endotoxinas que são mais constantes e mais distintas relativamente a outras δ-endotoxinas de B. thuringiensis. Estes anticorpos podem então ser usados para identificar especificamente δ-endotoxinas equivalentes com a actividade insecticida característica por imunoprecipitação, imunoensaio com ligação a enzimas (ELISA) ou transferência Western.

Um outro método para a identificação das δ-endotoxinas e genes do presente invento é através da utilização de sondas oligonucleotídicas. Estas sondas são sequências nucleotídicas tendo uma marca detectável. Como é conhecido na técnica, se a molécula sonda e a amostra de ácido nucleico hibridarem formando uma ligação forte entre as duas moléculas, pode-se assumir que a sonda e a amostra são essencialmente idênticas. A marca detectável da sonda proporciona um meio para determinar, de forma conhecida, se a hibridação ocorreu. Tal análise com sondas proporciona um método rápido para a identificação de genes de δ-endotoxinas formicidas do presente invento.

As sequências nucleotídicas que são usadas como sondas de acordo com o invento podem ser sintetizadas através da utilização de um sintetizador de DNA usando processos convencionais. Na utilização dos segmentos nucleotídicos como sondas, a sonda particular é marcada com qualquer marca adequada conhecida dos familiarizados com a matéria, incluindo marcas radioactivas e não radioactivas. 177 ΡΕ1040192

Marcas radioactivas típicas incluem 32P, 125I, 35S ou similares. Uma sonda marcada com um isótopo radioactivo pode ser construída a partir de uma sequência nucleotídica complementar da amostra de DNA por uma reacção de translação de corte ("nick translation") convencional usando DNase e DNA polimerase. A sonda e a amostra podem ser então combinadas numa solução tampão de hibridação e mantidas a uma temperatura adequada até ocorrer empare-lhamento. Em seguida a membrana é lavada para remoção de materiais estranhos, sendo a amostra e as moléculas de sonda ligadas tipicamente detectadas e quantificadas por auto-radiografia e/ou contagem de cintilação líquida.

As marcas não radioactivas incluem, por exemplo, ligandos tais como biotina ou tiroxina, assim como enzimas tais como hidrolases ou peroxidases, ou os vários quimi-oluminescentes tais como luciferina ou compostos fluorescentes tipo fluoresceína e seus derivados. A sonda pode ser marcada em ambos os extremos com diferentes tipos de marcas para facilitar a separação, como, por exemplo, usando uma marca isotópica num extremo e uma marca de biotina no outro extremo. A formação e estabilidade de duplexes depende de complementaridade substancial entre as duas cadeias de um híbrido e, como referido atrás, um certo grau de desempa-relhamento pode ser tolerado. Assim, as sondas do presente invento incluem mutações (simples e múltiplas), deleções, inserções das sequências descritas, e suas combinações, em 178 ΡΕ1040192 que as referidas mutações, inserções e deleções permitem a formação de híbridos estáveis com o polinucleótido alvo com interesse. Mutações, inserções e deleções podem ser produzidas numa determinada sequência polinucleotídica de muitas formas, por métodos normalmente conhecidos dos familiarizados com a matéria, e talvez por outros métodos que se tornaram conhecidos na literatura.

Potenciais variações nas sondas descritas atrás são devidas, em parte, à redundância do código genético. Devido à redundância do código genético, i.e., mais de um tripleto de nucleótidos codificador (codão) pode ser usado para a maior parte dos aminoácidos usados para produzir proteínas. Assim, diferentes sequências de nucleótidos podem codificar o mesmo aminoácido particular. Portanto, as sequências de aminoácidos das δ-endotoxinas e peptídeos de B. thuringiensis podem ser preparadas com sequências nucleotídicas equivalentes codificadoras da mesma sequência de aminoácidos da proteína ou peptídeo. Assim, o presente invento inclui tais sequências nucleotídicas equivalentes. Igualmente, sequências inversas ou complementares são um aspecto do presente invento e podem ser facilmente usadas pelos familiarizados com a matéria. Ainda, foi demonstrado que as proteínas da estrutura e função identificadas podem ser construídas alterando a sequência de aminoácidos, se tais alterações não alterarem a estrutura secundária da proteína (Kaiser and Kzdy, 1984). Assim, o presente invento inclui mutantes da sequência de aminoácidos aqui descrita que não altera a estrutura secundária da proteína, ou se a 179 ΡΕ1040192 estrutura for alterada, a actividade biológica é substancialmente mantida. Ainda, o invento também inclui mutantes de organismos portadores da totalidade ou parte de um gene codificador das δ-endotoxinas do invento. Tais mutantes podem ser preparados por técnicas bem conhecidas dos familiarizados com a matéria. Por exemplo, a irradiação com UV pode ser usada para preparar mutantes de organismos hospedeiros. Igualmente, tais mutantes podem incluir células asporogéneas que podem também ser preparadas por processos bem conhecidos na técnica. 4.15 Ribozimas

As ribozimas são moléculas de RNA enzimáticas que clivam as espécies de mRNA. Em determinadas realizações, os inventores consideram a selecção e utilização de ribozimas capazes de clivar os segmentos de RNA do presente invento e a sua utilização para reduzir a actividade dos mRNAs alvo em tipos particulares de células ou tecidos.

Actualmente são conhecidas seis variedades básicas de RNAs enzimáticos naturais. Cada uma delas catalisa a hidrólise de ligações fosfodiéster do RNA in trans (e assim pode clivar outras moléculas de RNA) em condições fisiológicas. Em geral, os ácidos nucleicos enzimáticos actuam ligando-se primeiro a um RNA alvo. Tal ligação ocorre através da porção de ligação ao alvo de um ácido nucleico enzimático, o qual é mantido em estreita proximidade com uma porção enzimática da molécula que actua 180 ΡΕ1040192 de forma a clivar o RNA alvo. Assim, o ácido nucleico enzi-mático reconhece primeiro e depois liga-se a um RNA alvo através de extenso emparelhamento de bases e uma vez ligado ao local correcto, actua enzimaticamente de forma a cortar o RNA alvo. A clivagem estratégica de tal RNA alvo destruirá a sua capacidade para dirigir a síntese de uma proteína codificada. Após um ácido nucleico enzimático se ter ligado e clivado o seu RNA alvo, é libertado do RNA para procurar um outro alvo e pode repetidamente ligar-se e clivar novos alvos. A natureza enzimática de uma ribozima é vantajoso relativamente a muitas tecnologias, como seja a tecnologia "antisense" (em que uma molécula de ácido nucleico simplesmente se liga a um alvo de ácido nucleico para bloquear a sua tradução) uma vez que a concentração de ribozima necessária para afectar um tratamento terapêutico é inferior ao de um oligonucleótido "antisense". Esta vantagem reflecte a capacidade da ribozima actuar enzimaticamente. Assim, uma única molécula de ribozima é capz de clivar muitas moléculas de RNA alvo. Ainda, a ribozima é um inibidor altamente específico, com a especificidade de inibição dependendo não só do mecanismo de emparelhamento de bases da ligação ao RNA alvo, mas também do mecanismo de clivagem do RNA alvo. Os desemparelhamentos isolados ou substituições de bases, perto do local de clivagem podem eliminar completamente a actividade catalítica de uma ribozima. Desemparelhamentos semelhantes em moléculas "antisense" não inibem a sua acção (Woolf et al., 1992). Assim, a especifi- 181 ΡΕ1040192 cidade de acção de uma ribozima é superior à da ligação de uma oligonucleótido "antisense" que se liga ao mesmo local do RNA. A molécula de ácido nucleico enzimático pode ter a forma de uma cabeça de martelo, gancho de cabelo, vírus da hepatite δ, grupo I de intrões ou RNA de RnaseP (em associação com uma sequência guia de RNA) ou motivo de RNA VS de Neurospora. Exemplos de motivos em cabeça de martelo estão descritas por Rossi et ai., (1992); exemplos de motivos em gancho de cabelo estão descritos por Hampel et ai., (Patente Europeia EP 0360257), Hampel and Triz (1989), Hampel et ai., (1990) and Cech et ai., (Patente U.S. 5631359; um exemplo do motivo do vírus da hepatite δ está descrito por Perrotta and Been (1992); um exemplo do motivo RnaseP está descrito por Guerrier-Takada et ai., (1983); o motivo de ribozima de RNA VS de Neurospora está descrito por Collins (Saville and Collins, 1990; Saville and Collins, 1991; Collins and Olive, 1993); e um exemplo do intrão do Grupo I está descrito por Cech et ai., (Patente U.S. 4987071) . Tudo o que é importante numa molécula de ácido nucleico enzimático deste invento é que tenha um local específico de ligação ao substrato que é complementar de uma ou mais das regiões de RNA do gene alvo e que possua sequências nucleotídicas dentro ou na vizinhança do local de ligação ao substrato que confere à molécula uma actividade de clivagem ao RNA. Assim, as construções de ribozima não necessitam de ser limitadas aos motivos específicos aqui referidos. 182 ΡΕ1040192 0 invento proporciona um método para a produção de uma classe de agentes de clivagem enzimática que apresenta um elevado grau de especificidade do RNA de um alvo pretendido. A molécula de ácido nucleico enzimática é, de preferência, dirigida contra uma região altamente conservada da sequência de um mRNA alvo, de forma que o tratamento especifico de uma doença ou condição pode ser proporcionada por um ou mais ácidos nucleicos enzimáticos. Tais moléculas de ácido nucleico enzimáticas podem ser introduzidas exogenamente em células especificas conforme necessário. Como alternativa, as ribozimas podem ser expressas a partir de vectores de DNA ou RNA que são introduzidos em células especificas.

Pequenos motivos de ácido nucleico enzimático (e.g., da estrutura em cabeça de martelo ou em gancho de

cabelo) podem ser usados para introdução exógena. A

estrutura simples destas moléculas aumenta a capacidade do ácido nucleico enzimático para invadir regiões alvo da estrutura do mRNA. Como alternativa, as moléculas de RNA catalíticas podem ser expressas em células a partir de promotores eucarióticos (e.g., Scanlon et ai., 1991; Kashani-Sabet et ai., 1992; Dropulic et ai., 1992; Weerasinghe et ai., 1991; 0jwang et al.t 1992; Chen et al., 1992; Sarver et ai., 1990). Os familiarizados com a matéria compreenderão que qualquer ribozima pode ser expressa em células eucarióticas a partir de um vector de DNA adequado. A actividade de tais ribozimas pode ser aumentada através 183 ΡΕ1040192 da sua libertação do transcrito primário por uma segunda ribozima (Draper et ai., Pedido de Patente Internacional Publ. N° WO 93/23569 e Sullivan et al., Pedido de Patente Internacional Publicação N° WO 94/02595; Ohkawa et al., 1992; Taira et al., 1991; Ventura et al., 1993).

As ribozimas podem ser adicionadas directamente ou podem ser complexadas com lípidos catiónicos, lipidos complexos, encapsidadas dentro de lipossomas ou de outra forma introduzidas nas células alvo. O RNA ou complexos de RNA podem ser localmente administrados a tecidos importantes ex vivo ou In vivo através da injecção, inalação de aerossol, bomba de infusão ou tubos perfurados ("stents"), com ou sem a sua incorporação em biopolímeros.

Podem ser projectadas ribozimas como descrito em Draper et ai. (Pedido de Patente Internacional Publicação N° WO 93/23569) ou Sullivan et ai., (Pedido de Patente Internacional Publicação N° WO 94/02595) e sintetizadas para serem testadas in vitro e in vivo, como descrito. Tais ribozimas podem ser igualmente optimizadas para administração. Se bem que sejam proporcionados exemplos específicos, os familiarizados com a matéria reconhecerão que alvos de RNA equivalentes noutras espécies podem ser utilizados quando necessário.

As ribozimas em cabeça de martelo ou em gancho de cabelo podem ser individualmente analisadas por enrolamento conseguido com ferramentas informáticas (Jaeger et al., 184 ΡΕ1040192 1989) para avaliar se as sequências da ribozima adquirem a estrutura secundária adequada. As ribozimas com interacções intramoleculares desfavoráveis entre os braços de ligação e o centro catalítico não são consideradas. Podem ser escolhidos vários comprimentos do braços de ligação para optimizar a actividade. De um modo geral, pelo menos 5 bases em cada braço são capazes de se ligar ao RNA alvo ou de outra forma interagir com ele.

As ribozimas do motivo em cabeça de martelo ou em gancho de cabelo podem ser projectadas para emparelhar em vários locais no mRNA mensageiro e podem ser sintetizadas quimicamente. 0 método de síntese usado é de acordo com o procedimento normal de síntese de RNA como descrito em Usman et al. (1987) e em Scaringe et al., (1990) e utiliza grupos de protecção e acoplagem de ácidos nucleicos comuns, como sejam dimetoxitritilo no extremo 5' e fosforamidetos no extremo 3'. Os rendimentos médios do passo de acoplagem são tipicamente >98%. As ribozimas em gancho de cabelo podem ser sintetizadas em duas partes e emparelhadas para reconstruir uma ribozima activa (Chowrira and Burke, 1992). As ribozimas podem ser extensivamente modificadas para aumentar a estabilidade através de modificação com grupos resistentes a nucleases, por exemplo, 2'-amino, 2'-C-alilo, 2'-fluoro, 2'-o-metil, 2'-H (para uma revisão ver Usman and Cdergren, 1992). As ribozimas podem ainda ser purificadas por electroforese em gel usando métodos gerais ou por cromatografia líquida de alta resolução e ressuspensas em agua. 185 ΡΕ1040192 A actividade de ribozima pode ser optimizada através da alteração do comprimento dos braços de ligação da ribozima ou sintetizando quimicamente as ribozimas com modificações que inibem a sua degradação por ribonucleases séricas (ver, e.g., Pedido de Patente Internacional Publicação N° WO 92/07065; Perrault et al. , 1990; Pieken et al., 1991; Usman and Cedergren, 1992; Pedido de Patente Internacional Publicação N° WO 93/15187; Pedido de Patente Internacional Publicação N° WO 91/03162; Pedido de Patente Internacional Publicação N° WO 92110298.4; Pedido de Patente U.S. 5334711; e Pedido de Patente Internacional Publicação N° WO 94/13688, que descreve várias modificações quimicas que podem ser efectuadas aos grupos de açúcar das moléculas de RNA enzimáticas), modificações que aumentam a sua eficácia nas células, e remoção das bases do "pé" para encurtar o tempo de síntese de RNA e reduzir os requisitos químicos.

Sullivan et al., (Pedido de Patente Internacional Publicação N° WO94/02595) descreve os métodos gerais para a libertação de moléculas de RNA enzimáticas. As ribozimas podem ser administradas a células através de uma variedade de métodos conhecidos dos familiarizados com a matéria, incluindo, mas não estando restringido a encapsulação em lipossomas, por iontoforese, ou por incorporação noutros veículos, tais como hidrogéis, ciclodextrinas, nanocápsulas biodegradáveis e microsferas bioadesivas. Para algumas indicações, as ribozimas podem ser directamente libertadas 186 ΡΕ1040192 ex vivo às células ou tecidos com ou sem os referidos veículos. Como alternativa, a combinação RNA/veículo pode ser localmente libertada por inalação directa, por injecção di-recta ou usando um catéter, bomba de infusão ou tubos perfurados. Outras vias de libertação incluem, mas não estão limitadas a injecção intravascular, intramuscular, subcutânea ou articular, inalação de aerossóis, administração oral (forma de comprimido ou pílula), tópica, sistémica, ocular, intraperitoneal e/ou intratecal. Descrições mais detalhadas de libertação e administração de ribozimas são proporcionadas em Sullivan et al., (Pedido de Patente Internacional Publicação N° WO 94/02595) e Draper et al., (Pedido de Patente Internacional Publicação N° WO 93/23569).

Um outro meio de acumular elevadas concentrações de uma ou mais ribozimas dentro das células é incorporar as sequências codificadoras de ribozima num vector de expressão de DNA. A transcrição das sequências de ribozima é dirigida a partir de um promotor eucariótico da RNA polimerase I (poli), RNA polimerase II (pol II) ou RNA polimerase III (pol III). Os transcritos dos promotores pol II ou pol III serão expressos em níveis elevados em todas as células; os níveis de um determinado promotor pol II num determinado tipo celular dependerá da natureza das sequências reguladoras génicas (estimuladores, silenciadores, etc.) presentes na vizinhança. Os promotores de RNA polimerases procarióticas podem também ser usados, desde que a enzima seja expressa nas células adequadas (Elroy-Stein and Moss, 1990; Gao and Huang, 1993; Lieber et al., 187 ΡΕ1040192 1993; Zhou et al., 1990) . As ribozimas expressas a partir de tais promotores podem funcionar em células de mamífero (e.g. Kashani-Saber et al., 1992; Ojwang et al., 1992; Chen et al., 1992; Yu et al., 1993; L'Huillier et al., 1992; Lisziewicz et al., 1993). Tais unidades de transcrição podem ser incorporadas numa variedade de vectores para introdução em células de mamífero, incluindo mas não estando restringido a vectores plasmídicos de DNA, vectores de DNA virai (tais como adenovírus ou vectores adeno-associados) ou vectores de RNA virai (tais como retrovírus, vírus da floresta de Semliki, vectores de vírus Sindbis).

As ribozimas deste invento podem ser usadas como ferramentas de diagnóstico para avaliar a deriva genética e mutações nas linhas celulares ou tipos celulares. Elas podem ser igualmente usadas para avaliar os níveis da molécula de RNA alvo. A estreita relação entre a actividade de ribozima e a estrutura do RNA alvo permite a detecção de mutações em qualquer região da molécula que altere o emparelhamento de bases e a estrutura tridimensional do RNA alvo. Usando as múltiplas ribozimas descritas neste invento, pode-se mapear as alterações de nucleótidos que são importantes para a estrutura de RNA e função in vitro, assim como em células e tecidos. A clivagem de RNAs alvo com ribozimas pode ser usada para inibir a expressão de genes e definir o papel (essencialmente) dos produtos de genes especificados em células ou tipos de células particulares. ΡΕ1040192 5.0 Exemplos

Os exemplos que se seguem são incluídos para demonstrar realizações preferidas do invento. Deverá ser apreciado pelos familiarizados com a matéria que as técnicas descritas nos exemplos que se seguem representam técnicas descobertas pelo inventor como funcionando bem na execução do invento, e portanto poderão ser consideradas como constituindo modos preferidos da sua realização. 5.1 Exemplo 1 — Estrutura Tridimensional de Cry3Bb A estrutura tridimensional de Cry3Bb foi determinada por cristalografia de raios X. A cristalização de Cry3Bb e a colheita dos dados de difracção de raios X foram realizados como descrito por Cody et al., (1992) . A estrutura do cristal de Cry3Bb foi refinada para um factor R residual de 18,0% usando os dados colhidos numa resolução de 2,4 Ã. Os cristais pertencem ao grupo espaçador C222i com as dimensões de unidades celulares a = 122,44, b = 131,81 e c = 105,37 Ã e contêm uma molécula na unidade assimétrica. As coordenadas atómicas para Cry3Bb estão descritas no Exemplo 31 e apresentadas na Secção 9. A estrutura de Cry3Bb é semelhante à de Cry3A (Li et al., 1991) . Consiste em 5825 átomos da proteína derivados de 588 resíduos (aminoácidos 64-652) formando três domínios discretos (FIG. 1) . Um total de 251 moléculas de 189 ΡΕ1040192 água foram identificadas na estrutura de Cry3Bb (FIG.2). O domínio 1 (resíduos 64-294) é um feixe de sete hélices formado por seis hélices enroladas à volta de uma hélice central, a5 (FIG.3). Os aminoácidos formadores de cada hélice estão apresentados na FIG.4. 0 domínio 2 (resíduos 295-502) possui três folhas β antiparalelas (FIG. 5A e FIG. 5B) . As folhas 1 e 2, cada uma composta por 4 cadeias β, formam o motivo distinto "chave grega". A superfíce externa da folha 3, composta por 3 cadeias β, faz contacto com a hélice a7 do domínio 1. A FIG. 6 apresenta os aminoácidos constituintes de cada uma das cadeias β no domínio 2. Uma hélice α pequena, a8 que se segue à cadeia βΐ, está também incluído no domínio 2. 0 domínio 3 (resíduos 503-652) tem uma topologia de barril β em forma de chave grega ("jelly roll") que tem um núcleo hidrofóbico e está quase paralelo ao eixo a e perpendicular ao eixo c da malha (FIG. 7A e FIG. 7B). Os aminoácidos constituintes de cada cadeia β do domínio 3 estão apresentados na FIG. 8.

Os monómeros de Cry3Bb no cristal formam uma estrutura quaternária dimérica ao longo de um eixo binário paralelo ao eixo a (FIG. 9A e FIG. 9B). A hélice a6 situa-se numa fenda formada pela interface do domínio 1 e domínios 1 e 3 da molécula de simetria com a qual está relacionada. Existem numerosos contactos estreitos de ligações de hidrogénio ao longo desta superfície, confirmando a estabilidade estrutural do dímero. 190 ΡΕ1040192 5.2 Exemplo 2 - Preparação de Cry3Bb.60 B. thuringiensis EG7231 foi cultivada até à esporulação em meio C2 com selecção por cloranfenicol (Cml). Os sólidos desta cultura foram recuperadas por centrifugação e lavados com água. A toxina foi purificada por recristalização a partir de NaBr 4,0 M (Cody et al., 1992). A Cry3Bb purificada foi solubilizada em 10 ml de KOH 50mM/100 mg de Cry3Bb e tamponado para pH 9,0 com CAPS 100 mM (pH 9,0). A toxina solúvel foi tratada com tripsina numa proporção de 50 mg de toxina para 1 mg de tripsina. Após 20 min de digestão com tripsina, a proteína predominante visualizada por electrforese em gel de SDS-poliacrilamida (SDS-PAGE) tinha 60 KDa. Não se observou subsequente digestão da toxina de 60 KDa. FIG. 4 ilustra Cry3Bb e Cry3Bb.60 coradas por Coomassie após SDS-PAGE. 5.3 Exemplo 3 — Purificação e Sequenciação de Cry3Bb.60

Cry3Bb.60 foi electroforeticamente purificada por SDS-PAGE e electrotransferida para membrana Immobilon-P® (Millipore) por transferência semi-seca a 15V durante 30 min. A membrana foi então lavada duas vezes com água e corada com 0,025% de R-250, 40% de metanol. Para reduzir o fundo, a membrana foi descorada com 50% de metanol até as bandas de proteína coradas serem visíveis. A transferência foi então seca e a banda Cry3Bb.60 corada foi retirada da membrana. Esta banda foi mandada para o Tufts University Sequencing Laboratory (Boston, MA) para sequenciação N- 191 ΡΕ1040192 terminal. A sequência de aminoácidos N-terminal determinada experimentalmente está apresentada na Tabela 7 assim como a sequência de aminoácido conhecida começando no resíduo de aminoácido 160.

Tabela 7

Sequência de Aminoácidos do Extremo N de Cry3Bb.60 e Comparação com a

Sequência Conhecida de Cry3Bb

Sequência deduzida Sequência conhecida Residuo# S S 160 K K 161 R R 162 S S 163 Q Q 164 D D 165 R R 16 6 5.4 Exemplo 4 - Bioactividade de Cry3Bb.60

Cry3Bb foi preparado para bioensaio através da solubilização numa quantidade mínima de KH 50 mM, 10 ml por 100 mg de toxina e tamponado para pH 9,0 com CAPS 100 mM, pH 9,0. Cry3Bb.60 foi preparado como descrito no Exemplo 1. Ambas as preparações foram mantidas à temperatura ambiente 12 a 16 horas antes do bioensaio. Após sete dias a mortalidade da população foi detemrinada e analisada para determinar a concentração letal de cada toxina. Estes resultados estão descritos na Tabela 8. 192 ΡΕ1040192

Tabela δ

Bioactividade de Cry3Bb e Cry3Bb.60 Contra a Lagarta das Raízes do Milho do Sul (Diabiotica undecimpunctata) LC50 mg/alvéolo 95% C.I. Cry3Bb 24, 09 15-39 Cry3Bb.60 6, 72 5,25-8,4 5.5 Exemplo 5 - Formação de Canais Iónicos por Cry3Bb e CryB2.60

Cry3Bb.60 e Cry3Bb foram avaliadas quanto à sua capacidade para formar canais iónicos em bicamadas de lípidos planares. As bicamadas de fosfatidilcolina foram formadas em suportes de Teflon® sobre um buraco de 0,7 mm.

Uma solução de banho de 3,5 ml de KOH 100 mM, CaCl2 10 mM, CAPS 100 mM (pH 9,5) foi colocada de cada um dos lados da partição de Teflon®. A toxina foi adicionada a um lado da partição e uma voltagem de 60 mM foi imposta através da bicamada de fosfatidilcolina. Qualquer fuga de iões através da membrana foi amplificada e registada. Uma análise da frequência das condutâncias criadas por Cry3Bb ou Cry3Bb.60 está ilustrada na FIG. 5A e FIG. 5B. Cry3Bb.60 facilmente formou canais iónicos enquanto que Cry3Bb raramente formou canais. 5.6 Exemplo 6 — Formação de Oligómeros de Alto Peso Molecular

Moléculas individuais de Cry3Bb ou Cry3Bb.60 193 ΡΕ1040192 formam um complexo com uma outra molécula do mesmo tipo. A capacidade de Cry3Bb para formar um oligómero não é aparente de forma reprodutível. A formação do complexo não é repetidamente observada em condições não desnaturantes. Cry3Bb.60 formou uma quantidade significativamente superior de um complexo com um peso molecular mais elevado (> 120 KDa) com outras moléculas Cry3Bb.60. Os oligómeros de Cry3Bb são demonstrados pela intensidade do gel de SDS-poliacrilamida corado com Coomassie. A oligomerização é visualizada em SDS-PAGE quando não se aquece as amostras antes da aplicação no gel para reter alguma toxina não desnaturante. Estes dados sugerem que Cry3Bb.60 mais facilmente forma o complexo de ordem superior do que Cry3Bb sozinho. A oligomerização é igualmente observada através do estudo da condutância produzida por estas moléculas e o aumento da condutância dependente do tempo. Esta alteração na condutância pode ser atribuída à oligomerização da toxina. 5.7 Exemplo 7 — Método de Projecção 1: Identificação e Alteração de Locais Sensíveis a Proteases e Processamento Proteolítico

Foi descrito na literatura que o tratamento da proteína toxina Cry3A com tripsina, uma enzima que cliva proteínas no lado carboxilo dos resíduos de lisina e arginina disponíveis, dá um produto de clivagem estável de 55 KDa a partir da proteína nativa de 67 KDa (Carrol et al., 1989). A sequenciação N-terminal do produto de 55 KDa mostrou que a clivagem ocorre no resíduo de aminoácido 194 ΡΕ1040192 R158. Encontrou-se que a proteína truncada Cry3A retem o mesmo nível de actividade insecticida da proteína nativa. A proteína toxina Cry3Bb foi também tratada com tripsina. Após digestão, o tamanho da proteína diminuiu de 68 KDa, o peso molecular da toxina Cry3Bb nativa, para 60 KDa. Não se observou qualquer outra digestão. A sequenciação N-terminal revelou o local de clivagem da tripsina da toxina truncada (Cry3Bb.60) como sendo o resíduo de aminoácido R159 em 1α3,4 de Cry3Bb. Inesperadamente, observou-se que a bioac-tividade da toxina Cry3Bb truncada aumentou.

Usando este método, a digestão com protease de uma proteína toxina de B. thuringiensis, foi identificado um local proteoliticamente sensível em Cry3Bb e uma forma mais activa da proteína (Cry3Bb.60) foi encontrada. Modificações deste local sensível à proteólise, através da introdução de um local de reconhecimento por proteases adicional, também resultou no isolamento de uma proteína biologicamente mais activa. É igualmente possível que a remoção de um ou mais locais de outros locais sensíveis a proteases pode melhorar a actividade. As regiões proteo-liticamente sensíveis, uma vez identificadas, podem se modificadas ou utilizadas para produzir toxinas biologicamente mais activas. 5.7.1 Cry3Bb. 60 0 tratamento da proteína toxina Cry3Bb solubi-lizada com tripsina resulta no isolamento de uma proteína 195 ΡΕ1040192 toxina Cry3Bb truncada, estável, com um peso molecular de 60 KDa (Cry3Bb.60). A sequenciação N-terminal de Cry3Bb.60 mostra o local sensível à tripsina como sendo R159 em lcx3,4 da toxina nativa. A digestão com tripsina resulta na remoção das hélices 1-3 a partir da Cry3Bb nativa mas igualmente aumenta a actividade da toxina contra larvas de SCRW em aproximadamente quatro vezes.

Cry3Bb.60 é uma toxina única com maior utilização insecticida relativamente a Cry3Bb parental. O aumento da actividade biológica, é apenas um parâmetro que distingue a nova toxina. Para além do tamanho reduzido, Cry3Bb.60 é igualmente uma proteína mais solúvel. Cry3Bb precipita da solução a pH 6,5 enquanto que Cry3Bb.60 permanece em solução desde pH 4,5 até pH 12. Cry3Bb.60 também forma canais iónicos com maior frequência do que Cry3Bb.

Cry3Bb.60 é produzida pela remoção proteolítica dos primeiros 159 reíduos de aminoácidos ou pela produção in vivo desta toxina, por bactérias ou plantas que expressem o gene Cry3Bb.60, ou seja o gene Cry3Bb sem os primeiros 483 nucleótidos.

Resumindo, Cry3Bb.60 é distinto de Cry3Bb de várias formas importantes: maior actividade insecticida; maior gama de solubilidade; maior capacidade; maior capacidade para formar canais; e menor dimensão. 196 ΡΕ1040192 5.7.2 EG11221 A mutagénese semi ao acaso da região 1α3,4 sensível à tripsina de cry3Bb resultou no isolamento de Cry3Bb.11221, uma determinada proteína Cry3Bb que apresenta um aumento superior a 6 vezes na actividade contra larvas SCRW comparativamente com a toxina selvagem. Cry3Bb.11221 tem alterações de 4 aminoácidos na região 1α3,4. Uma destas alterações, L158R, introduz um local adicional para tripsina adjacente a R159, o local proteoliticamente sensível usado para produzir Cry3Bb.60 (exemplo 4.1.). Cry3Bb.11221 é produzido por B. thuringiensis como uma proteína toxina de tamanho completo mas é presumivelmente digerido por proteases do tubo digestivo do insecto para o mesmo tamanho de Cry3Bb.60 (ver os resultados de Cry3A de Carroll et al., 1989). 0 local adicional de reconhecimeno por proteases pode tornar a região 1α3,4 ainda mais sensível à digestão, aumentando assim a actividade. 5.8 Exemplo 8 - Método de Projecção 2: Determinação e Manipulação da Água Ligada

Existem várias formas de as moléculas de água se associarem a uma proteína, incluindo a água de superfície que é facilmente removida e a água ligada que é mais difícil de extrair (Dunitz, 1994; Zhang and Matthews, 1994). A função da água ligada foi sujeita a extrapolação académica significativa, mas a função precisa tem pouca validação experimental. Alguma da água ligada ou estrutural mais 197 ΡΕ1040192 interessante é a água que participa na estrutura da proteína no interior da própria proteína. A ocupação de um local por uma molécula de água pode indicar uma bolsa estável dentro de uma proteína ou menor compactação criada por pontes de sal mediadas por água e ligações de hidrogénio a água. Isto pode reduzir o grau de ligação entre aminoácidos, possivelmente tornando a região mais flexível. Uma sequência de aminoácidos diferente à volta do mesmo local poderá resultar em melhor compactação, colapsando a bolsa à volta de aminoácidos polares ou carregados. Isto pode resultar em menor flexibilidade. Assim, o grau de hidratação de uma região de uma proteína pode determinar a flexibilidade ou mobilidade daquela região e a manipulação da hidratação pode alterar a flexibilidade. Métodos para aumentar a hidratação de uma região exposta a água incluem o aumento do número de resíduos hidrofóbicos ao longo da superfície. Está descrito na literatura que os resíduos hidrofóbicos expostos necessitam de significativamente mais água para hidratar do que os resíduos hidrofílicos (CRC Handbook of Chemistry and Physics, CRC Press, Inc.). No entanto, não está descrito que ao fazer-se isto, possam ser conseguidos aumentos da actividade biológica da proteína. A água estrutural não foi previamente identificada em δ-endotoxinas de B. thuringiensis, incluindo Cry3Bb. Ainda, não existem descrições da função desta água estrutural nas δ-endotoxinas ou toxinas bacterianas. Na análise de Cry3Bb, foi observado que uma colecção de 198 ΡΕ1040192 moléculas de água estão situadas à volta de 1α3,4, um local definido pelos inventores igualmente importante para o aumento da bioactividade. A ansa da região a3,4 está exposta na superfície e pode definir uma charneira na proteína permitindo a sua remoção ou movimento das três primeiras hélices do domínio 1. A hidratação encontrada à volta desta região pode conferir flexibilidade e mobilidade a esta ansa. A observação da água estrutural no local 1α3,4 proporcionou uma ferramenta analítica para posterior análise da estrutura. Se este local importante estiver rodeado pela água, então outros locais importantes podem também estar completamente ou parcialmente rodeados por água. Usando esta perspectiva, foi então identificada água estrutural a rodear as hélices 5 e 6. Esta água estrutural forma uma coluna ao longo da proteína, separando eficazmente as hélices 5 e 6 do resto da molécula. As estruturas de Cry3A e Cry3b sugerem que as hélices 5 e 6 estão altamente associadas, ligadas uma à outra por intereacções de Van der Waals. Por si só a hélice 5 de Cry3A, apesar de insuficiente para actividade biológica, foi demonstrado ter capacidade para formar canais iónicos numa membrana artificial (Gazit and Shai, 1993). Os canais iónicos formados pela hélice 5 são 10 vezes mais pequenos do que os canais da toxina de tamanho completo sugerindo que significativamente mais estrutura de toxina é necessária para os canais iónicos de tamanho completo. Em Cry3Bb, observou-se que a hélice 5, como parte de um conjunto de hélices a (domínio 1), forma canais iónicos (Von Tersch et al., 1994). Observações experimentais não publicadas pelos inventores demonstram que a hélice 6 também atravessa a 199 ΡΕ1040192 membrana biológica. Assim as hélices 5 e 6 são as hélices formadoras de canais putativos necessários para a toxicidade. A hidratação à volta destas hélices pode indicar que a flexibilidade desta região é necessária para a toxicidade. Pensamos que se for possível aumentar a hidratação à volta das hélices 5 e 6, poder-se-á criar uma melhor proteína toxina. No entanto, há que ter cuidado em evitar a criação de superfícies hidrofóbicas contínuas entre as hélices 5-6 e qualquer outra parte da proteína que poderão, por interacções hidrofóbicas, actuar para restringir o movimento de hélices móveis. A mobilidade das hélices 5 e 6 podem também depender da flexibilidade das ansas que lhes estão associadas, assim como doutras regiões da molécula Cry3Bb, particularmente no domínio 1, que pode sofrer alterações conformacionais para permitir a inserção das 2 hélices na membrana. A alteração da hidratação destas regiões da proteína pode também afectar a sua bioactividade. 5.8.1 Cry3Bb. 11032

Uma colecção de resíduos de água ligados indicou a relativa flexibilidade da região 1α3,4. A flexibilidade desta ansa pode ser aumentada através do aumento da hidratação da região ao substituir-se resíduos relativamente hidrofóbicos pelos resíduos hidrofílicos expostos. Um exemplo de uma proteína projectada melhorada tendo este tipo de substituição é Cry3Bb.11032. Cry3Bb.11032 tem 200 ΡΕ1040192 alteração do aminoácido D165G; glicina é mais hidrofóbica do que aspartato (escala de hidrofobicidade de Kyte and Doolittle de -0,4 vs -3,5 para aspartato). Cry3Bb.11032 é aproximadamente 3 vezes mais activo do que Cry3Bb selvagem. 5.8.2 Cry3Bb. 11051

Para aumentar a hidratação da região 1α4,5 de

Cry3Bb, glicina foi substituída na superfície exposta pelo resíduo K189. A glicina é mais hidrofóbica do que a lisina (escala de hidrofobicidade de Kyte and Doolittle de -0,4 vs -3,9 para lisina) e pode resultar num aumento da água ligada. 0 aumento da água ligada pode conferir maior flexi-ilidade à região da ansa que precede a hélice formadora de canais, a5. A proteína projectada Cry3Bb com a alteração K189G, Cry3Bb.11051, apresenta um aumento de 3 vezes na actividade comparativamente com Cry3Bb selvagem. 5.8.3 Alterações para La7,pi (Cry3Bb. 11241 e 11242)

As alterações de aminoácidos feitas na ansa exposta na superfície que liga a hélice α 7 e a cadeia β 1 (1α7,β1) resultou na identificação de 2 proteínas Cry3Bb alteradas. Com bioactividades aumentadas, Cry3Bb.11241 e Cry3Bb.11242. A análise do índice de hidropatia de 2 destas proteínas ao longo da sequência de 20 aminoácidos de 281 a 300 inclusive da região 1α7,β1, revelou que as substituiões de aminoácidos nestas proteínas tornaram a região 1α7, Pi muito mais hidrofóbica. O grau médio do valor de hidropatia (GRAVY) foi determinado para cada uma das sequências 201 ΡΕ1040192 proteicas usando o programa informático de análise de sequências proteicas PC/GENE® (IntelliGenetics, Inc., Mountain View, CA, publicação 6.85), SOAP e um intervalo de 7 aminoácidos. O aumento de hidrofobicidade da região 1α7,β1 para cada proteina pode aumentar a hidratação da ansa e, portanto, a flexibilidade. As proteínas alteradas, as suas respectivas alterações de aminoácidos, o número de vezes do aumento da bioactividade selvagem e os valores de GRAVY estão apresentados na Tabela 9.

Tabela 9

Valores de HIdropatia para a Região loí.7 , βΐ de Cry3Bb e 2 Proteínas Cry3Bb Alteradas com Bioactividade SCRW Aumentada

Proteína Cry3Bb* Alterações de aminoácidos Número de vezes do to da bioactividade vamente à proteína aumen- relati- selvagem GRAVY (aminoácidos 305-324) Selvagem - - 4, 50 Cry3Bb.11241 Y287F,D288N,R290L 2, 6x 10,70 Cry3Bb.11242 R290V 2, 5x 8, 85 5.8.4 Alterações para ίαΐ,βδ (Cry3Bb. 11228, Cry3Bb. 11229, Cry3Bb.11230, Cry3Bb.11233, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb. 11238 e Cry3Bb. 11239) A ansa exposta na superfície entre a cadeia β 1 e a hélice α 8 (1α1,β8) define a fronteira entre os domínios 1 e 2 de Cry3Bb. A introdução de alterações de aminoácidos semi ao acaso nesta região resultou na identificação de várias proteínas Cry3Bb alteradas com maior bioactividade. 202 ΡΕ1040192 A análise do índice de hidropatia das substituições de aminoácidos encontradas nas proteínas alteradas mostra que as alterações tornaram a região exposta mais hidrofóbica, o que resulta num aumento de hidratação e flexibilidade. A Tabela 10 apresenta as proteínas alteradas, as suas respectivas alterações de aminoácidos e o número de vezes de aumento relativamente a Cry3Bb selvagem e o grau médio do valor de hidropatia (GRAVY) determindo através do programa informático de análise de sequências proteicas PC|GENE® (IntelliGenetics, Inc., Mountain View, CA, publicação 6.85), SOAP, ao longo da sequência de 20 aminoácidos 305-324 inclusive de Ιαί,βδ, usando um intervalo de 7 aminoácidos.

Tabela 10

Valores de Hidropatia para a Região lcx7 , βΐ de Cry3Bb e 2 Proteínas Cry3Bb Projectadas com Bioactividade SCRW Aaumentada

Proteína Cry3Bb* Alterações de aminoácidos Número de vezes do da bioactividade vamente à proteína aumento relati- selvagem GRAVY (aminoácidos 281-300) Selvagem - - 0,85 Cry3Bb.11228 S311L,N313T,E317K 4, lx 4,35 Cry3Bb.11229 S311T,E317K,Y318C 2,5x 2,60 Cry3Bb.11230 S311A,L312V,Q316W 4,7x 3,65 Cry3Bb.11233 S311A,Q316D 2,2x 2,15 Cry3Bb.11236 S311I 3, lx 3,50 Cry3Bb.11237 S311I,N313H 5, 4x 3, 65 Cry3Bb.11238 N313V,T314N, 2,6x 9, 85 Q316M,E317V Cry3Bb.11239 N313R,L315P, 2,8x 3, 95

Q316L,E317A 203 ΡΕ1040192 5.8.5 Cry3Bb. 11227, Cry3Bb. 11241 e Cry3Bb. 11242 O aminoácido Q238, situado na hélice 6 de Cry3Bb, foi identificado como um resíduo que, pelo seu grande tamanho e ligação de hidrogénio a R290, bloqueia a hidratação completa do espaço entre a hélice 6 e a hélice 4. A substituição de R290 com aminoácidos que não formam ligações de hidrogénio, ou que possuem cadeias laterais que não podem abranger a distância física à ligação de hidrogénio com Q238, pode resultar num aumento da hidratação à volta de Q238. Q238, incapaz de se ligar através de pontes de hidrogénio a R290, pode não se ligar a água. Isto pode aumentar a flexibilidade da região de formação de canais iónicos. As proteínas projectadas Cry3Bb.ll27 (R290N), Cry3Bb.11241 (R290L) e Cry3Bb.11242 (R290V) apresentam aumentos de actividade de aproximadamente 2 vezes, 2,6 vezes e 2,5 vezes, respectivamente, contra larvas SCRW comparativamente com a selvagem. 5.9 Exemplo 9 - Método de Projecção 3: Manipulação de Ligações de Hidrogénio à Volta das Regiões Móveis A mobilidade de regiões de uma proteína pode ser necessária para a actividade. A mobilidade da região a.5,6, a região formadora dos canais putativos de Cry3Bb, pode ser melhorada através da diminuição do número de ligações de hidrogénio, incluindo pontes de sal (pontes de hidrogénio entre cadeias laterais de aminoácidos com cargas opostas), 204 ΡΕ1040192 entre as hélices 5-6 e qualquer outra parte da molécula ou estrutura do dímero. A diminuição do número de ligações de hidrogénio e pontes de sal pode melhorar a actividade biológica. A substituição dos aminoácidos das pontes de hidrogénio com resíduos hidrofóbicos deverá ser feita com cuidado para evitar criar superfícies hidrofóbicas contínuas entre as hélices 5-6 e qualquer outra parte do dímero. Isto pode diminuir a mobilidade através do aumento das interacções entre superfícies hidrofóbicas. 5.9.1 Cry3Bb. 11222 e Cry3Bb. 11223

Tyr230 está situada na hélice 6 e, na estrutura quaternária do dímero de Cry3Bb, este aminoácido é coordenado com Tyr230 da molécula adjacente. Três pontes de hidrogénio são formadas entre as duas hélices 6 nos dois monómeros devido a este aminoácido. De forma a melhorar a flexibilidade das hélices 5-6, as hélices teoricamente capazes de penetrar na membrana e formar um canal iónico, as pontes de hidrogénio ao longo do dímero foram removidas ao alterar-se este aminoácido e um correspondente aumento na actividade biológica foi observado. As proteínas Cry3Bb, Cry3Bb.11222 e Cry3Bb.EG11223, apresentam um aumento de 4 vezes e 2,8 vezes na actividade de SCRW, respectivamente, comparativamente com a proteína selvagem. 5.9.2 Cry3Bb. 11051 A proteína Cry3Bb projectada Cry3Bb.11051 tem a alteração de aminoácidos K189G em 1α4,5 do domínio 1. Na 205 ΡΕ1040192 estrutura Cry3Bb selvagem, a cadeia lateral exposta de K189 está suficientemente perto da alteração lateral exposta de E123, situada em la2b,3, para formar pontes de hidrogénio. A substituição de K189 com glicina, conforme encontrado nesta posição em Cry3A, remove a possibilidade de formação de ligações de hidrogénio neste local e resulta numa proteína com uma bioactividade três vezes superior a Cry3Bb selvagem. 5.9.3 Cry3Bb. 11227, Cry3Bb. 11241 E Cry3Bb. 11242 O aminoácido Q238, situado na hélice 6 de Cry3Bb, foi identificado como um resíduo que, devido ao seu tamanho grande e ligação de hidrogénio a R290, bloqueia a hidratação completa do espaço entre a hélice 6 e a hélice 4. A substituição de R290 com os aminoácidos que não formam pontes de hidrogénio ou que possuem cadeias laterais que não podem atravessar a distância física até à ponte de hidrogénio com Q238 pode aumentar a flexibilidade da região formadora de canais. As proteínas projectadas Cry3Bb.11227 (R290N), Cry3Bb.11241 (R290L) e Cry3Bb.11242 (R290V) apresentam actividades aumentadas de aproximadamente 2 vezes, 2,6 vezes e 2,5 vezes, respectivamente, contra larvas SCRW comparativamente com a proteína selvagem. 5.10 Exemplo 10 - Método de Projecção 4: Análise da Ansa e Projecção da Ansa à Volta das Hélices Flexíveis

As regiões de ansa da estrutura de uma proteína podem estar envolvidas em numerosas funções da proteína 206 ΡΕ1040192 incluindo, mas não estando limitado à formação de canais iónicos, formação e manutenção da estrutura quaternária e ligação a receptores. Cry3Bb é uma proteína formadora de canais. A disponibilidade das hélices formadoras de canais iónicos das δ-endotoxinas para se moverem para a bicamada depende da ausência de forças que impedem o processo. Uma destas forças que possivelmente limita este processo é a ocupação espacial das cadeias laterais de aminoácidos nas regiões das ansas à volta das hélices críticas. A literatura sugere que em pelo menos uma outra toxina bacte-riana, não uma toxina de B. thuringiensis, a molécula de toxina abre-se ou, em termos científicos, perde alguma da estrutura quaternária para expor uma região activa da membrana (Cramer et al., 1990) . Esta literatura não ensina como melhorar a probabilidade deste evento ocorrer e desconhece-se se as toxinas de B. thuringiensis usam este mesmo processo para penetrar na membrana. A redução da ocupação espacial das cadeias laterais de aminoácidos nestas regiões críticas através da redução do tamanho ou alteração do posicionamento da cadeia lateral com o correspondente aumento na actividade biológica foi o passo inovado. 5.10.1 Análise da Ansa Entre as Hélices 3 e 4 (Cry3Bb. 11032)

Os inventores descobriram que as três primeiras hélices do domínio um poderão ser separadas do resto da toxina por digestão proteolítica da ansa entre as hélices a3 e a4 (Cry3Bb.60). Esforços iniciais para truncar o gene cry3Bb para produzir esta molécula Cry3Bb encurtada, mas mais activa, falharam. Por razões desconhecidas, B. thurin- 207 ΡΕ1040192 giensis não sintetiza esta molécula de 60 KDa. Pensou-se então que talvez as primeiras três hélices do domínio 1 não tivessem de ser removidas proteoliticamente, ou de forma equivalente, a proteína não tinha de ser sintetizada nesta forma truncada para tirar partido da alteração de Cry3Bb.60. Observou-se que a proteína Cry3A tinha um pequeno aminoácido perto de 1α3,4 que poderia conferir maior flexibilidade na região da ansa permitindo assim que as três primeiras hélices do domínio 1 se movessem para fora do caminho, expondo a região activa da membrana. Ao projectar-se uma molécula Cry3Bb com um resíduo glicina perto desta ansa, a ocupação espacial dos resíduos na ansa deverá ser encurtada. A proteína projectada de novo, Cry3Bb.11032, tem a alteração de aminoácido D165G, que substitui o resíduo de aspartato maior (massa média de 115,09) com o aminoácido mais pequeno, glicina (massa média de 57,05). A actividade de Cry3Bb.11032 é aproximadamente 3 vezes superior à da proteína selvagem. Desta forma, a ansa entre as hélices a3 e a4 foi racionalmente projectada com um aumento correspondente na actividade biológica. 5.10.2 Cry3Bb.11051 A região da ansa que liga as hélices a4 e a5 em Cry3Bb deve ser flexível de forma a que as hélices α5-α6 formadoras de canais possam penetrar na membrana. Foi notado que Cry3A possui um resíduo de glicina no meio desta ansa que pode conferir maior flexibilidade. A correspondente alteração, K189G, foi feita em Cry3Bb e a proteína resultante, Cry3Bb.11051, apresenta um aumento de 3 vezes 208 ΡΕ1040192 na actividade contra larvas de SCRW comparativamente com Cry3Bb selvagem. 5.10.3 Análise da Ansa Entre a Cadeia β 1 e a Hhelice 8 (Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11233, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb. 11238 e Cry3Bb.11239) A região da ansa situada entre a cadeia β 1 do domínio 2 e a hélice α 8 no domínio 2 está muito perto da ansa entre as hélices α 6 e 7 no domínio 1. Algumas das cadeias laterais dos aminoácidos de Ιβί,αδ surgem como se pudessem impedir espacialmente o movimento de 1α6,7. Uma vez que 1α6,7 deve ser flexível para as hélices formadoras de canais α5-αδ se inserirem na membrana, pensou-se que a manipulação desta ansa poderia alterar o posicionamento das cadeias laterais resultando em menos impedimento espacial. Isto foi conseguido criando proteínas com actividades biológicas aumentadas, variando entre 2,2 e 5,4 vezes mais do que a proteína selvagem. Estas proteínas toxina projectadas e as suas alterações de aminoácidos estão apresentadas na Tabela 2 como Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11233, Cry3Bb.11236, Cry3Bb.11237,

Cry3Bb.11238 e Cry3Bb.11239. 5.10.4 Análise da Ansa Entre a Hélice 7 e a Cadeia β 1 (Cry3Bb.11228, Cry3Bb.11229, Cry3Bb.11230, Cry3Bb.11233, Cry3Bb.11236, Cry3Bb.11237, Cry3Bb. 11238 e Cry3Bb.11239)

Se Cry3Bb for semelhante a uma toxina bacteriana que se deve abrir para expor uma região activa de membrana 209 ΡΕ1040192 para toxicidade, é possível que outras hélices, para além das hélices formadoras de canais, sofram alterações das posições. Deduziu-se que, se as hélices α5-α6 se inserirem na membrana, então a hélice al pode ter também de alterar posições. Demonstrou-se no exemplo 4.4.3 que o aumento da flexibilidade entre a hélice a6 e al pode aumentar a actividade, maior flexibilidade na ansa após a hélice al, 1α7,β1 pode também aumentar a bioactividade. Alterações da região 1α7,β1 de Cry3Bb resultaram no isolamento de várias proteínas com actividades aumentadas variando entre 1,9 e 4,3 vezes mais do que a proteína selvagem. Estas proteínas projectadas estão apresentadas na Tabela 7 como Cry3Bb.11227, Cry3Bb.11234, Cry3Bb.11241, Cry3Bb.11242 e Cry3Bb.11236. 5.11 Exemplo 11 - Método de Pprojecção 5: Desenho da Ansa à Volta das Cadeias β e Folhas β

As regiões de ansas da estrutura de uma proteína podem estar envolvidas em numerosas funções da proteína incluindo, mas não estando limitado à formação de canais, formação e manutenção da estrutura quaternária e ligação a receptores. Uma superfície de ligação é muitas vezes definida por uma série de ansas, como é o caso da imunoglobu-lina G (IgG) (ver Branden and Tooze, 1991, para revisão). No entanto, o que não pode ser determinado nesta altura é quais as ansas que serão importantes para as interacções de receptores olhando apenas para a estrutura da proteína em questão. Uma vez que não foi identificado um receptor para Cry3Bb, não é mesmo possível comparar a estrutura de Cry3Bb 210 ΡΕ1040192 com outras proteínas que possuem o mesmo receptor devido a semelhanças estruturais. Para identificar ansas Cry3Bb que contribuem para as interacções de receptores, foi efectuada mutagénese ao acaso em ansas expostas na superfície. À medida que cada ansa foi alterada, o perfil das bioactividades globais das proteínas resultantes foi examinado e comparado. As ansas, especialmente no domínio 2 que parecem ser desnecessárias para a actividade de canal, dividem-se em duas categorias: (1) as ansas que podem ser modificadas sem muita alteração no nível de bioactividade das proteínas resultantes e (2) as ansas em que as alterações resultaram na perda global da bioactividade da proteína resultante. Usando este método de projecção, é possível identificar várias ansas importantes para a actividade . 5.11.1 Análise da Ansa β2,3

Mutagénese semi ao acaso da região da ansa entre as cadeias β 2 e 3 resultou na produção de proteínas toxina estruturalmente estáveis com actividades significativamente reduzidas contra larvas SCRW. A região 1β2,3 é altamente sensível às alterações de aminoácidos indicando que amino-ácidos ou sequências de aminoácidos específicos são necessárias para a actividade proteica de toxina. Considera-se, portanto, que alterações específicas na região 1β2,3 aumentará a ligação e, portanto, a actividade da proteína toxina desenhada de novo. 211 ΡΕ1040192 5.11.2 Análise da Ansa β6,7

As mutações semi ao acaso introduzidas na região da ansa entre as cadeias 6 e 7 resultaram em proteínas estruturalmente estáveis com uma perda global de bioacti-vidade contra SCRW. A região 1β6,7 é altamente sensível a alterações de aminoácidos indicando que os aminoácidos específicos ou sequências de aminoácidos são necessários para actividade da proteína toxina. Considera-se, portanto, que alterações específicas na região 1βδ,7 aumentará a ligação e, portanto, a actividade da proteína toxina pro-jectada de novo. 5.11.3 Análise da Ansa βΙΟ,ΙΙ

As mutações ao acaso na região da ansa entre as cadeias β 10 e 11 resultou em proteínas tendo uma perda global de bioactividade contra SCRW. A ansa βίο,11 está estruturalmente perto e interage com as ansas β2,3 e βδ, 7. Alterações específicas dos resíduos individuais dentro da região ΙβΙΟ,ΙΙ podem também resultar num aumento da inte-racção com a membrana de insectos, aumentando a bioactividade da proteína toxina. 5.11.4 Cry3Bb.11095

As ansas β2,3, βδ, 7 e βΙΟ,ΙΙ foram identificadas como importantes para a bioactividade de Cry3Bb. As 3 ansas estão expostas na superfície e estruturalmente próximas 212 ΡΕ1040192 umas das outras. 0 aminoácido Q348 na estrutura selvagem, situado na cadeia β2 imediatamente antes de 1β2,3, não forma quaisquer contactos intramoleculares. No entanto, a substituição Q348 com arginina (Q348R) resulta na formação de 2 novas pontes de hidrogénio entre R348 e os carbonilos do esqueleto de R487 e R488, ambos situados em ipi 0,11. As novas ligações de hidrogénio podem actuar para estabilizar a estrutura formada pelas 3 ansas. A proteína projectada portadora desta alteração, Cry3Bb.11095, é 4,6 vezes mais activa do que Cry3Bb selvagem. 5.12 Exemplo 12 - Método de Projecção 6: Identificação e Nova

Alteração das Superfícies Electrostáticas Complexas

As interacções das proteínas incluem interacções hidrofóbicas (e.g., forças de Van der Waals), interacções hidrofílicas, incluindo entre cargas opostas nas cadeias de aminoácidos (pontes de sal) e ligações de hidrogénio. Sabe-se muito pouco acerca das interacções entre a δ-endotoxina e o receptor. Actualmente, não existem descrições na literatura que identifiquem os tipos de interacções que predominam entre toxinas e receptores de B. thuringiensis.

No entanto, experimentalmente, é importante aumentar a força da interacção toxina de B. thuringiensis-receptor não permitindo a determinação precisa da interacção química que a suporta tendo em vista a sua melhoria. Para conseguir isto, a superfície electrostática de Cry3Bb foi definida resolvendo a distribuição Poisson- 213 ΡΕ1040192

Boltzman à volta da molécula. Uma vez resolvida esta superfície electricamente definida, esta pode ser então analisada relativamente a regiões de maior diversidade. Deduziu-se que estas regiões electrostaticamente diversas terão a maior probabilidade de participar nas interacções específicas entre as proteínas da toxina de B. thurin-giensis e o receptor, em vez de interacções mais gerais e não específicas. Assim, estas regiões foram escolhidas para nova projecção, continuando a aumentar a diversidade elec-trostática das regiões. Ainda, a análise da interacção electrostática à volta da região putativa formadora de canais da toxina criou perspectivas para a nova projecção. Isto inclui a identificação de um resíduo electropositivo num canal que de outra forma estaria carregado negativamente (ver exemplo 4.6.1). 5.12.1 R290 (Cry3Bb. 11227, Cry3Bb. 11241 E cry3Bb. 11242) A análise da interface do dímero de Cry3Bb ao longo do eixo do domínio 1 sugere que um poro ou canal de catiões possa ser formado entre os monómeros. 0 exame elec-trostático deste eixo deu credibilidade adicional a esta sugestão. De facto, o hipotético canal está essencialmente carregado negativamente, uma observação consistente com a análise biofísica de canais de δ-endotoxina selectivos para catiões. Se um canal catiónico se formar ao longo do eixo do dímero, então o catião poderá mover-se entre os monómeros de forma relativamente fácil com apenas um obstáculo significativo. Um resíduo de arginina carregado positiva- 214 ΡΕ1040192 mente (R290) situa-se no canal carregado negativamente. Este resíduo poderá impedir o movimento catiónico ao longo do canal. Baseado nesta análise, R290 foi alterado para um resíduo não carregado. A bioactividade das proteínas pro-jectadas de novo Cry3Bb.11227 (R290N), Cry3BB.11241 (R290L) e Cry3Bb.11242 (R290V) foi melhorada aproximadamente 2 vezes, 2,6 vezes e 2,5 vezes, respectivamente. 5.12.2 Cry3Bb.60 A digestão com tripsina de Cry3Bb solubilizada dá uma proteína truncada estável com um peso molecular de 60 KDa (Cry3Bb.60). A digestão com tripsina ocorre no lado carboxilo do resíduo R159, removendo eficazmente as hélices 1 a 3 da estrutura nativa Cry3Bb. A clivagem das primeiras 3 hélices expõe uma superfície eslectrostática diferente da encontrada na estrutura nativa. A nova superfície tem uma combinação de características hidrofóbicas polares e carregadas que podem desempenhar um papel nas interacções com membranas. A bioactividade de Cry3Bb.60 é 3,6 vezes superior à de Cry3Bb selvagem. 5.13 Exemplo 13 - Método de Projecção 7: Identificação e Remoção de Locais de Ligação a Metais A literatura ensina que o comportamento in vitro das toxinas de B. thuringiensis pode melhorar através da quelatação de catiões divalentes no sistema experimental (Crawford and Harvey 1988) . No entanto, desconhecia-se como 215 ΡΕ1040192 é que estes catiões divalentes inibiam a actividade in vitro. Crawford and Harvey (1988) demonstraram que a corrente de curto circuito através do intestino é mais fortemente inibida por B. thuringiensis na presença de EDTA, um quelator de iões divalentes, do que na ausência deste agente, sugerindo assim que este passo no modo de actuação de B. thuringiensis poderá ser potenciado através da remoção de iões divalentes. Observações semelhantes foram feitas usando membranas de lípidos negras e medindo um aumento na corrente criada pelas δ-endotoxinas na presença de EDTA para quelatar iões divalentes. Houve pelo menos três possíveis explicações para estas observações. A primeira explicação poderia ser a dos iões divalentes serem demasiado grandes para se moverem através de um canal iónico mais adequado para iões monovalentes, bloqueando assim o canal. Segundo, os iões divalentes podem cobrir a proteína de forma muito geral, tamponando assim as interac-ções de carga necessárias para a interacção das toxinas de membrana e limitando a actividade de canal. A terceira possibilidade é que exista um local específico de ligação a metais na proteína e, quando ocupado por iões divalentes, a função de canal iónico seja inibida. Se bem que a literatura não possa diferenciar o valor de uma possibilidade relativamente a outra, a terceira possibilidade conduziu a uma análise da estrutura Cry3Bb de pesquisa de um local específico de ligação a metal que possa alterar a probabilidade de uma toxina poder formar um canal iónico. 216 ΡΕ1040192 5.13.1 Η231 ( (Cry3Bb. 11222, Cry3Bb11224, Cry3Bb. 11225 e

Cry3Bb. 11226)

Um local putativo de ligação a metal é formado na estrutura do dimero de Cry3Bb pelos residuos de H231 de cada monómero. Os residuos H231, situados na hélice αβ, situam-se adjacentes uns aos outros e perto do eixo de simetria do dimero. A remoção deste local por substituição da histidina com outros aminoácidos foi avaliada pela ausência da actividade de canal iónico dependente de EDTA. As bioactividades das proteínas toxina projectadas, Cry3Bb.11222, Cry3Bb.11224, Cry3Bb.11225 e Cry3Bb.11226, são aumentadas 4, 5 3,6 e 3 vezes, respectivamente, em relação a Cry3Bb selvagem. As respectivas alterações de aminoácidos estão apresentadas na Tabela 2. 5.14 Exemplo 14 - Método de Projecção 8: Alteração da Estrutura Quaternária

Cry3Bb pode existir em solução como um dimero semelhante a uma proteína relacionada, Cry3A (Walters et ai., 1992) . No entanto, a importância do dimero para a actividade biológica é desconhecida devido à toxina como um monómero ou como estrutura de ordem superior não ter sido exaustivamente avaliada. Assume-se que os resíduos de aminoácidos específicos contribuam para a formação e estabilidade da estrutura quaternária. Uma vez identificado um resíduo que contribui, podem ser feitas alterações para diminuir ou aumentar o efeito daquele resíduo afectando 217 ΡΕ1040192 assim a interacção entre monómeros. A actividade de canal é uma forma útil, mas de forma alguma a única, de avaliar a estrutura quaternária de Cry3Bb e seus derivados. Foi observado que Cry3Bb cria condutâncias controladas em membranas que crescem de tamanho com o tempo, resultando no final em grandes poros na membrana (a actividade canal de Cry3Bb selvagem está descrita na Secção 12.1). Foi observado que Cry3A forma um dimero mais estável do que Cry3Bb e por coincidência forma mais depressa níveis mais elevados de condutância (FIG. 10). Esta observação levou os inventores a propor que a oligomerização e a formação de canais iónicos (tamanho da condutância e velocidade de formação do canal) estejam relacionadas. Baseado nesta observação Cry3Bb foi novamente manipulado para preparar oligómeros maiores e mais estáveis a uma velocidade maior. Assume-se nesta análise que a velocidade de formação de canais iónicos e crescimento reflecte este processo. É também possível que as alterações na estrutura quaternária possam não afectar a actividade de canal iónico. Alterações à estrutura quaternária podem também afectar as interacções com receptores, processamento de proteínas no ambiente do tubo digestivo de insectos, assim como outros aspectos de bioactividade desconhecidos. 5.14.1 Cry3Bb.11048 A análise estrutural comparativa de Cry3A e Cry3Bb conduz à identificação de diferenças estruturais entre as duas toxinas no domínio de formação de canais 218 ΡΕ1040192 iónicos; especificamente, uma inserção de um aminoácido entre a hélice 2a e a hélice 2b em Cry3Bb. A remoção deste aminoácido adicional em Cry3B2, A104, e uma substituição D103E, como em Cry3A, resultou na perda de controlo do canal e na formação de poros simétricos. Uma vez formados os poros eles permanecem abertos e permitem uma condutância estável variando entre 25-130 pS. Esta proteina projectada, Cry3Bb.11048, é 4,3 vezes mais activa do que Cry3Bb selvagem contra larvas SCRW. 5.14.2 Oligomerização de Cry3Bb.60

Moléculas individuais de Cry3Bb ou Cry3Bb.60 podem formar um complexo com uma outra molécula semelhante. A oligomerização de Cry3Bb é demonstrada por SDS-PAGE, em que as amostras não são aquecidas em tampão de amostra antes de serem aplicadas no gel. A ausência do tratamento pelo calor permite que permaneça alguma toxina não desnaturada. A oligomerização é visualizada após coloração com Coomassie através do aparecimento de uma banda com 2 vezes o peso molecular do monómero. A intensidade da banda de peso molecular mais elevado reflete o grau de oligomerização. A capacidade de Cry3Bb para formar um oligómero não é aparente de forma reprodutível. O complexo não pode ser observado repetidamente. No entanto, Cry3Bb.60 forma uma quantidade significativamente maior de um complexo de peso molecular mais elevado (120 KDa) . Estes dados sugerem que Cry3Bb.60 forma mais facilmente o complexo de ordem mais elevada do que Cry3Bb sozinho. Cry3Bb.60 forma canais 219 ΡΕ1040192 iónicos com maior frequência do que Cry3Bb selvagem (ver secção 5.12.9). 5.14.3 Cry3Bb.11035

Foram feitas alterações em cry3Bb para reflectir a sequência de aminoácidos em cry3A no extremo de 1α3,4 e no começo da hélice 4. Estas alterações resultaram na proteína projectada, Cry3Bb.11035, que ao contrário de Cry3Bb selvagem, forma canais espontâneos com condutâncias maiores. Cry3Bb.11035 é aproximadamente três vezes mais activo contra as larvas SCRW do que Cry3Bb selvagem. Cry3Bb.11035 e as suas alterações de aminoácidos estão apresentadas na tabela 10. 5.14.4 Cry3Bb.11032

Cry3Bb.11032 foi alterado no resíduo 165 na hélice a4, alterando um aspartato para glicina, como encontrado em Cry3A. Cry3Bb.11032 é três vezes mais activo do que Cry3Bb selvagem. A actividade de canal de Cry3Bb.11032 é muito semelhante à de cry3Bb excepto quando a proteína projectada é artificialmente incorporada na membrana. Um aumento de 16 vezes nas condutâncias do canal inicial é observado comparativamente a Cry3Bb selvagem (ver secção 5.12.2). Este aumento na condutância inicial presumivelmente é devido a um aumento da estrutura quaternária, estabilidade ou estrutura de ordem superior. 220 ΡΕ1040192 5.14.5 EG11224

Na estrutura do dímero Cry3Bb selvagem, histi-dina, na posição 231 no domínio 1, faz contactos de ligações de hidrogénio com D288(domínio 1), Y230 (domínio 1) e através de uma rede de moléculas de água, também faz contacto com D610 (domínio 3), todos do monómero oposto. D610 e K235 (domínio 1) também faz contacto. Substituindo a histidina com uma arginina, H231R resulta, numa orientação, na formação de uma ponte de sal com D610 do monómero vizinho. Numa segunda orientação, os contactos com D288 do monómero vizinho, como surge na estrutura selvagem, são mantidos. Em qualquer uma das orientações, R231 não faz ligações de hidrogénio com Y230 do monómero oposto mas faz contacto com K235 que retém o seu contacto com K610 (V.

Cody, comunicação pessoal). A alteração das ligações de hidrogénio modificou as interacções entre os diferentes domínios da proteína na estrutura quaternária. Globalmente, existem menos ligações de hidrogénio entre os domínios 1 dos monómeros vizinhos e uma ligação muito mais forte forma-se entre os domínios 1 e 3. Encontrou-se que a actividade de canal estava alterada. Cry3Bb.11224 produz pequenos canais de abertura/fecho rápido como Cry3Bb. No entanto, ao contrário de Cry3Bb selvagem, Cry3Bb.11224 não apresenta activação dependente de β-mercaptoetanol. A substituição de H231 com arginina resultou numa proteína Cry3Bb redesenhada, Cry3Bb.11224, apresentando um aumento de 5 vezes da bioactividade. 221 ΡΕ1040192 5.14.6 Cry3Bb.1126

Cry3Bb.11226 é semelhante a Cry3Bb.11224 discutido na Secção 4.8.5, pelo facto de a histidina na posição 231 ter sido substituída. A alteração de aminoácido, H231T, resulta na perda de activação dependente de β-mercapto-etanol observada com Cry3Bb selvagem (ver Secção 5.12.1). a substituição de H231, um local putativo de ligação a metais, altera a interacção de regiões na estrutura quaternária resultando num tipo diferente de actividade de canal. Cry3Bb.ll26 é três vezes mais activo do que Cry3Bb selvagem. 5.14.7 Cry3Bb.11221

Cry3Bb.11221 foi redesenhada na região 1α3,4 de Cry3Bb. Os canais formados por Cry3Bb.11221 são muito melhor resolvidos do que as condutâncias formadas por Cry3Bb selvagem (ver Secção 5.12.6). Cry3Bb.11221 apresenta um aumento de 6,4 vezes na bioactividade relativamente a Cry3Bb selvagem. As alterações de aminoácidos encontradas em Cry3Bb.11221 estão apresentadas na Tabela 2. 5.14.8 Cry3Bb.11242 A proteína redesenhada, Cry3Bb.11242, portadora da alteração R290V, forma pequenas condutâncias imediatamente, que crescem rapidamente e de forma estável para condutâncias maiores em cerca de 3 min (ver secção 5.12.7). 222 ΡΕ1040192

Isto contrasta com os canais de Cry3Bb selvagem que levam 30-45 min a surgirem e crescem lentamente ao longo de horas para condutâncias grandes. Cry3Bb.11242 também apresenta um aumento de 2,5 vezes na bioactividade comparativamente com Cry3Bb selvagem. 5.14.9 Cry3Bb.11230

Cry3Bb.11230, ao contrário de Cry3Bb selvagem, forma canais bem resolvidos com estados abertos longos. Estes canais atingem uma condutância máxima de 3000 pS mas não continuam a crescer com o tempo. Cry3Bb.11230 foi redesenhada na região Ιβί,αθ de Cry3Bb e apresenta um aumento de quase 5 vezes na actividade contra larvas SCRW (Tabela 9) e um aumento de 5,4 vezes contra larvas WCRW (Tabela 10) comparado com Cry3Bb selvagem. As alterações de aminoácidos encontradas em Cry3bb.11230 estão apresentadas na Tabela 2. 5.15 Exemplo 15 - Método de Projecção 9: Projecção de Resíduos

Estruturais. A estrutura tridimensional especifica de uma proteína é mantida no lugar por aminoácidos que podem estar escondidos ou de outra removidos da superfície da proteína. Estes determinantes estruturais podem ser identificados através da análise das forças responsáveis pelo posicionamento da estrutura da superfície. O impacto destes resíduos estruturais pode ser então aumentado para restringir o movimento molecular ou diminuído para aumentar a flexibilidade molecular. 223 ΡΕ1040192 5.15.1 Cry3Bb. 11095

As ansas β2,3, β6,7 e βΙΟ,ΙΙ, situadas no domínio 2 de Cry3Bb, foram identificadas como importantes para a bioactividade. O aminoácido Q348 na estrutura selvagem, situado na cadeia β2 imediatamente antes de 1β2,3 não forma quaisquer contactos intramoleculares. No entanto, a substituição de Q348 com arginina (Q348R) resulta na formação de 2 novas ligações de hidrogénio entre R348 e o esqueleto de carbonilos de R487 e R488, ambos situados em ΙβΙΟ,ΙΙ. As novas ligações de hidrogénio podem actuar de forma a estabilizar a estrutura formada pelas três ansas. Certamente, a estrutura à volta de R348 está mais intimamente empacotada conforme determinado por cristalografia de raios X. A proteína projectada portadora desta alteração Cry3Bb.11095, é 4,6 mais activa do que Cry3Bb selvagem. 5.16 Exemplo 16 - Método de Projecção 10: Análise Combinatória e Mutagénese

Locais individuais na molécula Cry3Bb alterada podem ser usados conjuntamente para criar uma molécula Cry3Bb com actividade ainda maior do que a actividade de qualquer lugar individual. Este método não foi aplicado com precisão a qualquer δ-endotoxina. Igualmente também não é óbvio que melhorias em dois locais possam conjuntamente melhorar a actividade biológica da proteína. De facto, os 224 ΡΕ1040192 dados demonstram que melhorias em 2 locais, quando reunidos numa única construção, não melhoram mais necessariamente a actividade biológica de Cry3Bb. Nalguns casos, a combinação resultou no decréscimo da estabilidade e/ou actividade da proteína. Exemplos de proteínas com combinações de locais que resultaram num melhoramento de actividade comparativamente com Cry3Bb selvagem mas com menos actividade comparativamente com 1 ou mais das proteínas "parentais" são Cry3Bb.11235, 11046, 11057 e 11058. Cry3Bb.11082, que contem as regiões redesenhadas das 4 proteínas parentais, retém o nível de actividade da estirpe parental mais activa (Cry3Bb.11230) mas não apresenta um aumento de actividade. Estas proteínas estão apresentadas na Tabela 7. Seguem-se exemplos de casos em que mutações combinadas possuem actividade biológica significativamente melhorada. 5.16.1 Cry3Bb.11231 A proteína redesenhada Cry3Bb.11231 contem as alterações encontradas em Cry3Bb.11224 (H231R) e cry3Bb.11228 (alterações em Ιβί,αδ). A combinação de alterações de aminoácidos encontrada em Cry3Bb.11231 resulta num aumento de bioactividade contra larvas de SCRW e aproximadamente 8 vezes relativamente a Cry3Bb selvagem (Tabela 2). Este aumento é maior do que o apresentado por Cry3Bb.11224 (5,0x) ou Cry3Bb.11228 (4,lx) sozinho. Cry3Bb.11231 também apresenta um aumento de 12,9 vezes na actividade comparativamente com Cry3Bb selvagem contra larvas WCRW (Tabela 10). 225 ΡΕ1040192 5.16.2 Cry3Bb.11081 A proteína Cry3Bb redesenhada Cry3bb.11081 foi construída combinando as alterações encontradas em Cry3Bb.11032 e Cry3Bb.11229 (com excepção de Y318C). Cry3Bb.11081 demonstrou um aumento de actividade de 6,1 vezes na actividade relativamente a Cry3Bb selvagem; um maior aumento na actividade do que qualquer uma das proteínas parentais individuais, Cry3Bb.11032 (3,1 vezes) e

Cry3Bb.11229 (2,5 vezes). 5.16.3 Cry3Bb.11083 A proteína Cry3Bb redesenhada Cry3bb.11083 foi construída combinando as alterações encontradas em Cry3Bb.11036 e Cry3Bb.11095. Cry3Bb.11083 demonstrou um aumento de actividade de 7,4 vezes na actividade contra larvas SCRW comparativamente com Cry3Bb selvagem; um aumento maior do que Cry3Bb.11036 (4,3x) ou Cry3Bb.11095 (4,6x). Cry3Bb.11083 também apresenta um aumento de 5,4 vezes na actividade contra larvas WCRW comparativamente com Cry3Bb selvagem (Tabela 10). 5.16.4 Cry3Bb. 11084 A proteína Cry3Bb redesenhada Cry3bb.11084 foi construída combinando as alterações encontradas em Cry3Bb.11032 e a alteraçao S311L encontrada em Cry3Bb.11228 . Cry3Bb. 11084 apresenta um aumento de 7,2 226 ΡΕ1040192 vezes na actividade relativamente a Cry3Bb selvagem; um aumento superior a Cry3Bb.11032 (3,lx) ou cry3Bb.11228 (4,lx) · 5.16.5 Cry3bb11098

A proteína Cry3Bb redesenhada Cry3Bb.11098 foi construída de forma a conter as seguintes alterações de aminoácidos: D165G, H231R, S311L, N313T e E317K. A sequência de ácidos nucleicos está apresentada em SEQ ID NO:107 e a sequência de aminoácidos codificada está apresentada em SEQ ID NO: 107 e a sequência de aminoácidos codificada está apresentada em SEQ ID NO:108. 5.17 Exemplo 17 - Estratégia de Projecção 11: Alteração da Ligação de WCRW a Glicoproteínas e a Membranas em Escova

Se bem que a identidade dos receptores de Cry3Bb seja desconhecida, é no entanto importante para aumentar a interacção da toxina com o seu receptor. Uma forma de aumentar a interacção toxina-receptor sabendo a identidade do receptor é reduzir ou eliminar a ligação não produtiva a outras moléculas. Os inventores observaram que Cry3Bb se liga não especificamente a albumina sérica bovina (BSA) que foi glicosilada com uma variedade de grupos de açúcar, mas não a BSA não glicosilada. Cry3A, que não é activa em espécies de Diabrotica, apresenta ligação semelhante mas ainda maior a BSA glicosilada. De forma semelhante, Cry3A apresenta ainda maior ligação a membranas em escova (BBM) 227 ΡΕ1040192 de WCRW imobilizadas do que Cry3Bb selvagem, sugerindo que muita da ligação observada não é produtiva. Deduziu-se que a ligação não específica a BBM de WCRW ocorre via proteínas glicosiladas e que a ligação a BSA glicosilada e a BBM de WCRW é não produtiva na via de reacções para toxicidade. Assim, a redução ou eliminação daquela ligação conduzirá a um aumento da ligação ao receptor produtivo e a um aumento da toxicidade. Os potenciais locais de ligação a grupos de açúcar foram alvo do redesenhamento de forma a reduzir a ligação não específica de Cry3Bb a glicoproteínas e a BBM de WCRW imobilizadas. 5.17.1 Cry3Bb . 60

Cry3Bb-60, em que Cry3Bb foi clivada em R159 em 1α3,4, mostra decréscimo da ligação a BSA glicosilada e diminui a ligação a BBM de WCRW imobilizadas. Cry3Bb-60 apresenta um aumento de 3,6 vezes na bioactividade relativamente a Cry3Bb selvagem. 5.17.2 Alterações a 1α3,4 (Cry3Bb. 11221)

Cry3Bb.11221 foi redesenhada na região 1α3,4 do domínio 1, que é a rgeião em que Cry3Bb é clivada para produzir Cry3Bb-60. Cry3Bb.11221 também apresenta um decréscimo da ligação a BSA glicosilada e a BBM de WCRW imobilizadas e apresenta um aumento de 6,4 vezes na bioactividade relativamente a Cry3Bb selvagem. Conjuntamente com os dados de Cry3Bb.60 (secção 5.17.1) estes dados sugerem que esta 228 ΡΕ1040192 região da ansa contribui substancialmente para a ligação não produtiva da toxina. 5.17.3 Alteração de 1β1,α8 (Cry3Bb. 11228, 11230, 11237 e 11231) A região Ιβί,αδ de Cry3BB foi redesenhada para aumentar a hidratação (secção 4.2.4) e aumentar a flexibilidade (secção 4.4.3). Várias proteínas alteradas nesta região, Cry3Bb.ll28, 11230 e 1237, demonstram niveis substancialmente mais baixos de ligação a BSA glicosilada e a BBM de WCRW imobilizada e também apresenta aumentos entre 4,1 e 4,5 vezes da bioactividade relativamente a Cry3Bb selvagem. 5.17.4 Actividade de Ligação

As tendências de Cry3Bb e de alguns dos seus derivados para se ligarem a BSA glicosilada e a BBM de WCRW foram determinadas usando um biosensor de ressonância dos plasmões de superfície BIAcore™. Para a ligação a BSA glicosilada, a proteína glicosilada foi imobilizada, usando química de NHS convencional, a uma chip CM5 (BIAcore) e a toxina solubilizada foi injectada na superfície de BSA glicosilada. Para medir a ligação a BBM de WCRW, as vesículas das membranas em escova (BBMV) purificadas a partir de tubos digestivos de WCRW (English et ai., 1991) foram imobilizadas num chip HPA (BIAcore) depois lavadas com KOH 10 mM ou com β-octilglucósido 40 mM. A toxina solubilizada foi então injectada sobre a superfície da bi-camada híbrida resultante para detectar a ligação. A con- 229 ΡΕ1040192 centração proteica foi determinada pelo ensaio de Protein Dye Reagent (BioRad) ou ensaio de BCA Portein (Pierce).

Podem ser igualmente usados outros métodos para determinar a mesma informação de ligação. Estes incluem, mas não estão limitados a experiências de transferência de ligandos usando toxina marcada, proteína glicosilada marcada ou anticorpos anti-toxina, cromatografia de afinidade e ligação in vitro de toxina a BBMV intacta. 5.18 Exemplo 18 - Construção de Plasmídeos com Sequências cry3Bb Selvagem

Procedimentos de DNA recombinante convencionais foram efectuados essencialmente como descrito por Sambrook et al., (1989) . 5.18.1 PEG1701 pEGl701 (Fig. 11), contido em EG11204 e EG11037, foi construído através da inserção do fragmento Sphl-PstI contendo o gene cry3Bb e o terminador crylF derivado de pEG911 (Baum, 1994) no local Sphl-PstI de pEG854.9 (Baum et al., 1996), um número elevado de cópias do vector vai-vem B. thuringiensis - E. coli. 5.18.2 PEG1028 pEG1028 contem o fragmento HindiII de cry3Bb 230 ΡΕ1040192 derivado de pEG1701 clonado no local de clonagem múltiplo de pTZ18U em HindIII. 5.19 Exemplo 19 - Construcção de Plasmídeos com Genes cry3Bb Alterados O DNA de plasmideo derivado de E. coli foi preparado pelo método de lise alcalina (Maniatis et al., 1982) ou pelos kits de preparação de plasmideo comerciais (exemplos: kit PERFECTprep™, 5 Prime - 3 Prime, Inc.,

Boulder CO; QIAGEN plasmid prep kit, QIAGEN Inc.) . Os plasmídeos de B. thuringiensis foram preparados a partir de culturas, crescidas em infusão de cérebro coração mais 0,5% de glicerol (BHIG) até meio da fase logarítmica, pelo método de lise alcalina. Quando necessário para purificação, fragmentos de DNA foram removidos do gel de agarose após electroforese e recuperados com pó de vidro usando um kit Geneclean II® (BIO 101 Inc., La Jolla, CA) . A alteração do gene cry3Bb foi conseguida usando várias técnicas incluindo mutagénese dirigida, PCR™ triplex, mutagénese por PCR™ quase ao acaso, arrastamento de DNA e técnicas recombinantes convencionais. Estas técnicas estão descritas nas Secções 6.1, 6.2, 6.3, 6.4 e 6.5, respectivamente. As sequências de DNA das sequências iniciadoras usadas estão apresentadas na Secção 7. 5.20 Exemplo 20 - Mutagénese Dirigida

Mutagénese dirigida foi efectuada pelos protocolos estabelecidos por Kunkle (1985) e Kunkle et al. (1987) 231 ΡΕ1040192 usando o kit de mutagénese in vitro Muta-Gene™ M13 (Bio-Rad, Richmond, CA) . Combinações de alterações de cry3Bb foram conseguidas usando o kit Muta-Gene™ e múltiplas sequências iniciadoras oligonucleotídicas mutagénicas. 5.20.1 PEG1041

pEG1041, contido em EG11032, foi construído usando o kit Muta-Gene™, a sequência iniciadora C e pEG1028 de cadeia simples como matriz de DNA. A sequência de DNA

cry3Bb alterada resultante foi excisada como um fragmento de DNA PflMI e usada para substituir o fragmento de DNA correspondente em pEG1701. 5.20.2 PEG1046

pEG1046, contido em EG11035, foi construído usando o kit Muta-Gene™, a sequência iniciadora D e pEG1028 de cadeia simples como matriz de DNA. A sequência de DNA

cry3Bb alterada resultante foi excisada como um fragmento de DNA PflMI e usada para substituir o fragmento de DNA correspondente em pEG1701. 5.20.3 PEG1047 pEGl0 4 7, contido em EG11036, foi construído usando o kit Muta-Gene™, a sequência iniciadora E e pEG1028 de cadeia simples como matriz de DNA. A sequência 232 ΡΕ1040192 de DNA cry3Bb alterada resultante foi excisada como um fragmento de DNA PflMI e usada para substituir o fragmento de DNA correspondente em pEG1701. 5.20.4 PEG1052 pEGl0 52, contido em EG11046, foi construído usando o kit Muta-Gene™, as sequências iniciadoras D e E e pEG1028 de cadeia simples como matriz de DNA. A sequência de DNA cry3Bb alterada resultante foi excisada como um fragmento de DNA PflMI e usada para substituir o fragmento de DNA correspondente em pEG1701. 5.20.5 PEG1054 pEG1054, contido em EG11048, foi construído usando o kit Muta-Gene™, a sequência iniciadora F e pEG1028 de cadeia simples como matriz de DNA. A sequência de DNA cry3Bb alterada resultante foi excisada como um fragmento de DNA PflMI e usada para substituir o fragmento de DNA correspondente em pEG1701. 5.20.6 PEG1057 pEG1057, contido em EG11051, foi construído usando o kit Muta-Gene™, a sequência iniciadora G e pEG1028 de cadeia simples como matriz de DNA. A sequência de DNA cry3Bb alterada resultante foi excisada como um 233 ΡΕ1040192 fragmento de DNA PflMI e usada para substituir o fragmento de DNA correspondente em pEG1701. 5.21 Exemplo 21 - PCR™ Triplex PCR™ triplex está descrito por Michael (1994). Este método utiliza uma ligase termostável para incorporar uma sequência iniciadora mutagénica fosforilada num fragmento de DNA amplificado durante PCR™. PCR™ foi realizado num termociclador Perkin Elmer Cetus DNA Thermal Cycler (Perkin-Elmer, Norwalk, CT) usando um kit de DNA polimerase AmpliTaq™ (Perkin-Elmer) e pEG1701 linearizado com Sphl como DNA matriz. Os produtos de PCR™ foram limpos usando kits comerciais tais como Wizard™ PCR™ Preps (Promega, Madison, WI) e QIAquick PCR™ Purification kit (QIAGEN Inc., Chatsworth, CA). 5.21.1 PEG1708 e PEG1709

pEGl708 e pEG1709, contidos em EG11222 e EG11223, respectivamente, foram construídos por substitução do fragmento PflMI-PflMI de cry3Bb em pEG1701 com o fragmento de PCR™ digerido com PflMI e purificado em gel, alterado nas posições nucleotídicas 688-690 de cry3Bb, codificadora do aminoácido Y230. As mutações ao acaso foram introduzidas no codão Y230 por PCR™ triplex. A sequência iniciadora mutagénica MVT095 foi fosforilada e usada em conjunto com o par de sequências iniciadoras externas FW001 e FW006. A 234 ΡΕ1040192 sequência iniciadora MVT095 também contem uma mutação silenciosa na posição 687, mudando T para C, o que, quando da incorporação, introduz uma local FcoRI adicional em pEGl701. 5.21.2 PEG1710, PEG1711 E PEG1712

Os plasmideos pEG1710, pEG1711 e pEG1712, contidos em EG11224, EG11225 e EG11226, respectivamente, foram construídos por substitução do fragmento PflMI-PflMI de cry3Bb em pEG1701 com o fragmento de PCR™ digerido com PflMI e purificado em gel, alterado nas posições nucleotí-dicas 690-692 de cry3Bb, codificadora de H231. As mutações ao acaso foram introduzidas no codão H231 por PCR™ triplex. A sequência iniciadora mutagénica MVT097 foi fosforilada e usada em conjunto com o par de sequências iniciadoras externas FW001 e FW006. A sequência iniciadora MVT095 também contem uma alteração da sequência de um T para C na posição 687, o que, quando da incorporação, resulta num local FcoRI adicional por mutação silenciosa. 5.21.3 PEG1713 e PEG1727 pEG1713 e pEG1727, contidos em EG11227 e EG11242, respectivamente, foram construídos por substitução do fragmento PflMI-PflMI de cry3Bb em pEG1701 com o fragmento de PCR™ digerido com PflMI e purificado em gel, alterado nas posições nucleotídicas 868-870 em cry3Bb, codificadora 235 ΡΕ1040192 do aminoácido R290. As mutações ao acaso foram introduzidas no codão Y230 por PCR™ triplex. A sequência iniciadora mutagénica MVT091 foi projectada de forma a que as substituições de nucleótidos resultassem em aproximadamente 36% das sequências codificadoras dos aminoácidos D ou E. MTV091 foi fosforilada e usada em conjunto com o par de sequências iniciadoras externas FW001 e FW006. 5.22 Exemplo 22 - Mutagénese Quase ao Acaso por PCR™ A mutagénese quase ao acaso combina as técnicas mutagénicas por PCR™ descritas por Vallette et al. (1989), Tomic et ai. (1990) e LaBean and Kauffman (1993). As sequências iniciadoras mutagénicas, por vezes mais de 70 nucleótidos de comprimento, foram redesenhadas para introduzir alterações ao longo das posições nucleotidicas codificadoras de uma região estrutural completa, como seja uma ansa. Codões degenerados tipicamente consistem numa proporção de 82% dos nucleótidos selvagens mais 6% de cada um dos outros 3 nucleótidos por posição para introduzir semi ao acaso alterações ao longo da região alvo (LaBean and Kauffman, 1993). Quando possível, os locais de restrição naturais foram utilizados; usaram-se enzimas da classe 2 quando os locais naturais não eram convenientes (Stemmer and Morris, 1992, descreve a lista adicional de enzimas de restrição úteis para esta técnica) . PCR™ foi efectuado num termociclador Perkin Elmer Cetus DNA Thermal Cycler (Perkin-Elmer, Norwalk, CT) usando um kit de Ampli- 236 ΡΕ1040192

Taq™ DNA polimerase (Perkin-Elmer) e pEG1701 linearizado com Sphl como DNA matriz. A amplificação quase ao acaso por PCR™ foi realizada usando as seguintes condições: desnaturação a 94°C durante 1,5 min.; emparelhamento a 50°C durante 2 min. e extensão a 72°C durante 3 min., durante 30 ciclos. Os 14 ciclos finais de extensão foram prolongados mais 25 s por ciclo. A concentração das sequências iniciadoras foi 20 μΜ por reacção ou 40 μΜ para sequências iniciadoras mutagénicas mais longas. Os produtos de PCR™ foram limpos usando kits comerciais tais como Wizard™ PCR™ Preps (Promega, Madison, WI) e o kit QIAquick PCR™ Purification kit (QIAGEN Inc., Chatsworth, CA). Nalguns casos os produtos de PCR™ foram tratados com o fragmento Klenow (Promega) seguindo as instruções do fabricante para preencher quaisquer extremidades soltas de cadeia simples antes da digestão de restrição. 5.22.1 PEG1707 pEG1707, contido em EG11221, foi construído por substitução do fragmento PflMI-PflMI de cry3Bb em pEG1701 com o fragmento de PCR™ digerido com PflMI e purificado em gel, alterado nas posições nucleotídicas 460-480 de cry3Bb, codificadora dos aminoácidos de 1α3,4 154-160. A sequência iniciadora MVT075, que inclui um local de reconhecimento para a enzima de restrição da classe 2 Bsal, e a sequência iniciadora FW006 foram usados para introduzir alterações nesta região por mutagénese quase ao acaso. A sequência 237 ΡΕ1040192 iniciadora MVT076, também contendo um local Bsal, e a sequência iniciadora FW001 foram usadas para amplificar por PCR™ um fragmento "adaptador". Após amplificação por PCR™, ambos os produtos foram limpos, preenchidos os extremos, digeridos com Bsal e ligados um ao outro. 0 fragmento ligado foi purificado em gel e usado como matriz para a amplificação por PCR™ usando o par de sequências iniciadoras FW001 e FW006. 0 produto de PCR™ foi limpo, digerido com PflMI, purificado em gel e ligado ao DNA do vector pEG1701 digerido com PflMI e purificado 5.22.2 PEG1720 e PEG1726 pEGl720 e pEG1726, contido em EG11234 e EG11241, respectivamente, foram construídos por substitução do fragmento PflMI-PflMI de cry3Bb em pEG1701 com o fragmento de PCR™ digerido com Pfim e purificado em gel, alterado nas posições nucleotídicas 859-885 de cry3Bb, codificador dos aminoácidos de 1α7,β1 287-295. A mutagénese quase ao acaso através de PCR™ foi usada para introduzir alterações nesta região. A sequência iniciadora MVT111, desenhada com um local Bsal, e a sequência iniciadora FW006 foram usadas para introduzir as alterações. A sequência iniciadora MVT094, também contendo um local Bsal, e a sequência iniciadora FW001 foram usadas para amplificar por PCR™ um fragmento adaptador. Os produtos de PCR™ foram digeridos com Bsal, purificados em gel e depois ligados uns aos outros. O produto ligado foi amplificado por PCR™ usando 238 ΡΕ1040192 o par de sequências iniciadoras FW001 e FW006, digerido com PflMI. 5.22.3 PEG1714, PEG1715, PEG1716, PEG1718, PEG1719, PEG1722, PEG1723, PEG1724 e PEG1725 pEGl714, pEGl715, pEG1716, pEG1718, pEG1719, pEG1722, pEG1723, pEG1724 e pEG1725, contidos em EG11228, EG11229, EG11230, EG11232, EG11233, EG11236, EG11237, EG11238 e EG11239, respectivamente, foram construídos por substitução do fragmento PflMI-PflMI do gene cry3Bb em pEG1701 com o fragmento de PCR™ digerido com PflMI e purificado em gel, alterado nas posições nucleotídicas 931-954 de cry3Bb, codificadoras dos aminoácidos de Ιβί,αδ 311-318. A mutagénese quase ao acaso através de PCR™ foi usada para introduzir alterações nesta região usando a sequência iniciadora MVT103 e a sequência iniciadora FW006. As sequências iniciadoras FW001 e FW006 foram usadas para amplificar um fragmento adaptador. Os produtos de PCR™ foram preenchidos usando Klenow e digeridos com BamH.1. 0 fragmento maior da digestão e FW001-FW006 foi purificado em gel, depois ligado ao fragmento MVT103-FW006 digerido. 0 produto ligado foi purificado em gel e amplificado por PCR™ usando o par de sequências iniciadoras FW001 e FW006. 0 produto amplificado foi digerido com PflMI e purificado em gel antes da ligação ao DNA vector pEG1701 digerido com PflMI e purificado. 239 ΡΕ1040192 5.22.4 PEG1701. Ιιβ2.3

Plasmídeos portadores de alterações da sequência selvagem de cry3Bb nos nucleótidos 1051-1065, codificadores da região estrutural Ιβ2,3 de Cry3Bb, foram construídos por substituição do fragmento Mlul-Spel de pEG1701 com o

produto de PCR™ isolado e digerido com MluI e Spel. O produto de PCR™ foi gerado por mutagénese quase ao acaso por PCR™, em que que a sequência iniciadora mutagénica MVT081 foi emparelhada com FW006. Estes plasmídeos como grupo foram designados pEG1701.1β2,3. 5.22.5 PEG1701.Ιιβ6, 7

Os plasmideos contendo mutações na sequência selvagem de cry3Bb nos nucleótidos 1234-1248, codificadores da região estrutural Ιββ, 7 de Cry3Bb, foram construídos por substituição do fragmento Mlul-Spel de pEG1701 com o

produto de PCR™ isolado e digerido com Mlu I e Spel. O produto de PCR™ foi gerado por mutagénese quase ao acaso através de PCR™ em que a sequência iniciadora mutagénica MVT085 foi emparelhada com WD115. O par de sequências iniciadoras MVT089 e WD112 foi usado para amplificar um fragmento adaptador. Ambos os produtos de PCR™ foram digeridos com Taql e ligados um ao outro. O produto de ligação foi purificado em gel e amplificado por PCR™ usando o par de sequências iniciadoras MVT089 e FW006. O produto amplificado foi digerido com MluI e Spel e ligado 240 ΡΕ1040192 ao DNA do vector digerido com MluI e SpeI e purificado. Estes plasmideos como grupo foram designados pEG1701.Ιββ, 7. 5.22.6 PEG1701, ΙιβΙΟ, 11

Plasmideos contendo sequências cry3Bb mutadas nos nucleótidos 1450-1467, codificadores da região estrutural ΙβΙΟ,ΙΙ de Cry3Bb, foram construídos por substituição do fragmento Mlul-Spel de pEG1701 com o produto de PCR™ isolado e digeridos com MluI e Spel. O produto de PCR™ foi gerado por mutagénese quase ao acaso através de PCR™ em que a sequência iniciadora mutagénica MVT105 foi emparelhada com MVT070. O par de sequências iniciadoras MVT092 e MVT083 foram usadas para amplificar um fragmento adaptador. (MVT083 é um oligonucleótido mutagénico desenhado para uma outra região. As alterações da sequência introduzidas por MVT083 foram removidas após digestão com enzimas de restrição e não têm impacto na alteração de cry3Bb na região ΙβΙΟ,11). Ambos os produtos de PCR™ foram digeridos com Bsal, ligados um ao outro e o produto de ligação amplificado por PCR™ usando o par de sequências iniciadoras MVT083 e MVT070. O produto de PCR™ resultante foi digerido com Spel e PstI e purificado em gel. Estes plasmideos como grupo foram designados pEG1701.ΙβΙΟ,11.

5.23 Exemplo 23 - Arrastamento de DNA

Arrastamento de DNA, como descrito por Stemmer (1994), foi usado para combinar alterações individuais no gene cry3Bb. 241 ΡΕ1040192 5.23.1 PEG1084, PEG1085, PEG1086 e PEG1087 pEGlΟ84, PEG1085, pEG1086 e pEG1087, contidos em EG11081, EG11082, EG11083 e EG11084, respectivamente, foram recuperados a partir de arrastamento de DNA. Resumidamente, os fragmentos de DNA PflMI foram gerados usando a série de sequências iniciadoras A e B e cada um dos plasmídeos pEGl707, pEGl714, pEG1715, pEG1716, pEG1041, pEG1046, pEG1047 e pEG1054 como matrizes de DNA. Os fragmentos de DNA resultantes foram reunidos em quantidades equimolares e digeridos com DNasel e fragmentos de DNA de 50-100 pb foram recuperados a partir de um gel de agarose através de três ciclos de congelação-descongelação: três min num banho de neve carbónica-etanol, seguido de descongelação completa a 50 °C. Os fragmentos de DNA recuperados foram montados por PCR™ sem sequências iniciadoras e amplificados por PCR™ usando a série de sequências iniciadoras A e B como descrito por Stemmer (1994). Os fragmentos de DNA finais amplificados foram cortados com PflMI e usados para substituir o fragmento de DNA PfIMI de cry3Bb correspondente em pEG1701. 5.24 Exemplo 24 - Técnicas de DNA Recombinante

Os procedimentos de DNA recombinante convencionais foram realizados essencialmente como descrito por Sambrook et ai. (1989). 242 ΡΕ1040192 5.24.1 PEG1717 pEG1717, contido em EG11231, foi construído por substituição do fragmento Bgl I pequeno de pEG1710 com o fragmento Bgll pequeno de pEG1714. 5.24.2 PEG1721 pEG1721, contido em EG11235, foi construído por substituição do fragmento Bgll pequeno de pEG1710 com o fragmento Bgll pequeno de pEG1087. 5.24.3 PEG1063 pEG1062, contido em EG11057, foi construído por substituição do fragmento de DNA NcoI contendo ori43 derivada de pEG1054 com o fragmento de DNA NcoI isolado contendo ori43 e as alterações em cry3Bb derivado de pEGl046 . 5.24.4 PEG1063 pEG1063, contido em EG11058, foi construído por substituição do fragmento de DNA iVcol contendo ori43 derivada de pEG1054 com o fragmento de DNA iVcol isolado contendo ori43 e as alterações em cry3Bb derivado de pEGl707. 243 ΡΕ1040192 5.24.5 PEG1095 PEG1095, contido em EG11095, foi construído por substituição do fragmento de DNA Mlul-Spel em pE1701 com o fragmento de DNA correspondente Mlul-Spel derivado de PEG1086. 5.25 Exemplo 25 - Sequências Iniciadoras Utilizadas na Construção de Variantes de Cry3Bb*

Estão apresentadas abaixo as sequências iniciadoras usadas para mutagénese dirigida por PCR™ triplex e PCR™ quase ao acaso para preparar as variantes cy3Bb* como descrito atrás. As sequências iniciadoras foram obtidas da Ranson Hill Bioscience, Inc. (Ramona, CA) e Integrated DNA Technologies, Inc. (Coralville, IA). A composição específica das sequências iniciadoras contendo degenerescências particulares num ou mais resíduos está apresentado na Secção 5.30, Exemplo 30. 5.25.1 Sequência Iniciadora FW001 (SEQ ID NO: 71) : 5'-AGACAACTCTACAGTAAAAGATG-3' 5.25.2 Sequência Iniciadora FW006 (SEQ ID NO: 72) : 5'-GGTAATTGGTCAATAGAATC-3' 244 ΡΕ1040192 5.25.3 Sequência Iniciadora MVT095 (SEQ ID NO: 73) : 5'-CAGAAGATGTTGCTGAATTCNNNCATAGACAATTAAAAC-3' 5.25.4 Sequência Iniciadora MVT097 (SEQ ID NO: 74) : 5'-GATGTTGCTGAATTCTATNNNAGACAATTAAAAC-3' 5.25.5 Sequência Iniciadora MVT091 (SEQ ID NO:75) : 5'-CCCATTTTATGATATTBDNTTATACTCAAAAGG-3' 5.25.6 Sequência Iniciadora MVT075 (SEQ ID NO: 76) :

5'-AGCTATGCTGGTCTCGGAAGAAAEFNFFNFJNJFJFJNFINJFJA AAAGAAGCCAAGATCGAAT-3' 5.25.7 Sequência Iniciadora MVT076 (SEQ ID NO: 77) : 5'-GGTCACCTAGGTCTCTCTTCCAGGAATTTAACGCATTAAC-3' 5.25.8 Sequência Iniciadora MVTlll (SEQ ID NO: 78) :

5'-AGCTATGCTGGTCTCCCATTTJEHIEJEJJEIIKRRJEHEIJEEN 111GT TAAAACAGAAC TAAC-3' 5.25.9 Sequência iniciadora MVT094 (SEQ ID NO: 79) : 5'-ATCCAGTGGGGTCTCAAATGGGAAAAGTACAATTAG-3' 245 ΡΕ1040192 5.25.10 Sequência Iniciadora MVT103 (SEQ ID NO: 80) : 5'-CATTTTTACGGATCCAATTTTTJFFFJNEEJEFNF JNFEILEIJE-OGGACCAACTTTTTTGAG-3' 5.25.11 Sequência Iniciadora MVT081 (SEQ ID NO: 81) : 5'-GAATTTCATACGCGTCTTCAACCTGGTJEHJJJIINMEEIEJTCT-TTCAATTATTGGTCTGG-3' 5.25.12 Sequência Iniciadora MVT085 (SEQ ID NO: 82) : 5'-AAAAGTTTATCGAACTATAGCTAATACAGACGTAGCGGCTJQQFF-NEEJIIJEEIGTATATTTAGGTGTTACG-3' 5.25.13 Sequência Iniciadora A (SEQ ID NO:83) 3B2PFLM1: 5'-GGAGTTCCATTTGCTGGGGC-3' 5.25.14 Sequência Iniciadora B (SEQ ID NO: 84) 3B2PFLM2: 5'-ATCTCCATAAAATGGGG-3' 5.25.15 Sequência Iniciadora C (SEQ ID NO: 85) 3B2165DG: 5'-GCGAAGTAAAAGAAGCCAAGGTCGAATAAGGG-3' 246 ΡΕ1040192 5.25.16 Sequência Iniciadora D (SEQ ID NO: 86 ) 3B216 0SKRD: 5'-CCTTTAAGTTTGCGAAATCCACACAGCCAAGGTCGAATAAGGG-3 5.25.17 Sequência Iniciadora E (SEQ ID NO: 87) 3B2290VP : 5'-CCCATTTTATGATGTTCGGTTATACCCAAAAGGGG-3' 5.25.18 Sequência Iniciadora F (SEQ ID NO: 88) 3B2EDA104 : 5'-GGCCAAGTGAAGACCCATGGAAGGC-3' 5.25.19 Sequência Iniciadora G (SEQ ID NO: 89) 3B2KG189: 5'-GCAGTTTCCGGATTCGAAGTGC-3' 5.25.20 Sequência Iniciadora WD112 (SEQ ID NO: 90) : 5'-CCGCTACGTCTGTATTA-3' 5.25.21 Sequência Iniciadora WD115 (SEQ ID NO: 91) : 5'-ATAATGGAAGCACCTGA-3' 5.25.22 Sequência Iniciadora MVT105 (SEQ ID NO: 92) :

5'-AGCTATGCTGGTCTCTTCTTAEJIFEIIEFFIJFIJIINACAATT CCATTTTTTACTTGG-3' 247 ΡΕ1040192 5.25.23 Sequência Iniciadora MVT092 (SEQ ID NO: 93) : 5'-ATCCAGTTGGGTCTCTAAGAAACAAACCGCGTAATTAAGC-3' 5.25.24 Sequência Iniciadora MVT070 (SEQ ID NO: 94) : 5'-CCTCAAGGGTTATAACATCC-3' 5.25.25 Sequência Iniciadora MVT083 (SEQ ID NO: 95) : 5'-GTACAAAAGCTAAGCTTTIEJIINPEEMEEIJNJESCGAACTATA-GCTAATACAG-3' 5.26 Exemplo 26 - Análise da Sequência dos Genes cry3Bb Alterados Células E. coli DH5a™ (GIBCO BRL, Gaithersburg, MD), JM110 e Sure™ (Stratagene, La Jolla, CA) foram por vezes usadas para amplificar DNA de plasmideo para sequenciação. Os plasmídeos foram usados para transformar estas células usando os procedimentos do fabricante. O DNA foi sequenciado usando o kit de sequenciação de DNA Sequenase® 2.0 adquirido a U.S. Biochemical Corporation (Cleveland, Ohio). Os plasmídeos descritos na secção 6, a sua respectiva divergência da sequência cry3Bb selvagem, as alterações de aminoácidos resultantes e o local das alterações da estrutura proteica estão apresentados na

Tabela 11. - 248 - ΡΕ1040192

Tabela 11

Alterações na Sequência de DNA dos Genes cry3Bb e Substituições de Ahinoácidos Resultantes das Proteínas Cry3Bb*

Plasraídeo Sequência de DNA cry3Bb* Sequência de aminoácidos Cry3Bb* Local da alteração estrutural pEG1707 A460T,C461T,A462T,C464A,T465C,T466C, T467A,A468T,A469T,G470C,T472C, T473G, G474T,A477T,A478T,G479C T154F,P155H,L156H,L158R lo3,4 pEG1708 T687C, T688C, A689T,C691A,A692G Y230L,H231S a6 pPEG1709 T667C,T687C,T688A,A689G,C591A,A692G S223P,Y230S a6 pEG1710 T687C,A692G H231R a6 PEG1711 T687C,C691A H231N,T241S aõ pEG1712 T687C,C691A,A692C,T693C H231T a6 pEG1713 C868A,G869A,G870T R290N Ια,βΐ pEG1714 C932T,A938C,T942G,G949A,T954C S311L,N313T,E317K Ιβί,αδ pEG1715 T931A, A933C,T942A,T945A,G949A,A953G, T954C S311T,E317K,Y318C Ιβί,αδ pEG1716 T931G,A933C,C934G,T945G,C946T,A947G, G951A,T954C S311A,L312,Q316W Ιβί,αδ - 249 - ΡΕ1040192

Tabela 11 (Continuação)

Plasnídeo Sequência de DNA cry3Bb* Sequência de aminoácidos Cry3Bb* Local da alteração estrutural pEG1717 T687C,A692G,C932T,A938C,T942G,G949A H231R, S311L,N313T,E317K αδ,Ιβί,αδ pEG1718 T931A,A933G,T935C,T936C,A938C,T939C S311T,L312P,N313T,E317N Ιβί,αδ PEG1719 T931G, A933C, T936G, T942C, C943T,T945A, C946G,G948C,T954C S311A,Q316D Ιβί,αδ pEG1720 T861C,T866C,C868A,T871CrT872G,A875T, T877A,C878G,A882G I289T,L291R,Y292F,S293R 1α7,β1 pEG1721 T687C,A692G,C932T H231R,S311L αδ,Ιβί,αδ pEG1722 T931A,C932T,A933C,T936C,T942G, T945A, T954C S311I Ιβί,αδ pEG1723 T931A,C932T,A933C,T936C,A937G,A938T, C941A,T942C,T945A,C946A,A947T, A950T, T954C S311I,N313H Ιβί,αδ pEG1724 A933C,T936C,A937G,A938T,C941A,T942C, T945A,C946A,A947T,A950T,T954C N313V,T314N,Q316M,E317V Ιβί,αδ - 250 - ΡΕ1040192

Tabela 11 (Continuação)

Plasiídeo Sequência de DNA cry3Hb* Sequência de aminoácidos Cry3Bb* Local da alteração estrutural pEG1725 A933T,A938G,T939G,T942A,T944C,T945A, N313R,L315P,Q316L,E317A Ιβί,αβ A947T,G948T,A950C,T954C pEG1726 A860T,T861C,G862A,C868T,G869T,T871C, Y287F,D288N,R290L 1α7,β1 A873T,T877A,C878G,A879T pEG1727 C868G,G869T R290V 1α7,β1 pEG1041 A494G D165G α4 pEG1046 G479A,A481C,A482C,A484C,G485A,A486C, S160N,K161P,P162H,D165G α4 A494G pEG1047 A865G,T877C I289V,S293P 1ο7,β1 PEG1052 G479A,A481C,A482C,A484C,G485A,A486C, S160NrK161P,P162H,D165G, α4,1α7,β1 A494G,A865G,T877C I289V,S293P PEG1054 Τ309Α,Δ310,Δ311,Δ312 D103E,AA104 la2a,2b pEG1057 A565G,A566G K189G 1α4,5 pEG1062 T309A,Δ310,Δ311,Δ312,G479A,A481C, D103E,AA104,S160N,K161P, Ia2a,2ba4 A482C,A484C,G485A,A486C,A494G P162H,D165G - 251 - ΡΕ1040192

Tabela 11 (Continuação)

Plasraídeo Sequência de DNA cry3Bb* Sequência de aminoácidos Cry3Bb* Local da alteração estrutural pEG1063 T309A,A310,A311,A312,A460T,C461T, A462T,C464A,T465C,T466C,T467A,A468T, A469T,G470C,T472C,T473G,G474T, A477T, A478T,G479C D103E,AA104,T154F,P155H, L156HrL158R Ia2a,2bla3,4 pEG1084 A494G,T931A,A933C,T942A,T945A,G949A, T954C D165G,S311T,E317K a4,lpl,o8 PEG1085 A494G,A865GrT877C,T914C,T931G,A933C, C934G,T945G,C946T,A947G,G951ArT954C, A1043G,T1094C S311A,L312V,Q316W,Q348R, V365A p203b pEG1086 A865G,T877C,A1043G I289V,S293P,Q348R 1ο7,ρΐ,β2 pEG1087 A494G,C932T D165G,S311L a4,lpl,a8 PEG1095 A1043G Q348R P2 252 ΡΕ1040192 5.27 Exemplo 27 - Expressão de Proteínas Cry3Bb* 5.27.1 Condições de Cultura

Preparou-se agar LB usando uma fórmula convencional (Maniatis et al., 1982). 0 agar de amido foi adquirido à Difco Laboratories (Detroit, MI) e suplementado com mais 5 g/1 de agar. 0 meio líquido C2 foi descrito por Donovan et al. (1988). 0 meio C2 foi por vezes preparado sem tampão fosfato (C2-P). Todas as culturas foram incubadas entre 25°C e 30°C; as culturas líquidas foram também agitadas a 250 rpm, até ter ocorrido esporulação e lise. 5.27.2 Condições de Transformação pEG1701 e seus derivados foram introduzidos em B. thuringiensis var. kurstaki EG7566 (Baum, 1994) ou EG10368 (Patente U.S. 5322687) acristalífera pelo método de electroporação de Macaluso e Mettus (1991). Nalguns casos, o método foi modificado como se segue para maximizar o número de transformantes. A estirpe recipiente de B. thuringiensis foi inoculada em infusão de cérebro coração mais 0,5% de glicerol a partir de um inoculo crescido durante a noite a 30°C em agar LB, crescida até uma densidade óptica de aproximadamente 0,5 a 600 nm, arrefecida em gelo durante 10 min, lavada 2x com EB e ressuspensa em 1/50 volumes de EB. As células transformadas foram seleccionadas em agar LB ou em agar de milho mais 5 253 ΡΕ1040192 μg/ml de cloranfenicol. 0 rastreio visual de colónias foi usado para identificar transformantes produtores de proteína do cristal; as colónias recombinantes foram geralmente mais opacas do que as colónias que não produziram proteína do cristal. 5.27.3 Designações de Estirpes e Proteínas

Um transformante contendo um gene cry3Bb* alterado codificador de uma proteína Cry3Bb* alterada foi designado por um número "EG", e.g., EG11231. A proteína

Cry3Bb* alterada foi designada Cry3Bb seguido do número da estirpe, e.g., Cry3Bb.11231. As colecções de proteínas com alterações num local estrutural foram designadas Cry3Bb seguido do local estrutural, e.g., Cry3Bb.1β2,3. A Tabela 12 apresenta os plasmídeos pertinentes para este invento, as novas estirpes de B. thuringiensis contendo os plasmídeos, a estirpe recipiente acristalífera de B. thuringiensis usada e as proteínas produzidas pelas novas estirpes. 5.28 Exemplo 28 - Geração e Caracterização de Cry3Bb-60 5.28.1 Geração de Cry3Bb-60 A estirpe EG7231 produtora de Cry3Bb (Patente U.S. 5187091) foi crescida em meio C2 mais 3 mg/ml de cloranfenicol. Após esporulação e lise, a cultura foi lavada com água e a proteína Cry3Bb purificada pelo método de 254 ΡΕ1040192 solubilização com NaBr e recristalização de Cody et al. (1992). A concentração proteica foi determinada pelo ensaio BCA Protein Assay (pierce, Rockford, IL). A proteina recristalizada foi solubilizada em 10 ml de KOH 50 mM por 100 mg de proteina Cry3Bb e tamponado para pH 9,0 com CAPS (ácido 3-[ciclo-hexilamino]-1-propanossulfónico) 100 mM, pH 9,0. A toxina solúvel foi tratada com tripsina numa proporção de peso de 50 mg de toxina para 1 mg de tripsina, entre 10 min e durante a noite, à temperatura ambiente. A tripsina cliva proteínas no lado carboxilo de resíduos de arginina e lisina disponíveis. Para o bioensaio de 8 doses, as condições de solubilização foram alteradas ligeiramente para aumentar a concentração proteica: KOH 50 mM foi adicionado gota a gota para 2,7 ml de uma suspensão a 12,77 mg/ml de Cry3Bb* purificada até ter ocorrido a solubilização do cristal. O volume foi então ajustado a 7 ml com CAPS 100 mM, pH 9,0.

Tabela 12

Plasmídeos Portadores de Genes Cry3Bb* Alterados Transformados em B.

THURINGIENSIS PARA EXPRESSÃO DE PROTEÍNAS CRY3BB* ALTERADAS

Designação do plasmídeo Nova estirpe BT Proteina expressa pEGl701 EG11204 WT Cry3Bb pEGl701 EG11037 WT Cry3Bb pEGl707 EG11221 Cry3Bb.11221 pEGl708 EG11222 Cry3Bb.11222 pEGl709 EG11223 Cry3Bb.11223 255 ΡΕ1040192

Tabela 12 (Continuação)

Designação do plasmídeo Nova estirpe BT Proteína expressa pEGl710 EG11224 Cry3Bb.11224 pEGl711 EG11225 Cry3Bb.11225 pEGl712 EG11226 Cry3Bb.11226 pEGl713 EG11227 Cry3Bb.11227 pEGl714 EG11228 Cry3Bb.11228 pEGl715 EG11229 Cry3Bb.11229 pEGl716 EG11230 Cry3Bb.11230 pEGl717 EG11231 Cry3Bb.11231 pEGl718 EG11232 Cry3Bb.11232 pEGl719 EG11233 Cry3Bb.11233 pEGl720 EG11234 Cry3Bb.11234 pEGl721 EG11235 Cry3Bb.11235 pEGl722 EG11236 Cry3Bb.11236 pEGl723 EG11237 Cry3Bb.11237 pEGl724 EG11238 Cry3Bb.11238 pEGl725 EG11239 Cry3Bb.11239 pEGl726 EG11241 Cry3Bb.11241 pEGl727 EG11242 Cry3Bb.11242 pEGl0 41 EG11032 Cry3Bb.11032 pEGl0 46 EG11035 Cry3Bb.11035 pEGl0 4 7 EG11036 Cry3Bb.11036 pEG1052 EG11046 Cry3Bb.11046 pEGl0 5 4 EG11048 Cry3Bb.11048 pEGl0 5 7 EG11051 Cry3Bb.11051 pEG1062 EG11057 Cry3Bb.11057 256 ΡΕ1040192

Tabela 12 (Continuação)

Designação do plasmídeo Nova estirpe BT Proteina expressa PEG1063 EG11058 Cry3Bb.11058 pEGl0 8 4 EG11081 Cry3Bb.11081 pEGl0 8 5 EG11082 Cry3Bb.11082 pEG1086 EG11083 Cry3Bb.11083 pEGl087 EG11084 Cry3Bb.11084 PEG1095 EG11095 Cry3Bb.11095 PEG1098 EG11098 Cry3Bb.11098 pEGl701.1β2,3 Colecção de estirpes sem designação Cry3Bb.1β2,3 pEGl7 01.1β 6,7 Colecção de estirpes sem designação Cry3Bb.1β6,7 pEGl701.1β10,11 Colecção de estirpes sem designação Cry3Bb.1β10,11 5.28.2 Determinação do Peso Molecular de Cry3Bb-60 0 peso molecular do fragmento predominante da digestão com tripsina de Cry3Bb foi determinado como sendo 60 KDa por análise de electroforese em gel de SDS-poliacrilamida (SDS-PAGE) usando marcadores de pesos moleculares comerciais. Este fragmento de digestão foi designado Cry3Bb-60. Não se observou qualquer outro produtos de clivagem de 60 KDa. 257 ΡΕ1040192 5.28.3 Determinação do Extremo NH2 de Cry3Bb-60

Para determinar a sequência terminal NH2 de Cry3Bb-60, o produto de digestão com tripsina foi frac-cionado por SDS-PAGE e transferido para membrana Immobilon™-P (Millipore Corporation, Bedford, MA) seguindo procedimentos de transferência Western convencionais. Após transferência, a membrana foi lavada duas vezes com água, depois corada com 0,025% de Coomassie Brilliant Blue R-250 mais 40% metanol durante 5 min, descorada com 50% de metanol e lavado em água. A banda Cry3Bb.60 foi removida com uma lâmina de barbear. A sequenciação terminal NH2 foi realizada em Tufts Medicai School, Department of Physiology (Boston, MA) usando processo de degradação de Edman automatizados convencionais. A sequência de aminoácidos terminal NH2 foi determinada como sendo SKRAQDR (SEQ ID NO:96), correspondendo aos aminoácidos 160-166 de Cry3Bb. A digestão com tripsina ocorreu no lado carboxilo do aminoácido R159 resultando na remoção de hélices 1-3. 5.29 Exemplo 29 - Bioactividade de Proteínas Cry3Bb* 5.29.1 Condições de Cultura e Determinação da Concentração Proteica

As culturas para os bioensaios de 1 dose foram crescidas em C2-P mais 5 μρ/ιηΐ de cloranfenicol (C2-P/cm5) depois diluído com 3 volumes de 0,005% de triton X-100®. As concentrações proteicas destas culturas não foram determinadas. As culturas para bioensaios de 8 doses foram 258 ΡΕ1040192 crescidas em C2/cm5, lavadas 1-2 vezes com 1-2 volumes de água estéril e ressuspensas em 1/10 volume de Triton X-100® a 0,005%. A concentração proteica da toxina de cada concentrado foi determinada como descrito por Brussock e Currier (1990), omitindo o tratamento com HEPES 3M. A concentração proteica foi ajustada a 3,2 mg/ml em 0,005% de Triton X-100® para a dose máxima do ensaio. Cry3Bb.60 foi produzida e guantificada através do ensaio de 8 doses como descrito na Secção 9.1. 5.29.2 Bioensaios de Insectos

Larvas de Diabrotica undecimpunctata Barber (lagarta da raiz do milho do sul ou SCWR) e Diabrotica virgifera virgifera LeConte (lagarta da raiz do milho do oeste ou WCRW) foram criadas como descrito por Slaney et ai. (1992). Ensaios de oito doses e análises "probit" foram realizados como descrito por Slaney et al. (1992). Trinta e duas larvas foram testadas por dose a 50 μΐ de amostra por alvéolo de dieta (área de superfície de 175 mm2) . Os controlos positivos foram estirpes produtoras de Cry3Bb EG11037 ou EG11204. Todos os bioensaios foram realizados usando placas de 128 alvéolos contendo aproximadamente 1 ml de dieta por alvéolo com coberturas de filme poliéster Mylar perfurada (C-D International Inc., Pitman, NJ). Realizaram-se ensaios de uma dose essencialmente como anteriormente, excepto ter-se testado apenas 1 dose por estirpe. Todos os ensaios foram repetidos pelo menos duas vezes. 259 ΡΕ1040192

5.29.3 Resultados de Bioensaios com Insectos : Ensaios de 1 Dose Contra SCRW

Os resultados dos ensaios de 1 dose são expressos como a mortalidade relativa (RM) da estirpe experimental comparada com a selvagem (% de mortalidade da cultura experimental dividida pela % de mortalidade da cultura WT). As proteínas Cry3Bb alteradas e melhoradas derivadas dos plasmideos construídos usando os métodos de PCR™ introduzindo alterações ao acaso ou semi ao acaso na sequência do gene cry3Bb foram distinguidas de outras proteínas Cry3Bb alteradas mas não melhoradas repetindo o ensaio de 1 dose contra larvas SCRW. As proteínas apresentando aumento de actividade (definido como RM > 1,5) comparativamente com WT Cry3Bb ou, no caso de proteínas com combinações de locais alterados, comparativamente com uma proteína Cry3BB alterada "parental", foram ainda caracterizados pelo ensaio de 8 doses. 0 "padrão" de RM global, produzido pelo ensaio de 1 dose resulta de uma colecção de proteínas portadoras de alterações ao acaso ou semi ao acaso dentro de uma única região estrutural, e.g., em 1β2,3, pode ser usado para determinar se aquela região estrutural é importante para a bioactividade. A retenção dos níveis de actividade WT (RM « 1) indica que são toleradas alterações naquela região. A perda global de actividade (RM < 19) distingue as regiões como importantes para a bioactividade. ΡΕ1040192

5.29.4 Cry3Bb. 1β2,3: Resultados de Bioensaios de 1 Dose Contra SCRW A proteína Cry3Bb.ip2,3 é uma colecção de proteínas na região 1β2,3 de Cry3Bb (ver secção 5.3.4). Resultados típicos dos ensaios de 1-dose destas proteínas alteradas estão apresentados na Fig. 12. Os valores de RM para Cry3Bb.^2,3 são inferiores a 1, com poucas excepções dos valores perto de 1, indicando que esta região é importante para a toxicidade.

5.29.5 Cry3Bb.1β6,7: Resultados de Bioensaios de 1 Dose Contra SCRW A proteína Cry3Bb.^6,7 é uma colecção de proteínas na região 1β6,7 de Cry3Bb (ver secção 5.3.5). Resultados típicos dos ensaios de 1-dose destas proteínas alteradas estão apresentados na Fig. 13. Os valores de RM para Cry3Bb.^6,7 são inferiores a 1, com poucas excepções dos valores perto de 1, indicando que esta região é importante para a toxicidade.

5.29.6 Cry3Bb.ΙβΙΟ,11: Resultados de Bioensaios de 1 Dose Contra SCRW A proteína Cry3Bb.ΙβΙΟ, 11 é uma colecção de proteínas na região ΙβΙΟ,11 de Cry3Bb (ver secção 5.3.6). Resultados típicos dos ensaios de 1-dose destas proteínas alteradas estão apresnetados na Fig. 14. Os valores de RM para Cry3Bb.Ιβί0,11 são inferiores a 1, com poucas excepções dos valores perto de 1, indicando que esta região é importante para a toxicidade. 261 ΡΕ1040192

5.29.7 Resultados de Bioensaios com Insectos : Resultados de Ensaios de 8 Doses Contra SCRW

Os resultados dos ensaios de 8 doses são expressos como um valor de LC50 (concentração proteica dando 50% de mortalidade) com intervalos de confiança de 95%. Os valores de LC50 com intervalos de confiança de 95% das proteínas Cry3Bb alteradas mostrando actividades aumentadas contra larvas SCRW e os valores de LC50 do controlo WT Cry3Bb determinado na mesma altura estão apresentados na Tabela 13, juntamente com o número de vezes de aumento relativamente à actividade WT para cada uma das proteínas melhoradas.

Tabela 13

Proteínas Cry3Bb Alteradas Foram Testadas Contra Larvas SCRW em Duplicados de Ensaios de 8 Doses para Determinar os Valores de LC50 LC50 μ9/3ΐνέο1ο (95% C.I.) Proteína Proteína WT Cry3Bb Numero de ve- melhorada melhorada controlo zes do aumento relativamente à Actividade de WT WT Cry3Bb.6 0 6,7(5,3-8,4) 24,1(15-39) 3,6x Cry3Bb.11221 3,2(2,5-4) 20,5(14,529) 6,4x Cry3Bb.11222 7,3(6-9) 29,4(23-37) 4, Ox Cry3Bb.11223 10,5(9-12) 29,4(23-37) 2,8x 262 ΡΕ1040192

Tabela 13 (Continuação)

Proteína melhorada LC50 μg/alvéolo (95% C.I.) Proteína melhorada WT Cry3Bb controlo Numero de vezes do aumento relativamente à Actividade de WT Cry3Bb.11224 6,5(5,1-8,2) 32,5(25-43) 5, Ox Cry3Bb.11225 13,7(11-16,8) 49,5 (39-65) 3,6x Cry3Bb.11226 16,7(10,62-4,2) 49,5 (39-65) 3, Ox Cry3Bb.11227 11,1(9,1-13,5) 21,3(16-28) 1,9x Cry3Bb.11228 00 1 kD O 00 32,9(25-45) 4, lx Cry3Bb.11229 7,2(5, 8-8,8) 18,2(15-22) 2,5x Cry3Bb.11230 7,0(5,8-8,6) 32,9(25-45) 4, 7x Cry3Bb.11231 3,3(3,0-3,7) 26,1(22-31) 7, 9x Cry3Bb.11232 6,4(5, 4-7, 7) 32,9(25-45) 5, lx Cry3Bb.11233 15,7(12-20) 32,9(25-45) 2,2x Cry3Bb.11234 7(6-9) 29(22-39) 4, lx Cry3Bb.11235 4,2 (3,6-4,9) 13,3 (10-17) 3,2x Cry3Bb.11236 11,6(9-15) 36,4(27-49) 3, lx Cry3Bb.11237 6,8(4-11) 36,4(27-49) 5, 4x Cry3Bb.11238 13,9 (11-17) 36,4(27-49) 2,6x Cry3Bb.11239 13,0(10-16) 36,4(27-49) 2, 8x Cry3Bb.11241 11(7-16) 29(22-39) 2,6x Cry3Bb.11242 11,9(9,2-16) 30(23-38) 2,5x Cry3Bb.11032 4,2 (3,6-4,9) 13,3 (10-17) 3, lx Cry3Bb.11035 10,3(8-13) 27, 9 (23-34) 2, 7x Cry3Bb.11036 6,5(5, 1-7,9) 27, 9 (23-34) 4,3x 263 ΡΕ1040192

Tabela 13 (Continuação) LC50 μg/alvéolo (95% C.I.) Proteína melhorada Proteína melhorada WT Cry3Bb controlo Numero de vezes do aumento relatívamente à Actividade de WT Cry3Bb.11046 12,1(8-19) 31,2(25-39) 2,6x Cry3Bb.11048 8,3 (6-11) 35,4(24-53) 4, 3x Cry3Bb.11051 11,8(8-16) 35,4(24-53) 3, Ox Cry3Bb.11057 8,8(7-11) 29,5(24-36) 3,4x Cry3Bb.11058 9,6(6-14) 33,4(27-43) 3,5x Cry3Bb.11081 8,5(7-11) 51,5(37-79) 6, lx Cry3Bb.11082 10,6(8-13) 51,5(37-79) 4, 9x Cry3Bb.11083 7,0(5-10) 51,5(37-79) 7, 4x Cry3Bb.11084 7,2 (4-12) 51,5(37-79) 7,2x Cry3Bb.11095 11,1(9-14) 51,5(37-79) 4,6x Cry3Bb.11098

5.29.8 Resultados de Bioensaios com Insectos : Ensaios de 8 Doses Contra WCRW

As larvas de WCRW são delicadas e difíceis de trabalhar. Assim, apenas algumas das Cry3Bb alteradas apresentando actividade melhorada contra larvas de SCWT foram igualmente testadas contra larvas de WCRW em ensaios de 8 doses. As determinações de LC50 para as proteínas Cry3Bb alteradas estão apresentadas na Tabela 14 juntamente 264 ΡΕ1040192 com os valores de LC50 do controlo WT Cry3Bb determinado na mesma altura.

Tabela 14

Proteínas Cry3Bb* Apresentando Actividade Melhorada Contra Larvas de SCRW Também Apresentam Actividade Melhorada Contra Larvas de WCRW LC50 μρ/alvéolo (95% C.I.) Proteína Proteína WT Cry3Bb Número de melhorada melhorada controlo vezes do aumento relativamente a WT EG11083 6,3(4,7-8,2) 63,5(46-91) 10, lx EG11230 24,2(13-40) 4,5(2,1-7,4) 5, 4x EG11231 32,2 (14-67) 2,5(1,7-3,6) 12, 9x 5.30 Exemplo 30 - Actividade de Canal

Os canais iónicos produzidos por Cry3Bb e alguns dos seus derivados foram medidos pelos métodos descritos por Slatin et al., (1990). Nalguns casos, as bicamadas lipidicas foram preparadas a partir de uma mistura de 4:1 de fosfatidiletanolamina (PE):fosfatidilcolina (PC). A proteína toxina foi solubilizada a partir de culturas de B. thuringiensis em meio C2 lavadas com KOH 12 mM. Após centrifugação para remover esporos e outros detritos, 10 μρ de proteína toxina solúvel foi adicionado ao compartimento cis (4,5 volumes) da câmara da membrana. A concentração protei- 265 ΡΕ1040192 ca foi determinada usando o ensaio BCA Protein Assay (Pierce). 5.30.1 Actividade de Canal Iónico de WT Cry3Bb

Quando da exposição a membranas de lipidos negras, Cry3Bb forma canais iónicos com vários estados de condutância. Os canais formados por Cry3Bb são raramente canais discretos com estados de abertura e fecho bem resolvidos e geralmente requerem incubação da toxina com a membrana durante 30-45 min antes de serem observados quaisquer eventos tipo canal. Após formação das condutân-cias iniciais, o tamanho aumenta entre aproximadamente 200 pS e mais de 10 000 pS durante 2-3 h. Apenas as pequenas condutâncias (< 200 pS) são dependentes de voltagem. Acima de 200 pS, as condutâncias são completamente simétricas. Os canais de Cry3Bb também apresentam activação dependente de β-mercaptoetanol, crescendo de condutâncias de pequenos canais de « 200 pS até vários milhares de pS dentro de 2 min após a adição de β-mercatoetanol ao compartimento cis da câmara de membranas. 5.30.2 Cry3Bb.11032 A actividade de canal de Cry3Bb.11032 é muito semlhante a WT Cry3Bb quando a proteína toxina solubilizada é adicionada ao compartimento cis da câmara de membranas. No entanto, quando esta proteína é artificialmente incorporada na membrana através da formação ou "pintura" da 266 ΡΕ1040192 membrana na presença da proteína Cry3Bb.11032, foi observado um aumento de 16 vezes nas condutâncias de canal iniciais (¾ 4000 pS) . Este fenómeno não foi observado com WT Cry3Bb. 5.30.3 Cry3Bb.11035

Quando da exposição a membranas artificiais, a proteína Cry3Bb.11035 forma espontaneamente canais que crescem para condutâncias maiores dentro de um tempo relativamente curto (~ 5 min) . Os valores de condutância variam entre 3000 e 6000 pS e, tal como WT Cry3Bb, são dependentes de voltagem em valores de condutância baixos. 5.30.4 Cry3Bb.11048 A proteína Cry3Bb.11048 é muito diferente de WT Cry3Bb pelo facto de parecer não formar canais mas, antes, forma poros simétricos relativamente à voltagem. Uma vez formado o poro, ele permanece aberto e permite uma condutância estável variando entre 25 e 130 pS. 5.30.5 Cry3Bb. 11224 e Cry3Bb. 11226 O local de ligação a metais de WT Cry3Bb, formado por H231 na estrutura dimérica, foi removido nas proteínas Cry3Bb.11224 e Cry3Bb.11226. As condutâncias formadas por proteínas alteradas são idênticas às de WT Cry3Bb com a 267 ΡΕ1040192 excepção de nenhuma das proteínas alteradas apresentar activação dependente de β-mercaptoetanol. 5.30.6 Cry3Bb.11221 A proteína Cry3Bb.11221 foi observada como formando imediatamente pequenos canais de 100-200 pS com dependência limitada da voltagem. Algumas condutâncias mais elevadas foram observadas no potencial negativo. Noutros estudos, o estabelecimento de actividade foi retardado em 27 min, que é mais típico para WT Cry3Bb. Ao contrário de WT Cry3Bb, no entanto, Cry3Bb.11221 forma canais de 600 pS bem resolvidos com longos estados de abertura. A proteína eventualmente atinge condutâncias de 700 pS. 5.30.7 Cry3Bb.11242 A proteína Cry3Bb.11242 forma pequenas condutâncias imediatamente quando da exposição a uma membrana artificial. A condutância cresce estavelmente e rapidamente até 6000 pS em aproximadamente 3 min. Alguma dependência da voltagem foi observada, com uma preferência para uma voltagem negativa imposta. 5.30.8 Cry3Bb.11230

Ao contrário de WT Cry3Bb, Cry3Bb.11230 forma canais bem resolvidos com longos estados de abertura que não continuam a crescer em condutância com o tempo. As 268 ΡΕ1040192 condutâncias máximas de canal observadas atingiram 3000 pS. FIG. 15 ilustra a diferença entre os canais formados por Cry3Bb e Cry3Bb.11230. 5.30.9 Cry3Bb.60

Cry3Bb.60 forma canais iónicos bem resolvidos dentro de 20 min de exposição a uma membrana artificial. Estes canais crescem em condutância e frequência com o tempo. O comportamento de Cry3Bb.60 numa bicamada lipídica planar difere de Cry3Bb em duas formas significativas. As condutâncias criadas por Cry3Bb.60 formam-se mais rapidamente do que Cry3Bb e, ao contrário de cry3Bb, as condutâncias são estáveis, tendo estados de abertura e fecho bem resolvidos de canais iónicos estáveis (FIG. 16). 5.31 Exemplo 31 - Composições de sequências iniciadoras

Tabela 15 SEQ ID NO:83 % de nucleótidos na mistura Código A T G C N 25 25 25 25

Tabela 16 SEQ ID NO:84 % de nucleótidos na mistura Código A T G C N 25 25 25 25 269 ΡΕ1040192

Tabela 17 SEQ ID NO:85 % de nucleótidos na mistura Código A T G C B 16 16 52 16 D 70 10 10 10 N 25 25 25 25 Tabela 18 SEQ ID NO:86 % de nucleótidos na mistura Código A T G C E 82 6 6 6 F 6 6 6 82 J 6 82 6 6 I 6 6 82 6 N 25 25 25 25 Tabela 19 SEQ ID NO:88 % de nucleótidos na mistura Código A T G C J 6 82 6 6 E 82 6 6 6 H 1 1 1 97 I 6 6 82 6 K 15 15 15 55 R 15 55 15 15 270 ΡΕ1040192

Tabela 20 SEQ ID NO:83 % de nucleótidos na mistura Código A T G C J 6 82 6 6 F 6 6 6 82 N 25 25 25 25 E 82 6 6 6 I 6 6 82 6 L 8 1 83 8 0 1 1 1 97 Tabela 21 SEQ ID NO:91 % de nucleótidos na mistura Código A T G C J 6 82 6 6 E 82 6 6 6 H 1 1 1 97 I 6 6 82 6 N 25 25 25 25 M 82 2 8 8 Tabela 22 SEQ ID NO:92 % de nucleótidos na mistura Código A T G C J 6 82 6 6 Q 0 9 82 9 F 6 6 6 82 N 25 25 25 25 E 82 6 6 6 I 6 6 82 6 271 ΡΕ1040192

Tabela 23 SEQ ID NO:92 Código % de nucleótidos na mistura A T G c J 6 82 6 6 F 6 6 6 82 N 25 25 25 25 E 82 6 6 6 I 6 6 82 6

Tabela 24 SEQ ID NO:95 % de nucleótidos na mistura Código A T G C J 6 82 6 6 N 25 25 25 25 E 82 6 6 6 I 6 6 82 6 M 82 2 8 8 P 8 2 8 82 S 1 97 1 1 5.32 Exemplo 32 - Coordenadas Atómicas Para Cry3Bb As coordenadas atómicas para a proteína Cry3Bb estão apresentadas no Apêndice incluído na Secção 9.1. 272 ΡΕ1040192

5.33 Exemplo 32 - Coordenadas Atómicas Para Cry3A

As coordenadas atómicas para a proteína Cry3A estão apresentadas no Apêndice incluído na Secção 9.2. 5.34 Exemplo 34 - Modificação de Genes cry para Expressão em Plantas.

Sabe-se que os genes cry selvagens são fracamente expressos em plantas como um gene de tamanho completo ou como um gene truncado. Tipicamente, o teor G+C de um gene cry é baixo (37%) e muitas vezes possui muitas regiões ricas em A+T, potenciais locais de poliadenilação e numerosas sequências ATTTA. A Tabela 25 mostra uma lista de potenciais sequências de poliadenilação que deverão ser evitadas quando da preparação da construção do gene "plantizado".

Tabela 25

Lista de sequências dos potenciais locais de poliadenilação

AATAAA1 AATAAT1 AACCAA ATATAA AATCAA ATACTA ATAAAA ATGAAA AAGCAT ATTAAT ATACAT AAAATA ATTAAA1 2 AATTAA1 1 AATACA1 1 CATAAA1 1 indica um potencial local de poliadenilação maior vegetal. 2 indica um potencial local de poliadenilação menor animal. 273 ΡΕ1040192

Todos os outros são potenciais locais de poliadenilaçao menor de plantas.

As regiões para mutagénese podem ser seleccio-nadas como se segue. Foram identificadas todas as regiões da sequência de DNA do gene cry contendo cinco ou mais pares de bases consecutivas que eram A ou T. Estes foram ordenados em termos de comprimento e percentagem mais elevada de A+T na sequência envolvente ao longo de uma região de 20-30 pares de bases. O DNA foi analisado relativamente às regiões que devem conter locais de poliadenilação ou sequências ATTTA. Foram então projectados oligonucleótidos que maximizam a eliminação de regiões consecutivas de A+T que continham um ou mais locais de poliadenilação ou sequências ATTTA. Demonstrou-se, com base em trabalhos publicados, que dois potenciais locais de poliadenilação são mais críticos. Foram seleccionados codões com G+C aumentado, mas que não geram locais para enzimas de restrição úteis para clonagem e montagem do gene modificado (e.g., BamHI, BglII, Seal, Ncol, EcoRI, etc.) Igualmente foram evitados codões que possuem os pares TA ou GC, os quais são descritos como sendo raros em plantas.

Se bem que o promotor CaMV35S seja geralmente um promotor constitutivo de elevado nível na maior parte dos tecidos vegetais, o nível de expressão dos genes dirigidos pelo promotor CaMV35S é baixo em tecido floral relativamente aos níveis observados em tecido foliar. Devido aos alvos economicamente importantes danificados por alguns 274 ΡΕ1040192 insectos serem as partes florais ou derivadas das partes florais (e.g., quartos e bolas de algodão, rebentos de tabaco, rebentos e frutos de tomateiro), é muitas vezes vantajoso aumentar a expressão de proteínas do cristal nestes tecidos relativamente à obtida com o promotor CaMV35S. 0 promotor 35S do vírus do mosaico da escrofu-lária (FMV) é análogo ao promotor de CaMV35S. Este promotor foi isolado e inserido num vector de transformação de plantas. Relativamente ao promotor CaMV, o promotor FMV 35S é altamente expresso no tecido floral, enquanto proporciona simultaneamente níveis elevados de expressão génica noutros tecidos tais como a folha. Pode ser construído um vector de transformação de plantas em que o gene cry sintético de tamamnho completo é dirigido pelo promotor 35S de FMV. As plantas do tabaco podem ser transformadas com o vector e comparadas relativamente à expressão da proteína do cristal por transferência Western ou imunoensaio de ELISA no tecido foliar e floral. 0 promotor FMV foi usado para produzir níveis relativamente elevados da proteína do cristal em tecido floral comparativamente com o promotor CaMV. 5.35 Exemplo 35 - Expressão de Genes cry Sintéticos com Promotores ssRUBISCO e Peptídeos de Trânsito para o Cloroplasto.

Os genes em plantas codificadores da subunidade pequena de RUBISCO (SSU) são muitas vezes altamente expressos, regulados pela luz e por vezes mostram especificidade 275 ΡΕ1040192 de tecido. Estas propriedades de expressão são largamente devidas às sequências do promotor destes genes. Foi possível usar os promotores SSU para expressar genes heterólo-gos em plantas transformadas. Tipicamente uma planta possuirá múltiplos genes SSU e os níveis de expressão e especificidade de tecido de diferentes genes SSU serão diferentes. As proteínas SSU são codificadas no núcleo e sintetizadas no citoplasma como precursores que possuem uma extensão N-terminal conhecida como peptídeo de trânsito para o cloroplasto (CTP) . CTP dirige o precursor para o cloroplasto e promove a internalização da proteína SSU para o cloroplasto. Neste processo, o CTP é clivado da proteína SSU. Estas sequências CTP foram usadas para dirigir as proteínas heterólogas para os cloroplastos das plantas transformadas.

Os promotores SSU deverão ter várias vantagens para a expressão de genes de proteínas heterólogas em plantas. Alguns promotores SSU são altamente expressos e podem originar níveis tão elevados como os observados com o promotor CaMV35S. A distribuição nos tecidos da expressão a partir de promotores SSU é diferente da do promotor CaMV35S, assim para o controlo de algumas pragas de insec-tos, poderá ser vantajoso dirigir a expressão de proteínas do cristal naquelas células em que SSU é mais altamente expresso. Por exemplo, se bem que relativamente constitutivo, na folha o promotor CaMV35S é mais altamente expresso em tecido vascular do que nalgumas partes da folha, enquanto que os promotores SSU são mais altamente expressos 276 ΡΕ1040192 nas células do mesófilo da folha. Alguns promotores SSU são igualmente mais específicos de tecido, assim será possível utilizar um promotor SSU específico para expressar a proteína do presente invento em apenas uma subsérie de tecidos vegetais se, por exemplo, a expressão de tal proteína em determinadas células for mais prejudicial para essas células. Por exemplo, para o controlo do escaravelho da batateira do Colorado, pode ser vantajoso usar os promotores SSU para dirigir a expressão da proteína do cristal nas folhas mas não no tubérculo comestível. A utilização de sequências CTP SSU para localizar proteínas do cristal no cloroplasto deverá ser igualmente vantajoso. A localização das proteínas do cristal de B. thuringiensis no cloroplasto poderá proteger estes de proteases encontradas no citoplasma. Isto poderá estabilizar as proteínas e conduzir a níveis mais elevados de acumulação da toxina activa. Os genes cry contendo o CTP poderão ser usados em combinação com o promotor SSU ou com outros promotores tais como CaMV35S. 5.36 Exemplo 36 - Direccionamento de Proteínas Cry* para o Espaço Extracelular ou Vacúolo através da Utilização de Peptídeos Sinal.

As proteínas de B. thuringiensis produzidas a partir dos genes sintéticos aqui descritos estão localizados no citoplasma da célula vegetal e esta localização citoplasmática resulta em plantas que são eficazes como insecticidas. Pode ser vantajoso para alguns fins dirigir 277 ΡΕ1040192 as proteínas de B. thuringiensis para outros compartimentos da célula vegetal. A localização das proteínas de B. thuringiensis em compartimentos diferentes do citoplasma pode resultar em menor exposição das proteínas de B. thuringiensis às proteases citoplasmáticas conduzindo a uma maior acumulação da proteína originando maior actividade insecticida. A localização extracelular poderá conduzir a exposição mais eficiente de certos insectos às proteínas de B. thuringiensis conduzindo a uma maior eficácia. Se uma proteína de B. thuringiensis for prejudicial para uma função da célula vegetal, então a localização num compartimento não citoplasmático poderá proteger estas células da proteína.

Em plantas, assim como noutros eucariotas, as proteínas que se destinam a ser localizadas extracelular-mente ou em vários compartimentos específicos são tipicamente sintetizadas com uma extensão N-terminal conhecida como o peptídeo sinal. Este peptídeo sinal dirige a proteína para a via de compatimentalização e é tipicamente clivado da proteína madura como um passo precoce da compartimentalização. Para uma proteína extracelular, a via secretória tipicamente envolve, durante a tradução, a inserção no retículo endoplasmático com clivagem do peptídeo sinal nesta fase. A proteína madura passa então através do Golgi para vesículas que se fundem com a membrana plasmática, resultando assim na libertação da proteína para o espaço extracelular. As proteínas destinadas a outros compartimentos seguem uma via semlhante. Por exemplo, 278 ΡΕ1040192 proteínas destinadas ao retículo endoplasmático ou ao Golgi seguem este esquema, mas são especificamente retidas no compartimento adequado. Nas plantas algumas proteínas são igualmente dirigidas para o vacúolo, um outro compartimento membranar no citoplasma de muitas células vegetais. As proteínas dirigidas para o vacúolo divergem da via atrás referida no Golgi onde entram em vesículas que se fundem com o vacúolo.

Uma característica comum deste direcionamento de proteínas é o peptídeo sinal que inicia o processo de compartimentalização. A fusão de um peptídeo sinal com uma proteína conduzirá, em muitos casos, ao direcionamento da proteína para o retículo endoplasmático. A eficiência deste passo pode depender igualmente da sequência da própria proteína madura. Os sinais que dirigem uma proteína para um compartimento específico em vez do espaço extracelular não está claramente definido. Parece que muitos dos sinais que dirigem a proteína para compartimentos específicos estão contidos dentro da sequência de aminoácidos da proteína madura. Isto foi demonstrado para algumas proteínas direccionadas para os vacúolos, mas não é ainda possível definir com precisão estas sequências. Parece que a secreção para o espaço extracelular é a via de "defeito" para uma proteína que contem uma sequência sinal mas sem outros sinais de compartimentalização. Assim, uma estratégia para dirigir as proteínas de B. thuringiensis para fora do citoplasma é fundir os genes de B. thu- 279 ΡΕ1040192 ringiensis sintéticos com sequências de DNA codificadoras de peptideos sinais vegetais conhecidos. Estes genes de fusão darão origem a proteínas de B. thuringiensis que entram na via secretória e conduzem à secreção extracelular ou direccionamento para o vacúolo ou para outros compartimentos. Têm sido descritas sequências sinal para vários genes vegetais. Uma dessas sequências é da proteína PRlb relacionada com a patogénese do tabaco que foi anterior-mente descrita (Cornelissen et al., 1986). A proteína PRlb está normalmente localizada no espaço extracelular. Um outro tipo de peptídeo sinal está contido nas proteínas de armazenamento de sementes dos legumes. Estas proteínas estão localizadas no corpo proteico das sementes, que é um compartimento do tipo vacúolo encontrado em sementes. Uma sequência de DNA de peptídeo sinal para a subunidade β da proteína de armazenamento 7S do feijão comum (Phaseolus vulgaris) , PvuB foi descrita (Doyle et al., 1986). Baseado nestas sequências publicadas, os genes podem ser sin-tetisados quimicamente usando oligonucleótidos que codificam os peptideos sinal de PRlb e PvuB. Nalguns casos para se conseguir secreção ou compartimentalização de proteínas heterólogas, pode ser necessário incluir uma sequência de aminoácidos para além do local de clivagem normal do peptídeo sinal. Isto pode ser necessário para assegurar a clivagem correcta do peptídeo sinal. 280 ΡΕ1040192 5.37 Exemplo 37 - Isolamento de Milho Transgénico Resistente a

Diabrotica spp. Usando Variantes de Cry3Bb. 5.37.1 Construção de Genes Vegetais A expressão de um gene vegetal, que existe na forma de DNA de cadeia dupla, envolve a transcrição de RNA mensageiro (mRNA) a partir de uma cadeia do DNA pela enzima RNA polimerase e subsequente processamento do transcrito primário de mRNA dentro do núcleo. Este processamento envolve uma região 3' não traduzida que adiciona nucleó-tidos poliadenilados ao extremo 3' do RNA. A transcrição do DNA em mRNA é regulada por uma região de DNA geralmente referida como o "promotor". A região do promotor contem uma sequência de bases que sinaliza a RNA polimerase para se associar ao DNA e iniciar a transcrição de mRNA usando uma das cadeias de DNA como uma matriz para preparar a cadeia de RNA correspondente.

Uma série de promotores que são activos em células vegetais foram descritos na literatura. Tais promotores podem ser obtidos a partir de plantas ou de virus de plantas e incluem, mas não estão limitados aos promotores da nopalina sintetase (NOS) e ocotpina sintetase (OCS) (os quais existem em plasmideo indutores de tumores de Agrobacterium tumefaciens) , os promotores 19S e 35S virus do mosaico da couve flor (CaMV), o promotor induzivel pela luz da subunidade pequena de ribulose 1,5-bifosfato carboxilase (ssRUBISCO, um polipeptídeo vegetal muito 281 ΡΕ1040192 abundante) e o promotor 35S do vírus do mosaico da escrofulária (FMV). Todos estes promotores foram usados para criar vários tipos de construções de DNA que foram expressos em plantas (ver e.g., Patente U.S. N° 5463175). 0 promotor particular seleccionado deverá ser capaz de causar suficiente expressão da sequência codificadora da enzima para resultar na produção de uma quantidade eficaz da proteína. Uma série de promotores preferidos são promotores constitutivos tais como os promotores CaMV35S ou FMV35S que dão níveis elevados de expressão na maior parte dos órgãos vegetais (Patente U.S. N° 5378619). Uma outra série de promotores preferidos são promotores estimulados na raiz ou promotores específicos tais como o promotor 4 as-1 derivado de CaMV ou o promotor P0X1 de trigo (Patente U.S. N°5023179; Hertig et ai., 1991). Os promotores estimulados ou específicos da raiz serão particularmente preferidos para o controlo da lagarta do milho (Diabroticus spp.) em plantas de milho transgénicas.

Os promotores usados nas construções de DNA (i.e. genes vegetais quiméricos) do presente invento podem ser modificados, caso se pretenda, para afectar as suas carac-terísticas de controlo. Por exemplo, o promotor CaMV35S pode ser ligado à porção do gene ssRUBISCO que reprime a expressão de ssRUBISCO na ausência de luz, para criar promotor que é activo em folhas mas não nas raízes. promotor quimérico resultante pode ser usado como aqui descrito. Para fins desta descrição, a frase promotor 282 ΡΕ1040192 "CaMV35" inclui assim variações do promotor CaMV35S, e.g., promotores derivados por meio de ligação a regiões de operador, mutagénese ao acaso ou controlada, etc. Ainda, os promotores podem ser alterados de forma a conterem múltiplas "sequências estimuladoras" para contribuir para o aumento da expressão génica. 0 RNA produzido por uma construção de DNA do presente invento também contem uma sequência líder 5' não traduzida. Esta sequência pode ser derivada do promotor seleccionado para expressar o gene e pode ser especifi-camente modificada de forma a aumentar a tradução do mRNA. As regiões 5' não traduzidas podem ser igualmente obtidas a partir do RNA virai, a partir de genes eucarióticos adequados ou a partir de uma sequência génica sintética. 0 presente invento não está limitado a construções em que a região não traduzida deriva da sequência 5' não traduzida que acompanha a sequência do promotor.

Para a expressão optimizada em plantas monoco-tiledóneas, tais como milho, deverá ser incluído um intrão na construção de expressão de DNA. Este intrão será tipicamente substituído perto do extremo 5' do mRNA na sequência não traduzida. Este intrão poderá ser obtido, mas não está limitado a uma série de intrões consistindo no intrão hsp70 de milho (Patente U.S. N° 5424412; especificamente aqui incorporado por referência) ou no intrão Actl de arroz (McElroy et al., 1990). Como se mostra abaixo, o intrão hsp70 do milho é útil no presente invento. 283 ΡΕ1040192

Conforme referido atrás, a região 3' não traduzida dos genes vegetais quiméricos do presente invento possuem um sinal de poliadenilação que funciona em plantas de forma a causar a adição dos nucleótidos adenilato ao extremo 3' do RNA. São exemplos de regiões 3' preferidas (1) as regiões 3' transcritas não traduzidas contendo o sinal de poliadenilação de genes do plasmídeo indutor de tumores em Agrobacterium (Ti), tais como o gene da nopalina sintetase (NOS) e (2) os genes de plantas tais como o gene ssRUBISCO E9 da ervilheira (Fischhoff et al., 1987). 5.37.2 Transformação e Expressão em Plantas

Um gene vegetal quimérico contendo uma sequência codificadora estrutural do presente invento pode ser inserido no genoma de uma planta por qualquer método adequado. Os vectores de transformação vegetais adequados incluem os derivados de um plasmídeo Ti de Agrobacterium tumefaciens, assim como os descritos, e.g., por Herrera-Estrella (1983), Bevan (1983), Klee (1985) e Publicação do Pedido de Patente Europeia N° EP0120516. Para além dos vectores de transformação de plantas derivados dos plasmídeos Ti ou indutores de raízes (Ri) de Agrobacterium, podem ser usados métodos alternativos para inserir as construções de DNA deste invento em células vegetais. Tais métodos podem envolver, por exemplo, a utilização de lipossomas, electroporação, agentes químicos que aumentam a internalização de DNA livre, introdução de DNA livre via 284 ΡΕ1040192 bombardeamento com microprojécteis e transformação usando vírus ou pólen (Fromm et al., 1986; Armstrong et al., 1990; Frommet al., 1990). 5.37.3 Construção de Vectores de Expressão de Plantas Monocotiledóneas para Variantes de cry3Bb 5.37.3.1 Projecção de Genes Variantes de cry3Bb para a Expressão em Plantas

Para a expressão eficiente das variantes cry3Bb em plantas transgénicas, o gene codificador das variantes deve ter uma composição de sequências adequada (Diehn et al., 1996). Um exemplo de tal sequência está apresentado para o gene vll231 (SEQ ID NO: 99) que codifica a proteína variante Cry3Bbll231 (SEQ ID NO:100) com actividade Diabrotica. Este gene foi obtido por mutagénese (Kunkel, 1985) de um gene cry3Bb sintético (SEQ ID NO: 101) codificador de uma proteína essencialmente homóloga da proteína codificada pelo gene cry3Bb nativo (Número de acesso do GenBank m89794, SEQ ID NO: 102). Os oligonucleótidos que se seguem foram usados na mutagénese do gene sintético original cry3Bb (SEQ ID NO:101) para criar o gene vll231 (SEQ ID NO:99):

Oligo#l: 5'-TAGGCCTCCATCCATGGCAAACCCTAACAATC-3' (SEQ ID NO:103) ΡΕ1040192 285 01igo#2: 5'-TCCCATCTTCCTACTTACGACCCTGCAGAAATACGGTCCAAC-3' (SEQ ID NO:104)

Oligo#3: 5'-GACCTCACCTACCAAACATTCGATCTTG-3' (SEQ ID NO:105)

Oligo#4: 5'-CGAGTTCTACCGTAGGCAGCTCAAG-3' (SEQ ID NO:106) 5.37.3.2 Construção do Vector de Expressão de Cry3Bb em Plantas Monocotiledóneas

Para colocar o gene variante de cry3Bb vll232 num vector adequado para a expressão em plantas monocotiledóneas (i.e. sob o controlo do promotor com estimulador 35S do vírus do mosaico da couve flor e ligado ao intrão hsp70 seguido de um local de poliadenilação da nopalina sintetase como na Patente U.S. N° 5424412, aqui incorporada especificamente como referência), o vector pMONl9469 foi digerido com NcoI e EcoRI. A banda maior do vector de apro-ximadamente 4,6 Kb foi sujeita a electroforese, purificada e ligada com DNA ligase de T4 ao fragmento NcoI-EcoRI de aproximadamente 2 Kb contendo o gene vll231 (SEQ ID NO:99). A mistura de ligação foi usada para transformada E. coli, recuperadas as colónias resistentes a carbenicilina e o DNA de plasmídeo recuperado pelo processo de minipreparação de 286 ΡΕ1040192 DNA. Este DNA foi sujeito a análise com enzimas de restrição, com enzimas tais como NcoI e EcoRI (em conjunto), NotI e PstI para identificar clones contendo pMON33708 (a sequência codificadora de vll231 fundida com o intrão hsp70 sob o controlo do promotor CaMV35S com estimulador).

Para colocar o gene vll231 num vector adequado para a recuperação de plantas estavelmente transformadas e resistentes a insectos, o fragmento de restrição iVotl de 3,75 Kb derivado de pMON33708, contendo a sequência codificadora da lisina oxidase fundida com o intrão hsp70 sob o controlo do promotor CaMV35S com estimulador, foi isolado por electroforese em gel e purificação. Este fragmento foi ligado a pMON30460 tratado com NotI e fosfa-tase alcalina intestinal de vitela (pMON30460 contem a sequência codificadora da neomicina fosfotransferase sob o controlo do promotor CaMV35S). As colónias resistentes à canamicina foram obtidas por transformação desta mistura de ligação em E. coli e as colónias contendo pMON33710 identificadas por digestão com endonucleases de restrição dos DNAs das minipreparações de plasmideo. Enzimas de restrição tais como NotI, EcoRV, HindIII, NcoI, EcoRI e f3g_Z.il podem ser usadas para identificar os clones adequados contendo o fragmento iVotl de pMON33708 no local Not I de pMON30460 (i.e. pMON3710) numa orientação tal que ambos os genes ficam em tandem (i.e. o extremo 3' da cassete de expressão vll231 fica ligado ao extremo 5' da cassete de expressão nptll). A expressão da proteína vll231 por pMON33710, em cloroplastos de milho, foi confirmada por electroporação de DNA de pMON33710 em protoplastos seguido de transferência 287 ΡΕ1040192 das proteínas e análise por ELISA. Este vector pode ser introduzido no DNA genómico de embriões de milho por bombardeamento com pistola de partículas, seguido de selecção com paromomicina para se obter plantas expressando o gene vll232 essencialmente como descrito na Patente U.S. N° 5424412, especificamente aqui incluído como referência.

Neste exemplo, o vector foi introduzido via cobombardeamento com um plasmídeo que confere resistência a higromicina em escutelos de embriões imaturos (IES) de milho, seguido de selecção com higromicina e regeneração. Linhas de milho transgénicas expressando a proteína vll231 foram identificadas por análise de ELISA. As sementes da progénie destes eventos foram subsequentemente testadas relativamente à protecção da alimentação por Diabrotica. 5.37.3.3 Desempenho in planta de Cry3Bb . 11231

As plantas de milho transformadas expressando Cry3Bb.11231 foram testadas com larvas da lagarta da raiz do milho ocidental (WCR) num ensaio de plantação de plântulas em vasos de 25,4 cm. 0 genótipo transformado foi A634, enquanto que a progénie do cruzamento RO com A634 foi avaliada. As observações incluíram o efeito no desenvolvimento larvar (peso), velocidade de destruição das raízes (RDR) e expressão proteica. 0 vector de transformação contendo o gene cry3Bb foi pMON33710. Os tratamentos incluíram isopopulações positivas e negativas para cada evento e um teste A634. 288 ΡΕ1040192 0 ensaio das plântulas consistiu nos seguintes passos: (i) sementes isoladas foram colocadas em copos de 1 onça contendo terra de envasamento; (ii) quando do rebentamento, cada plântula foi infestada com 4 larvas recém eclodidas; e (iii) após infestação, as plântulas foram incubadas durante 7 dias a 25°C, 50% RH e 14:10 (L:D) de fotoperiodo. A humidade adequada foi aplicada ao solo dos vasos durante o periodo de incubação para manter o vigor da plântula. O ensaio dos vasos de 10 polegadas consistiu nos seguintes passos: (i) sementes isoladas foram colocadas em vasos de 10 polegadas contendo terra de envasamento; (ii) aos 14 dias após sementeira, cada vaso foi infestado com 800 ovos, os quais tinham sido pré-incubados de forma a que a eclosão ocorresse 5-7 dias após infestação; e (iii) após infestação, as plantas foram incubadas durante 4 semanas nas mesmas condições ambientais do ensaio das plântulas. Os vasos foram irrigados por baixo e por cima diariamente.

Para o ensaio das plântulas, no dia 7 as plantas foram classificadas de acordo com a destruição da raiz e as larvas sobreviventes foram pesadas. Igualmente nesta altura, as concentrações da proteína Cry3Bb nas raízes foram determinadas por ELISA. A escala usada para o ensaio das plântulas para avaliar a destruição das raízes é como se segue: RDR (taxa de destruição da raiz) 0 = sem alimentação visível; RDR 1 = alimentação muito ligeira; RDR 2 = alimentação ligeira; RDR 3 = alimentação moderada; RDR 4= alimentação abundante; e RDR 5 = alimentação muito abundante. 289 ΡΕ1040192

Os resultados do ensaio das plântulas estão apresentados na Tabela 26. As plantas expressando a proteína Cry3Bb foram completamente protegidas da alimentação por WCR, enquanto que as larvas que sobreviveram a este tratamento não tinham crescido. Os pesos médios das larvas variaram entre 2,03 e 2,73 mg para os tratamentos sem expressão, enquanto que as larvas sobreviventes pesavam em média 0,11 g no tratamento com expressão de cry3Bb. As taxas de destruição de raízes foram 3,86 e 0,33 para as isopopulações sem expressão e com expressão, respectivamen-te. A sobrevivência larvar variou entre 75 e 85% para os tratamentos negativos e a testar, em que apenas 25% das larvas sobreviveram ao tratamento com Cy3Bb.

Tabela 26

Efeito de Plantas que Expressam Cry3Bb nas Larvas WCR num Ensaio com

Plântulas

Plantas Larvas Evento Tratamento N Raiz RDR+DP N % Média+DP (ppm) Sob peso (mg) 16 Negativo 7 O O 3,86+0,65 21 75 2,73+1,67 16 Positivo 3 29,01 0,33+0,45 3 25 0,11+0,07 A634 Teste 4 O O - 13 81 2,03+0,83

Para o ensaio dos vasos (25,4 cm), às 4 semanas após infestação o peso das plantas foi registado e foi 290 ΡΕ1040192 atribuída uma classificaçao de destruição das raízes (Escala 1-6 de Iowa; Hills e Peters, 1971) .

Os resultados do ensaio com os vasos de 25,4 cm estão apresentados na Tabela 27. As plantas que expressavam a proteína Cry3Bb tinham significativamente menos alimentação e estavam mais altas do que as plantas que não expressavam a proteína. O evento 16, o mais elevado dos dois eventos de expressão proporcionou quase controlo completo. Os tratamentos negativos tiveram taxas de destruição de raízes muito elevadas indicando uma pressão muito grande pelos insectos. As avaliações de destruição média de raízes positivas foram de 3,4 e 2,2 para o evento 6 e 16, respectivamente. RDR média para o tratamento negativo foi de 5,0 e 5,6.

Tabela 27

Efeito do Milho que Expressa Cry3Bb no Controlo da Alimentação das Larvas WCR num Ensaio com Vasos de 10 Polegadas

Evento Tratamento N Raiz (ppm) RDR±DP Altura da planta (cm) 6 Negativo 7 O O 5,0+1,41 49,7+18,72 6 Positivo 5 7,0 3,4+1,14 73,9+8,67 16 Negativo 5 O o 5,6+0,89 61,2+7,75 16 Positivp 5 55, 0 2,2+0,84 83,8+7,15

Resumindo, as plantas de milho expressando proteína Cry3Bb possuem um efeito biológico significativo no desenvolvimento de larvas WCR, conforme ilustrado no ensaio com vasos de 10 polegadas. 291 ΡΕ1040192 6.0 Breve descrição dos identificadores de sequências SEQ ID NO:l Sequência de DNA do gene cry3Bb.11221. SEQ ID NO: 2 Sequência de aminoácidos do polipeptídeo Cry3Bb.11221. SEQ ID NO:3 Sequência de DNA do gene cry3Bb.11222. SEQ ID NO: 4 Sequência de aminoácidos do polipeptídeo Cry3Bb.11222. SEQ ID NO:5 Sequência de DNA do gene cry3Bb.11223. SEQ ID NO: 6 Sequência de aminoácidos do polipeptídeo Cry3Bb.11223. SEQ ID NO:7 Sequência de DNA do gene cry3Bb.11224. SEQ ID NO: 8 Sequência de aminoácidos do polipeptídeo Cry3Bb.11224. SEQ ID NO: SEQ ID NO: Cry3Bb.11225. SEQ ID NO: SEQ ID NO: Cry3Bb.11226. SEQ ID NO: SEQ ID NO: Cry3Bb.11227. SEQ ID NO: SEQ ID NO: Cry3Bb.11228. SEQ ID NO: SEQ ID NO: 9 Sequência de DNA do gene cry3Bb.11225. 10 Sequência de aminoácidos do polipeptídeo 11 Sequência de DNA do gene cry3Bb.11226. 12 Sequência de aminoácidos do polipeptídeo 13 Sequência de DNA do gene cry3Bb.11227. 14 Sequência de aminoácidos do polipeptídeo 15 Sequência de DNA do gene cry3Bb.11228. 16 Sequência de aminoácidos do polipeptídeo 17 Sequência de DNA do gene cry3Bb.11229. 18 Sequência de aminoácidos do polipeptídeo

Cry3Bb.11229. ΡΕ1040192 292 SEQ ID NO:19 Sequência de DNA do gene SEQ ID NO:20 Sequência de aminoácidos Cry3Bb.11230. SEQ ID NO:21 Sequência de DNA do gene SEQ ID NO:22 Sequência de aminoácidos Cry3Bb.11231. SEQ ID NO:23 Sequência de DNA do gene SEQ ID NO:24 Sequência de aminoácidos Cry3Bb.11232. SEQ ID NO:25 Sequência de DNA do gene SEQ ID NO:26 Sequência de aminoácidos Cry3Bb.11233. SEQ ID NO:2 7 Sequência de DNA do gene SEQ ID NO:28 Sequência de aminoácidos Cry3Bb.11234. SEQ ID NO:29 Sequência de DNA do gene SEQ ID NO:30 Sequência de aminoácidos Cry3Bb.11235. SEQ ID NO:31 Sequência de DNA do gene SEQ ID NO:32 Sequência de aminoácidos Cry3Bb.11236. SEQ ID NO:33 Sequência de DNA do gene SEQ ID NO:34 Sequência de aminoácidos Cry3Bb.11237. SEQ ID NO:35 Sequência de DNA do gene SEQ ID NO:36 Sequência de aminoácidos Cry3Bb.11238. SEQ ID NO:3 7 Sequência de DNA do gene SEQ ID NO:38 Sequência de aminoácidos cry3Bb.11230 . do polipeptídeo cry3Bb.11231. do polipeptídeo cry3Bb.11232. do polipeptídeo cry3Bb.11233. do polipeptídeo cry3Bb.11234. do polipeptídeo cry3Bb.11235. do polipeptídeo cry3Bb.11236. do polipeptídeo cry3Bb.11237. do polipeptídeo cry3Bb.11238. do polipeptídeo cry3Bb.11239. do polipeptídeo

Cry3Bb.11239. ΡΕ1040192 293 SEQ ID NO:39 Sequência de DNA do gene SEQ ID NO:40 Sequência de aminoácidos Cry3Bb.11241. SEQ ID NO:41 Sequência de DNA do gene SEQ ID NO:42 Sequência de aminoácidos Cry3Bb.11243. SEQ ID NO:43 Sequência de DNA do gene SEQ ID NO:44 Sequência de aminoácidos Cry3Bb.11032. SEQ ID NO:45 Sequência de DNA do gene SEQ ID NO:46 Sequência de aminoácidos Cry3Bb.11035. SEQ ID NO:47 Sequência de DNA do gene SEQ ID NO:48 Sequência de aminoácidos Cry3Bb.11036. SEQ ID NO:49 Sequência de DNA do gene SEQ ID NO:50 Sequência de aminoácidos Cry3Bb.11046. SEQ ID NO:51 Sequência de DNA do gene SEQ ID NO:52 Sequência de aminoácidos Cry3Bb.11048 . SEQ ID NO:53 Sequência de DNA do gene SEQ ID NO:54 Sequência de aminoácidos Cry3Bb.11051. SEQ ID NO:55 Sequência de DNA do gene SEQ ID NO:56 Sequência de aminoácidos Cry3Bb.11057. SEQ ID NO:57 Sequência de DNA do gene SEQ ID NO:58 Sequência de aminoácidos cry3Bb.11241. do polipeptídeo cry3Bb.11242. do polipeptídeo cry3Bb.11032. do polipeptídeo cry3Bb.11035. do polipeptídeo cry3Bb.11036. do polipeptídeo cry3Bb.11046. do polipeptídeo cry3Bb.11048. do polipeptídeo cry3Bb.11051. do polipeptídeo cry3Bb.11057. do polipeptídeo cry3Bb.11058. do polipeptídeo

Cry3Bb.11058. 294 ΡΕ1040192 SEQ ID NO:59 Sequência SEQ ID NO:60 Sequência Cry3Bb.11081. SEQ ID NO:61 Sequência SEQ ID NO:62 Sequência Cry3Bb.11082. SEQ ID NO:63 Sequência SEQ ID NO:64 Sequência Cry3Bb.11083. SEQ ID NO:65 Sequência SEQ ID NO:66 Sequência Cry3Bb.11084. SEQ ID NO:6 7 Sequência SEQ ID NO:68 Sequência Cry3Bb.11095. SEQ ID NO:69 Sequência SEQ ID NO:70 Sequência Cry3Bb.60. SEQ ID NO:71 Sequência SEQ ID NO:72 Sequência SEQ ID NO:73 Sequência SEQ ID NO:74 Sequência SEQ ID NO:75 Sequência SEQ ID NO:76 Sequência SEQ ID NO:77 Sequência SEQ ID NO:78 Sequência SEQ ID NO:79 Sequência SEQ ID NO:80 Sequência SEQ ID NO:81 Sequência SEQ ID NO:82 Sequência de DNA do gene cry3Bb.11081. de aminoácidos do polipeptídeo de DNA do gene cry3Bb.11082. de aminoácidos do polipeptídeo de DNA do gene cry3Bb.11083. de aminoácidos do polipeptídeo de DNA do gene cry3Bb.11084. de aminoácidos do polipeptídeo de DNA do gene cry3Bb.11095. de aminoácidos do polipeptídeo de DNA do gene cry3Bb.60. de aminoácidos do polipeptídeo iniciadora FW001. iniciadora FW006. iniciadora MVT095. iniciadora MVT097. iniciadora MVT091. iniciadora MVT075. iniciadora MVT076. iniciadora MVT111. iniciadora MVT094. iniciadora MVT103. iniciadora MVT081. iniciadora MVT085. PE1040192 — 295 - SEQ ID NO: 83 Sequência iniciadora A. SEQ ID NO: 84 Sequência iniciadora B. SEQ ID NO: 85 Sequência iniciadora C. SEQ ID NO: 86 Sequência iniciadora D. SEQ ID NO: 87 Sequência iniciadora E . SEQ ID NO: 88 Sequência iniciadora F . SEQ ID NO: 89 Sequência iniciadora G. SEQ ID NO: 90 Sequência iniciadora WD112. SEQ ID NO: 91 Sequência iniciadora WD115. SEQ ID NO: 92 Sequência iniciadora MVT105. SEQ ID NO: 93 Sequência iniciadora MVT092. SEQ ID NO: 94 Sequência iniciadora MVT 0 7 0. SEQ ID NO: 95 Sequência iniciadora MVT 0 83. SEQ ID NO:96 Aminoácido N-terminal do polipeptídeo Cry3Bb. SEQ ID NO:97 Sequência de DNA do gene cry3Bb selvagem. SEQ ID NO:98 Sequênca de aminoácidos do plipeptídeo Cry3Bb selvagem. SEQ ID NO: 99 Sequência de DNAplantizada para o gene cry3Bb.11231. SEQ ID NO:100 Sequência de aminoácidos do polipeptídeo plantizado Cry3Bb.11231. SEQ ID NO: 101 Sequência de DNA do gene cry3Bb usado para preparar SEQ ID NO:99. SEQ ID NO:102 Sequência de DNA do gene cry3Bb selvagem, Genbank #M89794. SEQ ID NO:103 Sequência de DNA de Oligo #1. SEQ ID NO:104 Sequência de DNA de Oligo #2. SEQ ID NO:105 Sequência de DNA de Oligo #3. 296 ΡΕ1040192 SEQ ID NO:106 Sequência de DNA de Oligo #4. SEQ ID NO:107 Sequência de DNA do gene cry3Bb.11089. SEQ ID NO:108 Sequência de aminoácidos do polipeptídeo Cry3Bb.11098. 7.0 Referências

As referências que se seguem, proporcionam exemplos de processos ou outros detalhes suplementares aos aqui descritos.

Patente U.S. 4237224, concedida em 2 de Dezembro, 1980. Patente u. s. 4332898, concedida em 1 de Junho, 1982. Patente U.S. 4342832, concedida em 3 de Agosto, 1982. Patente U.S. 4356270, concedida em 26 de Out., 1982. Patente U.S. 4362817, concedida em 7 de Dez., 1982. Patente U.S. 4371625, concedida em 1 de Fev., 1983. Patente U.S. 4448885, concedida em 15 de Maio, 1984. Patente U.S. 4467036, concedida em 21 de Ago., 1984. Patente U.S. 4554101, concedida em 19 de Nov., 1985. Patente U.S. 4683195, concedida em 28 de Jul., 1987. Patente U.S. 4683202, concedida em 28 de Jul., 1987. Patente U.S. 4757011, concedida em 2 de Jul., 1988. Patente U.S. 4766203, concedida em 23 de Agosto, 1988. Patente U.S. 4769061, concedida em 6 de Setembro, 1988. Patente U.S. 4797279, concedida em 10 de i Janeiro, 1989. Patente U.S. 4800159, concedida em 24 de i Janeiro, 1989. Patente U.S. 4883750, concedida em 28 de Novembro, 1989. Patente U.S. 4910016, concedida em 20 de Março, 1990. Patente U.S. 4965188, concedida em 23 de Out., 1990. - 297 - ΡΕ1040192

Patente U. S. 4971908, concedida em 20 de Nov., 1990 . Patente U. S. 4987071, publicado em 22 de Jan., 1991. Patente U. S. 5380831, publicado em 10 de Jan., 1995. Patente U. S. 5023179, publicado em 11 de Junho, 1991. Patente U. S . 5024837, publicado em 18 de Junho, 1991. Patente U. S . 5126133, publicado em 30 de Jun. , 1922 . Patente U. S . 5176995, publicado em 15 de Out. , 1991. Patente U. S . 5187091, publicado em XXXXX , 1993. Patente U. S . 5322687, publicado em 21 de Junho, 1994 . Patente u. s. 5334711, publicado em 2 de . Ago., 1 994 . Patente u. s. 5378619, publicado em 3 de Janeiro , 199Ϊ Patente u. s. 5424412, publicado em 3 de Junho, 1995. Patente u. s. 5441884, publicado em 15 de Ago. , 1995 . Patente U.S. ! 5463175, publicado em 31 de ( Outubro . 1995 Patente u. s. 5500365, publicado em 19 de Março, 1996 . Patente U.S. 5591616, publicado em 7 de Janeiro , 199: Patente U.S. 5631359, publicado em 20 de Maio, 1997 . Patente U.S. 5659123, publicado em 19 de Agosto , 199: Pat. Eur O N° EP 0120516. Pat. Eur o N° EP 0360257. Ped. Pat . Eur . N° 92110298.4. Ped. Pat . Eur . N° 295156A1. Patente da Gr ã Bretanha 2202328. Ped. Pat . Int . Publ. N° WO 91/03 162 • Ped. Pat . Int . Publ. N° WO 92/07 065 • Ped. Pat . Int . Publ. N° WO 93/15 187 • Ped. Pat . Int . Publ. N° WO 93/23 569 • Ped. Pat . Int . Publ. N° WO 94/02 595 • Ped. Pat . Int . Publ. N° WO 94/13 688 • Ped. Pat . Int . Publ. N° PCT/US87 /00880 . 298 ΡΕ1040192

Ped. Pat. Int. Publ. N° PCT/US89/01025. Ped. Pat. Int. Publ. N° WO 88/09812 . Ped. Pat. Int. Publ. N° WO 88/10315. Ped. Pat. Int. Publ. N° WO 89/06700. Ped. Pat. Int. Publ. N° WO 93/07278. Âbboít, "A methed fôr computíag tbe efíectivenesjs sfaa rnsectieide," J. Ecm. Ente- mel., 18:265-267* 1925. Ábduílafe et al, Btomhmíogy, 4:1087,1986. âlmond and Bean, BímhmúPy\ 32:S04CMÔ46, I9f$, Áxuitai, EMBQ·!,, 4:277-287,1985. ai«/ al, FM.MS Micrúèioí. Lett 7111:255-262, im ííig ef «f., Ftoif Çd? , 9:3 3S-339,1990.

Afonso®, Wa, Zhang* *M»tagenesis. of spectôcííy and. loxicity regicns of a Badttw iktsríwgiemls protoxm gene,” J, Bac&riel., 177:4059-4065,1995,

Bagdô&ãriân d &l, úmeT 16:237,1981..

Baum eíeÍ.,ÂppL Bmimn. M&wèml, $6:3420*3428,1900.

Baum» *Tn540í, a new dess lí tfansposább eiemeiit Hom Bacillus thuringiemis* J, terM, 176:2835-2845,1994. B&om, J, BaziertúL, 177:4036-4042,1995,

Baams Ka&çfbda, Oatwtm-Suffce, "SngííiÉerirtg B&etfim ihmngtensis Bloinseciicides wilh ars fndigénoiis Site-Specilk Recombination System," Âppl. Emítm, Mt~ crobM. 62:XXX«XXX* 1996.

Benbrook ei dL „ In; Prmméifígs Sm Εψύ JM&, Btmerwotfh* Stonebam, MA, pp. 27-54,1986,

Bsvarm 3:04:184,1983,

Bolivar*/ ΰ/„ Ckm, 2:95,1977,

Bntnden and Τοοχο, "íntrodactim to Prntsrn Struciure* Oarland PubSíshing, lac, ' .New York* NY, 1991,

Smssock and Cunrier» "Use of sediam dodêeyl swlíiBS-põiâe^áràide gel efeeíropho-resís lo qoantífy BmMm ihwingiensis â-endoíaxms,1* Ar st4nalytieal Qhemis-tty of Mmíilm tkirmgwmis* LA. Hiokle and W,L Fiteh, fBife), American Chemical Socfety, Washington D. C.» pp. 78-87,1990.. 299 ΡΕ1040192

Capeedú, lsffigb elldeacy iraasfarniMlon by direet mícreinjeeifon of.DNA. mm eub íured mãmaoaiían ceils,'5 €$U, 22(2):479-988, !f$0.

Caramorij Aífeertiai, (3sU, "ϋ» w gêiteimkí» of bybrMs between tw Bã&llm thuringtexsís ínsecl-tOKin-enc-odía^ gemes,,w (&M, 98:37-44, 199! Cashmore eí âi5 €kn. Êtog. &f Pi-mus, Plemiiti Press, New York, 29-38 Oiambeis ar ot,Âppt.. Mmfcm, Mícmbml, 173:396^3976, 199L Chau tt &LScimee* 244:Ϊ74-18 1, im

Chenet a£, Nuci Aetôsftes^ 20:4581-9,1992,

Cheo, Curtis®* Alcantara* Dean» "Mutatíoms m domaía 1 of Beeiffus ikmingkmis &· endoíoxin CiylAb reduee the kreversibíe bsndlng of teia to Mmémã Mxtã hrash border membrana veskks^ ,/. Btol CMm*, 270:841245419» 1995,

Cbeti, Iôê» Dean, "Site-directed moiadom in a higlly eoa.gorved teglon of Boeitim tfmrmgmmis S~e®do!oxiJi afíbçt lahibition of sitort draàí current aeness 3mn-$ja? m&rt mídgUiã,” Prúc, Netl Ácod Scí USA, 96:9041-9045, 1993.

Cbowtim sad Burke, NwL AeMt Res,t 20:2835-2840,1992.

Clapp, "Soiaatàc gene therapy into laematopoiettc cdds.. Orneai sdatus and fb&ire tm-jplicafíoits,* Cim. PtrinotoL, 20(1):355-168,3993, €ody, L«ft, Jeoses, Fangbom BsiglMs, *PmficMkm and aEystsllia»t*oa of msecttcíd&l ê-mdetsxin CryíIIB2 finas SoeUlus thuriHgwnsis" PrtMeinsr: Struct. Fmct Gênêt* 14:324,3992.

CeUins and Olive, Btochem.·, 32:2795-2799,1993.

Conway and Wkfcem, In: MNA Pt®ms$mg, p, 40, Cold Spriag Harbor Lai Cold Spríng Harbo^NY* 1981

Gomelissea ef «f, "A icbacco mosak viras-induced tobaeco petem ís homologoos to lhe sweeHastkig protela fh&umaíra*" Naturet 321(6069):53.1*532,1986, Cíãroer, Ceáeft, Mernlit Song, "Straetee Md dyrtâamcs of the ooiiem EI chamei,* Motee. Mkr&btol, 4:519-524 1990, CRC Bnndbaok of Cbemistry and Pbysks* 58a* edítron» CRC Press* íne,, Cleveland*

CnskmetaÍ^ Phm Pfysio^ È7:ê7l~ê74} 1988, 300 ΡΕ1040192 C«rid» Agarwai* Wagner, Cotten, “Adenovkus enhaaeement ef taandemti-polylydne*n^ded gene deJiwy," Pw. Natí Acsd. Sei, tMâ„ 88(19):8850-««54,1991.

Ctirieí, Wagner, Cotten, Bimstíeí, Àiarwai, U, LoeeheJ, 1¾ "Migh-effickocy g«nê transfer mediated by adenevints eoupled to DNA-polylystee conipfôxeC Hmm. Cm mr,, 3(2); 1.474 S4e 1992. "Revísion of two Computer programe for probit Buli Êntomúi, S&e

Ammi: 16:1045, 197Ô.

De Maagd» Kwa» vm der Ktei, Yamamoto, ScfeJpper, Vlák, Stiekema, Bosch, *Doaw» 10 subslítutíon io. Búcifím thuringkmis ddta-endotoad» CrylÁ(b) residis ío superior toxleíty for Spõá&pmm exígua and ateed membraoe pro-teín rcco^tio»,* ÂppL Ettvimfi àákrúbi&L, 62; 1537»1543,19%, Demeiai^NueL AcidsMe&t 14(5):222¾ 1936.

Dbir êt ãlfPlwt mi RÊp&m, mm. 1991.

Dsehft ei aLf Gemi. Engineer^ í 1:13-99,19%.

Dooovs», Da&koemfc, C&bert, Groat, G&wrwt-Bwkes, Cariton, *’Tbe 1¾ protein. of Bmiihs ihtírmgiemis var, kurstãki: aoefeotide sequenee- and eiiíomocidal ac-tivlty” J Rkd, Omm.> 263:561-567,1988.

Doyie Chem,> 261 (20):9228-9236, 1 986.

Dropulk et a/,, J„ Virot ,66:1432-41,1992,

Dunitz» "The eotrcpc cosi of boond wster ín erystab and bíomolecofes^ Sd««s 2é4:6?04Sx, 1994.

Barp ând Elíar, Nucí Âctds Res. , 15:3619,1987,

Bgltósí aad AíííIcísoís, "Rebroviral vectois for introducbcm of genes tato mammaHan edis**' Bmiee-kmqmã, 6(7):608-614, I9SR

Eglííis, Kantoíf* Kdhit, ííarsoo, Moea* Lothrop, Elaese, Andessoa, "ftrirovital- mediated gem tmmsíer íoto betáopokiie eells,* Aév, Exp, Med Bmí, 241 :19-27,1988,

Elroy-Steia and Μθμ,Αοο. Natl .dtôsàá Sei 0£Ί, 87:6743-7,1990,

Engtish and Slâíift, frnect Biochem, Mõ$. .®tó.;l 22: í -7, 1992, 301 ΡΕ1040192

English, iteaddy, Bastlan, ^Oeíía^aíiotoMíi-íisdueed1 teskagp of ^Rb^-iT and BjO fions pliospIsoKpM vssfcles m cãíatysed by peçontsdtuíÊd miúguí raembíane," Imeet Swckem... 21: 177484,1491,

FtãehhoÊf ei aÍ.tBmíImkmhm 5:807-813,1987,

Ffsley <?# «£, Biú/Têtkmí&.gp:f 3:629*635, 1985,

Fraley et ai., Prae. Mml Âcmt. Sei USA, 80:4803* 1413,

Frataan» FCR™ feíocols, & Ouide to Methods and Applieatioos XVIII IBâ, Aea-demtc Press, ltfew York, 1990,

Frcmsí» et. §Lt Miú/TmhmL·^ 8:833*839,. 1990.

Ffomm et d., M&tm% 319:791*793, 1986,

Froram, Tayfor, Wàlbot ^Bjtjjressioa of genes ti&wterted mto monocot and dleoí plant cells by eleetepomli«a,f’ Pme. Nml Âeaâ. Sei $$4, 82(17):5824-5828, 1985.

Fu£iamr* Mmt Tissm Cult Left, 2:74,1985.

Fynan, Wefewer, Míor, Hsynes, Santoro, Rõhhson, "DNÂ vemtmi pre&ctáve *ia-mMÍMdôiis by psmáteTil:! mucosai, and gene $m moadMbns** Prm, Mátl âeM Sei. USA, 90(24):114784148¾ 1993,

Galítsky, Oody, Wojtszak, Ghosh, Luft» Panghem, Wawrzak, Eaglísh, *CiysíaJ and Molecular Stracture of iM« Jnseetiddal fâaetertal d-Endotoxin CtylíIBl of Bmííim tkeriegtemis* Reseasdi.Coiaimsnkation to ÉcogmI»c..TLâagboiiíe. PA, 1993,

Gao and Huaiig, Nmi Âcíds JSfcí.* 21:2867-72,1493,

Gazlt and Shâí, "Strueturai and Fisnetional Cbameterlzaõon of the α-5 segment of Bmiiim * Biochemistrp,. 32:3429-3436·, 1993,

Gasií and Shai, HHbe assetttbiy and org®i^tk® of the- «5 and o? helloes th» pere-foraing domalo of BúcíUm tfmrmgiemk ê-endobxis^ Á Bml Chem,, 270:2571*2578, 1995,

Ge, Rivers, Milae, De®, TmeibnM domains of Beòtíus tk&togimsis .insedítádal oystai pn>tdns: refinemeat of EeHothis vwesmm and Tridwpfwia ni specF ffcitjr êwmw m CiytM&* Jt Bmt Chem.t 266:17954-17958,1991, 302 ΡΕ1040192

Oenoveae and Mitea*»k» h: SNA Processing, p, 62, Cold Sprbg Barbor Laboraror?, Cdd Spring jHfjubor, NY, 1988,

Gil and PMHMftfbtt, item, 312::473,1914,

Gornsaloslr. eittl, Pmc. NmL Aeoà Sei UM, 79:6951-6955,1982,

Grahaiu and va» der Eb* *Traaa&«maiioii of m celbs bf DNA of hsirraM adeaovirtís 5* Vsmkgy, 54(2):516439,1973..

GroehilsM:!, Maason, Borisova, Jhsafêtó-Cafçy,. Sefnwrt?-, Broussean, Cygier, "Boctfim tktmngkmis CiylAfa) maeetiddy toxin: aystal sua&nre and ehannel ferma-Μϋί Bmh 254:447-464» 1995. G«errier4Takaáa ei o/.» CeU, 35:849,1913..

Hampel anáTiits, âiockem., 28:4929, 1989:

Hampe! ar aí.» Nucl Àcids Rm.., 18:299» 1990.

Harfow mú Lane» *Antibodsesi A. Laboratory Manual,^ Cold Sprkg Barbar labora-teiy, Cold Sprtng Harbor* HY* 1988.

Hemeia-EsteeUa. et al, Naiuréf 393:269» 1983,

Bestei et a/.» Nucí Aciàt jfe*, 20:3252,1992.

HerOg^M PíantMol Btot, 16:171-174,1991.

Bes»» MemMm CymU 107:367» im

Mills and Peters, I. Sem. Bntemol, 64:764-765» 1971, iíõckgffiã, M The Bimry Pkmt Veatút System. Ofíàct-dorfefcersj» Kantora B.V., AI* blasserdam, Chspter 5. HôfteiadWldíjíí, MkráhBA. ifew,, 53:242-255,1989.

Holfand ai,t Bmchemistry, 17:4900,1971,

BofàameteLtM&i, Gm. Gemi, 163:181487» 1978»

Honee» van der Sair»» Visses; NwL Acids A»> 16:6246» 1988.

Horsch m a/.» Sckmce, 227:1229*1231» 1985.

HumascBi»!»: Animai Tissué Teeámqtm, W,H. Fieeman. and Compars?» 1967, laeger «fú£s Pr&c Núfl. Âsad Sei USA, 86: '7766-7710,1989,

Johmton and Tang» "Gene gan tiansfecííon of animal edis má geneik immtsáza-Meíhúés CM JSM* 43(À}:353-365» 1994» 3ofge*j$en # &L, Mel Cm, Gemi, 207:471» 1987, 303 ΡΕ1040192

Kaberand Kody, SSdetice, 223:249-255* 1984.

Kssham-Saber et úL,.ámmme te. £tev<> 2:3-15,1992, Kãkteiãi, EMBÚI» 8:130944,1989. mm m ãl, JBMTteMefy, .3:632-642,1985.

Ktesm&táL} 327:70, 1987. 'KkmeídLtPrúe, MeiíL Acad ScL USA, 15:8502*8505,1988»; KQzák, N&tttfe, 308:241-246, 1984.

Kxiêg£íô/„ Ameigèr/m· Schãdímgskmde P^umensehufz 57:145-150,

Krie® # βί, Z mg te, 96:50040®, 1983. w indMwm* W, H, Fimnan. & Compaay, N¥, 1994

Kuakle* "Rapid and effieient sfce»spedífc mutagenesis wilhoat: pbraaotyplc sdmkmZ IPwc. Mott Amd Sei USÂ, 82:488-492,1985.

Kunlcfe, Roberto, Zabour, MetkodtEn&mL 154:367-382,1987»

Kwafc, Lu, Des»s “Expioraticm of rnsepto*· bindiôg of M&çiiim íkiírfngiemss tostias,* Mem, Jmt. (Xnmid&, 90:75-79, 199S».

Kw»h «ία/., Proc. Ne& Aeoá Sei UM, 86(4):1173-1177,1989. KyM aad Dâalítíte, Z Mei, Bl&í, 157:103-132» 1982.

Lliaillier #1 ai, EMBOJ., 11:4411-8, 1992. L&Benn má Kauf&»M, "Design of sya&slfe gene tibtwries encoding sandom seçiiea&e poretdrtS Wíth desiredensemble characterisíks/* PmL Sei,2:1249-1254,1993, Lsmbert, Buysse, Decock, Jansens, Pia», Saey, SeuHids:, Vm Âudeishow, Van. Rk, Vaa Vlks, Itefboe»» “A B&etítm: tktírmgiemis irtsecticky crystal jsrotein w*tb a higà aotfvjty agamst members of the fkrasiy ifoetukkte* áppí ãminm., Mi cmèi&Í^§2’M 0-86, 1996.»

Lee, Miíoe, Oe, Dean» "Locais® «f a Bmtbyx m&ri 'mxplm btadmg regioa m a ifcr-eilimthwmgpmstetendoioxir*/’ J, Mfol Ckmi,* 267:3115-312!, 1992,

Lee, Yoiffig, Dean, "Domam 01 exchangea of B&elHm íbtrmgtemiã CiylA Iojúrs af« íest búaáí^g lo dilTerent gyjpsy mmh midgut naftai/1 Biúchem. Siophys, R&% Cúmmun.^ 216:306-312,1995. 304 ΡΕ1040192

14 Catml!» BHar, "Crysiai sireeíare of mseeticiklal S-endaiosm fiom ikrfttm tharingiemií&í 2.5Ã rasoMioa" Nmure (Loiuíq»), 353:815-821,199L y«ber ft d,, Mttkods· Emymaí.i ,217:47-66, 1993,

Untórom ef «/., Gtmiics, 11:160,1990* bhziewmz et d, Prm. Nãil Àcad Sei USA,, 90:8000-4,19.93. LôfSS tt d , HM Gm. €hmt.f 199:1 78,1985.

Lu, Rajamohan, Dean, "Identífieasion ©f assiso scid rsddues of Bmiiim fhwmgkmsis S-ffindbmlft CrylAa assodated wíih aiemfsflene ΗακΜφ aad toxteky to Bom-kptmmfÂ BectermL, 176:5554-555¾ 1994.,

Lu, .Xt«a> Clapp, 14 Bmjaneyer, "HÍgh eíTtekaey retawííaJ mediated gene imnsáuc» tio» mto ángle b&laíed ímmature Md teptósbie CP34{3+) hematopoktk siem/pragonior oelts fora htmm umbilical cord bloed," J; Βχμ M&d, 178(6):2089-2096, 1993.

Msealuso and Mettus, J, Baetm&l^ 173:1353-056,1991.

Maddock ei at* Thtrd Mermtioml Cvngttss &/Mmt Mfkwfar Èhbgp, Ábstract 372,1991,

Maloy etai, "Microbíal Genedes55 2ns! Editíes, 3oscs aad Baítlett PsbBshers, Btmw* MA, 1994.

Maíoy, ^EperaRWJtal Teehniques í® BaeíedaJ Geaeíios" Joses and Batiteit Publbh-ers, Boston, MA, 1990.

Maniatís, Frítssh, Sambrook, tm jfcfofeesfer Chnmg: A l&bermery Mmud, CoM Spnitf Hstfcor Laboratory, CoM Sprrng Marta, NY, 1982*

Marcoíte etd^Natum, 335:454,, 1918.

McDevtò & &lt Cm, 37:99.3-999,1984. M«El.rny <f«f„ Pímf Ceil, 2:162-171, im.

Metias and Maeafôs©,. Appí. Emir-o®.· MotW, 56:1128-1134,1990.

Mkliaei, "Mirtagenesás by fecorpofation of a Fhô^boTyktod Oligo Daring PCR™ Ámpíifscation,w BmTechmqms, 16(3):410-412,1994,

Meubmis el«?,, Theor. Appl. Gemi, 75:30,1987. ÔMI. «t úi, Nmm, 313:810* 1985.

Qfearâ et#l, Pr&c, Nmí. Amd. Set USA, 86(15):5673-5677,1989, 305 ΡΕ1040192

Ghkawa et Nml áckk 8ymp. Ser., 27: l 5*6, 1992«

Ojwaag moi,, Froe. Netl Aeod Sei. USA, 89:10802*6» 1992, 01st>« ei ei., 2 8e$feriot, 150:6069,1912,

OmirulRÉ m&L, Fiam jMfaíeatiar Sioíogy, 21:415428» 1991,

Pandey má Mtólafí, In "RNA Frm^ràgC p> 1.33, €Md Spdng Hadw Lalxwstory, OM. Spriqg Haste, N¥, 1987,

Fm&èíaÍ^Náhire, 325:27% 1987,

Fsrrauh etait Nmwe, 344:565,. 1990.

Peswttta and Been* Bktehem., 31; í 6,1992.

Piefca» et ®L, Seience, 253:314» 1991,

Poszkewskí et ai,, BMBGJ., 3:2719,1989. f^tsykmstalMel Gem Gemi., 199:183,1985.

FwteeatfdUMrf. Gett. Gemi., 205:193-200,1986,

Proksp má ftemL *R«a»i*lHnani DMA Technoloey i* Am. Μ. Y. AeadL &t, dddíxxa-xxK* 1,991.

Rajámoha», Âfeaitam, Lee, Ctee», Caríist, Dean, "Single árón.e «dd etomgm m do mala 0 of õactílm ikuringknsis CrylÂb S^eadotoxtB al&ct trreverább Mad-

A ittg to Mamhea sexta midgut membrane vedcles," J. Bmteri&L, 177:2276* 2282,1993*

Rajamohan, Cottftl» Oôtild, Dea*, "Rôle ôf áomaia II, loop 2 nêâidoes of Saeiilm ihttrmgmmis QtylAb 5*endotoxm ia reversible and insvemble bíadíng to Mmdum sexta and IMIúdm virescem* J. Bml Chern^ 271:2390-2397, 1996.

Rogers ei nl, In: Meíh&ds Fút pimu Mokeukr Bmíogy, A., Weissbaeh and H< Weiss-hmh eds.» Academk P*e$s Inc,, San Dtego, CA 1981,

Rogm mé^Mmkrnls EmymaL, 153:253-277,1987,

Roed &®í, ÂidsMts. Hum. ãeirwfc., 8:183,1992.

SadoMy and Álwine, Moke. Ceil Bt&i., 4(8):1460-146% 1984.

Samtook & eí, “Môkcâilar Clonitíg: À Lateatory MaauâlC Cold Spring Hafboí Labotery, Cold Sprísg Harbor, N¥, 1989, 306 ΡΕ1040192

Sandth., Lereete, Menou, Ctoufbyx* Gw, Leeãdel, Múí MkmbioL 3:229*238, IM9. Sâíichis, Leteeíus, Menait, Chauíâttm Lecadat, Mol Micrúéf&i,, 2:393-404,1988, Sarw et el, Sciçme, 247:1222-1225,1990,

Savilte and CeÉIiis» ÍM, 61:685-696,1990,

Savilleaukl Cdfins, P?m.. AM âml Sei USA, 88:8826-8838» 1991.

Bmám êí el, Proc. mil Acad Sei tmf 88:10591-5,1991.

ScaifngB eí^iM AcmMrn,, I&5433-5441,1990.

Schn^f^d Whitdy, Pmc. M Acad Sei £^*78:2893-2897, 1981. SóhòOpf ê·? a/.s 1 Sbt Chm.f 260:6264-6272,. 1985,

Segai "Biodbenncal Calcula^oa# 2udEdítbn, loba Wsky & Som, New York, 1976, Shawasd Kameo,, 0/4 46:659-667, 19S6,

Shaw and Karosn, /»; “RN A Ftoeessãng^ p. 220, Cold Sprmg Harbor Lâboratory» Çolá Spring Harbor, NY» 1987, S.Ímp$on, Scieme, 233:34,1986,

Slaney, Robbins, EnglísJt, *Mode of aeioa of SaeíUm ^urmgmmis toma CiyiBÂ: An anatysls of íoxicity k leptimíarm decemíimata (Say) and- Bfttbr&tim in*-decimpnmtet& kwwréi Barber,” ImeefBfoekm. Múlee.. SM, 22:9*18,1992, Siaim, Âbraffis, logÍÍsÍ\ ''Ddk-eodotexms fbrrn catiosHseleetíve dtannel* ift plM&r lipijd biiayers,H Bmek&m, Bíephy®. Êe$. 169(2):765-772, 1990,

Smedley and Biliar, of tfcree silrfaee-cxjgoised loops of a BacUlus thwmgièmis iasêetfcid&l forno reveals rè^iápês mpottmt for toxiclfy* reeoptor teeosiuttofi má .passíbly memfemae: ksertxw»* Microbíotegy, 142::1617-1624, 1996,

Sffiitib and Etlar, wMirtagenesfe of two surfacenaíposed loops of títe Bacittus

Akwmgkmis CrylC S-eodatoxsii siTeeís ÍRâsctieidal. specificlty," Si&chtm d, 302:611*616,1994,

Smith, Menick, Bone* Ellar, AppL Êmímn, MmkM,, 62:680-684,1996,

Spieimsnn t#«/,,Mot Ge.» Gemi, 205:34, 1986,. 307 ΡΕ1040192

Stemmer Md Morris, 'Êozymatk Inversa Ρ€ΚΪΜ: A Resirícfkw Sito Indepandení, Single-Frapoenl Metàod for Hlgh-Oflcioiey, Site-Direeíed Mutaganesis·,* &&Teckttkiw$, 13(2):214420, 1992.

Stemrnsr, Pr&c> Netí Meá Sei USA* 91 :10747-1075, 1994.,

Tmrâ et #/,, .Nael ádésM&$^ 19:5125*30,1991,

Tombei e£, NucL Âciés Mm.< 12:1656,19%,

Tomíe* Sunjevarte* Savtchenko, Bliimentierg, *A rapid and slmpfe methód fõr intm-docing spedlk mníadoas iatò anypositiott ofDNA leavíng all other positioras tmadierod,” NudmcÂciés Mus., 18(6):1656, 1990,

ToHyama ei ai, ThêúrAppÍ Qm0,,t?$:.Kf 1986.

Udiimiya et ol.., AM Cm Gemt., 204:204,1986.

Ups&èsi et úL> Biemfatiqaes* 18:29-31,1995.

Usman mú Ctâ&tgm\ TÍM, í 7:34,1992.

Usatanand C#dotgtÈ% Tretté* in Bímk&m &£, 17:334,1992.

Umm Âm. Orna. Sm., 109:7845-7854,1987.

Vailette, Msrgo, Reiss, Adesjíik, *Constnactíoa oímotaiit and cMmedc genes «dag the poiymerâse Chain leactíera,*' NtteL ÁridsMm., 17:723-733,1989.

Vasll et úí , ‘Iterbicid^re^stant fsrtHe wbm plãnts obiãÉiód by mkropfõ- joeíib IxKRhaídítierst ef tegeaerable eiafacyogenie caltas" Bwimhmhgy, 10:667*674,1992,

Vasll, Bfotecfmaiogp* 6:397,1988,

Wtsaaod Schei.1* Nml. Àetd$ m.t 13:69814998,1985,

Velte» tra£, EM8ÕJ,, 3:2723*2730, 1984.

Ventura «f«&, Nucl AetikMe^ 21:3249-55,1993.,

VodkineM/l, Cetí, 34:1023,1983,

VogeS ètaL^J. ÇeM Bmchem., Suppi. 13D:312,1989,

Von Tersch, Slatin, Kntesza, Englísh, "Membrane pefoteabílâzlog aetivíty of BaciBm tkurmgtemis Cdmpi&mi-nmve toxins GryillB2 and OyíliBi dornaia 1 pep* lides,* AppL Sm Mmnékd., 60:3711*3717,1994,

Wagner, Eatloakal, Çoíte», Kkbppas, Mechtlei; €oiiêls Bunstid, "Coupling of ade-rsonrm to teansferrin-polyfysiRo/DNA complexcs greaíly ««bancos ie©ept»r* 308 ΡΕ1040192 snedia&d §eae detivery and exprcgsicm ©f iranslected genes»" Proc. NatL Amd

Sa. usa, mMM99-mx im.

VfaOk&ttaL Proc. Mmí Amâ, SeL USA, 89(1):392-396, 1992.

Wakers eí al f Bsochem. Bi&phys, Res. 196:921-924 1993.

Wilson «r aí, Mateeuiftr Bmiãgy õfíki Gèm, 4th Ed., W, A. Benjssnkt, I«cv» Menlo Park, CA, 1987.

Wegfasksgshe ef st, X Vhwl, 65:5531-4,1991..

Weíssbaeh and Weissbach, Methodx for /9o# Mohcuiar Jiiafaigy* (eds.), Acaáejnk Press, Inc* San Diegô, CA» 1988,

WtxakretaL.PtantMot. Btot., 12:41-50,1989.

Wiçksíís mã Stephe^sosi, Science!., 226:1045,1984.

Wfcfesns #<á, h: “KNA p, 9, CoM Sprâig H#rbef t^boraíory, Cold

SpnngH®íwr»NY, 1987.

Welíèrsberger et aí,,Aflpl, Emiron. Miewbwi, ,62:279-282,1996,

Wong and Net&aanK, "EJeetsfie ffelá jnedJatéd gesse transfer," Mbeàm, Bisphys. Mm. C&mmm., i07(2):584-587,1982,

Woolf #/«*. /Vw, Natl Âceà Sei VSá, 89:7305-7309,1992.

Ww and Arenson» *Loeaíia*d nsutagenesis defines regioas ©f die BácUlm fkuriHgie»* sis S-endotoxkt ktvolved ie íosddty and specificlty," J. BM, Cfert.., 267:2311-2317, 1992.

Ww and Dean, “Fanctionaí sigrtifkan.ee of loops í» the ffieepícjr bkiding doreaín of Badiím ihurmgiemis CryOlA S^ftdtoíosdil" X M®L JM, 255:628-640,1996, Yamada et eh, Phnt Cteff Mep.., 4:85,1986.

Yang Μ aí., Proc, Nml Âe&d. Sei USA, 87:4144-48,1990.

Yu etsl,Proc, Nstl Aead ScL UM, 906340-4» 1993.

Zadoukaf, Wagner, Cotten, Phillips, Piartk, SteMem, Cariei, Bíittsdel, HYaodfeMntebfi: a tóghly erlkkwt way lo express gene construeis m eu-káryõííê cdk*Ãnn. N. X Âçsé, ScL 660:136-153,1992. ZJSÃftg and Masfeews, ”Conserva0on.$ õí sdveRl-birsdiflg sítes ut 10 crysta! íomss nf T4 JysttzyBK»* ProL Sei, 3:1031-1039,1994,

Zhow e(et.,Mol CeiíBmL, 10:4529-37,1990.

Todas as composições e métodos aqui descritos e reivindicados podem ser preparados e executados sem experimentação adicional face à presente descrição. ΡΕ1040192 309

LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE:

(A) NOME: ECOGEN, INC./MONSANTO COMPANY

(B) RUA: 2005 CABOT BLVD W/700 CHESTERFIELD VILLAGE PKY N

(C) CIDADE: LANGHORNE/ST. LOUIS

(D) ESTADO: PA/MO

(E) PAÍS: USA (F) CÓDIGO POSTAL: 819047/63198

(A) NOME: LEIGH H. ENGLISH

(B) RUA: 120 CHAPEL DR

(C) CIDADE: CHRUCHVILLE

(D) ESTADO: PA

(E) PAÍS: USA (F) CÓDIGO POSTAL: 18966

(A) NOME: SUSAN M. BRUSSOCK

(B) RUA: 7 HILLSIDE LN

(C) CIDADE: NEW HOPE

(D) ESTADO: PA

(E) PAÍS: USA (F) CÓDIGO POSTAL: 18938

(A) NOME: THOMASM. MALVAR

(B) RUA: 12046 CHÁRTER HOUSE LN

(C) CIDADE: ST. LOUIS

(D) ESTADO: MO

(E) PAÍS: USA (F) CÓDIGO POSTAL: 63146

(A) NOME: JAMES W. BRYSON

(B) RUA: 87 WOOD STREAM DR

(C) CIDADE: LANGHORNE

(D) ESTADO: PA

(E) PAÍS: USA (F) CÓDIGO POSTAL: 19053

(A) NOME: CAROLINE A. KULESZA

(B) RUA: 301 OLD LYNCHBURG RD

(C) CIDADE: CHARLOTTESVILLE

(D) ESTADO: VA

(E) PAÍS: USA (F) CÓDIGO POSTAL: 22903

(A) NOME: FREDERICK S. WALTERS

(B) RUA: 3413 6TH AVE

(C) CIDADE: BEAVER FALLS

(D) ESTADO: PA

(E) PAÍS: USA (F) CÓDIGO POSTAL: 15010 - 310 - ΡΕ1040192

(A) NOME: STEPHEN L. SLATIN

(B) RUA:3823 LESLIE PL

(C) CIDADE: FAIR LAWN

(D) ESTADO: NJ

(E) PAÍS: USA (F) CÓDIGO POSTAL: 07410

(A) NOME: MICAHAEL A. VON TERSCH

(B) RUA: 14 RUTLEDGE AVE

(C) CIDADE: TRENTON

(D) ESTADO: NJ

(E) PAÍS: USA (F) CÓDIGO POSTAL: 08618

(A) NOME: CHARLES ROMANO

(B) RUA: 2402 MAPLE CROSSING DR

(C) CIDADE: WILDWOOD

(D) ESTADO: MO

(E) PAÍS: USA (F) CÓDIGO POSTAL: 63011

(ii) TÍTULO DO INVENTO: PLANTAS TRANSGÉNICAS RESISTENTES A INSECTOS E MÉTODOS PARA MELHORAMENTO DA ACTIVIDADE DE δ-ENDOTOXINA CONTRA INSECTOS ALVO (iii) NÚMERO DE SEQUÊNCIAS: 113 (iv) FORMA LEGÍVEL EM COMPUTADOR: (A) TIPO DE MEIO: disquete (B) COMPUTADOR: PC IBM compatível

(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) PROGRAMA: PatentInRelease #1.0, Versão #1.30 (EPO) (v) DADOS DO PRESENTE PEDIDO:

NÚMERO DO PEDIDO: DESCONHECIDO (vi) DADOS DE PEDIDO ANTERIOR: (A) NÚMERO DO PEDIDO: US 08/993170 (B) DATA DE APRESENTAÇÃO: 18-DEC-1997 (vi) DADOS DE PEDIDO ANTERIOR: (A) NÚMERO DO PEDIDO: US 08/993722 (B) DATA DE APRESENTAÇÃO: 18-DEC-1997 (vi) DADOS DE PEDIDO ANTERIOR: (A) NÚMERO DO PEDIDO: US 08/993775 (B) DATA DE APRESENTAÇÃO: 18-DEC-1997 (vi) DADOS DE PEDIDO ANTERIOR: (A) NÚMERO DO PEDIDO: US 08/996441 (B) DATA DE APRESENTAÇÃO: 18-DEC-1997 (2) INFORMAÇÃO PARA SEQ ID NO:1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases 311 ΡΕ1040192 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:1:

ΛΤδ MT CCA MC MT ÇÇÃ AGT CM CM AC0 MA MC SM Mlk CCT ii Nafc ASA Pro Asn Asn Arg Ser (31 u Mia Asp Thr He Lys vai Thr Pxtí 1 5 ΪΟ is AAC ACT mh TT© CAA ACT AAC CAT AAT CAA TAT CCT TTA gct SAC AAT 9S Ajs» S®r Gin Leu Gin Thr Asn Kis ãsíi Gin Tyt Pró Leu Alâ Asp As» ^0: 25 10 ccã. AAT TG& RC& CTA Ç5&Ã GAA TTA AAT TAT MA GAA TTT TTA AOA ATC 144 Fr® As» Ser Thr Glu Glu L®u Asm Tyr Lys Fh® LS» Arg Met 35 40 45 ACT GAÂ ©&c &©T TCT &C« «&& «TG CTA ©AC AAC TCT ACA STA AM «AT 192 rhx ©lu Astp Ssr Ser Thr SIu Vai Aap Asn Ser Thr Vai Lys Asp so 55 so ac.k GTT QSQ ACA ©GA ATT TCT STT GTA COO CA© ATT TTA ©ST Gr? ®T& 249 Ala Vai <aly Thr oiy n« ser vai. V «fc % Gly Gin XI® £|l.y Val val 65 00 75 m ©GA ©Tf Tfl: OCT SCA etc ACT TCA TTT TAT CAA TCA CTT 2 88: ©ly mt s*r® Fh® .Ala Oly Ala l®u Tíu· Sêr Phe tyr Ser Phe Leu 85 90 SB &AC ACT ATA TG© CCA AGT «AT gct ©AC CCA τα© AAG gct TTT' ÃTG «CA 3 36 AS» Thr IlS: Trp Pr® bd' Asp Ala .ftsp pro Trp Lyã Ala Phe Met Ala 100 10 s 110 CAA mt G&& cm CTO ATA a&T m® MA ATA GA3 ÇAS TAT «CT AftA AGT ΪΜ SIn vai Glu vai Leu 11® Asp Liy& Lya Ilè Glu Glu ty* Lys Sar LIS 12.0 12S MA GCT crr OCA sás TT<\ fiAS CGT CTT CAA AAT AAT TTC CAA OAT tat: 432 Lya Ala hSU Ala Glu Leu Gla ®ly Leu Gin As» Mn Fhe Glu ftsp Tyr 130 H3 140 GTT MT GCQ TTÃ ÃÃT TCC T®3 AAC AAR. TTT CAC CAT CGT CGT TCT 4S0 vai Asn AX& Leu As» ser Trp Lys Lys Phe H.ÍS Hia ser Arg Arg Ser 145 ISO 15ã ISO MA m& AflC ÇÃA ÍS&T CGA ATI Afífí CAA CTT ppípp CM 8©A (PÃ mr S2Ê: Lya Arg Ser ASp Arg 11 a Arg Glu Leu Phe Ser 01» .|ί1ά Glu Ser iCô 170 17S 312 ΡΕ1040192 ÇftT •m CGT A&T TCC AT® ccg TCA TTT cca gtt TCC AAÃ TTC GAA STG 576 HÍ8 Phe Arg Íiíin S&r físt Pr» Ser Phe Ala Vai Ser Lys Phe: Glu Vai MO 1,85 190 çrq TTT CTA CCA ACA TAT GCA CAA GCT «CA AAT ACA CAT TTA TTG CTA 824 .Leu Phe Léa Pró Thr Tyr Ale Gin Ala Ale Ληη Thr Kr 5 Leu .Leu Leu l&S SOO 208 rm AAA GAT GCT CAA STT TTT OCA GAA <3AA TOG GSA TAT TCT.TCA GAA 672 Leu Lys &hp Ale Glrs vai Phe siy Glu Giu. Trp Gly- Tyr Ser Ser Glu £10 215 220 GAT GTT «cr GM. TTT mt CAT mh CAA TTA AM OT ACA CM CAA mc 7M Asp Vai Ais. Giu Phe Tyr Sis Arg Gin L®« hys Leu Thr Si» Gin Tyr ass 230 23$ 240 ACT fâ&C CAT TGT GTT MT TGGt TAT AAT STT GGA TTA AAT COT TTA AGA 768 Thr kfsp Bi a cy« Vai As» Trp Tyr Ãsn Vai Gly Leu As» Gly Less Arg a«s 250 2$$ GOT TCA ACT TAT GAT GCA TGG ore AM TTT AAC CGT TTT CGC ASA CAA SIS Gly Ssr Thr Tyr A»p Ala l^rp vai Lys Phe Asn Arg Ph« Arg Ary Glu 2£S MS 270 AT® ACT TTA, ACT CTA ΤΓΑ GAT CTA ATT SfA CTT TTC CCA TTT TAT CAT 884 mt Thr LêU Thr Vai T.<Í?"U Aosp L«n n« Vai Phe TfXS Fbe Tyr Asp 275 280: 285 ATS ms ra. tac TCA MA úm qtt MA ΜΆ SM CTA A.CA AGÂ G»e ATT SI.2 llB Arg Leu. Tyr Ser Lys Gly V&l Lys Thr Gi» Leu Thr Aorg Asp ile ata 2 95 300 TTT ACG GAT CCA ATT TTT TCA CTT AAT ÁèT CTT CAS3 QftG TAT GSA CCA 860 phe Thr Ãsp Por® IU ser Leu Ma Thr Leu Ql.fi Giu Tyr Gly Prp 3ÕS 3X0 315 320 ACT TTT T7G ÂGT ATA 0,¾^¾. AAC TCT ATT CGA AM CCT CAT TTA TTT GAT 1008 Thr Phe Lgu Ssr Ile Glu Asa Ser Ile Arn Lys Fro lis Leu Phe Asp 325 330 33,5 ®r TO CM OvtG ATT TTT CA1? acg CGT CTT CAA CCT GGT TAC TTT X05S Tyr &KU Gin Gly Πβ Glu Phe lia Thr Ar>g Leu Gin Pr» Gly Tyr Phe ;í4ô 343 330 GGG MA gat" TCT TO MT TAT TSG TCT GGT AAT TAT GT.A GAA ACT AGA 1X04 Gly Lyas Asp Ser Ph» Mn Tyr TTp Ser Gly As-n Tyr Vai Siu Tkr Arg 355 M9 3SS eef MT ATA GSA ΤΓΤ AST AAiía ACA ATT ACT TCC CCA TTT TAT GGA GAT 1152 Pra Sfer ile Gly ser ser Lys Thr ile Thr ssr P:ro Phe Tyr Gly Asp 370 3"?S 380 MA TCT AC? SM. CCT ©TA CM AAO CTA AGC TTT CAT Θ3Α CM AAA. STT 1200 Lys Ser Thr 01. ti Pr» vai Gin Lys Leu Ser Phe Asp Gly «in hys vai 38'S 390 335 400 ΡΕ1040192 313

τχϊ cm. act Am sor aat aca «ac ot» oco gct eco aat ser ars Tyr Arg Yfer lie Ala Asa Tfer Agp Vai Ala Ais Yrp Pro Rsk sly t.ya 405 41« 41S em tat m ôqt stt Ace asa qrn· sat rrr act c&a tãt qat oat cm Val Tyr S<ea Giy Vai Tíjr Lys Vai àsg» th® â«r Sln Tys- Asp Aap Qln 430 425 430 ARA AAT GM SCT AST AC» CAA ACA TAT SAY TCA AM ASA AAC ARY SSO Lys Sla Yfer Ser flu: <31n lir fyr Regi Ser Lys Arg Asn As» Oly 435 44« 445 cat em ast ©ca cag ®ϊ Ter mt sac cm ttk cce ccs. m& àca aca Mis Val Ser Ala ©la Asp Ser 11« Ãsgt 01» Leu Pre Pre ©la ttar Thr 4 m 4$S 4S© 8at sm cca err saa asa sc& tat a®p cat cas cst a&t me 0¾¾ saa Asp Slu Pro Leu Slu t»ye Ala Tyr Ser His ©la Le« Am tyr Ala Slu 465 474 476 4»S YGT TTC TTA ATS CAS ©AC COT COT GSA ACA ATT CCA TTT TTT ACT TOS Cye Phe Leu M»& al» Aap Arg Axg Sly Tfcr rle Pro Phe sine Hsr Trj» 485 490 495 ACA CAT ASA AGT ©TA QAC TTT TTT AAT ACA ATT ©AT SCT SAA. AAS ATT Tftr »i® A*g ser val asp Pite ?be Aen thr He ftip Ala ©la Ly» ile soo sos sio ACT CAA CTT OCA ©TA ©T© AAA ©CA TAT ©CC YT© TCT TCA ©ST SCT TCC Thr Slu Lea Pr©· Val Vai Lyá Ala Tyr Ala Leu Ser Ser Oly Ala Ser 51& 52« 52S ATT ATT SAA 00T CCA SSA. TTC ACA ©CA SSR .AAT TTA CÍ» TTC CTA MA 11« He Slu sly Pr© Oly Ph» Tfer Oly Gly Asa Leu l>e« pfe© Leu Lys $30 535 540 SAA TCT AST AAT TCA ATT SCT AM TTT AAA STT ACA TTA AAT TÇA OCA slu ser Ser Asa Ser Xla Ala Lys Pise Lys Vai Thr Leu Aeri Ser Ala 545 550 5S:& SS0 OOC TT8 TTA ©AA cm W ÕST OTA ASA ATA CSC TAT SCT TCP AÇÇ ACT Ala Leu Lati ©ia Ar© Tyr Arg Val Arg He Arg Tyr Ala. Ser Títtf Tkr SSS ' 570 S75 AAC TTA CSA CTT TTT ©T© CM AAT TCA AAC AAT ©AT TTT CTT STC «TC Asa Leu Arg Leu Pite Val Slss Asa Ser toa Asa Asp Phe teu Vsl lie 5Í0 5SS 590 TAC ATT AAT AAA ACT ATS AAT AAA GAT GAT GAT TTA ACA TAT CM ACA Tyr II® Am Aya Thr M»t:· Asa i>ys Aap Asp Aap Leu Thr Tyr Ol» Thr 593 000 50S TTT GAT CTC ©CA ACT ACT AAT TCT AAT ATS ©6© TTC TC© ©ST GAT AA© Phe Asp Leu Ala Tàr Thr Asn Ser Aaa «et: Oly Phe Ser ©ly Asp Lys 510 SIS 12 4 8 1396 1344 1192 1440

14 0S 1S3« 15S4 xesa 1690 3.7.28 177Ê 1S24 1972 314 ΡΕ1040192 AAT CTT ATA ATA ©CA ©AA TCT TTC CTT TCT AAT GAA ÃAA ATC 132(5 Asei filu Leu 11« 11 e Sly Ala Glu Sar Vâl Set Aên Glu. Lys 11* $30 835 04 0 TAT ATA. «AT άm ATA ©ÃA ΤΓΓ ATC CGA ©TA * TTG lAà 5.559 Tyr lia Lya Glu Pjiô 11« 1?srç> Vai Í5ÍK Luu 045 05o (2) INFORMAÇÃO PARA SEQ ID NO:2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína

(xi ) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2: «tet Ass Pro Aars As® Arg S«r Glu His A*p Tbr Xiè Lys Vai TSsr % 5 10 IS h&tl Sar Qltt Leis Gin TAr Asa His &3ΪΪ Gltt -ryr 5>ro léu Ala Assp AUn 20 20 Pres Aàs. Sé£ Thr ILew G.iu Glu Leu Asn tyr Ly« Glu Ph* Leu Arg 8tet 25 40 4S Tte SíLti ASp ser ser Tto Qlu vai Leu &Sp AS£È Ser Thx Vai lya Asp so ss €0 Ala Vai Gly Tta Gly Ile Ser vai vai Giy Gin li* L*U <ny v*i Vai 70 75 00 Sly Vai Sr-à Shè AÍ ài ©iy Alá Leu Thr Piie *2yr Gin Ssr Ph* Leu ss 30 85 Assa TM' 11« Tsp PE» Ser Aap Ala ASp Pro Trp Lys Ai a Pfee Ala xos 10 5 110 Gla Vai Glu vai Leu xie A«P Lys Lya :T..5.e Glu Glu Tyr Ala Lys S®r 115 123 12 S Lys Ala IfSU Ala Gin LSU ©Ift Gly Leu Gin Asn Aaxs Pbé Cplis. Asp Tyr 13 θ 135 140 Val ASO Ala L-eg ASP Ser Trp Lys Ly';s Phe Mia Mis Ser Arg Arg Ser 14S .100 188 18 Ô iys Arg Ser Qixs ÃSp Arg lie Arg Glu Léu. Phe Set Gin Ala Glu S»r 105 120 175 Sis Shs Arg A-OB Ser «et Prp Ser Pb* j&XiSi Vai Ser Lys Phe Glti Vai 100 185 ISO 315 ΡΕ1040192 í.ati Phs Leu LM Fk» Thr Tyr Alâ íàs-Xj^ 2QQ Ala AI® Ase . fhr Mi» Leu L$u Leu aos Leu Lys ΪΧΟ Asp Mâ Cal« Vai Fbe eivais siu Glu Trp Qiy Tyr Ser Ser Slu 220 Asp Vai 22$ Ιίΐά <5!u Tyr 23 0 Mis Arg Glrt Leu Lys 235 Lsu Thr Slh Gle Tyr 240 Thr Asp His Cys V»X 24 S &s« Trp Tyr .teíi Vai 250 £ly Leu Ase âly Leu Arg 255 Sly Sér Thr Tyr 2655 Aap AXs. Trp Vai Lys 26S Phe Aen Arg Phe Arg Arg slu 270 Met Thr v$ $7$ Thr Vai L.#U Asp L*« 2:5 O lie vai Leu. Fhe Aro Fhs Tyr Asp 2§s '11® Asrg 290 Leu Tyr Ser Lyss Oly Vai 295 Lys Thr G Xaí Le® Thr Asg Asp lie 3 O# F&e Thr 305 As;p Fr® ii® Ç'h«? 11Θ Ser Leu Âsn 'Thr Leu 315 Sln 0lu Tyr Sly Pr» 320 Thr Pbs tóa §er 11« 125 0ÍiU As» S®r 11® Arg &yg 330 Pr® Ui» &©« Fhe Asp 335 Tyr Leu <51 u Giy 340 π<?: 531 u Fhe Hig Thr Arg 349 L.ÉU CJl.® vro my Tyr Fhe 350 Sly Lys Asp 353 ser Pbe ASA Tyr Trp 360 Ser Gly Aam Tyr Vai. Slu Thr Arg 266 Pr® Ler 370 n« Siy Ser Ser Lys Thr 3TS XMe Thr Ser F*0 Pb» Tyr GTy A&p 3S0 Lysi S»sr 3 85 Thr mu Pfó Vâl 3:90 Sla. Ly.S íâií ssr Pfee 395 Aiip Oiy Cia Lys Val 490 Tyr &rg Thr 11¾ Ala 405 Asm Thr Λεφ vai A.2 si 410 AJL& Trp Pru Ausi Siy Lya 415 V&l Tyr Less ©Xy· 420 Vai Thr Lys Vai Asp 435 Fhe Ser 01® Tyx Aap Asp <3la 430 Lys Á.sn hiu' «S Thr Ser Thr 53I.S1 Thr •540 Tyr Asp Ssr Lys teg Asr» Asn Oly 455 hIs v&X 450 Ser Al^ '3.1 n Asp Ser lie 4 55 Asp ΦΐϊΧ Leu Fro frv slu Thr Thr 400 Asp 465 Pr® Leu SiU L^âi 470 Alâ. Tyr .ser Mlh SI» 475' Lé.ii asm. Tyr Ala 3lu 450 Cys Phe LíÈtS Mefc Sln 485 &sp &rg Arg δίγ Thr 430 iie Pr® Ffee Fhe Thr Trp 4S5 316 ΡΕ1040192 rhr Hls Arf Sfir vai Asp Rhe Phe Asa tM~ Ik Asp Ma »1« ty$ XX* SCO 505 S-l0

Thr Gin teu P»« Vai Vai Ly» Ala ty*· .Ma teu Sei;- Ser Gly Ala sar SIS S20 §2§ lie xis Slu «ly P*ó eiy *M Tlir eiy siy JUm teu Leu Rh* teu tya sae sás s*o alu Ser Ser As* Ser Ile Ala ty® Rh* tys v*l Tfer teu As» Ser Ala 54& SfeO 5SS SSÕ

Ala teu teu Gin Ar$ Tyr *x$ ν*1 Arg lis Arg yy*· Ma s*r Thr Thr

SfiS 570 S7S

As» &*« Arg teu »he V*1 ®1« A*» Ser Asn &sp Phe teu Vai 11*

580 SâS SM

Tyr 11« Asa tys Tte «eu As» ty» Asp A*p Agp t*U f&y Tyg· ai-« Tfiy

S5S $00 §0S

Phe Asp teu AI* Tfcr Thr A®» Ser Asa «et Gly Rh* Ser Gly Asp tya SIS SIS $.20

Asm Glu teu Xle 11* Gly Ala Glu S*r Rhe vai Ser As» Glu ty» Xl* 825 $30 S35 §40

Tyr 11« Asp- ty»· 11« 01 u Vh* 11* Pr» Vai «31» teu $4$ $50 (2) INFORMAÇÃO PARA SEQ ID NO:3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:3:

ATS AAT CCA AAC ΑΑΤ ÇGA AGT GA& Ç*T GAT AOS ATA SAS «TP *CA CCT 4S «te* &»» Pr* Asa Asm AJPS Ser <Slu Eis Aep Tfer lie y*i fcc® 1 s ίο X5 AAC âST GAA TTQ CAA ACT AAC CAT AAT CAA TAT CCT TTA SÇT @AC AAT 0$

As» S*r Qlu tau Gl» ahr A*a Hia As» ele Tyr &tts> t*u aía aso a*r 28 25 30 144ΡΕ1040192 317

OCA AAT TOA hCA CTA «SSA ©AA TTA AAT TAT AA& CAA TTT TTA ÀSÃ ATO Pr© Asa Ser Ths* Leu Gl© Sltí Leu Asa Tyr Lys Slu Ph© Leu Ac® «et 35 40 45 ac? saa ©ac aot tct ao® sm «to em gac aac tot aca ®tA aaa gat Thf ©lu Asp ser Ser tfer Glu Vai Leu Aap Asm ser Thr "Vai Lys ftsp 50 ,55 60 3CA GTT ©88 ACA GSA ATT TCT ©TT GTA 803 CAS ATT TTA ©3T W ©TA Ale vai Oly Thr fôly xle Se*· vai vai ©ly Sirs ile Leu ©ly.Val Vai «5 30 75 SB :33A STT CCA TTT GCT 8GG ®CA CTC ACT TCA TTT ΤΆΤ CAA TOA TTT CTT Oly Vai Fr» Phe Ala Sly Ala Leu Thr Ser Fha Tyr ©ln Ser Fhe Le» 8:5 53 9:5 aac act m tos oca mr mx <scr mc «cã tos aas ©ct ttt ato oca Asn Thr lie Trp Pr» Ser Asp Ala Asp tr» frp Lya Ala. Phet wst Ala loo xos 110 CAA STT ©AA ©TA CTO ATA ©AT Km AAA ATA ©AS Ç&.C TAT ©CT AAA AST Glsí Vai *81« Vai Leu Xle &®p Lys Lys lia ©1« slu Tyr Ala Lys Ser 315 ISO ais AM SCT CTT ©CA SAS ΓΓΑ CAQ ©ST CST CAA A&T 'ITC SAA ©AT 5AT Ly» Ais Leu Ala Slu Leu Slu ©ly Leu ela. Asn Asa Fhe ®1« Asp Tyr 130 115 140 «TT AAT SCO TTA AAT TOC TO® *»© AAA AOA CCT TT& SST TTO SS& AST Vai Aísk Ais Leu Asn Ser τηρ Lys Ly» Thr Fr» Leu Ser Lea Axg Ser 14S ISO 1SS ISO AAA A©& ASO CAA ®&T «©A ATA AS® G.AA CTT TTT TCT CAA ©CA «A. AST tys Ar® Ser Sl» Asp Arg Xle Arg Olu Leu õh® ser sln Ala slu Ser 165 3,70 175 GA? ΤΓΓ CST AAt TCC ATO CG© TCA TTT GC& ST? TOC AAA TT0 SM GTO His Phe Ar® As» Ser «et Pr© ser p&e Ala vai Ser í*ys gfee 81» v*l 350 385 350 ctg rrr cm oca aca tat oca c&& qct gca aat aca cai* tm tto cta Leu Pb© Leu Fr» Tfer Tyr Ala Cisi Al« Ala Asa, Thx- Híã lêú l^eu Lsu 395 300 205 TTA AAA OAT SCT CAA STT ITT TOft GAA CAA TO® SOA ?*f TOT TC& GAA Lau Lys Asp Ala Sle Vai Fhe oly slu sl« *rp'Gly Tyx ser Ser Glu 210 235 2:20 8AT STT SCT GA& TTC CTT AST AÇA CAA TTA AAA CTT ACA CAA CAA TAC Mp vai Ais. Slu PA® Leu ser &rg Siji^Leu Lys Leu Thr Gl» Gin Tyr 22 5 230 235 240 ACT ©AO CAT ms STT AAT TOS TAT AAT ÇJTT Q0A TTÃ AAT «SST TTA ,&SA Thr Asp His Cys Vai Ãsh Trp Tyr Asa Vat Gl y Leu Asa ©ly La» ASíg 245 250 25S 353 240

2ÔS .»30 384 432 400 528

SOS 624 672 720 '768 318 ΡΕ1040192 «GT TCA A£T TAT GAT ©CA TS6 GTC AA& TTT AAC CST TTT CSC AG* OA& SI6

Gly sei Ihr Tyr Asg Mm Trp vai 2»ya phe Aso &rg í*« Argr Axg Qlu ISO 2S5 27®

Ata acjc m act sm s*& oat cm Att cm ctt ttc cca tft w gat ®«4

Met Thr Meu Thr 235 Vai Leu Asp Leu 330 lie Vai Leu £>ks Oro ®he Tyr Asp 205 ATT CGS TTA TAC TCA AM «QG «TT AAA ACA «AA CTA ÃCA AGA GAC ATT 312 Xle Argi 300 Leu Tyr Ser Ly# Gly Vai SsS Lyss Thr Slu Las Thr Arg .Aap Ile 300 TTT ÃCS GAT CCA ATT m TCA CTT AAT ACT CTT cm «AS TAT OS& CCA ss® £tse 3 9S Thr Asp Pr© 11 e Phe 310 ser Leu Asu Thr Leu 3iS 0151 CIw Tyr Cly Aro 32® ACT ttt ττα Am· ATA GAÃ AAC TCT ATT cm AA& CCT CAT TTA TTT CAT ιοοβ TÈsr She :Le» Ser Xlô 32 S Glu As» Ser TI® Arç Lys 330 Oro Mis Leu Pha Asp 335 TAT TTA CAG GSS ATT GAA TTT CAT ACS CGT Cif CAA CCT GGT TAC TTT 1056 'Tyr Leu Gl.n m,y 340 Ik «Tu £%e Ais Thr 345 Arg Leu «1« ®ro «ly Tyr Phe 350 «ee am GAT TCT TTC AAT TAT T«« TCT «ST MT TAT CTA «AA ACT ACA 1104 «ly Lys Asp ser 35» Phe As» Tyr Trp 35® «ar «ly As» Tyr v»l «iv tkir A*g 3S5 CCT &ST ATA GGA TCT MíT AAC ACA ATT ACT TOC CCA tTT TAT «SA «AT 1152 Pr» »#r 370 lie Gly ser Ser Lyu 37S Thr Ilê Tht Ser Aro J?fce Tyr Gly Asp» 380 AM TCT ACT «AA CCT GTA CAA AA<3 «TA AC3C TTT «AT GOA CAA MA CTT 1200 Ly# 385 Ser Thr Oiu PrO vel 3'30 Gl.Vi Ly» Leu Ser The 33S Asp Gly Cl» Ly* Vai 400 TI'T cm ACT ATA QCT MT ACÂ SftC 0TA gçs <3CT rm cos aat ssr m 124® Tyr A»3f Thr 11« Ma 40$ As» Thr Asip vai Alá Ala 410 Trp Prp Aâ» Gly Lys 415 6R TAT TOA «ST «TT ACS AAA STT «AT TTT AGT CAA TAT «AT GAT CÁA 129$ Vel Tyr Leu «ly VéX 430 Thr Lys vai Asp 425: Phe sar sln Tyr Asp &mp ai» 430 m Mf âÁÂ ACT mr ACA CM ACA TAT CAT TCA AAA A«A AAC MT «GC 1344 Ly® As» Slu Thr 43S Ser Thr Glu Thr 440 Tyr Asp Ser Ly# Aríf Asrt Asu «ly 44S CAT «TA AOT GCA CAS «AT TCT ATT «AC CAA TTA CCS CCA. GAA ACA ACA 13 «3 Mi# VAI 45® Ssr Alá GlK ASp Ser ã ie hsip CIís Leu Prs ptp Glu Tte Thr 450 GAT SM CCA ctt S&A W «CA TAT mr CAT CAG CTT MT TAC «CS «ΆΑ 14 4 Q Asp 4S3 aiu íhro Meu «lu Lys 470 Me Tyr %é'.r lis <»lu 475 Léu Asa Tyr Me Slu 48® 319 ΡΕ1040192 TQT TTÇ TTA ATS 0*8 « ©8Γ COT OSA ACA ATT ©CA TTT TTT AOT TCSS 1488

Cye Ph& hw» Nefc si» Asp Arg .Arg eíy Thr 11« Pr» abe Phe Thr T«p 485 496' 49S ACA CAT AÇA AST «TA ©A© TTT TTT AAT AO* ATT 6AT SCT «AA AA© ATT Tis*· Sis Arg· Ser Vai Asp vhe Phe As» Thr 11« A&p Ala 61« I*ys fie S&8 505 SIS ACT CAA CTT ÇCA «TA 0¾¾ AAA OCA TAT OCC TTS TCT TCA GCT SCT TCC 3&r Sis Iíêu are Vai vai Ays Ala Tys Ala leu Ser Ser Gly .Ala Ser SIS 520 525 ATT ATT GAA «ST CCA Í21& TTC ACA G0A SdA AAT TTA CTA TTC CTA AAA 11® fls «lu «ly Pro ©iy T&r çly «iy Aan imi !>*<* $t»e &e« fcy* 530 535 540 1530 15S4

ISIS

ISSO 1728 gaa Ter mt aat rck att «cr aaa ttt aaa ©rr aca tta aat tca oca

Glu Ser Ser Aon Ser 11* Ma &y* K?b« l<ys Vai Tfcr leu Aso Ser Ma

545 550 55$ 50D SCC TTS TtA CAA C«A TAT COT ©TA AQA ATA 00C TAT «Cr TCT ACC agt

Ale leu t»e« «1» Arg Tyr Arg Vai Arg lie Arg fyr Ala Ser Ttar Thr AAC TTA GCA CTT TTT «W3 CAA AAT TCA AAC AAT OAT TTT CTT OTC ATC Asm &«« Arg leu Pt» Vãl «lii Asm Ser Asn Aan Asp The leu Vai ile 580 S85 $30 TAC ATT AAT AA& ACT ATS AAT AAA «AT S&T GA.T TTA ACA TAT CAA ACA Tyr fie Aon fcya Tfcr Mafc A*a 'JLye &s$s Asp Asj> l«s Ihf Tyr ©In Tfe.r S9S SOO «QS TfT OAT ©TC OCA ACT ACT AAT TCT AAT ATQ ©OS TTC TCC CÇT OAT AAC Phe Asp &eu Ala Thr Tísr hs& ser Asm M®r «ly Phe ser oly Asp Ays §10 §15 §20 AAT CAA CTT ΑΤΑ ΑΤΑ ®0A «CA «AA TCT TTC CTT TCT AAT «SA AAA ATC Aen Glu fceu ll® fie «iy Ala ©lu Ser ske vai ser Asa. «lu fcys fie §25 630 S3S- 640 TAT ATA GAT AAG ATA «AA ΪΤΓ ATC CCA CTA CAA TTS ΤΑΛ Tyr II* Asp l*ya lie ©1« Pb® Xle Pro· Vai «la leu §45 S50 1776 1824 1872 1320 1353 (2) INFORMAÇÃO PARA SEQ ID NO:4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:4: M»t Am* Pstsb Aan A*» Arg Ser Slu His Asp xbt- lie %>y» V*1 Thr ít© 320 ΡΕ1040192 X $ Χ§ 15

Asa Ser 61« teu ©1» 3$«r As» ília As» ©la Tyr· iro Le» Ais Arp a»» 20 05 3-0

Pr© As» Ser Thr Leu ©lu ©la Leu As» Tyr Lys ©lu Pise Lee .Arg tfctfc. 3s 40 45 fiie ©lu Asp $«r ger Thr ©X» Vai Leu Asp Asa Ser Thr Vai Ay» Asp §0 56 60 M* Vai ©iy Tfcr ©ly Lie Ser v«X V*X ©ly ©1» Ile Leu ©ly V»1 V«1 m 20 7s ao ©iy vel Pr© vh® Ala sly Ala Leu Thr ©er Phg; Tyr ©1» ser Fh® Leu as so m

Asa fhr Ile Srp Pxo ©er Asp A.le &»p Aro Trp Lye Ale FA® Me£ Ala im los no ©1» vai ©lu vai Leu 11« Asp Lys tys lie ©lu ©lu yyr Ala Lys Ser 113 120 x25

Lys Ala Leu Ala ©lu L®u Sla ©ly teu ©1» Asn As» Pbe ©lu Asp Tyr 130 115 240

Vai Asa. Ala Leu As» Se* Trp Lye Ly» T&r Pr© Leu Ser leu Arg Ser 145 ISO 155 1.60

Lys Ar© Ser ©1« Asp Ar© XXe Ar© ©Xu Leu Fha ser «1» Ala ©lu Ser

US 170 i?S sis Fhe Argr Asa ser «efe Pre ser Fhe Ala vai Ser Lys Phe ©lu vel

ISO 185 ISO

Leu Wse Lsu Pm Thr Tyr Ala ©1» Ala Ala As» Thr Hia leu Leu Leu 155 20 a 205

Leu Lys Ãsp Ala ©1» Vai pite ©iy ©lu ©lu Trp ©ly Tyr Smx Ser <31«. 210 2.1» 220

Asp Vai Ala ©lu Fh® Leu Ser Argr Si» Leu Lys Leu T&r Slis ©1» íyr aas 210 23 5 24:0 f&r Asp His Cys vai as» Trp tyr Asa. vai sly Leu As» ©Iy Leu Arg 245 250 255

Sly Ser Thr- Tyr Asp Ma frp Vai Lys Pis® Ae» Axg Phe Ar© Arg ©lu 260 26$ 278

Met Thr l«u T&r Vai Leu A#p teu lie Vai Leu Phe Pr© Phe Tyr Asp 275 200 255

Ile Asg Leu Tyr Ser Lye ©Iy VuX Ly» Xhr Slu Leu Thr Arg .A»p XX* 250 271 300 321 ΡΕ1040192

Pbe Tbr Asp Pr© lie Phe ssr &e» Asn Thr Lew aln 8iu tyr oly Prs 30S ;US! Tta Fke: 1««. S«£ IX® ©Xu ftsn Ssr 325 Tyr &ee ©Ia My Xle ©1» Bhe Hls 349 ©ly Lye Aap Ser ®he Asts Tyr Tsp 3i5 340 pso Ser lis Gly ser Ser L-y» Thr 370 375 ItfB ser Thr £51« Ire VAI si:» Lys 385 390 Tyr Arg ttcr Xl.« Ma Aà» Thr Asp 405 VaX Tyr .feeu ©ly Vai Thr Lys Vai 430 Lys Aen Oltx Vfer Ser Thr <3In Th» 435 440 m£$ Vai ser Ma ©I» as§5 s«r lie 4S0 455 Asp SXu ,»to· Lfitt SI,U Ly® Ais Ty* 485 470 Cy* lhe &eu Met «31® Asp Arg A*SF 485 Thr Ki-s Árg Ser Vai ãsp Fh.e JHhe 500 Thr ©1» lesa. Pre> ¥&1 Vai. yys Ala SIS 520 XX® lie Ql« GXy Pro Gly Phs Thr 530 535 ôltt ôer Ser As» Ser lie Ala Lyã sa-A 550 Ala S*s« X»ew ©1» Arg Tyr Arg Vai SS5 Asií Lee. Ak^ £>#« Fha v*l ©1» As» S&§ Tyr Tle Aso &ys Thr ms As» Lys 55tô SB» 315 320 11« Arçi Lys Pi SS Mi st Isv Vfae &&p 330 335

Thr Arg 1^5¾ tus pre eXy Tyr Fhe 345 350

Ser Sly Asn. Tyr Vai ©Xu. Thr Axg 3® 5 IX e Thr ser Vkj Pise Tyr ©ly Asp 3 80 1*811 Ser gfcs Ase Sly Si» L®® Vai 3OS 400

Vai Ala Ala Trp Frô Asn ©Xy Lys 4X0 413

Asp Phe se-r ©In Tyr Asp Asp ©In. 435 430

Tyr Asp Ser Lys Arg Asm Asn ©ly 44S

Asp ei» Lee. í>ro v.rç> SI» Th» Vhr 4€0 ser hís αία La« Asa Tyr Ala <si» 475 «80 ©Xy Thr XX* Pre Fhe Fhss Th» Trp 490 495

Asa Thr Tie ftep Ala elu l<y« lie S9S 510

Tyr Ala he« Ser Ser &ly Ala ser 828

Oly ©ly Ases latp l»ea Vha le» l»ys 540 '?he Lys Vai Thr lea hmn âer Ala 55S.· 560

Arg lie Arg fyr Ala Ser Thr T3*r

S7Ô 5?S

Ser Asa Asei Asp Fh® L·©® Vsal lis 585 53«

Asp Asp Asp Lê® Thr Tyr GÍí* Thr ms 322 ΡΕ1040192

Ph-s Asp- Lss o. Al a Thr Tht As® ffet Gl.y Pihe Ser 01y Asp Lys (SlS sss asei Glu Lei > 7.1 e ii# Gly Ala Slu Ssr Phe VAI Sse: A&n Glu &ys lie m s É3S §40 Tyr II* Àsj: n* GXu 11® Vax ÍíX» Leia ¢45 650 (2) INFORMAÇÃO PARA SEQ ID NO:5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:5: ATS A&T OCA MC MT CGA MT SM CAT «AT ATA ΑΑΩ ΟΙ’Τ’ ACÃ COT 40 Asn S?rp Asa As» Arg sar His Msp TíVf XI® Vai Ifeor S?re 1 § 3.0 IS AAC AGT ÓAA TTG OAA ACT AAC CAT AAT ÇA& mf OCT tta OCT GftC AAT 36 Assoa. s&r >31« úew GÍM Thr As« Hia Aãíi Glíi Tyr PrO L*u Ala As p Asn 20 25 lô em aat TCA AC& CTA CAA GAA TTA AAT TAT AAA G&A TTT TTA Asm ATS 144 Tro A&ii Saa Thr Jàau Sla Sl» Ae» Asm Tyr L'/s Gla Pile Ifãa Aí-g ÍSSE :3S 40 45 ACT Cp&Âí ΑΟΓ TCT AOS GTS CTA mc &M: TCT AÇA OTA AAA GAT 1.42 ΤΐιΓ CJlw. Α*φ SSF Set Thff GlU vai Xieu Asp Asii Sar Thír ¥S.I s Asp so 55 go SCA GTT ©GG AiCA c«s& ATT TCT STT GTA cm ATT rm SST GTT ST®. 34 i> A!í.is val sly ¥h:t Ôly Uss Ser vai Vai Sly GI» lie Isea >jly VAI Vai ss 70 75 eo sm <stt OCA GCT GGG GÚ.A CTO ACT TCA TTT TAT OAA TOA TTT CTT 288 Giy vsl Ero pise Ala Gly Ala I*»U THr Pb® Tyr Gla Ssr Ffe® tau 8S so MC ACT Am TGG CC& AGT «ST GCT SAC OCA. TSG AAG iírOX1 TTT ATG •SCA 338 As» Th* 11® Ttp PXQ $ar ,&sp Ala Asp Pm Ttp tys Eha ííteo Ala. CAA «r

SftA GTA erra ATA GAT AAG AAA ATA GAG GAG TAS* GCT AAA &SV 433ΡΕ1040192 323

Glts V*i ela Vai i>e» 11« Asp Ly» Lye tle sl« 61» ®yr Ala I»ys S*r 115 130 125 AM CCT CTT GCA 6AG m CÃS «ST CTT CRA AAT AAT TTC GAA ©AT TAT Lys Ala tam Ala ©tu í*e». ©In Qly &*u Gin Asa Asa 9&e ©tu As» Tyr 130 ' 115 140 ®rr Mt ses tta ast tcc tsg a»© aaa aca cgt tta Αβτ tt© cga ast Vai Asa Ala Leu Asn ser Trp l.ys Lys Thr Pro Leu Ser 1-srt Arg Ser 145 150 iss 1BC AAA Α8Α Aàs:: CAfik ©AT 06» ΜΑ AS© GAA CTT fW TCT CAA SCA ©ΑΑ AGT lys Ar» âer ©la ftep Jtegr lie Arg ©lu hau "Chã Ser ©la Ala ©la Se* 3*5 120 17S CA« W CGT mi TCC ATS CCS TC» TTT ®CA QTT TCC AAA TTC ©T© Eis Ehs Arg »*it ser Met Vr® ser p»® Ala vai ser kya Phe 61» Vai 180 18 § 190 CTQ TTT CTA CCA ACA TAY OCA CA» 6CT SCA ΑΑΤ ACA CAT TTA Λβ Cm leu pha Leu Vt<3 Tfer Tyr Ala Ql» Ala Ala »«» Tfer Bis x<nm &au &·» 395 200 30S TTA AAA ΘΑΤ ÍSCT CRA GTT TTT GGA QAA EM. TGG GGA, TAT TCT CCA ÍÍA& lam isya Asp Ata Gin Vai Eh.® oiy ôiu 01« Trp Gly Tyr Ser iro Giu 2x0 ais aso SAT GTT 6CT EM TTC AQT CRT AQ» CAA TTA AAA CTT ACA CA» CAA TAC ÂSgs Vai Ala CI« Sh* Ser Hi® »jpg CSla Lew lys Leu TJSX ©in 6lfc T^X 225 230 23S »49 ACT ©AC CAT TOT GTT AAT Τθβ TAT AAT GTT ©6» TTA MT SST TTA ASA Thr Asp Kis Cys Vai Aaa Yrp Vyr As» Vai Sly !«« ASA ©ly La» Ar© 245 250 255 6©T TCA ACT TAT SftT OCA TGG OYC ft»» TTC MC OGY TTT 06C ASA SA» Oly Ser Shar Tyr Asp Ala Trp Vai hya 9bt& ASn Αχ© AX© Arar ©lo 26® 355 270 ar® »CT TTA ACT sx» TTA ©AT CTA ATT ota ctt ttc oca TTT tat s»t HsS- TAr Leu Thr Vai tau Asp 1«» Ile vai lana Stoa vro Pha Tyr Asp »78 »80 28â ATT CG© XTA TAC TCA AAA 6(56 6TT MA ACA GAA CTA ACA AGA SBC ATT 21« Arg Leu Tyr Ser Lys Gly vai Lys Tfcr 6iu £>«» Thr Arg Asp 21.® 2§0 295 300 TTT ACÍi ÕÁT CCA ATT TXT TCA CTT AAT ACT CTT CRC Qm TAT 00A CCA Vbe Thr Aap Px& lie $t*« Ser Lew Asa Thr JUe« ©1» ©lw Tjnf ©ly iro 305 31® 315 32© ACT TTT TOS AGT ATA ORA AAC TCT ATT OGA MA CCT CAT TTA TTT ©AT Thr ttm leu Sor rle 61» As» Ser He Arg Lys iro His Leu ttie Asp 325 330 335 4S0 528 ST* 524 573 720 768 816 864 312 568 1008 tat tta c&e ma. att m ttt cat ac© cai1 ctt caa cct ggt tac frr 1056 ΡΕ1040192 324

tyr tmt 01« Gly lie Glu Ph» Kis Thr Argr .Leu sla Fr© Gly Tyr Fhe MQ 345 35« ©90 AM «AT TCT TTC MT T&T TOG· TCT «SÔT AAT TAT o?» SM ACT ASA eiy Lys Aep Ser· vim Mn Tyr Trp ser oly As» Tyr v«i ©iu Thr srg m$ aso .ms CCT AGT A?A 3GA TCT Α3Γ AAS ACA ATT ÃCT TCC CCA TTT TAT SOA GAT Pr© Ser XX® Siy Ser ser Lya Thr ile Thr Sar Pr© gh-e Tyr oXy Asp 3TO 375 390 MA TCT ACT GfiA CCT «TA C&A MG CTA ASC TTT GAT ©GA CAA AA& 8TT Ly» Ser Thr «31« Pr© Vai «1» Lys l&u ser Phs Asp Gly sln Lys V©1 ass asa 395 *oe TAT CGA ACT ATA 0CT MT ACA OAC «TA ©OS SCT TGG Cm AAT GST MG Tyr Arg Thr lie Ala Asa Thr Aap M Ala Ala Trp Pr© As© Gly Lys 405 410 415 GTA TAT TTA Ό&Τ CfT ACG AM (ÍTT GAT TTT ÃST CM TAT «AT «AT CM Vai Tyr Leu Gly Vai Thr Lye Vai Aíip Vim Ser Sln Tyr A»p Asp Sln 920 425 -130 AAA MT S» ACT AGT ACA CM ACA mT SAI TCA AM ASA MC AAT CSC Lys λβ« Glu Thr Ser Thr Sln Thr Tyr Asp Ser Ly» &rg Ah» Jtón Sly 45» 44© 44S 110,4 11S3 1200 I24t$ 1290 1344

CAT «TA AGT OCA CAG «A* TCT ATT ÇAC CAA TTA ¢¢50 CCA «SM ACA ACA ft£« Vai Ser Ala Sln Asp Ser II* Asp Sln Leu Pr» Pr© Glu Thr Thr 450 4 55 4«0 SAT sm cca ctt aa λλα sca. tat agt cat cas çtt aat tac çcg saa A«p Glu Pm Leu SI© Lys Ala Tyr ser .«is Gl© Leu. Asa. Tyr Ala 91« 465 4?0 475 4β0 TCT TCC TTA ATS GAG GM? CGT CGT <SGA ACA ATT CCA TTT TTT ACT TGÇ cya Fhe Leu Mefc Gla tep Arg Axg e£y Thr il» Fr© vim Fhe Thr Trp 495 490 455 ACA Cht ASA AGT CTA GAC TTT TTT AAT ACA ATT SAT SCT ãU MG ATT Thr Uie Arg S«r Vei Asp Fhe Fhe Aen Thr Xie Asp Ala Glu lijfv XXe 500 SOS 5.10 ACT CAA CTT CCA GTA GTG MA SCA TAT «CC TTG TCT TCA CGT 9CT TCC Thr 01» Lea Fr© vai Vai Lye Ala Tyr Ala Leu Ser Ser Gly Ala Ser SIS' 520 53.5 ATT ATT CAA GST CCA SGA TTC ACA OOA SfâA. .MT TTA CTA TTC CTA .AAA i;ie Π« 9l« Gly Pr© Gly Fhe Thr Siy Sly Aan L.au L»u Fha Leu Lye 510 ’ 535 540 SM TCT AGT AAT TCA ATT GCT AAA TTT MA OTS? ACA ΤΓΑ AAT TCA CCA Glu Ser Ser Aan ser 3 Xe Ala hys Fhe Lye V»X Thr Leu Mn Ser Ala 545 5S0 585 §80 ocse TTC TTA CM COA TAT CST OTA AGA ATA CSC TAT GCT TCT ACC ACT 1.3 £2 1440 1409 1530 1584 1632 X86Ô

172S ΡΕ1040192 325

Ala Αβ» Leu Qio teg ?yr Arg Vai Arg II# Arg Tyr Ala Ser Tfer ttxe 565 570 $75 aac rth cm cn m gts csa mr tca *&c aâv gat yrr ctt ero ato te Lee Argt tea *$*e Vai «Ir A®n Ser &srí Asa Asp pbe teu Vai xi® SS0- 5SS sgg TAC «ST «KT ASA ACT MS AAT SAA Q*S ©A? «AT TTA ACÃ ΪΑΤ CAA ACA Tyr Xle Asa Lys Thr Met Asa Lys mp Asp Asp Leu Thr O.in Thr S55 500 §0$ ΪΤΤ 6AT CtC GC& ACT AC5P AAT *CT AAT ATS GSfô TtC TOS m$ QM! MG tfb® Asp íísíí Ala liur Thr Mn s®*· Aea íMet- siy Aba $e.r ely f»p Lys £10 SIS 628 AAT (SAA CTT ATA ATA GOA- GOA (SAA TCV TTC «TT tCt JAT <âAA AAA ATO Asa Ql» ,t«« Jl« XX® &ly Ma Gla ser Phe vai. Ser Asn <31 u Ly® i.le •38 510 S.3$ $40 TAT ATA SAT A AG ATA G.AA TTT ATC CCA O TA CAA TTG 7AA iy*r O.» Aep &y» XI® ólu Pb® £1» Rro v®X pl© Le» 545 S50 1776 ISS4 lâ?2 lOxu

I95S (2) INFORMAÇÃO PARA SEQ ID N0:6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 6: Met Asn Pr© As© A/rSt Arg S©r Glu Sis Th.K' XX® L-ys Vai TAr F.ra % s 1& IS Msn s®:r 81» &»U 8lnt Tfcr ASft BiS Aon GXis Tyy teo Lou Alo As» ASA ao 35 5Ô te© As© Ser Thr li^u Glu Glu LéU Asr! Tyr l>ys Giu PAe Leu Arg Met. 3S $<3 4S Thr Glv Asp Ssr sor Tbr Glu Vai L&w Asp As© Ser Thr Vai Lyís Asp 5S SS éo Ala Vai <31y Thr <»iy II·® Ser Vai Vai Gly Gin n« Leu Gly Vai vai S5 ve 75 SÓ ííly vai Pr© VA* MS uiy Ala LAU Thr Ser Ph® Tyr Gin Ser Phe Leu ss so 55 Ãsn Tfej* :tie Trp teo Ser Asp Ala Assp te© *ixp Lys Ala Pise Met AX& 1&Q 1<ÍS iia G'ÍIS. val <3.1 u vai II® Afíp lvs Lys lie o.in Gia Tyr Ala L-ys Ser 326 ΡΕ1040192

lis 13® X2S

Lys Ala, Lsu Ala Glu Lev G1 n Sly .Leu δ Ia ASft Asn S*he Gin: Asp Tys 130 13S 14®

Vai Aae Ais Leu Asa S«r Tsp X»y® Lys Thr Ihr» leu Ser Leu Arg S*r 145 15® 1SS 1*0

Lys Axg Ser Sia hap xes He A*g 81s* Leu Pha Ser Sln Ala Giu Ser 1S5 170 175

Hls jpfee Argr Asa Ser íí*£ Fr» Ser Pfee Ala Vai ser Ly» Phe Glu Vai ISO 185 ISO

Leu líhe Leu Pxo Thr Tyr Ais sl« Ais Ais Asa Thr Hls Leu Leu Leu 19:5 200 205 leu Lys Asp Ala ®1» V«1 *he G'iy «lu GJu Txj» Gly Tyr Ser Fre <31« 210 21S 220 asjs vai Ala slu Ah* ser 81® Arg QX» Leu Ly® Leu Thr Gl» <5i« Tyr 225 210 235 240

Thr Aep His cye vai Asa Ttp tyr Asa vai eiy Leu Asa Gly leu Arg 245 250 255 <33. y Ser Thr Tyr &sp Ala Trp vai Lye Pha Asn Arg Itee Arg Arg ôlu 250 2S5 270

Met Thr leu Thr vai leu Asp Leu lia vai Leu Fhe Fro Fhe Tyr &$p 275 2$Ú 2 «5 II® Arg Leu Ty» Ser Lys ®l:y Vai Lys Thr <31u Leu Thr Arg Asp lie 200 255 200

Fhe Thr Asp Sro tlm Wh* Ser Leu &®a Thr leu Gin Qlu Tyr Gly Fr» 305 310 315 320

Tkr Pha Leu Ser Tlé Slls Aae Ser Ile Arg Lyu feo Ui ss L«u Fhe Asp

325 330 33S

Tyr Leu Glsi Gly Ile Glu Phe His Thr Arg leu Gin Fro Gly Tyr Pfee 340 345 350 sly Ly» Asp ser Phe Aso Tysr Trp Ser Gly Assa Tyr Vai ®1« Thr A*g 355 350 365 ft» Sèr Ile Gly Ser Ser Ly» Thr xl* Thr S#r Fro Phe Tyr Gly Asp 370 375 380

Lys Sar Thr fólu Pr© Vai Gin Ly» Leu Ser Ph® Asp Gly Gin Lyss vai 38S 350 355 400

Tyr A*g Thr He Ais Asa Thr Asp Vai Ala Ais Ttp Pxo Asa Gly Ly» 405 41® 413 327 A&p Phe ser Gin. Tyr Asp As;p Gl» 42S 430 Tyx A8-p Ser Lyss Arg Mn Asa Gly 445.. Aép OsX$ Leu Prç? fhds Glu T&r Thr 460 Ser Si* Gin Leu Asn Tyr· Ala slu 4?S 480 Sly Λ* lie fes Pis* Pfes Tkr Txp 490 45$ Asn Sa II* Asp Ala Glu hy* He SOS 520 Tys Ala Leu Ser Ser ôly Ala Ser $25 Sly Oly Assa Leu leu Fhe Leu ty* $40 Phs Lys vai Thr Leu Asa Ser Ala 515 sso Arg He Arg Tyr Ala Ser Thr Thr 590 S75 Ser Asa As» Asp Phe Leu Vai He §85 .530 Asp Asp &âp Leu Tíiir Tyr Gin Tíur 60S Asa Met Oly Pite Ser Gly ftep Lye gao Ser P&e Vai Ser Asa Gltt Lyo Ile 05 640 Pr» Vai. Cio Leu 650 ΡΕ1040192

Vai 'Tyr Leu Gly Vai Thr Ώγ& vai 42$

Ly» As» Giu Thr Ser Tfcr ®1» 33μτ 43S 440

Mis< vai sor Ala sl« Asp Ser ils ma 4$s Α&ρ slíi to Leu õlu Ly* Ãla Tyr 4«5 420

Cys & 3te» Hefc 01a &££> AJsg A%g 40 s

Tfer Mis Ar» Ser Vai As» Pfee Pbe SOO

Tfe*: Cl,» Leu £>re vai vai Ly& Ala SIS 530

He I lê Slu Gly Frõ giy phe Titr S.30 535 <31« fer Ser Asii ser lie Ala x,ya S4S sso

Ale Leu Leu Sl» Arg Tyr A»g Vai 565

Aao &e« .AVSf liem Stoe Vai· Gi» .&&&. 58 o

Tyr 11« A»rt Ly* T&r Met As» Lye SOS soo

Phe hsp Leu Ala Tlur Thr Asa ser

610 SIS

AffiR Ôl» Leu He He Qly Ala Glu 625 «30

Tyr Π® Asp Lys Ha SA.u phe 11« €45 (2) INFORMAÇÃO PARA SEQ ID NO:7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: 48ΡΕ1040192 328 (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:7:

AtG MT CCA MC MT cm AST SM GAT OAT ACG ÃT& MS STT AGA CCT «et As» Psro Asn Arg Giw fiis tep Thr 11« Ly» Vai T&r fofo i s io as ms agt « Tm cm act aac cat mt caa. tat cct tta qct eac m Abr gear βϊ» Leu @1» ?Jht Mn li® Μει Qlvt Tyt Fro Leu M® âsp Mn 2» 25 30 CCA MT TC& AC* cm C»AA Μ TPA MT TM' AAA 8AA TTT m ASA A» ί*ί'£> Asn Sér Thr LSU Glu Glu L-âU A&S Tyr Lys Glu F&S Léu Arg Méfc lê 48 4$ ACT -SM CAC AST TCT ACG ORA GTG CTA G.AC AAC YCT ACA STA AAA ®AT tte Cl» Asp Ser Ser Thr £ílu Vel Leu Ãsp As» Ser Ttor Vai Lys Asp 50 35· SS m 144 192 GCA STT GGG ACA GGA ATT TCT STT Ala vai Qiy Thr Gly iiê Ser vaiss ?o CCA STT CCA m GCT ®QQ GCA CTC Giy Vai Fro Fts Ala Sly Ma Leu S.5 ,SAC ACT ATA TQG CCA AST GAT SCT Aao Thr Ile Tsp Fxo JSer Asp Ala ioe CAA GST » STA CTS ATA «AT AAB Gl» V&l GIu Vai Leu tis Asp Lys iiS 12» AM eer cst «ca gag m ane wsr LyS Ala Leu Ala Cl» Leu Gl» Gly 13» 3.3.5 on mt ees ttã mt tcc «se mg Vai Asa Ala Lau Aan ser Tr$> Lys 141 150 AAA AGA &SC CAA GAT Õ3A ATA AOG Lys te§ Ser «In Âsp Arf 11« Â«9 1SS CAT TTT CGT AAT TCÇ ATG OCO TOA His Pise Arg Asn Ser «et Brro Ser ISO cm ΤΤΓ CTA OCA ACA TAT «CA CAA Leu Phe Leu Fr» Th* Tyr Ma Gin GTA QGS CA@ ATT TTA SGT «TT ®TA Vai Giy Gin Ile Leu Gly vai Vai 75 a» ACT TOA TTT TAT CAA TCR TTT CTT Thr $*r VA* Tyr Sln Ser Pbe Leu 90 95 GAC CCA T6B A8G GCT ITT ATG GCA As.p Fre T'rp Ly-s Ala Ehe M«r. Ala 1Q5 110 AftA ATA CAÇ G&G TAT GCT AAA AÇT Lys lie Gia. Giu Tyr Ala Lys ôer 125 CTT CAA AAT ÃAT TTC CAA GAT TAT Leu eln Aen As» Ffcas ®1» As» Tyr 140 ma μά cct tta mv Tm cm Mt* Lys Thr Pr» Leu Ssr Leu Arg Ser LSS ISO ssã err ttt tct caa gca oaa bst Gltt Leu Fhe sor cia Ala Slu Ser 1T0 175 ΤΠ GCA GTP TCC AAA TTC GAA GtG Fhe Ala Vel Ser Ly* P&e Glu. Vai WS 19-3 «CT GCA AAT ACA CAT TTA TTG CTA Ala Ala Asa TI**· His Leu Leu Leu :>«8

31S 184 432 4§0

SM

STS ÇS 4 ΡΕ1040192 329 195 205 tta ααα cat ser caa ©tf ttt ©ga gaa saa tsg ssa tat tct » ©a& Le» L-ysi Asp Ala Sl» Vai Phe Qly ©lu ©lu Trp Gly Tyr S*r ser ©1» 210 215 220 ©AT GTT ©CT QhA TTC TAT C®T AGA CAA TTA &2j& ©ff ÃCA CAA ©AA TAC ASp ¥al Ala ela Phe Tyx Arg Arg ela Leu Ly» Leu Thr ©1» ©to Tyr 225 220 23$ 240 ACT SftC CAT TST ©ΪΎ AÃT TGG TAT AAT GTT OGA Τ1Ά AAY GGf ΤΓΑ ASA Thr Asp Bis Cy» Vai Asa T«p Tyr Asa. ¥al @ly Lati As» sly JLsa Axg 245 2.50 255 <3GT TCA ASJT TAT ©AT ©GA T8© ©TC AAA TO AAC OKT ΪΤΤ C©C ASA ©AA Sly Ser Thr Tyr Asp Ma Trp Vãl íiys SSfc® &á» ftx$ Phe Arg As® ©ltt 360 265 270 M© ACT TTA ACT ©TA Tf A OAT CTA ATT ©TA CTT TTC CCA TIt TAT ©AT Met Thr Leu Thr vai la» Asp Leu lie Vai Leu Vtee Pr» Pfe.e Tyr Asp 27 S 23 S 285 ATT CGS TTA BC TCÀ AÂ& ©G© ©TT AAA ALÁ ©AA CTA ACA ASA ©AC ATT II® Axg tom Tyr $er Ly# ©ly vai hys Thr ela Leu. Thr Arg Rsp lie 29# 3»S MV TTT AC© ©AT CCA ATT ΓΠ TÇA CTT AAT ACT CTT C&S ©AS TAT ©ÇA CCA Phs Tta» Μφ PJf» ll® Ph* Ser x<su Asa Thr Αβα ©la Glu tyr sly pro 30$ StÔ M§ SM ACT TTT TTC A6T ATA SAA AAC TCT ATT ©GA AA& CCT CST TTA TTT ©AT Thr Pfce Leu Ser He ©1« Asa Ser xle Arg Ig/m Pr© His Um The Asp 33$ 33© 335 tat tta cm &m att sra ttt cat aos ost ctt caa cct ©er tac ttt Tyr Leu ©la Gly xle ©la Pbe Bis Thr Arg Leu SI» Aro Sly Tyr Phe 340 3:45 350 SSS MA CAT TCT TTC AAT TAT TSG TCT -SQT AAT TAT GTA ©AA ACT AGA Giy £,ys Asp Ser Ph® Asao Tyr Trp ser ©ly Asa Tyr vai Glu Thr Arg .355 300 36$ CCT AST ATA GGA TCT AST AA© ACA ATT ACT TCC CCA TfT TAT ©SA 0»T Pro Ser Jla Sly Ser Ser Lys Thr 11« Thr Sér 9xo Vhé tyX ©ly Asp 370 37$ 350 AAA TCT ACT SAA CCT ©fÃ CAA AA© CTA ASC fTf ©AT 6©A CAA AAA ©ff Ly* Ser Thr ©lo Pso V«1 ©to Lys Leu Ser Phe Asp Gly ©to Ly» Vai 365 35© .35$ 400 TÀT CGA ACT ATA CCT AAT ACR CRC GTA ©CS GCT TGG CC© AAT CGT M© Tyr Arg Thr lie Ala Aea Thr Ά&ρ Vai Ala Ala Ttp Pro As.» ©ly !>ys 4:9S 410 4.15 ©m TAT TTA. ©ST GTT AC© AAA STT S&T TTT AGT CAA TAT SAT ©AT CAA Vai Tyr Le« ©iy Vai Thr Lys vel Asp Vhe Ser ©1» Tyr Aap Asp ©In 6 72 720 768 815 654 8X3 060 1008 1056 1104 1153 1M0 1248 1286 330 ΡΕ1040192 42:β 42 5 430 αατ g&a act ' AST AC» , CAA ACA TAT «AT TCA AAA . ASA. AAC AAT 1 ac,t. 5.344 Lyg Ag» Siu Tftr Ssí' Thr Gltl The Tyr ASp ser Lys &rg Ãs« As» «ly 435 44 0 445 ατ pm <?e* i"‘A<? SAT TCT ATT «AC CAA TTA CCS CCA CAA ACA ACA 13 33 His V*i Ser Ala Gin Asp Ser He Aâfa Gin heu Pro £ro Gin Thr Thr 450 45 S 460 «AT SAA ÇCA. CTT CAA MA C-CA TAT &CT «AT CA» STS AAT as cç» <®AA X440 Asp Slu Paro Leu Sltt Lys Ala Tyr Ser His Gin Leu As» Tyr Mi 0l'u 4S5 470 47 δ 460 tst rre m at» cac» mc CGT CGT SCA ACA ATT CCA TTT TTT ACT TGS 14 §8 Cys Pàe Leu Met «X» Ãsp Arg Arj Cly Thr lié Oro Pfcíi Phe Thr Tsp 455 430 435 MCA 0ΑΨ MÂ A0T «TA «AC TTT m AAT ACA ATT 5AT QCT CAA ΑΑΘ ATT iâM Tb.-r ais Afgf Sor Vul A»p Phe Pha At»» Thr .1.1¾ Asp Aia »Xu Lye He 5 3 Cs .SOS 510: ACT CAA CTT CCA CTÂ GTG ^3¾¾. CSCÍÂ; TAT «ee TT» TCT TCA »ST GCT TCC ÍS04 Thr Gla Leu Fr® vai v»X hy® Ala. Tyr Ai a Leu Ser Ser Ciy Ala Ser SIS S20 325 ATT ATT QAA GCT CCA SSft TTC ACA GGA 8GA AAT TTA CTA ttc em AAA 1533 XX* lie Oíu Sly Pro «ly Phe Thr «ly Gly Asn Leu Léu Phe Lasi Lys 530 335 540 SM *ct mr M.T TCÁ ATT «cr· aaa TTT AAA QTT ACA TO AAT TCA ÇCA 1500 Glu ser ser &s» Ser He Ale Lys The Lya Vai Tte Leu As» ser Ala 545 ssa 355 589 sscc tta caa csa tat C<5T «TA AGl& CSC TAT QCT TCT ACC AÇT 1738 Ala Leti L»u íS.I.n Arg tyr Arg Vai Arg He Ar^ Tyr Ala Ser Thr Thr 565 s?e 575 AAC TTA CSÃ. CTT TTT «TC CAA AAt TCA AÃC AAT SAT r5>ijKjí cr? »re ATS 1776 As» Leu Arg Leu, Ph» vaa «1» As» Ser Asa As» Asp Phs Leu Vai ile SOT S8S 590 fAC ATT AAT AAA i\CT Am ΑΛΤ AAA «AT SAT SAT TTA ACA TAT CAA ACA 1824 Tyr lie fcsn Lys Thr Met As» t-yss Asp Asp Asp Leu Thr Tyr cia Thr 595 SC» 005 TTT GAT CTC QCA ACY ACT AAT TCT AAT AT» SO» TTC CCS GQT SAT AA» 1873 Ph» A§:p Lsu Ala Thr Usa? Asss Ser AS» Meh SXy Phe Ser Giy Asp Lys sio A;iS 620 AAT OAA CTT ATA ATA 03A GCA OAA TCT TTC STT TCT AAT SAA AAA ATS 1320 ftsn <31u Leu lie lie Gly Ala Slu Ser Pite Vai Ser Ãstn Slu Lye He 625 OÔ £35 840 TAT ATA SAT A&S ATA SAÃ TTT ATT cca sm CAA TI» TAA 1$$£ Tyr 11* Asp Lya ile SI» Fíie :P.r<5 Vai si» Leu ΡΕ1040192 331 845 β ss (2) INFORMAÇÃO PARA SEQ ID NO:8: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:8:

Hst Asm &sa Asm Mg Ser Glu Hiss Aep Th*' fie l>ys Vai Thr Ptò

1 5 10 IS

Asa Bmr Oiti Leu Qln Thr Asti Mis Asa oin Vyy Leu Ala A8& A&i* 2 d 2 5 30

Asa Sear Thr Leu ©Xu ©3.» Leu Asa Tyr s»ys Mlvs Leu Mste 35 4© ΤΑΐΓ ©lu. &sp Ser soa The <3ÍU Vai Lêu Asp Ser Vai £#8 ASp só ss m

Ala Vai Siy Thr ©Xy Ile Ser Vai V*X ©Xy 61» Ile Leu Qly Vai Vai 6*5 10 75 00 aiy vai »re ene ala eiy Ala lcu yfer ser me Tyr «1» 8#r m# L*u 85 30 35 to» Tlisr ile txp s*» Ser Ãsp Ala top Pr» Trp i*ys Ala Fhe Mea Ala

100 iõS ixO íslu Vai íalv. vai íasi He Aap Lys Lya xle fâlu Slu Vyx- Ala Lys Ser 115 130 125

Ly# Ala lí&u Ala Glu lata Gin ©Xy Leu s-in toa to» pfee slu Asp sy*·

ião 13S ISO vai n. Al.a i.eit Atu ser Trp Lys tyd iivr uru lais bú£ Léu Arp Ser 150 155 100

Ly.â Arg S-M Gin Aáp Ãrg Ile ÂPg Qlu Lati Phè Sèr &Írs Alá &Lu Ser 165 170 175

Mis Fhe tog Âsrs. Ser Hat Fro Ser í>hs Ma Vai Ser %,y» Ffee 6lu Vai ISO 285 ISO &·» Leu Thr Tyr Ala ©£» Ala Ma Am Thr Mis Le» hm Leu 2.95 2SS 205

Le» Lya Asj> Ala ©1» vai Fhjs Qly ©la ©la Trp Qly fyp ser Ser ©lu 210 215 220

Asp Vai Ala ©lu P&e Tyr Asrst tos ©la l«u Lym Lau Thr «1« Qln Tyr 332 235 240 Asa Vai Ol.y 2 50 > Leu ; Asa ís.ly Leu 255 !. Arg Lys 365 Phe Asn Arg Pba Arg Arg 270 81» II® Vai Leu Phe Pro Phs Tyr 2S5 Asp Lys Th» Giu Leu 300 Thr Arg Aep il* Aon Tlsr Leu 315 sis 81» fy» Giy Pro 330 lie Arg 330 Lys Pm Mia Leu PA® 335 Asp Th» 345 ΑϊΧί Leu Gin Pm 81 y Ty» 350 Phe Ser oly Aon Ty» Va i Glu Th» 365 Axg 11® Thr Ser to 350 Phe Tyx eiy mp Leu Ser .The 3S5 Aáp Siy Gin Lya Vai 400 Vai Ai a 418 Ala Trp Pm Asn Gly 415 Lyn Asp 425 Ph© S©» Gin Tyr Aap Asp Gin 430 Tjft .&$£> 5er .Lys Arg Ah» Asp 445 81-y Asp Gin Leu Pm 460 to Giu Thr Thr Ser His Gin 475 Lèiií As» Ty» Ala Glu 480 01 y Thr 4 PO Ilè Pm Fhô Ph© Th» 455 Trp ASii 505 ftí Ile Asp Ala 81» Lys sio Ik Tyr Ala Leu ser Ser sly Ala Ssr ΡΕ1040192 22$ 2.30

Th» Asp Ris Cy« Vai Asa Trp Tyjr 24$ ®ly Ser Th» Tyv Asp Ala Trp Va.l

3--SS

Ket Thr I*ett Th» Vai Leu Asp Leu 275 2:50 1.1« Arg Leu Tyr Se» t/ym B&y vai 2S0 29$

Phe Th» Asp Pr* lie Ph® S®» Leu 30S sie

Thr Phe Leu Se» II e Gi» Asn Se» 325

Ty» Leu 81» ®ly 11® ©1» Pfc* »is 340

Qly lys fomp Ser 3?he Asa Tyr Trp 355 360

Pm Ser Tle «31y Ser Ser Lys Thr 3TO 375 l*y» Ser Thr SIu Px& Vai 01» Lys 3S5 3S0

Ty» A*9 Th» lie Ala Asa Th» A»p 405 vai Tyr i«&» Oly Vai Th» Lya Vai 420

Lyg A£h <?3u Th» s«r Th*· »1» Th» 43 S 440

Hie Vai Ser Ala 01» Asp Ser lie 4Μ 455

Asp 81» Prà. IAU 01» Lyá Alá 3y» 4S5 478 cye PA® Leu Met Qln Aep A»g Arg 485

Th» Ris A»g Se» Vai Asp Ptm Ffce SOO

Vktx 81» Leu Pm Vai Vai Lye Ala 5| S 520 525 333 ΡΕ1040192 il® lie SX» 61 y Pro çly Phs Tfer Gly Gly A»« L«« Le» Phe l*«v Ly» 510 S3S 54 Cs <Slu ser ser As» S«r Xis Ala Lys pfee Lys Vai Thr i»e« Aa» Ser Ale 545 550 555 ssa

Ale L®u Lau. Gin Arg Tyr Arg vai ftrg· 11« Aaffr Ty* Ala Ser T&r T&r 565 f?0 575

Asa Lsu Arg Lau Pha Vai Gl» Asn Ser Asa Aatt As& PÈta Lsu, V»1 lie 58-0 585 580

Tyr 11« Asn Lys Thr «et Am Lys A.«p A®p Asp Leu T&r ‘fyx Gin xfer 585 500 605

Pha Asp Leu M® *fer T&r Asa Ser hmt Mafc ©ly Ptie Ser ©ly As^ Lys 510 615 520 A$fi íSitt Ti«ti Ti» Ti* Rly Ai* Slu Ser #he Vai Ser Asa ©la lys He 525 610 SIS €40

Tyr H« Astp &ya lie Gl« Ph® Xle Pr© Vai 01» í»eu 545 656 (2) INFORMAÇÃO PARA SEQ ID NO:9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:9: ATO AAT CCA me &AT C8A AGT 0AA CAT GAT AC® ATA AA® STT ACA CCT 46 mt Aan Pro Asn Asn Arg ííer Glu His Afjp Thr He Lys v®.l Thr pr© 1 5 10 15 aac XGV m'' rm CAA A0T AAC CAT AAT CAA ΤΆΤ CCT TTA GCT GAC AAT 86 A®» ãér 0181 Léu 0lfi Thr Mn Hi.S Asn 0.· ft Tyr Frct Lsu Ala A&p Assss 20 25 .3® •CCA AAT TÇA ACA CTA S&A 0AA TT& AAT TAT AAA 0&Ã TYT TTA A0A A1G 144 Pro AStl Ser Thr LSU GÍU aiu Leu Ass Tyr Lys SlB Phs Lew Arf 34ar 35 40 45 ACT GAA GAC AST tct AOS GAA CTA GAC me TCT ACA 0TA ASA GAT 182 Thr Gl« aer âer Thr <S1» val Leu Asp &SD, Ser Thr ¥âi Lys Mp se $$ 60 240ΡΕ1040192 334

oca orr ma aca em att tct gtt ©ta ©o© c&g αττ ττα ββτ αττ ©τα Ala Vai SIy thr Gly lia 8*r Vai Vai Sly «Ia XI® &*u Sly V%1 Vai £§ 70 7$ 80 ®SA <3TT CCA w ©cr «o© «ca ctg act tca ΤΤΤ tat CAA TCA TTT CTT rçly vai ftce £'he Ala fi.ly Ala Lesi Thr Sex Tyr ίϊ|.η Ser Ph» r..e» 85 90 95 AA© &CT ATA 1©© CCft AST ©AT GCT ©AC CCA T©8 AAG ©CT TTT ATS ©CA .A$rj Th* Ha Trp *m s«r A*p Ala As|> Αττ-ο Tsp i»y* Ala ©he Mal Ala 103 10 S 110 CAA QfT SAA ©TA CP© ATA ©AT AA© AAA ATA GA© ©A© TAT «CT AAA AGT Gin Vai du Vai Aeu XX* A*p i»y« &ys 11* GlU Glu Tyr Ala lyA S*r XIS 120 12 S AAA SCT CTT <3CA ©A© TTA CA© GGT CTT CAA AAT AAT TTC OAA «AT TAT Ays Al a fcesi Ai a díí leu Gin Gly ley «In As® Asa Phe Glu Asp Tyr lie 335 140 gtt aat ao© Tm aat tcc t©g aa© aaa ãca cct tta ast tx© c©a AÇV Vai &a® Μ* 1®«. As® ser Trp lys l»ys Thr ©re ser Aett Argr Ser 145 150 155 1«0 AAA ASA ASC CAA SAT CGA ATA AGG SAA CTT TTT TCT CAA «CA OfiA AST lys Arg Ser ©In Aap Arg fíe Arg ©lu. Iam Vhe Ser ©In. Ala ©I» Ser 16S 370 17 S 288 338 384 432 480 528

CftT TTT COT AAT TCC ATS CCS TCA TTT GGA OTT TÇÇ AAA TTC «AA ST© Kis ©fee Ar© Ase ser M*fc WO ser The Ala Vai Ser ly« Písj? GlV Va3 180 195 390 CP© TTT CTA CCA ACA TAT ©CA CAA «CP «CA AAT ACA C&T TTA TT© ©TA ©eu Pte» 1« Pfro Thr Tyr Ala Sisa Alá Ala Asa Thr Hist t>a« 1« Kasu 195 :20o 206 TTA ASA «AT GCT CAA CTT TTT «GA SAA GAA TOS GSA TAT TCT TC& GAA Km X>ys Pxep Ala «la VAX Pkm Ôly da ©1® Trp dy Tyr sex ser «1« 210 2 IS 220 GAT «TT ©CT «AA TTC TAT AAT A«A CAA TTA ÃAA CTT AÇA CAA CAA TAC Asp VaX Ala ©1« fihe ryr Aon Arg ©Ia leu ip leu Ttor ©Ia <*lrt Tyr 22S 230 23s 240 TCT 0AC CAT TGT «TT AAT T©G TAT AAT «TT S©A TTÁ AAT QST Tm A©* Ser Asp Ma Cys vai Aan Trp Tyr Assa Vsl Sly k&q ask sly xe» Arg 2*S 2S0 2SS aer tca act tat sat sca re© ©re aaa tpt aac cgt rrr c©e ãsa m& Gly Ser Thr Tyr Aep Ata Trp Vai Lys Pha Aso. Arg »he Arg Arg «lu 280 2SS 270 MG ACT TTft. ACT ©TA TTA «AT CIA ATT ©m CTT TTC CCA TTT TÁT SAT Mefc Thr Leu Thr Vai Lmo Asp £>eu II» Vai L«u The ore The Tyr Aep S75 280 2SS 57« 672 72:0 708 81« 804 335 ΡΕ1040192 ATT CS© TTA TAC TCA AA» «G© OTT AAA ACA SAA CTA ACA AGA GAC ATT §12

Ile Arg Leu Tyr Ser Ly» Ôly Vai hys Thr ©1* £®a Thr Arg Aap lie 250 29S .3Q0 TTT ACQ SAT CCA ATT TXT TGA CTT AAT ACT CTT CA® ©A© TAT Θ0Α CCA 9€6

Phe Thir A«p am Tíi» x»h« ser r^* asm Thr ΐ'ι^.ί ©ja ©ΐΛί Tyr giy p.jrç* 305 3.10 31S ‘ 320 ACT TXT TTS AGT ATA SAA AAC TCT ATT CSA AAA CCT CAT TTA TTT 3AT 100» T5*r Phe í*u 8«*· £1« ©lu A»«· Ser .O,® Asg Lys »m Eis Leu Pb* Asg 32$ 330 3.3$ tat tta cm mts att «aa ttt cat acg ©st ctt csa cct cct tac ttt 1054

Tyr &su Sla Sly xle Glu Phe Hie Thr Arg L<su ©lia pm Qiy Tyr Phê 340 34$ 350 QSO AAA ©AT TÇT TTC AAT TAT TOS TCT ©GT AAT TAT ©TA ©A* ACT ASA 1104

Sly I»ya Sô* Fh* Ass Tyr Τΐρ Ses? -Gly &$n Tyr v»l 01« Thr Ar© 3SS 3S0 36« CCT AQT ATA mm TCT' AGT AftS ACA ATT ACT TCC CCA TXT TAT ©SA ©AT 11 $2

Fm Ser 11« ®ly Ser Ser Ay» TAr 11« Thr ser Fm Fhe Tyr ®ly Asp 370 375 300 AAA TCT ACT ©AA CCT ©TA CAA AAO CTA ACC TTT SAT GGA CSA ΆΛΑ OTT 1200

Ay» Ser Thx Siu Pro vai Gin hye leu Ser Fhe Asp ©iy ©ia Lys vai 385 3 00 3S.5 400 TAT ÇJSA ACT ATA ©CT AAT ACA ©AC ©TA ©O© ©CT TSG CC© AAT ©βΤ AA© X24©

Tyr Argr Thr Ha Ala Asm Thr Astf» Vai Alss Ala ’&ηρ Fr». Asm aly í,y» 4-05 4.10 4X5 ©TA TAT TTA ©ST «ET AGG AAA ©TT ©AT TTT AQT GA& TAT ©AT ©AT CAA 1*SM5

Vai Tyr E.«w Sly Vai Thr Aysj Vai Aap S»he: Ser ííln Tyr Asp Aap ©1« 420 425 430 AAA AAT GAA ACT AST ACA CAA ÃCA TAT ©AT TOA AAA AQA AAC AAT ©BC 1344 J.ysj ftsíi Gla Tlsx Ser Thr Qitl Thr Tyr Aáp Ser Sys a.rg Asa ftsn fíly 435 440 44« CAT ©TA AST OCA Cft© ©AT TCT ATT ©AC CAA TTA CCS CCA S&A ACA A.CA 13 §2

His val See Ala ©la Asp Ser Ila Aap ©la l-ou Fr© Pr© ©lu Thr Thr

450 455 4SO ©AT CAA CCA CTT ©AA AAA CCA TAT ACT CAT CAS CTT A&T TAC ©0© QAA 144 Θ

Asp ©lo Fm Latx elu Lys Alá fyr Sar His ©la hea As» Tyt Ais ©1« 465 470 47S 4S0 TST TTC ΤΓΑ ATO CA© OAC CGT C6T ©SA A£A ATT CCA TTT TTT ACT TC© 1488

Cys Pfc« leu Mac ©1». Aap Ârg Axç ©ly Thr lie ao Fh« Fhe Tfer T*p 485 480 455 ACA CAT ASA ACT ©TA ©AC ΤΕΤ 'TTT AAT ACA ATT ©AT OCT OAAl AAÚ ATT Thr His Arg' Ser Val Aep Phe pfee Asn Thr 1.1«. Asp A|,a ÇXu l»ys Ilf SOO SOS Si® 1535 ΡΕ1040192 336 ACf CM GTT C CA <3TA ®F» ΑΛΑ OCA TAS* «CC TP5 TCT TSA SÔT OCt TCC Ths? SI a S«eu too vai v&l Ay.» Ala Tyr AI* Leu ser S«r Sly M a Se*· SIS &2P 525 ATT ATT ORA m? CCA SSA TTC AC.& «GA. G&A AAT TTA CIA TTC CTA J5M IIa II» ΘΙΐί aly Fm <31y Phe Thr <Sly Gly Asti teu teu Phs. .ke« I*y» .530 S3S 54® 1584 1S3.2

£&& TCT Am &AT TCA MT GCT AAA ί?Ι.·ϋ Ser Sar Asn Ser li® Al® tys B4S 5SS SCC TTG TTA CAA CCA TAT COT STA Ala liam &e:U Í31» Arçj 5SS Tyr Arg Vai AAC TTA CÔA CTT TTT GTy- CAA AAT Assn Tesu Arg Leis. Phe SI® Asn 5.8® TAC ATT AAT AAA ACT ATC AAT AAA Tyr :tl» Asn Lya Thr Asn i*ye SS5 690 TTT SAT CTC CCA ACT ACT AAT TCT The Asp &SU Ma Thr Thr ASf! Ser SI.» SIS TPT ÃAA GTT ACA TTA AAT TCA GSA Pb& lys Vai Th*· l<*tí Ase »»* Al» 555 -&m ASA ATA CSC TAT GCT TCT ACC &CT Jfcegf t3e Argf Tyj* M.-ã §ex tfer Th* 57® S7? TTA AAC AAT OAT TFT CTT GTC «TC Ser· Asm íssí Asp Mt® Vai II® sm s»a S&T OAT GÂT m ACA TAT CM. ACA ftap Aap A*p sm* Tto Tyr Gin Thr «OS· AAT ATS <ms TTC TCG GGT GAT AAG Asirt m&e. Gly toe Ser Cly Asp Lys sis

ISSO 1728

Í.77S 1824

ISIS 192® 1959

ΑΑΨ ÔAA CTT ΑΤΑ ΑΤΑ «GA SCA SAA TCT TTC GTT TCT AAT SAA AAA ATS

Mn. SIu teu Ite IX» Sly Ala <8Xn Ser Phe Vai s«x Aso. Slsi iy» lie §23 §3® §3S 64®

TAT ATA OAT ÃAS ATA GAA TTT ATC CCA CTA CAA TTS TAA

Tyr II® A&p Lys 11* Gin Phe 11« Pr® Vai <33.» imx €4B «S-i5 (2) INF0RMAÇA0 PARA SEQ ID NO:10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:10: Met. Ase Pr cs A®ts Asm Arg Ser <5lu Eis Aep Thr lie i.ya Vai Thr I S I® IS Asn Ser Glxs li&U Sl.íl Thr aso His Aâtt (I.in Tyr Pro Ii®Si Ala Asp 20 25 30 too A&ti Ssr Thr íi«» ! 31u SIu L««. Aíía Tyr t>ys «1.» Fhe li®u ASÇj too

AsrJ M**fc

35 4® 4S ΡΕ1040192 337

Vhr alii .AS» Ser Ser Thr 81a Vai Leu Astp Aan Ser Thr Vai Ly» Asp 59 55 Ma ¥al Gly Thr ©iy llm Ser vai «S 70 Qiy vai p*o Pis* Ala Sly Ala Leu ss As» Ite 11» T£j> Ps·* S&r Asp Ala 100 Si» Vai ©Lu. Vai Lea 11« Aap fcjrs m ias X»ys Ala Leu Ala elu Leu ©1» Gly 130 135 Vai As» Ala La» As» Par Trp Ly.s 145 ISO hy» Argr Ser ala A&p Ax© 11« Arg 16 S· Sis phr; A«j Asm Ser Mete Pr» S«r 160 L«u Pise Leu Pr» Thr Tyr Ala Gla 3.55 ' 200 Le» lys fusp Ala ©La Vai Ph» ©ly 210 215 Ãsp Vai At a esl.ai Phe Tyr Asm Arg 225 230 Bar Ajsp Hia eye Vai A»» Trp Tyr 3tA5 Gly 5s*' thr Tyr Anp Alã T*rp Vai 260 Mate Thr Lati Thr Vai L®u Á&p Leu 275 280 11a Arg 1*0» Tyr Ser Lys Gly vai 250 235 Pisa 33»r As$> Pre 1.1 a PA» ser he» 305 3 XÔ thr Fhe Leu ®er 11« Giv As» ser 325 tyr Leu ©1« ©iy lie Siu Phe Ms 60

Vai Gly Gin Ue Leu Gly Vai vai 75 S0

Thr 5ãf Phè Tyr Gl» Ser Pbe Lêu 50 55 &Êp Pr* Tip Lys Ala Piiô Kuí. Alm 105 110 fcy» I la ©1» ©lu Tyr AXa Lys Ser 125

Leu sis AS» As» Vha Giu A&p Tyr 140

Lys Thr Pro leu Ser Leu Arg Bar 1.55 160 filu Lau Pite Ser Gin Aí A fíiu Ser 170 175

Phe Ala Vai Ser Lya Pise Slu Vai TOS 150

Ala Ala Asm Thr Hi« l&u xasu Leu 2 as ©1» ©lu Trg> Sl.y Tyr Ser s«r Glu 320 «1» Leu Ly» Len Thr sln ai» Tyr 33S 240

Asm vai Gly Lo» Ag» ©iy Leu Argr 25» 2S6

Lys Pha An» Arg Phe Argr Asrg ©lu 26 S ' 370 li» vai Lati Phe Pr* Phe ty* &*&

2BB

Lys Thr Giu he» Thr Arg &sp Xle 300

As» Thr Leu ©1» ©lu Tyr Gly Px» MS 320

lis Arg í.y» Fx» Hia Leu Ph® .ftsp 330 3i3S

Thr Arg Lati $1» Ps© Gly Tyr Ptxe 338 34S. 3S0 $&x ©ly Ag» Tyx Vai 0lu Thr .&rg 3fiS £Xe Thr Ser srs> ®fee Tyx ®ly Αβρ 380 Leu Ser Pha afp ©iy ala &ys vai 355 40S vai Ale Ale tsp Pro Asa ©ly Ly* 410 415 Asg Phe Ser ©1« tyx Asp &sp Qln 425 430 Tyr Aáp Ser Ly» &rg Asa toa 01y 445· Asp Sla Leu Pr» Oro glu Thr Thr 480 âer Bis <SX» ha» Asa Tyr Ala 01¾ 475 480 01y Thr ile Pr» Phe Ph» Thr Ttp 400 455 As» Thr xie Asp Ala Si» &ys 11« s«s 510 Tyr Ala tm*· Ser Ser &ly Ala ser 525 0iy sly Asa Leu La» Ph& x<att T»ys 540 p&e Lys Vai Tiur Leu As» ser Ala SSS 5βΰ Arg xie Arg tyx Ala Ser Thr Thr 57C 575 Sex Asa as» Asp Phs Leu Vol He S85 SOO h&p Asp &Mp Leu Thr Tyr 01» Thr S05 Aúà Mãt ©ly Pfee Ser ©!y Asp Lyé SâO Ser Ph# Vai Ser Asa ®lu Lys He ΡΕ1040192 346 «*y Ly* Ser Plae &®r tyx 1SS 1£0

Fro ser Xle (íl y S%r Ser Lys Thr 316 37$

Lya Ser Thr 01 u 9*o v*l Sla Ly» 3$©

Tfr .tog Thx 11« Ala Asn Thr Asp 405

Vai Tyx Leu eiy Vai Thr Lya Vai 420

Lys As» Gl» Thr Ser Thr fílíj Thr 435 446

;fíi.s Vai Ser Ala Oin Asp Ser II® 450 4SS

Asp slu Pra L®o Slu Lys Ala Tyr 4§5 470

cy» Lee Mae ©la Asp Arg Arfr 43S

Thr Sis Arg s*r Vai Asp Fhe Phe SOO

Thr Slrs Léu Pró Vai Vai Lyá Ala 515 520

Xla lia Qla «&y Ps» Qly Fhe Thr

530 53 S

Sla Sfmr Ser As» Par lie Ala Lye 545 550

Ma Le» í*m 0U,s Arg tyr Arg Vai 585

Asn. te» Arg Leu Phe Vai 01¾ As» 580

Tyr lie &#» W& Thr «et Asa Ly* 555 000

She Aap Leo Ala Thr Thr Am sar 610 SIS A^n 0lu Lee lie Xl e ®ly Ala. <31u egs «ao ΡΕ1040192 339 ’Γ’/r ϊΐ* Asp t>ys Ila Sla Fhe 11« Sr© Vai Gla i,«y •64 δ 6S@

(2) INFORMAÇÃO PARA SEQ ID NO:11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:11: .ATS AM? «SC* AAC AftT COA A®¥ «A& CAT «AT AC6 m A&S3 CTT ACA CCT M8fe Asa Pifo Asa Asa Aygr Sssr Qlu Sis Asp Thr 11« E.ys. V«1 Thr Pro 1 S :ifâ i$ AAC JMSf CJAA TTS CAA ACT AAG C3WP AAT CAA «AT CCT TTA C€T CAC AAT As» Ser ciii fceu <2l» Thr A$u His Ass «X» Tyr Pr» Isôo. Ais Asp Asn 20 35 30 CCA AAT TCA ÁCÃ CTA SAA CAA TTA AAT TAT ARA CAA TTT TTA ACA. ATC Pr® Asa Ser Thr iew &lu Glu Leu Asn Tyr hys «1« ph« Lev Sr$ M*£ 35 ^0 4S ACT G.AA «AC AST TCT ACÇ GAR CTC CTA (IRC AA€ TCT ACA QTA ΛΑΑ GAT Thr íllu Ãsp ser ser Thr Ôlu vsl Leu Attp Asb Ser Thr V«.X Ly» Atsp s® ss se QCA OTT GSG ACA GOA. ATT TCT GTT STA CCS CAOS ATT TTA «OT GTT CTA Ai*. Vai Gly Thr sly .11« Ser vai va.1 «ly Gla Xle hsri Sly Vai Vai iS 7 V 75 80 GOA mt CCA TTT CCT GQO «CA CTC ACT TCA TTT mtt CAA TCA TTT CST Gly Vsl Pro phs .Ala ®iy Ais Lau Thr Ser Fhe>: Tyr Gin Ser Phe Leu 8S a*0 SS &&C ACT ATA TSG CCA ACT S&T CCT GAC CCA TSG AAC CCT TTT ATS OCA As® Thr Xis Trp Fr© Ser Asp Ala Asp sre T*p tya Ala Pha Set Ala 100 AOS li® CAA GTT QhA OTA CTQ ATÃ GAT AAG AAA ATA GAG GAO TAT CCT AAA A«T Gla vai Glu Vai Loo lie Aep Ly» Lys lia alo 81« ‘Py* Ais Lys Sàr 115 130 12.» AAA GCT crr CCA GAG TT& CAG «G3? CTT CAA AAT AAT fTC SAA «AT TAT Xsya Ala .te» Ala «1» IA» 81a Gly Aasi <Sla Asn Asa Sfes «la Asp Tyr 130 135 l^SO 144 102 340 2 as 33« 3S4 432 ΡΕ1040192 340 err awt oce m &at tcc tos aas ma aca otp toa mr ttc csa Vai Asa M® :Leu Aen Ser Trp Lys Lys TM- Fro Leu Ser Lew ftrg Ser 145 Ϊ·5Ρ ISS ISO. MA AGA mc CAA QAT 0(3». Am ΜΙ SAA CTT TW TCT KM «CA «AÃ AST :Lvs Ara Ser Qla Asp Ara llô Ara 01« teu JFh« Ser SI» Ala elu Ser 2SS 170 175 c»x ttt esr »at tcc ato css toa ttt «ca stt κε aa* ttc ou gto His si*e &rg Ama Ser Met: Vra ser Phe Ale V«X Ser Ly» Pia®· «la VAX 1*0 l*f 150 CTQ TCf C*A ÇÇÃ ACA TÃt «CA. CAA ®CT «CÃ AAT ACA CAT Tth tTO CT» Jeew Fhé i*u Fro Thr *Hyz Ala «In Ala Ala As» Ttur Eis Le» S-eu L»u 295 200 205 TTA AAA GA7 ®S CAA OTT TTT «GA «AA «M TOS m& TAT TCT TOA. -(SAA Leu Lys? Asp Ala «Xe V®X Pfce «ly ôlta <SX« Trp Sly Tyr Séx Ser «Xu 510 215 230 ÓM «TO «Cf G6A TTO «At AOC ASA CAA TF» AAA CTT ACA CAA CAA. TAC Aap Vel tti «ia Ffcé Tyr Thr Arg «Xn. Leu Lys Leu t&r «In Gin Tyr 225 230 23S 240 ACT «AC CAT TOT GTO MT TGG TAT AAT «TO «GA TOA AAT «KST TFA. ASA Thr A$$ Eia eye Vai Asn Trp Tyx Aan Va.l «ly Leu Mn «ly Leu. Arg 24S 2S0 255 4 SÓ: 520 576 S24 672

72 D 765 SSt TCÀ ACT TAT «AT «CA TOS «TC AM TTT MC CGT TTT CSC ASA «M Sly ser Thr Tyr ftsp Ala Tsp vai Lys Fhe Ama Arg Ffce Jtoff Ar® Gin 260 '3 <5 5 370 ATO ACT TFA ACT «ΤΑ TT& GAT CT» ATT «TA » TOS CCA TTT TAT «KT m-t. Thr Leu Thr Vai Leu Atsp Leu 11« Vai las» Kfce Pre Phe Tyr A*p 273 2»fâ SOS ATT CSS TFA TAC TOA AAA CSC OTT Má ACA «AA Cfá AÇA ASA K ATT 11« Axg Leu Tyr Ser Lys «Xy Vai X>ye Thr 8iu Leu Thr A.rg Aap xie 190 S55 300 TTT AOS «AT CCA ATT TTT TÇA. CTT AAT ACT CTT CÃS SAS TAT SSA CCA Fhn Thr Çxo 21« Fhé Ser Leu Asn Thr Leu SXn Sln Tyr Siy Fro 3ÔS 310 1X5 320 ACT TFT Tm. AGT ATA SAA AftC TCT ATT CGA AAA CCT CAT TTA TTT QAT Thr Fhe Leu Ser lis Sàtr Ãsa Ser Xle Arg Lys FxO Hio Leu Fhe Asp 115 330 33S TAT TO CAS «SG ATT «»Ã TTT CãT IMC« CST CTT CRA CCT &&T TAC TTT Tyr Leu S.l.a Sly XX« «Xu Fhe Bis Thr &rg Leu. Sln te ffiXy Tyr Fhe 340 345 350 ais 064 060 1005 1056 «SS AM «AT TÇT TTC AAT TAT TG© TCT SGT AAT TAT 3TA SM ACT ASA «Xy Lys h»& S<st Ths Aon Tyr Trp s«r «iy Aon Tyr Vai «iu Thr Arg 1104 1152ΡΕ1040192 341 CCT A8T AT» <3SA TCT AST AAC ACA ATT ACT TCC CCA TTO TAT GõA Oftf Pr© Ser XI* Gly Ser Ser Xy» Tbx lie Thx S*r »r© Phe Tyr «iy Asp 370 ,3?S 3«o AfiA TCT ACT GftA CCT S» CAR M CTA ACC TTT GAT 60A CAA AAA GTT kys s*r Thr ele Pr© vai Gl» í,eu Ser fhe Asp «ly Gia Lys Vel. 3SS 38® 305 <*&« 1%T GSA AO* ATA GCT AAT ACA OAC «XSA «CG 3CT T00 £00 AA? COT AAG Tyr Asg Tfcr li* Ala Asa x*tr Asp vai Ala Ais Trp Pro Asa «ly l»y» 40$ 4i® 415 ΘΤΑ TAT TTA «QT GTT ACS &ÃA STT GAT TTT A®3“ CftÃ XAT OAT ®ÃT CftA Vai fyr Leu «iy v®i TAr &yg vai Asp Phe ser «ia Tyr Asp Aap «ia 420 42S 436 AAA AAT CAA ACT AGT AGA CSR ACR XAT «AT TCA MA ASA AAC MS SOC j,ys Asm «iu tixs Ser Tfcr «In Tfar Tyr Asp Ser x>ye Arg Asa Asa «iy 43$ 440 44S CAT «TA AST «CA C&G -0AT TCT ATT OAC CAA TTA CCS CCA SAA ACA ACA Kis vai Ser Ala «la Aap ser lie &sg Gin M«t Pr© Pr© elu Thr Thr 45® 4$S MO «AT SM CCA CTT CAA AAA GC& TAT A3Y CAT CAS CTT AAT TAC «CG GA* Asp «itt Pr© leu ®.lu hys Ala Tyr Ser Sis «In t«i Aen Tyr Ala ela 4S5 470 475 48®

12 QO 124® 1256 1344 1332 1446 TCT TTC TTA ATS CAG GÀC CGT CGT SGA ACA ATT CCA TTT TTT ACT TSG Cy» phe &*u Wefc «In *ap Arg Ar® «ly Thr Xi« Pr© Phe Pise Tfer Txp 435 466 445 ACA CAT ASA »GT QTA «AC TTT TTT AAT ACA ATT GAT CCT SAA MS ATT Thr Mi& &ep ser vai Asp PM PM Ma tixe Ee Aep Ala «la Itf* He 506 565 ss.« ãCT caa ctt cca em «*e aaa «ca tat scc tps tct m «cr «cr tcc Thr Gla Aeu Pxo Vai Vai J»ys Ala Tyr Ai» X<eu Ser Ser Gly Ala Ser S15 539 sss ATT att e&a. gbs cca ees. ttc msa gsa «GA AAT TTA CTA TTC CTA aaa 11« lie da sly Pr© Gly Phe Thr Gly Gly Asa Aeu &au fhe í-õu &ys 530 535 546 C5AA TCT A3T AAT TCA ATT CCT ÃAA TTT Ã&& STT ACA TTA &RT TCA SCft «la Ser Ser Asa Ser lie Ala &y» Pha Ays Vai Thr t*u Asa Ser Ala 54S 550 S5S 560 GCC TXG TTA CSÃ &Ά TAT CGT «TA A6R ATA CGC TAT GCSP TCT ACC ACT Ala h®i S-ea eia Arg Tyr Arg vai A*y li» ÃKS Tyn- Ala Ser Tísr Thr- 5Ê5 570 575 148« 153« 1564 1532 1680 1728 AAC TTÃ CGA CTT TTT GTG CAA AAT TCA AAC AAT «AT TTT CTT GTC ATC Asã Ii®u Arg Ma PM Vai «Ira Asn Ser Asn Asn Asp Sihe leu Vai II® 560 SB5 550 1776 342 ΡΕ1040192 TAC ATT AAT AAA ACT ATOS AAT AAA SAT GAT GAT TTA &CA TAT CAA ACA, IS 2 4 Tyr Xie as» Ly.-S Thr Met .ASM Ly« AS» Asp ASp Lse Th» Tyr Gin Thr sõò oos TTT OAT ere GCA ACT ACT AAT TCT AAT ATd 43GS3 TTC TOS GGT GAT &&G 1872 Phe Aísp Le-ii Ala Thr Thr Asa Ser Asn Met Sly Fh«: Ser Gly Asp Lys 010 61S Õ20 AAT GAA CtT ATA ATA OVA CAA TCT TTC GTT TCT .AAT GAA AAA ATC 192» Aarí siu Lesa ΪΙ® lie Gly &X& Glu Ser Phe Vai Ssr Asn Glu Lya il e 525 030 €15 S40 ΤΑΪ ATA «3AT m& ATA. SAA ATO CC& STA CAA TTC TAA ISsg» Tyr lie tep Lys Ilê Siu Phe He Pre Vai Gin Lea

845 «SC (2) INFORMAÇÃO PARA SEQ ID NO:12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:12: .Mefc Ãsn &»o Ibn Aen Ârgr 8ex Slu Sia Mp íhr ile Ly» v«.l Thr jpxo 1 £ 10 15 asm Se» Glu Leu âlt* Wnx Ma Ei» Mn Ôlnt Tyr fxo Leu Ala Asj> asm 20 2.S 30

Asa S«r Thr Leu Giu Glu Leu Ma Ty» Lye Gly íhe Leu. &rg Wfcft- 30 40 45

Thr Glu Asp Ser Ser th» Glu Vai Leu Aap Asss Ser Th» Vai Ly* Aap

so ss $Q

Ai® vai Giy Th» <Uy lie ser Vai Vai SSIy Gto Sis Leu Giy Vai vai SS 70 75 80 âiy Vai ghe At* ely Ala Leu líhr Ssr líh© Ty» $1* ser o&e Leu

85 oo SS

As» Φ*μγ ile «í*p P*0 Se» Ala Asp Pnt Tvp Ly* Ala Fhe .Mfct Ala Í0í» i»S 11» G2x» Va.1 Glu Vai Leu lis Aap Ly» Ly* lie Glu Glu Tyr Ai» Ly* g«r

115 120 12S

Lyâ Ala Leu At» <31» Leu GIis Gly Leu Gin Mn Assa Fb« GXw Asp fy» 130 US 140 vai asa Al* Leu As» Sesr TTp Lyu Ly» Th» p-ro Leu Se» Leu Arg s.6r 145 150 155 igs 343 ΡΕ1040192 ©Ιλϊ tett S*fee S«s Gl» Ala Gl\í S**1 170 173 Phes Ala Vai Ser !Ly® Pb* ©1« Vai 185 188 Ala Ala Asm Thr Kl» teu teu teu 205· ©te ©lu Ttp ®iy Tyx mx Ser 01 u 320 Gin teu Lya Leu Thr Sln Glt* Tyr 235 240 A»» V«1 Giy teu &sn &y teu Arg 2l>0 255 Lys The Asa &rg Ph» Arg A*p <Slu 2&S 270 11® v»l teu phe ντο pfe* Tyr Asp 285 Lya Thr Glu .Leu Thr Atsr Asp XXe 300 Asn Thr teu Gin *3lu Tyi ©ly Prct 3X8 320 Ile Ar$ ttys Pso Hia teu Pha Asp 330 335 Thr As-g teu <51sa Pee ®ly Tyr Phe 345 350 Ser <siy teu Tyr Vai slu Thr Arg 355 í le Thr Ser Pr© P hç Tyx Giy Asp 380 teu Set Phe Aap Siy Qla Lyu Vãl 385 400 Vai Ala AI» Trp f*?o A&& Gly Ay» 410 438 Aap Ohe Ser Glst Tyr tep Âsp <?iu 425 430 tyr Amp Ser |*y» &rg um Am úly 445

Lys Arg ter Gin Asp ftrg ϊΐ* Arg 1*5 ais Me Asr$ A#n s«r Mafc gr© Ser iã& teu The teu Pr© rhr tyx Ala 8in 135 300 teu Lyn Aap &.la Gin V«1 Fh® sly 2iô 3X5 &»p v»X. Ais sj-u Ph* Tyr Thr Arg 225 330

Tlsr Aep Mia cys Vai Asn Trp Tyr 245 8ly ter 1KS*r Tyr Asp Ala Ttp v«a 3ác· fctefc Thr teu Thr v&l stett Asp teu. 27B 280

Sle Arp teu xyr ter Lys ©ly vai 280 28 5

PiiSs Tfar Aep :feo 11« Pfe» ter teu 305 310

Th*- »« te» Ser ;il« ©1« ten Ser 325

Ty*“ tet» Gte Gly lie <30, u Ffee Mi® 34 C* <Sty Lys Asrp Ser Fte Aon Tyr Trp 3¾¾ 3$0

Pr© Ser II® 81y Ser Ser I»y® Th*· 370 375

Ly» Ser Tkç Glu ftw Vai <3J» ty» 185 380

Tyr Arg Thr lis Ala Aon Tfer A»p 405 va! Ty*r leu <My Vai Thr Lys vai 430

Ly» Asm Glu H*r Sar Thr ©:in Tbr 435 440

Mis Vai Ser Ala 81n Asp Ser lie A»p Õin Leu Fr© Pr© Glu Thr Thr ΡΕ1040192 344 400 45 § Ã8$ fJU* PTó Lçil í?J.V by‘« Ala Tyy 4isS 470 Cys Phe L&u Mat Olrs Asp Ar® Arg •4 OS- Thr Bis Ars S$r Vai Asp Phe Fhe 5Θ0 Thr GIk Leu Pr© Vai Vai Lys iVXís líi 520 xi® llé <81 u <sly Pm Sly Phe Thr S36 SIS Sl\4 Ser ã«r Asa ser 11® Ala Lys BAB $5© Ala Leu Leu Gin Ar® SS.5 Tyr Ar® Vai Asn Leu Ar® Leu t%e vai Sln As» SãO Tyr 11¾ Asii LyS TLr S4®t Ãasrs. Lys: 5S5 SOO Vhe Asp Laxt Ala Thr Tta Asks Ser 6X0 «15 As» ©itt Lètt 11© lie ãly Ala ©Xu 05 Tyr XlsS As_;> Lys XI® ©lu Phs lie 04 s 4m íjXsí jçgv $y? &x» Giu 47S 4S0 <Sly Thr íie paro ph® Ph» Thr Trp· 436 4S5 ftSIi TSe· Xlç Aep Alá GlXí Lya lis 505 5X0

Tyr Ala leu Ser Mmx OXy Ala Ser S2S

Sly 6!y Asa Iam I*®«. Fhe l«eu tys 540

Fh& &ys VAX rhr L*m A»n ser Ala $gg 56©

AJPgf Xis Ar® Tyr Ala Sssr Thr Thr svo SÍS

Ser te» Asm Asp Oh© L©a Vai X.l« $es SS»

Asp Asp Asp Ls« Tfer *yr Glrs Thr SOS

As» Mefc ©ly ftss Ser ©ly Asp Lyá

S2S

Ser Ohe Vai Ser Aars Glu L>ys Xl e SIS 040

Pr© Vai ela L*u OSÔ (2) INFORMAÇÃO PARA SEQ ID NO:11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:13: 48

ATS MT CCA MC HAT CSA AST SAA CAT SAY &03 ATA &&S STT ACA CCT 345 ΡΕ1040192 M«t A*» Tr© Asa Arg @&s GIu ai» Asp Tfc.r :Oe x,ys Vai Tbr Pm 1 5 *0 x&

AAC AGT ÔM TTS CAA ACT AAC CAT MT CAA TAT CCT TTA. «CT «AC MT 9S

Asa Ser «la &eu Gin Thr Asn Sis As» ©In tyx Pro L-&n Ala Asp Aaxi 20 25 âo CCA MT TCA M» CTA GRA má TTA AAT TAT MÃ GAA TTT TTA XBA ATS 14« P*o Asa .ser Thr keu «ia Glu hasi Aan Tyr &y» ®lu The i*e» Arg Mtee

3$ 40 4S ACT (SM «AC MT TCT ACG «KA 8TO CTA GAC MC TCT ACA STA AM «AT .19»

Thr «ia Aap Ser Ser TJsr Gl» Vai A*x» Rsp As» Ser Tfer vai hym Aap ss ss «o QCA STT ©>3G ACA «GA ATT TCT' ©Tf CTA GGS CAG ATT TTA GGT «ΪΤ ΒΪΑ 140

Ala Vai Gly Thr «ly Xl« Ser Vai V«1 Gly «Ia Ile Leu Oly Vai Vai 65 50 '?> 80 SOA, GTT CCA TTT ®CT CSC SÍ3A CTC ACT TCA TTT TAT CM TC» TTT CTT »38

Oly vai Pr® phe Ala Sly Ai a teu Thr «er Ph» Tyr ®1» Ser Phe stau

85 90 9S MC ACT ATA Τββ CCA AOT GRT «CT GAC CCA TOS MG SCT TCT ATS CCA »3« A«n Thr ile Trp Pm s«r Asp Ala A*p Pm Tcp Lye Ala phe iM&fc Ala 100 105 .110 CAA «W GM GTA CTG ATA SAT AAC AAA ATA OMB «AS TAT GCT ARA AGT *** «is. Vai Slu Vai Leu ile Asp Lys hys lie Glu «la Tyr Ma hys Ser 115 1:10 125 AAA GCT CTT CCA «AS TTA CAG CGT CTT CAA AAT AAT TTC GM GAT TAT 432

Lys Ala Leu Ala «tu l*s« Gin ôly Lee ®1» Aan Asn Phs elu Aap tryr 230 135 140 GTT AM? «CG TTA AAT TCt «SS AAS AAA ACA CCT TTA ΑβΤ Π8 CGA AGT 4»0

Vai Asn Ma i<©« Aan Ser Trp l>y» lys Thr Pm Áewt Ser leew· Arg Ser iãs 150 i$5 160

AAA ASA ASC CAA SAT CCA ATA »fS® CM CTT TTT TCT CAA «CA 0M AST MS hys AKg ser Sl» Aap Arg lie Arg Sl« &es Phe Ser Gin Ala Gla ser iss na i.7 s CM? TTT tm MT TCC ATS CCS TCA TTT GCA GTT TOC AM TTC GRA GTS ST«

His Phe Arg Aen Ser Net Pr© Ser she Ala Vai Ser ly» Ptxe Glu Vai ISO IBS 100 ÇT3 TTT CTA CCA ACA TAT GCA CM QCT SCA MT ACA CAT TTA TTQ CTA «24 tóu Phe l»«u Pro Thr tyr Ala Gin Ala Ala Aen Thr Hia heu :toj heu iís soo ass TTA AAA «AT <3CT CAA CTT TTT «SA OM SAA TGG «GA. TAT TCT TCA ÕAA 6T2 háii vye Aep Ala «in Vai Pfee Gly Glu «lu Trp <31y Tyx S«:r Ser elu 210 SIS 220 «AT STT GCT «Μ TTT TAT CÃT AGA CAA TTA MA CTT ACA CAA CM TAC 220 346 ΡΕ1040192

Asp VaX Ala <3Iw Pt*e Ty* His Arg Gla j»eu Ay» Leu Vhr «Xn Gin Tyr 22S 230 23S 240 ACT GAC CAt TOT 03T ΛΑΤ T«G TXT RAT «TT S«A TTA AÃT GGT TTA Λ@λ ?$β

Th* Asp Kis Cys Vai Aan Trp Jyr A»n Vai «ly teu Asa. Gly Leu Ar© ,145 X5«> 23<f ma tca act ma mt «ca sres ore ma m aac c&r ttt cec asa «aa ais ©Xy Se* Th* Ty* Asp Ai* T*p V*i Lys 1%» Asa A*g Phe Arg A*g? ©1« as-o 2ss st-o AT© ACT TTA ACT ©TA TTÂ «AT CTA ATT STA CTT TTC OCR TXT T»T ©AT 864

Me& vhr Leu Thr Vai teu Asp te» 11® Vai teu Pàe prp phe Tyr Asp 295 285 AT? AAT TTA TAC TC& ARA ©S« CTT IM ACA SM C» ACA M?A GAC ATT 512 11« Mn teu Tyr ser Ly« Gly Vai l,ys Thr <ãlu teu Th* &rg Asp 13,® 250 255 300 TTT ACG SAT CCA ATT TTT TCA CTT AAT ACT CTT CA<i «AG TÁT «GA CCA 350

Phe Thr Asg» Pre XA» Phe Ser teu Asn Thr teu Gin «lu Tyr Gly Oro 305 310 315 320 act txt rr© agt Am «aa aac tct ATT ca am cct CRT TTA TXT «AT Ιβββ

Th*· phe teu Ser lie Glu Asri ser lie Arg Lys p**> Hls teu Phe Asp 325 330 335 TK’ TTA CAG SGS ATT GAA TTT CAT ACG CGT CTT C&A OCX GGT T&C TTT 1056

Tyr teu «1© Gly 21· 01» Ph· Hi® Thr A*© teu ©1» P*e sly Tyr Phe 340 34S 350 ©G© ARA ©AT TCT TTC AAT TAT TStô TC* ©CT MT TAT GTA GAA ACT AÇA 1204

Gly Lye Asp Se» Phe w» Ty» Trjp se» Gly Asa Tyr vai ©lu Thr Asg

3;5S 340 34 S CCT AGT ATA GOA TCT AST JUW3 ACA ATT ACT TCC CCA TTT TRT GGA ©AT M*2

Stto Se* He Gly Ser Ser Ly« Thr XX· Th:r Ser Pro ρ)ϋ> Hyr Gly 370 303 380 ARA TCT ACT GAA CCT ΏΤΑ CftA AA© CTA A£3C TTT «AT «Oft CAÃ ARA GTT 1»®»

Lya Se» Th* ©lu Pr® Vai 01» x,ys Leu Se* Phe Asp ©ly ©1» lys vai 335 350 355 400 TAT CSA ACT ATA CCT MT ACA «AC GTA «CG GCT TGG CCS AAT GGT AAG 3248

Tyr Ã»g Sa 11« Ma Jum Thr Aap Vel Ala Ala Tep Pro &sn «ly t»ye 403 410 415 CTA TAX TTA CGT CTT AC© MA CTT «AT TTT AST CAA TAT «AT «AT CM 3235

Vai Tyr teu Gly Vai Thr Lys Vai Asp The Ser Gin Tyr Asp Aep «In 420 433 430 AAA AAT GAA ACT AST ACA CAS ACA TXT GAT TÇA ARA A«A MC MT «GC 1344 l<yã AãA ©Xu Thr Ser Thr «1« Thr Tyr Asp Ser x,y» Arg Asa ta «ly 435 440 44s CAT «TA ACT «CA «&« «AT TCT ATT GAC CAA TT& CCG CCA GAA -ACA ACA X392 347 ΡΕ1040192

His vai Ser Ala, 01» Asp Ser lia Asp 61n Leu Pro Pr® ©lu Tbr Thr 458 455 460 SAT £M CCR CTT M MA ©CA TAT A®T CAT CAQ CTT MT TA-C SOS GAA 1440 Ãsp *5i,u Prç» im 81v I»y» Ala 'Ty* S«r His ala £*m toL Tyr Ais t»lu " â?0 473 4Ò0 f©f TTC TTA ATg «Αβ SA£ CST COT SOA ACA ATT 0Ç& TXT TTT ACT KS 148-8

Cys ghe Leu «et al« ftsp Ar§f Argr Qly Th* rle Pro Pfce Pita TStr Tep

485 490 ! 4 PS ACA CAT ASA AST OT» SAC TTT TTT AAT ACA ATT SAT OÇT GAA AAS ATT 1S18

Tfcr His Arg· 8er v«i A»p Pite Phe Asn Th-r iie Asp Ma Qlu X*ys II®

$90 SSS SIS ACT CAA CTT CCA STA <STS M» OCA TAT OCC TTS TCT TC» <SGT 9CT TCC 15-84

Ths ain Leu. Pxo Vai Vai Ly-s Ala tyr Ala Leu s«r ser ®Jty Ma S«r SIS 530 §2i ATT ATT G8A &3fc OCA «A TTC ACA «WSA GOA AAT TTA CTA TTC CTA AM 1€32 3'le ϊ1«· αία oly ΐ£β Qly P&e Thr· Qly Gly Aro. Léu Leu Ph« Leu Lys 538 535 540 ÇAA TCT Ai3T AAT TGA ATT SCT AAA TTT AM GTT AÇA TTA AAT TCA- GCA 1680 eiu Ser Ser Asu Ser 11« Ala Lys Phe Lya vai Thr Leti ftm Sér Ala MS ' 5S0 555 §58 ©CC tTU TTA CAft CTA TAT COT CTA ASA ATA CSC TAT SCT TCT ACC ACT 1028

Ala Lsú Leu. Gin Arg Tyr Arg VaX Arg He Arg Tyr Ala Ser Tte TM'

58.5 S7Ú SOS ÁAC TTA CGA CTT TTT GTQ CfiA AAT TCA MC AAT 0AT TTT CTT CTC ÃTC 1776

Aro Leu Arg Leu pises vai <31o Aon S&x Aro Asa. Asp Pfcie Leu Vai Xia 580 SSS 590 T&C ATT AAT AAA ACT ATO AAT AAA <3AT OAT SAT TTA ACA TAT CAA ACA 3.824

Tyr lie Aro Ly» Thr í*et A«» Lys: Asp Asp Aep Leu The Tyr slu. Tfer SS5 SOO 60S TTT a&T CTC OCA ACT AC? AAT TCT AAT ATS SSS TTC TCC OCT SAT MS 10T3 M» Aep Leu Ala TÁr Th.T Asn. &*x Asa Mafe si,y phe ser çiy Aro ílve

fl.O MQ AAT SM CTT ATA ATA SOA SC& (M TCT' TTC STT TCT ÂÂT ORA. AM. ATÇ 1820

Aro @ia Leu He lie eiy Ala SXu Ser Bhe vai Ser Ma 8la Lys He 82S 830 83S «40 TAT ATA CAT AAG ATA GAA TTT ATC CCA ©TA CAA TTG TAA 1855

Tyr He Aep Lya Xle ©iu & 11« Pr® vai ala Leu (2) INFORMAÇÃO PARA SEQ ID NO:14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos 348 ΡΕ1040192 (B) TIPO: aminoacido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:14:

Asas Pr» As» As» Arg ssr ©lu Ki.s ftsjs T&r lie hys vai Thr pr& 1 s 10 15

Am mst ¢81¾ imi um την asr h±s Asn ©l» Tyr pr© lAHi Ala* as» ash 25 30 Asa Tyr 'Lys ©1» PA® l*s» Arg Mat 45 l*«» Asp Asa ser Tfer vai liys Asp 00 Vai ©ly ©ia 11« leu ©ly V*1 vai ?s so Tlir Ser Phs Tyr Slii Sér Ph® Lee 90 §5 Asp Vrcí Trp t,ys> Ala Pita Mafc Ala 105 119 Ay» II* ©lu ©lu iyr Ala. s»ys 8*r 125 Leu 6l.a Asa Asn. Ptia ©lu. Asp Tyr 140 Lys taf ps?» Leu Leu AFf ser 155 160 ©lu Leu phe saz ©In. Ala ©lu ser 170 175 9&a Ala Vai S«r kys Ph« ©Ia vai 185 .198 Ala AlA Aâ» TB.T' His L«U Létt I*#is 205 ©la ©ia Trp ©ly Tyr sar ser oiu 220 61b l«u Lys L®« Thr ©1» ©la Tyr 235 240 Asn Vai ©ly te» Asa ©ly Lea Arg 2m S5S Lys Pina Asa Ar*f 9h.e Arg Arg ©lu 255 270 20

Pr& Ama S«r Tta L«u ©lu ©lu i.®u 15 4©

Tbr Slu Asp Ser Ser TAr ©1« vai 50 55

Ala Vai ©ly Thr ©ly 11® ©ar Vai S5 70 ©ly Vai ψχο &hm Ala ©ly Ala Lsu 85

Asri Tdr ll® Trp Pro Ser Asp Ala 100 ©la Vai <31u Vai Lm lia Asp &ys lis iao

Lya Ala Leo Ala ©1» hm ©in ©ly 120 135

Vai Jtoa Ala Deu aaa ssar ITp Ly® 145 150 í,y.s Arg ser ©1« Asp Ar© xla Ar©

MS

His Phe Argr Asa S*r M®t P:r© Ôer 180

Ii®« Mss Lm* Pro $fer Tys?· AlA ©Ifâ 1:55 300

Lm í^e Asp Alo, ©1» ml Phe ©ly 210 215 ftsp Vai Ala ©la Phe Tyr His Ar© 225 2A0

Thr ftsp «la Cy» Va! Asa Trp Tyr 24.5 ©ly Ser T3*r Tyr· Asp Ala Trp vai 250 ΡΕ1040192 349

MSt mt £*«», Ϊ&Ϊ v«l £i8u ASp Ie«tt 27S 280 11« &sa hau Tyr Ser Ly# Gly Vai 23© 3.95 Sb« Thse Mp Ptó 11« lhe ser Leu 305 31© Thr Fha Leu £«*? iXe 01¾ &ssj Ser 325 Tyr Leu gIís Sly lia Glu Phss His 340 GXy fcys Αβρ seç- Fite Αβά Tyr Trp 355 3S<Í Pse 8«*- lie; G'iy Ser Ser 2»y» Tta? 370 3'?S Ly« S*r Tht' elu Pro V«1 Gin Lp 385 39>Q Tyr Arg· Thr lie Ala Asn Thr Asp 405 Vai Tyr Leu Gly Vai Thr Lys Vai 420 Lys A.sji 01 u Th.f S«r Th.v elts Thr 435 440 His val Ser Ala Gl« A«p Ser 11«· 450 455 Asj> Gin Pr» .Leu G.lu lys Ala Tyr 45 S 470 Cy» Fhe Lee Met Sl« Aep Arg Arg 415 T&r Sis Axgr ser vai Aep Phe Phs SOO Thr Gin Leu uro Vai Vai iys Ala 513 sao n« He Slví Sly Aro Sly Phe Thr 530 S35 ¢1¾ Ser Ser Aam Ser 11« Ala Lys 54 S SSO llè Vsi Leu Phe Aro Fhe Tyr Μψ 385

Lys Th.r SIu Leu Thr Arg Asp He 300 A«» Thr Leu GX» ¢11 u Tyr Sly Ara 313 320

Xie &rg Ly& l>ra Hi* Leu Fite ftsp 330 335 Títr Arg X<e» Ol» Aro <*ly Tysr Pfce 348 35©

Ser fSIy As» Tyr Vai Gl» Thr Arg

3«S lie Thr Ser Pr.o Phe Tyr sly &s» .38©

Leu Ser Ptae Ãsp Gly Gin Lys vai 38S 400

Vsl Ale Ais Trp Pro As» Gly Lys 41© 41s

Asp Phe: §«jf til» Tyr Asp Asp Gin 425 43©

Tyr Asp ser Lys Arg Ae« As» Gly 445

Asp· Gin L»» &xt? Pro Glu Thr Thr 4SO S«.r Ria Gin Leu As» Tyx Ala Glu 475 48©

Gly Thr .11« Pxo Ph& Fbe Thr Trp 490 495

As» Thr lie Aisp Ala Glu Lys lie SOS S1.0

Tyr Ala Leu Se*1 Ser Gly Ala Ser S2S

Gly Giy As». L&u Leu Fite L«u Lys

S4S

Phe Lys Vai 3'hr Lsu As» Ser Ala sss sm

Ale Leu Leu Glu Arg Tyr Arg vai Arg· 11« Arg Tyr Ala âer Thr Thr 350 ΡΕ1040192

SS5 S79 S'?S

Asn. Χ,-eu Arg Lesu Fh« Vâl 01» As» AOn As» Asp Sfe» XrfMi Vai 11« sôíí sss soo

Tyr il« Asa Lys T&r Mefc A«n .ΐ»γ« as© Asp &ep Leu T&r Tyr Oln Thr 5fS 600 60S

Phs Asp Leu Ala TA*1 flir As» Sex As» ÍSefc OXy Fh® Ser OXy Asp Lys 0X0 SIS £20 gusn Olu Leu 11* 11« Sly AX® ©lu Ser Fixe VSl Ser tm& (H« Igr# llã 625 6 33 05 $40

Tyr 11« Asp Lys 11« ΘΧ» FSrb Ik Fr© V*1 Sln L&u 645 650 (2) INFORMAÇÃO PARA SEQ ID NO:15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:15: ATO SAT CCA AAC AAT SGA AGT OAA G&T GA.T AAG GTT ACA CCT 4S mt X Aa» Pr» As» Am S Arg Ser Qlu ííis Asp 10 Thr lie: Lys Vai Tfcr 15 pre AAC AÍÍT GAA cm ACT AAC CAT .AAT CAA TAT CCT TOA OCT GAC AAT M Aa» Ser Qlu I;®« 20 Gin TAr Aso Hlg A:SA 25 oin Tyr Fr© Leu Ala 30 Aap ASM CCA AAT TCA ACA em QftA OAA TTA AAT TAT AAA SAA TXT TTA ATS 144 Fm As® Ser 35 ThF Léu ÇIu Qlu liSU 40 Aísri Tyr Lya Qlu Fíié 45 Leu Arg Mer ACX OAA GAC AQT TCT ÃCS QAA GTG CTA GAC AAC TCT ACA QTA AAA «AT isa Thr Ciu Asp 50 Ser Ser TAr Glxl OS vai Lau Asp Asa Ser 60 Thr Vai Lys ΆΜΡ OCA çtt osq ACA ATT TCT OTT OTA GGO CAQ ATT TTA QQT GTO GTA 240 Ala Vai 01y Tbr ss sly DLe 70 S&r V&l Vai Çly 01» IX e 75 Leu OXy Vai Vai SO mh STT CCA TXT GCT (sm CCA CTC ACT TCA m tat CAA TCA TTT CTT S®5 &ly Vai Pr» PA® Ala <3ly &X« Leu Tfcur Ses Phsa Tyr SI» Ser Phe Léu 351 ΡΕ1040192 AAC ACf Am TOS ©CA AS? GAT ©CT SAC CCA T&3 AAS QCt ΤΓΓ ATS ©CA 335

Ar» ftr 11« Trp Fr» s«r Asjp Ala A»p Fro Trp Lys Ais Fh® *to-t Ala ISO AOS Jiõ CAA ©TT GAA ©TA CTS Am ©AT AAG AAA ATA S&<3 <3A© TAT ©CT ΆΛΑ AQT 384 SI» V*1 ©1» Vai ke« lie Aap Lys X.ys Xl« ©1« Glu Tyr Ala £>y» Ser 115 120 13$ ΑΛΑ <3CT CTT ©CA GAS TTA CA6 0ST CTT CAA AAT AAT fTC ©AA ©AT TAT 432

Ay» Aí.» A*» Ala. Sln ϊλά Gin ©Ay &.«« Si» Asn Aaa F.fe» ©Au A®p Tyr 130 135 140 ©TT AAT «C® TTA AAT TGC T6S AM? AAA ACA CCT TTA AOT TTO OSA AG? 480

Fsi. A»» í .£*s.s ’Τ'ί^ϊ s.y* T.yp TO.r Ρτ^* ti ίρ<μ]

MS ISO 155 ISO AAA ASA ABC CAA ©AT CGA ATA AGG 6AA CTT TXT TCT CAA OCA SAA A©T 528

Lys Ar© ser ©I» Aap Argr lie Arg «1« las» she ser slra Ala slu s«r IAS 170 175 CAT TTT OSS? AAT TCC ATS CCS TCA TTf «CA 6TT TCC AAA TTC GAA GTG 5‘?5

His O&s* A.rsj Aati S&r Mefc Pia 8«? Fhè Ala vai S&r l.ya Fhe ©la Vai

180 185 ISO CTG TTT Cf A ©CA ACA «AT ©CA CAA ©CT ©CA AAT AC» CST TTA TTS CTA 624 &«a Ms.e Lm í?ro Thr Tyr Ala ©1» Me Ala Aon Thr Sis lm* leu I>eu 1.9S 2m 20$ TTA AAA OAT ©CT CAA STT TTT GGA. ©AA GAA TSG QGA TAT TCT TCA ©AA 672 L·®» I.ye Asp Ala Sln Vai Ffes Sly <31 u «In Trp Sly Tyr Ser Ser Slu 210 âiS 220 SAT mr ©CT ©AA TTT TAT cwr ASA CAA TTA AAA CTT ACA CAA CAA TAC 720

Asp vai. Me ©iu Ffee Tyr Mi» Ar® ©l.s ©au 3Uy» &*w Tí»r ©1» ©1» Tyr 225 230 235 340 ACT ©AC CAT TOT GTT AAT TGfif TAT AAT GTT SGA TTA AAT C©T ΤΤΛ ASA 768

Tbr A»p His cy» Vai ftm Trp Tyr A»« vai. aly l<eu Atm eiy &·» Arg·

245 2S0 2SS ©ST TCA. ACT TAT ©AT SCA TO© ©TC AAA TTT AAC CBT «TT OSC ASA ©AA tl«

Sly Ser fte Tyr &Sp Ale T*p ^el fcys FAé Asn Arg FJsfò Ãrg Aâng ©ly 260 2S$ 270 ATO ACT TTA ACT STA TTA SAT CTA ATT STA CTT fTC CCA TTT TAT SAT 854 ífet Thr AêU Tfcr Vai AOV Aep tieu xle vai Léw Fhe Fre Wlm Tyr A»p 275 380 285 ATT CG© TTA TAC TCA AAA SSS GTT AAA ACA SAA CTA ACA ASSA SAC ATT 312 11« Arg tmt Tyr Ser I»y» ©ly ¥al lye Thr 61« z*ea Thr Arg Asp Jle 230 235 300 TTT AC© ©AT CCA ATT TTT TTA CTT ACF AC© CTT CA© AAS TAC ©GA CCA m 0

Fbe Tkr Asp Fr» Xle Fh« JUeu íi*u I9»r Thr L«y Slrí Sys Tyr ©ly Fr» 352 ΡΕ1040192 aos 3:U> 315 330 ACT TTT TTS AGT ATA SAA. ΑΑΓ TCT &TT C8A AM CCT CAT ΤΓΑ TTT SAT .1008 T&r J?te L&u Sey SI® Qiu AS·» Ser tle Arg Lys Pr© His te» Pise Asp :;3* 330 355 TAS TPA CAiS «®S ATT ®A TTT CAT A« CGT CTT C&A CCT «ÔT TÀC TTT Í»S« tyt Leu Sla Oiy Xla GlU Mtts His Thr Arg í»*u Si» Pr<© Qly Tyr Ph® 340 34.8 350 GSÔ AAA GftX TCT TSC AAT TAT T8G TCT G8T MT TAT TO <*&A ACT ASA U9* <Siy lsys Asp Ser Pis.» Am Tyr T«p Ser Gly As» tyx VAI 81« TftT AT§

3SS , 3«0 3SS CCT AST ATA «GA TCT ΑΘΤ MC AC*. ATT ACT TCC CCA ΤΤΤ TAT GOA GAT 11S2

Pro Ser ll«s Oiy -Isk 3es: Lyw Tlu" lia Ttos- S«i. Pr© Pb® fyr çly As» 370 375 380 AAA TCT ACT SAA CCT STA CAA MS CTA A8C TTT «AT <38*. CM AM QTT 1*«Ô S»y» Ser Thr Glu Pro Vai Gin Ly» i*e« Oer Phe Assp Gly ei» Lys --vai 285 3»0 335 400 TAT ® ACT ATA SC® .AAT ACA «AC STA SCO ÍSCT TtSS CCS AAT mX AA6 1248

Tyr Asr® Th*· ih aía ,A#r Th*· &ep v*l Ais AI® Hrp Fr* Aets Cly ty» 405 4X0 415 0TA TAT TTA CíCT (JTT AÇO AAA CTT «AT TFT AGT CM TAT GAT «AT £&A 1336

Vel· Tyr Is» 61 y Vai Thsf Lya Vai A*p Ph» &»r çin Tyt: *®p Asp 01« 420 428 430 AM AAT CM ACT ACT ACA CM ACA TAT ÇAT TCA AM A6A MC AAT SGC 1344

Lyj* As» elu T&r Ser T&r «1» Tfer fyr As» Ser Vys Arg As» Afta ely 43$ 440 445 CAT TO MT OCA CAG Q&T TCT ATT «AC CAA TTft CCO CCA OM ACA ACA 1353.

BiR VaJL Ser Ais cl» Asp Ssr lis Asp Cl» Lsu Pro Pró d» Tíir Thr 450 4SS 4€0

CÃT SAA CCA. CTT SM AAA «CA TAT AS® CAT CK9 CTT MT TAC ©08 CAA X44S

Asp Sl« Pro teu Qiu Lys sis Tyr $«r His Gl:«, Leu, λ*α Ty*· Ala 81« 4^5 470 473 480 T8T TTC TTA ATO CAG «AC COT OST GSA ACA ATT CCA TTT TTT ACT TOS 1488 cys Pba Lev m* SI» Asp Axp Arg Gly Tfer lie Hro Ph® The Thr T*p

485 450 4PS ACA CAT ASA AGT 8TA OAC TTT TTT MT ACA ATT SAT GCT íSAA AA8 ATT 1336

Tbr Hi« A*B Ser Vsi Asp Pha Phe Asn Tks H* Asp· Aie Sl« Lys XI*

500 505 SIS ACT CAA CTT CCA 8TA βΤβ AM CCA TAT GOC TTC TST TCA CGT GCT TCC 1584

Thr Sln L«« Pro Vai vai Lys Ala Tyr Ala teu Ssr ser Qly Ais ser SIS 530 525 ATT ATT GAA «GT CCA GOA TTC ACA OSA CCA r*t TTA ÇTA TTC CTA AM 1S32

Tle iie <31« eiy Pvo &ly Phe thr 8Sy «ly a*» teu teu Ph* teu £»yc 353 ΡΕ1040192 S30 33S 54 0 «AR TCT ABT AAT TCA ATT ©CT AAA TTF AAA ©TT ACA TTA AAT TCA ©CA 1880

Olu Ser Sêr Agft ser lia Ala i.y» Phe :JUye vai Thr Leu Am. Ser Ala 54 S S5Q 555 S6C OCC TT® TTA CAA OSA TAT CST STA AOA ATA C<3C TAT ®CF TCT ACC ACT 1728

Me Lftv &eu si» Ar$ Tysr A*g v#i Arg Sla Asf§ Tyr Al® &«r Thr Thr 565 570 575 AA© TTA «6A CTT ΪΤΤ ©TS ©&& AAT TCA MC AAT «AT TXT CTT STC ATC m«

Asa ΐι»« Arg Lsu Phe vai ©1» Asa ser asa A*n Asp S&e Leu vkl Xle $ m ses sso TAC ATT AAT AAA ACT ATS .AAT AAA ©AT ©A? «AT TTA ACA TAT CAA AGA 1824

Tyr ile mi hys Thr Me.Sí km Lys Asp Asp Asp to» Tfer Tyr Gin Thr S9S «6« ΤΤΓ SAT ctc GCA ACT ACT AAT TCT AAT AT® ©S© TTC TOS SOT ©AT AAQ 1872

Pha Asp leu Ais Thr Thr Asm S«r Asn Het «ly Phe Ser «iy Aap Lys 61® $18 820

AAT «AA CTT ATA ATA OS» OCA SftA TÇT TTC «ITT TCT AAT fiM AAA ATC ISSO

Asa ©lu Leu Ik He «ly Al* «lu Se* Phe Vsl ser Mae Olu hyat lie 625 filõ filS ¢-40 TAT MA 8Af MS ATA SSA TTT ATC CSA OTA C*A TKS TAft 1559 iyr Xle Aep Lyst He Gl« Phe He Pr® Vai ©1» l.-sw S45 €S(t (2) INFORMAÇÃO PARA SEQ ID NO:16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:16:

Asn Pro As» Asa i\rg Ser ©la Hia Aso- Thr Xle Lys vai Thr pro 1 S 10 15 Asa S-er 01« Leu ©in •fhx Asa ais ASh ©Irs Tysr Fro LS!« .Ala Asp Asn S» .35 10 Pro Asa. Ser Tht LãU Slu Glu Leu ASP Tyr Lys Clu Ph& Leu Arg Kefc 33 40 45 Thz Giti Asp Ser ser Thr Giu Vai Leu Afip Asú s&r Thr vai Lys Asp 50 ss fio Ais Vai Gly Thr fôly XXe- ser VAI Vai Sly «In .11 e Leu ©ly vai Vai s$ 7© 75 80 ΡΕ1040192 354

Gly Vai ST© Phe Oiy Alsi 1·®* 35 h&a 3$s» He Ύχρ P-ro Se*1 Asp AI® 100 Gls Ifta 01 u Vai Ls« Ile ABp- l»y* iiS Χ2Θ Lys Ais Lèu Ai* Oltt Leu 01n €ly lâ» 13 S Vai han JO* Léu A*® S*r ιίφ ^y» 1*5 ISO Ly« Arg Ser 03.» A*p *«9 13« Arg 1«5 Eis Fhe Ax$ Aàs ser «*S hro Ser ISO Leia Píhji Imu. Fr© Thr Tyr Ala βΐη 135 200 LéU Lys Asp Ala 0.1«. Vai Ph» tSly 210 215 Aap ¥*1 Alá Sly Phe Tyr ííie Arg 225 250 Tfer ÃBp HÍS Cya Va À Asá TSp Tyi' 245 <£ty S*r Tfer Tyr Aap Ala T*p Vai 2S0 Wefc Thtr teu Thr Vai Leu Asp Léu 275 280 lis Arg Léu Tyr Ser L<ya 01 y Vai 3SS 2VS Phe Thr As;p Fr© lia VA* Leu Leu 305 ;?10 Thr Phá Leu Sar lis Sl« Asa Ser 325 Tyr Leu 01« 61 y 11* 01u Fhe Mia 340 ©ly Ly# ASp S*r Ph® Asa Tyr Tep 35$ 350 J?r© Ser xle 01y Ser Ser Lya Thr 370 375

Thr 5ar Phe Tyr 01a Se» Píie Leu 30 S5

Asp P»o Trp Lys Alá Phe M®t M* 1ÔS 110

Lye ii* ôtu ®.lu Ty» Ala Ly* sor 125

Leu ;Gln Au© Aon Fhá 01 u Asp Tyr 14»

Lys Thr Fr© Leu Ssr .Leu Arg Ser 155 im 61 u Leu Píhs Ser ©In A.ia fila Ser 170 175

Phe Alá Vál Sar Lys fhe Giu Vai 183· 130

Ala Ala A&n Thr Bi* La» Leu Leu. 2 »5

Qlu íJiu T»p <Uy Tyr Ser Ser 01« 220

Gl© Leu Lya Lèu Thr 01a ©1b Tyr 23S 24S

Asa Vai Gly Leu Asn Gly Leu Arg 23» 255

Lya Pfcte Aan Arg Phe Argr Arg Glu 3«5 270

Xié Vai léu Fha Pr© Phé Tyr AOp 285

Lys Thr 01u Léu Thr Arg Asp 11« 300

Thr Thr Leu Gin Lys Ty» 01y Pr© 33.5 320 lia Arg Lys Fr© Hia Leu Fha Asp 330 335

Thr Arg Leu @le E«o <3ly Tyr Ph* 345 '350

Ser 01 y Asrt Tyr vai alu Tfer ftrg .345

Xle Thr ser pru Phe Tyr Gly Aup 300 355 ΡΕ1040192

Ly* Ser Thr ©1« £r© Vai Gin Lys Leu Ser Phe Aep Gly Glo 'IiJrS Vai 38$ 380 335 400

Tyr Aaxsr Th* lie ala Aa« Thr A»p Vai Ala Ala T*p Oro Asm Gly &ye 4OS 410 41$ V*.l Tyr J#eu Oi.y Vai Tb* Xsy» Vai Asp pfca. ser «sl» Tyr Aap Aap Gl« 490 425 4.30

Ly» Asm «lu Th*· âtr Thr Gla. Thr Tyr A*p se* Lys A*§ Asn Asm Gly 4,3-5 44.0 44 S

Mis Vai Se* Ala Gi» Aep se* il« Aep «lo Leu Pro oro Gl« Th* Tfer 4S0 455 4S0

Asp Glu 0*0 l»eu Glu lya Ala Ty* £er Eis Glsi Leu Asa Tyr Ala. *31w 4€S 470 49$ 440

Cy* »h* hm Matt sia Asp &rg Arg sly Tb* tl» Fro Fhe wh» Tb* T*p

485 450 4$S

Th* Kis &rg Ser Vai Aep £9»e Ph» Asa Th* ϊϊβ tep Ala Sl» Lys Ji* SOO SOS sio

Thr Glm Léu 8*0 vai Vai L>ye Ala Tyr Ala teu Ser Se* Sly Ala Ser SIS 520 525 11« il« Çl» ©ly Sr» 6Xy Mmi Th* <5ly âly Aars l«u 140» J?fee Leu íUyé 53,0 535 S40 GIu Ser Ser Asn Ser 11# Ala X*y.s Mm S*ye Vai Tbr hm Asa S*r Ala

545 SSO 555 56 O

Ala teu ftau Gin. hvg Tyr Arg Vai Arg IXe Ajrg Tyr Ala Sax Th* Tfcr

SSS 573 57S

Asa Leu ftrg Leu Phe vai Gla Asa $er Asa Aeo Asp Pb* Leu Vai 11* §80 SSS .590

Tyr 11® A»n Ly» Tfcar Í4efc Aso Ly» Asp Asp Asp Lau Tkr Tyr Gin Th* 595 δ00 SOS

Mm A»p Leu Ala Th* Th* Asa Ser Asa Met Gly Pbe ser Gly Asp Lya S.U> δ30

Asa Gin teu He 11« eiy Ala GX« Ser Pke Vai ser Asa slu Lys 11« SÃS 630 05 840

Tyr Ile A»p Lya 11® Glu Wh» tl» Pro Vai ®1b luu S45 450 (2) INFORMAÇÃO PARA SEQ ID NO:17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases 356 ΡΕ1040192 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:17: ATO ART ©CA. *AC AA.T ©3R. AGf ©ΑΛ CAT Qm AOS ATA AAS QTP ACA COT Met Asm Pr© Asn As» Asg Ser Slu His Asp Tíir 11® Lye Vai Shr »ro X S 10 15 AAC ACT «M, TTO ©RR. &CT AAC CAT AAT CAA. SA* OCT ΤΤΛ ©CT ©AC ΑΑ3Γ Am ter ©ta tm* ©X» Tfcr .As» Mis A&n Gin fyr Pre teu Ala Aap Asn «0 :S5 3a CÇA ΑΑΪ TC* ACA CSR. ©RA G&& TTA .ΑΛΤ TAT AAA ©AR TST TTA ASA ATS Fto ah» Ser Thr Leu Cílsi clu {«» Asn fyr t,ys Slu Phe te» Arg Mae 3 5 40' 4S ÂCT ©RA «AC AST SOS AfíG «AA ®K? CSA ©AC ARC TOT AÇA ©m AAA OAT Sfer ©J,u A*$* Ss*r Ser Tbr ©I» V*1 Leu tep A*a Ser Thr Vai Lys &sp 53 55 03 3CA STT GGG ACA ©GA ATT TCT QTT GTA. SSG C&Q ATT KA QC5T Í5TT STA Ais Vai 6Iy Thr Sly lia Smt Vai Vai âly ©la lie Leu Gly Vai vai 55 70 75 80 ©©A GTT CCA ITT CCT G©6 ©CA CTC ACT TOA TTT TAT CAA TÇA TTT CTT ©ly Vai Pr» Phe Ala «ly Ala Leu f&r Ser JWsa Ty* Glii Ser Pte te» as ao ss arc act Am to» cm mt «at ©ct «ac cca tos aa© ©ct ttt ato ©ca AS» Thr lie ψτρ Sxo Ser Asp Ala Asp Pr© Trp Ala Pb® Het Ala S.O0 103 110 «8 14.4 192

S8S

33S CAA ©ST ©AA «TA O© ASA <SAT A&S AAA ATA ©AS ©A© TAT ©q* AAA *©S ©1» Vai &lu Vai teu lie Ãsp Ly® Rys Hç ©iu ©1» Tyr Ala Lys Ser 115 120 123 384 aaa ©cs crr ©ca «as tta cr© «ct ctt caa aat art rrc saa ©at m? &y£ A1* &eu Ala GIU te». ©1» ©ly Lau ©1» As:n Asa Plis Slts Aap Tyr X. 10 135 14 0 432 ©SS AAT ®cs TTA AAT TCSC TO© AA» AAA ACA CCS TTA A0T TTS CCA. AST Vai Ãsn Ala Leu Asn Mar Trp Lys Lys TMr P*p Aav StX teu Ãrg ser i*s iso iss ião AAA .ASA AGC CAA, SAT OSA ATA AG© ©AA CTT TTT TCT CAA SCA SAA AGT Lys Ato ©*r Gin Aap Ar» He Arg ©lu teu Ph® Ser Gin Ala ©1« ter XSS XI0 xis 480 528 ΡΕ1040192 357 CAT TO* cer ΑΛΤ TCC ATS CCS TCA TTT ©CA «TO TCC AAA TTC GAA 0¾¾ Bi» p&* te» s**· J*efc 2*re> ter Phe Ala. 'Vai Ser I>y* Ph« ©1» Vai 13Q 185 190 S78 CTS TOT CTA CCA *CA TAT SCA CAA QCT GCA AAT ACA C&T TTA TOS CtA Jah gbe teu P*a> Thr Tyr Ais ©la Ala Ala As» Thr Mis teu tea teu l$s 200 205 TOA MA «AT SCT CM. «TO TTT SSÃ GAA GAA TQGí SGA TAT TCT. TCA SAA teu fcy» tep Ala <3Xa Vai Phe Siy Glu Glu Trp «ly Tyr Ser Ser Slv. 210 SIS 32Ô 872

GA? GTT «TO SAA TTT TA? CAT AGA CAA 3T& AAA CTO ACA CM SAA TAC Asp Vai Ala Slu Pha Tyr Sis Arg ©In teu &y® teu Thr Cl» <31» Tyr 2.28 230 23» 24Õ AC* «AC CAT TST «TT AAT Τ®θ TAT AAT OT GOA TOA AAT GGT TOA ASA Th* tep «is Oys vai Aám Trp Tyr ten Vai «Xy teu A®» ©iy 'teu Aí-® 245 250 2SS 720 ?ás <3©T TCA ACT TAT «AT «CA TOO· «TC AAA TTT AM? O0T TTO CSC AGA «AA Giy Ser Thr Tyx tep Ala Trp Vai hys Phe Aso Aapgf Phe Krg tegi ©1« 2S0 2SS 370 ATS ACT TTA AC* «ΤΑ, ΤΓΑ «AT CTA ATT ©TA. CXX TTC CCA ΤΪΤ TAT «AT Mefc. Thr teu Thr Vai teu Asp Leu lie Vai te» Pite Pr© Mas Tyr tep 375 280 285 ATT C®B TOA TAC TCA AAA SSS STT ΑΛΑ ACA SAA CTA ACA AGA GAC ATO 3Xe Arg teu Tyr Ser Lys siy -Vai fcy» Thr Qlu teu Thr Ar® tep ile 230 295 300 ITT AO© «A* OCA ATT TTT .AÕÓ CTT AAT ACA CTA CA© AM TSC «©A CCA Fhe Thr Aap Pr© Xle vlae Thr teu ftan Thr teu. Gin hy» Cys «ly Pr© 305 310 31S 320 ACT TTO TO© AGT ATA ©AA AftC TCT ATT CGA ΑΛΑ iCCT CAT TOA TTO «AT Thr Phe teu Ser Xle «X» .Aen. Ser 11® Arg Lys Pro His teu Ph# Asp 325 330 335 TAT TOA OUS SCO ATT SAÂ TTT ÇAT AÇS COT CTT CAA CCT ©ST TAC TTO Tyj? teu ΟΙ» «Jy Ile «lo Phs His íbr Arg teu Gin Pw» ©iy Tyr Pte 340 34S 350 8-16 864 P12 980 1008 1058 3104

<3QQ AAA SAT TCT TTC AAT TAT TOS TCT ÔGT AAT TAT STA ÓAA ACT ASA

Sly I»ya Aap Ser Ph« teu Tyr Trp Sar Sly tea Tyr Vai Slu Thr Arg 355 300 355 1152

CCT MT ATA GSA TCT AST AM ACA ATT ACT TCC CCA TTO TAT SSA SAT

Pro Sor Xle fâly Ser S®r X»y« Thr lis Thr Ser Pro Phe Tyr SXy A*p 370 375 380 AAR TCT ACT OAA CCT CTA CAA AAG CTA ASC TTT GAT GSA CAA ASA STT Vjf& ser Thr Giu pjpo Vai Gla ^ys teu ser Fhe Asp Sly Sis hys Vai 38S 390 395 400 1200 1248ΡΕ1040192 358 TAT CSA ACT A3f» OCX ΑΛΤ ac» ©ac sm ©os ©cr TOS ©c© αλτ ©st aws Tyr Arg Tbr 11« Ala A$n Tb* Aap Vai Ala Ala Trp ©ro Asn Sly fcy« 4«S «X© 415 ©TA TAT ΚΑ'δδΤ ©TT ACS AAA ©TT ©AT TTT A8T ÇAA TAT «AT ©AT CRA. Vai Ty* Leu Gly vai Tb* hym Vai Asp Phe Ser ©la *ys Asp Asp ©ia 420 425 430 ΑΛΑ AAT ©ΛΑ ACT AGT ACA CAA ACA TAT ©AT TCA AAA MSA AAC. AAT ©6C s»ys As» »S.lu Thr ser Thr ain Tkr Tyr Asp ser Cys Arg &sn Asa Gly 435 4€0 «45 CAT ©ta AGT OCA CAS «AT TCT ATT SAC ÇAA TTA CÇ© ÇÇA =SA& AÇA AÇA Hiâ vai Ser ftl® ©1» ssp ser 11« Asp ela Leu ptm Fro ©la Tb* Th* 450 455 4SS ©AT SAA OEA CTT GAA AAA OCA TAT AííT CÃT CAÍ? CTT AAT TAC Í3CG GAA Asp ©lu Fr« um ©lu l*y» Ala Tyr ser Ris ©la Leu Asa Tyr Ala ©lu 4S5 470 475 480 TGT TTC TSA AT© CA© ©AC COT OST ©3A ÃCÃ ATT CCS TTT TTT ACT Tm Cys The te» btefe ©ia Asp As© A*g ©ly Thr Ile Pr© Phe ^se Thr Tsp 485 45H8 495 ACA CAT AGA MT GTA GAÇ TTT TTT AAT ACA ATT GAT SCT GAA AA© ATT Tb* His A*© Ser vai Asp ©b® Pb.» Asa Thr 11« Asp Ala ©lu I>y* xie S00 SOS S10 ACT OVA CTT CCS cm ©T© AAA ©CA TAT ©CC TTS TCT TCA GQT SCT TCC Tb* Sln bati Vai Vai by» Ala Tyr Ala Leu S«s ©e.r ©ly Ala Ser SIS 520 52 S ATT ATT GAA GGT CCS ©GA TTC ACA GSA ©GA AAT TTA CTA TTÇ ÇTA AAA ila II e ©1« ©ly P*a ©ly Phe Th* sly ©ly Asa leu leu. Fh.e Leu Ay» S3Ô 53S 540 ΟΛΑ TCT ACT AAT TCA ATT ®CT AAA TTT AAA STT ACA TTA AAT TCA ©CA ©lu ser Ser Asa Ser 11« Ala X*y» Pb® Ly® Vai Thr Leu As» ser Ala 545 550 S.SS 550 @ce TT© TTA CAA CÕA TAT CS™ ©TA ASA ATA CSC TAT ©CT TCT ACC ACT Ala Leu Leu ©lu Arg Ty* A*g Vai Arg lie Asg Tyr Ala Ser Thr Thr SSS 570 $75 AAC KA ©SA" CTT TTT «T© CAA AAT TCA AAC AAT GAT TTT STT ©TC ATC Asn Leu Arg Lsm Phe Vai Cln Ae» Ser Assa. Asa Asp Pb« Leu vai .11« 580 5Ô5 530 TAC ATT AAT AAA ACT ATC AAT AAA GAT @AT GAT TTA ACA TAT CAA ACA Tyr lis As» Lys Thr 3tet Asn Lys Asp Asp Asp Thr Tyr Gin. Tbr 535 S00 «05 TTT GAT Cm OCA ACT ACT AAT TCT AAT ATS CGG TTC TCS GCT GAT AAG Phe Asp Leu Ale Thr Tbr Asn $«* Asn Ktet Gly Ths áer Gly Asp Lys 613 SIS 620

12 SS 5.344 1352 1440 1408 153« 1584 1832 1680 1728

17 7 S 1824 5 8 72 ΡΕ1040192 359 AAT Í.5AA CTT ATA Aérs Ql« r»eis ile 635 Λ7Ά GGA GCA Ils Gly Ais«o 3aa tct rrc &n ter aat «aa ma atc SIu &sr Pise Vai Ser As« 31« &ye ile 635 S40 1920 tâ.t Am c.mi *m Tyr 11® Assp fcya ATA SU ΤΓΤ ATC CCA £le olu Phís il« pra 645 CTTA vai S50 cm. TTG TM 31« £.·&« (2) INFORMAÇÃO PARA SEQ ID NO:18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:18: «et as» Pr© As» As» Arg ser ®Xu Bis A#p Thr He l»ys v«i Thr Aro

1 $ 10 IS

Asn Ser 33» íe» «1» Thr As» Hi* as» <sl« Tyr p»© in&u Ale Xnp As» 20 2S 30 P«© M» Ser áí leu Gla elu leu Asn Tyr t>y« ela Fhe L@u Arg «et 35 40 95

Thr ei» Asp ser Ser Thr Oiu VAI te» Aap Aso Ser Thr Vã! X»ys Asp 50 55 50

Ale Vai oly Thr ôly Ile Ser Vai Vai «ly 31» Ile Jeu «ly vai vai 65 30 35 m «ly Vai Pr© Phe Ala ôly Ala haw Thr Ser Fha Tyr «1» Ser Stt* Leu 05 90 515 AS» Thr II* Tlp ?» Ser Asp Ala Isp Pr© Trp Lys Ala P&e Met Ala 100 3L0S 110

Sln Vai Slss Vai Leu 11« As:p Lyg Lysí 11* 31 u Glts Tyr' Ala Lys &mr 115 130 125 &ya Ala &e» Ala Slu Ie« 31» «ly leu SI» Asn As» Phe Slu &sp Tyr 130 135 190

Vai As» Ala Xe» &S» Ser Τφ Ly® lys Thr Pr© L9M Sei1 X*u ATf Ser 145 ISO ISS l«0 lye Arf Ser 31» Asp Arg lie Asg 3lu leu Pha Ser 31» Ala «lu Ser 1S5 170 175

Bis Phe Arg As» ser «et Pr© Ser vh& Ala Vai Ser hys Oh® 31© Vai 100 X55 190 360 ΡΕ1040192 &»u Μϊίϊ Leu Pr® Thx fyr Ala <3ln XSS 200 Leu hys Asp Ala <Si» Vai Phe Gly 210 21.5 A«p Vai Ala Ç&tt. Ph* Tyr Mis Argf 22S 338 Tfe» Asg Sis: CfP Vaã. Mn trp fyr Z4B Gly S·®* TA*· Tyr Aep Al-0 frp vai 260 fíet Thr Leu Thr vai. ias* Asp Leu 275 280 11 e Arsr Leu. Tyr ser Ly» ely vai 290: 395 £»h« ThT Aâp AM II & Ph« Th*· Leu 305 3.L0 Thr Phe Leu Ser lisa slu As» Ser 325 2'yr Leu ei» ffity lie Glu She »1« 340 sly L-ys Agsp Ser Phe Asa Tyr Trp 3SS 360 Ara Ser Ile ©ly Ser Ser Lys Thr 370 375 Lys Ser Thr GX» Aro Vai Gla Lys 3S5- .350 Tyr Arg Thr 11« Ala Aso Thr Asp 4 05 Vai Tyr Leu Gly V«1 Thr LyS val 410 Lys Asa Ql» ' Thr S«r Thr Gla Thr 435 440 His Vai s®r Ala Gin Asp Ser lis 450 455 Asp Glu Ara Leu Slu Lys Ala Tyr 4:65 479 Gys PA® Leu i4et Gin Asp Arg Arg

Ala Ala .Ag» liar His Lou Leis Lau 205

Giu slu Trp t-iy Tyx Ser Ser Giu 220 SÍh. Leu Ly* Lais Thr Qln Sla Tyr 235 240

As& vai íJIy L®u Am Gly.Lau Ar§ 2S0 255

Lys Phé ASrt Âr<j Phe Axej Arg Gin 26 S 270

Xle v«X Leu Phe Oro Ph® Tyr Aap 2$s hys Tftr ôlu Leu Thr .ftrg Asp ile 300·

Asa Tbr Leu <31 r Ly» Cys Oly Pre 31S ISO lie Argr Ly» Pro His Leu Pb» Asp 230 335

Thr Ar§ Leu Gin Pr» csiy Tyr Phe 345 350

Ser Gly Aen Tyr V«1 Slu Thr Arg 365 11« Thr Ser Pr» Phe Tyr sly Aag> 380

Leu Ser Ph® Asp «Xy sla Lys vai 355 4m

Vai Ala Ala Trp Fra Aun sly Lys 410 415

Aep Phe Ser Gin Tyr Asp Ãsp Slu 425 430

Tyr Asp Ser Lys Arg Asa. Asa Gly 44 5

Asp Gin Leu Pr» Aro çly, thr Thr 460

Ser :»i* Gin te» Asa Tyr Ala slu 475 4&0

Gly Thr 11« Pr» Ph® Ph® Thr Trp 409 4SS 405 361 ΡΕ1040192

Th* Bis Arg ser vai Asp Phe Phe

SOQ

Thr ©Iís. Leu Pre Vai Vhl Ly® Ai* SIS 520 lie Xis ©lu ©ly Pro· Giy Phe Thr 530 S3§ elu $«r Ser A«ta Ser lie Ala Ly» §45 55©

Ala .Leu Leu ©1» Arg Ty* arg vai

56 S &sr Leu Arg Leu Phe vai ©líi Asa S®0

Tyr 11« Ag» Ly® Tter Mst As© Lys sisi. se©

Fhe Asp Leu Ale Thr Thr A»n ser

610 S:1S

Itósn ©i» Leu. He He ©ly Âlâ Glu «2.5 630

Tyr Ha Asp Ly-s He ©lu Phe Ue 64S

Asa Thr Tle Asp Ala slu Ly© Ile SOS- 510

Tyr Ala Leu Ser Ser ©ly Ala Ser S2S ©ly ©ly Asa Leu Leu Pàe tmx Lys 540

Mie Lys Vai Thr Leu As» Ser Ale SSS 560

Arg He Arg Tyr Ala ser Thr Thr 510 §'?£

Ser Asa Asa Asp pise Leu vai He SS5 ,5fí>

Asp Asp Ãsp .Leu Thr Tyr <31® Thr hi>ò ΆΜΆ Wet ©ly Phe S*e:r ©ly Aep l«ys 63©

Ser Phe vai ser as» ©lu Ly© He 635 64 ©

Pro Vai ©Ir Leu SS© (2) INF0RMAÇA0 PARA SEQ ID N0:19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:19: ATO AAT OCA AAC AAT €©A A©T ©AA CM' ©AT AC© ATA AAS ST? ACA CCT 43

Itefc Asn Bro as» As» Arg ser ©la Asp Thr Ile Ly» Vai Thr Pro 1 5 10 15 AAC ΑβΤ GAA MS CM ACT AAC CAT AAT CAA TAT CCT TTA ©CT SAC AAT S€

Asa Ser SLu Leu ©ln Thr Ase Xis Aãú ©la Tyr A» Leu Ala Asp Asn 2S 25 30 144ΡΕ1040192 362 CCA AAf τα ACK CTA SAA GA& TTA JAT TAT AAA ©AA TTT TTA AGA ATS »ro Ann Ser rhr Leu Glu Glu Leu Ag» ry** Ay» ©Xu Phs Leu Arg «et 3S 40 4S ACT GAA GAÇ ΑΘΤ TCT AOS ©BA ©TS CTA SAC AAC TCT ©f» AA» ©AT Tbr Slu Asp Ser Ser fftr ©1« VAI Leu As» Asn Ser Thr Vai Ly» Asp 50 55 &S mh stt ocs âca osa att tct gtt ©ta ggg cag att tta ggt stt gta Ala V«l Giy fhr ©ly Us Ser Vai Vai Oly 61a Tle tóu Giy v*l Vai SS 70 75 SO ©GA «tT CCA TTT ©Cf ©β© «CA CTC ACT TCA TTT TAT OU TCA TTT CTT ©ly V»1 'Pto Pbe Ala ©ly Ala LéU Thr Ser Fhe Tyír Sla Ser Pise 1»$« $$ 90 75 A&C ACT ATA TGG CCA AST SAT GCT GAC CCA T6S AKG GCT TTT ATS ©CA Agn The· Ϊ2& Trp Prs ser Asp Ala Aap sro Τκρ sye Ala Fh.e ttet Ala ISO 105 110 CAÃ GTT GAA GTA CTG ATA SAT AAG AAft ATA SAS SAG TAT GCT AA& AGT Gin Val Gl« Vai Leu 11« Αβρ Ly» Lys lia altx Glu Tyr Ala Lyfi Ser 1.15 120 225 AAA G€T CTT ©CA GÁG «A C&G GGT Cft OAA A&T AAT iníC GÃA GÃT TÃT .kys Ala leu Ala ©lu Leu Gin Gly t*e» Gin Isq Asa» Pbe ©1« Asp Tyr 110 135 140 QTS AAT GCG TTA AAT fCC TSG A&G A&A ACA CCT Tf» Λ5Τ TTG CGA AGT Vai Mn Ala Leu Aèn Ser Trp Lyn Lys Tisr P*o Leu Ser Leu As?g Ser 14$ 150 255 ISO aaa Am me em w cm ata me siwv stt m tct tsm ©c& <saa aqt Ays Arg Ser Gin Asp Arg He Arg· Gin Leu Phe sér ®l» Ala Sl« s«r 1«5 170 17$ CAT TTT CGT ΑΑΤ TCC ATS CCS TCA TTT SC» ©ST TCC AA» TTC GAA &m Ris Ph® Arg Asa Ser M«»& Pro Ser The Ala Vai ser l$ya Phe Glu Vai 180 18S 150 CTG TTT cm GCA AC» TAT SC» CÀA GCT OCA AAT &CA CAT TTA TTG CJ» Leu Pta Ls« Fro fhr Tyr Ala Gin JH« Ala Asa sStr 81« Leu Leu L*u itS 20Ô 205 TTA AAR <3AT GCT C.AA ©Tf TTT G8A ©AA GSA «3© GGA T.AT TCT TCA GAA Leu Lya Asp Ãla Gin Vai Phe ©ly Glu Glu Τηρ Gly Tyr Ser Ser ©lu 210 215 220 OAf GST ©Cf δ&Α TVf TAT CAT MA- CAA TTA AAA CTT AGA ÇAA ÇAA TAC V«1 Ala SXu Fbé Tyr SI® Arg Gin L^u Aya Leu T&r Gin Gin Tyr 220 216 21$ 240 act ©»c cat f«r err aat tgg tat aãt gtt sga tta aat ©gt tta asa th* %9£> Ris Cyn Vai A®n Trp Tyr As& Vai ©Xy Leu Am ©ly Leu Arg 24 S 250 25.5 102 240 288 135 384 432 526

%7R 624 072 7:20 768 363 ΡΕ1040192 βατ tca act tat gat gca tos «tc aâa ttt aac cot ttt osc asa gaa sis 61y S*r Thr Tyr A»p Al* Ttp Vai bys Pfce A*n Arg *h« Are Argr «la 36© 26$ 270 ATO ACT TTA MT «TA TTA «AT CS ATT «TA CTT TTÇ ©ÇA TTT TAT «AT 8£4 «ftC Thr Leu Thr Vai Leu Asp Leu Lie Vai Leu Fh* Pr» 9h& Tyr Asp 2?5 %m 2m ATT 00® TTA TAC TCA AAA <3GG «TT ASA ACA «AA CTA ACA AGA GAC ATT SX*

Ilè Arf Leu fyr Ssr Lys sly ml Lys Thr Olu Leu Thr Ar® Assp Ile 2SG 2:SS .300 TTT Ά&& «AT CCA MT TTT SCC ®ΓΤ .AAT ACT CTG TOO «AA TAC «OA «CA 9m

Ph» Thr Asp P»o íle Ph« Ala Vai Asrt Thr teu Trp Olu t!yr Oly Pro 305 3I0 SIS 320 KCT TTT TTS AOT ATA «AA .AAC TCT ATT CSA AAA CCT CAT Tt% TTT «AT 100« Tísr Mtws Leis S#r Ilè 01« Assn Ser He Arg Lys Pr» Hi« Lfcu »be Asp

325 330 33S TAT TTA CAÍS GGG ATT GAft TTT Cft-T ACG C«T CTT CAA CCT OOT TAC TTT .U556

Tyr teu Gin Gly lis GIu ?.*·>« Hiss Thr Arg Leu Gin Prct Gly Tyr Pha 340 34« ' 350 000 AAA GAT TCT TTC AAT TÃT TGG TCT GGT AAT TAT STA GftA ACT .ASA 13,04

Oly Lya Astp «ar Phe Aon. Tyr Trp «ar <51y Asa tyr Vai Glu Thr A*g 355 360 365 CCT AST ATA GOA TOT AGT Mffi AGÃ ATT AGT TCC C€A TTT TAT SÓft «AT 1153

Pre Ser 11« Oly Ser Ser I*y» Thr 11« Thr Ser Pr o Ph» Tyr sly Asp

370 37S ISO *** TCT ACT GAA CCT GTA CSA AAG CTA AOC TTT SAT &BA CIA AAA <3TT 12 O©

Lys Ser Thr «1«. Pr© Vai Gin Lyw Leu Ser Ah» Asp Gtly eln I*y» Vai 105 300 395 400 TAT GOA ACT ATA OCT AAT ACA «AC STA ®£S3 OCT ‘POO CCO AAT GST AAG 1240 tyr A,rg Thr il* Ala Aan Thr Asp vai Ala Ala Trp Pro Asn oly L-ys 405 419 415 GTA TAT TTA «ST STT ACO AAA GTT GAT TTT AGT CAA TAT GAT «AT GAA 1206

Vai Tyr Aen òly vai Thr tye Vai Aap Fh.e ser Gin Tyr· Asp Asp Gin 420 425 430 AÃÃ AAT SSA ACT AGT ACA CAA ACA TAT GAT TCA AAA AGA AAC AAT GGC 1344

Lys Ass Olu Thr S«r Thr Gin Thr Tyr Aup Ser hyg Arg Aon Aan Gly

435 440 44S £.AT GTA *m- OCA CÃS GAT TCT ATT GAC CM TfÃ ©05 CCA QlUl ACA ACA .13¾

Hl® ¥«I 8«r Ala Slrs Asp Ser 11« Asp Gin Leu Prg Pro· ©!u Thr Thr 450 455 460

GAT GAA CCA CUT GAA ÃAA «CA TAT AOT CM' «AíS ©ÍT AAT TAÇ «CS GAA

Asp Glu Pio Leu eia hy» Alã Tyr S«r Mis «ia Lúu Aun Tyr Ala Olu 465 470 475 480 1440 ΡΕ1040192 364 TTC 1ΤΛ ATO CAG GAC CGT CST &<SA AGA ATT CCA ΓΤΤ IT? ACT T©S Cys Phe La» fltet Sln âsp Arg Arg G.ly Thr Xle Pro pfee Pihs Th* Trp 485 430 4 55 ACA CAT ASA AST STA ©AC TCT TTT AAT ACA. ΑΪΤ ©AT GCT 8&A AAÍS ATT Th* His Arg Ser Vai Asp Ph* Pfcw Asm Xhr Ile Asp Aà* Slu Lys XI® 50Ô SOS 510 ACT OVA CTT OCA «TA OTO AAA ©GA TAT GOC TTS TCT TCA TO? GCT TCC Th* Gin Lsu ¥ro Vai Vai tys Ais Tyr Ala Leu Ser S&r Gly Ala Ser 515 520 525 ATT ATT GftA GCST OCA GGA TTC ACA GOA ββΑ AAT TTA CT& TTC ffl» AAA 11« X.le Giw Gly Pro Gly Ph* Vfer Sly Oly Ama Lau Lee fte i*u 2^s 530 535 $49 SAA TCT AQT AAT TOA ATT ©C? AAA TFT AAA GTT ACA TTA AAT TCA GCA Gitt Ser Ssr Asm S«r Xle Ais. Lys Ph« t>ym Vei Thr Leu A»« Ser Alã 545 S50 5S5 Sê© GCC ITS TTA CAA G&A 'TM1' COT ©TA ASA ATA CGC TAT ©CT TCT ACC ACT Ala Leu Lee Gin Arg Tyr Ar® Vai Arg Xle Arg Tyr Ais Ser Thr Thr SS5 57© 575 AAC TTA OOA CTÍ TÍT GTO CAA AAT TCA. AAC AAT ©AT TTT CTT STC ATO As» Léu Arg Leis Phe Vai Giii Asxt Ser Asn As» Asp ?Ae Leu Vai xi® 58D 505 5S0 Ϊ488

XSM

X5M 1632

1S8D 1728 1775 TAC ATT AAT MA ACT ATS AAT ΛΛΛ SAX SAT <3AT TXA Λ€Λ TAT CAA ACA Tyr Xle λκι hys Th* Asa Ly» Asp Asp Asp Lena T&r Tyr ©la TJtw 555 É00 SOS ttt «at cre oca act act aat tct aat ato ea© tss το® sgt oat aag Phm Asp Lau Ala Tfcr Thr asa Ser Asn Wefc Gly &xm Ser ®ly Asp l»ye SlO S1.5 520 AAT GAA CTT ATA ATA >3SA GCA tiAA TCT TTC GTT TCT AAT GAA AAA ATO Asn Glu Leu ilè Xifâ Gly Ai a G3.u Ser Pine Vâi Sér As» Glw Ay® Ile S25 610 615 540 ΤΛΤ ATA SAÍ AAG ATA GAA TTT ATO CCA GTA CAA TTO ÍAA Tyr He Asp t>y» ΪΙ« ©lu Sim lie Pr<s vai Qla Leu S45 550 1S24 1872

I52G 1.555 (2) INF0RMAÇA0 PARA SEQ ID N0:20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:20: 365 ΡΕ1040192

Nst Asa Asn &gri Arg Sar Olu Bis A®» Thr 11«· Lys Vai Thr Par» 366 ΡΕ1040192 5 Gin Th* Asn Kis

Leu Gin Gin Leu «0 Ser Thr Giu Vai 55 Gly Ile Ser ¥al 70 Ala Gly Ala Leu 85 Pm Ser Asp Ala 10 Asn oln Tyr Fro 25 Aan Tyr Ly* «la

Thr Tyr Ala Gin 2Θ0 Gin Vai Fhe Gly 215 Pbô Tyr Híjs Arg 33® Vai Asn Trp- Tyr 245 Ãsp Ala 'Trp Vai V«I Leu Asp Leu 280 5nr Lys Gly Vai 355

Leu Asp Asn .¾¾¾. «0 Vai Gly Gin xis 75 Thr Ser Pfce Tyr te Asp Pro· Trp Lye 1 OS Lys Ile OIxí ©lu i

Asm Ser ciu Leu 20 *>«» Asn Ser Thr :í s TSssc ©Xw Asp ©er se

Ala Vai Gly Thr Giy Vai Pr© Phe

As*s Stnr Ile Trp aso •Gin Vai Qlu Ve1 115

Ly® Ala Leu Ala 13®

Vai Asn Ala Leu 145 1*3«* íjkj Ser <31 a

Mis Pha Arg Asn 189

Leu P)»e Leu Pr© 19S

Leu Ly» Asp Ala 210 Αί®ρ Vai Ala Glu TM Asp Hiss Cys 3,1 y ser T'hr Tyr M8 MAS Thr Seu Thr 275

Xis Âry Leu Tyr im

Leu lie A.sp Lys 130 ©1«. L«u ©1» ©ly 135

Asn Ser Trp .Lys 150 A»p Ar© Ile Arg 165

Ser Het Pr© Ser

Leu Gin Asn Aan 140

Lyn Tin: Pr© leu

15S •Glu Leu Ph» ser 17&

Pha Ala Vai Ser 185

Ala Ala Asn Thr

Glu G.ln Trp Gly 220

Gin Leu I»ye Lati 235

Asm Vai Gly leu 350

Ly» Fh® Asn Ar®

2ÉS 1.1® Vai leu Vhe

Ly» TM Glu Le® 300 L»« Ale Asp Asn

3S

Mie Leu Arg kse 45

Thr vai Lys Asp

Leu Gly vai Vai S0

Gin Ser Ph© Leu 9:5

Ala. ph® Mafc. .Ala 110

Tyr Ala Lys; Ser 3.25

Fh® ©la Asp: Tyr

Saí' Leu Arg Ser XS© ®la Ala Glu Ser 175

L-ysí Fh® ©lu Vai ISO f-lia Leu Leu Leu 205

Tyr Ser Ser* Gin

Thr Gin Gin Tyr 340

Asn sly Leu Arg 355 f'he Axg Arg· ©lu 370 oro Phe Tyr Asp 205 X iir Arg Asp He ΡΕ1040192 367

StoM Thr Asp Fa*o 3 la Phe Ais. Vai 305 3TD Thr Phe I4u 8·*1 11« 01». AS». S&X 32 S fyr Leu Gl« G.ly Xle Glu Fhe Eis â«e Siy Lys Asp 8««· Phe Am tyx fxp 355 3S0 PXô Ser Ile Gly Ser Ser &y» 'Thr 3?0 175 Lya ser Thr elu Fr© v«x <3i«. fcys 385 3M Tyx Arg· Thr XI® Ala Asn Thr Aep 405 V«1 Tyr Leu Gly vai Thr Lys Vai 420 Lya A*n 81u Thr Ser Thr <Sl»t Thr 435 440 Eis VAX Ser &ia «l.n Asp Ser lie 45S 4SS &sp ©1« Fr© Lev. <31u Xys Ala Tyy· <íOS 4^0 Çy« MUI £·«© iMssfc Q£n Aag &rg Arg 48 S Thr Eis Ãrg Ser vai Asp Phe Phe SOS Thr Glíí Leu Pr© Vai Vai l»ys Ala 515 52« IU 11« βία Gly Fr© Gly Fhe Th* 530 5XS SXu Ser Ser Asa Ser 11« Ma Lys S4S sso Ala lmi Leu. ©In Arg Tyr &rg Vai 5S5 Ase Lee Arg Lee Fhe Vai ©1» Asa 580 tyr 11« Asn Ly« Thr Mefc Asn Lys S8S SOO

Asa Thr leu TK$> Glu Tyr *31 γ Pr© 115 320

He Argf h-ys j?rsa His Leu Pite Asp 3,3.0 33 s

Thr Arg Leu ai© Pr© Sly Tyr phe 345 350

5®r aly Asu Tyr V&X slu Thr Arg 3SS H& Thr Ser Pr© Fhs Tyr SdLy Asp 38Õ L-su Ser Ph« A»p Gly Gin Lys vai 305 4«o

Vai Ala Ala Trp Pr© ftart gly Lys: 410 415

Asp Fh« ser si© Tyr Asp Asp sia. 425 430

Tyr Asp Ser Lya Arg Asa Asa. Gly 44 S

Asp ©In- t*e» sxe Pr© Gie Thr Thr 40© 5®r Bis GIts Leu Asn Tyr Ala t3le 4 75 400· sly Thr Il« Pr© Fhe Fhe tM* ττρ 430 495

Aso Tfer Ile Asp Ais ®1« j,y® He SOS 510

Tyr Ala Leu Ser Ser Gly Ala Ser 525

Gly Gly Asm Leu Leu Fhe Leu Lys 540

Phè Lys Vai Thr Leu Asn Ser Ala 555 .Argr He Avg Tyr Ala Ser Thr Thr STO 575

Ser asa Aan Aep Fha teu Vai ll® SS5 550

Asp Asp Asp Leu Thr Tyr ©la Thr •<S8S 368 ΡΕ1040192

Asfí tóu Ala Thr Tkr Asb Ser Mn MeL Gly Fhe S®.r Siy Asp hyt 6ϊο sis sao <Sltt lhe» lie lie Gly Ala. eiw S«r Sh® Vai Ser Aan 01® Lye 11® «25 SIS €3S $40 ^yt IIe Asp iys Xl® Glu Ph& li® Pro Vai Gin Leu

54S esO (2) INFORMAÇÃO PARA SEQ ID NO:21: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0:21: ATS AAT CCA MC MSt CSA AGT SAA CAT GÂT ftCB JKPA AA<3 GTT ACA CCT 46

Met Asa Pró Asa Asn ftrg ser <31« His Aep Thr He Lys Vai Thr Pr» 1 5 10 15 AAC AfiRP 8AA TO CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT GAC AAT 04

Asn Ser <31« Leti Gin Tbr A&b Sis Asa Gin Ty.r Pro Aiã Aop Aen »0 35 30 CCA AAT TCA ACA £TA GAA <3AA TTA AAT TAT AAA QAA TTT TTA ASA ATS 144

Pra Asa Ser Thr asm Gl® slu Leu Asn Tyr Lya Clu £he Leu Arg ttst 35 40 45 ACT S&A «AC AST TÇT ACG GAA GTÕ ÇTA. AAC TCT ACA &SA AÃA SAT 192

Thr Glu Asp Ser Ser Thr elu Vai Leu Asp Asa ser Thr vai hys Asp

50 55 SO GCA <3TT ms ACA GGA ATT TCT OTT ©TA GSG CAC6 ATT TTA <SST GTT ÔTA 240

Ale Vai Gly Thr Gly 11« Ser Vai Vai Sly Oln 11« Léu Gly Vai Vai 55 70 75 Sõ S©A GTT OCA TTT ©Cf ©GO «CA CTC ACT TCA TTT TAT CA& TOA TTT CTT 260

Gly Vai Prò Phê Ala Gly Ala Leu Th:t Ser Phe Tyr £»Xa Ser Phs Leu as 90 Sâ AAC ACT ATA TOG CCA ÃST QAT GCT «AC CCA TSG AAS GCT TTT ATS SCA 31«

Asa Thr lie Tsp Pr» Ser Asp Ala Asp Pro Txp Lye Ale ?h« «tet Ala 100 105 lio CÂA STT CAA «TA CTC ATA <3A.T AAÇ A&A ATA GftC GAG TAT GCT MA AGT 304 432ΡΕ1040192 369 ®ϊη vai Gin Vai Leu IX® ftsp I*y» **y» 11« 61¾ 91« ¥yr Ma Z>ys Se.r SM <ser cfv «ca «as t*a cas «st crr csa aat aat ttc «λα. sãy *r* Lys Ala |j«« Ala 9lu Lau ela ®ly l^a« 91«. &s» AS» FM 31« A8P TfX 110 13S 140 ®ΪΤ AAT SCS TTA AAT TCC YSS Sm AAA AC& CCT TTA A5T TTS GSÃ AST Vai Ãss Ma Leu Asn se*· Ticp Siye Ay» Tiur Ars? L®s 3«* L®« Arg Ser 145 ISO 155 - 150 MÃ ASA ASC GRA OAT CSA ATA A99 «AA CYT TTT YCY Ç&A SC» QAA AST Ly» Arg Set· «lis Asp Ar<s IX® ãí*j 91« SLe» Ffoe s®* Glit -Ala 91« S«r 165 1T0 175 CAT TTT CST HAT TCC ATO CCS XCA TXT «CA. STT XCC AAA TO CAA ®TS Ma FM Jtegt Asn Ser Hat Vro fer yjfe# Ss V«l Ssr Lyo i?h¥ Si» ¥«i 150 3L9S 150 CTS TTT CTA CCA ACA TAT CCA GRA 9CT 3CA AAT ACA C&T TTA TTC CTA la»u 9hm Leu aro Th.r Tyr Al» Slst Ala Ala Asn Thr ttia Leu Leu. Leu 155 200 205 TTA AAA «AT 9C® CÂA «Tf ΧΤΥ ®tt& «AÃ «AA T8S «BA TAT SCT TC» SAA Leu Lys Asp Ala elo Vai Pha Gly 91« Cl» Trp 31y Tys' Ser S«*' «1» 210 215 22» STT SCT GSA TTC TAT OGT ASA CAA TTA AAA C3T ACA ÇA& ÇAA YAC Aap Vai Ala 91« Fh* Tyr A*g Asg 91» M &γ» Leu Tfcr «Ia Sla Yyr 2:25 23 0 235 14 9 ACf «AC CR? T6T CTT AAT XCG· TAT AAT ÇTT «9R TTA. AAT «ST TTA ASA Tfor A*j» Kis cy» vai asíí Trp Tyr Ao» vai Sly Leu &$». «iy Leu Arg 245 350 2S5

4SD

S7S «24 S72 720 368 9ST TCA ACT TAT «AT «CA T@3: GTC AAA. TTT AAC CGT TTT CSC AGA CAA 91y Smv Tís.x fysr iMp Ala Trp v«l Ly® Fhe Jum Argr FSso Axf Mgr 91« 2«0 2S5 3?0 AT» ACT TTA ACT «TA TTA 9AT CTA ATT 9TA CTT TTC OCA TTT’ TAT <3AT ííet ThJf Leu Thr Vai Leu Asp LeU XX® V»1 leu Pro Sfee Tyr Asp 27S 290 23S ATT 039 TTA TAC TCA AÃA. ·®3® STT AAA Ã.CÃ «AÃ. CTA ACA ASA. ÇftC ATT II® Arg Leu Tyt Set Lys. 9ly Vai Lys Thr 91« &®u Thr Aatg Asp lie 250 395 300 91« SS4 313 TTT AO® «AT CCA ATT TTT TTA CTT ACT AOS CTT CA® AAS TAC G9A OCA Pfe« T&r A®p Fro XI· PM Α®« Law. TSsr Thr &e« CXa L-ye tyr Siy fsó 30S 3X0 .3.13 320 ACT TTT TTC ACT ATA 9MV. &ÃC TCT ATT C«A AAA CCT CÃT TTA TTT SAT Tlar FAs .Leu. S«r Il« 6.1u Asm ser Tie Arg Lys Fm Kis Leu FT*e A#p 325 13© 335 tat: ra em sss att om ttt cat acs cm ew c&a ce^ soí tac *m 960 10-58 3.05« ΡΕ1040192 370 τγχ- lm» <SXn. Gly lis ®lu Pbe His Th? Acrg teu Glu &κα (31 y Tyr P&e •ub 34â aso SS55 ΆΜ% CAT TÇT TTC ΑΛΤ TAT TSB TCT GQT AAT TAT ΟΎΑ SAA &CT ASA Sly Lys Asp Ser J?fcs Ma Tyr Tffp £®sr siiy 1« τγκ vel T&r »S âs‘s Mft 3«5 CCT A®T ATA ®Sft f£¥ A®· AA8 ACS. MT ÃCf fCC CCÀ TTf fAf ®AT Pr» Ser Tle Qiy Ser Ser Lys xhr rle Tlw Ser Pro Ph* fy? ®ly Mp 370 375 380 AM. TCT ACT @AA CCT ®TA ttÁ AÀú CTA. AGC TTT ®AT SOA Ê&A MA SW hys Ser Thr 01« te vai Gin :Lye teu Ser Pfce Aap Sly Sla í»y» Vel 3§S 3SO 3SS 400 TAT OSÁ ITT &?A GCT AAf ÁCÃ SAC STA GCS ÚCt TÕ3 CCS MT SST AAS Tyr Ar§ He Ai» As» 23» A*p V#4 Ala Ai» irp ST© A»» <?iy iy» 4OS 41D 41S Sm TAT ΤΤΆ sst off MG AAA í» ÔÂt TTT AgT caà f AT êAt S&T CAA Vai. Tyr teu Gly Vai Tte Lys Vai Attp Fhe Ser Gin Tyr Asp Asp elxi 420 4 2» 410 AAA MT SM MX AST ACÂ CM ACA TAT 6AT TCA AAA ASA AAC AAT SSC Ay» Aen ®iia· Λτ Ser THr Sirs T&r Tyr Asp Sér Ay» Ar® As» Asa SSIy 43$ 440 445 CAT GTA AGT GCA C&© GAT TCT ATT GAG CM TTA CCS CCA QAA RCA ACA Hi» vai ser Ala ®ln Asp ser lie Asp sl» teu í?ro ms 61u Tbr TAr •i50 eSS 4S0 mx saa cca. crr m. aaa oua tat «er cat e»& ctt aat tac «22 oaa Asp s.lu Psw Leu βΐ» X«y» Ala Tyr ser Sis sle teu Aso Tyr Ale Glu 4«'$ 470 *7S «S0 liÒi

11SS ilôú

1:24 S iãss 1344 4332 1440

tot ttc TTA AT» cm mc car cer gsa aca att cca ttp ttt act tgs Cys Pise teu M»c Asp Arg Arg ®ly Thr XXe »ro Fhe Fl» T&r Trp 4SS 4®0 405 ACA CAT ASA AGT OTA SAC TTT TTT AAT ACA Mt GÃT Í3CT OAA AAS ATT Thr Ble Axg Ser Vai Asp Ffe» Pina Aso T3sr Ile Asp Ais Glu hy» X2e S00 SOS 510 ACT CAA CTT CCA GTA %M OCA TAT SCC TTQ TCT TCA GGT GCT TESJ Thr GiA teu„ ®x» vai vai i»y» Ala Tyr Al« teu ser ser <31y Ala ser sis sa« S2& AT? ATT SAA SST CCA QSA TTC ACA ÇQA «OA AAT TTA CTA TTC em AAA lie XI» Glu ®ly Pr» Gly »he Tfer ®iy Qly Asa teu Leu Fh® teu L<ys S:M SIS 54 0 « TCT A®T AAT TCA ATT' ®CT AAA TTT AAA GTT ACA TTA AAT TCA. SCA Slu 8»r S«r AS» Ser Xle Ala I*ys Th» I*yS vai T&r teu As» 8e* Ala S4S 550 S55 ' 560 GCC TT® TTA ÇAA C5QA TAT CGT ®TA ASA ATA CSC TAT .®CT TCT ACC ACT 14 8 5 3536 1584 1632 1580 1728 371 ΡΕ1040192

Alâ Leu Leu Eslh Mg. Tyr Arg vai Arg X.l« ftrg Tyr Ala Ser Thr Thr S5S 570 5? v AAG m CdA S.TI' 'fiT UT« CAA AA Γ TCA AAC JWVf GST TTT CTT GTC ATC 17?« Asa .L-êSJi Arçe Leu Ph© Val 61H Assu hsrt ASft Asp Pil«_ Leu Vai lie '580 585 590 mc ATT AAT AAA ACT ATS AAT AAA 6ΛΤ 6AT «AT m ACA TAT CAA ACA 1814 *y* TXb Asrs. Lyss Thr Mês As» Lys Asp Assp Âsp Leu Thr Tvt β»1η Thr 595 SOO 505 - TTT OAT «CA ACT AÇT AAT TC^ AAT ATS QG® TTC TCS SAT AAG 1873 Phs Asp Leu Thr Thr ftsn sar &&Ϊ1 M8t sly Ph@ ser @ly hsp Lys S1Q 515 SAT GSA crr ATA ATA GíiA ÍSCA iBAA TC? TTC tmv TCT AAT (iiVi AAA ATC 192« Asn Si. ίϊ Leis lia 11e 6ly Ala aia Ser Phe Vai Se* Asn sia Ly» Ilê S2S $33 83 5 «40 TST ATA SAT AM» ATA GAA TiT MV C‘CA «TA CAA taV TAA. I9S9 Tyr xle ASp hys n? fâiíi £*wa Ilfi Pr<5 Vai Slft Lau 64S 6SC! (2) INFORMAÇÃO PARA SEQ ID NO:22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:22:

Met Ptfo As» Asn Ãrg· Ser Slis Eis Ha Lys vai Th* i § 10 18

Asa Ser <Slu lau Gin Thr Asa Hls Asa ffiL» *yr Pípo Lea Ala Asp 20 2S 30

Fr© Asa s®r bw Gla Sitt Leu. Asa Tyr Lys tílu Fh© A®» as«í tSmt 35 40 45

Thr GXu Aap Sair Ser Thr Slti Vai Leu Aap Rmt Sêr Thr Vai Lya Aaj>

SO S5 «O

Ala Vai «ãly Tb£ ®Xy lia S#r Vai Vai Oiy Gin lia Laia Sly Vai VSil €5 70 ?§· 60 «Hy Val Er© ®*b® Ala Gly Ala Lati Thr Ser Phe Tyx Gla Sê* Phe Latos

86 50 g*S

Asft Thr lie Trp £>r© Ser Asp Ála Asp F:*o Trp Lys Ais Ehe Mes:. Ais ISO XOI 110

Slrs Vai Qi» Vai He Asp Lys Lys 11® (Slu Gla Tyr Ala Lys Ser 372

12S Léu §X» Asn Asa Fbe ©1» Asp Tyr 140 lys fhr Pr» Leu Ser Le» Arg ser 155 ISO Glti Xéu Ph® Ser Gin Aiâ Glu Ser X?Õ ' XIS Pfce Me Vai Ser ly* Phe ©1» Vai XS5 190 Ala Fila Asp Thr HiS Leu X&U L#« 2 OS ©1» Gin Trp ©ly Tyr Ser Ser ©1« .220 ©X» X«« Ly® leu Thr Gin ©ia Tyr 235 240 Aon Vai >3Iy Leu Ase Gly Leu Arg 25Õ 255 Lya· Ffee Asa Arg Phs Arg ftrg Glu MB " 270 xis. VAX Leu Phe pr» pfee Tyr Asp 288 hye Tiir ©iu Leu Thr Asg Ãsp fie 300 3*ir Th.r Leu sl» Ly» fyt Gly £Ue 3 XS 320 fie Arg: Ly» Fs'« Sie Leu «M Asp 330 335 Tlír Arg Leu ©la Fro ©ly Tyr Ffee «5 3.50 Ser ©ly Aan Tyr Vai Glu Thr Arg 3^S il« T&s? S»y V«8 Síkb Vyr ©ly Asp .380 Letí Ser Phe Ásp ©ly ©ln Ly» Vai 305 400 Vai, Ala Ala Trp Pro Aso. ©ly Ly» 4X0 4XS ΡΕ1040192 11.5 120

Lys alá Leu Ala ©1» Leu Stó ®í,y

13* 13S V«1 Asa Ais leu Aan Ser Trp Lye 1*5 153

Ly& Arg: Ser ©in Asp Arg Il« Argt 155

Kis »he &rçt Asa Ser Mefc Frc> Ser 183

Leu vhe Leu Pee Thr Tyr Ais ©l.» IS5 230 £,«« Ly» Âsp Ala Gla Vai- F&e ©ly 210 2x3 asp Vai Ala Sla Phe Tyr Arg Arg 225 230 fiar Asp His éye ¥«i ftan *¥rp íy* 245 ôly ser Tihr fyr Aep Ala Trp Vai 2S0 ί’ΐΐίΚ. Thr Léu Thr Vãl Leu A.Sp ISsu 275 200 ile A*© Leu Tyr ser Ly» ©Xy V#1 SSõ 255 8h« Thr Asp ma» xi* »m Leu Leu 385 3X0

Thr Phe Law Ser 21« ©1« Asn Ser 3 25

Tyr Leu ©X» ©ly Xle ©1** slse «is 24 0

©Xy Ays Asp Ser Ohsj Asm Tyr Trp 3SS 3SS fro Ser lie <?iy Ssr ©«¥ L-ya TAr 370 375. &ys Ser Thr ©1« Fr© Vãl ©la Lye 305 390

Tyr Arg T$*r XX« Ala Aen Thr &«p

4 OS 373 ΡΕ1040192 ¥&1 Tyr L*tt <31 y V&l Thr Lya Vai Asp Ph© S«r ©la. Tyr &ap Asp ©in 42D 4:3:S 430

Lys ása δ1*ι Thr· Ser Thsr δίκ* Tfer Tyr Asp Ser Lye Axg A&n AS» aly 435 44 0 44S «is ¥âl Ser M« tis Asp Ser iie te# 9to tr» Wm fiv ?h* Thr 45© tSS 430

Asp ©lu Pé» Le« ©lia Lys Ala Tyr Ser Hie Gin Leu Asn Tyr Ala ©Iss 485 4T9 475 489

Cya Fhe Leu m <31» Âap Aarg Arg <31y Tisr Xla Pr© Pbe Fhe Tlir Trp 485 440 495

Thr Bis Aig Ser Vai Assp Fh© Phe Asa T&r xl© Aap Ala (11¾ Lye lie .50© SOS $20

Thr ©in Leu Pr» Vai vai Lys Ala ítyr Ala Leu íS©r ser ©Ly Ala Ser 525 820 SàS lie lie <3Xt» s.Iy Fr© ©ly Ftee Thr ©iy ©ly hs» teu Aeu Fíxe Leu l»ye §30 535 54© ©1« Ser «Ser Asn Ser Oa Ala Lys Pise Lys Vai Usar Leu Asn Ser Ala §45 55© 555 550

Ala Leu Leu ©Ia Arg Tyr Arg Vai Arg XI© Arg Tyr Ala Ser Thr Tt*r

555 S70 5?S

Aaa Leu Asg Leu Phe vai Qlss &»» Ser As« Aan Asp Phe Leu Vai lie §§E9 585 590

Tyr li® Asa Tte fj®& ftsn Lys M# âsp A^p te® $*« Tyr ©1» thx- 595 808 «05

Fhe Asp Leu Ala Thr Thr &*n Ser Asu fctefc ©ly Phe Ser·, ©3Ly Asp Lye 510 515 «20

Asn Slu Leu He lie ©ly Ala ©1« Ser Piie Vai Ser Mi ©iu Lys lie $ts 530 635 64©

Tyr 31« Aap Lye lie ©iu Ph« II® Fr© Vai ©Ir Leu «45 S50 (2) INFORMAÇÃO PARA SEQ ID NO:23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear CARACTERÍSTICA: (ix) 374 ΡΕ1040192

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:23: A.7Í3 AAT : CCA AAC AAT CSA AGT GAA CAT CAT ACG ATA AAG GTT ACA CCT 48 ASO Pro As» A«». Arg Ser mu His Asp Thr Oe Lys Vai Thr Pr» 1 5 10 IS AAC AGT CAA rrc CAA. ACT mc CAT AAT CAA TAT COT TTA CCT CAC AAT 95 A»o Ser Mu Leu Mft Th* AS» UÍM As» Sla Tyr Pro Lê» Ala Aap Aau 20 25 30 CCA AAT TCA ACA CTA Í5AA TTA AAT TAT AAA CAA TTT TTA ACA ATC 144 Fro &br. Ser Vhr te» M» c*iu Leu As» Tyr Lys M u Phe Leu Arg MaL 35 48 4S ACT SAA GAC AST TCT AOS OAA 0TS CTA SAC AAC TCP ACA OTA 192 Tfer 81» AOp ser Ser Thr VáX teu Asp Aso Sér Thr Val Lys Aêp so 55 SQ GCA CTT GGO ACA QG& ATT TCT CTT STA <308: cm ATT TTA CCT CTT GTA 240 Giy Thr Ue ser vai vai GjLy Qln Ile teu Gly vai val S5 TO 75 00 SSA OTT CCA TTT SCT *S?Í2S CCA CTC ACT TCA TTT TAT <5RR TO ITT CTT 3Í& My Vmi Pro Phe Giy Ma teu Thr SOr Phe Tyr Cl» ser Phe teu 85 90 95 a&c ã ct ATA TÇG CCA ACT G&T COT CCA tcc AAC CCT TTT ATC CCA 335 Αβ» Th* xle Trp Pr» «Sã-s? Asp Ala A»p Pr» Trp Lya Ala Pha Hat. AX& 1GS 185 110 CAA <3TT GAA <3TA CTG ATA GAT AAO AAA ATA GAS OAC TAT GCT AAA ACT 384 ®ln v&l Cl» Vai Leu n* Asp Lys Lys tl« Mu Mu Tyr Ala Lys Ser 11S 120 125 ΆΑΑ. CCT CTT GCA GÁG TTA CAG GGT CTT CAA AAT AAT TTC CAA CAT TAT 432 hys Ma Leu Ala Ma Leu M» My Leu Mb As» Asn Hís Mu Asc +yi oo ;os 140 ctt aikp CCS TTA AAT TCC TGG AAG ΆΑΑ ACA CCT TTA AST TTC OííA AÇT 400 Vai Asn Ala Leu Asa Ser Trp Ly» Lys Thr Pro L&u Ser Leu Arg Ser .145 ISO 155 IS© MA ACA j&GCT CAA GAT CGA ATA &GG GA& CTT TTT TCT CAA CCA. SAA AST 32$ Lys Arg ser Gin Asp Arg ile Arg 0ÍU L»U Pite ser cln Ala Olu ser 1S5 270 175 CAT ΤΪΎ CCT AAT TCC ATG CCS tca TTT CCA CTT TCC Α&Λ TTC CAA CTG 5?S Mis Ptss Arg AAft ser H&t Pro Ser Mae Ma Vai Ser Lys Phe Mu Vai ISO SâS 3L»0 cts ttt CT& CCA ACA TAT CCA CAA ÍÍCT GCA AAT ACA CAT TTA TTC CTA 024 leu Phe LSU Pr» fhr Tyr Ala M» Ala Ala Asa Thr His Leu teu Leu 672ΡΕ1040192 375 1SS 286 305 m Mh ssct cm sít τττ ®sa ©&& gm. xs« gga tat tcs- tca. oaaLeu Lys Asp Ala Sln Vai Phe <5Xy Slu slu Trp ely Tyr Sá* S*r Glu210 2X5 220 sjw stt scr gm ttt tat cat aba. caa Tm má ctt acá caã cm tãcasj» vai Ala Glu Phe Tyr Sis Arg fâln l«u kf& hm Thr t$Xtà Slo Tyr 225 230 235 240 ACT SAC CAT TGT ©TT AAT TSÔ TAT M.T «Tf 6GA TTA AAT QQT TTA A8A Th*' Ãsp Sis Cy» vai Asn Trp Tys Asn Vai Gly lueu ASA ely Lè*i Arg 245 250 25S ©GT TCA AÇT TAT «AT GCÁ 7GG GTC ãA& TTT AAC C8T TTT CSC ASA 0A& sly Ser Tlit Tyr Aap Aia Tip v*x x>ys Ptse Asm Axg P.h$ Arg «xfr Glo 260 26'5 270 ATS ACT TTA ACV STA TTÁ SAT CTA ATT STA CTT TTC OCA TTT TAT OAT Mac Thr hm Thr Vai Mu Mp fceu tl« Vai Lau Oh® Pm fte Tyr Asp 27S 280 285 ATT cm tta me tca aaa me otr aaa aca «aã cia aca asa gác ast 11« Arg Mu Tyr S«r hym ely Vai J»y* Thr <a« Leu Thr Arg A&P Σ1» 280 285 388 TTT AC© ©AT CQA ATT TTT AC© CCÁ ÁCC ACC CTA CÃS ©AT TAC OSA OCA Ph* Thr Asp Pr© II» £4ts Tbar Pm Thr Thr Mu 01« Amp Tyr ely Pro 305 3X0 31S 328 ACfT fff WS AGT ATA SM. AAC TCT ATT C©A MA CCT CAT TTA TTT ©AT Tkr Pisa &eu Ser· Xle Qlu Mn Ser lia Mg h¥& Prh His hm The Asp 325 330 335 730 768

SIS 664 313 366 1088 tat tta cm m& atx m ttt catTyr &eu sis ©Xy ii« elu Pkut kís 348 GSG AAA SAT TCf TTC MT TAT TSS «ly hm ASJ» ser Pb* Aan Tyr Trp 358 368 CCT AST ATA GOA TCT AST AM3 ACA Pm ser ii« ely Ser S«r hym Thr 370 375 AAA TCT ACT SAA CCT CTA CAÁ AAG Lys §er Thr 01« Se Vai GX;ís. I»y« 38S 330 TAT OSA ACT ATA SCT AAT ACA SAC Tyr Αχ-g Thr XXe Ala Mn Thr Asp 408 STA TAT TTA OST STT AOQ AAA GTT Vai Tyr Xi#u ely Vai Thx ty» Vai ACS COT CTT CAA CCT OOT TAC TTT Thr Arg Mas elii Pm ely Tyr Phe 345 3 58 TCT QST AAT TAT CTA «λ ÁCT ÁS& S«r ely Ase Tyr vai slw Thr Atg 365 ATT ACT TCC cta TTT TAT eOA «AT 1,1 ís Thr Ser Pro PM Tyr <*ly Asp 300 CTA AGC TTT ORT SSA CAA ÁÁÃ GTT leu ler Pha Mp Sly el» :Lys Vai $m 400 ©ta ©ec ecr xm. tscc; aat q©t aa@ Val Ala Ala Txp Pro ásíi ely Lys 410 4IS GAT TTT AQT CAA TAT GAT (3ÁT CAÃ Asp Phe Ser Olh Tyr A»p Aep Ola 3.055 1184 1152 1280 1248 1286 376 ΡΕ1040192 4 30 425 43¾ ΑΛΑ AAT ACT ACA CAA ACA TRT «AT TCA AAA ASA AAC AAT OGC 1344

Lys A*» @1« Thr Se» Thr eia Thr Tyr Asp ser Lys Ar« Àsn As» ôly

4Ά5 440 44S ©AT «TA AGT «CA CA© «AT TCT ATT «AC CAA TTA ©C© CCA «Aft ÃO ACA. 13 Sf2 ifis Vai Ser Ala «la Itap 60r Xla Asp «la £*4«. Pro Pro ®i« Thr Thr 450 455 460 «At S&& CCA CTT «AA ARA «CA TM A©T CAT CAS CTT AAT mC «C© «AA 1440

Asp «lu Pro l*eu Cia Lyo Ala Tyr Ser íiís Slss Leu Asa Tyr Ala «lu 4SS 470 475 400 wr TPC TXA ATS CAC «AC CST CST ©3A ACA ATT cca TXT TTT ACT TGQ 146#

Cys Phs Leu Mete da Aap Mgr Arg Sly Thr· Hs Pra Che Phe Thr xjq» 4SS 430 435 ACA CAT ASA AST sm «AC TFT ΪΙΤ AAT ACA ATT «AT «CT d AA« ATT 1530

Thr Mis Arg Ser Vel Asp Bfc* Pfce Asa Thr 21« ,Asp Ala «lu Lya Σίβ 500 505 510 ACT CAA CTT CCA. «TA «f« AAA ©CÃ TAT ©CC TT© TÇT TCA «®P «CP ICC 1534

Thr ©X» Leu Pr& Vai Vai Lys Ala Tyr Ala Leu Ser Ser Qly Ale Ser

SIS 520 SSS ATT ATT «M mt CCA «CA VtC AC A «SA ©SÃ AAT ΤΓΑ CTA TTC CTA AAA 1612

Ile lie ©Isi ©ly Pro Sly Sha Thr ©ly «iy Asb X>*u L«u Fhe Leu tys S30 535 540 ©A& TCP AST AAT TC& ATT GCP AAA TTT A&A OTT &CA TTA AAT TCA ©CA XéêÔ ©lu Ser ser A:sn Sar Ha Ale Lys Phe tym Vai Tb.r Leu. Asa. Ser Ala. 545 S50 555 560

ÇCC TT0 TTA CAA CSA TAT ΟβΡ ©TA AÇA ATA C9C TAT OCT TCT ACC ACT 172 B

Ala Leu leu ®1» Arg Ty*· Arg Vai Arg 12« Arg· Tyr Ale ser Tlir l&r .666 5 7 0 375 AAC TTA CBA CTT ΤΪΤ STS CAA. AAT TCA AAC AAT «AT TTT CTT «TC ATC 1770

Asn Leu Arg t»Xk Vfca Vai Cl» Asa Ser Asa Asm Asp Pha Lee Vai Xle 5ÍÕ SS5 53® TAC ATT AAT ÂÂA ACT M« AAT AAA <SAT CAT QST TTA ACA TAT CAA ACA 1334

Ty» ila As» Ly© TSs»· M«t Asa tym A&p Aay Asp i<au TAr Tyr «la Thr 555 600 €05 TTT «AT CTC CCA ACT ACT AAT TCT AAT Alll «Q« TTÇ TO« «5T OftT AAÍ5 167¾

Pfee Asp Leu Ma Thr Thr Asa Ser Aer* Mat Sly Ph® Ser Qly Asp Lye 610 61.5-

AftT «AA CTT ATA ATA ««A «CA «RA TCT TTC OTT TCT AAT SAA AAA ATC 1.920

Asn ©lu Leu Xle. Ile «2y Ala «lu Ser Ph& Vel Ser Asm ©lu Lye II® 82S S3Ó €35 €40 195 3 TAT ATA ©AT AAS ATA «AÃ TTT ATC CCA ©TA CAA TTS TAA Tyr Tle Asp i*ye íl* «lu Phe lie Bro Vai <5ln Leu $50 $50 377 ΡΕ1040192 (2) INFORMAÇÃO PARA SEQ ID NO:24: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:24:

Mefc Aan Pr© .Am» .Am» Axg Ser Glu Mis Asp 11« &>y& Vai thr 1 s 10 1s A88 Slu teu Qln Tht jum xis Asa Gin xyr pro teu Ala Asp Asn 20 25 m

Pro Asa Ser Th* teu <31 u ííl» te» Asa Xyr hy» GX» te» Ax% ítefe 3S 4© 45

Thr Qlu &sp Ser Ser tfXr Glu v*l. teu Asp Asn ser Thr vai Lye Aep 50 55 5» M» Vai «ly Thr Sly 11« Ser vai Vai ely 431» Ile teu ®iy Vai Vai 6S 70 75 tÕ

Sly Vai prO P'&ô Ala ely Ala te» Hhr fiar Phe Tjr 01« Ser Phè teu 85 3® 95

Asa Thr xle Xxrp Pr» Ser Asp Ala Mp Pr» Xrp lys Ala Pise Mas Ala 100 105 11©

ala Val slu Vai te» 11 e Asp X>ys &ys II* el» Slu Xyr Ãla fcy» Ser 135 130 12 S

Lys Ala teu Ala 01» te» Gin Sly teu Gin. Asm Asm Phe <31» *Sp Xyr 130 115 240

Vai. Jigfrt Ala T,a« Sa« »«*· T*f» Uy» Ay* iSt PT* teu sar teu Arg Ser 145 ISO 155 i«0 bys Axg Ser Sla A»p Axg lie Αχψ Olu te» Pise Ser Gin Ala slu ser 165 170 175 Hís Phe Arg Aso Ser Met Prs Sô-r Ate Vai Ser fcys 2he Slu Vai l©a 150 teu pfee teu M» tfcr Tyr Ala ela Ala Ala Asa ttar Xis teu teu teu X9§ 200 205 teu ttftt &ep Ala Slu Vai phe «ly ®2» Tí¥‘ ely xyr ser 8«r Slu 310 31S 220

Asp Vai Ala Slu 5É»e Tyr Xis Ar$ Giti teu lye teu X'h:r &m Gin Xyr 378 ΡΕ1040192 23 5 340 Asa Vai. ©ly L&U Asn Sly Leu &rg 250 255 Lys Fhe Asπ Arg Fhe &rg Arg <Siu 2$S 370 II® Vai Leu Fhe Pxo Flsa Tyr Asp 235 L.ya τϋ* siu Leu Th* Arg Aàp na 300 Thr Thr Leu 315 Gin Asp Tyr ©ly Fx© 320 11® Arg bys ¥t:a Hia Lee Fhe Asp 330 3.35 Th* Arg Leu Slu Fr» Oly Tyr Phe 346 150 Ser ©ly Ao» Tyr Val mlu Thr 345 Axp ll® Thr Ser Fro Fh® Tyr ©ly Asp ISO Leu Ser Fhe Asp Sly 61« Lys Vai 3âS 40Ô Vai Alva Ala τ.ί'ρ .sre .As» Oly Lys 410 415 Aap Phe Saí* sln Tyr Asp Asp Slft 42S 430 Tyr Asp Ser Lys Arg Asa Asa Sly 445 Asp 61.» Leu Fr» Ftxa Slu Thr Thr 4ê0 sas 330

Th* Asp His Cys Vai Asa T*p Tyr 24$ 61y Ser Tfer Yyx Asp Ale Trp Vai aso M»e Yfcr Lee Th* Vai tmx A®p teu S'?5 280

11® Arg Iséki Tyr Ser Lya ííly Vai 290 3SS

Phe Thr Âsp Sro Xle Fhe Th* te 3OS 310

Thr Fhe" £*eu ser ile ®lu &&» ser n s

Tyr Lee Sl» Sly lie slu Pás «*» 040

Sly Lya Aap ler she Asm Tyr Trp 3SS· 36Q F*» Ser S.1® ôly ser Ser’ Ly* Thr 310 37$

Lys <Sex T&r ©iu Pro Vai ©i» Lye

36$ MO

tVr Arg Thr He Ala Asa Thr Asp 4 OS

Vai Tyr Leu 61y Vai Ly* Vfcl 420

Ly» JUsn Slu. Thr Ser Th:r Si» Thr 43S 440

Eis Vai Ser Me 61» Asp Ser II®

460 4SS A#p Slu »ro Lee Slu Lys Ala Tyr Ser Hi* 61» Leu As» Tyx Ma. Slu 4S3 470 475 480 Çys Pb® Leu Mefc 61» Asp At& Arg ©ly Yhx lis Pr» Fhe Fhe Th*· Tsp 466 490 495

Thr Mis Mg Ser Vai Mp PM PM Mn Tbr lis ftsp Mi olu hys IIe 500 SOS 510

Thr Gin Leu Fro vai vai Lys Ala Ty* Ma Leu Ser Ser Gly Me Ser SIS §20 525 379 ΡΕ1040192 II© U« Slu ©ly Prs Sly Phe fhjr

930 SIS «i.u Sar Λβη Sô® 1:1¾ Ala Ly» 545 S90

Ma Leu Lea ©la Aâfg· Tyv Vai S€5 &0n Lê.ti Avg fteu ®Ί»« Vai ©1» Asa 580 ryr 1:1« Aea hym T.hr Met Asa Lys

S3S SOO ph© A&p Leu Ala Thr Tfer Asa Ser MG 015 v, V'/£ Cíy <?ly Assa Leu Leu Fís© I*®4* S40

„.. MS

Phe í*ys Vai Thr L©« Am S^r 555 .v*,r ti**

Argr 11« Arg Tyr Ma sa*

S 7 0 §^S

Sar Aãa Asa Asp sa« L«w VA-1 *^ S85 590

Asp Asp Asp Leu Tbr Tyr ©ia *«** SOS

As© *$e& Gly Pha Ser ©iy Asp Lys

Sso

Asn Glu Leu Ik 11® ©l.y Ala Slu sa® Ph# vai Sè® Aaa ©Ias Ly# 11¾ S25 630 SIS S4G

Tyr ila Asp Lys XI» slu pfa® 1.1* Paro vai ©ln Leu €45 S50 (2) INFORMAÇÃO PARA SEQ ID NO:25: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:25: ATS AAT CCA AAC AAT CGA AGT GAA CAT SAT AOS ATA AAG GTT ACA CCT Met ÃSSSt Ar© Asn Asn. Arg Ser Glu Eis Asp Thr lie hys Vai Tfex P£S 1 5 10 15 AAC mr SAA TTG CAA ACT AAC «AT AAT CAA TAT CCT TTA GCT GAC AAT Asn SÓS? G1u Leu Gin. Th® Asn Hia Asn Gin Tyr Pr» Leu Alâ Asp Asn 20 2S 3 D CCA AAT TCA ACM CTA <3AA GÃA TTA AAT tãt AA& «AA TTT TTA AGA ATS Px© As« Ser TA® Leu 01 u Leu Ash Tyx PLs Leu Arg Met 15 49 4i* ACT G.ftA 0ÃC AGT TCT ACG «AÃ &m CTA «AS AAC TCT ACA STA AAA «AT T»X Glu Asp Ser &sr Thr Gl« Vai Léu Aíip Asa s&r Thr Vai Lys Asp 50 60 340 340 380 ΡΕ1040192 ©cã ©rr ©©© ãc& s©a ATT tct srr gta ©qs cas αττ tt» s©t stt ©m

Ale Vil ©Xy Tfcr Gly II* Ser Vil V«X ©Xy ©Xs Xle hiu ©ly Vil Vil ss 7s 7s 8» 268 gga srr cca ttt ©cr gq® se®, crc act tca rrr tat caa tca w ctt ôljf Vil 8*0 Phi Ali Sly JUL* L©« Tfc*r Ser Fhe Tyr 31b Ser Ffee L«« 85 SÔ Si AAC ACT ATA TG© CCA A©T ©AT GCT Asrt Thr lie Trp Pro Ser Aap Ai a xee

CAA CTT GAA STA C5SS ATA ©AT AA© sln. Vil Gltt Vil Leu He ASp Ly» 1,XS ISO

ÃAA ser cru ©CA ©as TTA CA© GGT

Lys Ala Leu AXs ©lu Leu ©In fily 130 .13 5

GTV AAT GCG m AAT TCC TGG AAG

Vai Asa Ala Léu Asa Ser Trp Lys 14S ISO AAÃ A©A A©C C&A ©AT CQA ATA AGG Lys &rg sor ©la Aep Arg XXe Arg W5 ©AC CCA TO© AÃ© ©CT TXT ATO ©CA Asp Pro Trp Lys Ala Phe Met Ala 105. 11© ASA ATA ©AG ©AS TAT GCT ASA &GT Ay» He ©lu ©lu Tyr Ala Lya Ser 12$ CTT ©SÃ ΑΛΤ AAT TT© ©SÃ SAT TAT Leu Gl« Asm S&u Pim ©1» A»p Tyr .14©

AAA. ACA CCT TTA &GT TTO CG& A©T Ly» Tfer gro Leu Ser Leu Arg Ser 15$ ISO

©aa err τττ tct caa «cã ©aã ãst SIu Leu Fh« Ser sln Ala. ©lu Ser 110 I7S 432 400 S28 CAT TTT CGT AAT TCC AT© CC© TCA TTT ©CA GTT TCC AAA TTC ©&A ©TO Hi» Phe Arg Aan Ser Kefc Pro' Ser PJse Ala Vai ser Lye &em Glu vai ião 135 ISO cr© trr ©ta ©ca aca tat ©ca caa ©cx ©ca aat aca cat tta tts em Leu Phe Leu ®ro Tisr Tyr Ala ein Ala Ala A»o Tur Hi» Leu Leu Leu 135 100 20© TTA AAA ©AT GCT C&A ©TT TXT S©A ©AA ©AA '.TO© ©SA TAT TCT TC® G&& Leu Lya Asp Ala GIb vai Phe Giy Glu Glu Trp ©ly Tyr Ser Ser ©lu 210 31S 220

OTO «34 «T2 ©AT ©TT ©CT ©AA TTT TAT CAT A©A CAA TTA AAA CTT AC® CA® CÃA TÃC Aep Vai Ala ©1« fite Tyr Hia Arg ©iu Leu Lys Leu Thr ©In ©Xn Tyr 22 S 330 33 S 3*0 ACT ©A© «®T TOT ©TT A®T TO© TAT AAT GTT ©GA TTA ÀAT ©ST TTA A©S Thr Asp His Cya Vai Asn Trp Tyr Asa Vai <31y Leu Asrt ©ly Leu Arg 34H ISO 3SS ÕBT TCA ACT TAT ©AT ©CA TO© ©TC AAA TTT AAC CGT TTT CGC A.Qã ©A& sly Ser Thr Tyr Asp Ala Trp Vai Lya pfee Aon Arg &rg Sl» 26© 26s 2T0 730 768

BIS

AT© ACT TTA ACT GTA TTA. QAT CTA ATT ©TA CTT Ti'C CCA TTT TAT ©AT Hefc Thr Le«. Thr Vai Lm A$p Leu Jk Vai Leu She ?ro Sh& Tyr Asp STS 5§0 28S 864 313ΡΕ1040192 381 ATT C«« ΤΤΆ mc tca ααα ggg gt? ara aca gaa cta aca ASA GAC ATT ll& Arg Leu Tyr Lys Gly Vai tys Thr <Si« Leu Thr Arg Asp Ile 2S0 " %$$ 390 TPT »m «AT CCA ATT TTT GCC CTS AAT ACC TTA SAC GA0 »δ ©SA CCA Phe Thr Aso pr» íle Ffee Ma Leu Asm Th*· Aau Asp GIu Tyr «ly Pr» 105 319 315 329 ACT TFT TTS AGT ATA SAA AAC TCT ATT CQ& AAA. OCT CAT TTA TTT «AT Thr Fhe Leu S«x II® Glw asa saar il« Arg liys Fr» Mia Leu Fhs Asp 3SS 330 335 TA? TTA CA8 GGG ATT' SAA TTT C&T AOG CGT CTT CAA «SCT Ϊ38Τ VAC TTT Tyr Le» Gla Sly tle «lu Ffee Mis Thr Arg Leu ©Ia Fro «ly Tyr Fh® J*0 34.5 350 OGS AAA «AT TC? TTC AAT TAT TOÍS TC? ©GT A&V TAT OTA GAA A€? AGA ©iy I*ys Asp ser Fhs Ass» Tyr Trp Ser «ly Ass tyx vai Glu. Thr Arg XSS 3SO :?»& CCT ftST ATA «GA TCT AST AAS ACA ATT ACT TCC CCA TTT TAT «SA. SAT Fr» Ser 22« ©Xy Ser Ser Lys Thr lie Thr Ser Fra Ffa* Tyx ©Xy Asp :r?s> 335 380 *AA TCT ACT GA& CCT «TA ÇAft AAG CTA &GC TOP «AT ©6& CAA AAA ©TT hys Ser Thr- «lu Fro Vai Gin Ly& Lee Ser PA* Asp Sly «I» &y» Vai 38S 3PC 39S 400 TAT em act ata sct aat aca w>£ «m «os «cr tm eos aat «st aas Tyx Arg Thr li* Ale As» Thr Aep V«1 Ala Ale Trp Pro Asa ©ly Lys 4OS 410 115 «ta tat tta ogt eiT acs mh csrr <mt τη ast cm, ta? «at «at caa Vai Tyr Lee «ly vai Thr Lys vai Asp sãte ser sin Tyr Aep Aep sl» «30 435 530 AftA AAT GAA ACT ACT ACA CAA ACA TAT «AT TCA AãÂ ASA AAC AAT CSC Uya Aen çl« Thr ser Thr ela Thr Tyr Asp Ser l#a ftrg Aan Aen Qly 435 44« 445 CAT STA ACT ÔCA CA© ©AT TCT ATT ÔAC CAA TTA CC© CCA <SAA. ACA ACA His Vai Ser Ala ©1« Asp Ser n® Asp «lo- Leu Fro Fro ©lu Thxr Thr 450 4SS 400 «AT ®AA CCA CTT CAA. AAA GCA TAT ΑΘΤ CAT CAG CTT AAT TAC ©CG GAA Asp eia Pr» Leu «!« 2»y» Ala Tyr Ser His ©1» A«u Asa Tyr Ma ©la 4S5 4-?0 «?S 400 TST TTC TTA ATS CAS ©MC CGT COF «GA ACA ATT OCA TTT ITT ACT TOS Cys Phe Lee íteh ôl» Asp Arg Argr ®ly Thr lie Fro Fh» Phe Thr Trp 485 480 4SS ACã CAT ASA AGT OTA SAC TTT TTT AAT ACA ATT GA? CCT GSA AAG ATT Thr His Arg Ser Vai Assp Pba Rhe As» Thr Ile Asp Ala «lu í.ye Ile S00 505 S20 880 1008 1056 1104 115¾ 1300 12:4 6 1296 1344 1392 1440 1408 1536 ΡΕ1040192 382

ACT CAA CT? CC&. GTA OTO AAA OCA «AT 3CC TTS TCT «CA OST QCT TCC Thr «la leu Pxrss Vai vai hym Ala Tyr Ala Leu ser Ser Ol y Ala Ser SÁS SáO SÁS A3T ATT OAA OOT CCA GOA TTC &CA OOA 0Ώ& AAT TTA CTA TO CTA AAA Il« lie Glu 01 jr Fra Giy l*h«· Thr Oly Oly Asm Leu Leu She Leu Lys SM SÁS 540 oaa ser agt aat tca att qct aaa ttt &âa ®tt aca tta aat tca gca õlu ser ser aan sar Ile Ma &ys pfce bys vai Tbr i^b Ser Ma S4S 559 555 56» OCC TTS «TA CAA COA «AT CGT QTA ΑβΑ ATA GÇÇ «AT OC« «CT ACC ACT Ma &e» lea 01» Arg syr A*g vai Argr rie Ay® Tyx Ala ser Thr Sfer 565 ' §7« 575 aac tta <m ctt rrr s«® caa aat tca aac aat «at ttt m esc atc Aan Leu Arg Leu Phe Vai Gin Asn Ser Asn Aen Asp i%» leu v*X lie 58S 385 5S0 ac ATT AAT AAA ACT ATS .AAT AAA GAT OAT «AT TTA ACA TAT CAA ACA Tyr Zle Asn Lya Thr .Ηβ-t Asn lys Asp Asp Aap Leu Tbr Tyr Oln. Tbr S5S Sí)Q 60.5 TTT «AT CTC SCA ACT ACT AAT TCT AAT ATO 000 TTC ΤΟΘ «OT OAT AAG Fie Asp Leu Ala T&r T»r A*» Ser Asn Met Ol y F'ba Ser «iy Asp &y« SlO 615 S20 MT «JftA ÇTT ATA ATA OQA ®Cft SA& TCT TTC STT TCT AAT G&& AAA ÃTC As» «X» L«u Ha ri* Oly Ala 01« Ser Pite Vai Ser As» Otu Lys Me S25 630 SIS 640 TAT ATA OAT AftG ASA OA& TTT ATO CCA 03A CAA STO TAA Tyr lie Asp Ay» lie Olu Fhe Xle 9*o Vai 01» £>«» 64S SSO 1SS4 1533

ISSO 1728 1.776

ÁS7F I32Ó

X«>5V (2) INFORMAÇÃO PARA SEQ ID NO:26: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:26: M«st- assi Pee As» Aa» Ar® Ser Slu Hi® Aâp Tfer lie Ly» v*l thr Pr» i s xs is &m*s Ser Ôln S3»r Α»Λ His As» ca» Tyr Vro leu Ala λ$ρ Ae® 20 23 3§

Ang Síefc

Pr» as» Ser s&r itetu Oiu olu Ua Ast» «yr l»ye 01« Ffee Á-e»

3S 6» 4S ΡΕ1040192 383

Thr Glu Asp Ser Ser Thr Glu Vai 50 55 Ma vai Gly Thr Gly Xle Ser Vai m 70 Gly Vai Sro Phe Mi Gly Ala Lau as Am Thr 31 ç Trp· gro Ser Aap Ala ISO G&e Vai <31». vai ϋβα Xl.« Aup Ay» 11S 120 l»y® Ala Léu Ala βία Leu Qia Gly 139 :os Vai Asa Ma &eu te Ser Trp Lye 145 158 I*y» Axg Ser ©Xh Asp Arg lia Arg 1SS HiS fha Arg Ããft Sêp H«t PtO Set 180 Leu Wh& leu Pr o Thx" Tyr Ais Glu 195 200 X»eu lya Asp Ala Gin vai phe Giy 210 215 A»p Vai Ala Glu J?ha Tyr Hi.s Arg 23S 230 Tto» &sp :Wi:s Cys vai Asa Trp Tyr 245 Gly Ser f hr Tyt Asp Ais Trp vai as-s Hat Thr l*eu thr Vai Leu Asp Leu 27.5 23Θ Xla Aseg £&u Vyr Ser S*y» G.ly Vai 290 255 Pha Thr Asp Prs xle Fhe Ala Leu 305 310 Thr ,fc .Lm Ser ile Glu A-«n §ar .325

Leu Asp Asn Sar Thr Vai lys Aep m

Vai Gly Gin Óe Leu Sly Vai Vai 75 3 0

Thr Ser pfee Tyr Gin Ser Ffc* Leu SO 9S

Asp Pm Trp I>y» Ala Pha Hst Ala 105 130 hys XI e Glu Glu Tyr Ala Lys Ser 125

Leu Gli's Mn Asxx The Glu A&p Tyr 140

Ly& Thr Pró Leu Ser Leis Ar§' Ser 155 100

Glu x*eu p-he Ser ©ia Ala Glu Sor X7Õ lis

Phe Ala vai ser Ly» Fiw* el«f vai 185 ISO

Ala Ala Aaa Thr His Leu Leu s&u 20S

Glu. Glu Trp Gly Tyr ser ser Glu 220

Gin Leu ly» Leu Thr <3l» Gin Tyr 2ÍS 24 Ó

Aan Vai Gly Leu Asa Gly Leu Arg 250 255

Lys 3?bs. Asa Arg Pha Arg Arg Glu 2i$S »70

lie Vai Leu J*ha P£o pbe Tyr Asp 2SS

Lys Thr Glu Leu Thr Atg Aap 11® 300

As» Thr Lau Asp Glu Tyr sly Fro 3IS 320

Xle Arg Lys Frrs Hia Leu. Fha Aap MS ' SIS

Tyr Leu Gin Gly lie Glu Sbe »i» Tfer Arg &eu Gin Pro Sly Tyr Fhe 384 ΡΕ1040192 MS aiy Lys Asp MS Sor Fhe Asa 'Tyv Trp 3S0 Pro s«r 370 Ik «ly Ber ser Lys .775 thx L y' S" 2SS ser Ttor Slu Pro vsl 350 O.lri Lysi Tyr Arg thr 1 .i-^S Al.4 ASil 405 ite ASp Vai Tyx LSU Qly 430 Vai Tb.r T,.ys Vai Sys Asa Slu 42 S Thr Ser fbr Slíí Thr 440 His Vai. 4S0; ser Ala í31:á Asp Ser 455 llê Asp 465 Olu Pro Lau Slu Lys 470 Ala Tyr Cya Fhe A«U I4®fc 01» A*$> &3rg Argr 4SS Thr HÍS Arg: 5er 500 Vai Asp Fhe Píiè Thr Sl« Oaix 515 Prs Vai Vai Lys Ala. sao 11« Ils 530 Gla Gly Ore Gly 535 Th{· 01« Bsr Ser Asa 5er I.le Ala Sysj Μ 5 S$0

Mia I,«u L«u <5Ιϊϊ Arg Tyr Arg Vai 565

Asn h&x teg SLea Ptm V*l Gin Ass sso

Tyr II* As» i»ys Títr Met As» Ly» §35 €00

Phe Ssp Leu Ma Tíar f&r èm s*r €10 €15 A»n GIu 2eu 12¾ Ile Gly Ala Glv gas 00 34S 350

Ser Sly &s« Tyr Vâl Giu Thr Arg âss O® ffer Ser sro FOe Tyr «ly Asp· iso

Leu Ser p&« Aap oiy 01» &y* Vai â9S * 40(5 vai ms Ais xrp pr» As» siy fcys 410 41.5

Asp P-ha Ser SI» Tyr A»p &»jp· Olii 4 ;,í > 4.Vi>

Tyr Aap Ser Lya &rg Asa Asm Qly 445 &sp Gla L&u Pro Pro fâlxj Thr Tkr 4So

Ssr Kís Gin L-Su ASA Tys' Ala Oltt 475 4B0

Oly Ths li* pr* Pisa Pha T&* Trp 4S0 4§5

Asn Th:i' Ile Asp Ale ®.lu Lya XI® sos s.ie

Tyx Ala Leu Ser ser Gl.y Ala Sar 535 6ly @ly Xsti Lais x&» Mm* &*** &ys 540 6he Lys Vai Thr Leu Α8Π SêX Ala 555 SS Ó

Arg Ile Axg Tyx AXa Ser %'hr Thr 570 575

Ser Ag» Asa Asgs Fbe te Vai 11« 5§S 5*0

Asp Asp Asp Les* Thr Tyr 01» ISir SOS àsn MS. Qly Ser Giy Μξί &yi es$

Ser Pb© Vai Ser Ase OXv l>ys 1-1© SIS S48 ΡΕ1040192 385

jyr fie Aâp l>y& lis Oiti Ph.® Tie Pr© Vai Gin L«o €4S SSO (2) INFORMAÇÃO PARA SEQ ID NO:27: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:27: ATO &AT OCA AAC AAT OS.A .AGT GAA CA? ©AT ACS ATA AAG «TT AOR CCT A»fc Pr© Asn teK Arg ser Glu Bis A&p Thr lie fcys Vai Bur Pr© 1 5 10 IS AAC ΑΘΤ ·ΟΑΑ TTO CAA ACT AAO CAT AAT CAA TAT OCT Tf» CCT «AC -AAT Hm §er Oiu Leu 61n TJa* Asn Bis hm 61» fyr ír© Leu Ala Asp Asa 20 25 3® CCA AAT TOA ACA CTA GAR ©AA TTA AAT TAT A&A <3AA TTT TTA AOA ATO Pzo Asa s«:r Tfer í*®u eiu ©1«. Asn Tyr l?ys: «In PA« 1.®« Argr JMefc 3S áft 4$ ACT GRA «AC AOT TCT .ACG ©RA ST© CTA <3AC AAC TCT ACA GTA AAA CAT Tfcx Oiti Asp ser Ser ®hr siu vai &eu Asp Asa Ser Thr Va.Jt hym Mp SÕ 35 so SCA &TT GG© ACA GGA ATT TC? GTT GTA GGG CÁÍ5 ATT TT» GGT ©ΓΥ «TA Ala vai Gly ifcr Sl.y fie Bar va.l Vai ©iy da fie Leu sty vai V*X 7© 75 00 qqa gtt cca rrt «cr coe «ca crc act tca ttt ta* caa tca rrr crr siy Vai pr© Píj» AI® 0ly Alã Aea Tfcr ser Pise Tyr eia ser Pha Asu g$ te iS MC ACT ATA tQS CSA AST GAT <3CT CSC CCS* tm AAG GCT TTT ATO ©CA Asa Thr He Ysp· Pre Ser Asp Ala Asp Pr© Ttp Lys Ala Phse ííefe Ala 100 105 .130 CÃS. GTT GAA ©TA CTO ATA ©AT AAG AAA ATA m® SAÚ WT Ú£T MA Mf ©in Vai Gía vai Xle Asp Lys Lys 11« «lu Glu Tyr Ala Gys Ser 115 120 125 AAA. SCT ©TT GCA. QWS TTA CA« ÔST CTT CAA AÃT AAT TTC GRA GAT TAT Lfs AS® Leu Ai» «ia hs& 61» Siy íi»tt 61a èm Asa Hte Ty* 110 13S 140 •40 344 332 240 288

3.W 314: 432 480ΡΕ1040192 386

GTT AAT «C0 Tm AAT TCC TG& M6 AAA ACA CCT TTA ACT TT® CSA AOT Vai Asn M« Leu Asa Ser txp hya Lys Th-r Leu Ser Leu Arg Ser S48 150 IBS t«0 AAA ASA A«C CAA «AT 03A ATA MM QAA CTT TTT TCT CAA «CA O&A A0T Lys Arg sor «1» Asp àrg Ile Arg «Tu Leu Fhe Ser ela Ala «lu ser 1SS 170 17S CAT TTT COT AAT TCC ATS CCS TCA TTT OCA STT TCC AAA TTC «RA OTO Mis hhe Argt Aera Ser M@k Pr© Ser Phe Ala. Vai Ser Ly» Sb© Siu Vai 18 G ISS 13© CTG TTT ÇTA CCA ACA TAT «CA CAA «CT GÍÍA AAT ACA CAT TTA TTS CTA Leu ®fo# Leu Fr» Tta Tyr AI» Gin Ala Ai» Asct V&r Hi» l*u Leu Leu 1-35 200 2 OS ΤΓΑ AAA SAT QCT CAA «TT TTT GGA «AA «*A TSS «SÃ TAT TCT TCA G.AA Leu Ly* Asp Ais Sl« Vai· ifls.© «ly «iu «la T*p Oly Tyr Ser Ser Qlu 21© 215 220 OAT QTT SCT SAA TFT TAT CAT AíXA CAA TTA AAA CTT ACA CAA CAA TAÇ Asp Vai Ala «lu .Phe Tyr ais Arg «la Leu Lya Leu Thr ôln «la Tyr 235 230 23S 240 ACT S&C CAT TST OTT AAT ΪΜ TAT AAT SJÍ G8A TTA AAT «6T TTA ASA Tfer Asp .81« Cys V»1 Asn Trp Tyr Asn vai ely Leu Asn Cly Lea Argt 245 250 255 ©ST TCA ACT VAT «AT OCA TOS OTC AAA TTT AAC CGT TTT CGC ASA GAA «ly .tíer ttor Tyr Asp Ala Tzp vai Ly* Ph* Asn Arg Phe Argt Assg Olu 260 2SS 370 AT« ACT TTA ACT «TA «A «AT CTA ATT «TA CTT TTC CCA TVT TAff ®AT Met· Thr Leu T&r Vel Leu Asp Leu lie vai Leu «Ae ero sí» Tyr ftgp 27S 380 285 • ACT A«a CQA TTC AGA AAS GSS GTT AAA ACA «AA CTA ACA AGS «AC ATT ΤΙμγ Arg· Arg Ffee A»g Ly» «ly Vai Ly» Tbr «lu Leu T&r Arg Asp ile 290- 335 3©V TTT AOS ®AT CCA ATT TTT TCA ÇTT AAT ACT CTT CAS GA© TAT GGA CCA Phe Thr .Asp Pro lie Phe Ser Lea Aea Tbr Lea «In «lu Tyr Gly pro 305 310 315 320 ACT TTT TT0. A«T ATA G»A AAC TCT ATT CSA AAA CCT CAT TTA TTT «AT Thr Phe lso Ser 11« «lu Asn Ser 11« Argr Lys Fro Hia Leu Ph« Asp 32S 330 333 TAT TTA CA0 «®S ATT 3AA TTT CAT ACS COT CTT CAA CCT 0OT TAC TST Tyr .Leu 01» «ly tle Giw Ph© Hás Thr Ax$ Leu «1» Pio «ly Tyr Phe 340 34S 3 ST ms AAA 0AT TCT TTC AAT TAT TG© TCT ©OT AAT TAT «TA «AA ACT A®A Gly Lys Asp Ser Pfee Λ» Tyr Trp Ser «ly Aea Tyr vai «lu Thr Arg 35S 340 3SS

S2S 57Ê 024 672 720:

Slfi 884 312 1008 10S« 1X04 387 ΡΕ1040192 OCT AGT ATA @©A TCT AGT AAS ACA ATT &CT TOC CCA TTT TÂT ©AT 1152

Pro Ser 11« «ly S«r Ser i»y* T&r Xle Thr Ser Pr© Ph« Tyr <51 y Asp

37« 3 75 38S MA TCT ACT\«AA CCT Í3T.& CAft .AÀS CTA. ASC TTT GAT ««#L «AA AAA <3TT 1200 l»ym Ser Tfcr «1» Pr© 'fel Sla Irys Le» Sar fte Asp «iy «In &y& Vai 3S5 390 39S ' 400 TAT CISA ACT ATA GCT AAT ACA, S&C «TA Q0& CCT T8S C©3 AAT CKW AA6 134«

Tyr mg thx n« Ala A*a Tbr Asp vai Ala Ala rtp p*© ão.» Cly Ay» 49S 419 415 «ra TAT fm cer «tt ags aaa ôtt sat τττ ast çm tat o&t «AT CAA %2#è

Vai Tyr :L«» CXy Vai Thr £»y* fel Asp fee S*r 61a Tyr Aep A»p> 61o 429 435 430 ARA AAT «AA ACT ftST ACA CAA ACA W «AT TCA AM ASA AAC A&T OSC 1344 l*y© Asm 61 u Thr Ser Msr 6ift T&r *Fyr A»p Ser ísy» Axg Aar Aso «ly

43$ 44Q 44S CAT STA A6T «CA CA0 6AT TCT ATT «AC CAA TTA CC6 CCA ORA ACA ACA 1392

Mis fel Ser Ala cl» Asp Ser íla Assp «1» Ae» ®m Pm 61© Tbr Thr 4S0 45$ 4S0 6AT SAA CCA CTT 6AA MA 6CA TAT AGT CAT CA6 CTT AAT TAC 005 CAA 1440

Aap «la Pr» fea CX« &ys Ala Tyr Ser Sis SI» irisa Asa Tyr Ala 6Xu 455 470 475 4S0 TBT TTC TTA ATO CAB G&C CST CST «GA ACA ATT CCA TTT TTT ACT TOS 14 S 8

Cys Ph» IjS» Mefc 61«, Aap Arg Arg QXy Thr IIe Pr© The P&e T&r T*p

40§ 430 49S

ACA CAT ASA AST STA 6AC TTT TTT .AAT ACA ATT «AT CCT OAA AAO ATT IS3S

Thr Hia A»g· s«r vai Asp Pfe Phe Aea Tte 11« Aap Ál.a Slxt &ya Ile SOO: SOS S10 act càa crr eco, ota cto aaa sca tat scc ttg tct toa sgt «ct toc is#4

Tbr 61» feo Oro fel fel I#y« Ala Tyx Alo hmi Ser Ser Qly Ala ser SIS S20 525 ATT ATT 6AA COT CCA S®A TTC ACA CCA SGA. AAT TTA ÇTA TTC CTA AAA M32

Ile Ha: ©lo eiy Pre Sly Pfc» Th-r 61y ÔXy Αβ» Ιλ«· hm Phe As» Ly® SIS S3S 549 SRA TCT ACT AAT TCft, ATT CCT AAA TTT ΆΆ& STT ACA TTA AAT TOA «CR 1480 «1» Ser Ser As» 8«» 11«· Ala Ays Ph« Lya fel TAr ©e» Ma Ser Ale S4S SS0 SSS SS0 «cc TTC TTA CSA cm TAT CGT «TA ASA ATA CSC TAT 6C3P TCP ACC ACT 1728

Ala ©e» l«u. Gin A*g Tyr Arg fel Arg 11® A*g Tyr Ala s®r Thr Tftr

5iS 570 57S AAC TTA. CSA CTT TTT ©TC CAA AAT TCA AAC MT SàT TTT CTT 6TC ATC 1775

Asn l«u Arg Mu Phe fel Sln As» ser A®» Mo fesp Pha bau fel 11« 509 5SS 590 388 ΡΕ1040192 mc ATT AAT AAA ACT ATS AAT AAA SAT GAT GAT TTA ACA TAT CAA ACA 1824 Tyr lie As» tys Thr Ne t Asri Ly& ASp ASt> Asp La» Thr Tyr Glc) Thr S9S soo SOS TXT <3AT CTC OCA. ACT ACT AAT tsx AAT ATG 600 TTC TCG 60T GAT AAiL 1872 phe Asp Leu Ala Thx Thr Asn Ser As» Stet Gly Phe Ser Giy Avp Lys 6 10 SIS 020 AAT SM CTT Am ATA «Oft GCA GAA TCT TTC 0TT TCT AAT GAA. AAÁ ÃTC 1020 AS» GT». I-®» XI® lie Ala 61» Ser Phe Vai Ser Aon Giu. Lys II e 43 S 450 435 440 TAT ATA G&T AA0 ATA 6AA TTT ATC CCA GTA C&& TTS TAA 1959 Tyr xl.e Asp t»>'3 lie Gl» Pisa 11® Pr® Vai. 61» Leu 045 550 (2) INFORMAÇÃO PARA SEQ ID NO:28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:28:

Kis Asp Thr xl«. Lye vai Thr Pxx» .10 15 asu 61» Tyr *r« Ls» Ala Aop As» 25 ao Asn. Tyr Ly» 61u S» Leai Arg Mefc 45 Leu Asp Asn Ser Thr Vai Lys A&p ió Vai <31 y Gin lie Ls« 01 y Vai Vai ?s eo Thr Ser PA® Tyr <5l» Ser Phe Leu 56 #5 Aap Pr» T.rp Aya Ala Pb® Ala 105 ;u.o Lys XI» 0lu 61» Tyr Ala Lyá Sár 125 Leu 61» As» As» Wh& SI». Aap Tyr 140 Lys Thr Pr© Leu ser Leu Ãrgt S«r 155 ISO Môt As» Pro As» Asn &rg Ser Glw 5. 5

Asn Ser <31 a L&u <3 In. Th:r As» Bis ao

Pr» Mmn. sar Thr Leu 61«. 61« í#®« as 40 ?toc 61» Assp S*x Se* Tísr 61» Vai 58 §§

Ala Vfcl flly Tta Gly lie Ser V«1 §5 ' <Uy Vfel Pro PA» Ala Sly Ala. Leu S5

As» Thr Xle Trp Pr© S«* Asp Ais lãs 61» Vai Slu ¥ai Le» Xis Asp Lys 11S 120

Lys Ala. l®u Ala 61» teu SI» 6Iy ISO 13S VUl As» Ala &£** Aâtt Sei Tip LySi 145 150 ΡΕ1040192 389

Lys Argr Ser βΐη Asp Arg lie Arg i.Sâ His Phe Arg Asu Ser HeL Pro Ser ISO Le» Ph.e Leu Pstõ Thr Tyr Ala <SX» 185 20« Le« Lya Asp Ai# Glu val Ph·® Sly 21G 255 Aep Vai Ala Giu PAs Tyr His Arg 223 230 Tfcr Asp His Cy» Vai Asa Trp Tyr 245 Giy S«r Thr Tyr A*p Al# Txp Vel 260 Wefc Thr Lea T^r Vai Leu Asp teu »?$ 2SÓ Thr Arg Arg »h» Aeg Lys Qly Val :20O 2SS Phe Thr Asp Piro Ué Fh« Ser imt 3Θ5 MÔ Tte Pha Leu Ser li# fiHy. aso ser 325 5¾¾ LÉU GlA sly 11« «lu The Mis s« ely Lys Asp Ser Mis Asa Tyr Trp 3S5 360 Pm Ser Xle oly Ser Ser Ly® Thr 370 375 Lys Ser Thr ala Pro 'Val <3X:a Lys 385 30S Ty* Arg Thr Ile Ala Asa Thr Asp 4&S Vai Tyr Leu Sly Val Thr Lys Val 420 Lys As» eitt Thr Ser Thr 81» Thr 435 440 Mie Vai Sar Ala <81» Asp Ser £1* slu Léu p:he ser Gl» Ala siu Ser 170 175

Vhe Ala Val Ser Lys :Phe Slu vai .185 .180

Ala Ala Asn Thr His Léu Léu Léu 205

Glu Slu Trp Sly Tyr Ser Ser Glu 228

Gl» Leu Lys Léu Thr Slrs Gin Tyr 235 240

Aa« Val Sly Leu Aan Sly M» Arg ISO 255

Lys Phe Asa Arg Phe teg Arg <liu 265 27S

He Vai Leu Phe Pr® Fhe Tyr Asp 235

Lys Thr slu Leu Thr a*®· Asp xle 3 00 asa Thr Lau ®1» Glu Tyr sly Prõ 31S 320 IIé Arg Lys Pr© Mia Leu P.he Asj? 330· 33:5

Thr Arg Leu Glu Pro Gly Tyr ph« 345 3SÓ ser Gly Asn Tyr vstl Glu Thr Arg 3f5 lie Thr Ser Pro Phe Tyr ®ly Aep 380

Leu ser Ftae A&p Gly Sln Lys Vai 395 400

Vai Ala Ala Trp Pro Asa Gly Lys 410 415

Asp Phe Ser 61b Tyr Asp Asp Cl» 42S 438

Tyr Asp Ser Lys Arg As» As» ®ly 445

Asp Gla Leu Prs Pre> Giu Thr Thr 390 ΡΕ1040192

450 455 4£Q

Asp SIu Pr» Leu ©1» ty» Ala lyr Ser Hie Sln Leu A»» Tyr Ala Glu 4i5 470 47:5 4Ô0 cy* Phe Leu Met Gl» Asp Arg Arg Gly ttxr XI* »ro Phe Pise Tte Txp 485 49Θ 455

Thr Ma Arg Ser vai ftsp Ptee P&e Asa Thr £1« Hep Ala <31u Lye lis

SOS § 05 51C TAr siíi l&u Fííã vai vai Ly» αία τψ? ma léu βαϊ ser Giy ma &&?

SIS 550 52S

He xis Glu GXy Pro Gly Phe St&r Gly Gly As& Léu .lsu Phe Leu JLys 530 535 540 GXu Ser Ser Asn Ser He Ala Lya |*fee hym· Vai Thr Leu ã»a Ser Ala 545 550 S.5S S60

Ala Leu L«u slti ftrg Tys Arg V&l Arg iXe ftrg Tyr Ala ser Thr Thr S65 570 575 íuwi Lsu Mg Leu f*Xie YAl ®lu as» Ssi &au Assh futp Píse Leu Vai lie SSÔ 585 530

Tft II» A«u Lys Thr Síet A«h Lfs Aep A«p &sp Leu Thr Tyx GXs "SSur S95 «00 $m

Fha A»p Lsu Ma Thr Thr As» Ser Mss l*efc sly Ffcs Ser úly Asp &ys 610 SIS 620

Aan siu Leu ils lis sly Ala slu ser Phe vai Ser Asa Glu Lys lie 53$ £30 635 «40

Tyw XX* Aap Lys Il« Slu Çha llss Pr» Vai GX» Lsu 645 «50 (2) INFORMAÇÃO PARA SEQ ID NO:29: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:29:

4E

AT® AAT CCA AAC AAT ΟβΑ A®T «ÁA CAT GAT AD® ΑΤΑ JVtíS ®TT ACA CCT 391 ΡΕ1040192 «et Asrs Pr» Asm Asm Arg Ser «1« His Asp Thr Xis Lys vai Thr pro :i s xo 15

MC AST <3AA TTG CAA AÇ? MC CA? AÃ? CAA TAT CGT TTA ©Cf «AC AAT SS

Asm ser «iu hm Oift TAr Asm lis Asm «1» Ty* Pt© hm Ala Asp Asm " 30 3S 30 ÇCÃ AÃ? TC*. AC* cm «M «M TTA ΑΚΓ TAT MA GM TXT TTA *®A ÃTÕ 144 8*» Asm Ser Hw teu βία ©lu Less asm Tyr Lys βία Phe Leu Arg «et 35 40 45 ACT «M «AC ÃGT tCT AC<5 ΘΑΑ GT6 Cm ©AC AAC TC? ACA «ΤΑ AA& ©AT 152

Tkr βία tep Ser Ser fhr Slti Vai Leu Aap Asa Sex Tísr Vai Lys Asp 50 5$ 6« oca «rr m& aca gca att tct çtt em eos cm att tta «fô? orr em 240

Ala Vsl «ly Thr «ay lie Ser vai vai «ly ei» He Leu Gly Vai Vai SS 70 75 80 em stt ccã ttt «ct aee «ca ctc act tcã ttt tat caa tca ttt ctt zm

Qly Vai Pr© Pfee Ala Gly Ala Leu Thr Ser Pise Tyr Gin Ser Phe Leu 85 9Q .95

AAC ACT ATA T8S CCA A®T «AT ©CT «AC CÊA f«« AA« GC? TTT ATS ©CA $M âsn Tfer lie τκρ Pr© Ser Asp Ala Asp Pr© trp Ly* Ala Phe tt*t Ala ISO 105 110 CAA GTT GAA GTA CXG ATA «AT IM AM ΑΤΑ «A0 «AO TAT ®CT AM AG? 384

Gin Vai slu Vai Lesa Jle Asp Lye Lys Ilm «la «la Tyr Ala Ly* Ser X.M !2l> 125 AAA «çr CTT OCA ©AG TTA CRS ΟβΤ CTf CM AAT AAT TTC GAA «AT TAT 432 3Lys Ale Leu Ala. Glu Leu Gin ©ly Leu. Gin Asn As® pjjiia ©In Asp Tyr 130 X35 140

Gtt aã? GCC ?m M.T TCC TG© afia aaa aca ccr tta ag? ttg cga as? asa

Vai As» Ala Leu Asa Ser Trp Lyss Ly® Thr Pr© Leu Ser Leu Arg Ser

MS 150 1SS ISO AAA ao* asSC CAA «At CÍÍA ATA AOQ OAA CTT TTT TCT CAA OCA OAA AO? S2»

Lys atq ser «1» Asp l*g 2Xe Arg Olu Leu The Ser Gin Ala Glu. Sei:· 1SÍ 1T0 175

GAT ?TT CGT AAT TCC ATO CC8 TCA TTT «CA CTT TCC ÃM TTC GAA GTG S7S

His Fhe Argf knm. ser «et Pr» Ser phe Ala Vai Sex Lys Phe Siu Vai

im 1SS ISO CT« TTT CTA CCA ACA TAT OCA CM OCT CCA AAT AÇA CAT TTA TTG· CTA 624 E«eu WhG .Leu Pr» ’?tsr Tyr Ala ©In Ala Ala Asn Tiir Bis Leu Leu Leu

19S 200 2«S TTÃ MA «AT «CT CM. CTT TTT ««A CM «AA TGG OQA TAT TCT TCA SM 573

Leu Lys Rstp Ala Gin Vai «a* «iy «1» ftp «ly Tyr Ser ser Slu 310 2:15 320 OAT 0TT OCT OAA TTC TAT CGT AGA CM TTÃ AAA Cf? ACA CAA CM TÃC 730 392 ΡΕ1040192 Ãsp 22S vai Ala 01¾ Phe Tyr 2 3.0 A.rg Arg ©In Leu LyS 335 Leu Thr Gin Gl.it Tyr 240 78» Ã.ÇT GAC CAT TGT GTT AAT ••T4S TAT AAT GTT ‘CaíSA. TTA AAT ívííJT ÃGÃ Tirix ASp His cys Vel 34 8 As-n Trp Tyr Asm vai SSÈ! Gly Asn Gly hev :S55 Arg OGT TCA ACT TAT O/VT ©CA tee GTC Ma TTT1 AAC CGT ?rr CSC ASA &&& δ 15' Gly Ger Thr Tyr Aísp 260 Ala Trp vs l Sfês phe A.Si’ Arg JPJSe Ar<í Arg 270 Sltt AT© ACT TTÃ. ACT «TA TT& ©AT cm ATT GTA CTT TTC CCA TTT TAT GAT 8S4 Meh Thr Ií^:U S75: x&r Vai Asp 3§S Sis Vai Leu The Oro 2S5 Phe Tyr Asp ATT 03« TTA TAC TCA AAA eoe G1T AM ACA GAA CTA ASJA AUA. ClAi; ATT 912 Ile Aí'<J .290 Leu Tyr &&T Lya Qiy Vai Lys Thr Glu Leu 300 Thr Arg Asp lie AOS GAt cm ATT -ni: TTA cm· AAT ACT CTT GAG GAG TAT GGA CCA sso ph® 305 Thr ÂJ3-P Pm 11 & Phe 31. Φ Liãu Leu Asrt Thr Leu 335 Siri Slu Tyr Gly Pro 320 ACT TTT TTG AÔT ATA SM AAC TCT ATT CGA AAA CCT CAT TTA TTT GAT 10 es Thr Fha Ser n« 325 Giu AS» ssr Zlfi ftrg 330 hys sro EiS Lso The 335 Asp TAT ΤΤΆ CM ©as ATT GAA TT't CAT ACG ccsr crr CAA cct GGT mc Ι'ΤΤ 105S Tyr Leu GIs «ly 340 Ue aiw PAe His Thr 345 Arg Leu ©In Pro Gly Tyr 330 Ph« GS3 AM ©AT TCT •TVQ AAT TAT TOS TCT «S? A&T TAT STA @M ACT Λ llIM Gly Lys A&p 355 Ser Wh» Asn. Tyr Trp 3iSO Ser Gly M& Tyr Vai 345 Giu Thr Arg CCT AOT ATA OGA TGT AST ΛΛ© ÃCA ATT AST TCe CCA T*T TAT ®GA βΑΤ Μ82

Pm mt 11« flly ser ser Uye Tfcr lie Thr Ssr Pttt «se Tyr Gly Asp 370 37.5 380

MA ««* ACT TM. TC? «TA CAA A&8 CTA ASC » «AT GSA CM MA «TT 2,2 QQ i,ys ser Thr elw Pro vai ele Lys L&u s«r Wh» Âep ©ly ©1» Lys Vai 385 3M 3.9.8 400 tat em. ãct ata ©ct aat aca sac ©ta scg sct tgg ccg aat gst aas 124»

Tyr Arg Thr lie Ala Asa Thr Asp Vai Ala Ala Trp Pm A.m Gly Lya 405 410 415 ©ta tat tta «st stt aos aaa mr «at rrr .act caa tat qat m cm 329« V*1 Tyr Lev Gly Vâl Jte pys vai Asp *he ãex «In Tyr Asp Asp Gin 420 428 430 AAft. AAT 0Α& ACT AGT ASA CAA ACA TAT SAT TCA MA ASA AAC ΑΑΓ GGC 1344

Ly# Ash Glu Thr S«r Thr Gin Thr Tyr Asp Ser Lys Arp ftsn Aaft Gly 435 440 445 cat em mx ©ca ca© ©kt tct att «sc cm. tta cce cca » aca aca 1332 ΡΕ1040192 393 H.is V*1 ser Ma Gin A»p Ser lie Asp 61» tsu Fra ?ro 61» T&r THr 450 4SS -ISO &&T G*A OCA CTT OÃA AM GCA TAT AST CAT CAG CTT ttf »C GGG 5» Asp 61» Fre Lsn Qlu &y» Mia Tyr Ser Sis ®1» I·»» Ae» Tyr Ala 61» 4S$ 470 475 480 tst rrc tta ats qâb mss cm cm· mm Mm att oca ttt tw act r&& Cy» Fhe Leu Met 63.» Arp **g Mg 31y Tter 11« Sô *&« Fias T&r T*F 4®S 4 90 ·' 4SS ACA cm ASA JM3T M OAC TTT TTT AAT ACA ATT 6AT ®CT GAA AS® ATT Thr lis &rg ser Vai Asp Fhe Fhe as» Tfer 11« *»p Ala 61» t>ys Xis soo sos sxo nn caa ctt cca ra. <rra aaa oca tat occ tts tct tca oct sct tcc ftr sl» &e» Fro Vai Vai Lya Ale. Tyr Ais Xau Ser Ser 6iy Aia Ser SIS 320 * 525 ATT ATT OM «ST CCA SSA TTC ACA SBA SOA AAT TTA CTA TTC CTA AM Xla X1& 61« Sly Fr© Ciy Fhe Thr 61y «ly As» tas t»éu Lau Ay» 530 535 54© 6AA :fC" AGT AAT TOA ATT C5CT ΆΆΑ TFT AAA GTT ACA TTA AAT TCA GCA 01» Ser s&s Ase Ser XXe Ala S»y» F.he fcy» Vai Thr l#m Asa Ser Ala 545 SSO 5S5 560 QCC TTG ϊΤΑ CAA CSA TAT CGT 6TA AGA ATA OSC TAT 6CT TCP ACC ACT Ala beu tat» Gin Arg Tyr Arg Vai Arg Xle Mg xyr Ala ser T&r Tfer SSS 570 575 ASff TT& «SOA CTT TFT STB CAA AAT TCA AAC AAT S&T TFT CTT ©TC ATC A«n tmi Arg L-au Vb» vai 61» Am ser Ase Ass» Asp Fh* 1<«» Tal xle 58Θ SSS 55& TAC ATI1, AAT AAA ACT ATC AAT AAA GAT ©AT OAT TTA ACA TAT CAA ACA. Tyr Xle Ae» vya Thf K«t Asa i»ys Aep Asg Aep Lau Tfer Tyr ©la Tbx SSS SOO SOS TTT ©AT- CTC SCA ACT ACF AAT TCP AAT AT® SB» TTC TOG «ST «AT AAS Fite Aep L&u Ais Thr Tifer Aen Ser A*n Met Sly FA« 8er Sly A*p 1í¥» 010 315 630 AAT @AA CTT ATA ATA &SA 3CA SAA TCT TT€ 8ΤΓ TCT AAT SAA AAA ATC As» Slu tatu Ila Ile ely ala Ql» Ser Ffee Vai Ser A«» ®I« W XÍ« 323 S30 535 540 TAT «TA OAT AAS ATA CAA TST ATC CCA CTA CAA TTC ΪΑΑ Tysr Xle Aop oys Tle Ciu Ph» XI® Mo Vai 6ΪΛ L«u Ê45 SS0 (2) INFORMAÇÃO PARA SEQ ID N0:30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos

144 D 1488 1533 15S4 1S32 1680 1738 1776 JJ34 1872 1050 ΡΕ1040192 394 (B) TIPO: aminoacido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteí (xi) DESCRIÇÃO DA SEQUÊNCIA:

Wsfc âsii Fjso hati ârg Ser @lu 1 5 Λ&ά «v* <3ju Seu islã Tíir Asím. Hás 20

Fr© Am ser Thr Leu glu slu Leu 35 40

Tfcr βΧ» &»p Ser Ser Tfcr 6Xu Vai

Sâ SS

Ais Vai Gly Thr Siy xXa ser Vai S.§ 70

Gly Vs.i F*·© Fto» Ala Gly Hs Lm OS- AS» Th* Xle Txp Fr© Se* Aa$» Ala

ÍOO

Si» Vai Glu Vai Le«. Ila λβρ Ly» II5 120

Lys Ala. Leu Ala OIu Leu Glri Giy 1IG 135

Vai "As** Ala teu &aa Ser Trp T,y»

14 S ISO L-yS> Arg Ser Slu Asp Ary lie hrg 3,5 5

Mis PJ»a Arg Mn Ser «efc Fr© Ser ISO

Leu Fbe Leu P*x> Tta Tyr Ale (51» 1$S 200

Leu Lys Asp Ala SIa Vai Fhe Qty 210 2X5

Asp vai Ale Slu Fh* Tyr Ari’ Arf 22 S 23fi

Ttir Aap His Cys vai As» Trp Tyr 345 gly ser thr Tyt Asp Ala Trp· vai

MO na SEQ ID NO:30:

His A«p rhr 11-e Lys y»i fhr Fr© 10 1$ Asn Gin 'Xyr Pr© Leu Ala Aan 25 3© Ãs» Tyr Lys slu £φ,& Leu &rrj Nisii Leu &sp Mn Ser Thr vai Lyss &sp val eiy «1» Ilé Leu Gly vai Vai 75 30 Thi- Ser Pfca Tyx Gla ser Pfce Leu 50 S5 Asp F*© frp Lya Ala Phe «et Ala XQS ilt> x>y» xis Glu Glu Tyr Ala Lyss ge* 121 teu Gin Asri Asií PAe Glu Asp Tyr 140 Lys Hir Fr© &*u S«r Leu A*g s«* 155 X6Q Glu Leu Fhe Ser Sln Ala Glu $«* 3 70 j ?4 Fhe Ala Vai Ser Lys Fhe Glu VaX XOS ISO Ala A1& As a Thr Hi.s Leu Luu Leu 305 Glu Slu Trp gly fyg Ser Ser Slu 220 <*ln Lee Lys Leu Thr Slu Glu. Tyr 235 240 A*rt Vai Gly Lee Asa Gly LéU Arg 250 255 Lys Fí»a Asa Ar§ Pite Arg Arg Glu MS 270 395 ΡΕ1040192

Tfer Leu Thr vai Leu Asp Leu li# Vâl Leu Fh# Pr© Pb# Tyr Asp 275 28« 288

Ile &rg Leu Tyr Ser Lyo <51y Vai Lys Thr Glu Leu The, Arg? Asp lia 2£Ç ' 2BS 300 pfes Ttosr Asp Psro lie Phe Leu Leu Aon Th* Leu Gl» Giu Tyr Gly Pro 3 08 310 Thr yfc© Leu Ser Xle Ol» Aon Ser 325 fyx- Leu sin Gly ile Glu Phe Hie 340 Oly Lys Asp 3«r Pha A&n Tyr Trp 3 5 5 380 fea Ser lie Giy Ser Ser Lys Tfcr 3 70 375 Lys ser Th-r ©1« Fr© vai «1» Lys 3SS 350 Tyr &rg Thr lie Ala Aon 1&r Asp 405 vai Tyr Leu Gly Vai Thr Lye Vai 420 Lyn Mn Slu Tfc* S#r *a»r Sis Tlur 435 440 Mis Vai Ser Ais. Gin Asp ser lie «se 455 Asp ©1« Fr# Leu Giu tys .Ma Tyr 465 470 Cya pfee Leu Mafc Gin Asp &rg ftrg 4SS Thr Ei s Arg- ser vai A*p Fhe Ph# 500 Thr Gin Leu Pro Vai VaX Lys Ala 515 520 11« Xl« «lu Sly Pro ®ly Phe Thr §30 S3 5 Glu Ssr Ser A®» Ser 11« Ala Ly» 545 55-0 Ala Leu Leu Cia Arg Tyr* Alg vai 315 3S0 lie &rg Lys Pro Bis Leu Pise Asp 330 335

Thr Mg Leu Gin Pre Gly Tyr Pfee 345 350

Ser Gly Asa Tyr Vai Gtu Thr Axgr 3S5 ile Thr S«r Pro The Tyr Gly Asp 380 .Le« Ssr Phs Asp Gly GÍex Lys Vai 335 400

Vai Alo Ala Trp Pre Asa çiy Lye 410 43S

Asp Pbe Ser ©iu Tyr Asp Asp ©Xn 425 *30

Tyr Msp ser Lys &t?§ Mn asp Siy 44 5

Asp <Sl» Le». Pro Peu ÍJlu Thr Tbr 450·

Ser Mis ©In 'Leu Aon Tyr Ala ©lu 475 480

Siy «*T íle P*e Phe Phe Thr Trp

4tO 4PS

Aan Thr 11« Asp Ala ©lu Lys lia 505 510

Tyr Ala Leu Ser Ser Gly Ala Ser 325 «ly Gly Asa Leu Leu Phe Leu. Lye 540 'Ph« Ly» Vai Thr Leu Asn ter Al« 555 550

Arf lia Arg Tyr Ma Ser Thr Tfer ΡΕ1040192 396 Sê?» 570 57S Mm AT5 Leu Fb» Vai As» Ser Asn Asia &SJ5 Pite Lais Vai Xle SAO 585 S5D Tyr ile ÃÍ5S5 Lys Tlsr Asn Aõp Asp Asp I^u Thr Tysr Gl» Tb:r 595 SCO SOS t%es Asp Leu Ais Thr Thr As» S«*r ASO. ífet Giy Fh» Giy Asp Lys SIÕ SIS Aso GLs Leu Xis ii® ôiy Ala Gl« Ser Pha mi A«pjt Glu Lys Ile $2S S3Õ 05 S40 Tyr XXs Asp Lys He P.he XI» PJfO Vai Gin liátí

S45 fSG (2) INFORMAÇÃO PARA SEQ ID NO:31: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:31:

ATiS W CCA AAC AAT 0®A AGT ΘΑΑ CAT «AT ÃCG ATA. ÃÃG <3Tt ACA CCT 4S

HeÇ. Asb Pro Aen Angj filu Mis Asp Thjf lié Lys Vai Thr SíO

1 S 3-S

AAC AOT «ÃA TO CAA ACT AAC CAT «AT CAA TAT CCT ΪΤΑ ®GT «AC ΑΑΤ M

Asa ser ®tu Leu Gin Thr A*n Ui» ftwt Oto. Tyr Fso hmi Ala Asp Aait

20 2S 3ÊS OCA AST TCA ACA CTA «** G&A TTA AAT TAT AA& ®&& ΤΤΓ TTA ASA AT® 144

Pro *ea s«r Thx teu «lu Glu Leu A»n 'Tyr Lys Qlu sh« Leu Ar» **et

3% 40 4S

ACT ®AA <3AC ACT TCT AC® a&A GT® CTA «AC AAC TCT ACA «TA AAA ®AT 1SS

Thr «Tu Asp Ser Ser Thr ®lti vai teu Asg> Ásn ser Tfer vai tye mp

so 55 áS ®CA OTT SCO ACA SSA ATT TCT GTT ®TA SOO CAG ATT TTA «ST 8TT GTA 240

Ma V*1 Giy Thr e&y lie ser Vel oly oiti xie teu Giy vai vai SS 70 75 80 GOA. &$f CCA TFT GCT G&S OCA CTC ACT TCA TFT TAT CSA TCA W CTT Giy vai Fco Pb® Ala Giy Ala teu Thx A«r Pha Tyx álrt Ser *fce Leu 397 ΡΕ1040192

85 50 $S M*G ACT Má XO© CCA &GT ©AT SCT SAÇ f-XA TSS MS SCT TXT ATS QCA 33®

Aen Thr Ué Tyji jpr© Ser A»p Alá Μρ yr« Tr$s Ly» Mi Ms?t Ala 100 3,05 XI©

CÂA ©ΤΥ SAA GTA CTS ATA. «AT JU« MA ATA SAS <3m TAT SCT AAA AST 3M 61« vai Qlu V*1 Leu ZX* A®g> Lys Lys ile «lu «1« Tyx Ais hys âex 115 120 13.5 ·,· aaa ©ar çnt «ca ©a© m cas ôqt ctt caa aat aat ttc e» gat m® 433

Lys Ala Leu Ala 01© Leu ®lh ©ly Léu «In Aen Mn Fhe ©lu Amp Tyr 130 135 140 S1T AAT ©Õl Tm &M TCC TS3 AAG &ΆΆ ACA CCT TTA A3T ΤΪ© €GA MST 4 50 ©Ai A8« Ais Leu &sjj ser Trp Lys Lys Thr Pre Leu Ser Leu Mg Ser

145 ISO 155 ISO aaa a©a aoc cm «αχ 08A Am. a«« sm ctt rrr tct cm «ca cm ast síns

Lys Arg Ser ©In m& A*g lie Mg «iu te« f.Uu Sus «X» AX» «Xu $e*· U$ 1?8 17 5 CAT TTT CCT AAT 'TCC ATS CC« TCA TTT «CA CTT TCC AM TTC CM ©T© 574

Hls Fhê Arf asjr ser Mec Fro Ser P&e Ala Vai Ser Lya The GXu Vai X.S» 185 ISO CTO TfT ÇTA CCA A.CA TAT ©CA CAA GCT OCA AAT ACA CAT TTA TTC CTA ©24

Leu Fhe Lee Fr© %τ Tyr AX* «la Ala. Ala Asn Thr Si® Leu Leu Leu 155 200 205 tm AM ©AT OCT CAA CTT Tft ©GA OAA OAA TQQ OSA TAT TCf TCA «AÃ 672

Leu Ly* Asp Ala ©In Vai Mia ©ly «1» ©io T?p ©Xy Tyar Ser fax ©l» 210 2íã 23© «AT orr ©cr ©aa ttt tat cat asa cm tta aaa ctt aça cm. cm tac ?2o. Λβρ Vei Ala slu Ph® Ty* Hi® A*g «la Leu Lye Leu «ar «la sia Tyr 225 33© 233 24© ACT OAC CAT Wf «TT MT T«« TA® AAT «TT SSA TTA MT «ST TTA AM 355 fc nsp Mis Cys vai Ά»η Ttp Tyr Am vol «Ty í« .Aaa «ly Leu Arg MS 2SS 255 «ST TCA ACT TAT «AT «CA TOO «TC AAA TTT AAC CST TTT Ç«C ASA <3AA êi€

Qly sor Tísr Tyr *S|? Ala rtp vai Ly» Phe Aaeg Fhs Arg Arg Glu 20© 2«5 27© ATS ACT TTA ACT CTA TTA «AT CTA ATT «TA CT? TTC CCA 5TT YAT «AT 8C4

Met Thr Leu Thr Vai Leu Asp Leu Sle Vai Leu Phe Pro She Tyr A®p 275 280 285 ATT CGÔ TtA TAC TCA MA. «TT AM. ACA SM «A ACA A«A «AC ATT 812 ll® Arg Leu. T>*r Sá» Lye «iy Vai i,??s Thr Ql« Leu Thr Arg Aãp Xie 290 2S5 3©0 TTT AOS «AT CCA. ATT TTT ATC CTC MT AC© CTA CA© GA8 TAC SOS ÇCA 850

TAe Thr Asp Fr» lie Phs lie Luu Aas. Thr Leu Ola ©iu Tyr «iy ptQ ΡΕ1040192 398

ϊδδ n© âis 320 ACT 1W TTO ACT ΑΤΛ SM M€ TCT ATT OSSA MA CCT CAT ΤΤΑ TTT OAT Tlii' Jttue Ser 11« <31 u Aso Ser xle Aty byu P$t> sis x«eu £Sse Asp 32.S 330 335 fW ΤΓΑ CAS Q0« ATT SM TTT CAT AC® CCT CTT CAA CCT «GT TAC TTT .usos

iOSS

Tysr fce» d» Gly He Gla Fhe ilis MOcc® aaa sat tct rre mt mv tos ©ly 3jys# Asp Ser S*hè As» Tyr Tip 355 3S0 CCT ACT ATA ©SA TCT A-ST AAS ACA ®»f«3 Sei: Ile sly Ser Ser S»y» thx 370 37S ΑΆΑ TCT A.CT G&& CCT 6» CAA AAG &<ys Ser TM ©i» fr*? VeJ. Si·» 30y« 385 3 90 ΤΆΤ CQft ACT Am CCT aat aca gac Tyr Argr Tte Xle Ala As» Thx Jtep 40S GTA T&T TTA ©ST CTT AC® AAA GTT ml tyr A«« Cly Vai Tlwr l*y» Vai 420 ASA ART CsAA ACT AQT ACA CAA ACA Ay» A»» Cl» Bir Ser thr Ci». tfer 4 35 44« cat em act <sca em θάψ tct att h-í » uai Sjer aíít Çlw: Ακρ Ser He 450 4ãS ©AT CAA ©CA. CTT <3AA AM GCA TAT Asp Glu Pr» Lsau Clsi Ay» Ala Tyr 455 470 tot rrs toa ato cag gac cgt cot Cys PÁ® Leu Hst ©Ixi Rgp &rg AXg 485 ACA, CAT ACA ACT <3TA GA© TTT TTT Thr Mis Arg Ser Vai Âep Mi® sh» S&Ôact c&a ctt cm cm c,m .áaa ®ca T&r Oin Leu Pre Vai Vai tys Ai a 5XS 53» ATT ATT CAA COT OCA ®S& TTC A.CA He He ci» fiiy o*» «siy pm tm

Thr Jtícq Leu Sl» Px» Oly Tyr Fhe 3«S 350 TCT GGT MT TAT ©TA ÇAA ACT AGA Ser sly as» Tyr VAÍ <3l» TAt Arg 3S5 ATT ACT tCC CCA TTT TAT âSA ÔAT He Tht Ser .P.W» Ftoe Tyr Qly Asp 3S0 CTA ASC TTT SAT GSA CAA AAA CTT J#ett S«x' l?he Asp <Jly Glíi Ays: Vai 395 40® GTA OCO CCT tee CCO MT CCT AM Vai Ala Ala Trp í>rsj Asn ©ly Cys 4 3. Q 415 GAT TTT AGT ÇAA TAT ©AT OAT CM ÂM& Ph* ser ela Tyr Asp Asp ein 428 439 TAT GAT TOA AA& ACA AÂC ÂÃÍ ©SC Tyfr Asp sar Lya Arg A«» As» çly 44 5 SAC CAA TT& CCG CCA CAA ACA ACA assp alrs Tjmt pr^> Ci» Tbr TÁT 4S© ACT CAT CA® CTT MT TAC OCG GAA Sar Hís ©la Aeu Mn Tyr Ala Gl» 478 4SC CCA ACA ATT CCA TTT TTT ACT TSQ Cly TM' 11« fe» Plust Th® Tfar Trp 4:30 4 §5 MT ACA ATT OfeT CCT CAA AAC ATT as» Thr He &ep Ais Clw. í.*ys Xl® SOS 5X0 TAT SCO TTS TCT TCA CGT CCT TCC Tyr Ais Aau Sar Sar ®iy Ala Ser sas GGA SGR AAT TT& CTA TTC CTA AAA Qly Cly Asa 1*0« The Hs» tiys Π04 1152 3 200 1248 120« 1.344 1392 1440 1488 153« X.ãÈ4 i$3â ΡΕ1040192 399 S30- 535 5¾¾ CR». TCT AGT AAT TCÂ »« CCT AS» Kt AAA &Tf hCk Tf A AAT TÇR QÇA siú ser sás- Asii Bèr ile Ma ly® *%s tes vai ar teu hm fer .Ma $«â 55Ô SSS MO ÔCC TfS TTA CR» os» W COT GTA aga ATA oec TXT OGT TCT ACC AGT Ala Leu teu Si» Ar© fyr Ar© vat Ar© Ile Ar© Tyr Alã 8** Th* Thr §65 S70 575 SAC TTA CSÁ OTF TTT GTG CA» AAT TC» AAC ΑΛΤ 0»T TTT ©ΤΓ GTE ATC Asm teu Argr I>eu Pfeè fel. Cl A AÉ» Ser AS6 Asti Asp 1¾½ teU VAI Ilè 580 585 550 T&C ATT AAT ARA ACT ATS A»T »R» SAT SAT ORT TTA ACA TAT CA» ACA Tyr lie Asn Ayã T&T «6E ASA J»yS Asp Mp AS|> teU Ite Tyr #1» f*i.V 595 SOO 505 TTT SRT CTC ©CR ACT ACT AAT TCT ΑΛΤ ATS &®3 TTC TOS CGT QAT ARG j»he Asp teu Ma Tfcr Tkr »«a ser Asa Met ssly ¥tw» ser cly As^ Lys 61« SIS S20 AAT CA» CTT ΑΤΑ ΑΤΑ ©SA OCA OAA TÇT TTC GTf TCT AAT CA» ARA AfC ASO ola te& íle Oiy Ala ela Ser fee vai ser As» ®lu l>ys lia 625 «30 «35 640 TAT ATA GAT AAG ATA OAA TTT ATC OCR CTA CA» TTC TA& Tyr II* Atf& fcy« 11# Olu lie ©re Vai Cia teia 645 SSÕ 1680 172« 1.7?« 1024 i»?2 1520 1555 (2) INFORMAÇÃO PARA SEQ ID NO:32: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:32: 1 ASTl Pro .A0ti Asa S Arg Ser ela Si 3 &«J3 10 Thr Ile i-ys Vai T&r 15 Pre Ser d ϋ teu 28 <3I» TAr Asa HlsS Asa 3S Gin Tyr Pre .teu Ale: SÓ ASp AS» Pro Asn Ser 55 Thr teu Slu Cia tea 40 ASíi Tyr Ly« Olu fee 45 teu Arg Mst Thr ©Xu Asp 50 Ser Ser fkr &i» S5 Vftl teu tep Asa Ser 60 Thr fel A»í> Ak S5 Va.l Giy Thr S31.Y Me 70 Ser Vai vai fè-k.y' Gl:n 75· lie teu ®iy Vai Vai 30 ΡΕ1040192 400

Sly Vai Fr© Phe ma Gly Ala Le» 8$ T&r &ar Ffea Tyr Gla Ser Fhe Leu SO 55

Aso . Thr lia Trp xoo Fro Asp Ala Gl» vai «lu 115 vai Leu ile Asp Ly« 120 Lys Ala 130 Lsu Ala 61» LSU 61« 6!y 138 Val 3.4 S Mu M a Leu As» ser ISO Trp Lys Lys Arg Set: 61» ASp 188 Arg 11« Arg ais ?hír Arg As.fi iâõ Ser msk Pr© Ser :?:..·«« Fh« Leu 1J5 Pro Thr Tyr Ala <31« 300 Leu Lys 210 hap Ala Qln val Phs Gly 215 Aíjp Vai. 225 .Ala Slu Pha Tyr 230 i8ia Arg Thr Asp His Cys Val 245 As» Trp Tyr Sly Ser Thr xyr 260 Aap Ala Trp val Msfc Thr iíSSJi 275 Thr Vai Leu A&p Le u 288 XX© Arg 280 Leu Tyr Oc.r Ly» oiy vai 29S Fite 305 Thr Asp Pr» n© Phfâ 310 11« Leu Thr Ffee L-èu SOS? Ue 325 01 \i. Âsn Ser Tyr Leu 61a Cã y .340 Xle 61«. V.h« Eia eiy Lys Xhsp 3SS 5ar Plie &s« Tyr txp 3 m

Asjp Pro Trp Lys Ala *54t Ma 1QS 3.3.0

Ly» 11« <Slu <*lu xyr Ala Lye Ser

Leu 61» As» As» FA« 61» Aáp Tyjr 140

Lya Tfcr l«u ser Leu Ar$ ser 155 .160 61.» La.» Pite Ser Gin Ala Gl» a$sr 170 175

Fhe Ala Val Ser l*ya Fh« ala vai 105 svo

Ala Ala Aan Tlsr Ei® -Ls» S»bu Leu 20 3 ala «1» T*p 6ly Tyr Se* Ser 61» mo

Gla teu Lys Leu Tte 61» SI» Tyr 235 24S

Asm Val Gly Leu As« Giy Leu Arg

350 2SS

Lys Ffte Aura Mg Pfc« Arg Arg 61» 265 ' 270

Ile val i«» Fh« Fro Fhe Tyr A»j* 265 &ye xhr 61« 1·«» Thr Mg A*f Xla 500

As». TAr Leu Sis SIu Tyr Sly Pr© 315 120

Ué Arg Lys Aro His L«u Fhe Asp 330 33S «hr Arg Leu Gin Pr» «Xy Tyr P&e 345 350

Ser Gly As« gyjr Val 61» Tbr Arg 365

Fr» Ser 1.1« sly Ser S*r Lys Thr Sle Thr Ser Fr» Phs Tyr «ly Âsp 370 275 386 401 ΡΕ1040192

Lys Ser Tbr $1« Pro Vai 01» bys, 1*6« Ser Fbe ftsp Gly <31« Lys Vai 3âS ISO 3SS 4 Só

Tyr Arg Th:r lie Ala A*ft Tte Assp V»i Ala Ala Trp Fr© Asa 01y Ly»

405 410 41S

VfsX. Tyr Le» sly vai Tbr Ly« vai A»p Ph« s«r 01« yyr Asp Asp oi» 420 42S 430 i*ye A&sa <Siu Tlsr s«r *?hr 01» U»r Tyr AMp Ser Lya Asa Aen Gly OS 440 44 5

Hi® vai ser Ala. ©1« Aap ««r xis Asp 01» L&u Pr« Pr© ¢31¾ ^fer Tb* 450 455 450

Asp Qlu Pr© Leu 0l« Lya Ala Tyr Ser Eis 01» Leu Ama. Tyr Ala sita 46 S 470 475 4S© cy» Pb& L®-tt Met SifS tep Arg Arg Gly Tkr Il« Ríó Ph« Fh« fAr Trp 455 490 4t5

Thr 81$ &rg vai Άβρ Phe Fhe A®n Hwf 22« A®p Ala. siu Lys 11« SOO 505 510 *f*hr Siu Leu Paro- Vai Vai Lya Ala Tyr Ala Leu Ser Ser 0ly Ala Ses 515 520 525

Ilô lie 01» sly Pr© 01y Pke *&r ely Gly Aaa Leu Leu Ft*e Leu Lye 530 535 540 01» Ser Ser As» Ser 11« Ala Ly» Fbes Ly» Vai Thr ,L«u As» Ser Ãia 54 5 550 SSS 560

Ala Leu Leu 02«. *rg Tyr Ar«j vai Arg fie Aspgr Tyr Ala ser Tkr Thr SSS 570 57.5 A«n Leu &rg Leu Pke Vai 02» A»» Ser As» Asa Asp F9se Leu Vai lie 580 S8S 550

Tyr lie As» Lys fítr Me* Asa tys &sp Aap Asj» Leu Th.r *gyx 02» Tbr 5S5 600 505

Fhe asp Leu Ala T&r thr A®» Ser As» Ket Sly Fh« Ser 0iy Asp Ly» «20 SIS £20

Asa 02« Leu II» Xl« Gly Ala Glu Ser Fbe VAl ser As» qlu Ly» lie £25 «30 635 S40 lyr xle Asp Ly» f ie Glu Phss Ile Pro Vai 01« Leu 645 6.5 Õ (2) INFORMAÇÃO PARA SEQ ID NO:33: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases ΡΕ1040192 402 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:33: ATS AM* OCA AftO AAT OSA AST ©&& C&T ©AT ACÇ ATA AA© «TT ACA CCT fefc Aba firo Ase .ftgn Arg «*r GlU Mis Aáp Tfar Xlé Lys Vâl T&r F*» l B líí 3.5 MS AST GM TTG CM ACT AAC «AT AAT CA& TÃT OCT TT& ©Cf Mf Mn ser Glu Mu Glrs Thr Asn sis. Mn Gin Tyr Frss hmt Ala Sap Mn 20 gs 30 CCA AAT TCA ACA CTâ SM GAA Tf A MT TAT AAA G&A TTT TTA ASA ATS ϊη> as» Ser Thr Lsu Glu Glu Lsti as» Tyr 5>ye slu piae teu A*g Wter 35 40 45 ACT GAA QSC AGT TCT AC© GAA ©TS CTA GSC AAÇ TCT AÇA βΕΑ AAA «AT TM «1« Asp Ser Ser Tkr «1« vai Le» Asp Aen ser Tfer vai hys Asp .so ss m GOA GTT GGS ACA G6& ATT TCT GTT STÃ GO© C&G ATT TTA G3T Θ-ΤΤ «TA. Alá VAl Gly TM Gly lis Ser vai vai Gly Gin lie .Leu ©iy vai Vai S5 70 7$ S8 @©& ctt cm t*x ©cr «g« «ca ctc ao? tca rer tat caa tca ttt ctt ©ly vai Pr» Pb© Ala ©ly Ala teu Thr Ser Fhe Tyr ©1» Ser SM Leis iS 30 35 AAC ACT ATA TGG OCA AGT «AT «CT GAC CCA fÚO MG ÚCS TfT ATS ©CA Asn Xbr Xis Trp Pro Ser Asp Ala Aap Pro Trp Ay» Ala ph* ttet Alá :u«f TOS MO CAA GTT MS GTA CTO ATA GAT AAG AAA ATA GA© G&G TAT ©CT MA AQT «In Vai ©iu vsl Leu Xle Aep ly» hys fie Glu ©1« Tyr Ala Lys Ser li5 120 125 AAA ©CT CTT «CA «A© TTA CA® G3T CTT CAA AAT AAT TdC GAA GAT TM V/n Ma. Lev Ala Gl» L®« Gin Gly Léa Gla ash As© Pfee 61» Mp fyr 13 0 135 .140 ÇTT MT «CG TTA MT TCC TC« AA« AM ACA CCT TTA AGT Tm EGA ACT Vai Asn Ale Leu Am Ser Trp Lys l»ya Thr Psro Mu Ser teu Axg Ser 145 1SÔ 1S5 ISO AAA mh AGC CAA ©AT CGA ATS AS« GAA CTT TTT TCT CAA CCS ®&A AGT I.y& Arg Ser ©1» Asp Arg lis A«g Qlu £«u P9» Ser Gls Ala slu Ser 1SS 170 175 48 144 132 240

2BB 3S4 432 480 saa ΡΕ1040192 403 ca? ttt os? Mf tcc xm oos tca ttt sca gtt tcc aaa ttc gaa qtg Kía Fh« Arg Aa» 5e* «εκ pz© sar Fhe Ala vai ser Ay» Phs GXu vai I3S 185 ISO CTQ: TTT CTA CCA AC& TAT SCA CAA <3CT SCA AAT A£A CAT TTA TTQ CTM Lsu ph« Leu 3¾¾ Thr Tyr Ai* Gin Ala Ala Aess Tbt His Leu Leu L*u .SOS 205 TTA AAA 6AT «CT CAA «Tf TTT SOA ®AA OftA TGS SOA T&t TCINTCA «AA lsíí &y© tep Ala «Xft Vai Rh© Sly Gla Slu Vrp SXy Tyr Ser Ser «1« 31« .2X5 230 BAT GTT SCT 8AA TTT TAV CAT ASA CAA TTA AAA CT? ACA CAA CAA T&C A«p Vai Ala SXu Phe Tyr His Arg Sln Leu Lys t*u Tfcr <31i» Slii Tyr SIS 21« 2:¾¾ 348 a.ct m.c cat τατ err aat τββ tat aat gtt sca ttà aat ser rm aga Tfer Asp ííis çy® vai Asn Txp Tyr Asa vai Oly l*u Asa ely Lau sxg 24â 3M> 25t> SOT TCA ftCT ΐ%Τ «AT SCA T0S GTC AAA TTT AAC OST TTT CSC ASA ÕAA Sly Ser Tfcr Tyr Asp Ala Vrp Vai hy» Fh* As» Arg Fha Arg ftrg olu 260 245 370 ATS ftCT TTA ACT ©TA TTA GAT CTA ATT «TA CTT TTC CCA TTT TAT SAT M«& Tb* Leu Tb* V*1 L&u Asp jau Ile Vil Leu she Rtss íte Tyr Asp 275 290 385 ATT CGS TTÂ T&C TCA AAA «CK3 GTT AAA ACA «AA «TA ACA ASA SAC ATT He Arg Tyr Ser Lys Qly Vai Lys Thr Glu Leu Thr Arg Asp il« 350 285 ΧΘ» TTT ACO GA? CCA ATT TTT ATC CTA CAT ACG CTS CAQ «AS TAC SGA CCA Ph® Thr Asp Pr® 11© VÍ» Ile Leu His Tb* !Leu SXa <&u Ty* Siy Rro 3S5 31S 31S 338 ACT TTT TTG AGT ATA QAA AAC TCT ATT CGA AAA CCT CAT TTA TTT G/1T Th* Pfee L®u Sft* Ile SIu Asa Ser Ha jR*g Lys Pr® Mis :Leu Stoe Asp 3ã§ 338 22S TAT TTA CAS SGO ATT <3AA 'TTT CAT ACS CGT CTT CAA CCT SOT TAC TTT Tyr lsu Qlo GXy XI» 61u Ph« His Thr Arg Lau SX» Pro 6Xy Tyr Phe $4d 345 350 C®3 AAA CAT TCT TTC AAT TAT TOS TCT SGT AAT TST STA SAA ACT AGA Sly Lys Msp Set 8ha Asa Tyr Trp Ser Ciy Aee Tyr Vai Glu Thr Arg 354 550 555 CCT AGT ATA CGA TCT ACT ÃÃQ ACA ATT ACT TCC fiCÂ TTT TAT GGA ÔAT Fra smr II© Sly Ser Ser Lys Thr 11« Thr Ser Fr» &b« Tyr Gly &©p 3TO 37S 380 AAA TCT ACT OEAA CCT ÔTA CAÃ AAÇ CTA AfíC TTT «AT OEA CAA AAA «TT Lys Ser Thr sl.u Pro vai cie Lys Leu S*r Pb® Asp Qly Gin Lys Vai 385 3» ms s?s Ô24 678 720 7S8 816 864 812 1008

10SS 1104 1152 1300 404 ΡΕ1040192

TftT CCíA AC! ATA SC? AAT ACA ©AC GTA «CG QCT TOO CCS AAT GG7 Aft© 174«

Tyr &x%j Tfcr IM Ala Asn Th» *ep Vai Ala Ala Trp 5ro As» «ly lys 4 as 410 «SIS·

GXA TAT TS& SQT <STT AC© AAA SH «A? TTT W3T CAA SAT ©AT ©M* CAA 12M uai Tyr Lmi sly vai T&r ϊ>γ» v»i Aap Phe Ser ©I» Tyr Afip Asp ©1». 420 *M «3« ΑΛΑ AAT ®AA ACT A©? ACA CAA ACA TAT SAT TCA AAA MÍA AA&. AA? CSC 13 «4

Lys Aaa. Giv Thr ssr Thr ©1» Thr Tyr $mp Ser Lys Azg Aen Asa <3ly 43S 440 445 CAt OTA AS? GCA CA® ®AT TCT ATT ©AC CAA TTA COO CCS SAA ACA ACA 1332

Sis vai. Ser Ala ©ia Asp S«.r Xla Aap si» Leu Pre »ro 01« f&r TAr 450 4SS 409 βΑΤ βΑλ ΟϋΑ ΏΤ ®m .AAA ©CA TAT AST CAT CA© CTT AAT SC ©C© O&A 1440

Asp ©1«. F.txs Leu ©la Ly* Ala Tyr Ser Hia Gin Leu Ass Tyr Ais «ia· 445 470 4?S 480 TOT TTC m ATO CA® ©AC CGT 03? ©3A ACA AT? OCA TTT TTT AC? TOS 1404

Cy» *1» L*u Síet Sl» Aap A«© A*© Sly Thr il« ore *4*e She ftr v*p 44$ 4*S0 435 ACA CAT ASA AGT ÔTA ©AC TTT TTT AAT ACA ATT ®? ©CT OAA. AAG ATT 153« tSsr Kio Arg $** vei Asp oh» Ofee Asa Tfey lie aap Ala ela Lye lie S00 SOS 010 ACT CAA CTT CCA STA 8TG AAA OCA TAT OCC CTÕ TCT tCA GGT ©CT TCC 1584

Ths ©la Le« RJKJ. %sl S'ei Τ»γ« Ais Tyr Stis »-*« S«r &*r «iy Ala Se*r sis S30 sas att att ca* <ser cca «g& ttc aca soa gga sat tta cm ttc cm aaa i«3a lie lie Giy Oiy Pso·. Oly SA* Tlw <Sly ®ly A*» ma iam FAe L«« Lye SlO SOS 548

CAA TCT AffiP AAT TCA AfT CCT AAA ΤΤΪ ÃÀA GT? ACA m AAT TCA GCA ISSO

Glu sss' Ser Asn Ser li® Ala X<ys Fhe Lys Vai Ttir JLeu Asn Ser Al»

S45 ««O SSS SSO

QKSC TTS tth CAA CEA TAT CQT Cf A ASA ATA CSC TAT SC? TCT ACC AC? S.7TS

Ale mu Seu ©1« Arg Tys teg? Vel Arg lie Arg Tyr Ma Ser Thr T&ar SSS $70 575 SAC TTA C6A CXT TTT QTS CAA AAT TCA AAC AA? ORT TCT C*T «?C ATC 1.77S'

Asa Le« Arg C«u she Vel ®ln Asa Ser Asa Asa A»|> She Seu Vai fie SSO S8S 55« TAC ATT AftT AAA ACT ATS AAT AAA CAT m? «AT TTA ACA TA? CAA ACA 1824

Tyr Uê Asa Ay* Th» mt. Asa Lys Asp Asp »sp Leu mr Tyr oia Thr SS5 «00 6« 5 TTT SAT CTC ©CA ACT ACT AAT TCT AAT ATS SOS T35C SOS «GT GA? AA© 1872

Ph* Asp Leu Ala Thr iSar Asn Ser Asa κβε 6iy 8hs ser «ly tesp hys 405 ΡΕ1040192 1:930

19SS

ÃAt GAA Cft ATA ATA OCA SÁA fCf tf a ÚTT TCT aat SAA »AA AtC

Mn 01« Lsu ll® 11« ®ly Ala 01« Ser Ifce Vai Ser Aen alv hys li® S25 S3S £35 040 tAt ata gat a&g ata oaa ttt atc a» gk caa ttb taa

Tyr 11« Asp L.y» XXe ©iw Ah® .11® Vrs Vai Sln &m*

g4S 6SS (2) INFORMAÇÃO PARA SEQ ID NO:34: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:34:

Hst Asa Are asm mn Mg Ser SIu Mia Aap Thr lis tys Vai thx «*© 1 5 10 15

As?s Ser (au kn oln Tkr mn. Mim asa ©1». ©yr hum Ala imp A**k 30 25 30 feo ãêís. Ser T.hs? tam ©lu ©iu Leu Asm Tyr Lys ©1» ah* Leu Arg Msfc. 35 48 4$

Tta <3lu Aap :S®r ser Thr siu vai Leu mp Asn Ser Thr vai Ly» Άβρ 50 SS S'0

Ala Vai ©ly Tta ©J.y SXe Ser v»i Vai ©iy ¢514¾ χι« my Vai Vai

SS 70 75 SQ ©ly V41 Fr» Ahe Alá ©ly Alá Leu Tln &«£ oíh* Ty*· çl*s Mar JMMt &eu sâ sa os

Asm Hhr íle ¥rp Pro Ser Asp> Ma Asp 9xx> Ttp l>ya Ala Fhe Mste Ala .100 10S 110 ©I» Vai O!» Vai Leu 11® Asp Ly» Lys lie ©iu. ©lu Tyr Ala Ly» Ser 11S 128 Ol

Lys Ale L-su Ala ©1« Leu ©In ©ly 1®«· Cin aau -Ααϊ* Ohe ©le Aep Tyr 130 05 140 val Asm Ala Leu A*tt Ser Trp &y* l*y« Tlsr Fr® Léu Ser Leu Arg Ser

14S ISO 1SS ISO

Lys Axg Ser ©Irs Asp Arg lie Arg ©1« Leu t%é &er ©In Alá elu ser

iSS 170 X?S

Mia Ph® Arg· &sn ser HeS Oro Ssr Phe Ai*. VàJ, Ser Ly» PA® ©lu vai ISO OS ISO ΡΕ1040192 406

Leu EhV he» Prt* Tte Tyr Ala 81*1 hem ky® &9& Ala &1.p Vai Pbe Sly 2.3.0 22^ Asp vai Ala Qiu Ahe tyr Ris Arg 22 & 230 Thr Asp Eis Cys Vai Mn Tsp Tyr 24S Sly g®r Thr Tyr &*p Alá Trp Va.l Kefc f&r líã-u Thr· Vai heu Asp lasa 275 280 lie Arg h«u Tyr Sar I*y® 81 y Vai 29Õ 2SS Ph* Vfct Asp Pífô li® »h« lis i»e« 305 320 Thr i?he lUm 8er lie $1υ Asn Ber 325 Tyr heu Olá SXy XI« ¢31¾ Ph© Hi© MO 8:ly Lya hap S«r Kis Asa Tyr Tsp 350 300 Papo Ser lie 8Xy Ser Stmt £>ya Thr 170 375 hys Ser Thr eiu. Pr© Vai ei» hys 3®0 3 90 Tyr A*g' Thr XX« Ala AS» Thr Asp-•105 Vai Tyr &e«. Gly Vai Thr Ays Vai 420 Lys As» ala Thr Bar Thr eln Thr 430 440 Eis Vál Ser Ala ei» Asp Ser lia 450 455 Asp 81» Fr» Le» eiv. í*ys Ala Tyr 460 470 Cys The h®» Hat. <3ln Asp Arg Arg 485

Ala Ala Asn Thr His Aau l»e\* &eu 205 élu élw Trp eiy Tyr Bar Ser ela 220

Si» ieu fcys Xam Thr e.l» $1» Tyr 235 340 &é« Vai $ly &eu Aen Siyv, &eu Arg 250 200

Lya Vha Aan Arg Sfeo ,A*g Ârg ei» 3*5 270 11» Vai Lssh 8-fee Orõ Ehã Tyr As» 285

Ays Thr ei» kãti Thr Atg Asp Tlô 300

His Thr heai sin olv Tyr GXy P*& 315 330 lia Arg hym Mr© Mis teu Pise Asp 33* 335

Thr Arg X.a» <sln Mro 81 y Tyr Phe 34 s 300

Ser 81y Asa Tyr Vai <$Lu Thr Arg 385 lie Thr gar Er o Ffea Tyr eiy Asp 380

Leu Ser vhe Asp/Gly ein Mys vai 385 400

Va| Ala. Ala Trp Fr» As» 8Xy Lye 410 410 A*p Pfae Ser $1» Tyr Aep Asp SX» 420 430

Tyr A«p ser hys Arg Asn Asa Siy 445 ASp ala lasu Ero Era Olu Thr Thr 46Õ

Ser His si» ie» As» Ίγε »1« βΐ» 475 48S

Qly Thr ile Pro vhs Pfea T&r Trp 4f0 455 407 ΡΕ1040192

Tfrr Si® Arg Vai Asp 3?h® Ph® SOS

Thr Gin teu Prp Vai Vai Lys Ala 515 “ 520 xl«s Tis Glu Oly .ÍTo «ly £he Th* 530 .S.â.s 6iu S«r Ser Ãsre 6®r 11® Ais Lya 545 $50

Ala teu teu Glii. Axg Tyr Ârg Vai S#S &sn Lísu Argí teu. ftí vai GIís Asa 5S0 <$γϊ 11® Asm lyís Sis* Mefc A®n Lys 5SS te d £&e Αβρ· te« Ala thr líhff Asn ser 510 61.5·

Asn ®ia teu xl® Jle <»ly Al« Glu S3:5 são

Tyr llm Assp Lys Xl« Glu tee Ile £4:5

Asa Thr II® tep Ala ©1« Lys 11« 5QS 510 tyr Ala teu ter teriGly Al« $mx 525

Gly Gly Asss. teu Leu Ph® teu fcy» S4 0

Ph® I»yA VAl TSir teit teB Ser Alá 555 SOO

Arg ite Arg Tyr Alá s«r Thr Thr S?0 575

Ser &sn Asa. Asp Ph® teu Vai lia SâS 550

Asp Asp Asp Leu Thr Tyr <81*5 54ir 505 A®n Môt Sly Phfi Ser sly Asp Lys §30

Ser pbs Vai ter Aas <5lu i»ye 11« £35 éi6

Pro Vai âla Leu 050 (2) INFORMAÇÃO PARA SEQ ID NO:35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:35:

ΑΧβ AAX CCA .AAC AAT COA AflfP GAA CAY SAT AC® ATA AA® <3TT ACA CCT «S M8& Am P*'<? Asei Aen Aes s«r slu Mi® Ãsj> VHr ϊΐ« Lys Vai Tlsr prs

1 5 10 IS AAC ACRf «AA MS C&& ACT AAC CAT AAT CAA TAT CCT *TA «C* «AC AASP 9®

Am Ser elu Leu €fl» Tbir Asa Kis Asa «In Tjnr ®ro teu Ala Asp Am

30 aO 408 ΡΕ1040192 CCA ;VvT TCA ACA C?A QAA SM· TT& Μι W MA 0ΑΛ TTT TO AGA ATS IA 4

Pm Asa sar Th:r Lau Slu CTtu Leu ».sn Tyr Lys CLu £h® Leu Arg Sfest as 40 4$ ACT QAA «AC A®T TCT ACG «AA STS C» 6AC MC TCT ACft ®£ft AM mT 132

Thr 61« A»p â«s- Ser Tfrr CIu v*l Leu Asm As» Sosr ttse Vai Lys Asp sa ss so «CA. 0TT €68 ACA «0Α ΚΓΤ TCT 0TT «S» SGS CA3 ATT TtA 66T 0TT 0ΪΛ 246

Ala Vai «ly ffer Qly ΪΧ® Ser Vai V»1 «iy ©1» XXe Leu Gly- Vsl Vai és W 75 ea «3A OTV CCA TTT GCT 000 «CA CTC ACT TC» ΤΓΤ TAT CAA TCS ΤΓΤ CTT 3#6 ©iy Vai 9ro Hw »1« sly Ala la» Thx fe? H*« Tyr ©ia Sor F&® L«u 35 90 55

AAC ACT ATA TG© ©CA AST «AT «CT «AC OCA T00 AA© ©CT «ΤΤ AT8 «CA 3.3 S

Asm Tfer Xla Tsp ®ro &®r Aap Ala Asp pro Txp Lys Ala ste» s«t Ala 100 105 1U5 ® «rr oaa «m çtg ata «at aa« ma ata «a© 6*6 tât ©ct aaa mst s#4

Si» Vai 03.14 Vai L-eii 2.1® Asp Lys Lyg TI® ©iu Slu Tyr Ala Lys s&r 115 120 12$ &&& «CT CTT ©CA ©Afô TT& CA€ 6©T CTT CM AAX MT TT£ SM «AT TAT 432

Lys Ala Lá» Má «1«. Leu ©1» Qly Leu Cl» Asa Asm St*· 61» A*jp Tyz 130 135 140 CTT MT 008 TTA AAT TOC TGG MS Am ACA CCT TTA A6T TX0 06» AST 4«8

Vai Asa Ala Leu Asm. Ser Trp Lys Lys Tb* Sr» Ls» S-er Lsu Arg Sar X4S iSQ 1SS ISO AAA A6A ASC CAA fflfif C6A ATA A0Ô 0AA ÇTT TTT TCT C.AA ©CA «AA A0T S38

Lys Ar§ sar ol» Assp Asm: Xl« Asm ©iu L«a Hw ser ei» Ala siu sav 1SS ‘ 170 17$ CAT TTT C0T AAT TCÇ ATS ÇC6 TÇA. TTT ©CA CTT TCC MA TTC QAh «Ϊ6 ST4

Hi» EAê Asm Asa ser !*eo f»ro ser Fiw Ala Vai ser Lys sbe Glv vai i»« tm im cr© ttt cm cca ac& tat sca caa gct sca aat aca cat Tm tds cm «24

Leu Thá Leu Hpo Thr T^r Ma 6ln Ala Ala As^t «ar Sis Le» Le» La» 155 ase aos m aaa oat <ser caa gtt ttt «ga. gaa oaa tos ssa tat tct tca «a& 072

La» Lys Asp Ala 6l» Vai Pfea «Xy 01» €1« Tsp «ly Tyr Ser s«» «lu 210 315 330 «AT 8TT «CT «AA TTT- TAT CAT 3Mth CAA Tth AAA CTT ACA CAA CM TA€ 226

A®p Vai Ala «lu She Tyr His Arg «1.» Leu Lys La» TAx 01» ©1» Tyr 22$ 230 MQ ACT SAC CAT T@T STT AAT TQ8 TAT AAT «ΓΤ 00A TEft ΑΆΤ GGT TTA ASA T08 «fer AM9 «is Cys Vai As:a Trp Tyr Ãsíí vai «ly 1-s» As» Siy Ls» Arg

24S 2§S 2SS 409 ΡΕ1040192 ββτ tca aer as «at oca tgss otc aaa ttt a&c cm m esc wa saa ei«

Sly Ser Thr Tyr Asp Ais Trp Vai L,ys Phe As-a Arg· phe Arg Arg Slu 360 26¾ 270 ATS ACT TTA ACT <3TA Tm «AT CTA ATT GTA CTT TTC CCA TTT TftT OAT 064 «fet Tfer baú Thr Vai :b*u Asp bee Tle Vai i*v Pha F:ro pbe Tyr Asp 2:73 230 3β9 ATT 0©S TTA TAC TCA AAA SOS GTT AAA ACA SAA CTA ACA AGA «AC ATT M2

Ila Arg Lasi Tyr g«r í>y# «ly Vai l»y® Tfer G.Isí 1»®« Thr Arg Asp Ile 390 239 300 TTT AC® «AT CCA ATT TTT TCC CTC GTT AAC CTA ATS OTG TAC GOA OCA 960

Fh® Thr Asp Pr» Ile Pb© S«* Una Vai As» !au «et vai Ty* 01 y Pr® jos 310 ;US 320 ACT TXT TTC «JT ΑΤΆ 0AA AAC TST ATT OSA AAA CCT C&T TTA TTT «AT 1008

Ths Bhe teu ser ile Glu Asa. Ser ll# Arg Lys Pp© Sis &«u Ph© A»p 32 S 130 339 TAT TTA CAS SGG ATT GA& TTT CAT ACS CGT CTT CAA CGT QGT TAC TTT 1056

Tyr Um. «la «ly 11« <3iu pfee «ia Thr ftrg Leu eia »*a <*ly Tyr Ph« 340 349 390 GSS AAA «AT TCT TTC AAT TAT TO» TCT «ST AAT TAT «TA GAA ACT ASA 1104

Sly í*y« Aep ger Ptoa Asa Tyr Txp Ser «iy Asn Tyr Vai. Slu Thr A*Sf 355 3SO 365 CCT AST ATA <3Gft TCT ÃST AAG ACA ATT ACT TCÇ CCA TTT TAT SSA GftT 1252

Pro S«r li* ely s«* S«r í/ya Thr 11« Thr Ser Pp© PS» Tyr Sly Ãep 370 370 380 AAA TCT AC* SAA CCT «TA CÃA AAG CTA AGC TTT SA.T GGA CAA AAA STT 1200

Cys Ser Thr Glu Frô Vai Sla lys Iiêu Ser The Aep Sly Sln l>y« Vai JS& 39tt 39S 40» TAT Cm. ÃCT ATA SCT AAT ACA SÃC CTA SCS3 GCT TOS CCS AA.T β&Γ MAS 1240

Tyr Axg fbst Ile Ala Aon Th*· Ãap Vai Ala Al® T*p Fr<s Asa «ly l.ya 403 410 416 GTA TAT TTA SST STT ACS AAA STT SAT TTT AGT CAA TAT CAT GAT CAA 12 S6 val Tyr b«a «ly Vai Thp hy» Vai Asp Phe Ser sle Tyr Asp Asp Slrs 420 425 430 AAA. AAT SAÃ ACT AGT ACA CAA ACA TAT GAT TCA ÃAA ASA AAC AAT «@C 1344 l»y» Asa eiu thx Ser Tbr Glo Thr Tyr Aep S«r Lys Arg Asa Asa Qly 43& 440 445 CAT GTA Sm GCA CAG GAT TCT ATT SAC CAA TTA CCS CCA. SAA ACA A£S^ 1302 «is V»1 ser Ala Glú Asp ser He Asp «la Leu P*o P*e «1» TM- Tb* ISO 455 466 «AT GAA CCA CTT GAA AAA GCA TAT Ά<gf CAT CAS CTT AAT TAC SCO G&h 1440

Asa Gl« oro Leu» «1« Ay» Ais Tyr ser HiS Cia í^u Asa Tyr ΑΪ0 01« 4SS 47Õ 475 48» 1488ΡΕ1040192 410 tot ttc TTk ato c»& ®hc c^r tot gsa aca att cca ttt w act Tise Cya Phe Leu mèç <s.Ik Aep *r-g Arg «ly Th* £1« Pr» fh« Pb* thr T*p 435 4SO 43S ACA CSC AOA AQT GTA GÃC TTT TTT AM' ACA ATT &Τ ίΚΪ GAA M« ATT Tfer His &rg Ser Vai Assp Ph® Pb® Asn Tfcr Xl· Asp Ai» «1» Lye Xl« saa sás sio act c&& cre cca «ta st® mã «ca tat «ec tto tct toa ®sx «cr tcc Thr Sln Istm Pr» Vai vai Lya Ala Tyr Ala Leu Ser Ser Qly* Ala :Ser PXS S2B S2S ATT ATT @&& «ST GCA QSA TTC ACA ««&, «<S& AAT TTA CT* TTC CtA MA ll« 11® «lu «Xy Pro ©ly phe Tfer «iy Qty Asm t>«u &«u ®h« Leu i.y» 530 335 543 «M TTT AST MT TOA ATT SCT AM TTT AAA «TT ACA MA AAX TCA OCA ©Iti Ser ser Asm Ser lie Ais l»y» Pha Lys Vai Tftr leu Asâ. Ser Ala 543 Sâô 553 SSO ÊCe TTO TTA CM ISA TAT CST OTÂ ABA ATA OBC T&T «CT TCT AQC ACT Ala Leu ál« Arg Tyr Asg VAI Arg lie Arg Tyr Alã Ser Tbr Thr Sfí5 S?0 57S AAC TTA CGA OET TTT STS CAA AAT TCA AAC ΑΚ3Ρ «AT TTT CTT ÔTO ATC As» ls« AK*f Leu P&e Vai dl» Asa s«.r Asa A»» Asp Ph«s i*» Vai lie sso sa& 5»e TàC ATT AAT &AA ACT ATO AAT AAA S&T ®f «AT TTA ACA TAT CM ACA Tyr Ile Asa Lye Xfer Mst Asa x.ys Asp Asp Aap Leu Τ-hr Ty* «Ia Thr S9S «00 S«5 TTT ©AT CTC ©dA ACT ACT AAT TCT AAT ATS W® TTC TOG QGT SAT **» Has Asp Lett Ala Thr Thr Asa Ser Asn ííet Ôly Pfeft Set ©ly ftsp uy& SlO e.XS 3:30 AAT QAA CTT ATA ATA ^1A ©CA SM TCT TTC: mt TCT AAT QAA AM ATC Asa Qia li»a Ile Tis ely Ais <31» Ser Pb» vai Ser Ahk CXu Lys lis S3S S3d «SS S43 TAT ATA «AT AAS ATA BAA TTT ATÇ CCA «TA CAA TTO TftA Tyr tk Asp Lys Ile Glu Pfee xle Pr o Vai «la Lee 345 450

1SM 1584 i Li 2 1300 xr?5 1834 1872 1939 1959 (2) INFORMAÇÃO PARA SEQ ID NO:36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:36: mi hm Pfô- Asa Asa Arg Ser Giu si» &sp £5í.r lie Lys vai thr Pr» 411 ΡΕ1040192 I s XO 15

As» ser 51 u te» Sln 2lsr As» Ki® Asm ©1» Έγ* fero te» Ala tep Asn 20 2S 3-0

Pro Asn ser Thr Leu Gl» 51» Lau As» TVr X.y» Slu Pb» te» Arg **efc 45 te« Asp AS» Ser TAr Vãl Lys Asp S0 Vai ©Xy 0i» 11« teu Gly vai Vai 75 $0 Thr ser F&e Tyr ©la Ser Phe teu 90 ss tep pra Trp Lys Ala Ate Met Ala 105 110 Ly» lia Slu ©lu Tyr Ala Lys s«r 125 Leu GXrs teu Asn Ate ©lu tep Tyr 140 iys T&r Are teu Ser Leu Asig $*t irn- ião Glu Leu Fh® Ser ©i:u Ala slu Ser·' 170 AVI Fise Ala Vai Bar Lys Phe ©lu. Vai xss IfO Ala Ala .As». Tfcr Mis te» te» teu 205 Ml» ©1» Trp ©ly Tyr· Ser ser ©lu 220 *31» teu Lyã Leu Thr ©la ©la Tyr 2:35 340 Asm vai ©ly teu teu Sly Leu Arg 2S9 255 Lys Fha te» Arg Pb® Arg &rg ©lu 265 270 Σ1« V» 1 teu PM Pro pte Tyr Asp 355 .Lys Thr ©lu teu Thr Aro tep lis 300 .35 40 ®sr 01» .tep ser S*r flsr *31« vai SÕ 55 M» Vai Gly Yhr Úly Xi« Ser Vai 65 t*> ©ly Vai Fro Phe Ala Sly Ala te» 55

Arn. Thx 11« Trp Bro Ser Aí5g Ala 100

Gi» Vai slu vai teu lia tep fcys 1X5 X20

Lys Ala teu Ala Slu te» 81» sly 130 I3S

Vai te» Ai» te» te® 8«*· Tiqo tys

1.45 ISO

Lys Arg Ser ©la Asp Arg XXe Arg 155

Mis Fte Arp As» Ser M&t. Fru Ser ISO teu ph« teu Fr» Thr Tyjr Ais ©l;n X5S S00

te» Lv» As» Ais 01» VaI Fh« ©ly 310 SIS Ásp Vai Ala *31 u Pka Tys Bis Arg 335 230

Thr As$> Mis Cys Vai As» Yxp Tyr 245 aiy Ser ffcr Tyz Aep Ma Trp Vai 250 fttefc Thr la» Tísr Vai teu tep teu 275 250

He **§ te» Tyr Ser Ly» ©ly VAl 200 SSS 412 ΡΕ1040192

Ahè Thr Asp Prp lie Pha ser Leu vai Ae» lm& Mst vai tyx <*ly P*u 305 310 31S 320

Th* Pfce &eu Ser lie 5iu Asa Ser lio Arg hys Sre Sis Lext ?h* Ahp 335 W? 33 s

Tyx Leu SI» Gly II* slu ?he BAs Thr Arg Lais Sln Pro sly Tyr Phe 3*e 345 3:50 <?ly kys Afcp S*r Pha Asii Tyr Trp Ser Qly Asft Tyr Vai <3lu< Thr Ar© 355 340 365 'Pro Ser xle Giy Ser Ser &y» Thr lis Thr Ser Pre Phe Tyr Qly Asp 37Q 375 3to

Lys sor Thr ®X» Pxo Vai Gin &y* keo Ser sh* Aap Sly eia i»y* Vai 3KS 350 3SS 400

Tyr Arjs Thr lis Alo. Asn Thr Asp Vai Ala Ala l'rp Pr® Ass» Gly Ly» 40S 410 415 val Tyr L*u eiy vai Thr &y* v*i a»p »h# ser ela Tyr A£p Asp ela 433 42S 430

Ly» Aan. Glu Thr Ser Thr Gin Thr Tyr hmp Ser £»ya Ar<j -Asn Asn Gly 435 440 445

His Vai Ser Ala Gin Asp Ser Ile Asp Gin Leu Pr» Pr© GXt» Thr Thr 4S0 433 460

Anp Gin fts Anu ela Ay* Ai» Tyr Se-r SAe el» Se» Λ»» Tyr Ala Gin 46$ 430 475 4S0

Cys The Leu tlet· Gin Asp Arg &rg Sly Thr ile Px© The Phe Thr Trp

4õS 430 4ÓS

Thr Mis Srg Ser Vai fóp Pb» Pb» Am Thr lie Asp Ala <31» hye ile SOS 505 510

Thr Gin léu Prõ V*1 Vai í»ys Ala Tyr Ala Leu Ser Ser Gly Ala Ser SIS 520 $35

Ile Ile Glu ©iy Pr© Sly Ph* Thr Sly Sly Am hm Le» Pfce Leu Lys 530 535 540

Gin Ser Ser asm ser ile Ala hye Phe &ye vai Thr l<e« asm ser Alá 545 SS0 SM 560

Alá hea tiási Gin Ar© Tyr Ar© Vál Ar§ llà A*© Tyr Alá Shr Thr Thr S65 57 Ô 575

Asn Leu ax© Leu Pite vai 51» Asn Ser as» As» Aâ$i Tte isu vai ik seo sas soo

Tyr Ile Aaa. Ly* Thr jígt As» lye A«p .&»£> Asp .1**» Thr Tyr Gin fhr 535 500 505 413 ΡΕ1040192

Rhe Aiíp δ 10 LíSás Ils Thr ?h*r A»» & IS Ser As« Oly Phe Ser Oly Ãsp Lya Asa ms eiu Leu II® li# eiy S.30 Ala •01« Ser Vai sis Saí: «ití Lys 11® S40 tl9 Asp I*ys IX® OÀU Fh* Xl(S F;ro VaI <3X« L ea (2) INFORMAÇÃO PARA SEQ ID NO :37: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:37: ATS AAT CCA AAC AAT C&A ÃÕT SAA CAT GAT ACS ATA A&S esr ACA ecr 43 Mafc ASO £ΐ» Aara Asn Arg Sor Hi;s ASÍ> Thr Os £j'ys Vâl Thr Fri> 1 S 10 is AftC «T GAA TT® cm ACT MAC Ç»T RAT C&A TAT CCT TTA (5C“T CAC AH.T 5!$ Asa Ser SI li í..fcU C.lfc Thr A&m Aso Si» Tyr Fro kSU Ala Asp Mn 20 35 30 ec&. AA? TCA A£A CTA SAÃ ORA TTA AAT fÂf AAA SÃA TTT TTA ASA A1S3 144 Pro Asn Thr i-OM ai» sXu Asn TVf iys Cia Ph® Lsw A.v>3 Mrt 35 40 4S AC? OAA SAC A3T TCf ACS «AA STS cm OAÇ AAC TCT ACA CTA AAA SAT 1®2 Thr Glu Asp á«r Ser Thr Glts vai Leu Asp ASR Ser Thr vai. Lys Asp 50 S.5 so GCA GTT dCd AC& SOA AT? tct gvt «TA. CCS CAQ ATT TTA ÇSf ÇTT CTA 240 Ala. Vai Sly Thr Oly i.i® Ser vai V»1 aly Gin lis leu Oly Vai Vai ss ia ?5 00 STT CCA TTT SCT 00$ «CA CTC ACT TCA TTT TAT CA» TCA T^T CTT 200 sly Vai Pj:çí Rha &ÍA Oly Ala keti Thr Ser Fh® Tyr Vin $0? ?T*e Le« SS 90 ss A&C Acr mh mi OCA. AST O&T GCT GAC CCA TCl(:> ÁM5 C5CT m ATS GCA 32S AA« Thr 11® Trp Fro S&r Asp Ala &Sp Fr» Trp hys Ala Fhe t4et Ala. im u»

C&A QTT SfcA «3TA CTS ATA «AT AAS AAA ATA S&G Ç&G TAT GCt M* AGT 414 ΡΕ1040192

ψ*1 hm 11« As® &$*» hys 11« #1¾ Cie tyr Ais hys &m~ US II» :US ma «cr err «ca m® ra me «mr «r cmm m$ sm- «*e «aa &w wr IM a;; « ;:>«« Me Qlu Ms «1,« «ly &s« Sis .». ato fTO «ia mp τγχ :3$ tos %m

Mf « wm. mr «e κι *m .*m ma «et tm *e* rm « ssr Mi. m Ais eeo Ma i*r txp %» hym TM Pm hm «*r Ma As?g $** ias xm iss ' ma ma a® a® m «at cm Am a«« «aa «t tst -otp cm «ca sa set eyt seg $«r ele M$ Mm 11* Mm «1« **& ita» wmt ei® M* «ta. M*· u-s íto x?s

CAf tCF WT AAT tcc ATO ©05 TCA TTT «CA «TC TTO MA. tfC TOA «TC

Mia Iw. M *te& Itt Ssr SM hls ml mm &i» ís« &U* PAl imt m xm cm w cm toa m f» *m «» «er ma mcm cm ««a Uííí ms A»a 8as* TM tyt Mã «le Ale Ais Ase TM sis hm hm. hm %m tm »s tm êm mr «cr m» «nr vrs «c*« m& tss cm mt ter tm tm hm '$&» %m aía «is v«l at «ly «*«· «1« t*»· ety ty*· tos· ser cia

1» 21$ '2 TO «** *m ©et pâ ftt mt ακτ asa saa toa im ©to asa caa s» me &sç ml Ais Sis f&* fp Sis Mm «la Ma hm SM mM. «Is fyt 2:1$ 33« »3$ »*« ato esc ©at w stt « te© w ato «to ®λ rm aro tot to& a» ®r Mp eis cy* ml *»a rs® tyr *e« sai *iy hm Am my f*m Mm MS MM %$$ ««ΚϊΒϊβ^ββΜΙΙΙΐΚβϊΗ*»» eiy ser TM' Tyr Asp MA Tsct> Tal Ms AM » TOe *1» Srg TOg? Cl« 2«» «Té ATO « TOA ATO «TA TOA SAT TOA ATO TOA STO TOC TOA TTO tAt «At :«®t » Μ TSs ¥At Asp- PSS H« SSl AAS SÁA TOS Tha Tf* M$> tos te« zm mf çm rm wm tro aaa çto tot aaa

Xis Mf Aaa tTO *«r hys «ly m% hm thr «Is hm- TOr -Arf Xis ttê cm lèé

XTO ATO CAt TOA ATO TOt tÇt TOt ATO ACA TOA CTO TOC tAC TOA TOA tM thr Asp TOS Xis TOA ATO TOC ATf TM TOS ATO. ATO Tyr Ciy » cm txe %%$ *m act ot rm Mm Am «aa aac tet ato toa aaa çet cat m «tt met ftr ATO hm m* tlM «1« ATO STO xis Mm TOA 81* TOS MA £*p

$M M-m IMS

CAT ® CAC ®S àff e&A ttt CAT ATO TOT CTT CÃA CCt MT TAC TTT

ATO 4ÍC TOS SM «4 TOC "tm #x« AAA sxa C$0 ICíjS

ISIS 415 ΡΕ1040192

Vyr bs« Siri Qiy Ils βία Ph* Mis Tkr Arg Um Gin »tro «Xy Vyr 34S 34 S 350 Q@é AÂA «gf ΪΪ6 Μϊ TM? TS8 TCT «ST MT TAT «TA «AA ÂCT ÃÚÁ AA0*

S.iy bys Asp Ser Pfce Asa Tyr Trp Ser Cly M» Tyr Vai Sl« Tíwr Ακρ 3SS’ 350 3GS cct a«t Am <»sa tct mv sag aca ατγ ãct $ee «ca. τττ tat mm tsm 1152

Prc* Sár lis Oly ser Ser bys Tfer lis & Ser Pr« Ph* Tyr SXy Asp 370 m 300 AAA TC® ACT «RA. CCT «TA CAA ARO CTA AGC.’ TO1 GAT ®GA CM A&S GTS *·20Φ

Lyâ ser Tte Síiu jfcra vel. ala bys Leu ser Fh-e Asp Sly «Xn hym Vai

388 390 $m 4SO TAT OQA ACT ATA GCT AAT ÂCS «Ac «TA SOS «CT Ψ&0 CCS· AAT ®BT AAG XÍ40

Tyr Arg Thr Ϊ1* Ala Aen. Thr Asp Vai Ais Ala Trp Pr» Asa Giy Ay»

405 410 41S sm at τϊά cct gtt acg asa. gtt «at rrr ast caa tat «st «at caa i2â« vai Tyr Leu «Xy Vai Tkr Lys Vai &sp Phe sar «In xyr Asp Asp «la 420 405 410 ASA AAT S3AA ACT AGT ACA CAA ACA M 6« TCA AAS AGA MAC AM' mc 1144

Lys A*pa Çlu Thr Ser Thr «In Thr Tyr Asp ser by# arg As» Asr «Xy 435 440: 445

CM® 8TA mt GCA CA8 «AT TCT ATT «AC CAA TTA CCS CCS GSS ACA ACA X3SS

Hi» Vai Sor Ale «I» ssp Ser lie Aap «X» teu Pt» Pre Gia Thr' Thr 450 4SS 400 G&T GAA CCA CP? SAA AA& «CA TAT SGT CAT CM? CTT MT TAC CCS «AA 1440

Aap eia Pro .beu «la bys Ale Tyr Ser Hla Olx» Leu Aen Tyr Ale Slu 4S5 470 475 400 ΤβΤ TTC TTA ATS CAG «AC CGT CGT ©GA ACS ATT CCS TTT «TT ACf TOC 1408

CfA Slfee be» «es «la Aap Ar* A*g Sly Thr lie Pre Pfas &t& τβαε rrp

485 4SO *M ACA m ASA &3T «TA OAÇ TTT TTT AAT ACA ATT «ST GCT «AA AAG Sfl" im$

Tfer His Ars ser vai Asp &fc® Phm Ams. thr He A»p Sla «lu bys lie

500 SOS SIS act cm ctt cca «m oro asa «ca mt «cc tm tct tca mr «*r tcc is$«

Thr «In Leu Vre VAX Vai by« Ale Tyr Ma Léu ser Sér «ly Alá Ser 5:15 S20 525 ATT ATT GAA SGT CCS ««A TTC .ACA GGA ©GA AAT TTA CTS TTC CTA AAA XS32

He lie «1« «ly B*« «Xy Phe Tfctr «Xy «Xy Ash» beu be« PAe Leu by» 530 iXS 5« «AS TCT AST AAT TCA ATT CCT AAA TTT MA CTT ACA TTA AAT TCA «CA l$'âÕ 01» ser ser Asn A«r He Ala tya .»he bys Vai fhr Leu Asn Ser Si a.

S4S SSO S 55 SSS OCC tm TTA GAA CSA TAT CGT «TA ASA ATS C0C TAT SCT TCT &CC ACT a,T2* 416 ΡΕ1040192

Leu Leu Gin Arg Tyr Ar® Vai Ar® lie Arg Tyr Ala ser Thr Thr ssi 570 S?S AAC TTA CÇA CTX QTG CM. ΑΛΤ TCA AAC AAT ©AT TTT CTT GTC ATC 17?« A*» Leu Ar® L-SU ?%« Vai Gin As» Ser As:» Asm Aap Phs. LíiU Vai Ile St® 585 530 tac ATT AAT AAA ACT ATC A&T A&A ©AT ÔAT SAT m ACA TAT CAA ACA 1534 Tyr lis Asn Lyg Thr Met AsSft LVâ Asp Asp Asp Leu Thr tyx 01» Thr 59¾ SOO SOS TXT imx GTC SCA ACT ACT A&T 7CT AAT ATS CG® XX ς ?cs m? ©AT AA© 1872 ASp .Leu Ala Thr Thr Ab» Ser As» Gly Phe Ser Gly Asp Lys S10 «S íMhl AAT ©AA CTX ATA ATA GGi\ G&A SAA TCT TTG ÇTT TCT ΑΑΪ GAA ΑΛΑ ATC 1920 As» Glu Leu zie lie Giy Alá Gin Ser Fh* Vsl ser ASrt ©lu l*ys 510 SIS rm ata QAT AÂG Am GAA TTT ATS CCA GTA CAÃ TTfJ TA& 19.SS Tyr !Ie Asp Lys .1.1 fe ai u Th-s Xis Am Vai Gin Leu aa$ sso (2) INFORMAÇÃO PARA SEQ ID NO:38: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:38:

Hec. Asm Fre As» As» 1 1 Sis His Asp Thr n« s í i I i s 10 IS Ass ser mu Leu QUi Tiu· As» hiss Asm Gin Tyr F:r© I S I I 20 2S 10 Pr® Aon Ser Thr Leu ©lu Siu Leu Aan Tvr Ay-js ©lu Phe Leu Ar® í4eL 35 $0 4:5 Thr Gin A*P Ser Ger Thr Glu vai Leu Asp ,A.Síi Ser- Thr Vai Lys Asp $$ SS te Ala Vai Gly Thr Gly ile s«-r vai Vál ©Iy ©In Xie Leu ©ly Vai Vai 05 70· 75 80 Oiy Vai Fr© P:hP Ala Qly Ala Leu Thr Ser Phe Tyr Gin Ser Phs Leu ÍS .80 85 Asa Thí Ue wp FLO 1 5 1 1 Trp Lys: Ala Wh& Jíeõ Ala 100 3LOS 110 «1« Vai ©Itt Vftl Lys SL.y* Ue Olu Sfia Tyr Ala Lys Ser ΡΕ1040192 417 r. xs ião í*y» Ala. Icfiu Ala Glu Lati Glrs ©ly 135 135 Vai Asn. Ala Leu Asa Ser Trp Lys 145 ISO Lys Axg ser ®1» Asp A*g 11« A*g 165 Hia Ph® Arg Asa 5sr Msfc Pro Ser ase Leu fihe Leu firo Th* tyv Ala ©i» 133 100 L©« Ly$ Asp Ala ©Xa Vai Ph& ©ly 210 aas Aap val Ala ©1«. fihe Tyr Sli.® Arg 32$ 230 Th* As|s Eis Cy» Vai A»a Trp Tyr 24 S Òly ©er Tfcr Ty* Aop Ala Trp Vai 260 Kat Tta Mv. Tfer Va.l Leu $*p Ma 27S aos He Ar© Lms Tyr Se* Lys ©ly Vai 290 ass Ffea tfer Asp £*o 11a PM &er Leu 3PS· 318 Tfer fibe Mu Ser Jle G-l» Astn Se*· 325 Tyr Leu ©ia Sly II* íílu Phe Sis 340 ©ly Lya à»f» â** Ph® teu tyr Trp 3S5 MÕ fixo $*r XI* Gly ser ser Lys Th* 370 375 Ly» Ser Tte ®Xu firo Vai ©1» Lys 385 3 ©O Tyr Arg Th* Ile Ala Asa Thr Áap 455 12:5

Mv 83.» Asa Mm fih® ©lu Αβρ Tyr 14 0

Ly» Tfer Era· Leu Ssr Mv fteg Ser

155 ISO ©1« Leo PA® Se* 6in Ala Glu S*r

170 17S

Ph® Ala Vai Ser Ly» fifee GLu Vai ISB ~ 1:90

Ala Ala Mn th* Sis Lati Leu Leu 2»S

Glu elu Trp GXy Tyr Ser Ser SIu 220 ©is Leu Ly* Leu Th* ©Xn sln Tyr 23:$· 240

Aan v*l ®ly Mv Asa ©ly Leu Arg 2$0 ÉSS

Ly» fihe Aea Arg Fhe Ar© Axg Glv 265 270

Ile Vai Leu Pise Pro Pft* tyr Aap 20 5

Lys Thr Siu Ma Thr A*g A»p Ile 300

Arg f hs Pro L*V Ala Tyr Gly firo 315 320

13® Ar© Lys Pira Bi» Leu Pit® A,«p 330 33S fhr Arg Lee ela firo ®Iy Tyr Phe 34 § 318 ser Gly Asa Tyr vai Glu thx Arg 365 lie Th* Se* Pro PM Tyr Gly Asp 360

Mu Ser Ph* Asg Sly Glrs Lys Vai 395 4SO

Vai Ala ala Trp Pm A«« (Si y liyst 410 413 418

hsp PhS Ser 81» Tyr Asp Ãap Gin 425 43Q tyr &.sp âer Lys Argr Aan Aaa 8iy 44$ &sp (Ela leu Fxp Pro Clu Thr Thr 4SG S«* Ki» 81» leu Asa Tyy Ala Qlu 475 4Í8S ôly Thr 11# &&& pfc# Pfe# Thr· Tr-a 4SS 495 Asa Thr Ele Asp Ala Giu l.ys sle SOS 510 Tyr Ala Leu. Ser ser ®ly Ala Ser 01 y Oly A#» Leu !>èu Phô Xdaa Lyg 540 P&s Ays vai Thr leu Asn Ser Ma SS5 550 Arg lie &rg Tyr Ale Ser Tiur Thr S70 * 575 Ser Aísís &aa Aap Phe leu vai Ha $*$ $90 Asp Asp Asp leu Tb* 1'yr 81a !Xhr C»05 As» Hefc Gly Pba Ser Oly Asp Lys $2& Ser ffee Vai Ser Asa 81u hyv He S3S $40 Prp Vai 81» hm 6SS ΡΕ1040192

Vai Tyr Lev Sly vai Thr Ly» Vai 420

Ly» As* <3lp ?br Ser Tb*· Glts Thr 4· 3 5 449

Kis Vai Ser Ma <S1» Asp Ser lie 4SÓ 455 &ap siv p*» hm Glu hys Ma Tyr 455 470

Cya Phe hm fttet 8in &sp Axg Argr 48$

Tfer Bis &rg Ser Vai Asp Phe Fhe 50V T&r fllft. L&U Pr© V*1 Vai Ly» Ais SIS sis n* lia 8iu sly pre> Qly Fhe ftor S3» §35 QIjí Ser Ser A»» $#r XI# Ala &ys 34$ SS«

Alá hm hm «X» Arg Tyt Arg Vai S«s

Amn tmv Arg keu vai 81» asa S89

Tyr lie teta- Lys Tfctr J4efc Asa ky# S93 00©

Phé ASp hm Ala Sfcr Thr Asa Se?

$.l.ó SIS

Am 31« l«#u xle Xle fi3.y Ala 31« gas $30

Tyr Ele Asp Lys Ele <31u Phs Ele

S4S (2) INFORMAÇÃO PARA SEQ ID NO:39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: 48ΡΕ1040192 419 (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:39: ATS MT CÇ& MC AAT COA AST GAA C&T SAT AC© ATA AAG ©TT ACA OCT Asa Pro Asa Asa Argr Ser ©iu His Asp T&r lie Ly* Vel Tfcr I S 10 15 AAC AST SM TIS CAA ACT AAC CAT AAT CM TA? CCT TTA SC? OAC M? Aeti Ser slu Leu 31« Tt*r Asu Ifi* Ma 31« fyr Pro Leu Ala Mp A»a 20 2S 30 CCA AAT TCA AÇA C?& «3&Ά SAA TTA AAT TA? AAA OAA TTT TTA ASA ATS p.FO hsii Séí TM Leu >31 u 3? u L«« Aon Tyr Lys Glu Pb® Arg M«C 35 40 45 ACT SAA 3ÃC Ã0f TÇT AC© QAA «T© CTA ©AC AAC TC? ACA ©TA AAA SAT Thr 32s As?p Ser Ser Tfe*' Glu Vai L«« Asp Asa S«Sf TM' Vai Ay» Asp 50 SS <?ÇA ©?? ÇC-3 AÇA QGA ATT TCT STT STA GSG CAS ATT TTA S3T STT GTA Ala VAI Sly T-hr G-Xy Ϊ1* Ser Vai Vai ©ly ©la 1:2« Leu «ly Vil V*1 «5 70 75 80 ©8A ©ST CCA TTT ©CT 333 CCA CTC ACT TCA TTT TAT CAA TCft ITT CTT ©ly Vai Jhw? Bh« Ala ©ly &1« Leu Thr ser KA* Tyr sln ser Phe Leu 8g 90 9â AAC ACT ATA 158© CCA AOT SAT SCT SAC CCA TÚ& AM? ÔCT TTT AT© ©CA Asn Thr Ile T*p J?ro Ser Asp Ala A«p Sr© Trp· Lys Ale Kfce «et .Ala 100 105 210 35 244 102 240 28« 316 CAA ©TT 3AA 0TA ÇTS ATA ©AT AAS AAA ATA ©A© ©AG TAT ©CT AAA AKT Sln Vàl Qlu. Vai Leu 11« Asp Ly» Ly» Ha ©1« ©1» Tyr Alã Lys &&r XIS 130 3.2.5 AAA 3CT CTT 3CA SAS TTA CAG GGT CTT CAA AAT AAT TTC SM GAT TAT Lys Ala Leu Ala Glu Leu 31» ©ly Lau ©la Asn Asa 0h« 31» M& Tyr 130 13Ç saç mr MT GCG TTA AAT TCC T©S MS MA ACA CSCT ia AGT TTG C3A A3T VSl As» Ale Leu Aea Ser Ίτρ Lys Ly» Thr ^r© Leu Sár Leu Arg Ser 14$ ISO' XSS ISO AAA ASA mc CAA 3A? CCA ΑΤΑ A33 3AA CTT TTT TCf CAA CCA <3M A3T Ly* Arg Ser 31» Asp Arg Tle Arg Glu Leu Ph-e Ser Cln Ala ©lu Ser 1«S 270 VtM CAT TTT C3T AAT TCC ATS CCS TCA TTT ©CA GTT TCC AAA -T?C CM ®TS Mss Phe Arg Asm. .Ser «et Pr» Sesr Phe Ala ¥al ser Ly» Phe Slu Vai 180 185 150 CTC TTT CTA CCA ACA TAT CCA CAA ©CT GCÃ AAT ACA CAT TTA ΤΎ3 OCA Lbu 2Ά© Leu Fr© TÀr Tyr Ala ©la Ala âIís Asa :thr His Leu Leu Leu 384 432 480 528 57« S24 720ΡΕ1040192 420 200

SOS tm am <m scv cm stt ttt g®a «αα saa te® ®®a tat tst tca sãa Ií«ú l-ys Asp &iã ®l» Vai Phe ®Xy ^Ia «lu Trp &ly Tyr Ser S«r «Xis 210 2IS 220 G&T 8TT SCT SM trt TAT CAT A«A CM TT& .AAA CTT ACA CM CAA «C Asp V«I AI» Slti Piia Xyr His Arg Gl» Leu Ly» Lay Thr Sla Sim tyr 335 2.? δ 235 2*0 ACT «AC €&'T W GTT AAT Τβ® TAT AAT ÔTT «GA TT* AAT GGT TFA AM Tfcr Asp Jtie Cys vel « T*p Tyr Asm vai «ly Leu asa sly Leu Ar® 245 250 2SB 8CT TCA ACT TAT «AT «CA TO3 OTO AAA TTT MC CGT TTT CSC AM @A& «ly Ser Tfer Tyr A»p Ala T-rp Vai Ly» Pta# Aa» Arg Vh* ATS Arg »1« 2«0 2SS ' 270 ATG AST YTft ACT GTA TTA GAT CTA ATT STA CTT TTC OCA TTT TTC MT Mfet Tfer Leu tt*r Vai Leu As» Leu Ile y*i Leu Pise **se PH« Asn 27S 2 SÓ 28S ATT TO CTT TAC AST AAA GGG «TT AAA ÃC& «AA CTA ACA AM «AC ATT *1» Leu Leu Tyr ser Ly» <SXy Vai Lys &J,u Leu tèx Arf Asp Si© 290 238 300 TTT AC® met CCS ATT ITT TCA CTT Mf ÁCT CTT Os& GAG TAT «GA CCA Abe Thr Afl» Pre lie »he Ser Leu As» Thr Leu GIss «lu 7¾¾ Sly faro 365 SIO 3X5 320 ACT TTT XTÍS ,wr ATA ®M AAC TCT ATT C® AAA. CCT CM’ TO, TfT MT T0r Fha Leu Ser li® «1» Mm ser lia A*f Ly» Fro His Leu. Phe Aap 33 S· 336 335 TAT TTA CAÔ GG® ATT «AA TTT CAf AO® CST CTT CM COT GST TAC TTT Tyr Leu Gl» ©ly íl·# ®X« Sfe® Hi.» Tht Ar® Leu 6in Pro «ly Tyr »he 340 MS 350 GSS AAA ®AT TCT TTC .AAT TAT TO® TCT ®ST MT TAT «TA SM ACT ASA «ly Lys Aap Ser »h« Asm Tyr Trp s®r «ly As» Tyr V*1 Glu Thr Ar®· 35S MQ 3SS ccr mt ata ssa tct agt aag aca att act tcc CCA TTT TAT ««A «AT pro ser xie «ly Ser Ser Lys Thr n« Thr Ser Pro Pbe Tyr Gly Aep 370 375 38« AAA TCT ftCT Sffi CCT «TA CAA AA® CtA ASC tTT GAT GGÃ CÁA AAA GTT Ly» Ser Thr ôlw fte V«I Ola Ly» Leu Ser 0h« A»p aly «i» Ly« V*1 3ãS 33S 30S 4SS TAT OSA ACT ATA SCT AAT ACA «AC ÚTA ©ÇÇ GC? WS CCS MT «ST MS Tyr Am® thr lie Ma Asm Thr Asp Vai Ala Ala Trp Fra Aats «ly Lys *0S 430 415 GTA TAT TTA. SGT STT ACG MA. CTT GAT TTT ACT CAA TAT «AT SAT CM Vai Tyr Leu Sly Vai Thr Lya Vai A»p pfee Ser «X» Tyr Asp Aap «la 768

SIS

SS'J SI2

3LS0S I0S6 1104 X 1.5:2 1200 um

12 SS 1344ΡΕ1040192 421 430 4Μ 430 AAA AAT GAA ACT »ST ACA CAA ÃCA TAT ffi&T TCA AAft. ASA MC 4AT GOC kyss A®» ¢1¾ Af Se* Th*· 01» Thr Tys? Aep Se* kys teg Asa A»» «ly 435 440 445 cm M&. mt oca cas em tct avt oac caa w& eco cca «&& aca ,&c& ílis vai Ser Ala Gin Aso se* Ile Asp si» i»au Fra Fro <Jlu Tis* íhr 450 4SS 45 0 ΘΑΤ OAA OCA Cri" ©AA AftA OCA TAT AST CAT CAQ CTT MT TAC 3CS 0«. Asp Cia. Pr» &e» Glw lyg Ala Tyr Se* His Cia L®« Asa Ty* Ma Glv 44» 4 TO ' -m 4*0 TOT WC TTA ATS CM SftC CST 08T «CA ACA ATT CC& TTT TTT ACT TOO Cys $h* fcsu fSfcfc Cl» &sp Asg Ar®· Siy Th*' II* pto Fbss Phe· Thr Trp 488 430 495 ACA CAT &GA AGT CrVft GAC TTT TTT AAT AC& ATT GAT GCT SAA AAG- ATT Thr Hi» fcg Sar vai Asp Phe Fhe Asa Th* lie? Asp Ala Glu Lys lie SOO SOS 510 ACT » !» OCA OTA ©T® AAA ®CA TAT 8CC TV© TCT TCA GGT ©d? *CC TA* <31« Leu Fr» ¥».l Vai fcys Ala Tyx Ala Raw se* Ser cly Ala s«r SIS 530 52S ATT ATT m& 88T OCA SOA- TTC AC* 86* 08& AAT ΤΓΑ CS» TK CVA AAA lia 11a Glw «Jy pra «ly ©h* Thr Qly ©ly Aan Aeu :La«. Ffe* hea hys S3® $3 5 540 GAA TCT &3T AAT TCA ATT CKTT AAÃ TTT ÃAÃ STT ACA TTft AAT TCA <3CA Glu Ser 5 ar Aa» Se* 11® Ala Lys Fhe Lys Vai Thr Aeu Asa Ser Ala 94» »»« 588 560 CCC TT8 TTA CRA 03» TAT C8T ©TA AGR ATA CSC TAT GCT TCT ACC ACT Ala feto* Lau Cl» Arg Tyr As?g Vai Arg lis Arg syr Ala Ser Tfar Thr »65 570 S?S AAC TTA OGA CTT TTT STG CAA AAT TCA AAC A&T GAT TTT CTT GTC ATC Asa jlea. Ar$ L·*». Ph* Vai Cia Asa Ser Asa As« Asp Ahe Lsa Vai lie £90 SfS S90 TAC ATT AAT AAA ACT ATC. AAT AAA GAT ORT CAT TTA ACA TAT CM ACA Tyr 11« As» J»ys Vhr Met Asa 35ys Asp Asp Asp z>eu Thr ®yr cia Thr S.VS SCO SOS TTT OAT CTC CCA ACT ACT Μ,Τ TCT SAT ATC Qm 7TC TCG 0TT GAT AAC The Aep lea Ala Tta Tfer Aaa Ser Mu «»fc 81 y 9he Se* sly Asp ly» 610 415 620 MT 8AA CTT ATA ATA «GA GCA «&A TCT TTC GTT TCT AM <SAA AAA MNÇ Asa ®lu L-ea He 11* ely Ala 61« Pfte Vai Ser Aisa Clv £>ye Ils 625 630' 635 640 TAT ATA GAT AA8 ATA CAA TTT ATC CCA GTA CAA. TTQ TKA Tyr lia Asp Xiys Xle 81» ©Ao Il«: Pro· Vai Gls &e» 1352 1440 1488 1536 1584 3J32

ISSO 1738

177S 1024 1073 ' 1520 1959 ΡΕ1040192 422 $45 SS& (2) INFORMAÇÃO PARA SEQ ID NO:40: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:40:

Mfcfc AS» Prs A#» 1 As» Se* SI» Lnn 29 Pro &sn Ser Tb.r AS Gltt A8$ S«3f S9 Ala Vai Gly Thr ss Gly Vai S^sfo Fhe

As» Jtóeg -Ser Glu S Gin Th*· Asn Kis

Sin Asp Th*' Jle 16 Asn GL« *syr P»

Asn Tyr Lys Glu

Leu Glu Slu Leu 40 Ser Thr Glu Vai ss <51 y 11« Ser Vai 70 Ala Gly Ala Lm* 8S Pro S:sr Asp Ala

Tb.r Tyr Ala Gin a«e Gin Vai She GXy sis Fins Tyr Μ1&· Ary

LhU ,*£φ &Sh 6#.Sf SS Vai Gly Gin Πβ 7$ Ths S*r Wim Tyx m hsp Pr-o Trp Lys 10$ Ly*- lie Or íí £5Xa

Asn Thr lie Trp ,1.99

Gto V«1

SIS

Lys Ala Leu Ãla 139

Vai As» Ala Lau

MS

Lys Arg Gin

Mis Ali# Arg Aãft 3 %D

Leu Ph® L®« PXt» !«$

Leis Lys ftsp Ais 219 ftsp Ale Glu

Mn XI» Mp l»ys 3,2 0

Qlu Leu Gin úly 13 5

Asa Ser Trp Lys lã 9

Asp Arg He Arg xes

Ser MS'c Pro Ser

Leu Gin Asei Asn 3.40

Lys Thr Krs Lma 1$.!> SI» Lew Phe Ser me

Fhé Ala Vai Ser lãs

Ala Ala Asn. Thr

Glu Glu Trp Gly 229

Gin lsv Lys Lsm

Lys Vai Thr J*ra»

IS

Leu Ala Asp Asn 39 í*he Leu Arg t*et 4¾

Thr Vsl Lys Mp

Leu Gly Vai Vai SH) GI» Ser Phe Leu m

Ala Phe mt Ala 119 •Tyr Ala kys 125

Mhe SXu ftsjs Tyr

Ser Leu Asrg Ser 16 S

Gin Alá Glu Ser

2TS

LvS Phé Glu Vai

·=: $D B.iía: L&U Ic&til £c&U 20$

Tyr ser ser Glu

Tftr Gin Gin Tyr 423 ΡΕ1040192 225 '210 335 340 thr hwp Hl®: Cye Vai Aa» frp fyr Aas . Vai Gly mm Asa ©ly Leu Arg 24¾ 3S0 255 0iy s«r Thr Ty.r Asp 26 δ Ala Ttp Vai Ly& S Phe As» Ar® Vfee Arg Ar® ©X» 270 34e£ Thr Leu Thr vai Lástò mp l*su XI e vai Iiêis Phe Pre &m Phm Asn 2?S 260 S8S lis l»*m EsSii Tyr s«ar Lya siy vai Lys Thr S I ti Lâ« Thr Ar® Asp 11» 390 255 300 Ffee -Ust Itep Pro fie Pfce Èçr XiB» Asn Thr Le» Gin G!» Tyr ©ly fr» 305 310 315 329 Tfer Fhs Leu Ser ile As» ser xle Arg Lya Pr o His Léts phá Aép 325 330 336 Tpr Leu Sln €51y Ile Glu Fhfi His Thr Ar® !*SU Gin Fro >31 y Tyr .Phe 340 M 5 350 Qly Lya Asp Star Pita Asrl Tyr Trp Ser siy Asa Tyr VAl $1« Tte Ais 155 360 36S Ko Ser lis Sly s«x Ser Lye Thr tle Thr S«x Fr o Fhe Tyr Sly Asp 329 27S 300 Lys Ser Th.;r Sl« Ρϊ'Ο 38S vai 350 alo LyS Leu ser S&® .315 AiSp ely sl« Lyv val 49-0 Ty.r tag ffcr 11« Ma ,Α^ϊγ^ Thr Asp Val. Ala Ala Trp 9ra Asa» Gly Ly@ 49S 410 4.15 v.sl Tyr Leu 01 y Vai Thr Lya Val Asp ph-e ier ©In. Tyr Aap .aap sl» 429 «3$ 430 Ly» Assi <si« Ttar ser Thr SI» Thf Tyr Ser :0ys Arg As» Asn íll.y 435 440 443 Hia ¥&! S«r Ala <51». A»p 9«Sr 11« ASp Sln Leu Fm Pm ©li* Thr Thr 450 4 SS 460 Aap Slu Pra Leu Slu 1-VÍ5 Ala Tyr Ser RÍ.S Sln Leu Ssr Tyr Ale @iu 4SS 470 426 460 Cy» Pha La·» Wet «31» Aap Ãrg Ar® Giy Thr lie ffiro Phe i»hg Thr Trp 4,8 S 420 4 2.S Thr sis A*g· Ser Vai Asp Pite Th« Asa Thr Ti© Asp Ala. Glu Lya Sl® §09 §9§ 510 Tfcr 81:» Leu fr<? ¥al !· w* A1 ·?» Tyr Ais liÇtí •3«s Gly Ala Sar

SIS 520

:S&S 424 ΡΕ1040192 11« «iy Rro 0.1 y S3S Tftr í^l.v 01 y Asa Leu 540 Fhe Leu Lys Glu S43 Ser Aso Ser xiss .AJL& Lys Phe l.ys vai ,555 Thr Leu ASh Ser hi,s $60 A.! a Leu Leu Gin Ary 565 Tyx AtXj Vai Arg X1& S7Q Ãrg iyr Ala Ser Thr SIS Thr Asm Leu 560 Ph® vai Gin Aon Sssr Asn Asa Aap Phe Lea SfO Vai 11® Tyr 11« tos :S3S th*· mt Α$ϊϊ l.ys SSO As?P Mp Mp Leis. Thr §05 Tyr Gin Thr Phe Asp Leu Ala, £10 Th r Thr ASO 61S Ser Asm Mefc Phsí $s j8í& S«J? Giy Asp Lys ίΐίϊ,ίϊ; Glu 11® lis Gly 630 Ala 0lu B®r ,She Vai 63 S S«r Aen, Glu ,iy.§ He §40 Tyr 11* Asp i.yfi li e Qln £%® ϊΐβ Pr o Va.1 Gin Leu (2) INFORMAÇÃO PARA SEQ ID NO:41: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:41: ATS AAT CC& MG Mf CGA MT GÀÀ CAT S&T AOS ATA A&S ACA CGT Mar 1 Asrs Trõ Asa» Aon S Arg Ser Glu HÍS Asp Thr IS TI® Ly® vai Thr 16 Pr® AAC -A£5T 0AA TOS GAA ACT A&C CAT AAT CAA TAT SCT TTA SGT <3AC AÃT Aau Ser Glu Leu Sla Thr AS® JKis Asm «In Tyr Pr© Leu Alá A.sp ASíl 20- SS 30 CCA AAT TCA ACA CTA 0M GAA TOA AAT TAT GAA TOT ASA AT0 Fro As» í§er Thr Leu Glu Giu Léii ASft Tyr Lys ÊsjLlí Phe Leu Ar§ Mefc 35 40 <s ACT ΘΑΑ 0AÇ AST TCT ACG 0AA 0TS CTA QÃC AAC TCT ACA STA A4A «AT Thr ãla Asp Ser Ser Thr Glu val Léu Aep Ahn Ser Thr Vai Lyss ÃS|> $0 SS 6«

PS 144 1:5:2 240ΡΕ1040192 425 ©ca ©rr ©ss aca ssa att ycy ©yy sm ©cc cm ayt tta ©et ®n «ta Ala Vai ©!y Thr Sly Ila S-er Vai V'al ©ly 61 n 11» Leu ©iy V&l Vai 6S Xt ?S 80 <ss& syy cca rrr ser ««6 ©ca ctc act tca tty tst o» yça ttt ctt ©ly V»X Pre Phgt Ala Siy Ala Leu Thr Ser Pite Tyt ei» Ser Sha Leu 85 ' 80 95 AAC ACT m Y6© €CA AOT «AY SCI' 6&C CCA tefâ AA6 «CT Hf At© ©GA Asa Thr Xl$ Trp 8r» Ser ftsj» Ala Jussp hro Tçp Lys Ala Sh? M«t Ala 100 105 110 CAA 8OT QMí ©TA Ct© ASA «AT AAS AAÃ ΑΤΑ ©ft© «A© ΤΑΥ ©CT AAA AOY ©1» Val ©lu Vai. Leu ík Asp Lys Ly» Ile ©lu ©X». Tyr Ala Lys Ser 115 120 X3S AAA 6CY CTX ©CA «AS TtA GM Θ6Τ CYX CAA AAT AAY YTC 6AA ©AY Y&Y Lys Ala Leu JUe ©lu Lsu ©1» ©Xy Leu ©la As». A«» St» Sla &&p Tyr 138 135 140 ©YY .AAT ©GS TTA AAT TCC TO© AA© AAA ACA CCT TTA A6T YY6 W AGT v»l As» Alá leu Asa ser Yxp Lys E>ys> Thr £*x<? leu Ser La» Arg ©*r 145 ISO 1SS 160 388 335 384 4:32 400 MA ASA A8C CAA ©AT OCÉA ΑΤΑ ACS «AA CTT ΤΤΓ TC® CAA OCR. ©A* AST &y© &rg· ser ΒΪ» Asp A*» s i s Ar© sl» l«eu fô*e Ser ©.X» Ala ©Xu s«r i65 ito m CAY YYT CST AAT TCC ATS CCS TCA YYT SCA STT TCC AAA TTC ©AA «T6 fUs flfee Arg As» ©cr fcíét fra õcr Pfec Ale Vai 6er Lya Ph.« ©1» vai 1*0 i«s s»e cr© YYT cm gca aca tat ©ca caa set ©m ãat aca ca? m yys cta teu Fhe Lsu Fsro Tísr 'Tyr Aia ©la. Ala Ala Asn Thr Hio &eu i?®u x«u 15S 300 305 ΓΤΑ AAA ©AY ©CT CAA SYS ΥΤΎ CCA <SAA SÃÃ TCC CCA TAT TCT TCA G&& :L«« by» Asp Ala ela. Vai 9h* ©iy ©1« Cl» Trp ©ly Tyr ser Ser Clu 210 215 310 ©AY GTT ©CY CAA ΤΓΓ TAT C&T ASA CAA TTA AAA CTT ACA CAA CAA TAC Asp Vai Ala S.lw Ohe Tyr Hrs Arg Cl» Ls» Lys Leu Thr Cl» Cl» Tyx 2:25 230 23 S 24 0 ACT OAO CAT TGT STT AAT T3G TAT AAT CTT CCA ΤΓΑ AAT Cwt TTA ACA Thr Asp Hia Cy» Vai Asa Trp Tyr As» V»1 Cly tm» As» ©ly i<su Ar© 345 2S0 255 YCA Aer TAT ©ay ©ca tcc ©TC AAA ttt AAC CSY ΤΓΓ CSC ACA CAA siy Ser Yhr Tyt. Asj? Ala Trp Vai Lys Oh® As» **© Ph® Arg Arg Cl» 260 365 230 »tfâ ACT TTA ACT ©TA TTA SAT CTA ATT ©TA CTT TTC CCA YYY TAT ©AT Met: Thr Ls» Thr Vai S*ea Asp Leu H® vai La» Phe Oro Tyr Asp 22:5 280 285 528

SIS 624 622 320 816 ΡΕ1040192 426 Αττ άτα n» ?ac tca aaa sss gtt aaa aca «àã cm aca Mm «ac att lie Vai l®u Tyy s*r fcy» «ly v*L Ly® Thr 01« Leu Thr Arg Asp lie 2S0 295 SCO «? ACât ©AT CCA ATT WP TCÃ CTT AAT ACT CTT CAB «AS TAT S8A CC& Ph® Thr ASp Pr» ri* Ph® Ser Lati A»*i Thr Leu Slu ©lu Tyr ©Jy Pt» 3<S5 31© 315 330 ACT TTT Ttci A8? ΑΤΑ SAA AAC TEX ATT CSA AAA CCT CÂT TÊÃ: TTf «AT Thr phe ϋβ» Set He Si» Asa Ser X.l« Am Lys Ar» Kis Leu phé &®p 325 330 335 TftT TTA cm GQQ ATT OAA TTT CAT AC© CCT CTT €AA CCT SST TÀC TTT jyr Leu «1« «ly 31» $4« ®he Ms Thr Aieg Leu «1» Pr» Gly Tyr Phe 34® 345 tm SGK5 Α&Ά GAT TCT TTC ΛΑΤ TXT TGS TCT OCT AAT TAT CTA ÕAA ACT ASA CTy hye Asp Ser The A»» Xyr Trp S»r Oly Asp Tyr Vai SXu Thr Arg 355 360 3«S CCT AGT ATA CTA TCT ACT AAC ACA ATT ACT TCT' ÇÇA TTT T&T SSA OAT Pato S&r lia Siy Sôt S»r Lys Tfer XI» Tfcf Ser Pr© Ph* Tyr Giy Aap 370 37$ ISO AAA TCT ACT C&A CCT CTA CAA M6 CTA ASC TTT CAT CCA CA& AAA CfTT Lys ser Thr «lu Pr© v«l cl© Lys lent seae Piso Asp 8ly Clã Lys v«l ?β5 330 395 40© TAX CGR ACT ATA CTT ART ACA CIAC CTA CCC CCT TCO Cfi© AAT 8CT AAC Tyx Atf TBX Ϊ1® Ala ASfi mr V*1 Alá Ala Trp Pr* Asa «ly Lys 405 41® 415 ota t&t rth cct stt acs ara gtt e&x wr act caa t&t cat ©at caa V»i Ty* Leu çly Vài Thç1 Lye VAI Aep Pf*« Ser §1» tyr Asp Asp 8l« 420 425 430 ARA AAT CAA. ACT ACT ACA CAA ACA TAT CAT TCÃ ÁA& ASA AAC MT «6C Lys Asm Slti TS»r S«r Thr am Thr Tyr .tep Ser Ly» Arg As® &an. sly 433 4.4© 445 CAT SS ACT OCA Cm CAT TCT ATT OAC CAA 1TA CCS CCA SAA ACA ACA Uis Vai Ser AX® 01« &sp Ser li» A»p SI» jm pto Pro çlu Thr Thr 4S0 455 4S0 sat ora cca cw oaa asa oca tat aqt cat cas cw a&t mc ©os oaa AJStp siu Pto Leu 01® Lys Ala Tyr s»t Mis «1» L®u Asn Tyr Ala «1» 405 470 4T8 48© 93.2 96©

1ÇQS 1056 1104 1152 120£5 124© 3,23« 1344 1132 1440 ΤΟΪ TTÇ TTA ATO CAS OAC CST CGT 00A ACA ATT OCA TTT TTT ACT TSS Cys as LSU Mefe @la Mp Arg Ar? Sly Thr ne 'Hm Fhc Thr T*p 455 4S0 435 ACA CAT AOA A8T STA «AC TTT TTT AAT ACA ATT QAT OCT OAA ARO ATT Thr Sis- Arg· Ssr »*1 A»p Phe Ae© Thr He A»p Al® «1« Lys lia 500 SOS 510 14S8

15.3 S ΡΕ1040192 427 acr caa cr? eca cm <wps aã». «ca mi «cc tts Ter tca ost «Cf tcc -jj-ur s>r« V«X v&l lye Ala Tyr Ala Leu Ser Ser Qly Ala Ser sxs s2o sas ATT ΑΤΓ «A*. «ST CCA ¢30.¾ TTC ACA 08» «CA MT TTA CTA tTC CTA &&A lie ΖΪ» Slu ®ly WO· «Xy WW Tfcr Sly Sly Assa fesa !>«» She Leu t»y* 530 SIS 54« GftA ®CT A6-T A*T TCA ATT «CT AAA. TXT AM ®TT ASA TTA AAT< TCA OCA OXu S«r Ser As® Ser 11« Ala Lya phe Ly» Vai T.hr Leu As® »«f &la S4S . âsa sss sso $CC TTS TSA CAA C6A TAT CST «TA ASA ATA CSC ΤΛΪ GCT TCT ACC ACT Ais *·»« ai» au| Tyr Axgr vai Arg 11* jusgr Tyr Ala Ser Thr Tbr se5 SV« 5 75 aac Tm csa crr ttt στ» caa aat tca aac aat em tst m crc atc jVen &*» Ar$ Leu Pfe* Vai «1® A*« Ser Asm Asm &ssp Ftse Leu Vâl II# SSO SSS 59« TAS ATT ΑΑΤ AftA AST Aí« AAT AAA Q&T SM SAT TTA AC& TAT CAA ASA Tyr lis Asa Syn *te M«6 Asa t>ys Asp Asp Asp L«a Thr Tyr «1» Tbr 595 <5 00 «05 TTT SAT CTC SCA ACT ACT AAT 7CT AA.T ATS <SSG TTC TCS «CT «AT AAS pfcue A®P Lau Ala Tfctr Th® As® Ser .Asa Het <&y Pisa ser Sly Ãsp Ly» 610 SIS S2C aat g»a crr Am ata soa úca «a& ter ττο αττ tct aat «aa ara atc As® «lu Leu li© Xle Sly Ais Qln ser Phe VaI s«r Asa «1» Lys 11® ess «$$ «4® TAT ATA CAT AAG ΑΤΑ «AA Ttt AtC CCA «SA CAA ΤΤβ TAA tyr n« A»P Lya ϊΐβ «1« Ph« I.i« 9X0 V*1 «1« ,fce» «4S 6S0 1SS4 1Ê3-2

ISSO 1728 1770 XS24 im-2 19.20 1:9 S9 (2) INF0RMAÇA0 PARA SEQ ID N0:42: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:42:

Mst. Asm Pro Àí ssrs Ãsn &r$ Ssr Glrs His Aap The·· 11« Lya Vál ^fer 1¾¾ 1 s 1β ss S®r «âlu ti* s» ®la Tkr As» Mis As xi «la Tyr P:ro l,<r.i Ala A.S p AíSii io 30 frp Asa &*κ ΐΐ ir Lsa slu íSlu L«a ASíi Tyr Lys GXu Iíôu A:tg >í« t 35 4S ΡΕ1040192 428

Thr ©1». Assp ser ser Thr «51« Vai »o ss Aia Vai ©iy Thr Gly XI® ser vai SB 70 0ly Vai Pr<? Ph® Ma Qiy Ale teu S5 Asa Thr He Trp »ro Ser Asp Ale ma tsln Vai ©1« Vai teu Xis Asp Lys 115 120 lys Ma las·» Ala ©Xu Leu ela. ©ly 130 1,3.5 Vai &su Ala Leu a»» Saar Trp Lys 145 ISO Ly» Arg Ser ©1« Aap Afcg li® Arg 1.:63 !íi.s Phss Ajtf Asm Ser J$et Pr* Ser ISO teu vtsa Leu Pr* Tfer Tyr Alá Qln lõs 200 Leu Lys. A»p Ala ela V»X Ffass ©ly 210 215 k&p Vâi Âià íSlu Phe Syr ftie Arg 23.5 ââo tIík' Asp M* Cya Vai teu Trp Tyx 245 ©ly Ser T&r syr tep Alá ?*£ Vai 360 wefc. Ttor te» Ttor Vai 1·««. tep Leu rm. aso He Vai teu Tyr Ser Lye ©ly vai 250 SOS fte Thx tep ilá Pto* Se*- teu 305 319 Tb* Pb®: te» ser il® si» ao® ser 3*5

Leu .tep Asa ser Thr vai by» Asj» «Q

Vai ©ly ©la Xla Leu ©ly V«1 Vai 75 00 ator Ser Phe Vyr <31ώ sei? stoe. Leu SÕ 55

Asp Pr* Trp Ly» Ala Sha «efc Ala 105 1M? .Lys He eiu. ei» Tyr Ala tye ser ias teu ©la Asa Ae» .»!*« <31«. tep Tyr 140

Lye Thr Fr® Leu S*r teu. Arg Ser 155 USO eiu Le« ®to» Ser Si» Ala ©1« ser

179 17S

Sfce Ala Vai ©er Ly* Ptoe ©la vai ias ièò

Ala Ala A$& ffcr His teu teu teu 2S§ ©1» ©1« Ϊϊρ· ©ly Çyr Ser Ser ©1» aao ©l» teu Lys teu SPhr ©la ©1» Tyr 33© 240

Asa Vai (Sly teu As* GXy teu Arg a*Ô 2S5

Ly® Fte text teg Pte Arg Arg Qly 26S 370 11a vai Leu. ©toe Pr* ptoe Tyr .te» 565

Lys Itor Glu teu Tbr Arg tep II® 300 teu ttor :tew ©X» ©lu Tyr Gly Pro 315 329

Ile Arg Ly« Pro sis Leu Pise Asp 330 135 %r teu íUu ©ly lie ©1« PA® «is ykr Arg teu ©la ©ro aly Tyr Pb® 429 ΡΕ1040192 340 MS 35©

Siy Lys Ase Ser Phs A*» Tyr Trp Sãr Sly &sn Τγτ Vml fôlu Thr &Γ3 3SS 360 3SS txro Saar il« 03y Se* se* Lys Thr 11« Xbr Ser JPra Ph.e Tyx Gly Άβρ

>70 3·? 5 3SO l*y# S«r Tfe* 6iu Sr© ¥*1 61» ppm Leu Ser Ph« Asp giy Cin Ιγ» V*1 38S 1£6 3&§ * 40©

Tyr Axg Thr 11« Ala Am®. Tfcr Amp V«X Ala Ala Trp £>re Am® Oly &y*

40S 410 4IS

Vai Tyr &eu SJy Vai Thr Lya Vai Amp PA* Ssr Qi» Ty£ Asp Amp Qlm 4íâ& 42iS 43¾

J*y» As® 61» Th* ser Thr elo Thr Tyr Asp ser fcys Arg Asa Asa eiy 435 44 5 <*4S

Sis V«3L Ser Ala <3i» Asp Ser He &sp 61» Leu sare gro Slu Thr Tfcr 450 4SS 406 AS» 61» PPG t*m 61» fcys Ma tyr Sor Hio sla Leu &gn Tyr Ma siu 465 476 4?§ 4gg ey§ i?m l«« mt ala asp Arg A*g siy Thr ne 0¾¾ pm s?t» Thr wp

4SS 440 40S mr lis &rn Ser Vai Asp Fh« Fhe Asm Thr xle A&p Ma slu Lys He SOO SÕ& S15

Thr fâlm Leu Are Vai Vai fcya Ala Tyr Ala l*u Sfer Ser gly Ala Ser SIS 520 S3S II® 11« Oitt 61 y Pt'o SXy Fhe· Thr ®y 6iy Ase Lee &«» Fha Lea i*ys 530 S3S S4õ 61·» §er fêr Ase Sar lie Alã Lys fh* bye y*i Thr Leu Asa Ser Ala 54S 550 SS5 5S6

Ala Lie» L«u Slís .Arg 1¾¾ Arg Vai Arg 11« Arg Tyr Ala Ser Thr Thr 54S S?õ §75

Aan liem Arg Leu lhe Vai ®ln Asa Ssr Ase am®. Ásp Vhs Leu Vai lie 580 S8S SgO

Tyr JkX« Ase fcys Thr i$e& Ase Lys A&p Aep Asp Leia Thr Tyr Ole Tbr SOS 000 005

fh« &gp L®» Ala ibr I3a« AOft §or Am Mst 0ly ae Ser 61y àsp Lys sis SIS S2Q

Aaai ΙΛ» 11« Zl* Sly Ala Ola Ser f^c vai âsr &se glu Lys He «as 630 035 64© ΡΕ1040192 430

Tyx IX* Asp Lys n,·? síu Phe xis Pro V»1 ©Ifí 6.4S 658 (2) INFORMAÇÃO PARA SEQ ID NO:43: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:43: ats *at oca aac a&T <m ast $&& cat sst aos Am um ott aca cct ítet. ãhr Asss Asa Ar® Se*· 0¾¾ Kis Asp Thr lie .fcy» VAl Tbr fc*s© X 5 xã IS A&C MST GAA TE8 CftA ACT AftC CAT AAT Oys, TAT CCT TXA ©CT ©AG ÂAT Aen Ser Sie i*eu Sin Thr Asii Jftia Asn SX» Tyr Pro L-eu Ala Asp Asn 20 ?.5 m CCA AAT TCA ACA «TA <&& 0AA TTA AAT TAT AAA OAA TTT TTA A0& ATS are aa* Ser Thr um ©X« ©X» s#au A#a. Tyx %-a si» phe Argf rt*e 35 40 4S ACT Q&A ©AC AST TCT ACS SAA 0¾¾ CTA (SM? AAC TCT MA ©?A AAA ©AT T&r ©lu Asp Ser Ser *&r Sl» i,sa Asp Asm se* Thr vai liye Aap se ss «a oca qtt ma aca mu att tct ©rr ©ta ma am αττ τϊα ©ar stt sm Ala V*1 Sly Tb* ©ly fte Ser Vai V»X Gly Gin Xie Una ®ly V*1 Vai ss "Ϊ0 ss ©ΘΑ ©TT ©GA TTT ©CT ©3© OCA -CSC ACT TCA TTT *»* CÍVA TCA TTT CTT 01 y Vai Pro Ptie Ala ©ly Ala X«e» Thr Ser phe Tyr ©Ir Ser Elsa I*ett 85 30 Si ÃAC ACT ÀXA T@G EGA &GT QAT OCT ©AC CCA TOS ftft® QCT TfT ATS ©CA As» Tfctr He Ttp Pt» ser Asp Ala Asp P*o Tip Xys Ala phe M*t. Aja 1Θ0 lOS 110 CAA STT SAA STA CTS· ATA ©AT AAO AAA ATA ©A© Q&3 TftT SCT AAA A8T 01a Vai Siv Vai x^u Ha Aap Lys siç siu ©lu Tyi Ma hys sei' lis 12Õ l:3â AAA ©e? CTJ* ©CA «AS TTA CA® CK3T CTT CAA AAT AAT TTC SAA GAT TAT by& Ala ifO© Ala sl« hm sla Giy hm Sl» Asa As» Pisa siu Asp Tyr 13.0 lis 140 48 â$ 144 132 288

33S 384 432 431 ΡΕ1040192 GTT MT GCG TTA RR? fCC TSS MS MA ACA CCT ?ffi AST ΪΤΏ CÍSA AST «30 V»l Asm Ale Leu hm S«X Tfp Lys Lys Thr vra hmi Ser Leu Arg Se» 14$ 150 155 160 AM AGA ASC CM 00T CQA ATA ASO SAA CH? TTT TCP Ç&A GCA SAA JKST S2$

Lys Arg Ser «X» 03 y A*g Π« &ε$ G'lti Leu Phe ser sln Ala Slu Series· 170 175 cat ttt cst aat *ce ATS cês tca ttt oca stt tcc aaa ttc oaa sre st#

Hl» *t>e &rg Asa ser Met Pro ser Fíie Ale vai Sor Lys pfe âlu v*x iso 185 iso qt& ttt em cca aca tat sca caa qct «ca aat aca cat tta rm cta S2*

Laa sito &*» Sro Thr Tyr Ala -61» Ala Ala Asa T&r Hl® Leu Leu Leu ass 2eo 2m TTA A&& «AT GCT CAA GTT TTT «SA «AA ÇAA T©S G&& TAT TCT TC» QAA #72

Leu Lys A&p Ala Giu ¥al sfee Qly 61« 61«, x«p «Xy Tyr Ser Ser 61u 310 21.5 220 SAT «TT ®CT «M TXT TAT CAT &0A CAA TTA AAA CPX ACA CAA CA& TAC 72-0

Asp Vai Ala «lu Phe Tyr Hia A*g 61» Leu Lys Leu Thr 61» 81» Tyr 22$ 2M 23S 340

ACT GiftC CAT TGV GTT AAT TGG TAT AAT STT SOA TTA AAT SGT TTA AGA 7SS Tíj.r App Si» cye vai Asm Trj> Ty» Aa» Vai eiy Léu As» «ly Leu Ar§

24S 350 3SS «st τϋΑ âcr tat «at «ca ts» gtc aa& rrt mc cm ttt esc asa «&a sis

Sly ser s&r Tyr Asp Ala Trp Vai Lys Fh® Asa Argf F&a As^t A*3f elu 2<J0 2«S 270 ATS AGT TTA ACT «TA ’.tTA SAT CT& ATT «TA CTT TTC CCA TTT TAT GAT «54

Mat Tfer Lea th.tr Vai teu A$p hmu Hm Vai Leu S&* »ro Sí»s Tyr Asp 275 a«« 205 ATT CGS m TAC TCA AAA 30® «TT AAA ACA SAA CTA- ACA ASA SAC ATT »12 ll<e Arg Le» Tyr Ser Ly* Gly Vai t*ys Tfer Slu Leu. Th% Arg· hs& Ile 2.90 2?5 300 TTT AC® «AT CCA ATT TTT TCA CTT AAT MT CTT CAC SAS TAT OCA CCh Md

Pfee TSir Ssp Fro Xle Vha ser Leu Asrt Thr JLea «Ixi alu Ty» 3ly Sro 305 310 315 330 ACT TTT TTS, λβΐ ΑΤΑ «&A AAC TCT ATT C6A AAA. CCT CAT TTA. TTT SAT :1605

Thr FAa Leu Ser Ϊ1* ®lu Asn Ser 11® Arg Lys Fro Hie Leu Fh.® Asp 325 .330 33:5 tat irm cas cm att gaa ttt cat »c® mt crr caa cct m* tac ttt josa

Tyr Leu ®i» ely II* C Iu Fhe Hl a Thr Arg Leu 01» Vrt» «1*/ Ty» 340 345 3S0 OSQ RAA SAT TCT T3'C AAT TAT TC-S TCT S6T AAT TAT STA M ACT ASA tim

Sly ftsp Ser Oh.e Asa Xys txp S®r 61y Ase. 'S.yr vai «lu Thr Arg 432 ΡΕ1040192 CC? A8T ATA «GA TCT AST AAG AC* ATT ACT TCC CSA ITT TAT ©Sã «AT US2 P"o Ser li* SSy Se* Ser lys Th* He Th* ser sro Pfee Ty* Gly mp. 3?6 39S 3M' AAA 3£T ACT GAA CCT GTA {M AÃ© CTA ACC ITT «AT «GA CA& A&A OTT iggò

Ly» Ser ítter 01« Pso Vai ©Xa Lys l*« ser Ph® Asp Oiy ©Ia Lys vai 38S 350 155 400 TAT C$A ACT ATA ©CT AAT ACA ®AC «TA ©0« «CT Tm CC<3 AAT (SG-T AAC 1348

Tyr Arg Tkr lie Ala Asa Th* Asp vai Ala Ala Trp Ptt> Asa Gly ι>γ& 46S êíO 4X5 S1A TAT TTA SS-T GTT ACG AftA CTT «AT TTT ACT CAA TAT «AT CAT CAA xãgg vai tyr teu «Xy Vai Tfer &ys vai Ά*ρ 4>he Se* ôls tyr Aep &sp ala 420 <m> 43δ ASA AAT «AA ACT ACT ACA ÇAA. AÇA TAT ©AT TCA MS ASA AAC AAT CSC 1344 ty« As» ©lu Thr Ser Thr ©1» Th* Ty* Ass;p Ser Lya Arg Aa» As» ®ly 455 448 445 CAT «TA ACT OCA. CA© GAT TCT ATT GAC CAA TTA CCS CCS 3ÃA AÇA AÇA 13 »2

Mia Vai Se* Ais Sis Asp Se* Xle Asg eia te» Pre» hre «1« thr Th*

4SÓ 455 4SS «AT ©AA CCA CTT ©AA AAA OCA TAT ACT CAV CA© CTT AAT TAC GCG ©A* 144 Θ

Asp «ia psò teu «Ia Lys Ala Tyr Ser His ala Leu Aso Tyr Ala «ia 4SJs 47® 475 4S0 w ttc m at» ca© ©&© mt cm cm aca att cca ttt ttt act tos ims cys Bhe IsíSM Wefc «ia Asp A*g Arg· Oly Th* II* p-ro Bh« Hie Thr Trp 485 496 455 ACA CAT AOA ACT ©TA GAC TTT T3T AAT ACA ATT «AT ©CT «AA AA© ATT 153-β

Th* Mis Arg Ser Vai Ãssp Fh* Phe Asa Th* II» Asp .Ala «lu £ys He

500 505 SIS ACT CAA CTT CCA Sffi «TS AAA GCA TAT «CC TBB tCT TCA «ST «CT TCC 1584

Thr «la Leu Pre< V&l vai sys Ais Tyr Ala 'Leu Ser $** «ly Ala s** SIS 520 525 ATT ATT «AA ©ST CCA SSA TTC ÃCA Útok S6A AAT TTA CTA TTC CtA ASA 1632 lis lie slu «ly **o «Xy Bhe Th* «iy fâly as» l»a L*a çhe Leu Ly» 530 535 540 SAA TCT AST AAT TCA ATT SCT AAA TTT AAA GTT ACA «TA AAT TCA CCA ISA® slu ser Ser Aen ser He Ais Ly» Stse l*y& Vai Th* L*a As» Ser Ala 545 550 S55: 550 GCC TTS TTA CAA CGA TftT CBT «TA ASA ATA OSC TAT «CT TCT ACC ACT 1738

Ala Leu Lea SXe Arg Tyr? Arg· Vai Arg Tis Arg Tyr Ala Ser Ite TAr

555 570 57S

AAC TTA 08A CTT TTT SW3 CA.A AAT TCA AAC AAT ©AT ITT CTT ©TC MS 177S

As» Leu Arg x^eu ph® vai Gin. Ser as» A«p POe l&v Vai íla 433 ΡΕ1040192 T&C ATT AAT MA AOT ATS? AAT MA d&T (SAT GAT ΤΤΛ ACA T&T CM. &CA 1824 Ty-r Ua Ash Thr f-fet: Asn Ays Asp Asp Asp Lesi Thr Tyr Gin 'Tisr sss SOO SOS TTT <3AT ers OCA ACT ACT AAT TCÍ MT ATO soa TTC TCOvOOT CA? AM? 187¾ Ajap í.ftU Ala Thr Tbr ASíí Oar Aen Kfit· <31y The Ser Oly mp Ly‘fi 610 61 S sso AAT GAA CTT ATA ATA GSA <3CA sm TCT TTC STT Ter AAT SM MA ATS Asrt <3151 .Lea lie lia Cly Ala Si« Sesr FAa Vai s&r Aar; Glis h;/a lia (Í25 630 535 ΤΑΎ Am ΩΑΤ MS ATA GAA rrr ATC OCA m cm. TTO TM 1050 Tyr Ila Asp Ayís 11a filu §?hs> sla Vr<s V*1 Qln Léu MS 5§β (2) INFORMAÇÃO PARA SEQ ID NO:44: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:44: 434 ΡΕ1040192

Μβΐ Αβ» Sr» Asas &m ÍUrg S«tf <31U 1 S

As» ser Ql.» ©1» -«Aff Asas. Mis 20

Pro asii Ser Thr teu OIis 01. m Lsvs 3$ 40

Thr ©1» Asp Ser s«r Thr slu Vel se $S

Ala Vai Gly Th« «ly 11« Ser V«1 6 5 ?0

Gly Vai ®r© »tm Ais ®ly Ala Leu

SS

Asn T&r lie Txp Fí:o Ser Asp Ala 1.00 aln vai si» vsl Leu Ha Asp Lys nS 120

Ly» Ala teu Ala alu ϊ*β« Gin Gly 130 115

Vai Asn Ala Leu Aso £ax Trp- Ly« 14S IS®

Hi& AiSp TSir Xle Lye Vai Thr Pro 10 15 A.sn oist %yx Fro teu Ala Asp Aso 3:6 30

Aso "fyr Lys <slu Pisa Lev Arg Met 4S

Leis itísp Asri Ser Tlir Vai Lys Asp SB

Vai Gly 01.53 H.® Leu. Gly Vai Vai 75 SO

Thr Ser Mie Tyr Sim Ser Pba Leu só as

Asp Paro Trp £»ys Ala Pjfee Het Ala X0S 110

Lys Xle Gly ©1m fyr Ala Ly« S«r l®5

Léu ©la Asn Asrs, gfte ©Xu Aap Tyr 14B

Lya Thr p-so Leu Ser La» Arg ©«r ISA ISO ΡΕ1040192 435

Lys arg ser ©1» ©ly Arg lie Arg 1Ê5 His? Phe Arg tes* ter tet Pr·» S*r ISO Leu ¥hm te» Px© Thr Tyr Ala 51» 19S 300 teu t*f$ Asp Ala Gin Vítl Aê «ly sie 21s Asg V*l Ala ©la Pb® Tyr Mis Argr 2.25 23» Tlsc tep Kl* Cy» Vai te» Trp Tyr 245 «ly Ser Thr Tyr ASfp Ala Trp Vai 260 Wssfc Thr Leu Tíur Vai L«u tep teu 37'5 2#0 Xis Arg Leu Tyr ser hys Sly vai 170 205 Pha Thr tep P*?» Ila Phe Se» teu 3OS 31S Thr te* teu ser lie el» te» ser 32 ã Tyr teu ©l» ©ly lis Gi» PJs© Hi© 348 ©ly l»ya tep Sar she Asís Tyr Trp 3SS MO Pro $mr 11« «ly ser ter fcy» 'Thr Í70 32S tiys ser Thr ©lu F«& vai si» hye 38S 300 Tyr Arg Thr lia Ala Ara Thr Asp 4 OS val. Tyr te« Qly vai Thr hy» Vai 420 Lyss As» 51» Thr ter Thr 51» Thr 43$ 440

Slu teu Phe Ser Sis Ale Slu Ser 170 275

Phm Ala Vai Ser í»ys Phe 31» Vai ISO XJW

Ala Ala Asa Thr «is teu teu te» 2S5 ©la «la Trp «ly Tyr Ser Ser ©lu 220 ©ia Leu tya Le» Thr ©1» ©1» Tyr 235 240

Asa V«1 «ly Leu Asa Sly teu Arg

SM SM

Ay» Sbe .&«» arg pisa Arg Arg ©lu 2g$ 270

Xl« vai teu. ph® Pr© Pte Tyr. tep

S«S L-ys Thr Glu Leu Thr Arg tep 11« 300

Asn Thr Leu ©la ©la Tyr ©ly Pr© 315 320 lie Arg Lys Pro sis teu te* Ásp 330 335

Thr Arg teu ©I» Pro Gly Tyr Phe 345 3 5«

Ser «ly As» Tyr Vai ©la Thr Arg

MS 11* Thr ter Pr» Phe Tyr ©ly tep 100 teu ser phe tep ©ly «1» Ly® Vai 395 400

Vai Ala Ala Trp Tro As» Gly Lys 410 415 tep Th® ter «1» Tyr asp tep ©In 425 430

Tyr tep Ser !*y& Arg as» teu ©ly 445

Kl» Vfcl Ser Ala ©la. Asp Ser lis .&sg Gin teu &*» Pro fílu Th» Thr 436 ΡΕ1040192 4 5β 4: i>$ &SQ Αίφ 61» Pm .Leu Slti Lys Ala Tyr Ser Hx a GlíS Leu Ãsii Tyr Ala 6iu 478 4?S 4¾¾ Cyss Fhe Mu Mar. Ola h&p Arg ASg •Giy The 11« Peo ÍM© Ph© Thr Trp «5 400 ^£3¾ Thr Me Arg Mr Vai Asp #í»e Fha Asn Thr He Asp Ala 61« t>Y$- íle 50® SOS SlO Thr 61« LSSX Sis Fr» vai Vai í»y« Ala S2 0 Tyr Ali leu Ser Ser sás 6Xy ÁXs Oer He Ue 536 61u Oiy Pr© Gly Pha S3S The Sly eiy A.*» LéU MS leu Ptee leu Lys Slu Ser Ser Asn Ser 11 & Ala i<ys ph» «<ys Val The íeii Aao Ssar ai a .5 í S ss-s 555 SS8 AÍS L«« Lee 6 In Tyr Arg Vai Ãrg lie. Ar-g Tyr Ala Ser Thr Thr 55-Τίί

Asa I»e» Axg Leis £4se Vai βϊη Asn Ser &gn. Asa Asp Vise i>e« vai XI e

530 S;ÍS SSS

Tyr 11« A8» Ly» YhP «*t Aaa Lys Asp A*.p &sp £e« Thr Tyr Olr» Thr 5S5 áOO gos

Sb» A®p L#Uí Ala *3sr Thr A*«. Ser Ase. «et «iy pfc* #*r <5iy Aep X,y» è'lí> 5í,$ S;aO

Aasi elu leu X.l© lie «3'ly Ais 0iu Sfer The Vai ser Asa Siu h/y» ΪΧ« «2$ ÍÍO 635 MO

Tyr lie A*j» Ly» lie 61a ®t*e Xl« Pr© v*X <3Xn L&u ®4S 65® (2) INFORMAÇÃO PARA SEQ ID NO:45: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:45:

ATS AAT CCA »AC AjVT C6A AST Sa C3VI 6AT AW ATA AAS §TT ACA CCT 4S 437 ΡΕ1040192

Hsfc Aart Pr® As» Asa £®r ©Xu His Asp Th? H» Lys vai Thr Pro 1 ã XO is aac » ©aa rr<3 caa act aac cat aat caa tat cct tta gct «ac aat m

As» Ser Glw &*m si» Thr As» Kls A®» Si» Ty:r Pro teu Ala Ag» as» 20 23 κ· cca mt tca aca c-m saa saa rm aat tat aaa « ttt tta agá .&ts 144 »re As» Ser Thr teu ©Xu ©X» teu As» Tyr Lys çlu *fce teu Ar© Met IS «0 45 ATT SA& «AC ACT TCT ACQ ©AA «V© CTA ©AC AAC VCT AG& Gm ΑΛΑ ©AT 192

Thr ©Xu *ap Ser Ser Thr «?lu vai teu Aep Assa ser Thr vai Lys Ά&ρ 50 55 S0- sem. gtt sss aca qsa att tct gtt sta cgs cm αϊτ n» ©gt άττ sta mq

Ala vai aiy Thr sly li» Ser vai vai ©ly sla xl® teu ©ly Vai Vai 65 TO ?5 gô GSA STT OCA TTT SCT 0©S OCA CTC ACT TCA TTT Τ.λτ CAA TCA TTT CTT 288

Gly Vai Prs» »he Ala ®ly Ala. teu Thr S*r »h« Tyr Ol» ter Sh« te» Θ5 m 95 aac ftiCT mã tm cm mt « ©cr guic cca tgs m© ©cr wtoq® %u

Aan Thr lia Tatp Pr» Ser Asp Aia Asp Pr» Trp Lys Ala Phe Met Ala 100 10s 1X0 caa «rr as* ©ta eis ata ©st *a© aaa ata sãs em tat ©ct aa* agt too

Cia vai GI« Vai teu 11» Asp lys lya íie ©1.» <31 u Tyr *x« &y» ser 1X5 130 125 AAA ©CT ©TT ©GA ©S© Tm CÃO C©r CTT ΟΛΑ ΑΛΤ SÁ? TTC aAA OAT ΤΑΥ 432

Hy» Ala leu Ala Gl» heis 01» «Sly I*®a Gla A»« As» Pha 01« A»p Tyr 1X0 05 i40 G-TT AAT «CG TTA. AAT TCC TGG AAG ΑΑΛ AC-A CCT TO mt Tm CQA AAT 480 vai Aa» Ala Ls» As» Ser Txp hya i*ys Thr P«e Ltm S&r Leu Arg ASO 14S 130 X5S 180 CCA CAC ASC CAA GGT CGA ATA ASG GAA CTT ΗΪ TCT CftA ÔCA GRA AÔT 528

Pr® Mis Ser Gi» Giy Acp ΪΧβ Ατφ Slu X<ew »he -Ser 01« Ala Glis ser 1S5 1T0 175

CAT ITT CfâT AAT TCC A®6 CCG TC& TTT' QCA «TT TCC &** TTC 6A» «TO S7S

Sis Phe ATH Jtóft ser Mst Sro Ser sha Ala Vai ser Lys lha <3i» vai

180 105 ISO «0 TTT cm CCA AÇA TXT «A Cila «J-ST GCA ΑλΤ AG* CAT TTA TTQ CTA S34

Lèu »he heu Oro Thr iyr Ala Sis Ala Ala A*» Thr Xliss Laa teu teu 155 200 30S TTA AAA SAT CKT CAA STT TTT GOA GAA <SAA tm GGA TAT TCT TCA GAA 0T2 teu Lys Asp Ala Sio VAI Wh» Sly GXu ©lu Trp Cly Tyr Ser Ser ©iu 210 3XS 220

®AT <STT ©CT ©AA TTT VAT CAT A©A C«A TTA ,AAA CTT MA. CAA CAA TAC 7:2 S ΡΕ1040192 438 Ãsp v&l Ma «lu Phe Tyr Mis Ar® Siss L«u Lys Lsu Thr «le. «X» Tyr 330 235 240 ao- gac ar mr αττ αατ tgg ί» aat «w m& m w ser tta asa T&r Asp Hi* Cy* M As» Trp Tyr Asn Vai 81y L«u Isn 81 y Lea &rg 245 2SO 30 (bst tca &a? tm mt «c& wíwm ftf me m& s&& 81 y ser fiir Tyr Aap Mm τχρ vai Lys phe ftâsn Ar® Mis Ar® Arg 8lu 2S0 2S5 2?D mxi act rtA act sa tta «ar cta att «ta crr ttc cca ttt mr «at Thr L&u tM vai Leu Asp Leo Xl« Vai &eu Fhe Fr© Fhe Tyr A*p 27S 230 285 ATT C80 TTA TAC TCA MA MS W MA ACA SAA CTA ΜΆ ASA SA€ ATT Xle Rrg teu Tyr Ssr Lys sly ¥*1 Lys TM Gl« Le» Thr Ar© Asp He 290 20» 300 TXT AOS «AT CCA ATT TTT TOA CTT AAT ACT CTT OWS S&S TAT MA CCA Fhe T&r Asp ftns lie fte» Ser Leu A»n TMe Χλ« ei» Sis* Tyr ©ly Pr» 305 HO 3L§ 320 ACT TTT TTS AST ATA 8AA AAC TCT ATI' CSA AAA MT CAT TTA TTT «AT f&r Phe L«u «er 12« «X» As» Ser XX e Ar© Lys Fr» Mis Leu Phe Aap 325 330 335 TAT TT& CAG 8SS ATT OAA TTT CAT AOS COT CTT CAA CCT «ST TAC TTT Tyx Leu Cio «2y He «lu Pk« Ki* Thr Ar® Leu «In .Pro «ly Tyr PM 340 348 340 esc .AAA «AT TCT TTC AAT TAT TOS TCT GST AAT TAT «TA «AA ACT ASA «iy Lys Asp $«r PM As» Tyr Trp ser sly Asm Tyr Vai ©lu Th* Ar© 355 300 3S5 CCT A8T ATA GOA TCT A0T AAO AGA ATT ACT TCC CCA TTT TAT 88A «AT ?n ser Xl« Ciy Ser Ser Lys Tfe He Thr ser F.ro Ptoe -fyr «ly Asp 370 373 3 SC AAA TCT ACT GA» CCT «TA CAA AA3 CTA AfiC TTT «AT «SA CAA AAA βΤΤ' Lys Se:r Tbr «lw Pró Vai 81» Lys Leu Ser Ph« Asp Sly Cia Lys Vai 3.35 350 355 400 TAT ®m ACT ATA SCT AAT ASA «AC «TA GCO SCT T58 SCO A»T G«T AAG Tyr Ar© TM II® Ais As» flu? Asp Vai A2-« -Ais Trp Pro àm 8Iy ftys 40S 410 413 «TA TAT TTA «8T STT ACS AAA «TT 8AT ITT AST CAA TAT «AT SAT CAA val Tyr teu 8ly Vai Thr Lys Vai A»p Ffee .Ser 81» Tyr A»p Aep 81» 420 425 430 7S8 sis m 4 S12

9SS 1003 1056 1104 11S2 1200· 1243 12SÈ

AAA AAT GAA ACT AÕT ACA CfiA ACA. TAT «At TCA AAA ASA AAC W «SC Lys Asses 81» Thr Ser Thar Sln Thr Tyr Asp Ser Lys Ar© As» Ae» «2y 435 440 445 ÇAT «TA AST «CA. CA8 «AT TCT ATT «AC CAA TTA CCS COt «AA ACA A£A 044 13 oa 1440ΡΕ1040192 439 Ή is Vai Ser Ala Gle Asp Ser Xle Asg ©1» Leu Tro Pr© Clu Thr Thr 450 4SS 460 SAT «AA COk CTT 6M AAA «CA TAT A©T ÇAT CA® CTT .AAT TAC «0« «AA Aap <> 1 u Pr© ;,«<. 'Sly hym Ala Tyr Ser His íSIí> Leu Aars Tyr M« 01« *SS 4?« 475 488 ΤΘΤ TTC Tm ATS CA« <StoC CST COT OOA ASA ATT CCA TTT TTT ACT ΦΘ6 Cys $%e Leu íter «In Asp Arg Arg ®ly Tftr XXe p*o The Phs Thr Trp 465 SSO * 495 ACA CAT ASA A«T <?TA GAC TTT TTT .AAT AÇA ATT ©AT SCT SAA AAG ATT Thr His Ar-g Ssí Vai Aáíp ©he ph« Asa Tht' ile Aap Ale ©ia i>y» xXe 5Θ9 ses sxo «tp caa ctt cm ©m om aaa gca tat scc tts tct tca ost qct toe Thr «la Leu Aro Vai vai Ly» Ala Tyr Ala Leu Sesr Ser ©ly Ala $er SIS S20 .52 δ ATT ATT SAA OST CCA SSA TTC &CA ©m SSA AAT TTA CTA TTC CTA AAA 21e lis Slu Sly &£& 01 y Mie Thr Gly Ol;y Asa Leu Leu Pb* Leu S*y* SM S3S 140 SAA TO? ÁCíT AAt TCA ATT SCT AÃA TTT MA STT ACA ΤΊΑ .AAT TCA QCA «la Ser Ser Asa Set? Xi« Ala t*y» Pfce Lys Vai Thr Leu Asm Ser Ala 549 SSO SSB 560 ÔCC TTÇ Tí'Ã CAA «3& TAT CSST STA ASA ATA €®C TAT SCT TCT ACC ACT Ala Imu Le« Sle Arg Ty* Arg Vai A*p Ik Arg Tyr Ala ser Thr Thr 5*5 570 S35 AAC ΤΤΆ 03& CTT TTT (STS CAA AAT TCA AAC AAT «AT TTT CTT CTC ATC Asa Leu Arg Leu Phe Vai ©1λ Asa ser Asa &sn Asp Vim Lem Vai 11« 500 S05 SSO TAS ATT AAT AAA ACT ATS AAT AAA CAT ÊAT SAT TTA. ASA TAT CAA ACA Tyr Xle Assí Lya Thr Pl«t Aso. Lys .Aep Aap Leu Tlsr fyr ©1« Thr 595 SÔO 605 TTT «AT CTC <3CA ACT ACT AAT TCT AAT ATO 0SÕ TTC <Γ«5β «0T «AT AA« Pb* Aisp Leu Ala Thr Thr Asa Ser Ase Set <âly Fhe ser ®ly Asp hy» 610 61:S 620 aat saa CTT &m am <s<sa oca saa tct rrc CTT tct aat saa aaa atc Ase 01« Leu II* ll» ôly Ala Ôlu Ser she Vai Awa slu Ly» II e 525 610 SIS 640 TAT ATA SAT ΆΜ hTA ®AA TTT ATC CCA βΤΑ CAA TTS TAA Tyr 11* Αβρ Lye Xl* Slu Ws* 11« ®rç> Vai «1» L*U 645 δ50 1488 1536 1584 1632 16 se 2328 1776 2S24 1872 1920 1811 (2) INF0RMAÇA0 PARA SEQ ID NO:46: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos 440 ΡΕ1040192 (B) TIPO: aminoacido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:46:

Mst Ara jpjro Ara Ara Arej Ssr Q.l« 1 S Asa ser ©iu Leu QIa Thr asís sis £0 Pro Asa Ser Thr Les* ®iu ©lu Leu SB ¢0 fhr 6Xtt Assp Ser S«.r Th* <31u Vai 50 ss Ala Vai ôly Thr ®Xy sle âer Vai 05 ©Ly Vai Pro Phe Ala <31 y Ala Leu Asm Mw ilú Trp Fr» Ser A«p Ala 100 ©X». Vai ©X» Vai Leu Xle AS$> LyS ixs ião L-ym Ala Leu Ala 01«. Leu ©i» ©ly 130 115 Vai ãsts. Ala Leu Ara Ser Trp Lys 145 ISO »r» His Ser ©X» 01 y Arg He Arg 16 3 Hia phe Asrsj Ara ser Mae Pm sar 180 ta» Phe Leu Pr« Thr Tyr Ala Ql« im soo Leu Ly® ftsp Ala filo Vai Pha ©1y 210 21S A*p vai Ala. çslu she Tyr His Arg 22S 230 Thr Asp Bis Cye Vai Ara Trp Tyr 24 â ©ly Ser Thr Tyr Asp Aia Trp Vai 350

Hi.s Asp Thr .11« Ly» VAX Thr Fm

10 l.S

Asn ©In Tyr Pm Leu Ala Ãap As« 25 20

Ara Tyr Lys Sis* Ph& 'Leu Axg we«. 45 issw: Α®ρ Ser Thr VsX Lys A$p 00

Vai Síy SI» Ile Leu ©iy Vai Vai ?S 00

Thr ® er phe Tyr ©Is* Ser Pha La»

Asp pr© τ*ρ Lye Ala ph* ííefc Ala iõs ii©

Lys lie <31 a <slu Tyr Ala Lys ser X25

Leis STis. Asis teu Pite £11 is Ά,&ρ Tyr 14 Θ

Lys. Thr Pr» Leu Ser Leu A**? As» IBS it©

©lo. Leu. Phe Ser Sle Ala ©1» Ser .X7B X?S

Phe Ala val ser Lys Phe ©1» Val iss iaa

Ala Ala Asm Thr His Leu Leu Leu 205 ©1» Slu Tfp ©ly Tyr Sar fiar ©la 220

Qln. Leu Lys Leu Thr ô-lia õlstt Tyr 235 240

Asn Vai ©ly Leu Asn ©ly Leu Arg 2S0 2S5·

Lys. Pise Ara hrsp Phe Ar© Arg fllu 205 230- ΡΕ1040192 441

Meu Thr Leu Thr· v*l Ms» Aap Leu 275 280 lie A»g iam Tyr ser Lys ely Vai 23Ú 23S Phé Thir ASp Pm ile Phe Ser &«« 3 OS 310 Titr Pite Léu Sar 11« Glu Asa 8«r 325 Tyr Leu ¢31¾ ely Ils Slu £h© Hla 34 β 31y Lys Aap S«r Pfe« Am Tyr ®ep 355 360 Pm Ser lie 8ly Ser Sér Lyjs Th.r 370 375 |»y« Ser Thr ©lu Fr© Vai ©1» Lys 355 3se Tyr Arg Thr Xle Ala Asa Thr asj> 405 Vai Tyr Leu ely Vai Thr Lys Vai 420 Ly# Asu Sla Thr Ser Vhr ©la Thr 435 440 Eis Vai ô«r Ala ela Asp ser ils «Sõ 455 Asg» Slu Pr© Leu Slu Lys Ais Tyr 465 470 5¾¾ ?2$e Leu «et $1¾ Aep Arg Arg 485 Thr His Arg Ser Vai A&p Ph« Pbw 500 Thr ©la Leu Pm Vai Vai Lys Ala. SIS 5®0 Xis lie Slu Qiy Oro Sly Ph« Thr §30 535 sis Ser Ser Aon Ser 11« Ala Lya 54â 550

Xle Vai Leu ph© Pr© Ph© Tyr A»p 285

Lya Thr Slu i,eu Thr Ar© Aap xl« 300

Asm Thr Leu eia elu Tyr ely i*m 315 320 11« Arg Lya Pr© Mis Leu Phe Asp 330 335

Thr Arg Leu ©ln Pr© ely Tyr Pite 345 350

Ser «ly Am Tyr ¥al ©lu Thr Arg 385 íle Thr Ser Pr© Phe Tyr ely Asp 380

Leu ser Ph« Asp ely ©ln. hym Vai 355 400 VAI Ala Ala Trp p*© A*a <SLy Lys 410 415

Asp ma Ser ©la Tyr Asp Aap Slts 425 43ft

Tyr Aap ser Lya Arg Am Am ely 44 S

Aap ala Leu Pr© Pie slu Thr Thr 4S0

Ser Mia ela Leu Asn Tyr Ala Slu 475 490 gly Thr Xis Pm Phe phe Thr Trp 490 4$£

Asrs Thr 11« Asp Ala ©1« Lys II e 505 510

Tyr Ala Leu Ser Ser ©ly Ala Ser 525 0iy ©ly Asa 'Leu Lee Pi«f Leu Lye 540

Pire Lys Vai Thr Leu Asa Ser Ala 5 5 5 56 0

Ala Lsu Leu ©la Aig Tyr Arg Vai Arg lie Arg Tyr Ala Ser Thr Thr 442 ΡΕ1040192 ses s?e s?s ksts Leu Arg· Leu Pite Vai <JX» Asa Ser Asn Asn Asp Pite Léu Vai íl« S6S S3S 590

Tyr lie Asn Ly® Thr mz &m Ly» Aa$» Asp Aep hm Thr tyr «1» T&r 595 600 605

Asp Lati Ala Thr St*· Ae» Ser As» »eç Siy *%e Ser siy Asp Ly* sie exS «20

Aan Si a Leu ΧΙβ 11* Ôly Ala filu S*3f Ph& Vai Sér ASA 8lU Ιφ8> ϊΐβ m$ «3Q 635 640

Tyr 11® Asa Lys Xle <Sla Fhe 31« SP*s* vai Qln Leu

6M5 SSO (2) INFORMAÇÃO PARA SEQ ID NO:47: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:47: ATS AAT CCA AAC AAT COÀ A0T 6&A ÇAT Hat Asa Pro .Asas. Asíí A«g ser 61.» Hl® 5 AftC AST 6AA tts CAA AÇT AA,C ÇAT A&T Asn Ser Gl» Leu 6l.tt Thr A«« HÍS Asa» 20 25 CCA AAT TCA ACA CTA GRR CAA, TTA AAT Oro ASSO Ser Thr Leu 61« 61« Leu Asn 35 40 ÂCT 6AA gac AST TCT AOG GAA 6TQ CTA Thr 8.1« Ser ser Thr ÓIu Vai Leu se SS GCA GTT GSS ac.a cm ATT TCT OTT 6TA Alo Vai 61y Thr Gly Xlê Ser Vai val m 70 ®3ft GTT CCÃ TTT GCT 666 GCA. CTC ACT 62 y Vai prs Rhe Alo eXy La» Thr S&T AÍS3 ATA AMi GTT ACA CCT 48

Asp Thr 11« Aye Vai Thr ppç» 10 15 CAK TAT CST TTA 6ÇT 6AC AAT 96 61b Tyr i»r« Ala Asp A&ri 30 TAT ARA om, TTT TTA AGA ATS 3.44

Tyr L-yã Slu Ph& Leu Arg Met 45 «ac ããc tct aca mh aaa qat 192

Asp Aon Sair Thr Vai Lys Asp çm ATT tta mt mt em 240 <sly 61« ile Leu siy vai vai 3? eo TCA TTT TAT CAA TCA TTT CTT 28&

Ser Pise Tyr Gin ser Pise Leu ΡΕ1040192 443 $$ 90 PS AAC ACT ATA T<3S CCA ftGT ΘΑΤ OCT GAC CCA TO» AAG GCT W AT® GCA Asm fhx 11« Trp Pua ser Asp Alá. Àsp fs-í> Trp Lya Ala l*h* A4« LOS 405 11© CAA OTT QAA OTA CTS ATA «AT AAG AAA ATA GRG GAS TAT »CT MA AGT ®.t» val «Xu val Leu Xle Asp Ay» s.y® Xle »1« ®lu Tyr Ala l«y» £«*" 115 123 125 aaa ©e* w oca &Rs Tm ca® »»t c» cm aat ms* wc oaa oat tat &y* Ala Leu Ala ©Ip Leu ®X» ®ly Leu Sl*l As» tal Pb* ®ltt Asp Tyx 13© 13¾ 140 m AAT OCO ra AAT TCC ΤΘ» AAG AAA AC* CCT TTA JWST TT© CGR AGT Val M» Ala Le» As» Ser Trp Lya lye Thx Pr® Leu Bei Leu Ajs§ Ser Í4S 130 *55 UQ AM ASA «BC CSA ®AT CQA ATA A®» OAA CTT TTT TCT CAA OCA G»A AST Lya Arg Bar 01» Mp Arg II* Ar» ©lu Lesai Ph* âer «2n Ala GIu Sér im 17© 17 5 CAT TTT CGT MT TCC AT» 00« TCA TTT GCA OTT TCC ARA TTC «AA ©X» Eis Ph& .Arg Asa s&? «is& Pr* ser Pise Ala vai ser Lys Pfe* ©1» vai 10« IA© UO ST» TTT CPA ca ASA TAT ®ÇA SM SST ©CA MT ASA CAT TTA TTS Cll Leu phe Leu Pr» Thr Tyr Ale «In Ala Ma Aen Tke· Mis L«u Leu L«» 195 ama sos m AAA «AT QCT C8AA STT TTT Θ8& 8AA «M. T8S SSA TAT TCT TGR GAA Leu Lys Asp Ala ©1» Vai Phe ©ljr ©lu ©1» Trp ©ty Tyr Ser &*r ©Xu 21© 115 220 SAT OTT ©CT OAA W TAT CAT ACA CAA TTA AAA CTT ACA CAA CAA TAC Asp VAI Ala »lu .©te® Tyr Mis At» Oltt Leu Lys Leu TAr »1» ©Ia Tyr 225 230 235 24© ACT «AC CAT TOT STT MT ffi© TAT AAT ΟΪΤ OÕA ΪΧ» MT ©ST TTA ASA Thr Aap His eys ml asa Trp Tyr Mn Vai ®ly A«m Asb »Xy Mu .Mg «4B 350 255

33S 432 40©

S.7S «34 673 720 755 «ST TCA ACT TAT QAT SCA TO® OTO ΑΑΑ TTT MC CGT TTT COC AQÁ ORA Oly Ser Thr Ty*· Asp Ala Trp Vai i«ys Fh* K*» Arg Pb* Arg Mg Clm 2S0 2SS 270 AT» ACT TTA ACT OTA TTA OAT CTA ATT ©TA CTT TTC CCA TTT TAT OAT H*fc Tkr L«a Thr val Leu A®p Lsu il« vai £*» Pb* Pro Pl» Tyr Asp 275 3S0 28S OTT C6G TTA TAC CCA AAA CSC CTT AAA ACA ORA CTA ACA ABA CRC ATT Val «krg Aeu iyr Pr© kys ©ly VeX hya Thx ola Leu Tbr Ar© Asp :íle 270 2 PS 300: 515 854 5.12 TTT ACO GAT CCA ATT TTT tCA CTT MT ACT CTT CA© m® TAT »©A CCA Pb* Thr- Αβρ Pr» Ϊ1* ««* S«r L«u As» Tbr Léu Sln. é-lu tyr &Xy Pr» P50 444 ΡΕ1040192 305 310 31S 3¾¾ ACT TTT TTiS AST ÂTÂ OÂA MAC TCT ATf C6A AAA CCT CAT Wft TTT «AT 1008

Thr phs Leu Ser lie Slu Asn Ser Xle Arg f»yss Pro His Lsw The Asp 325 330 33S tkf tm cm ®se w e« jnrr c»t Am c® ctt caa cct ggt tac ttt íos$ fyic Leu ®1« ©Xy Xle Sla Ph® Sis Ths Arg Le» «1» &xo Sly Tyr Fh« 340 345 350 >i «se AAA <3*T TCT T35C AAT TH TSS TCT <33® AAT TAT 6ΤΑ SAA ACT AGA XX©4

Gly Lys Asp 5«x Phe Αβη Tyr Trp Ser &ly As» ¥yr M GX» Tlar Argr 355 360 3«5 CCT AST Am SSA TCT AST Am ACA ATT ACT TCC OCA ΤΓΤ TAT GOA SAT 1X52 pro Ser He ely ser ser x»ys Thr lie Tis*' Ser Fro »he Tyr Sly Aep 370 37$ 380 AAA TCT ÃCT «AA CCT STA CAÃ. Aã® CTA AGC TTT GRT GGA CAA *&A GTT 1309 X.y» Ser Thr ele Fro Vai sisa Lys Leu Ser Phe Asp 0iy Ol» &y» Vai 335 390 395 40© TAT CGA ACT ATA GCT AAT ACA S&C GTA GCÍS 6CT TOS CCS AAT CtôT M© 12*8

Tyr ATf Thr 11« Ai a. Assa Thr λβρ VAX Ala Ala τχρ F:ro Assa Cfty Lys 405 410 4X5 om TAT TTA 0» CTT AC® AAA «TT «AT TTT AG* CAA TAT GAV β»Τ CAA 3.2*5 V&X Tyr Leu 8Xy Vai Thr· Lya W Aap Fhe Oer Sin Tyr A»p Mp Gin 4S0 425 430 AAA AAT attík mr AST »; CAA ACA TAT «AT *«A AAA ASA AAS? MT SSC ií«

Xtys As» Oio Th? ser Thr ei» Thr Tyr Asp Smt t&B Arg Aon A#» GXy 435 440 445 CAT STA rnv SCA CAÇ GAT TCT ATT CAG CAA TTA CGS OCA «AA ASA ASA 23S3

Hie Vai âa-r Ala slts Msp Ser xle Aetp Sln Aeu ftoa Sro Slt* T.hr Thr 450 455 450 OAT CAft CCA CTT CAA AAA GCA TAT AST CAT CAS COT AAT TAC S3CG GAA 1440 &8f* Slu Ara L-au Glu Ito Tyr :$er ais «1» Smt As:a Tyr Ala 61» 4S5 4TÔ 475 4S0 ®ST TTC TTA ATS Otô G»R CSX’ CST CCA ACA ATT CCA tTf TTT AOE? TSS I4ÓÒ

Cy.s Fhe Lesa Met 61» Asp Arp Arg Cly Thr lie Oro Fhe Fhe Thr Trp 4SS 4 m 495 ACÃ CAT ASA AST Sm CAC TTT TTT AAT ÃCÃ ATT SÃT GCT SÃA AAS ATT XS35

Thr eis .teg Ser Vai Asp ph« Phe Ae» »r Sle Aep M# Si» Ay» He

500 505 SIS ACT CAA CTT GCA «TA «®3 AAA GCA TAT SCO TTS TCT TCA QGT GCT TCC 1584

Thr Qift Leu Fro Vai Vai Lya Ala. Tyr Ala .Leu ser Ser Gly Ala Ser 515 520 525 ATT ATT GAA G&S CCA SOA TTC ACA CGA &SA MT TTA CTA TfC CTA AAA XS32

Tis li, a Slu Gly Fro sly Fhe Thr 01 y Gly As» Leu Leu Oh® La» Lys 445 ΡΕ1040192 530 5X5 âaO «AA XCT AGT AAT TCA ATT «cr AAA TTT AAA GTT ASA TTA AAT TCA «CA i $m 514t Ser ser Aon 5a τ il® Ais Lys Ph® bym Vai Thr Lav Aoxs Sei* Alã 545 550 155 560 SCC yrç tta C&ft C«A TAT mr «TA ASA ATA CSC TAT SCT tct acc ÃCT Ala Leu LOO. SIk Ai'Q Tyx Arg vai Arg Xle Arg Tyr Ala Ser Thr Thr 555 57 Ò SIS AAC TTA CSA crr Ttf ST8 CÃS AAT TCA ASC AAT «AT TTT crr sre ATC 1776 Asm Leu Ae^ hum Phe vai 61a Ase* ser Asa Asa A®p í%e L.01.J Vai Ilt 580 SSS 530 TAC ATT AAT AAA ACT ATS AAT AAA 3AT SAT «AT TTA ACA TAT CAA ACA 1024 Tyr xle Af«? Lys Thr &et Asm Lys Asp Aap Asp Leu Tisr Tyír «la Thr 59-5 «00 S05 rr? fôÃT CTCH í»OA ACT AC? AAT TCT AAT ATS TTC TCO SCI' «AT 1872 Asp Lê» Ala Th*: Thr AsB Ser ÂS» «ly PÍ5® Ser «ly Asp Lys «so 6lS 520 AAT SAA crr ATA ATA SíiA «CA QAA TCT TTC «Ti1 TCT .AAT AAA ATS 19:20 A.sn ela iíOO ile Xle «ly Ala «la Ser Phs Vai Ser ASil Lya lie 02S S30 6 35 640 ΓΑΤ •ΑΤΑ «at asa ATA &&& TTT ATC «CA «TA cm. TO TAA 1959 Tyr Xis Asp Lys xle Qlu Ph« 51« Aro vai GXse Loa 645 ε síí (2) INFORMAÇÃO PARA SEQ ID NO:48: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:48:

srt Asa as» .as» Ajc$ Ser ísia Mis Asp Tár II® Lys Vsã Usar Vr» 1 & ' 10 IS A«á mr Wh Leu aln Thr Asm Ris A»» Gin xyr Frs Leu A1A âap As» 26 2$ 36 í*ro Asa. Ser Vhr Leu 81« 431» Leu A»n Tyr Lys Giu Vtae Leu Argr Hefc 3S 46 4? »r si» Asp ser ser f&r vai Leu Jtsp Am ser Thr vai tep 50 SS $0

Ala vai ôly tfer 01y lie Ser v*l Vai «iy si« iXe Leu Sly vai vai «s 70 i% m 446 ΡΕ1040192

Oly Vâi Pec- Âls Gly Ai* ^e» “Pfcr §e« P&e 'Tyr Sln Se* Phè Leu 35 9« S5 a,ss Thx íSe trp p*r« S«r A®P **« Asp Pre Tsp tys Ais Pfce Met Ai» ΙΟβ io.s no 8ltt V*1 81» vai te» Um ·*®Ρ ky* ty* ii* <ϋ» Giu ty* Ai* tye S«r xis x^o 22$

Lys Ma te« M» Giu. teu. Sl» «Xy teu ®1« As» As® phe ele Asp Tyr 1;30 13-S 140

Vai Ase Λ.!» te» Awn Ser ’Srp ty» bys Tfar »r<s Leu 8«y .1*0» Argr Ser

14 S ISO ISS ISO

Lys Arg Ser Slat Asp Arg lie Arg ei» &®tó Pfe* Ser 81» Ma M» Ser 3,6 S 170 175

Bi» íftm Mg Asm se* Ket. P*?«» P*x Pb* Ala Vai s-er by» Ahe Si» Vai 180 3.85 180

hm.í pfce lsu pró «riar Tyr Aia 81» Ala Ala As» Thr His teu teu teu 1SS *90 aOS te» ty» Asp Aia 81» Vai £>&e GXy 81» 81» Trp Gly Tyjr S«r Ser cílu a .10 2XS 220 A»p Vai Ma Oííí Ptse "Tyr líls Arg Sl«t te» Lyo te» ftur 81» 81» :tfyr .325 330 23S 240 l&r Agp Hl» Cyo V*1 Ao» Trp Tyr Ae» Vfci 81 y teu A*» 81y teu Árg 2:45 350 255 <31 y Sor Thjf Tyr Asp Ala Trp Vai Lys P&e As» Arg Phe Arg Arg 81« sso sès 270

Wet Vhr teu Th.r Vai teu Aap te» lie ‘Vai teu Phg ppo Phe fyr Asp

275 280 30S

Vai Asg· teu Tyr Prc tye sly vai ty» ffer 81» te» fhr Argr Asp xie 230 aâs soo PM® TM: Aap Pro 21® Pite Ser te» Aso yhr teu 81» 6iu Xyr sXy Fr» 005 310 MS 338

Fltse teu ser 21 © @1» As» sor lie Arg tys Pre Mis teu ph» Asp

32S 330 MS

Tyr teu olo Sly Ile Slu PMe Hls fiar *tg te» Gie Pr» Gly Tyr· Pfee S4Õ 345 3SÔ aiy tys Asjj Ser Phe A»u tyx τχρ Ser Gly Ase Xyx Vai 8i» Thr Arg 3SS 350 353

Pne Môt 21«· eiy ««*· S«*· 2*y« Tihr Πβ ?fer Ser Pro Phe lyr Gly A»p 3?0 3?S 380 447 ΡΕ1040192 .Lyai ser Thr Glu Fr© Vai Gi» Ly* Le« Ser Ph© Asp ôly >31» Ly.» Vai 3S5 3S0 355 4Q9

Tyr *rg Tfer Ile Ma Asn Thr Aap Vai M« Ais Trp Fr© Asa dy tys

4®S 410 4ÍS

Vai Tyt L*ú 01 y ¥al fhr Lys ¥al &op Fho Ses? Gia Tyx h.sp Asp Slft 430 4125 4.30

Lye Asm Gl» fhr Ssr- Thr Qln Thr Tyr hm S«r tw* AT0' Asn Am. QlY 435 440 445 KÍ.S V«1 Ser Ala Sl« Asp Ser Ile Asp Gla teu Ps© Fr© <31« Th*: 5&r 4S0 455 4€0

Asp @i« pro Soeu Slu Ly© Ala Syar Ser Bi» «1» Le» Asn Tyr Ala Gltt 4$$ 4?0 4 TS 480

Cys Ph© Lao Me«. GX» Assp Arg Arg Sly Thr ll© ftro í?3ne Phe Thr Trp 485 4S8 4^5 TJsr Bi» âx§ Ser VAX Αίψ Vfce I?he Am Thr lis Aãp Ala Glu Lys 1 ia SOS 505 5.5 0

Thr Gin Leu Fr© vad V«1 tym Ais Tyr Ala Lm Ser Ser ely Ala ser 515 520 535 ik lie fílis Giy Pr© Gly Phe Thr GXy ®ly Aan Lm Le» Fbe Lsu Lya 530 535 $40

Gi« Ser Ser Am ser '11© Ala j#y* phe &ys VAl ttt Leu Asn ser Ala 545 550 $55 S49

Ala Lesi Leu sin Arg Tyr &rg Vai Arg? Ha ftrg Tyr Ala Ser Thr Thr SIS 530 515

Am Leu Arg Leu Ph® V©1 <S1*I ASft Ser Α0Π Aon. Asp Phe Leia Vai 11© sso s$5 si9

Tyr 11® Am Lyss Thr »st hmti L^b h&p Amp Ãssp Lau Thr Tyr 0.1» Tfer §m $Ô0 SOS

Phe Aep Leu Ala Thr Thr M ser Asa tist Gly PSs® Ser Gly Abj* Lys 0X0 SIS 6-2S

Am G.Xu Leu fie Ile Sly Mi 01» Ser Ih® %1 Ser Asm Giu hya 11© ®35 $30 $35 S4Ó

Tyr Tis Asp Lya XX© Glu Fh® Σ1& Pró Vai Gin. Lo»

04S ISO (2) INF0RMAÇA0 PARA SEQ ID NO:49: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases ΡΕ1040192 448 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:49: M-S **T GCA AAC Mf CG* A©T ©AA OLT SAT ACG ATA AAG STT ACA CCT SSat: Asa Pm Asa Aaa aeg ser ©Isn His A»j» Thr rl« l*ye Vfcl Thr Sr© X § ifâ IS AAC AC-T GAA TTS om ACT AAC C&T ΑΛΤ CAA TAV CCT TTA ÊCT GAC AÂT Asa Ser ©lu Leu sin Thr Assa His ft&s ©is Tyr Fro Ais &sp Asa 20 2S ao CCA AAT TCA &C& OS» GSA SAA TTA ΑΑΓ TAT AAA GAA ITT TSA AGA ATS tro Asa Ser Thr Leu ©lu Glu &su Asa Tyr l*ym ©!**. Fhe Lee Arg 35 4S 4S act mk s&c agt rer aos ísaa me cm sac aac tct aca opta aaa «at ISsr Giu Asp- ser Ser fiar ©Xu Vai Leu Aep Asa Ser Thr Vai Lys Asp SO 55 «o OCA ©TT ©QG ACA -GOA ATT TCT CTT CTÃ OGS CAÍ? ATT TTA ©e% fsTT GTA tie Vai ©ly Ttor ©!y Sle Sor V»1 Vai ©ly da lie Leu ©ly vai vai SS ?® ?S 80 &GA STT CCA TTT SCT GGG GOA CTC ATT TCA TXT TAT CAA TCA TTT CTT ©ly Vai Fr» Pfe& Ala ©iy .Ala unt T&* Ser Ftee Tyr sis Ser Pt» Leu as 90 9S AAC ACT ATA TQÍi CCA AST GAT GCT SAC CCA TOS AAS GCT TXT ATS GCA A*n Tfcr lie Trp Ρτα Ser Aap Ai» Asp Fr© Trp Lye Ala vise Met Ala ao® 105 no CAA STT GAA ©TA. era ATA OAT Á&G AÃA ATA G*G SAS TÀT CCT AAA AST «1» vai «1« Vai Leu Xle h&p Lys Lye lie ©1« ©la syr Ala Lys Ser 115 120 125 AAA ©CT CTT GC» SAÍ? TTA CAS «ST CTT CAA AAT AAT TT© β»Α «KP TAT Aya Ala Leu Ala t2Iu Lesi Gin ©iy Ιίβϋ ©1» Aaa Ass Vfe® Glu ksp Tyr 130 135 140 STT A&r 0CS3 Tffi AAT T0C TSS AAS AAA M» OCX TTA AST TTS C5BA AAT v&l Am Ala Leu as» Ser Trp Lyss Lya Tlsr Fra Le« Ser Leu Arg .Ãsa 145 150 153 1^(5 csa cac asc caa em <m ata *as gaa ctt ttt tct caa sca gaa ast pna His Ser ©ia Gly Arg Xle Aarg· Ôlu Leu Fhe ser sia Ala Slu Ser 155 xm tvs 48 144 íss 240

2SS 33« 384 432 48® 528 576ΡΕ1040192 449 CAT rst CQt AAT TCC ATS CCS TCA TTT SC» GTT TCC AAA. TTC SM <3T$ Hle Mie Arg Mn S&r Jtefc Mro Ser Phe Ais Vai ser Lys Fse 61 u Vai 180 3JS 190 CTS TTT CTA CCA ACA TAX OCA CAA SCT SC» AAT ACA CAT TXA TTS CTA tóa ρϋβ Lôu Fro Thr Xyr Ala Sim Ala Ala Asa Tíir Sis imt SLmu X*a 135 Mú SOS Jffi AAA «AT SCT CAA ΟΤΓ TTT SGA GAA (MA TSS SSA TAT TCS TCA SAA &®u Cys Αίφ Ala sla vai <Sly Slu Slu Trp sly Tyr s*r ser £lu 216 21S 356 <3AT ©tt ©ct oaa -TTT tat cat assa caa tta aaa ctt aca caa caa me Asp vai Ala Slu 9h* Tyr «4» Argr «1» &®u Ly· i#w Tlw Sln Cln Tyr 22S 230 SIS 340 ACT OAC CAT 'ÍBT STT AAT TSS ΈΑΤ AAT GTT SSA TTA A&T SC5T TTA ASA Thr Asp Hls Cy« Vai Asa Txp Tyr As« vai Qly Leu Asa SXy Lee Assg 245 250 255 βατ TCA ACT m βΑΤ «CA TGG «TC ΑΑλ TTT AAC COT TTT CSC ASA OAA Sly Ser fbx Tyr Asp Ma T.rp v«x Lye £ts© Asa ftrg Ph® Arg Arg Sim 266 265 276 ATO ACT TTA ACT ΘΪΑ TTA CAT CTA ATT STM CTT TTC CCA TTT TAT «&T Mat Tb*' bem Thr V«1 1«*» »*p *»*·>·« ti* Wa.1 j&gEp 2$0 ZSS «Tf 003 TTA TAC CCA AAA βββ GTT AA* ACA SAA CTA ACA ASA <&£ ATT v&l A*g A*« Tyr wxta Lys <SIy v»l &y* Tfer «lu £>*i& Sb* A*©· Asp xl« 290 295 160 TTT ACS ®»T CCA ATT TTT TCA CTT AAT ACT CTT CAS βΑβ TAT SSA CCA Aha Thr Asp sr® 21« 9b» i«« Mn Asa TAr Aaw «1» elm Ty# «ly Frs ies 310 31S 326 ACT TTT TTC AOT ΑΤΑ &ΆΆ AAC TCT ATT COA ΆΆΑ CÇT CAT TTA TTT SAT f&r Tfee Leu ser Ϊ2* βία Asm Ser Sl© Arg cys Frra Mis l«8ts. A:h.® ftsp 325 330 33.5 mx TTA CÃS SCO ATT GAA- TTT CAT ACS COT CTT CAA CCT SST TAC ΤΓΡ Tyr Lea Sla Sly 11« ©lu 0h« Mia Thr Arg .Leu ola Pr& Sly Tyr 340 345 350 SSa AftA SAT TCT TTC AAT TAT TOS TCT COT AAT TAT CTA «AA ACT ASA Cly Lys Asp Ser Ph# Asa Tyr Trp $#r 0-1 y A«a Tyr vai SlM Tkr Arg 355 360 3SS CCT AGT ATA CCA TCT AST MS ACA ATT ACT TCC CCA TTT TAT ©SR CAT vxo Ser Σ1« Siy â«r Ser X.ys Thr 11« Thr S*r 9·ηρ ΡΉ® Tyr Ôly Asp 376 375 300 ARA TCT .ACT 6AA CCT ΟΤΑ CAA AAS CTA A0C TTT βΑΤ OGA CAA ARA ÔTX Lys Oer Thr olu Fr© Vai SIjs Lys heu Ser Ptoe As® Sly -Gla Ly.s vml 1SS 399 395 466 634 67:3 720 768 816 S5-1- 560 1008 1656 1164 1152 1200 ΡΕ1040192 450 t»T am act Am eor aat aca ®rc ©m ece ser ts® cca aat oqt aas Tyr Ar® Tbx He A-la As» Th*' Asp Vai Ale Ai» trp Pr© Aan Oly ly* «©5 4&8 41S sm mt fm õer oro ac® aaa sto qkh m ast caa ta« «a? «at cãã '«al yyr íJly v* i Thr r..y-s Vai Asp PAís Ssy Gin Tyr hs.p Asp Gla 430 42S 430 A&A ΑΚΓ CAA ACr ASST CA& ACA TAT ©AT TfâA AAA ASA *AC> Mí SSC Lys Asa Slu ftr «er ttor ©X» Ua* Τγτ A»p Sai- &ys Ar$ *»» Am Oí.y 415 440 44S CAT «m m% ©GA CA0 SAT XCT ATT SAC CAA ΤΓΑ CCS ÇÇA Stt ACA ACA Sis v»X ser Ale ©1» A«p Ser Jtle Asp ©X» te« Pr© Pr© Olu Thr TAr 4SB 455 4S0 SÃT e» CCA CTT GA& AAA ©CA TAX AST CAT CAS CTO Ã&X TAC ©CO ©AA Asp ele Pr© Le» ©1» Lys Ma Tyr Ser ffis ©X» leu mm Tyr Ala ©1® 4£$ 470 47 5 400 WT TOC TTA ATS CAS SAC Cm CST SSA ACA ATT OCA WP TOT ACT TS© Cy* Phe te» **efc SX» Asp Ar® Ar® ©Xy tte He Pr© Jhe P.he Thr Tx& 4Í5 m 455 ACA CAT ASA AQT GTA Í3AC » Wf AAT ACA ATT «AT SCT CAA AAÍi ATT TM? Eis &rg Ser wal Asp Pfc® Phs &sn Thr He Asp Ala Qi.ii Lys Ila 400 SP 3 510 ÂCT CAA CTO CCA «TA ©3® AAA ©CA ΪΑΤ GÇÇ TOS TCT TCA ©©? SCT TCC Tfar ©X» la» »m VAI vai Ly» Ala Tyr Ala tess ser ser ciy Ais ser 5X5 520 535 ATO ATT ©AÀ SCT CCA SOA TTC-ACA QCA SOA AAT TOA CTA TTC CTA AAA IX® He Siu Sly Pr© ©Xy PJR* Thr Oly ©X;y As» Leu Lee Phe leu Lye S30 335 540 GAA TCT AOT AAT TCÃ ATT SCT AAA TTO AAA STO ACA TTA AAT TCA ©CA sly s®r Ser As» ser Xie Ale cyo Piw tya Vai m*· Lmi Asn ser Ala 545 SS8 55® 540 «CC TOO TTA CAA CGA TAT COT CTA ACA ATA CSC XAT SCT TCT ACC &CT Alà Lea Çlis A»gf Tyr Aieg Vai Ar® He A**$ Tyr Ais Ser ?te Tfer 545 570 SIS AAC TOA COA CTO TTT «TS CAA ® TCA AAC AAT mt XTO CTO CTC ATO Assí le» Ar§f Leu Pte© V*1 SXrâ AS» Ser AAA Asm ftsp Pbe l*e» Va.I lie 580 585 S50· TAC ATT AAT AAA ACT AT© AAT AAA 0AT SAT ©AT TOA ACA TAT CAA AÇA Tyr He Asa Lys Tfer Hst Asss Lys Asp Asp Asp Lea Thr Tyr Gin Thr 545 5C0 £05 TTT wli CTC aç& ACT ACT AAT TCT AAT ATO QGG TTC TCÕ ÍAJT CAS’ ÁÃQ Ffce Asp teu Ala Tbr ftt Asn ser Asa Me£ Õly tAè Ser SXy Asp Lya sie «is 520 13¾ 5 1344 13*3 1440 1458 153$ 1584 1833 1«80 1738 1775 1834 1871 1320ΡΕ1040192 451 AAT GAA Wfsn V A A ATA ATA OCA íSAA TCT TTC GTT TCT ALT OAA. ΑΑΑ AT Ase 62 S Via Leu lie lls ©Xy 630 Ala Gla Ser PA® Vai 535 Ser &SB 01 a Lys· il 54 •JAT ATA GAT AAG ata SAA TTT' ATC CCS. gta CAA TTC TAA Tyr lie Assp Lya lie 645 Olu lha li® Pr o Va I 6 90 Oln Leu (2) INFORMAÇÃO PARA SEQ ID NO:50: 19 S 3 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:50: m&ti fum Ãen Asa &rg Ser SKLu Mi® Assp Thr- n® i^y» Vai Thx 1 S 3.0 15

Ser ©1« Leu C3I« Thr ftsu Hi s Asn Sin Tyr Pr o 1«®« Ala As:p Asn 20 25 30

Ets» A$S» Ser Thr Leu ©lis β!« Leu Asn Tyw Ly® <ílsx Pfcsss Le» A**f Wssfc 39 40 45 ffcr Slíi Asp Ser Ser rhr <3.1u Vai Lee Αβρ Me& Ser Thr Vai Ly® Asp 50 55 60

Ala Vai Gly tbr ©ly Xle Ser Vai Vai ©Xy Gin lie Leu Gly V»i Vai 65 30 ?S SÔ sly Vai Oro 8he Ala aXy Ai» í»e« Thr Ser Ph« Tyr Gi» Ser p.he Leu 85 80 3.5

Asa Thr il e Trp Ser-Asp Ala Asp pro Trp Lys Ala pfee «et Ala 100 105 110 GXn Vai 6lu Vai Leu lie Asp Lye Lys lie slu ela Tyr Ala Ly® Ser 115 130 .125

Ala Ala Glu. Leu <5la GXy Leu SI a Asa A»rt JPh© 01¾ Aep Tyr 130 135 140 ml A*n Ala Leu Asa Ser Trp Lys Lys Thr 8ro Leu Ser Le» Axgt as» 145 ISO IS5 150 pro ais ser ©la eiy Are lie *rg 01« Leu Sles s«r ele Ala ©1« ser 155 170 175

Mi® Phe Ate? Asa 6sr Wefc Vro Ser Pha Ala Vai Ser Lys phss Viu mi ISO 185 13Ô 452 ΡΕ1040192

Leu Fhe te» Fro Thr tyr Ais 01» xss soo teu Lys Asp Ala 61» V&l RS*® ®Xy 210 51S «»p V&l Ala eltt Fhe Tyr Mis· Arg 22 S 23« Thr A»p «is Sye v*l &sss Trp Tyr 24 S Sly Sei' Thr Tyr Asp Ala Trp Vai 25» vm. Thr teu Thr Vai Leu Asp Leu 27 § 28Ç Vai &eg Leu Tye Fe® Ly» euy Vai 250 295 Fhe Thr Asp Fro 11« FJ*e Ser Leu 3QS 31» ytir Phs Le» Ser Ha alu as» ser 32 S 5Vr teu ®1» GXy Xle <*Xu Phs3 His 140 8ly Ly» Asp &«* Phe A»» Ty*' Trp 355 MO Fre Ser II s Sly ser ser Ly* Tfcr TW 375 Lys ser The 01« Pra vai si» Ly» 18 5 3S?Q Tyr Ar<j Thr 11* Ala As» The Aap 4 OS Vai Syr Lais siy y«X The Ly» Vai 428 I»ye Aa» OIu «sr Ser «ar SI» Thr «35 «o «ia vai Ser Ala cila A*p ®ér xie

450 4SS

Asp slu ?ϊ« Leu Sltt Lya Ãlv Ty» 4&S 470

Cya Ph* teu Meh sln A&p &rg Aeg 4BS

Ala Ala AS» Thr His Leu teu Leu 205 siv Slu. Trp Sly tyv Ser Ser Slu :33:-0 SI» teu Ly» teu Th*· '31» Sl« Tyr 235 240

Aso Vai Qiy teu AStt Sly* teu Arg 250 Sl$S

Lys The 0lu teu ar Argr Aap Il« 300

As» Thr teu Slu Slu Tyr Sly Frv 315 320 XI» Aeg lys Pr» Bis Leu pfe* Aap 130 335

The Ars teu (31» Pro SXy Tyr Pte 3*S 350 C-1 y Aís». tyr- Vai Slu Thi% A.í. 3$ 5 ile Thr Ser Pr» Phe Tyr Siy Aap »0 teu Ser Fhe Aap Sly 0Xn Lys Vai 353 409

Vai Ala Ala T*p Fe» As» Sly Lye 418 415

Aap p-be Ser 01» Tyr Asp Asp SI.» 425 430

Tyr Aap Ser Lys Arg Aaa* *a» Sly 445

Aap Gin teu Pr» Pr» Slu Thr 3tsr 450

Ser His βία Leu Asa Tyr Ais. Slu 475 480·

Gly Thr íle Fr» Fhe Fhe Thr Trp 430 45:5 453 ΡΕ1040192

Asa 505 Thr Xl-e Asp i ti a «1» fcy» 510 Tyr Ala Leu Ser & í#r Qly Ais Ser 525

Thr Hiss A.r'3 ssr V&l mp Pi® Ph® soo

Th* Glii Leu Fro vsl V&l Ly® Ala

Si5 53 D Èily Qly A*» &®u Leu ahe .!&«. fcys 540 p&s i*ys vai T&r sms Aaa ser .Ala 555 M® Arg 11» A*S Tyr Ala ser Sfcr %r S7í! 57S Asm Asm Asp Flie L>eu Vai lie 5S0 Asp Asp L®tt xhr Tyr ei« f&r SOS Mas Qly Ffea Ssar &ly Asp leya 520 Ph* V«i Ser Asm <31 a Lye ile 615 640 Vai ela. í/®u soo lie lie 015.¾ Qly Pr* Siy Ph® Tile 530 535 <5 Lu Ser Ser Asn Ser li® Ai® Lya

545 55S

Ala Leu Leu Slsri itegf Tyx Arf Vai

Asa £>a«. Arg Leu &fea Vai <S1» Âsa Ser

Sâé 58 S

Tyr Ué Asa Lys Thr Mat Asa X.y«i Aap

55S ãÔS ffctós imp hm* Ai» ffer Siur A«w Ser ftrn «0 515

Tys; lie Asp Lys Ile Slu pí» lie fco £45 (2) INFORMAÇÃO PARA SEQ ID NO:51: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1956 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1953. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:51:

Km «at cc«. aac Kat. Asrs. Pro Asm i AAT ÇGA AST ftsu Arg Ser a

sm cat sai1 AC® ata aa,® <&? «ca ccr <3.1** Ms Aejs Thr xla l»ys vai T&r ?ro 3-0 %H 48 AAC AST S®A ΤΓ5 CS& ACT AAC Rmi 5er ôiw Leu Gin Thr Ae» 2:0 CAT AAT CAA TAX CCS TTA OCX «AC AAT 56 531« As» Ôin Ty* íre Leu Ale Asp Asr 25 30 454 ΡΕ1040192

CCA Ά&Τ TCA AC» CTA «M «A* TO MT TAT MA «ΛΑ TTT TTA AÍSA pro Aan Ssk T&íf toa «1« 01« teu As» Tyif i>ys «la te» Arg

3$ 40 *S

ACT GAft SSC AST TCT AC® «&& «TG CTA «AC MC TOf AC& «TA MA SAT

Thr <S1U Asp í«r te.r ár 01« V«1 te» Asp Agra Ser TAr Va.l Ay« A*p 56 85 S®

OCA «TT «GS ACA ««& ΑΪΤ TCT GTT «TA 060 C3W5 ATT TTA QSV «ΤΪ «TA

Ala vai «ly T&r «Xy Xl« Sar Vai V»1 Gly «ia lis teu «Xy V*1 Vai 65 30 75 60 OOA rnt CCA TTT aca- «GO OCA ctc ACT TCA ITT TAT CAA TCA TTT CTT (sa-y Vai Vso *im Ala Sly Ala te» Thr Ser She Tyr «1» Ser Pb.® teu ss se $5 AAC ACT ATA 7GG C£» AST «AA «AC CCA Τββ AAC O» TTT ATS OCA MA Asn Thr si® Te& m> Sar «1« Αβρ Ps?«s T*p I.y* Ala Pb® «®t Ala «1« leo ms ii ff OTT βΑΑ «TA CTO ATA «AT MS MA ATA OAS CÈA« TAS' OCX AAA AST MA Vai «lu Vai teu XI* Asp Lya bys XI* «Xu «1« Ty* Ala l»y* Ser Lya U.$ 126 125

SCT CTT «CA «AG TTA CAO «®Ç CTT CAA AAT AAT TTC GAA «AT TkT CTT

Ala te« Ala «Ir* 1·«« «1» cly teu «la ask As» F&e «iu Aap Vai

136 IBS A4V

AAT «03 TTA AAT fCC T®S AftS AAA ACA CCT TTA AST TTS COA AST MA K*m Ala teu Mn Ser Trp Ly» hys Thr Sr£> teu Ser teu Arg Ser l»y®

J45 ISO 1SS

A&A AQC CAA «AT OSA ATA AGG SAA CTT TTT TCT C&& «CA «AA &ST CAT Arg Ser «1» A®p Arg lie Arg ol« teu Fbs sar Ola Ala 01a Ser Hia HS5 t?6 XIS TTT CST ΑΑΓ TOE ATS COO TCA TTT «CA «TT TCC AAA TTC «AA. «T« OCO Fba Arg A*a ser Kaç. bra ser *b* Ala vai ser h%» Pise «iu vai tea

186 105 ISO TTT CTA CCA ACA ΪΑΤ SCA CAA «CT «CA MT ACA CAT TTA TTS CTA TTA 9h® teu Fro Thr Tyr Ala «Ia Ala Ala Aan Tfcac Hie teu l.eu teu beu 19S 206 205 AAA o&T «CT CAA CTT TTT «SA «AA SAA TOO GOA T&T TCT ISCA CAA «AT lyx Aasp Ala «la Vai Me Oly «1» trp «ly Tyr Ser Ser «lu Asp 210 215 220 STT GCT «AA TTT TAT CAT MÂA CAA TTA AAA CTT ACA CAÍS. CAA t»C ACT Vai. Ala Sla Ohs Tyr Kl.® Arg 02» teu bys bea Thr Slss Sln íyr 2SÔ 235 «AC CAT ΤίϊΤ «TT AAT TCC TAT MT «Tt «GA TO AAT «6T TTA AOA «OT tp Kis Çy» v*l âsn Trp Tys* Aars Vai Gly teu Atn «ly teu Arg Gly 245 250 255 540 3 86Í 336 364

43S «S6 S28

5‘bS «24 €72 720 76» ΡΕ1040192 455 tCA *cr mi qat «ca y«« stc ma ttt aac cm ttt coe aga ®m ato Si»r Thr T yx' Aíí v> Al'â TrÁ VA Λ LyA Fh*? A®» Α ν A F AAÇj'1 ^'' a t. «0 «s «e iis

ACt TTA ACT «TA TTS «A» C*A ATT «TA CM? VXC CCA TTT TAX «AT ATT Thr í*e» Thr Va.1 Leu Aap L*a· 11* Vai. X**u Ph« Pro »h* Tyr A®p Xie §•5·$ 260 28 S m4 CGS TTA tm TCA AM GSG GTT MA ACA « CT.S ACA ASA «AC ATT TTT As$ Lati Tyr Ser Ly® Giy vai &yS Shr Gltt tótt Thr Arg λβρ 11® «*» 200 205 350 aos ά&τ cm ATT ttt toa crr mt act ctt ca« ma tat <χά oca act Ths An? Pr© II® Pbs Ser l>ss» A»» Thr X*»tt «X» Gl« Tyr GXy Pr© Thr 3 OS 3U« 3X5 32« s-m ΤΤΪ TTG AC.T ATA «M AAC TCT ATT CSA AAA COT CAT TTA TTT «AT TAT Pis® l«v ®*r lies Slti As» S«r 11® A*g Ay* Pr*» Kis Uni Ah* Aep Tyr 333 31« 333 TTA CAG GSS ATT GM TET CAT AO® CGT CTT CAA CCT «ST TAC TTT GGS χ,όΐΐ tíl® Giy lie slu Phe Kis Thr Rrg 1©« Cl» Fr» C4.y Tysr Fh« Giy Sêô 34:5 330 105«

ara «a* tct otc aat tat tos tct sgt aat TAT «ta «AA ACT ASA 001’ £*y» Asp S®r Ph« Asn Tyr Crp Ser fily Asn Tyr Vai Slu Thr Arg Pxo 355 380 3SS 1104 AST ATA ©SR TCT AQT AAÔ AC* ATT ACT TCC CCA TTT TAT «GA OAT ASA s&r Xt* Sly Ser Se« lys Thr 11« Th.r s*r &e& Ph* Tyr sly &&p Ly* 370 3?s 3SJ» 1:153 TCT ACT CAA CCT CTA CAA AAC CTÂ mc ΤΤΐ CAT OCA CAA AM- §» TAT Ser Thr ©1® Sre Vai Sln l.y» t®u Ser Pfce Asp Gly ©Ia l»ye Vai Tyr 3S5 3SG 35S 400

X30C

CSA ACT ATS SCT AAT ACA SAC ©TA QCS SCT TOG C<?0 AAT 03« AAC STA ÃrS TlMf li® Ala Asa Thr Asp Vai Ala Ala Trp Pro Asn Sly Lye Vai 405 410 4IS

1Ã4S TAT TTA G*3T Tyr 0«u «ly GTT AOS AAA GTT Vai Tkr Syis Vai 420 SAT TTT AGT CAA TAT GAT GAT CAA AAA Asp sh® Ser ais Tyr Asp Asp «lo ,ty» 425 430

12 SS AAT SAA ACT A®« Glv Thr 43.5 ACT ACA CAA ACA Ser Tkr Si» Thr TAT SAT TOA AM ASA AAC AAT «SC CAT Tyr Asp Ser tíym Arg M» Asn «ly Hls 44S 44$ 1344 STA AGT «CA Vai sar Ala 455 CAS SAT TCT ATT «la Mp Sor lie 4Sg SAC CAA. TTA Asp 61» sasa CCS CCA Prs 0ro 4S0 SAA ACA ACA GAT Qltt Thr Thr Asp 1392 SAA AÂA GCA TAT Clv fcye Al» Tyr 4T& ora cca crr GiU f» «CU 4S5 CAT CAS CTT AAT TAC «OS SM TGT Sor Ui* «ia íjou A.®a Tyr Al« «1« Cya 47S 48® 1440 456 ΡΕ1040192 yrc tta PftQ c&ô «ac cot dst asa. aca att cca ttt ttt act im acr 1488

Phts httu mt «Ia Rsp A*g Aro: «ly 13» II* Fre «** Fhe Thr Trp Thr 48 5 4.S0 4<>& CAT ASA mt «TÃ &kC TTT TTT A&T AC& ATT SAT ser 3AA AAS ATT ACT X$36

His Arg Ser Vai Asp P&e í%e Asn Thr Xle Asp Ala 01« 1,-ys Xle í%r soe sós sio CM £Τΐ ee& βΤΑ STS AAA <3CA'TAT OCC TIS TCT ΊΚΆ «OT «CT TCC ATT AS84

Gin IA» *s» Vai v&i Ly« Ala Tyr Ala Aeu Ser Ser «Xy Ais Ser il* SIS 520 525 ATT GftA «OT CCft GGA TTC AC» GOA 0«A A&T m C*A TTC C*R ARA OA& 1S32

Ila siti «Xy Pm Sly »íte Thr Gly «ty Asa* Lea bee Fiie hsw &ye «X» 530 S3S $áá rct MT AAT TCA ATT GOT AAA TTT AAA OTT ACA «** AAT TC& «CA «CC :Í.S80

Ser Ser Asn Ser XI* Ala feys fôs.® &ys vai Th£ &*« Asa Ser Ala Ala S5Ô S5S SSS TTG TTA CM. CCA TAT COT «TA ASA ATA «SC TAT QOT TCT ACC ACT AM XT38

iiey hen ®ln R*g Tyr Arg Vai A»g Xis Arg tyx Ala «ar Thr Thr Asn 565 S?S SVS

ΓΓΑ OSA COT TTT «TS CAA AAT TCA AAC AAT «AT TTT COT OTC ATC TAC 177S f·*» Arg lie» Pta Vai ®l« As» ser Aan As» Aap ?fee l«eu vai Xis ayr

s#ç 484 53HD ATT AAT AAA ACT ATS AAT AAA «AT «AT «AT Tm ACA TAT CAA ACA TTT 1824 ile Asn »y# Thr »et Asn Lys Asp λ*ρ A*p Le» Thr Tyr elí. Thr Fh® sn m$ Ctc «CA ACT ACT AAT TCT AAT ATS OM OTC TCS SST «AT AM AAT 1872

Asp L«tó Ala Thr TSir Asa Ser Ae» ff&& Sly ?he Ser «Xy Asp lifs. Aaa sie sis S20

SAA COT ATA AT.» OSA SCA SAA TCT TTC 6OT TDT AAT SAA AAA ATC TAT 1S2C «1» Iien 11® llâ Sly Ala «li» Ser The ¥al Ser Asn «lu hya Xle Tyr «25 «38 «3S «4Ô

ATA «AT h.m Am 8AA TTT ATC CCA OTA CM TTC TAA 3LSSS

Xle A«p lya Xle ®1» Fhe .Xle Fro Vel «lo t»aw (2) INFORMAÇÃO PARA SEQ ID NO:52: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 651 aminoácidos (B) TIPO: amínoácído (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:52: 457 - ΡΕ1040192

Kst; Asb Pr-o Ãss Asrc &rg Ser <slu Hi s Asp Thr He ^yg. Vai Ήμτ P 458 ΡΕ1040192

Xia Asp Lya Lya 139 Leu 01a Oly Leu 135 Ser Trp Ay® Ly» ISO Arg lie A.rg Glu XSS Met Pr o Ser Fhç ι

An» Ser 01» is» Sã

Pro Ακη Ser Thf 35

TtHf 01-¾ Asp Ser so

Ala Vai Gly Vhr 65

Sly VAI Pr-a Phe

Asn Vhr lie Ύερ XS3 vai siu vai .Le» xis

Ma £»«» Ala Gi« 30 SJ

Ann Ala l*aa. Asa

14S

Atsg: Ver 01» Asp

Wh* Arg A»a Ser 180

Pfeg Leu Pre Vhr 155 lef* *xp Ma Gla 2ie vai Ala Glu Pha 3:25

Asp His Cys vai

Tter Tyx Asp 2§ã

T£tr Leu Thr Vai 22S

Ar*! i.<»a tyr ser 290 5

Sis Thr .Asa HiS

Leu Gin Glu L«u 40

Ser T&r Glu Vai ss

0iy Sle Ser Vai 7S

Ala Gly Ala Lasi 85

Ara Ser 01» A$p

Asn Gin Tyr- Pro 25

As» fyr- Lys slu

Leu Asp Isa Ser: SO

Vai Gly Gl» 11« 95

Thr .$9T ffee Tyr 90 ftw> Tcp Lys Ala 10 5 lie fâlir Slu Tyr 15

IsS» AI* Asp ÃS* 30

Phé %mi Arg MeC-4S

Thr Vai lys Asp

Leu Qly VAI Vai SO 01» Ser The u?u 95

The SíeO AÍ A Gin 110

Ala Lys Ser Lys 13S fia.» Asp Tyr vai

Tyr Ala Gin Ais 200 V-al Ph® Gly Slti 215 Tyr Sis Arg Gin 23Ó Ábh Trp Tyr Asa 245 Ala Tsp Vai lijf»

Lee Asp Leo He 2S0 Lys Gly Vai Lys 255

Gin. Trp Oly Tyr 220 Leu Lys Leu Thr 211 Vel Gly LSn As» 359 phe Aso Ar«j Filo 265 Vel &eu Phe »ro

Thr Slu leis Thr 300

Gin Gin Tyr Thr 240 Gly Leu Arg 01 y 253 Arg Arg slu 2?o Phe Tyr fep II* 2S5 Arg Asp Ile Phe 01» Aso As» Phe 140 The Fro Leu* €«* iss Leu Phé Ser Gin 110 ALa Vai Ser Lys ÍÃS Ala Ask Thr Sis

Leis Arg Ser Lys 160 Ala Olu Ser His 125 Phe 0.1» Vai :Leu 190 Ae» Leu Leu Leu 205 Ser Ser @1« A#p 459

Thr Leu sla slu Tyr Gly yr» Thr 3IS 320 Arg £»y$ Peo Mis Leu Fhe Asp fyr 330 333 Arg Leu Gin .Pr» Gly Tyr Vhss Gly 345 .350 Gly Asm Tyr Vai Gle Vhr Arg Fr» 3€S Thr Ser Fr» Phe fyr Gly Asp Lys 3Í0 Ser Phe Asp Siy ©ia Lys Vai Tyr 305 400 Ala Ala Trp Pro Asa Gly Ly» Vai 410 415 Phe Ser Gin. Tyr Asp Asp ©la i>ys 42.$ 430 Asp ser tys Arg Asa Aan sly ale 445 Gin Leu Pro ?ra Slu Thx Thr Asp 450 Mis Gin Leu Aan Tyr Ãla Glu Cy» 42$ 400 Thr He Fr» &m Pha Thr Trp Thr 400 45$ Thr He Asp Ala Glu Lys Ile Tfax SOS $10 Ala. Le® ser ser ely .Ala Ser Ile S2S ely Aan Leu Leu Ph.® .Leu Lys Giu S40 Lys Vai Thr Leu Ass Ser Ala Ala 555 560 Ile Arg: Tyr Ala Ser Thr Thr Asa 5 70 575 Ase Aon Asp Phe Leu Vai lie *ya $0$ 550 Asp Asp Leu Thr Tyr Gin Thr i?h« 605 ΡΕ1040192 «ητ Aap Pm lie Sfce Ser Leu Asn 305 310

Phe Leu Ser lie Siu. hm Sár: H* 32$

Leu GXs Gly lie Sl» Pise $8i.a «sx 140 hye Aej* ser stoa asa Tyw Trp §®r 355 3S8

Ser He sly ser ser Lys Tfer lia 370 375

Ser Thr GIu Pr» 'Vai Gin Lys Le-u 38$ 3SS A:rxj «w ile Ala Asm Thr &sp vai 40$

Tyr Leu Gly Vai Thx Lys v»l Asp 470

Asa Glu «*r Ser f&* Gin «hr Tyr 435 440

Vai ser- Ala Gin Assp ser ϊ-le Asp 4$·® 4SS

Glu Prt» Leu Glu liys Ala Tyr ser 445 470

Phm Leu iWefc Gin Mtp Argr Arg <Sly 485 iíis Arg Ser Vai Aep The VA® Aon $00

Gin tm* Pro V*l Vai Lys Ala Tyr SIS 520

Xie Glu. Giy Oro GXy Pfte Thr sly $30 SIS ser ser Aso Ser lie Ala Lys Ph® 54$ sso

Leu Leu ela Arg Tyr Arg Vai Arg 565

Leu JUsg Leu Phe vai Gin Asa Ser 500

Ile As» Lys T&r htet &sn Ly» Asp S3S SOO 460 ΡΕ1040192 Λ230 Leu $19 AlS Thr Thr Asn Ssr SIS Aso M*K. «ly Ssr Sly Asp i39 L-yíi Assn Qlu 525 Leu 11« 11« Oly AI A OB Sl« Sãr PíHS V&.1 ser 05 fen $1«. L,y& 11« Tyr €40 lie m >* 1 11« Olu S4S I>h« •Π* v.sd 01«. S :5 0 L«u (2) INFORMAÇÃO PARA SEQ ID NO:53: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:53: ATS AAT CCA AAC AAT coa AQT OAA Q\T GÃX A08 ATA AAC orr ACA COT •43 IM®£ Α»β· íhxs Asa fen Arg Ser Glu KiSí Aífp Thr 11« Lys Val Thr Pr» 1 5 20 15 AAC AGT GSA TTS CAA ACT AAC CAT AAT CAA TAT C.C.T TT& SCT GAC AAT Ao» Ser 3.1 \s Leu £3ln Thr Asa HÍ8 Asm ôlts Tyr Pr» Lau. Ala Asp A#a 20 25 3S CCA ARX TCA ACA OTA SAA SAA TTA. AAT TAT AAA GAA, TTT TTA ASA ATS 1*4 "Asra Ser Thr· LíSU □lu 01« L«U ASfi Cyr hym OXo phe Leu Arg Μ* ε. is 40 45 ACT GAA 0AC AOT tct AOC OAA 0X0 CTA QAC AAC TCT ACA «TA ARA GAT IS2 Thr Glw Ásp Sar Ser Thr Slu Vai Le» Aap Asa Ser Thr Val í-ys Aap ,50 ss SO OCA ®rr ACA SSft ATT TCT GTT ÓTA 003 CÁO ATT' TTA OOT GTT «TA 340 Ala Vesl Sly Thr «ly X.les Ser Vai Vai Gly Oln Ue Láu Gly 'Val Vai m 70 75 00 mh s-tt OCA TTT «CT CS® «CA CTC ACT TCA TTT TAT CM TCA ΊΤ2 CTT 2 ia aiy Vai pTTO Phe Ala (Sly Ala Leu Thr Ser Ph& Tyr mu Ser Ph® Leu 8$ ss AAC ACT ATA TOS 0"νΑ· A0T GAT CCT SAC OCA TOO AAS OCX TTT ATO OCA Asm Thr 11« Trp Pro S«r Aop Ala Asp Pr« Trp iys Ala pha Me-fc Ala 10Ç 10^ 120

CM SOT «RA ATA GAT AAG AM ΑΤΑ «Μ ΘΑ3 TAT «CT AM A5T 384 432ΡΕ1040192 461

©la vai sis v&I Leu II s Asp Lya Lyo lie «lo 81« Tyr Ais lyu s&r 115 12S 125 ΑΛΑ ©CT CTT ©CA ©AG TTA CAS 08 T CTT CM MT ΛΑΤ TTC 5H. «AT TAT Lys Ala Leu Ala Slu Leu Gin Gly Leu Gin As« Asm Phe «1« Asp Tyr 138 · 135 140 ôtt mt «es tta mt tcc tos ams .má cct im *« ττβ c«à a«t Vai A#n Ala L*u Asa S«« Τκρ Lys Lys Thr Fr® Leu S«r .Leu Arp Ser 14S ISO 15S 100 AAA ASA ABC CAA SAT ESA Am ASS «AA CPT TTT T©T «*A «CA «A& A«T hyg «gsg Set: GXr Asp «sg Ile Arg ©Xu Leu Phe ser ©la Ais slu sar 1«S x?e 135 CAT TTT CGT MT TCC ATO CCS TCÃ TTT «3CA GTT TCC SS& TTC SM GTC His vha Arg Asu ser fitett Pr® Ser Phe Ala 'Vai §ex «iy Vh* Slu vai ISO 1ÔS ISO CTS ΨΗ CTA CCA. «CA TM ©CA CAA SCT ©CA *AX ACA CAT TTA. TTG CTA Leu pfca Leu Pr® Thr Tyr Ala «la Ala Ala &sn Thr Sie Leu Leu Lau l$$ 200 265 «A MA SA.T acr CAA OTT TH «C*& ©&& ©AA TSS (SCO TAT TC£ Tdh «AA Lais Lys .A*p Ala «X» vai J?ha sly alu ©1« Trp ©ly Tyr S*s? Sar ®L». 210 215 22© «AT GTT <3CT GAA TTT TAT CAT ASA CAA TTA AAA CTT ACA GM CAA TAC Asp Vai Ala ©iu PM Tyr His Axg «la Leu Lys Leu Tfer «In ©Is Tyr 22;S 2Ã0 $ÍS 240 ACT GAC CAT TOT CTT MT tQQ TAT MT 8TT ÍKJA TTA AAT CGT ΤΤΛ ASA Tfex AMp Bis cy» Vsl Ae» Tâfp Tyr Asm Vai Sly L«u Assn Gly Leu Axg 2 4·, 250 255 SST TCA ACf TAT «AT «CA Ϊ03 «TC AM. fff AAC CGT TTT CGC AGA «M «ly Ser Thr Tyr Asp Ala T*p Vsl Lys Ph® Asa Ajfgr £h« Axg Axg 01« Μΰ MS 220 um acτ m act «ta tta «at cta att ©ta ctt ttc cm ttt tat ©at Itefe Thr Leu Th.x vai Ley. Aep Leu rl® vai Leu Bhe Fr® FAe Tyr As® *75 a*Ô 2H» ATT CGG TTA TAC TCA MA. SÍ343· OTT iW ACA GAA. CTA ACA A©A ©AC ATT 11a Ar« um Tyr ser Lys «ly Vai Lys TJsr ©lu Lau Thr Aieg Asp i le 29« 2VS 100 TTT A05 ©AT CCA ATT TTT TCA CTT ΑΑΓ AÇT CTT CA© ©AS TAT SSA CCA Fita Thr Asp Prt> lia Ffca «ar Leu Asr* TAx Leu «la ©iu Tyr Sly Fro 305 330 315 320 ACT TTT Tm MT ATA SM AA£ TCT ATT COA MA CCT CAT TTA TTT «AT Thr PlMt Leis Ser Xie «la Asm Ser íle Jfecg Ly» Pro ais Lea PAe Aap 3®S 338 335 TAT TTA CAS SS8· ATT ©AA TTT CAT AOG- CGT CTT CAA CCT ®ST TAC TTT 4 ao 571 624 $7¾ 720

7SS βχδ 364 312 960 1008 5.05« 1104ΡΕ1040192 462 tyr JUevs Gin Giy xXe GXu The His Th?: Arg Leu «Iís Fs« <51 y Tyr Fhe 346 »45 »S0 G®S ÃiiA SAÍ ÍCT TTC AAT TAT TGG TCT SSX AAT TAT G?A QBA AC? AGÃ 0Xy js.Sp S-sí.' pke Asas. Tyr Tsp Ser Sly Ask ?yr Vai GX» T.hsr Arg 3$S 360 365 CCT MRF ATA ®m TO' AST A&S ACA ATT AC? TCC CCA ΤΠ* TAT «GA «AT Fro Ser Xie 31 y Ssr Ser Lys Thr lie Ths? Ser Fará- lhe Tyr Oiy Asp 370 * $73 3SC ma tct aCt em. cc? em caa aa@ cm asc ϊή ga? goa c&à »m «?? άγη «#? Tfcr «In JWP Vai eXp Lys S*tt. Ser Fhe A»p Ôly Cln Lya Vál 38S 39» 395 406 T&T CSA ACT ATA. Q€T AAT ACA OAC STA GCG S€T «(} COG AAT GGT AAG Xyar Asg thr XI» Ai· Asn tlar Aap VIU Ais. Ais Trp Fr» As» Sly &y» 405 41» 415 GTA TAT TT.A Q®T «TT ACS AAA βΤΤ «AT Tt? AáS? CAA TAT «A? SA? CA& Vai tyx heu 0ly Vai T&r Lys Vai Asp Bh· S«r ais Tyr Asp A»p «I» 4.36 4S5 430 AAA, AAT GSAA ACT AST A.CA CAA ACA TA? «A? TCA AAA AiSA AAC AAT «BC ly* Asa 3lts Thr s»r Thr sis Thr Tyr A»p 5«r Ly» Arg A®n Aea «ly 93-5 440 445 usa 1300

124S

,1:2M 1344

CA? <WA ΑΘΤ «CA CAS «A? TC? ATT «AC CAA TTA CO® CCA GAA ACA AS» Kls VAX Ser Ala alo Aap S»r 11 e Asp «X» Pvo· P«o «i» Thr Thr iSO 45S 46® SAT «AA CCA CTT «AA AAA OCA TAT AS? CAT CAS CS? AAT T*C «Q» «A» Asp «Xu í?ro kea ciu Lys Ala Tyr .Ser Hís Gin liSu Asn Tyr Ala Gin 4 SB 470 47.Ç 4S0 TQT TTC Tm ATO CAG GAC 05? CS? S6A ACÃ ATT CCA TTF TTT ACT TCC Cys Fhe Aeu Itefc «la Aap"Arg Arg Cly Tfer XX· »s® Fh® mas Thr Trp 4S$ 49® 49S AGA CAT ASA. AS? «TA SAS TTT TT? AA? ACSA ATT SAT CCT CAA AAC AT? Thr Sis Arg Ser Vsl Aap Ffce The Asn TAr Tle Asp Ala Gin hys l'la 5QÔ SOS Si® ACT CAA CTT CCA GTA CTC AAA OCA TAT OCC T8G TC? TCA G©? ©C? TCC Tfcx Olis Xán Ptxs Vai Vai Ays Alá Tyr Ala hmi Sár S*£ Gly Alá Ser SIS 52® ' 525 ATT ATT «AA GGT CCA G©A TTC ACA GGA GG.A AAT TTA CTA TTC CTA AAA XI· XI· «lu Gly ?r« Gly FA« TAr Gly Oly Aan 1«« JUsa pfe« heu hy» S3» S3S 549 GAA TC? im AAT TCA ATT SCT AAA ??? AAA ST? ACA TTA AAT TCA OCA Gin Ssr «ar Asm Sei* He ala Ays The i.ys vai Thr hen Asa ser Ale §45 446 S5S SSQ ®cc TTG T?A CAA os» TAT CGT GTA ACA ATA CSC TA? «CT TC? ACC ACT 1,302 1446

J.4SS 1544 K5Í3

15SS 1728 463 ΡΕ1040192

Ala Leu Leu Sln Atft Tyr Arp Vsl Asrg Ile Artj •Tyr Ale ser Thr T.nr SOS 570 S7S AftC TTA OSA CTT TTT GTO CftA AAT TOA AAC AAT DAT TTT CTT GTC Ate Hs Asa Leu Arg tèU Phe vai 01« S«íf ASr &S& ASp Ph» ,:lsu Vai 580 585 580 TAC ATT AÃT A&A ACT ATS MT MA DAT DAT DAT tta ACA TAT CAA ACA 1524 Tyr lie Aats Lyss Thr Met Ãsn Lys A.sp Asp ASp ÍèSSU Thr Tyr 31« Thr SOO 605 i*rr qat CTC OCA ACT ACT AAT TCT AA’Í' ATS ÕÔÓ ire ras OST QAT IS 73 Phe Asp Leu Ala Thr Thr Aess m* Aarl Mac eiy .Aha Ser ç.ly Asp tys 61:5 020 AAT <3AA CTT ATA ATA 3A2A SC& G&& TCT ttc orr TCT AAT G&A AAA ATC 1520 ASÍi siu Leu 11* 11* diy Ala <3Xw S*r Ser As» ¢.1 u Lya· ile 625 630 £35 64:0 TAT ATA OAT AAJS ATA SAA TTT (YfC CCA ΘΪΑ CAA TTO TAA 1SSS Tyr lie Asp h,ys I.Is Slu The íle Í?*O vai ala Lew 64.S «50 (2) INFORMAÇÃO PARA SEQ ID NO:54: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:54: 464 ΡΕ1040192

Mafc Asti Pr<í Ásn Ãsn Ar® âer β!« H±s ftsp Thr Il«- l*y* V*i Vhr Pro 1 § .10 is

As» ser GXa Leu @1« Tta Asa Big Asa sla Tyr Pr» &»» Λ® Asp Asai 20 25 3® ®ro Aatn ser Thr hmt ela siu L«u Asa Tyr l»ys Ql« píiis lam Ar® Met 3$ 4« -ss

Tirar Glu Asp Sss ser Th*r Gl« vai &eu tep Mn Ser ura VAI Sys Asp

B-ΰ . S.S SO

Ala Vâl oly Thr sly 11« ser vai Vai sly ela II* betx oiy vai Vai ®§ 7g 73 ggt

Sly Vai Are» Pise Ala Oly Ala. Leu Tfar Ser Pit® Tyr <31n Ser Ahe £>wu fS Sí> ss

100 19$ i;iO fêla Vai fita* Vai lie Asp &y» Lys Ile <31 v $1¾ Tyr Ala &ya ΡΕ1040192 465 ms 135 I»ys Alá. Leu Al$ glu Leu falto <*Xy 130 1,35

siu mn ask phtk fâiu a«$ fy« 1AQ vsl Asn Ala Lee rsk Ser Trp Lyo Lys Thr Pro Leu Ssr Leu Arg Ser

M5 1S9 i££ LOO

Lys Arg Ser Qlss Asp Aíç lie Arg Siu Leu Pise Ser sXn Ale Glo s&r

MS r?o Í?S

sis Fhe ttg A*» ser Mer, pjfo ser PAç Ala Vai Ser <3ly Pis® siu Vai 180 185 ISO

Leu Pise leu Pro fhx ‘lyr Ala GXs Ale Ala Aats Thr ISls Leu Seu Leu 155 aos 2 os

Seu Lys Asjs Ala <Sla VaX Pise sly (31 u <&«. Trp Hly Tyr Ser Ser Gls*

210 SIS È2P &sp Vsl Ala Slu Ph» Fyr His Xsg βΐ» Leu Lye Leu $fcr S!» OLo xyr 221 330 235 240

Tht mg «is Cys Vai te trp Ίγτ Asa ¥si siy Leu &&& sly Leu &rg 245 350 ass sly ley 1¾¾ Tyj? a#$ ais. τρρ vai Ly» Fhe M» Arg Fha Mg Âxg Slt* ase 2€.s 3?o ÍSafe- Thr Leu Tfcr Vai Leu Asp Leu ÍSa Vai LUU Phe Oro Fh® Tyr Aap 27 8· ISO ms ISe Ãrg Leu Tyr Ser Lye Sly Vai Lys Tkr Si o Leu Thr Arg Aep Lie 2S0 2SS 300

Thr P'n& Leu Ser II e SXsi Asu Ser LI® Arg lys Pró ílis Leu ÍShe Asp

125 330 33S

Sly Lye Asp sar Pise Aeu Tyr Trp ser sly Asn tyr Vai elu Thr Axg MS 350 M$

Fr© Ser lie Sly Ser Ser Lys Tfcr Xl-e Yte Ser Pr© Fh» Tyr Sly A&p 3?0 IVS 3so hyn Ser Tfer Si» to Vai 6I.s Lps Leu Sor fhe Mp Sly elo hw Vai 305 350 355 ” 400 yyr Arg Thr Ila Ale Asu TAr Aep Vai Ala Ala Trp 0¾¾ Asu Gly Lys 4G5 430 415 466 ΡΕ1040192 v*i Tyr L«t« Gly Vel Tbr hym Vai Asp tfee Ser sln tyr Asp Aep «3·» 4âÔ 425 430

Cye Phe teu íifist Oi» Aep Arg Arg Qly Ar 11® Pro Pfcs Ph& Tíhr Trp 4&S «50 4$S

Suc- hís Arg Ser Vai Asp Bifce PS® Asn Ar lie Aep Ale ©la. Lye lie soe SOS 510 TSr ©la um WX& Vai Vàl Lys AlS Tyr Alã Leu Ser Ser siy Ala ser S-1S &20 525 XI e: Xl« ©lu ©ly Pro úly Pite Thr ©ly ©ly Asn Leu Leu Pha Leu Lys 539 SâS 540 (31 a Ser Asm fer XI® AlA Ly# Pfcé; lyS Vai X'hr Lesi Asss .Sétf Ale

.545 558 855 SSO

5«S 578 5?S

As» Lev Arg Lsu p&e- Vai Sln Asa ser Asa Asa Asp p&e Leu vai lis SOO 555 550

Tyr Xl« Aas Lys .Tkr Met Ãs» Lya Asp Asp Asp Leu fhr ¥yr £»la 5¾¾ SS5 Soo sos

Tyr lie Aap Lys 11« ©iu F&« lie Pr-e Vai Oilm l&u 645 eso (2) INFORMAÇÃO PARA SEQ ID NO:55: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1956 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: 467 ΡΕ1040192

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1953. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:55: ATS AAT CC« AAC «AT CG.A ©SA CÃT SAÍ ACG ΜΆ ÂA© ©T£ AÇA GCT 48

l 5 IS

AhC AST 3A& 1*10 CAA AST «AC CAT «AT C«A TAT CCT «A 0CT GAC AAT m

Asa ser Glu Leu. Sl» T&r Asm tíis Asm Gin Tyr Pro Léu Ala Asp Asm 20 25 38 CCA AAT TCA ACA- CTA 0AA OAA TTA AAT TAT AAA ©AA TTT TTA ACA ATS 344 pra tem. Ser Thr Le« ©Xu Sl» Leu Asm Tyr Ly* Slu PAe Leu. Arg Wefc 35 40 45 «cr a&A ase ast tct acs oaa sts cta ase mg tct aca m aâa s&t im

Ala vai Gly Thr Gly Xle Ser Vai Vai Gly Gin tle .Loa Cfly vai vai 65 70 75 m ©©& &ST CCA TTT OCT GGG ©CA CfC ÁCT tCA TTT TAT CAA TCA TTT CTT 288 «ly Vai ftro Phô Ala ©iy Ala Le» Thr Ser Phe Tyr ôln Ser Phe Leu

SS 44 SS AAC &CT Am TOS CCA AST «A& S&C CCA TÇÇ AAG GCT TTT ATO OCA CAA 3 35

Asm Thr IX» Trp Pro Ser ©lis &»p pys» Trp Lys Ala Ph» M*fe Ala <3l» 100 105 na ©rr «sa ©ta cts ata oat aa© aaa ata gag em tat qct aaa agt· aaa 40« V*1 Gle vai Leu lis A$p i>ys by* Xl* Glv elu Tyr Ala Ays s«r .Gys lis 120 125 ©CT CTT OCA ΘΑΘ TTA CAG GGT CTf CAA AAT AAT TTC O&A OAT TAT GTT 433

Ala Le:a Ala <31 a Leu ele ©ly Le» Gin Aso. As». Ph« Gla Asp Tyv vai 1.39 13S 1.40 AAT GOG TTA AAT TCC TGC AAG AAA ACA CCT TTA AOT TTC» CGA .AAT CCA 488

Aaa Alã Leu Asa S®s' Txp Ly» Lys TÁr Pre Leu Ser Leu. Ayg· Aee S*o X4S ISO 155 X4Ô CAC AGC CM GGT C@A ATA AGG CTT TTT TCT CÃÃ. GCA GAA «βΤ CAT 52® HA* Ses? Gla Sly Argr Xle Arg ©iu Leu Phe Ges: Gla Ma ©lu Ser HA*

XêS 170 X?S TTT CGT .AAT TCC ATC CCG TCA TTT OCA BTT TCC MA TTC GAA ©f© CT6 5 TÉ PAe axs *9« «et Pvo Ser $lt· Ma Vai ser Ly» yhe GXu vai Leu isa ASS im TTT «TA CCA ACA TAT <3CA CAA ©CT ©CA AAT ACA CAT TTA TTG CTA TTA 024

Fbe Lau P**? Thr Tyr Ala alm Ala Ala Asa tbr Si* Leu Lea L«a Leu 468 ΡΕ1040192 195 2«O 205 &Â& QÃT SCE CAA STT TTT ®8A βΑΑ 6AA TGS GGA TAT TCT TCA CAA SAT 672 t.ys Asp Ala ela Vai Pise Sly ©1» <31u Tep GXy Tyr Ser Ser Qlu Asp 210 215 330 gft ecT gaa τττ tat cat asa caa tta aaa crr aca caa caa tac act 720 V*1 Ala Cia Phe Tyr Ai» Arp ©I» leu l«y» Leu Thr çln ela Tyr Tkr S3S 230 238 «40 SAC CAT WT GTT AAT TSG TAT AAT ^TT SOA TTA AAT ®8T TTA ASA SffiF 768 A»p JU$ cys Vai Aan Trp Tyr Ase Vai ©ly leu Asa Sly x»*« .Argr ©iy

24S ISO 2SS TCA ACT TAT ©AT SCA T®3 ©TC ASA TTT AAC COT TTT CGC ASA OAA ATS #1« ser Thr tyr Aep Ala Trp Vai &y* vhe asa Arg phe Arg Arg siu wet 260 26$ 270 ACT TTA ACT ©TA TTA «AT CTA ATT ©TA CTT TTC CCA TTT TAT 8AT ATT 864 T&r Leu Thr vai La» Aap um He vai &eu .The $?ro »he Tyr Aep xle 37$ 260 aes CGG TTA TAC TCA AAA ®K3 6TT AAA ACA CAA CTft ACA MA ©AC ATT TTT 312

Arg £*0» Tyr s«sr &ye ©iy va.i Lys civ Tte Mg ftep 11« Fiw 280 3SS 360 «o© ©at oca ATT rrr tca ctt aat act crr cas om tat soa cca act aeo

Thr Aap Pkp XX e »fc* ser La» Asa Thr iau sln ©isi Tyr Sly Pre Tfcr 30$ »10 315 32» TTT TTO ACT .ATA CAA AAC TCT ATT CCA AAA OCT CAT TTA TTT OAT TAT 100«

Pfe* Leu $*r i!s slv Aa» Ser lie Arg lye Fro His Leu Pise A*p Tyr 32S 338 338 TTA CA« íí» ATT OAA ΪΤΪ CAT ACC OâT CTT OSâ Cd’ «Cl- TAC TTT «UW 166«

Leu ôln sly 11« ©lu 8i*« Hia Thr Arg Cln sre 8:ly Tyr PÃs sly 340 34S 38» AAA SAT TCT TTC AAT TAT T0S TCT «ST AAT TAT 0TA SAA ACT MA COT 1184

Lym A«p Pb® asíí Tyr Trp Ser Sly Asa Tyr vai sla A*g Pet> 355 3S0 305 mr ata m* tct ast am aca att act tcc cca tt? tat mu. cat aaa 1152

Ser ile sly S«r Ser Aye Th.r ile *hr Ser Pro fhe Tyr Oly Jksp JÈya 376 375 380 TCT ACT SAA CCT -STA CAA AA@ CTA ftfiC 'TTT ©AT QSA CAA AAA GTT TAT 120»

Ser Tlhr Sis Fro vai Sla Hye leu ser The Aep Cly õla Aye vai Tyr 385 339 395 499 CSA ACT ATA CCT AAT AvA SÁC «ta SC?S <SCT TOS ÇÇ§ MT ««f AM CT& 1240 fttg Th.r Xie Ala Asa Thr .asp Vai. Ala Ala Tip pts Asa Cly lys Vai

403 410 41S

Tyr &eu Siy Vai Thr hys Vai. Aap Ph« Ser Gla Tyr Aap A^p 61« hya 469 ΡΕ1040192 42Ô 42$ «0 AÃT 8SA Aí» AGT *CA CAÃ ACA ΤΑΤ «At TCA AAA ASA AA.C AAX 88C C&T 1344. A*n 81» Thr ser Thr «1« Th* tyr Asp S«r Lya Atg Asa Asa ely His 43S 440 4*5· fflA AGT SCA CSS QAT TCT ATT GAC CAÃ ΤΎΑ CCS CCÃ «AA AC& ACA «AT 1302

Vai âer Ala el» Asp S«r tl« Asp &ln Leu Prô pra 81» Thr thr Asp 4SO 4SS 4S0 «AA CCA CTT «AA AAA OCA TAT AST CAT CAS Ctt AAT TAC SCO GAA TOT 1*40 «lu Pro lie» 8lu Lys U.s Tyx «ex Sãs «1» Essu Asm Tyr Ala Glu Cys 465 470 475 4S0 TTC TTA &t« OMS SAC CGT CGT GGA ACA ATT CCA TTT Ttt AGT TOS ACA I4«®

Fhs Leu Mefc ela Asp Argr Arg Gly Thr tis Pto Pite Thr Trp Thr 46 :S 400 4ââ CAT AísA A8T GTA «AC TTT Ttt kAT ACA ATT CAT CCT OÂA AAG ATT ACT 1S36 lis Ara Ser Vai Asp Ph® Phe Asn Thr He Asp Ala aio Lys ria Thr SOO 505 510 C&A CTT CCA «TA- ®TG AAA CCS TAT SCC TTO TCT TCA CCT «O? TCC Att 1504

Sia fc*u Me Vil vil. Çyi Al.i fyr Ali §m wm Qly Mo sor Ho

SIS 520 52 S

Att CAA CST CCA «SR TTC ACA 88A SCA &AT TTA CTA TTC CTA AAA GAA 1432 XI* 81». 8ly 3Prv «iy Phô thr «iy «iy Asa Leu Lew PIj© Leu hys 81« 530 515 540 TCT AST ART TOA .ATT «CT AAA TTT AAA: STT ACA TTA AAT TÉA GCA «OC 2640

Ser Ser Asa Ser Ha Ala Lya Phe Lys Vai Thr Leu As» Sar Ala Ala. 545 SS0 555 5SÕ

VT» T» CM CCA ΓΑΤ iXit «ta MM ATA CSC TAT SCI TCT ACC ALT ÃAC i /:<ÍP liSU Lea ela A*e Tys* Arg vai Arg ll« Arg Tyx Ala sex Thr Thr Aaa 565 570 575 tta cm ctt m 8TO caa μϊ tca aac **r sat ttt ctt mc mc ac i7?s

La» Arg l>*u Phs vai «la Aaa Sme Asa A«a Asp Pfe® Leu vai zla Tyr 550 5«5 540 ATT AAT AAA ACT ATO AAT AAA GRT O&T «At TtA ACÃ M C3UA ACA TTT 1824 lis Aaa Lys Thr .8efc Asn Lys Asp Asp Asp L&a thr tyr 81a Thr Vhs

5.95., «00 SQ S 8At Ctc OCA ACT ACT AAT TCT AAT ATO 888 TtC TCS 8«T «AT AAS AAT Itta

Aep Lau Ala Tfer Thr Asn Ser Asa Mel 8ly Pb® 8er «ly Asp bye Asn 610 6X5 €.20 8AA CTT Am ATA 8«A 8Ç» <*m TC? TTC «TT TCT **r 8AA « ATC TAT Xf2Ht 6l» Lau Tle lie ely Ala 81» $*r Phe Vai 8«r .Asa 81» L-ys lie Tyr 625 630 638 640 ATA «At M8 ATA «AA ΪΤΤ ATO CCA «TÃ CAA TTO 1» 188«

Ile AMp Xtym Xlm 81» ^swfe II* >«> Vai Ola í»e» 470 ΡΕ1040192 s«$ sse (2) INFORMAÇÃO PARA SEQ ID NO:56: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 651 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:56:

Asrt Pxe Asn Abo ser Olu HiS Asp Tb.r He Ly S vai Thr Pr» t 5 is IS Asa Ser «lu Lèe.i Thr A®* Mi® A®«3 Gin Tyr Pr« Leu SÍ3 Ãsp As» ao 2S 30 Sr» Asm Ser· Thr IúSU 81 u ‘ÍA.llA L*U Aân Tyr Ly® G.lu Phs Leu Arg Ktsr 35 ¢0 Thr ©lu Asp Ser Ser & «iu Vai- Léu Asp Asn Ser Thr Vai lys Asp se S5 so Ais Vai Sly Thr G1 y Ser Vai val Sly 01« 11 a Leu eíy Vai Vai 55 7Θ 75 80 «iy Vai Prò 3?hã Ais Ol. v'· AJLât Leu Thr Ser Phe Tyr Sln ser Phe Leu «s 50 SS Asa Thr He TEp Pr* ser Slu Aep Pr* Trp i*y& Ala Phe Mec Ala Siri ISO 105 110 Vai £vlu Vai L«tt Xie Asp Lys Ays Ue «131 Cs3U-£ Tyr Ma tya Ser Lys %2 0 125 Ma Leu Ma Leu Ql« Sly Leu 01« Asm As» ®4ws Oiti Asp Tyr vai 130 135 140 Assa Ala Leu Aôn Ser Trp Lys lys Thr Pr* Leu Per Leu Arg Ma Pr* 145 ISO ISã ISO S&r Olii <31 y Ãrg He &rg ai«. Leu F&e ser oln Ale Olu Ser His 1SS 170 175 Mrc$ Asn $:£r Pr* ser Phe Ala vai. v>í?ÍT ϊ:;:>'ίϊ Phe «lu Vai Leu ISO 155 ipe yhs Lâii Pr* Thr Tyr Ala «In Ala. Ala ASirS Thr His LSU Làii Leu Léu 155 200 2S5 Lvs Aap Ala «31« V»X Ph«: Qly Slu .^1. Λ* ,-í, *Λ Trp Tyr Ser Ser slu Asp 210 215 220 Vai Ma 8Xu. fhu Çyr His Ar§ Sln Leu Lys Leu Thr «21* Oík Tyr Thr 471 ΡΕ1040192 i^ Ϊ3 250 S 3-5 240 ASp Kis : cv.s Vai ASrí . Trp Tyr As» Vai Oly Leu Asfi Oiy Lau Arg Oly 545 SS8 255 Thr Tyr Asp Ai a Trp Vai Lys Phe A*» &r«í Phe A*8f &srg 01 a. Mee 260 265 270 Thr Leu Thr val Leu Aap 1.*» He Vísl Pfee Pr® Phe Tyr 11« 27 S 2&a 285 **g Le« Tyr Ser Ly$> ®ly Vai Lys Thr aiu Leu Thr Arg Aop He phe 250 255 590 Thr Asp Pzo lie P&a Ser Leu Asa xiir Leu Oln Siu Tyr oiy Pr© Thr 305 3ie 315 32S £>§!& hà« Ser Xle Glsi Aà» Ser Xle Jtegr fcy» Pr© Bis Lã© Phã Aãp Tyr 325 330 335 Leis Gin «iy Ile Glu pfc* H$M Thr Arff Leu Gin Pr© Lly Tyr Phe <*ly 540 145 350 Lys- Msp· Ser Phe Asn Tyr Trp Ser Ôly Ase Tyr Vai Ôlu Th* A*g Fr» 355 3S0 365 ser Ils Sly sar ίίΐίΚ Ly« Thr lie Thr Ter Pro Ph® Tyr Sly Aap Ly* 3?o 375 ISO Oer Thr Glu Pm vai Gin Lys Lau Ser Mas Asp eiy Gin Lys Vrl Tyr 305 390 125 409 A«g Thr Tis Ala ASÍJ Thr Asp Vai Ala Ãls Trp Pr© Ãsu Siy Lys Vai 405 410 415 Tyr Leu Cdy Vai Thr l>y» Vai Mep Pha Ser *3lh Tyr Asp Asp Gin Lye 420 425 4 39 Asn m u Thr Sair Thr <$ln Thr Tyr Asp Ser Lye Arg Asu &s» 01y Mis 43$ 440 44S Vai Ser Ala Gin ASp' Ser ile Asp oi» Leu Pr© M Oiu Thr Thr Asp 45« 4SS 460 &lu Pre Lsu eiu Ala Tyr Ser Mis Sis Leu ASU Tyr Ala eiw Cy» 465 470 475 400 Pirfâ LSVS W*t GXrs hap Arg &r§' sly Thr lis Tro The Phs Thr Trp Thr 4SS 459 455 Mi* Sr§r Ser vai ASp Phe Phe ,&sn Thr 11« A5p Olu l»y* 11« Thr SCO 505 610 CS3.fi. Leu Oro V8l Vai Lya Ala, Tyr AI» Leu Ser Ser Gly ida Ser lie

SIS 52 Q S2S 472 ΡΕ1040192

Ile Qlu sly p*·.» sly Slie Tbit «ly Qly As® Lett Ahe teu kys ©1« S3Ô 8M 54» i»r Ser &sn Ser li# Ale hy». Phe hy* Vel Tte u» a&íí Sar Ala Ala 5#5 55Ô SSS S€0 teu teu fílis Sng Tyr Árg Vai Arg Ite Arg· Tyt· Ate íUw Th»· THr A*rs sss s?e sis t*m* Ar-g teu Ate Vai ©1» As» Ser Asa M& Asp Phe teu v&i> il& ryr 58 Q if| £$$

Ile Asa 'Lys rke «et Asa 3úys Asp A#p Asp teu. fte Tyr &ka fbr wh» SM SOO ses ftsp· teu Ala T&r Th:r Asa ser as® M*st Qly E'h® ser oty &sp vy» Ase S10 SIS S20 δϊ» Leu lia li® Qly Ala QJUx S®r P|m* V&.i $#r Asa <$la Lys· ile Tj?x $3$ 838 838 €40

Ile Asp £>y.s xl« ©la Ph« XI® Arô Vai Gin teu 845 «£« (2) INFORMAÇÃO PARA SEQ ID NO:57: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1956 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1953. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:57: ΜΊ3- ÃAT CCA AAC AAT CSA AGt «AA CA" G&T AOS ATA AAG GTT Wh OT? 4S Met I Fíú Assrs Asrs S Arg «lu ais Aap xs T&r Π® Lys Vai Thr IS fro AAC ΑΘΤ «A& TT« OM AC? MC CAT ΑΛΤ CSA TA? CCT TTA «CT OAÇ AAT 3S Aiíft Ser Qlu Leu SO Sln Thr Agn His ,fts» S:S •31» Tyr Pr« LSíU Alá ASp 30 Aán CCA AÃT TCÃ ACA CTA GAA ©AA TTA A&T TAT AAA «AÃ T7T TTA .ASA ATO 144 ?r<3 Asxj Thr teu QiU <31 v teú 4S Asa Tyr Lys 0Α-ΐί S»he <iS te» Árg wefc ACT ísAA OAO wt TCT ACC3 3AA OTG «TA SAC AAC 1CT ACA gta aaa «AT xn ~hr ΐ3Ι« &sp se £©r Ser Thr Glu BS Vai teu Asp ASS £β Tte Vai Lys Agp 473 ΡΕ1040192 SGR ©ΪΤ A£A S©& ATT TCT ©TT ©TA 006 CS© ATT TTA GGT ©ΤΤ 8TA 2*0

Ma Vai ©ly Hw ©ly 11« S** Vai- V*1 ©Xy 61« He Leu Gly Vai Vai 70 7t> 80 gSA ®TT OCA TTT 60* 006 GCA CTC ACT TCA TTT »T CM TÇft TTT OT 2*8

Qly Vai Ar® Pfee Ala «Xy Ala Leu Hw S»r Fh« Tyr ©X» Ser $h* Le» 35 60 ss MC ACT ATA TC?» OCA AÔT 6AA CAC CCA T®3 MG GCT TTT ATS OCA CRA 335 A«n Ttw Ha Trp ira S«* ©1« A*p P*s» 3fcp Ly» Ala «fae Mafc Ala ©In ΧΘ0 10S 110 STT ORA saa cr® ata ©av as© ma ata srs sãs tat ©ct am &st asa 3**

Ala Lee Ala SXu Leu ©la ©ly Leu ©la Asa λβη Ph® ettt Asp Tyr VaX 130 135 140 AAT GCS TTA AAT TCC TB© MS AAA TtT CSC CST TCT CST CST TCT AAA 4*0 A®:» Ala Leu Asa Ser Trp Ly» í»ys Fh® His Hás â®jr Arg Ar® Ser Ly® 14S ISO 1S5 16© ASA A8C CAA ©AT OâA ATA AGG SAA CTT TTT TCT CAA ©CA ©AA AST CSX 52*

Ar# b&t 81® ss» A*» 11« iwgr ©&» La» Pb» Se*1 ©la Ala ©Xu S*r Uis 1«S 170 175 m 0©T MT TCC ATS CCS TOA TTT ©CA ©TT TCC MA TTC GAA ©TS CSS 576 íha Asrgf Asa ©cf eset Ora· g<*r Phe Ala Vai Ser Ly» Fl># ©X-s vai. Leu 1*0 1*$. 190 TTT CfA CCA ACA TAT ©CA C*A ©CT ©CA. AAT ACA CKP TTA TTB cm TTA 624

135 3$íi SOS AM « ®CT CAA orrr TTT m& ©M. ©AR Tas ©SÁ ΤΑΤ TCT fCA ©AA ΟΚΤ 672 bys Aep Ma ©la Ph® ©ly ©1« Slw T*p Oly Tyr S«r Ser ©lu Asp 2X0 3XS 22© ©SET ecr SAA TTT ΤΑΤ CRT ASA CAA TTÃ AAA CTT ACA CAA CM TAC ACT 720

Vai Ala SXu Fh« Ty-f Hi» Ar© ©la Leu Lya Lau Tfer elft ©1« Ty*· Tisr- 225 230 2 3'3 240 ©AC CAT TST STT AAT TSÔ TAT .AAT OTT ©6A ΤΓΑ AAT SST TTA ASA ©®T 763

Asp Hia Cys VAl As» Trp tyx Aa». Vai ©ly Leu As® sly Lsu Arg aly 2*5 250 255 TCA ACT TAT CAT CCã TGO ©TC AM TTT AAC CGT TTT C8C ASA. ©RA ATS 016 sor TAr Tyr ASf Ala Tx|j vai Lya PAa Asa Ar® &fee Ar® Mg δΐ-»· m* 260 2SS 270 ACT TTA ACT ©TA TTA ©AT CTA ATT ©TA CTT TTC CCA TTT TAT «AT ATT Thr Lev Thr Vai Leu Asp Leu lis Va.X Leu Pise Pr® Ph* Tyr λβρ li® 27S 2*0 2»5 364 013ΡΕ1040192 474 CSG TTA TAC TCA Ate, GGC STT Α&Λ ACA SAA CTA ACA ASA GAC AT? TTT Arp is^u Tyr S«r x>ys aiy vai. Lys Thr ©1« Leu Th* Asg Asp Tie «h* ase as® 300 ma ©at cca att ttt tca ctt aã? act cr? cm «*© ta? ©sa oca act Thr Asp «*» XX» «h® Sar &*v A*a Thr i»eu ©In ©Xu Ty* ©ly Th* 305 310 315 32» TTT na A©f A?A GAA AAC TCT ATT CCA AAA CCS CAT TTA Hf GAT TWT j?h« 'te» §»* IX* «la Aan Ser xl* *rgr «y» Pro Hie teu «í» A*P ?y* 52S 333 33$ TTA OKS ©85 ATT CA& TTT GA? ACC OST CT? C&A CCT QEST K TTT 5©© teu ©1» aiy Ite <31SS «te Hie T&r Ar© teu ©Xe Fr® ÕXy Tysr Ffcè ©iy 340 345 35» AAA ©AT TCT TTC AAT TAT T©G TCT «6? AAT TAT GTA ©AA ACT &<3A CCT Lys sep ter «te teu Tyr Trp S«r Sly Asa Tyr V«1 51« T&r Ak© 8r© 355 3®e 365 A©? ATA ©GA TCT mt AAB ACA ATT AC? TCC CCA TTT TAT OSft GAT AAA 8*r lie ©Xy S«* ter fcy» Tbr lie tíuf Ser »ro Pte Tyr Sly Asp X*ys 370 345 3 a» TCT SCT ©SÃ CCT ©TA CAA AftQ CSA ASC TTT SAT S©A €»* AAA CCT TAT 8e:c Thx Glu «*r<* Vai $ln Ly® Meu ©o* «te Aa» CXy ®Im. Ay» Vai Tyr 385 350 345 400 CCA AC? ATA SCT AAT ACA ©AC ©TA. ©CS «CT T8© CCS AAT ©ST te© ©IA Ai'§ Th* II.» Ma ten Thr Astp Vai Ala Ala Trp Fr© ten ©ly Aya V*X 405 410 4X5 TAT TTA ©ST ©7? AC© Ate ©TT ©AT TTT AST CAA TAT ©AT «AT CÃÁ AAA Tyr teu Sly Vai Tte fcys Vai tep fhe ter ©1j* tyr A*p A»p Sln Ay® 43 & 435 43G AAT SAA ACT mt -ACA GSA ACA TAT ©AT TCA AAA ASA AAC AAT GGC GAT Asa ©1« Thr s«:r Tte ©Xr ?X»r Tyr tep Ser Hy» Arp Astn Ate ©Xjr Mi.® 435 440 44S «A jkST QCA <3A8 ©AT TC? ATT ©AC CAA TTA CCS CCA ©AA ACA ACA ©AT vai ©ar Ala ©X» Asp ter :k A»p ©la L*u «r© Pro slo ?te Thr Asp 4§0 45$ 456 ©AA CCA. CT? ©AA AAA SCÃ TAT AS? GAT CA© CT? AAT TAC SCO teA T®T alti pre teu &lu hys Al» Tyr ser sís «In teu Asit Tyr *1« «lu q?* 4£S 430 47 S 480 TTC TTA AT® CA© ©AC OS? C©T ©©A ACA ATT CCA TTT TTT AC? T9© ACA Phe teu Met si» Asp Ar^ Arf ©Xy Thr lie Paro Fhe «he Hsr Ttp Thr «as 4 ao 4 as CAT ASA aar STA ©AC TTT TTT AAT ACA ATT OAT &CT ©AA AA© ATT ACT Ki9 A^( ser Vai Asp Wae «be A»» Tlxr 11« A»p Ala Sl« l»y* 11« Tbr 500 5QS 61» yea laos . 1055 i.x a 4 usa 130» 124® 1206 1344 1392

144D 1403

S SIS ΡΕ1040192 475 •CAA CTT «CA GTA OTO AAA OCA X&T &CC ΤΪΟ TCT TCA GOT SCT W MT «la líS-w Fra vai. vaX Lys Ala. Tyr Ala Lau Ser ser «Xy Ma Ser lie §25 520 52¾ ATT «AA Θ8Τ CCA OSA TTC ACA SOA USA MT TVA CfA TTC CTA AAA OAA fie Sis Oiy Sly PJtee Thr Sly Oiy-Ase Leu Lee P&e l»esi Lys Slu 530 535 849 TCT AST AAT TCA ATT ©CT AAA TTT AAA OTT ACft TtA AAT TCA OCA ®CC Ser Ser Asm ser 11* Ala hy® Pfte Lys Vai Tfer Lee Aa» Ser Ale Ale 545 S.SO 55 S ΤΤβ TTA. OAA COA TAT COT S!S ASA ATA CSC TAT QCT TCT ACC ACT AAC Léu <31 λ Aro Tyr Attçj w»! Atg ? 1 Ar*j Tyr A? a y' Tfor Thr Asíts 5S5 570 575 rn CSA CTT TTT OTO CAA AAT TCA AAC AAT «AT TTT CTT 6TC ATC TAC Lee ftrg Le« «*e Vai Glo Asti Ser Ase Asm Asp Phe Lee vai 11« Tyr 580 5SS SSNJ ATT Mf MA AÇT Ato AAT AAA SAT OAT OAT TTA ACft TAT CAfe ACA TTT lie As» Lys* Thr Mete A»n Lys ftsp Atsp Asp Leu Thr Tyr «1» Tb*· **h* SSS «00 SOS SAT CTC GCA ACT ACT AAT TCT AAT ATS SOÕ TTC Tí» 00T OAT AAS AAT Aâp Leu Ale Thr Thr As» $»r Aes Met «Xy The ser oly A®§> ny» as» filO €15 S2Ô <m. ctt Am ata ®sa sca oaa tct ttc srr τετ »i oaa ma xrc tm Ole. Lee lie il« OXy Ale 01a Ser The Vai Ssr Aeit ela Lyxt lio jyr €2.5 53® 535 640 ATA OAT AAS .ATA OAA TTT ATC «CA OTA CAA TTS TAA lie Asp Lys 11« olu Phe 11« Pr» Vai 01» Lee 545 650 1584 1632 1880 1328 3 770 1834 1872 1256 (2) INFORMAÇÃO PARA SEQ ID NO:58: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 651 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:58:

Hat S; ASS1 Pr» Aon Ásn Arg § £>«1- $lu Hie 10 Thr 11® Lys Vul Thr 25 Pro Asii Ser Olu Leu 20 siii Thr ASÍi M i s km 2% ísin Tyr i$eu A1& ASp â·® Ãhh Pr» As» Ser Thr L>&iS 0-lu ®lu Leu Agii Tyr Lys oie Phs Leu Asr g Met 35 40 45 476 ΡΕ1040192

Ma ¥8.1 rny Ί-m íLly lie Ser Val Vel ©2y ©X» Ile Le» ©Xy Val Vel $$ 7© ®8 ©ly vai Jhro Sís» Ma ©Xy Ak Le» T-hr Ser Sb.® Tyr ©la. Sssr fhs Leu 85 90 55

Aba Thr íle Tzp Pto ser ©1« Αβρ Pr« *$tp Lys Ala Ph.e Befc. Ala Gin ISO 105 110 vai Glu . Vai Lã» lie Aep Lya Lys X X é Gl» ©1» Tyr Ala Lys Ser Lys 115 220 233 Ala Leu 130 Ala <31U Leu sis sly 135 Leu alo ASX1 As» Phe 140 Gin ftsp Tyr Val &SI1 Ala Leu ÀSU Ser Trp Lys Lys The. Kis HÍS Ser M-9 &rg Ser Lys 14S ISO 1.5 5 XOõ Myj ser Gin Asp Arg lie Arg Giu Leu Phe Ser Gin Ala GXu Ser Síis *05 170 ' 27 S P&© Mrg ftsn Ser ISO Met Pr» Ser Pha Ala ÍJf val ser Ly:§s Fha Gltt *90 Val Leu Phu Lee Pr» Thr Tye Ala Gl» Ala Ala Asn Thr His Leu L®U Leu Leu 285 200 TOS Lya Asg Ala Slft Vai. Phe ©Xy <32» ©X» Trp Gly «yr Ser Ser ©lu Asp 110 215 220 Vai &1» G X u Phe 'Fyr Hio &rg Oln .Leu Lya Leu Thr Gin Gin Tyr Thr ^%S 1 .3 0 235 240 AOp sis Cya Vai AS» Trp Tyr Mn val ©Xy Leu Aon Gly Leu Argr Gly 24S 250 2S5 Ser Thr Tyr Asp Ala Trp Val Lys Pne Asn Arg PM &rg Arg ©lu 2«0 255 270 TM' Leu Thr Vai Leu Asp Leu 11 e vai Leu Ffce Prõ Phe Tyr Asp Ile 275 280 2SS &rg Leu Tysr- Ser Lys Gly Vai Lys Thr Glu Leu Thr Axg &sp He Phe ISO 295 300 Thr Asp Pr» lie ffie Ser Leu Asn Thr Lsu Gin ©1» Tyr Gly Pr» Thr 305 310 315 320 PM Leu Ser Ilè Glu Asn ser lie Arg Lye Fr» Mie Leu Phe Asp Tyr 325 330 33S Leu Gin -siy lie 31» Pise His Thr Arg Lfi» Gin Fr» Gly Tyr phã eiy 477 ΡΕ1040192 mo

Lys Ser She Asa tyr Ser 3 S 5 3 δ* 0

Ser lie ®ly Ser Ser Lya Ils; ί\ί{ϊ 37S

385 JJG ATS Thr íle Ala Asu ttw' **S Vsl

4ÔS

Tyr hm fâly v&l lbr Lys Vai ftsp 420 A*m 61« Tter Ser Tbr «la Tfer Tyr 43S 440

Vai Ser Ais Gin Asp Ser Asp

4S0 4 SS 6ltt *S® Leu Glu fcys M* Vyx Ser 4€S «70

pae la» Ksst «Ik Asp tew tag «Xy 4SS lis &rg ser vai Asp Phe asbk soo «I» Leu ar» Vai Vai Lys Ala syr sis sae 11 s «1« «ly aro Oly Pise t3»r «Xy SXO 535

Leu Léu Sla A*«| Tyr Arg Vai Arg S6S .Leu Arg I«« abe Vai «Ia As» Sm 580 11® Asm hys Thr Mas As» Lys Asp § os 8 o 0

Aap hsu Mm. τ&γ àm svr &$»

8X0 SIS ©1» Leu Ile xle QXY Al» ©la Ser «2» «20 MS 350 Gly A£b. TJ ?r Vai Giu Thr í 185 irg' Pr-o Tbr Ser Pa ro· Fbe Tyr Gly $ 380 i.g:p Lys ser pfee Asp «ly Oln S*ys 'VAX Tyr 3JS 40 s Ala Ma ®rp aro as». siy i*y» VAX 410 «15 Fh« Ser «Ia Tyr Aap Iksp í»y« 42S 430 Aap Ser Lys Arg Ae» Asa Qly HIs 445 6.1» .Leu Pro ar» 01« fhr tí»r Aap 480 Hls ela Lee Asa Tyr Alo Slu Cy» sj?S ««0 Tbr lie aro Phe abe S&r Trp fc 496 46S Tte IXe Asp Ala ©lu 3úys Ile Tisr sos sio Ma i»ôu ser sor ôXy Alo Ser Ile 525 «ly Asn Léu Leu Pb» Leu Ly» 61» 540 Lys vai Thr Leu Asa Ser Ala Ala sss sso He .&rg Tyr Ala Ser Tfer Ttor Agn S?0 575 As». Asa Asp Pb® Leu Vai Ile Tyx 585 540 Asp Asp Leu Tbr Tyr Sln Tbr Pb® S05 ?4éfc ÍJly Pb® S«r Qly Attp Lys Asa S20 FA* Vai Ser as» ©1» Lys He Tyr 835 540 478 ΡΕ1040192 IXs &ap i»ye He «1« Pfcws Xla Pr·» Vai sln Lee g4S €-50 (2) INF0RMAÇA0 PARA SEQ ID NO:59: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:59: ATO AAT OCA AA.C AAT CGA AGT SAA CW GAT ACG ATA Afta «ST ACA CH 48 ííeit Ásw Pra As.« Asa Arg Se*' Glu t&r He Ly» Vai «ar Pr«s

:·, S 3.6 iS

AAC JM3T «AA. TTO CAA *CT AAC CAT AAT CAA TAT CCT TTA GCT «AC AAT

Asm Ser «lu Leu «1» Tt*r Aaa Asa «la Sy* Lem Ala Aep Αβά

Se :SS CCA AAT TCA ACA CTA. OAA GAA TTA AAT TAT AAA «A* TTT TTÃ ΑβΑ ATS 144

Pr» As® ser ffcr Leu «lu Giu Leu A*a Tyr tys «lu vhe &eu Arg sfefc ÓS 46 4$ ACT CAA ae AST TCT AOS SAA STG CTA SAC AAC TCT ACA «TA AAA «AT 182

Tta «lu Asp s«x Ser Tbr elis vai Leu Aap As» Ser Tter Vai l>ya Asp sé ss «o «CA «TT CCS ACA «SA -ATT TCT GTT «TA «8« CAS ATT TTA «ST «TT «ΤΑ 140

Ala Vai Gly Ths «1 y ll* Ser Vai vai Gly Gin Ha Leu Çly Vai Vai 79 75 66 «GA «Tf CCA TTT GCT OCO OCA CTC ACT TCA TTT TAT CÃA TCA TTT CTT 28 a

Gly vai Pr» Pha Ala «ly Ala Leu TAr Ser Phs Tyr «ln. Ser Pise lat

SS 80 4S AAC ACT ATA TQG CCA AST «AT «CT «AC CCA T88 AAG «CT TTT ATO «CA 33«

As» T&r Tle Trp Pro Ser Asp Ala Asp Pro Trp &ym Ala Plxa Kes Ala iôô los iie CAA GTT QKh «TA CTO ATA GAT AAG .AAA ATA GAG «AO TAT GCT AAA AGT 084 «ln Vai «Is* val leu 11« Asp fcgrs hy» He «lu «lu Tyr Ala I»ys Ser ,U5 120 125 AAA «CT CTT «CA «AS TTA CAG GGT CTT CAA AAT AAT TTC GAA GAT TAT 4¾¾

Vf» Ala Leu Ala 61« Lèu «Ia «ly Leu «1» Aa« Asn Phe «X» Asp- Tyr 130 13S 140 ΡΕ1040192 479 ΦΓΓ )W «CG ΤΤΑ ΑΑΤ tC.C TGG &AG AAA AC A CCT m MT ΤΤΏ. CGA &&T v*j. as» Ala Leu »aa s&r Trp Ly» Ly# Thr Pro mu $«r fceu Ãrg Ser 14S 13© 4SS 1€8 AAA AGA mc C&A «ST CSA ATA MS <SAA CTT TTT TÇT C&& «CA «AA AOT !tyjg *xg s*r sln «ly *rg II# Argr «Tu L#« Pha ser «la Ala SOU* S#r ISA 1?8 1?S CAT TTT CGT AAT TOC ATS CCS TGA TTT «CA GTT TCC &AA TTC OftA <3TG Ais Fàs A*g Asa Ser Síet Pro Ser £%« Ala Vai Ser Lys Fhe «Xm Vai ISO 18 S i<f© CTS TTT ÇTA CCA AC» TAT OCA CAA @Ct SCA AAT ACA CAT TTA TTS CTA Leu Pise Seu Pr» Tfcr Tyr Ala sln Ala Ala As» tis»· Kl» Leu Lôu L#tt JJ>$ 20Q 205 YTA AAA «AT <sCT CSA «ST TTT ©3A GAA «AA T3S «GA W TCT TCA GAA teu Lys A&p Ala SI» Vai Ph* Siy &lu Slu frp Sly Tyr Ser Ser SIu aio ais 22s o&t òit ser «aa ttt tat cat um cm tta asa ctt aca caa cm tac A&p vei Ala. «lu P&e Tyr Mia Arg Qln Leu Ly« teu 1&sr Gin «1» Tyz 32$ 2.30 235 240 AC® «AC CAT TCST «TT AAT T©S TAT AAT «TT «0A TTA AAT «ST T*» AS» TAr Asp lis Cya vai. Asa Trp Tyr a#k vai eiy teu fean sly Leu Arg , " S*S 230 233 SST TCA ÃCT TA® «AT «€» TO® «TC AAA. TTT AAC CCS® ®ST CSC ASA S&ft «Xy Ser «sr Tyr &sp Ale Trp Vai Lys Pbtn A®» Arg pfce Ar^ Arg· «Xu 2SS M5 270 ATS act rrn ACT st» tt» g»t cta ATT ota ctt tpc cca ®tt tat sat mt. Th.r Lau tfer vai t«u Aap Lea. lie vai Leu vh& Pito Pise Tyr hap 275 300 255 ATT CSC TTA TAC TCA AAA SSS ©W ASA ACA OAA CTA ACA AS» SAC ATT Zle Arg· Leu Tyr Ser Lys <siy vai Lye Tisr elu Leu TÃsr Arg *ap lie 3F0 2#5 300 TTT »e« SAT CCA ATT TTT ACC CTT AftT AC» Cm cm AAQ TAC SSA CCA ffee Tbr Aàp Psro H# PAe Thr Leu Am Thr Léu. Gi» Lys Tyr <53. y Pro 305 110 315 220 ACT TTT TTS,.AST ATA SAA AAG TCT ATT CSA AAA COf CÃT TTA TTT OAT ®hr Phe Leu Se.r II# Olu As® Ser 11# A*3 Lys Pre· Mis Leu PAe Asp 325 330 335 TftT tm CAS CGS ATT OAA TTT CAT AC® C©T CTT CAA. CCT «®T TAC TTT Ty* Leu Ola Oiy .Ile «lu Fhe His Tb» Arg Leu «1b n» ©ly Tyr Ph* 340 34S 350 ®0® AAA «AT TCT TTC AAT TAT T®« TCT «®T AAT ®A® «TA GAA ACT AMA «ly Lys Asp Ser PMe Aso. Tyr Trp Ser «J.y asm Tyr vai «1« Thr Arg 355 3SCS 3é5

570 S'72 720 *?8Ã

8IS P12 1008 5 0S0 2204 1152ΡΕ1040192 480 cer am ata ««a tct ast a»b &e& att »gt tcc cca ttt tat ra ® Pro ser lie ely Ser Se.r i*y« ihar xla Tfes Ser pro ffce tys «ly Asp 37ϋ 375 330 AA& TCT ACT «fcA CCT «TA ÇAA AWS CTA AC-C TTT 6AT «GA CAA AAA «TT t-yfs Ser Tfcr Olu Pra Vai. 61« hys teu Ser Pfcs Asp 61 y ®i« Ly;s V&l S8S 3S8 35« 48« TAT CdA JSCX ATA SÇT AAT ACA «AC «TA «CS «ÇT TSS CC« AAT «ST &A6 Tyr Arg Thr il* Ais Asb Thr Asp vai Ala Ala Vtp Ptto A«n @2y l»y# 406 410 415 om, tat Tm mt &r? acs ma stt sat τϊτ aqt c&a tat «at «at caa Vai Tyr i»s« ely vai Thr l<ye vai .Asp Pfee Ser 61« fyr Asp Asp 61» 420 425 430 AAft AAT OAA ACT AGT ACA CAA ACA TAT «AT TC& AAA ASA AAC AAT SSÇ JUys Asa elu TÃr Ser Thr 61» Thr Tyr Asp Ser &y» Arg asb Asa sly 435 440 445 CAT 6ΪΑ AdT dOÀ €AS SAT TCT ATT «&£ ÇAA Tm ÇCG CCA SAA ACA ACA His vel ser Ale el» Asp ser lie Asp 61« Leu Sr© ftro 61« Thr Bv 450 455 450 «AT CIftA CCA CTS SAA. AAA «CA TAT AGT GAT CAS CTT AAT TAC «CS SAA Astp «lu Pr© x>«m 6Iu &y» Ala Tyr Ser Sis Sis JUeu Amn Tyr Ala «la 4ÈS5 470 475 48Ô TST TPC TTA ATS Cft® «AC OST 06T «8A ACA M OCA TTT TTT ACT TS6 Cy* í>he Leu Met 61« Asp Arg &rg sly ftr lie Aro Fh« He Thr Trp 4θ§ «5Ό 495 ACA cm ASA AST «TA «AC TTT TTT AAT ACA ATT «AT «CT «AA AAS ATT thr Hás Argr ser vai Asp Fhe PAe Asn Tàr ile Asp Ale <Slu x^ys 11« 500 505 SIO ACT CAA CTT €CA STA «TB AAA OCA TAT SCC ΤΓ6 TCP TCA SST «CX TCC ftt «1« £«« ír© Vai Vsi l*ya Ala Sy» Ala. l«etí Ser Ser 61y Ala Ser SIS 520 52:5 ATT ATT CAA OST CCA 66A TTC AÇA «<ÍA OOA AAT TTA CPA TfC Çíl AAA lia Ha 01 u Sly Pro SLy Pha Thr Sly Oly Asn Léu Lcm pbe Jjett l<ys 530 535 540 CAA TCT ACT AAT TCA ATT ÇÇT AAA TTT AAA GTT AÇA TTA AAT TCA GCA 01 u Ser Ser Aen Ser lia Ala l»ys Pfce Lys vai Thr Laa asb ser Ala 545 550 555 SSO scc ftú Tm caa. coa mt eer «ta a«a ata esc tat ser tct acc act Ala smn te» «In Arg Tyx Arg Vai Arg He Arg Tyr Ala Ser Thr Thr 565 570 575 A&£ TTA cm CTT TTT gts CAA AAT TCA AAC aat «at ttt ctt ctc atc Asa tau Arsr Leu phe vai «In Aon Ser aab Aan Aeg ®fea $>au vai xla 500 605 590 1200 1248 2206 1344 2392 1440 1483 1536 1384 1632

ISSO 1728 1776 481 ΡΕ1040192 TAC ATT ΑΆΤ AAA- ACT ATS ΛΆΤ RAA QAT DAT GAT TTA AC.A TAT CAA ACA X&14 Tyr XI® As» Lys Thr Mn Lys Asp Asp Aec Leu Thr Tyr Glís Thr »<S5 Sítò SOS TTT GAT CTC: GCA ÂCT MT MT TC? MT ATS GSG TTC TOS gct saf MS 1071 Rh« Aíip :L$u .Ala Thr Thr As» Ser Asm Mefc Sly Ser sly &sp Lys $1® SIS $20 ΆΆ.Τ ORA ew ATA ATA ΘΟΑ SCA &ΆΆ TCT TTC <STT TCT aãT SAA A&A ATC 1^20 Aaú CSla Leu Ilé 11$ Sly Ala Giu Ser P.h® mi Ser &$:n <Hu> Lys íle St 5 S30 535 S4Õ TAT ATA SAT AAC ATA SAA TTT AtC CCA CTA CAA TIS TAA XSSâ Tyv lie Aap Lys Xis SXu Phe n« Pr» Vai Sln La» «45 S S 5 (2) INFORMAÇÃO PARA SEQ ID NO:60: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:60:

Msfc An» Vr®· Mo s*r al» 1 5 A»« ter <*lu Imi- ®lm Thr Mo Mis te s>r& Asn Ser Thr Leu aiu sxu Leu 3S 4£í

Thr Olu Aep Se*· Ser Thr SIu v&I 5S 5$

Ala. Vai Sly Thr &1γ lis Ser 'Vai S5 70 CHy Vai 3?rs £&$ Ma >31y Ala Leu es

Asa Thr 11·$' Tr.p Pr» s$:r &sp Ma IOO GXís Vai SI» V*1 ímt 11« ttsp Lye 1X5 12Ó· lys Ala Leu Ala M» Leu. Mu Oly 139 135

Vai Asa Ale Leu As» ser Trp Lyss 145 ISO

His Asp Thr 1'le Ly$ Vsl Thr Fr®: 10 IS

As« si» Tyr pt» L«u ftla Asp Am 35 30

As» Tyr Ly.s alu í?he Léu Arg M$fc -4¾

Leu A&p Asii Ser íhr Vai Lys Asp m

Vai Sly €1» íi« Leu sly Vai Vai 75 80

Thr ííãr phe Tyr Sla Ser Phe Leu 90 ss

Lye ϊ1$ Glu Glu Tyr Ala Lys ser m ã L*« «ln Aa» ASÍI Glu A$P tyr 140

hys Thr Pr» Leu Ser Ls» Ary Sér 155 “ X«S ΡΕ1040192 482

Lye Arg s«r Qte ©ly A*g lies Arg lis líis Phffi Arg As» Ser Mst Pre Ser ' láò te» Bhe Α«« P)fO Thr Tyt Ala @J.n 195 2&ϋ te» t*yn Asp- Ate Qte Vai Phs? 01y 2:10 2lS Asp VSl Ala. ©iu Phe Tyr His Arg 225 336 Ttsr ftsp Kl» Cys Vai Asm Ύχρ Tyr MM 61 y Ser Tfar Tyr Asp Ala Trp Vai 35 S Mete T&r te» fhr Vai teu Asg te» 275 288 Ile AJfgf Leu Tpí Sèí Ly.á Q%y Vai 290 285 Ph» Shr Asp Pm Xiã 3?&a ter toga âos no ter Phe te» Ser Ile ©1» Asa s&r 325 Vyr Leu ©In ©iy lies Slu Phn His MO ÍSly Jjys Asp Sasr Ate As« lyr *$χρ 3SS- 360 Pro Ser He Sly Ser Ser Lys Ihr 370 375 S»ye ser Thr ©i» Pro vai @1« Lys 385 3S0 Tyx Arg ter ll.e Ala As» Thr Aap 4S35 vai Tyr ©ly vai ter Lys vai 420 Lys Âss ©1» ter Ser Tfer 61:» tear 435 440 61» fc«u Wh» Ser 6.1¾ Ale ©1« Ser 3,70 Í3g

Phe Ale Vai Ser Lys„ Phe 01 a Vai 185 158

Ala Ala Aen ter Kis Leu teu teu 2 OS ©lu ©1» Trp ©ly Tyr ser Ser ©i« a»o ©1» Leu .Lys· Leu ter ©1» ©te :fyr 235 249 &sn Vai ©ly teu Aa» 6ly teu *rg 250 .255

lie Vai teu She Pre Phe Tyr ftsp 28S

Lye ter 61» teu THr Arg? Ahp lie 300 .As» ter te» ©te Lys yy*· ©ly Prs> 315 320 lie Arg &ya Pro Hl» te» i?A® As*p 338 335 ter Ãrg te» ©ln tra ©ly “íyr 345 350

Vai. Ala Ala T*p Paro Asn. 61y Lya 410 415

45Í3 4SS

Cye Phe Leu Mefc sis Asp ftrg Arg 48»

Tfer Mi 9 Asg &mr vai Ά&ρ P&e Pis»

SOS

Th*- ein. i*au pm vai VM Lys Ala sis sso lie x 1 íí Cl.u Gly Cro SJLy Wh& ΤΙϊτ SCO 535

Olu Sei· Ser Assas Ser lia Ma Lys 545 550 AI» t&u hm» sl» Arg tyr ax% Vai sss

A&si Leu Argt bau Ph* Vai. Cslrt Asa 58 Q fyx Ile Asa Lys Tb.r mo Asa Lys 5$$ soo sfce mp fceia Ala Tte Tte e mr ®Í0 fi* 5

Asm èlu Lee lie He <Sly· Me <Slu

4SS

Sax Mis <Sla ie&u Asa iyr Ale si« 47S 4SÇ

iãly ffer He 'Pxo Pb* Pise Usr T.sp 490 49S

Amn ftir lie Aap Ala em Ly.§ H* S Q § 51.0·

Tyr Ala JLevi Ser Ser Oly .Ala Ser

Si 5

Sly <Sly Asn Le» iau Phs Lèit Lys 640

Ph® Lys Vai Tfer Leu Asn ler Ale 555 AX9 He Asg Tyr Ala Ser Tkr Tbr

S?0 StS S«x Aa» Asm Asp Phe Lee Vai sl* S«S SP4 A*p Asp Assp Leu fhr Tyr <5i» Thr €05 fim í®s« sly Ptee 8ex 61y A«p &y* «20

Ser Phe vsl Ser Ases «1» Lys 11* SâS 640

Pré Vai ©lé L<&« €5© (2) INFORMAÇÃO PARA SEQ ID NO:61: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:61:

XSfS AAT OCA AAC ΑΛΤ CQA AOS* OAA CAT «AT AOO Am A*« «TT ACA CCT ΡΕ1040192 484 M*t As» Pre Asti As» Arcj Ser Si a Mis toj? Thr 31« tys V«2 Thr &«·© 1 5 ú ts mc Α9Τ SAA TTS CM ACT AAC CAT AAT CAA TAT CCT rPA 8CT «AC AAT As» âer «1» Xmt &ln t®*· Aa» His As» ala Tyr pro i-«u Ais hsp as» AO 35 30 OCA M!S TCA ACA CTÃ. «AA GAA TTA ÂAT T&T AAA «RA W 5tm A8A ATS Pre Asa Ser Thr Msú «la Glu l*su Asa Tyr Lya ©iu Ah® Leu Arg Hat 3S rn 45 ACT «AA «AC AST TCT MS8 8AA CTS «TA «AC AAC TCT ACA STA AAA «AT T&i? «lu Asp Sor Ser Thr ©1» Vai &*» Asp as» Ser TA.* Vsi l>ys App 5;> 55 eo «CA «TT ««3 ACA «ASA ATT TCT GST «TA SSG OfcS ATT TTA «er «ΪΤ em Ala v&l «ly Thr Sly Xl® ser ¥al v&i «ly «1» lie Leu sly vai y»! SS te 7% ea SSA GTT CCft TTT -8CT ©0© ©CA CTC ACT TCA TTT TAS* CAA TCA TTT CTT Sly V*l Pre Phs Ala Ôly Ala &eu Thr Ser The Tyr «1» Se* Phe &e» $3 SÕ ss MC ACT ATA TOS OCA AST SRT 8CT SAC OCA TSG AA8 «CT TTT ÁT© GOA. Aon Thr II» Txp Pr» Ser Asp Ais Asp Pr» Tsp 1¾¾ AI» Pb* Hftt Ala 100 10S 110 CAA (3TT SAA OTA CT8 ATA GAT AAS AAA ATA «ÃS GAS TAT «CT AAA AST «1» val 81«. V»X &su 11« Asp Ay» l«ys IlS Slu 81» Tyr Ala I*ys ifcgr 115 120 12S aaa áes ctt «ca sã© tta cm ©st ctt caa aat aat ttc «aa gat tat Ly& Ais Leu Ala ©1« leu ©1» Sly Lee GXe Asa A»» 04»« «1» Asp Tyr 130 XIS 140 ©TT AAT GOG TTA ΑΑΤ TCC TG© AAS AAA ACA CGT TEA AGT TTS OSA AST val As» Ãia Ireu AS» ser Tep ly» Ay» Thr Tr<s Asa Ser leu A*^ ser 145 ISO XSS 1«0 ΑΛΑ ASA ÃfíC CSA. 88T «S8A ATA A8@ «AA CTT TTT TCT CAA OCA 8AA AST Cys Arg ser «1» «ly Ara lie Ar^r 61u teu Ohe Ser 81» Ais 82u Ser XtfS 1?0 1TS CAT TST C«T AAT TC© ATS CC® TCA TTT «CA «TT TCC AAA TTC «AA «TS His -Fh« Argr Aâ» ser Met Ar» 8er PA» Ala v&l Ssr t»ya PAe «1» Vai isõ xas ioo CT8 TTT a CCA ACA TAT ©CA CAA 8CT ©CA AAT ACA CAT TTA TTG CTA Leu 0h« Le» Pre Thr Tyr Ais 81» Ale Ale Asa Thr His teu Lee Leu 15*3 £00 2&S Tm MA ©AT SCT CAA «TT TTT ©GA «Μ «AA *G» ««A TAT TCT TCA «M Leu Lys Asp Ala «lo Vai 1¾¾ Gly ©1« «la Trp Sly Ty* Ser Ser 81» 210 213 ££ΰ «AT «TT «CT «AA TTT TAT CAT A«.A CAA TfA AAA CTT ACA CAA CM TA© Sé 144 S40

28S

3XS 3A4 432 480 576' «72 485 ΡΕ1040192 âsp vai Ala Glo p*e Tyr Ki« AK-g ©la Leu hya teu Th* Cln 01 n Tyr· 225 2.3Θ MS 240 ACT CSC CAT TGT Θ-ΤΤ MT TGG BMf MT GTT GOA ΤΪΆ MT @3T ΤΪΑ A©A 768

Tfer .Asp Hi.» Cys Vai Iwm Trp Tyr Mn va,i s:ty Lau Gly teu Argr 24S .3S0 255

Gly Ser Tb* Ty* Âsp Ala Trp Vai Lys Phe Asa Arg Phé Arg Arg «lu 260 2«5 17Φ- ATO ACP TO ACT «TA TTA «AT ÇTA ATT «TA CTT TTC CCA TTT TAT «AT *«4 «et Thr Loa Thr vai La» As®· teu lie Vai Leu pfce p«o »he Tyr ftsp

225 238 25S STT 03« Tfk TAC CCA AM €06 CTT MA ACA SAA CTA AC& Ά&Α SAC ATT §13

Vai Arg Leu Tyr Pb» Lye «1?/ vai Ly» Th* <3I» Leu Th* Args Aop lie 2SÍ< 20$ 300 TCt AC© CAT CCA ATT TTT 0OÇ GfT AAT ACT CTG TOO GA* TAC OCsA CCA 9« 8

Set Thr Aop Pxx» lie Phe Ai® vai Asn Thr Leu Trp Glu Tyr dy Pr» 385 310 MS 320 act ttt rra ast ata gaa mc tct att 0¾ m oct ca? m τττ m? iões

Th* Pb» Ma Se* O* Glu Ass Se* He A,*g Ms Pro ais Leu Ph« Asp 32 S 330 335 TAT TXA CA8 SGC ATT ©M TTT CAT AOS CST CTT COA CCT ©GT T&C TTT Í0S5

Om AAA «AT Τ0Γ 1213 »f ΤΑΤ TG© TCT ©GT AAT TAT ©CA GAA ACT ASA 1104 ©iy hym Ao» Ser Pb* Asa Tyr Vxp Ser Gly Ag» Ty* Ala d» The Arg 355 340 368 CCT .« ATA m& TCT .ACT AAC ACA ATT MlF TOC Í3CA TTT TAT C«A ΒΑΤ ilSÍ

Pro ser lie Gly sox ser lys Thr XI e Thar Ser Pr» Pfee Tyr Gly Asjp

370 3TS AAA TCT ACT «AA CCT GTA CAA AAC CTA A0C TXT GAT «GA CAA AAA. GTT 1308 tys Ser Thr ©lu Pr» Vai Gin Lye teu Ser The Asp Gly Qln Lys MAl 3SS 330 3SS 400 TAT OSA ACT ATA COT AAT ACA «AC «TA ®C8 ©CT TC© 006 AAT CCT AM$ 1349

Tyr Arg Th.*.. II® Ala. Ma Thr tep Vai Ale Ala Trp Pr» Asa. ciy Lys aos 4io «g

©TA TAT TTA CGT GTT AOS AAA GTT GaT TTT AO? CM TÃT CAT CAT CJUk I20S vai Tyr teu ®iy vai Thr Lys Vai Asp Phs Sor Gin Tyr .Asp Asp Gin 420 425 430 MA AAT ©AA ACT ArfTT AÇA CAA AÇA TAT GAT tCh AAA AC* MC AAT 9SC 1344

Lya Asa ©iu Th* Ser Thr Cl» Tfer Tyr Asp Ser Lys Arg· Aâh ASh Gly 4SS 440 44s CAT GTA ÁST: SCA CAÇ CAT TCT ATT Ç*r CAA :TT.A CCS CCA CM ACA ACA 1392 486 ΡΕ1040192

His VsJL ser Ala 81a Asp ser He Αβρ slrt 1*«« *r© í*r<a 01 u Tbx Thr 4S0 4SS 4£3 mr mh oca ctt saa a*a sca t&s μ,τ çâç ew à&t t&e qcg ssa 3,440

Asp 01« Psre íjStt 81« &ys Ala Tyr Ser Hie 01b Leu Asn ‘fyr Ala Sl« 4$S 478 47S 480 um m tta «m cm sac cst cst ssa aca att oca τη vn ãct tg® koo

«ys Fh» icesi «et Si» Aap Arg Arg õiy Tfer XX* fro pím »he ft»r Trp 48S 490 49S

ACA CAT ASA AOT ©TA «AC TTT TTT ÁÃT ACA ATT 8&T <3CT GAA AAO ATT 3,SM $&r Mis Argr ser vai &sp Pte& The ashs Hsr il* aap Ala sl» t»ym Xie soo sas sxe ACT CAA CTT OCA SFTA St» AAA OCA TAT OCC ΤΓΟ TCT XCA ©ay OCT TCC 1SS4 Tíar SI& Po» j?r© Val vai i*y· .Ala τγχ Ala &*u S*r ser Qly Ala. ier SIS S20 525 .ATT ATT CAA cm CCA SOA TTC ACA QSA OSA AAT TTA CTA TTC CTA AAA 3,43*

Il« 12« 01« Oly Píó Gly P.he Thr eiy çly Aso $..*« Laa Phe? Le» Lyg 030 SIS §40' «AA TCT &ST AAT TOA ATT SCT AAA TTT ARA ©Tf ,ACA ΤΤΑ AAT XC& OCA 2.680

Ql« ssr s»r Aso Sor ils Ala p&s ly® y»l ftr L&u Aso s«r Ma 545 SSO SSS SS0 ®CC TOQ TTA O.AA COA tÂT CCT CTA ÀGA ATA OQC TAT ©ET TCT ACC ACT 1728

Ala Leu Lèsí Sl» Argi Tyr Arg V*X Argt XI· Ar® Tyr AI® 0®r Tiir Thr $6$ S70 075 AAC TTA CCA CTT TTT OTO CAA AAT TCA AAC AAT «AT TTT CTT OTC ATC 1770

As» Lao Arg &ea Fhs vai SM aso ser Asa aso m& Fho v«.i ne

SSO SSS S9G mc ATT AAT AAA ACT ATS AAT AAA ®»T 8AT 0ΑΤ TTA ACA TAT CAA. ACA X8*4

Tyr II® Aon 14« TAr .«as. Asot. &ys Aap A®p Asp La« Thr Tyr <íln Tfer SSS SOO SOS TTT «AT CTC OCA ACT ACT AAT TCT AAT ATS 000 TTC TCO OCX ®AT AAC· IS 72

Phe ãsp %&a Ais ThT Thr Am Sor âsn Het dly &fce Sor Cly Asp Ays 8X0 SIS 630 AAT SAA CTT ATA ATA SOA ©CA OAA TCT TTC QTT TÇT AAT ORA AAA ATC 1920 ãvm elu T>ew 11« xl« Sly Ala clu ser Ffee Vai sar Asm. «1«. lya lia 62S SSO ÇâS €40 TAT ATA GAT AAG ΑΤΑ OAA TTT ATC ÇCA CTA CA& TTG TAA ISS.&

Tyr 11« Asp &.ys 11« el« Ffe.« xl· ®ex» vai óia xau S4S sso (2) INFORMAÇÃO PARA SEQ ID NO:62: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos 487 ΡΕ1040192 (B) TIPO: aminoácido (D) TOPOLOGIA: linear ína SEQ ID NO:62: (ii) TIPO DE MOLÉCULA: prote (xi) DESCRIÇÃO DA SEQUÊNCIA:

Mefc Aati Pr» As» As» A«g Ser Síy 1 $ Asa ser ala Leu 01» Sflar Ae» Ei* 3# Pr» Asa Ser ttap Leu 61» Qlu Leu 3s m Tíar *31» hep Ser Ser thr Olu Vai .50 5S Ala Vai Oiy Tíur Oly Ile ser vai SS 70 SXy Vai Prs» Phe Ala 61y Ala. Leu 85 hm $Er lie Trp pxo ser Asp Ala 1.00 ala Vai 6Xu Vai Lee Ile Asp Ly« lis 120 Lys Al« L«tt Ala ®1« Lftsi βίΛ 61y 130 5.35 Vai San Aiâ Lee ASA Ser Lys 145 ISO

Ly» Arg Ser ©1« sly Arg XX® Arg 1SS Eia Phe Arg Assa ser «et aso Pr» Ser Leu Phs Leu Pro Tyr aos AXa (Si» ao» Lôu-Ly* Asp Ala *31» vai PA® Gly 310 3a£

Asp V»1 Ma 01a Ph* fyr Eis Arg 225 230

Thx· Asp Eis Cys Vai As» Trp Tyr 345

Oly ger *Phr Tyr Asp Ala Txp Vai soo

Kl* Asp TM H.a Ly» Vai Ofar Pr*

10 IS

As» SI» Tyr Pr» Leu. Ala Asp As» 25 30

Asn ryr Ly* oiu Sfce Leu hxp Met

4S

Leu A*p Am ser Xhr Vai Ly» Asp val sly <sln χι» Leu Siy vai Vai 75 90

Thr Ser Pba tyr 61». 6ar Pb* Leu :>0 ss

Asp Pr» T*p Ly* Ala Phe Met Ais 10S 110

Lys Xis Cílu Glu Tyr Ais Lys Ser

13 S

Leu elft Asa ASn Phe 61» Asp 3*yr 140

Lyas vur Pr» L*u ser Leu at§ ser 1.5 S 160 «X» Leu Phe ser 61» Ala alu Ser

170 17S »»« Ala Vai Ser Ly* ?&* slu vai 185 1..7i>

Ale Ala A*» %r Ki* Leu. 'Leu Leu 20S 61» Olu Trp Oiy nyx ser ser alu 330 61» Leu Lys Leu Thr OX» 61» Tjr» 235 340 A»« Vai aiy Leu »*» ΟΪ y Leu Arg 2:50 3f«

Ly* Ph« Aan Arg Píws Arg Arg slu 26S 270 ΡΕ1040192 488

Mefe Thr Leu Thr Vai Asp 275 a&o Vai Arg i»eu Tyr Pr© Xys Çíiy V&l 290 295 ser -rhr Asp pr© ile phe Ala Vai 3OS 110 Thr Ph» l®« s*r He Glu Mn ser 12S Tyx ku 61ss «31 y He elu Pise Bis 340 &%.y Ly© ftsp ser F&e Iam Tyr Trp .355 ISO Pr© Ser Se ôly Ser ser Lys Ttrr 378 175 Lys Ser T&r SM Pr© Vai Lya 11S 3» Ty* Arg Tfer lie fia Mn. Thr Asp 401 Vai. Tyr Essii ely vel Tfer L.y© vai 428 Lyg fmn tliw Thr Ser Thr Gin Thr 43S 448 His Vai ser Ma ·01η &ap Ser 2le 450 455 Asp 31« Pr© L<s« 6iu Lys AI a Ty.r 4SS 470 Cys Wse Leu «et 61«. Asp &rg A*g 4B5 Tfer Sis Arg Ser Vai Asp Phs fh© 500 Thr ela L®a Fr& ¥®1 vai Lya Ais 515 $20 xle 11« ®lu &iy Pr© Siy Ph* Tbr 118 515 ísiu Ser Ser Mffi Ser O© Ai a Ay© 545 SSO Ala teu Leu ®Xa &rg Tyr Arg Vai

Ile Vai Leu Phe Pro Phe Tyr Asp 295

Aep Ph« ser Gin Tyr As$> ela 425 410

Asm Thr Ile Asp Alá 61« Lye Ila 505 5X9

Gly Ôly ta Leu Leu. Phe Leu Lys $40

Phe Lys Vai TAr lsu asei s*r Alá S.5.5 $59

Arg Ile Arg Tyr Ala Ser Thr Thr 489 ΡΕ1040192 SÁS S'ÍS 57¾

As® Leu Ajg &eu Ph® Vai A*» «β* *®:ίϊ &®ϊ5 ^*P ?*>» i*** Vai j * SfiO 5S5 SSO yyr ila hm Lya sfer «*t Asas s.ys a»P »«P -*«P i·*» *&>? ?y*· si« sss &oo oss í%a h&p Leu Ãt8 Thr tfer A*a S®* Asa Hat ely Pfc« 3«*· <3Iy fm$ *,ν 610 61.$ $2$ .Sa» GX® L«u lie Xi* «ly Ala «1« $»r &*m* vai «a* as® álu «ss «30 83 S 640 fyy Tl* ».ssp Tcyfs IIa (5.iu J»ha lia 9v* VAl ®'i» Lau S4S &S0 (2) INFORMAÇÃO PARA SEQ ID NO:63: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:63: ATO AA.T CCA AAC AA7 CSA GAA CAT CAT AOS ATA AAS· <3TT ACA CCT 40 MSt Asa Pró Asa AA® Mg s®r aiu HÍS ASp Thr Ile Lys vai Thr Pro .1 s xo is AAC AG-T GAA 7TO CAÃ ACT AAC CAT AAT CAA TAT CCT TTA CfCT CAC ΑΆΤ 96 As® Se? Slu Leu om Thr ASA M.S mn Gin Tyr i>?a LSU Ala ASg ASE SO XS n» CCA αλτ TCA ÃCA cm GAA OAA TTA AAT TAT ARA <3AA TTT TTA AGA ATG 3.44 PrÓ Ask 3sr Th:t- Leu ôlu Ôitt Leu hm- tyr Lyc Slu fhe Leu Arg Mefe 1$ 40 4S ACT CAA «AC AGC TCT ACG SAA GTG cm «ac ÃAC TCT ACA «TA ABA GAT 102 Thr Glu A&p Ssr Ser Thr Sitt Vai LSU A8p AS® Ser Thr vai Lys Aap SC SS «0 «CA GTT GGG AC A GiSA ATT TCT ΘΤΤ Sa GGG CAS ATT TTA «G? GTT «m 240 Ais vai Sly 7inv Sly Xle Ssr Vai Vai Giy 5! In 1½ Leu Qly VAX vai sSS 7Q 75 8© ©GA OTT CCA TTT CCT ggg GCA CTC ACT TCA TTT TAT CAA TCA TTT CTT SSS illy Vãl Ρϊΰ Phc Ai» sly Ala Leu Thr se*" Pha Tyr 01» Ser Píia Leu ΡΕ1040192 490 as se ss ase act aa tss oca mt om gct sac cca tss ms ser ttt atg gca 33«

Asa Thr Ile Trp Ser &sp Ala Asp Pro Trp Ly» Ala Pise Mefc Ais 1.00 X05 - 1X0 GAA w «ÃA mh cm ata. sat aaô «a ata gsg 3AG TAT GCT AAA ΑΦΤ 3 84 81» VaX 3Xu Vai Leu XXe Asp Lys Ly* lie sia «la Tyr Ala Lys Ler

115 1.33 X2S ma gct crr « sag tta cas @arr err caa aat mx ttc «aa sat tát 422

Lys Ala x<e« Ala ela Leu 31» Gly Le» 31». Asa Asm Ph* 31a Asp Tyr X30 13¾ 140 8TT AAT 303 TTA AM" TOO T33 AAfâ AM ÃCÃ CCT ΤΤΛ AOT TTS CGA AST 480

HS ISO 155 ISO asa. asa àgc (m em c&& &m ass «aa «ff w tct caa oca saa a®p $20

Lys Ar® se··»· 31a Aap Arg li® Arg 31« Leu Pí*e Ser Gls AXa 31» Ser ISO 170 17S CAÍ’ TXT OST MT T0C ATS CCS TCA TTT GOA STT TCC AAA TTC «AA STB 57« «ia Ffae A*f Asa S er Met P*© Se se Phe Ai s» Vai Ser Lys 31» Vai iss les ise em ttt cm ecav aba »t sca β«Λ gct cm »t &c& cat m ττα cta 334

Leu rbe Leu 'Pr» Thr Tyr Ala Gin Ala Ala Asa Thr «ia Leu Leu Leu im 20G sos

Tm Mft SAT KT C&A 0¾¾1 TTT Qúh OÃÁ OÁA TG« OSA. TAT TCT TCA «AA STt .Leu Lys Asp Ala G.lo Vai P;h® Cíly Gl« 31« Trp SXy Tyr Ser Ser ®Xu 23.0 2X5 220 GST GTT GCT WiA TTT TAT CAT AOA CM TT& ÃAA CTT ACA O» CAA TAC 730

Aap V*X M* 31« Pise Tyr Hls JUfg 31a Leu Lya Le« Thr 31» Ola Tyr 22S 230 23S 240

ACT GAC CAT TGT STT AAT TGG TAT AAT 35T 33« TO AAT «ST TTA ASA TOS

M»r hsp His Cys Vai te Trp Tyr Asa Vai 3ly Leu Aaa 31y Leu Àrg 24S 250 2SS

SST TCA ACT TAT SAT OCA T«® «TC AAA TTT A&C CGT ttt OSC ASA 3ftA SIS 3ly Ser Tte Tyr Asp Ala txp V*1 Ly* Pb® Ae» Arg Ph® Arg Arg 31« 2S0 205 27£> ATS ACT TTA ACT «ΤΑ ΤΡΑ 3AT CTA ATT 3ΓΑ CXt TSC CCA TTT TAT GAT 8« 4 I4et Tb» Leu Vbr vai. .Leu Asap Le« 11# vel Léu Phe Pro Sisa Tyr Aap

275 280 2SS STT 033 TTA TAC CCA ASA GGG «TT MA ACA SAA CTA ACA ÃGA GAÇ ATT S12

Vai Arg Leu Tyr Pifo Ly® 3ly Vãi Ly» Hsr 31« Leu Thx· 3teg Aap lie 230 2SS 300 TTT ACS «AT CCA ATT TTT TCA CTT MT A0? OT CA© «AS ΤΆΤ 33A. CCA SS3

Phe Thr »sp Pr» ile »he Ser Leu Aau Tbr Leu 31» 31« Tyr 3Xy ψχο 491 ΡΕ1040192 305 MO 315 330 ACf TTT TT® AST ATA GAA hPtC TCT ATT OSft. AAA CCT CAf ?T& TXT ®AT 100«

Thr Pfee Se* ll* âltt &»n Se* íle Árg .fcye Ρ*ς» Hia Laai Fhs Asp 325 330 335 tat ia caa saa ats g&& rrr cat m cot ctt csa cot ®ot tac rrr iom

Ty* MS Sim Cly lie ©1« Pbe His Th* A*g· !.»« Arg Pre Ciy Τγ* Phe MO MS .359 ο®® aaa mr rcr rrc *at tat rm tct ©ot aat w ©ta saa act asa 11.0¾ <31 y l*y» A»p Ser Pfee As» Tyr rrp Ser Sly Ãs:?i Ty* v*l SXu Th* Àrg 3S5 »«ft 3*5 CCT AST AI» ®G% TCT AOT AM» K» ATT ACT TCC OCA ΤΊΤ TAT ÇSA SAf 1152

Orõ Ser Tis Sly Ser Se* I>ys Thr 11« Tfcr Ser P*o Pise Ty* ©iy Aap 370 MS 3S0 ' AAA TCT ACT ®&A CCT OTA C.AA MG CTA A«C TTT G&T SOA ÇAR AM ©JT 1200 S»ys Ser Th* sltt Pr* V«1 016 Ay# fceu Ser *he Asp Sly SI.» Lys vai 3SS 300 3ÕS 400 mt CSA ACT ATA QCT AAT ACA ©AC ®TA ©C© <3CT TG© CC® A&T ©ST M© 1248

Ty* &rg Th* lie Ala Asm Tbr Asp Vai Me Ala Trjí p*e isa ©j.y &y» 4OS 410 415 OTA TAT TTA SOT OTT AC© AAA ©**· «AT TTT AOT SA& TAT OAT OAT CM 12 »6

Vel Ty* fce» Oly Vai Th* hya vai Ae» Fhe Ser <S» yyy Rsp Asp íâln 420 425 430 ΑΛΑ ΑΛΤ SM ASf ACT AGft 6« &CÃ TAT QM' TCA AAA ASA AAC AAT ®®C ±344

LyS ftsri ©la Thr Sár Th* Gl» TA* Ty* Asp Ser Lys Arsj Asa Asm Gly 435 440 445 CAT OCA AOT OCA CA® OAT TCT ATT SAC CAA TTA OSS CCA SftA ACA ACA 1392

Ris val sor Alo Gin Asp se* 11« A®p sln· Lee F*o P*s» SXw Th* Thr 4 SO 455 45Ό OAT «m CCà CTT «AA AM SCA TAT ÃST CAT CA® OTT AAT TftC CCS SAA 1440

Asp ©lu P*e te» ©iu hy® Ma Tyx Se* Hie ela leu Mn Tyr Ais Slot MS 470 473· 480 TST TTC TTA AT® CA,® «SAC C®T COT ©Sft. ACA ATT OCA TTT TTT ACT TSG 1488

Th* Kís A*s ser vai Aap Phs PM &sm Th* lio te& Ale Olu t^ys lie 500 SOS .510 ACT CAA CTT CCA ©TA ST® AAft GCA TAT ®CC TTC TCT TCA CCT QCT TCC .J8®4

Thr ©ln leu ftpo Vai Vai &ys Ala Ty* Ala leu Se* Ser ®ly Ala $«* SIS 520 525 ATT ATT CAA ®OT CCA OSA TTÇ ACA ®SA 0®A AAT TTA CTA TTC CTA ΜΆΆ 1S32 lie lie Cio Gly Fse ©iy Phe Th* ©ly sly aso hm r.eo fhe heu tys ΡΕ1040192 492 $.30 315 540 a;u\ tct a«t λατ tca att gct aaa. ttt m &rr aca tt% aat tga ©ca fâltx «er «sr Asa s«r Xi« Al* tya Mjs ty» V«1 S&r Seu &en S*r Ai* 24 g. SSfl S.SS S60 eec tt& m caa «m mx cax ea asa ata cac tat «gt xct acc act A1& íe» L*« «X» A*g xya" a*© Vai Are? n« arg 3W A*« Saí Tkx vbx 5S5 S70 S?$ AAC Ttfc 08A CSX TTT «IS £&& AAT TC* AAC AAT ©AT TTT CTT ©TC ATC Agn Xe» .Arg L*u The V*X ©la Asa Ser Asn Aen Asp Pfc» t*vs V«X Xle $.gO 585 550 TA€ ATT AAT A8A ACT ATEi AAT AAA GAT SAT GAT TEA ACA TAT CAA ACft Tyj.' Xis jmkí Py» Thr «tet Asa bys Asp Asp &sp Leu T&r Tyr ©1» The· sss £00 sos rrr ©at cxc «c* mt *ex aat tct aat m© m& rrc tos ©st srt m@ Ph« Asp Xe» Ala Shr TH*· Asa ser Asa Wefe 61y FAs Ser ©ly Aep Lys MV «iS 630 AAT <3AA CTT ATA ATA ©SA «CA ©AA TCT TTC GTT TCT AAT SAA MA ATC A#« ©iu Leu íle lis ©ly Ma ©Xv #«* Pb# V»1 $«ít Asa 31u Lys lie §3$ 530 535 £40 TAT ATA ©AT mt ATA ORA TTT ATS δ©Λ ©T» SAA TV© TAA Tyr xl# .ftjssp í^ya Hs «Lu she 11« sro v«X Sl« leu #4S 85® 1S8Õ 173 Ϊ

1T7S i.824 1872 xm& (2) INFORMAÇÃO PARA SEQ ID NO:64: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:64: ase. tro Asa Asa Arp Ser diu 8ís &sp Thr He nys vai T&r Fr» i, s iõ is ASSA .Bar illu L«u Gla Tfil Assa ©Is ASMt. «Xa Ϊ5Τ pro Leu Ala Asp Asn 20 XS 3©

Pro Atm Ser T&r leu ala eiu Léu Asa Tyr r*ys «iu pinm Leu Arsgr Mat sis 40 4$

Ala vai eiy Tlar «iy ll« âer V«1 Vai ely dl** lie Leu. dly vai Vai €S 70 TB 80 493 ΡΕ1040192 sXy Vai Prt> Pht» alá sly Ais Lsa TÍW S«r The Tyr Gin ser vhs > Leu 8S 00 83 &SK Thr lis Trp f*to Ser Asp Alá A$p Prô Trp iyg Aia phs Ais 100 105 210 Gin vai 81» Vai Leu ilá A»p Lya &y« ΪΙ& Glu Glu Tyr Ala. l.<ys Ser iiS .120 12 § V/s Alá ,U>U Ala Glu Xí®U Gin Gly leu Gin Asn Asm Phe ísltí. Aáp Tyr 130 138 140 vsl Asn. Alá LáU &£3U s«r Trp lya Lys Thr Pra Léu Sar Leu Arg X4S ISO 155 ISO xys Arg Sest1 (Sio Afirja Ai*?i 11* Arg· Glu l*ú Fhe ser Gla Ala Glu Ga* 145 170 17 5 His Fhá Arg Asn Ser M®0 .Sr© ser she Ala Vai Ser Lys Ph® Glu vai *ao 133 190 .L-sii í»hs LáU p&o Thr Tyr Ala Gin Ala Ala Ass» Thr BA s Leu Lev Lau 1SS 200 205 Leu Í:'/S h&p Ala Gin Vai Stae ílly Glu Glu Trp Giy Tyr ser Ser Glu 210 218 320 Asp Vai Alá ei» $tee Tyr Hã.s Arg Gin Leu .Lys Leu Thr sl» Gin Tyr 22 5 230 2.35 340 Vfer Λκ» His eyá vai Asa Trp Ty* Aso Vai (Jly LSU Aau V- ^ y ê-jwíij. Arg 24S 250 255 Giy Ser fhr Tyr Aáp Ala Trp Vai lys» SÍSS Asn &rg Fhe Arg Arg Glu MQ 3SS 270 Thr l«u Thr Vai Leu Asp Leu XI* Vai 3Ue«. Ohe 8*o vhe Tyr &sp ã?§ 280· 285 Vai. Arg Leu 2S»B Tyr Prc iys Giy Vai Lys Thr 295 81» Leu 300 Thr Arg Asp 11« Siá Thr Asp Pr© Xlê Ser Leu Asa Th* Lsu Gin Slu Tyr 81y Pro sas lio 315 328 Thr Phs Sí®» Sar lia Glu A@n Ser 22 £s Arg Lys Pro His Leu Phe Asp 335 330 335 Tyx Àeu Girl Sly lis Oiti Fíi* Hiá Thr Árg Loo Arg Vro >31 y Tyr Phe 340 345 3SO Cly Ly6 Asp Ser Wkm Ass Tyr Trp Ser Gly Asrt Tyr Vai Glu Thr Ar-3 3SS 3®Ó 3ii65· Pr» ser lie Gly Ser Ser .Lys Thr lie Thr Ser Ire Phe Tyx Gly Asp 3?« 375 380 494 ΡΕ1040192 i-y.s ser Thr 01¾ f»ro vai -·οΐη ϊ*γ$ fce» ser l>h« mp aly Lys vai 385 330 3 S>5 400

Tyr Srg T.b r 1.1 s Ala As® Tfcr Asp Vai Ala Ala Trp Oro .As.® fôly i.ys

«OS 410· 41S

Vsl Tyr La» <Siy Vai Thr I*ys Vol Mp Pte Sâr tila Tft &s§p Asp δΐ» 420 425 430 ly® Asa íslu Thr Ser Tfer Gin Thr Tyr &®p Ssr Lys Aru As® Assn Gly 43S 440 445

Cys Phe Leu wet 61a Asp &s?g· Arg Gl.y Thr 11« Pr o Pise Pbe Ti»r ttp 48$ 490 495

Uj.r sis Ar«| Ser Vai Asp 3?&a Ffcus As» Tfer 11« Aep Ala 61® Lys lie SOO SOS 5X0 ®hr sia leu Pr» v«j Vai Lye Ais -Ttyr Ala Leu Ser 8ar Sly Ala s«r SIS StO 575 lie 1.1® Ql« <S'ty Pm ©iy She Thr ©ly ôly Aa» Leu leu Pha Leu Lys sxo sis S40 qíu Ser Ser A*» Ser '11« Ala Lys Pha Ly» V«1 Thr £>«« As® Ser Ala S4S SS0 5S5 S«0

Ala leu sl» Arg Tyr Aegr Vai Ar§ ria Arg Tyr Ala Ser Thr Thr

5S5 S70 S7S

As® &stt Arg leu Phe Vai tífln. Asa Ser As» As». Asp Fhe Le» Vai iie 580 #8S 53Φ

Pim Asp ieu Ala Thr Thr- hm Ser hm «et Gly Phe Ser Sly Asp Ly& 4i® 61S 420 Aân <*iu Mm .X.l« lie 61 y Ala 61 u Set Mse Vai B&i &&n Slu Ly.s £le SSS S30 «35 §4s

Tyr ile h$p Ly& 11« <31» Phe Ile Pro Vai ela Leu S4S sso (2) INFORMAÇÃO PARA SEQ ID NO:65: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases 495 ΡΕ1040192 (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:65: ATO· MT CCA AAC AAT TOA mt «M CAT GAT AGG ATA. AAS GTT ACA CCT 4» í>fet Asa Fm fen Am S«r Glv ai® &®p Tbr £Xá Ly* Vâl Thr Pr®

í s io tS AAC AGT 0AA TTO C&A ACT AAC CAT MT CSA TAT CCT ΤΓΑ OCT «AC AAT 93

Aan 8«* «1« Leu Glu tfer As» Eis Asr. Si» Tyr Pjfo Lísíí Ala &ε-ρ ftsrs 20 25 .30 CCA AAT TCA. ACA CTA EftA ÍSAA. TTA MT TAT AAA GAA TTT ΊΤΑ AGA ATO 144

Pr® Asm Ser Thx Leu Glu Gltt L&u Asa Tyz Ly& Glu Ph.â Leu Ar® Eefc 3S 40 4-5 ACT OAA SAC AST TCT ACG «AA «TO GTA «AC A&C TCT ACA GTA MA ΘΑΤ 192

Thr ©Isr Asp s*r TA» Glu vai Leu Asp Asa ser vhr vai Lys A»p 50 5S BÚ GGA QTT GGG ACA «GA ATT TCT STT STA OSG CÃS ATT TTA GGT STT ®TA 240

Al* Vai Sly T&x Giy lis Ser Vai Vai Gly «In S* La» Gly Vai vai «s ?e 75 00 ®iSA GTT CCA TTT «C¥ «CA CTC ACT TOA Φ2Τ TAT CAA TCA ΤΤΪ CTt 240

Gly Vai 8T& ®b» Ala Gly Ala Le» TEr $ér Pba Tyx Gin S®s Phft Leu es só 99 AAC ACT ATA TOS CCA AGT «AT GCV GAC OCA TO® MG GC* OTP ATO OCA 210

Asa Thr Ii« Trp Pr© Ser Asp Ala Asp Fr» Trp Lys Ala Pfca Mefe Ala iee ios no ÇAA CíTT GAA Gm CTO ATA «AT AAQ AAA ATA. «AS «AS TAT GCX AAA ABT 204

Gin vai ©iu val L«a Ué Αβρ Lys Lys Tis Giu «lu Tyr Ala Ly» Ser 115 120 120 AAA GCT CTS «CA @AS TTA CAS 0®í CTT CAA SAT AAT TTC «AA. «AT TAT 4:32

Lys Ala t«u Ala slu Leu ΟΪ& Gly Lua Gl» Assa Asa F&s Glu Asp Tyr 130· 135 14 Õ «TT AAT W& TTA AAT TOC TSG AAS AM ASA CCT TTA AGT TBS CSA A«T 480

Vai Asa Ala Leu A*a ®«r Txp- Lys Lys Tfejf Fr» LSu $4tZ Leu Ar® ser

Ly* A*g Ser Gin Gly II* &x*t Glu Leu Fh® ser el» Ala Glu Ser 496 ΡΕ1040192 CA? ST? COT *AT TCfc ATS CCS TCA TTT OCA ST? TCC MA TTC CAA ffiKS S7«

His Fhss Arg a»» s«j? Maft Fr© ser Phe Aia Vai ©e*? hys Phe Glu Vai IÓO 185 290 CTS 5W CTA CC& AC» TAT OCA CAA CCT ©CA AA? ACA CA? TTA. TE& CTA 624

Tm asa ©a? ©cr caa ©st m soa ©aa ©aa tos ©qa tat tc? tca gaa «72 iam Lys Asp Ala Si» Vai Fh* «ly ©lu SI» Trp Gly Tyr ser Ser Gla aio sis 3*0 ©A? 3TT SC? ©AA TTT TA? GAT ASA CAA TTA AAA Cf? ACA « C&A ?AC 7*0

Asp Vai Ala ©lw »1>« Tyr Hía &*g Gla teu Ay» 'teu Thr ©la Gin Tyr .»»*» as© ais 240 SC? «AC CAT TST ÕTT A&T TQ© TA? A&T GT? SOA TTA AAT «8T TTA ASA 785

Thr Aep Bis Cys Vai Asa Trp Tyr Aen Vai Gly teu &sn. ©ly teu Ar§ »45 aso 255 ©GT TCA ACT TAT OAT ©CA TSG STC AAA STT AÃ© CS? ?Tt ©SC A«A GAA. 015 ©ly Oer -Thr Tyr Asp Ala ?*p Vai hy» vim Asa Arg ?he srg Arg ©lu 260 2(55 ST© ATO AST TTA ACT ©TA TTA GAT CTA ATT ©TA CTT TCC CCA ΤΤΤ TA? «AT 054

MCfc Thr teu Thr vai teu mp teu 11& Vai teu Fh® fsx» Pfeí& Tyr A»p 375 250 28S ATT C©0 TTA ?AC TC» AAA GO© QTT AAA AC» GAA CTA ACA SOA ©AC ATT »1* 11« A*g teu Tyr Ser hys ©ly vai ky* Thr ©la teu. Thr Arg A»p He

Ph« Thr Asp ?ro íl« The hm* teu Asn. Thr teu 31a -slu Tyr ®ly Ptp 3DS 310 215 12 ê ACT ITT Tm AGT ATA ©AS AAC TCT ATT OCA AAA CCT CA? TTA TTT QAT 1005

Thr Fh-e teu ãer 11« Olu Aau 5«.r 1.1« Arg S«y» 5re Hi* teu Fh® Aap 325 320 .33.5 TAT TTA CSC SOS AT? ©AA. m ©AT SOS? ©βτ CTT CAA CCT ©ST TAC ??? 1055 ?yr lusa Sln aly lie ©lu Fhe Hi» Thr Arg t>ev QlR Fr» Gly Tyr »ha MS 145 250 ©S© AAA GA? TC? TTC ft»T TAT Tm TC? CCT AAT TAT ©ΤΑ 8AA AC? AOS 2204 ©ly l»y« Aap Ser ©h» A»» Tyr Trp Ser ©ly Asn fyr Vai ©la Thr A*g SS5 380 U% CCT AC? ATA ©GA TC? AO? AA© ACA ATT AC? TCC CCS TT? ?S? ©0A ©AT 1252 ®*?e á«r 21« ©ly ©*r Oer ;Ly.a Thr íl« Thr ser Fro The Tyr ©ly Aep 370 .372 380 AAA TC? AC? es» CCT STA CAA. AAC ϋΨΑ &ãa ΤΤΎ GAT CCA ças. AS.fi. «?? hys ser Thr ©la P*« v&l sln L,ys hee Ser Vhe Aap ©ly Gin Ay» v»l **S 3*0 39S 400 497 ΡΕ1040192 at ea &ct at» se? αατ aca gac cm «os eer tos ce® aat ggt aag ims

Tyr kt-p Tkr lia Ala Asa TAr Asp vai Ala ala Trp pro As» 05. y- ty®

4QS 410 41S ®TA ΤΆΤ ΤΤΛ GGS CSTT AC® A&A OTT 0ΑΪ «T AST CA* TAT OAT «AT CAA 139«

Vai Tyr Leu Sly Vai Thr £>ye Vai Asp Pke Ser Gin Tyr Asv Asp ©X» 43Ô 4 25 AAÃ AAX íSAA ACT Ά&Τ AC* CAA ACA T»T SAT TCA AAA AGA AAC' AAT GÔG 1344

Lyá Aaa ®l« Thx Ser Tfer Cto Tt*r Syr Jtesp Ser i»ys Arg tem Ass Sly 43$ 440 44$

His Vai s*r Ala. «1» Asp Ser 11« tesp Gia Leu Pkp Fr» Glu Thr Tfer 45® ·*$$ 444 GAT GA& OCA CTT «AA AAA «CA TAT AÇC «&T CAO CTT AAT TAC GCB SA& 1440

Asp Glu »re Lati ®Xu JLys M* Tyr sor Hi» 01» Leu. Asn Tyr· Ala eiu 445 4TS 47$ 4S0 TOT TS© ΪΤΑ ATS CA© «AC CGT CGT 06* ACA ATT CC5A CTf TTT ACT Φ68 1438

AC& «AT ASA. JUST ·ΘΦΑ GAC TTT TTT AAT ACA ATT GAT SCT SAA AAG ATT 1$$S TI»: His fapg Ser VAI Assp Fhe Pise tem. tSrr 11« Asp AI® 61» Lys II®

T&r· 61» Lu» saro v*l Vai *g?o Ala Tyr Ala Ls» ser Ser Giy AI® ser SIS S2Ô S3S ATT ATO ÍSÁA 66Γ CCA 06* TTC ACA GOA 6S* AAT TE* CT* TTC CT* M* 1433 lie He Qlu sly wre Gly fite Thx 61y Gly mn Jaru. Lew Phe Leu Lys 530 535 $4p G** TCT AST AAT TC* ATT GCT AA* TJT AAA «TT AÇA TTA AAT TCA «CA 3.600

Gltt s«x' ser seu Ser 11« Ai® &y» Pim S.ys Vai Tkr i>ev Aon ser Ala $45 5se SSS 540 ecc ttg tta c*a mk tat c«r ©r* aga ata «se tat gct tct acc act xts®

Ale Leu teu 61Λ Ar® Ty*· A*® vai Ar® Xle Ar® Tyr AI® Ser Thr thx

As» Leu Arg Leu PAé Vai <3l» AsA Ser Asn Asr Asp PAe Leu Vai ΪΧβ ss6 sos sm TAC ATT AAT AAA ACT AT« AAT ÁAA GÃT «AT G&E TTA AÇA TAT CAA ACA 1824

Tyr lie tema Lys Tfer Met Aee Lys Asp .A^p Asp Leu Thr Tyr sl» Thr 5»s $m sos TTT «AT «te ©CA ACT AC)' AAT TCT AAT MG «©« TTC TCG OGT «AT AAG *872

Ph» Asp Ias» Ala Thr Thr As» Ser Asn Mtt 6ly Ser ©ly Aap Lys &XS Sl$ 620 498 ΡΕ1040192 AAT 0&& CTT .A?A ATA SUA SCA UAA TC? TTC ST? TCT ΑΆΤ 6AA AAA ATC Α®Ώ ÇrXu fceu tís Πβ sly Ala 01« Ser »he vai .Ses A»» Gl« Lys 11« §:2S *30 635 640 TAT hTh <3AT A&© ATA GAA ΪΤΤ ATC .... '..Ά UTO CAA TTV TAA ryx XI e Asp Lye Ile Si» Fh® Ile Pro Vai Gin Seu 64 5 6.50 (2) INFORMAÇÃO PARA SEQ ID NO:66: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:66:

Met Asa Ρττ.· A&n Asts Arg Ser <Uu ííis Asp Thr ii« Lys Vai Xhr Pr»

Asn. ser Thr bmt «Xu X*e« &an ty* Lys Giu Phe Easn XS 40 *§

Thr «&« Aap Ser S«r Thr »1« Vai !*&« Aap Ãss Ser Tfcr vai SO ss 69

Ala Vai í|ly Tftr Qly Xl* Ser Vai Vai «1γ 61» Il« Gly Vai Vai §5 70 80

Gly ml pr© Pfce Ala Gly Ma Lev Tfer Ser sfce Tyr Mn Ser Phe tem os sa ss tom Tfcr ils Trp toca Sã:r to&p Ma tosp Fro ®rg Ly» Ala Pfee «et Ala χάό ios xxo 61» vai Giu Vai La» lie tep Lys Lys lie 61« SXu Tyv Ala tym Ser 115 12Õ 125 l«ys &la Lee .Ala 61u Leu <5ln ©ly Leu Sln Asa As» Pise <5iw Asp Ty» ilO 13 S Í4Ô

Vfcl As» Ala leu Aan Ser Trp Lye Lys Tfer Pro· Leu Ser Xeu Arg Ser

145 ISO 15S 1SG X&» &rg Ser Ola Qly Ar® xis tot§ alu Aeu PHs $«r Mn Ala Mv Ser 165 X?0 125

Ala Ají.a á5ís Thr Bis Leu 205 óla 81« T*:p 8ly Tyr ser se* eiu 220 81a L>su Lys Leu Th* ©ln 81 n Tyr 23S 240 Asa val 8ly Leu A»» Sly" Leu Arg 2SÔ- 255 Lys Fhe As» Arg ?&« Arg Arg 81a 2ÊS 270 lie Vai Leu Pise psô pás Tyr Asp 235 Lys Thr 81» L®u Thr Arg Asp lie 300 fte» Thr Leu 81» ©lu Tyr Siy Vsr» 315 320 1.1© Arg Lys Pr» Mis Le» Phe Aep 339 335 Thr Ajpg lasa*. ©In Pr© <jly Tyr pke 34& 350 Ser ®ly Asa Tyy vAl ©lu rér .¾¾ 36.5 Xié Tfcur S«*· Pr» PÁ© Tyr 8iy Asp 310 Leu Ser Ahe Asp 81y SI» Lys Vai 395 400 Vai Ala Ala Trp P*a As» ©ly Lys 410 415 Asp Phé Ser 01» Tyr Asp A«p ©1» 425 430 Tyr Asj» s<sr Lys Aeg Asn As» õly 44S &®P 81» La» Ar© Pr» Oiu Thr Thr 460 Ser Mis ela Leu As» Tyx Ala 81« 475 4S0 ©ly Thr XX® fca Phs Pfae Thr Trp À9Ó 4¾ ΡΕ1040192 L®» Pfee Leu Prô Thr Tyr AI a 8l*t 195 300

Asp Vai Ala SI» Fh« Tyr ,si« &&& 22S 239

Thr Asrp Hia cy« Vai Aaa Trp Tyv 245 sly ser Thr "fyr Aâ£> Ale Ttp Vâl 260

Ffae Ti»: Aap Vro 11« Ph* S*®u ias» aes no

34S 8iy l»y& ASp sax Pis® Asàrt Tyr Tsp 3SS 360

Pr« ser lie Gly §«* 3®r 'Lye Th*' 3TO 375 l»ya Sar Thr Si» Pro vai Ql» Ly» 3«5 390 iyr Arg Thr lie Ala Mmn Thr &gp

40S val Tys Leu 8ly Vai usar Ay» vai 420 fcyS Asts- G!« tisc Ser l&r 81». Yfer 415 440

Mie Vai §®s Ala 81» Asp Ser Ha 450 45:5

Thr Mis âxf Ser vai Asp Fhe Pte tav rhr ite Asp Ala 61u Lyu lie 590 MSt 810

Thjf1 Gls LSã 9χ·« VSl Vai L-yâ Alá. Tyr Ala Lais Ssiar Se:£' Giy Ala Sssr SIS :5.20 525 lie ZÍ& fila ©ly Pr© ©ly Ph® Tfcr Qly Gly Asn teu teu Fbe teu Lys

530 SIS SéQ <31U Ser ser &sn S®r £lft Ma Lys Fhe Lys Vai Tte Leu As» Ser Ala S4£ 559 555 5S9

Ala Leu teu Gte AJe^f Tyr Arg? Vai &rg Ile Ar§ Tyr Ala ter Tfor Xfe.r S6S 5VO 525 teu Arg teu v.hé vai ei© As» is o Tyr lie Ass Lys TM' Mefe Asa Lya i3H 600 £%e tep teu Ala Tfcr Thr Asa ser ¢10 51S Asa CSXae teu lis» He siy ala <3.1© §25 Si0 Tyr lie 3Mtp Lys He <*1© Pfee lie 645

Ser Asa Asa Astp &he Leu Vai Ile 585 599 Asp Asp Agp teu t&r Tyr si» Tfer 605 As» i«e« my tfm e** «Xy &sp lys 620 Ser Pbs V»1 Ser Aaa Ola Lys jte §15 S40 Pr© Vel <9lã teu §50 (2) INFORMAÇÃO PARA SEQ ID NO:67: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:67: ATO· AAT ©CA AAC AAT CSA ASsT Q&& ©AT OAT ATO ATA AAS ©ff ACA COT 4«

Mete- Asa Pr© Asm As» Arg Ser Qlu Mis Asp Thr He Ly® ¥ãl Thr Pr© 1 5 1.8 li AAC AST SAA. TO3 CAÂ ACT AA© C&T MT CAA TAT COT Tm ©CSP ©AC &AT 36 A*a S«r ÔIu teu Qlã T&r Asa H.ls Aám ala Tyr Fr© teu Ala &sp As» 30 25 30 ΡΕ1040192 501 CCÃ ÃÃT tCh ACA cm 0¾¾ SAA TTA AAT TAT AAA SAA HT TO ASÃ ATS Fr® ÃSis. ser Thr &©» Olu elu L*u .A»» Tyr Ly» SIu Sfee leu Ar§f Wet 1$ 40 45 ACr SAA SAC AGT TCT AC® «Aã GT® CTA G&C MC K? ACA GTA ÃÃÃ «AT Thr aiu Asp ser Ser Thr 01« Vai Leu Asp Asn Ser Thr Vai Ays Aap sa m «o 0CA, <3W ©Q© ACA GGA ATT TCT &ΤΤ «TA «CS CA® ATT TTA SSV ®TT GffiA Ma Vai «ly Thr «ly O® Ser Val Val SXy Cia lie bem «Ay -vai vai &'S ?* ?S oo qíSa stt oca ror çer ass oca ctc act tc& ttt tat caa tca ttt ctt Gly Vai 'Pr© £»he Ala «ly Ala teu. Thr ser FM Tyr olfi ser- Fh.e Seu 8.5 90 55 SAC ACT ATA TGÍà CCA AGT «AT «CT GAC CC& ΤΘ© MG «0T Ttt AT® «CA Asa Tte Ils Txp Pro Sôr Asp Ala .ASp Ptú Trp L..ys Ala Phe «*« Ma loõ X08 iio caa gtt caa «ta er« m% mt mo aaa ata «ao sag tat «ct aaa ast ®ln vai 01« val Lee lie &sp Lys Lys lie ®l<i «lu Tyr Ala Ays Ser XIS 139' 12 S aaa ®ct crr ccã. ma tta cm am cr? cm aat mt ttc ®aa mt t&t Lys Ma issu Ala «lu Leu oi« õly «ee ©la As» Asa Pise ®lu Asp Tyr i:iS 149 GTT AAt COO TTA AAT tCC TOO MC AAA ACA COT 'TTA AST tt& GSA AflT Val Asa Ala Seu Ase Ser Trp bym fcy* Thr Pr» leu 9ex bom *xg Oex Mi 15« 155 16© AAA *®A ASC CAA CAT C6A ATA AS® SAA CTT TTT TCT CA* OCA ©MA AST Lys Arg Ser âl» Asp Aí§r 2lé Arg ®lu L»u 3?íie Ser Oiti Ala Slu Ser 1SS 170 X75 cm TTT C8T AAT tcc nem CCS TCA ttt CAIA mt TCC ASA TSC ®AA ma Mis PAe Ar® Asa Ser Ifat Are ser 'Phe Ala Vel Ser Ays Pba Qlu Vai 1S9 185 188 cr© ttt ea», cca aca tm oca caa mt et& aat acã cat tta ttq cta bem Vh» imx Pra Thr Tyr Ala Gin Ala Ala Asn T5tt Bie &»u li©u Leu xás aoo aos :X4# 102 2Í0 200 .336 10,4 432 480 520

S7S 524 TTA AAA SAT &CT cm «PT TTT GGA G&A GÃA TGG G«A TAT ΨΕ® TOA SAA Lau t-ys Asp Ala ela val pbm Gly slu ®lu Trp Gly Tyr Ser ser Slu 210 .3.15 228 am «TT QCT GAÃ T«’ mf CÃT AfâA caa, tta AAA ctt aca CAA CAA TAC Ãsp Val Ala Slu Pfee Tyr 8í« Ãrg Gin Leu X,ys Leu Thr «1» Qla Tyr 225 23C Í3S 240 •572 720

ACT «AC CAT TGT GIT AAT T®8 TAT AAT mt OCA TTA AAT ©ST TTÃ ÃGA TÃr Axp Bis Cys Val Aan Trp Tyr Ann Val Gly Leu Asa Gly Leu Arg. 24S 250 2SS 7S8 616ΡΕ1040192 502 ÉJ8T 1«A ACT f&T GAT GCA TGG GTC AAA TO? AAC COT TO? CGC AG» GAA Sly Ser Thr Tyr Aop Ala Trp Vai i*ys Phe Asn Arg $h& Arg A*g Gi4» 260 SSS 270 ato act w» *cr em m q*t m att «ta ctt ttc ecA.rrr mi gat Hat. The te« Thr Vai teu Asp teu xl& Vai .teu. «fee Vxo »he Tyr Asp 375 280 »«5 ATT CG® m TAC TCA A&A OGS GTT AA& ACA «AÃ CTA ACA AGA GAC ATT Arg Ϊ.ΒΜ Tyr 8«.«· &y» ely Vai Ly» Thr &lu fceu Tfer Arg4· Asp XI® 290 29$ 30& ΤΤΓ AC® GAT CCA ATT TTT TOA CTT AAT ACT CTT4 C&Ç GAG TAT GGA CCA S»ísô Thr Asp Pr» XX* Phe Ser teu Asa Tfcr teu Gin elv tyr GXy Pr© 3©S 310 315 320 ACT TTT TTO AGT ATA GAA AAC TCT ATT CG Λ ΑΛΑ CCT CAT YTA TTT GAT Thr Hi* teu Ser Π« Glu Asn Ser XX e Arg4 Lys $rt» Ki» te« Pte Asp 32$ 330 33S TAT TTA CA© ©CS ATT GAA TTT CAT kCG CGT CTT CSA CCT ©ST TAC TTT Tyr teu Gin OX y XX® Giv Ate fti,e Thr Axg tesos A*g Fr® Gly Tyr Phe 340 345 350 SS4 sit 950 100Θ 1056 $TO A»A SAT TCT TTC AAT TAT TGQ TCT OST AAT TAT ©TA. GA» ACT ASA Giy Lys Asp Ser Phe As» Tyr Trp Ser flly Asn Tyr V*1 GdU» Thr Argr âSS 300 363 CCT AGT ATA CCA TCT AGT AAS AC& ATT ACT TÇÇ CCA TTT TAT SGA ©AT Fr* ser xle ®ly ser Ser ixy* Thr lie Thr ser ***> Phes Tyr Gly Asp 370 375 380 AAA TCT ACT O&A CCT STA CAA AAG CTA JSSC TTT GAT SGA CA» Aftft STT Ly? Ser Thr βία Pr© Vai Gin 3Uy» tem Ser Phe Asp Giy Gin X»ya vai 3SS 390 395 *00 TAT CCA ACT ATA SCT AAT ACA SAC ®TA GCG GCT fSS CCS Miit CGT ASS Tyr Jtófar Thr 11* *1« A*» Thr Asp Vai Ala Ai® T.rp Pra Aan «Xy te® 465 410 413 GTA TAT TTA GST ®TT ACG AAA GTT GAT TTT AGT CAA TAT GAT GAT CAA-Vai Tyr tem sly vai Thr t.ys Vai Asp Phe S«r GXn Tyr Aap **£» Gl» 420 42S 430 AAA AAT GAA ,ACT AGT ACA CAA ACA TAT GAT TCA AAA M» MC AÃT GGC &ys Aaa GXu Thr Ser Thr Gl». Thr Tyr Asp Ser lys Arg Ma Asm Gly 43S 446 445 CAT GXA AGT GG» CAG GAT TCT ATT GftC CAA TTA CCS CCA GA» ÁCA ACA Bis Vai Ser Ala Glís Asf sar II* k&p Gin teu w» fs® GX» Har Thr 450 4SS 4S® GAT GAA CCA CTT GAA AAA GCA TAT AGT CAT CAG CTT ÃÂT TAC GCG GAA hm# Glu Prss teu Gin t*ys Ala Tyr 8er Kj& Gl» heu fma tyr Aia GXv 4SS 47S 475 488 3,1.64 11S2 1200 £248 1296 1344 1292 1440 ΡΕ1040192 503 τ«τ rrc Tm &ts cag -sac cgt cgt «ga aca at? ccã ττγ τπ act rm Gys eh* lsu mêi: sIa &sp Arg Arg my ffcr XX* £r© «» ehe Tter Trp 4SB 49D W *£» OVT ASA AST «TA SAC TTT TTT AAT ACA. ATT GAT «CT «AA AAG ATT Thr Mi* asp^ ser vai A»p Phe PJws A*n Thr lie Asp JUa Giu hy» 11® soo sos sio ACT C»A CTT OCA OTA «TB ASA OCA a? GCC TTS TCT TCA SOT OCT TCC Thr «in Lè*. Pys» Vai V*1 Ly# Alá. Tyr Alá LOu Serr ·§*£ CSly Ala SáT SIS 520 535 ATT ATT GAA. «ST OCA &&h TTC AGA ®GA Í5SA AAT TTA OTA TTC OTA AAA 11* 11* «lu Oly 9r<? Sly eh* The SXy «ly Aan. 1»*« !*** »h* Leu Ly» 530 535 54» «AA TÇF AGT ΑΛΤ TCA ATT GTT ΑΛ4 TTT AAA GTT ACA TTA AAT TCA OCA Glu ser Ser ãsft Ser H* Ala i»y» ma Lys vai Th* Leu Asn Ser M* $4$ »50 m$ SS6 OCC ΤΤΘ TTA GAA cm tat ost «ta ASA ATA CSC TAT «CT TCT ACC ACT Ale Leu Lee »1» A*g xyr vai Arg xle a*# Tyr Ala S«r Tiir Thr 565 S?0 ST5 MC rm CSA GTT TTT OTS M AAT TCft AAG AAT GAT TTT GTT STC «TC As« Leu ,toj .Leu Phe Vai «la Ma Ser Aexi Asn Asp Fhe Leu Vai 11« £8$ 58$ TAC ATT Μΐ AAA ACT ATS AAT AAA «AT GAT GAT TTA ÂCA TAT €AA ACA Ty* XXe A»« Ly» ar *fet A*n Lys Asp A»p Asp t*o xàr fyr ®Xn tJm? S8S 600 60$ TTT SM5 CTC c's('A Plw Asp Lsm Ala Tbr Thr &*<& Ser Asn Met «ly She Ser «ly l»y« filõ 61$ 620 AAT «A& «TT ATA ATA «GA ®CÍA GAA TCT TTC «TT TCT AAT «Αλ AAA ATC Aaa «1« Lea xle xle «ly Ala «lu Sar Ph» vai ser Asa elu Ly* II* 8SB S3S «15 640 5 4 88 1556 1S84 1822 1688 1728

1??S 1824 li 73 19:20 TAT ATA GAT AAC- ATA GAA TTT ATS CCA STA CAA TT3 TAA 18$$ Tyr lis Asp hys X $» Glu Phe Ile Fro vai «la Utu S4S «$φ (2) INFORMAÇÃO PARA SEQ ID N0:68: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:68: M&fc &»» iiíô MS. ASh tef SS'3f Qlu Sis Mp fh-r íle L^S V&l Thf &g$ 504 ΡΕ1040192

Asa Ser 01¾ Leu Fro Asa se* Tb* .3$

Ais#· Vai, «1 y Thx' 65 âly ¥al Fro fhe

I>yg AM Leu A3L« ISO

Vsl Asm Ais Lêtu 14.5

Mis Phfâ Arg Asa ISO L®» PAe í.íli Pr o 155

Leit Lys Asp Ais MO

Thr Asp His Cys «ly Ssr Th* Tyr 260 Píêt tbr «w t&jt 275

Pru Ser Assp Ala 20

Asa «la Tyr vro 25

Asn Ty* Lys «ia

Leu Assp Asa £«* SO

Leu Ala Asp Asa 30

Pite» Leu Asg: ííet 45

Thr Vai £,y» Asp .Leu Sly Vai Vai 59 «3,a §®r Phe Leu 95

Thr Tyr Ma «Ia 200 «la Yal ph® Giy 215 Fhs Ty* íí*g A*g 230 Vai Asa V*p Ty* 245 Asp Ala Trp Ψ&1

VAI fceu Asp teu im- Se* Lye 05 y v«l 29S «lu «lu Trp «ly 22« Gítí Leu Lys teu 235 Asa Vai ©ly Leu 250 Lys PAe Asa Arg 255 II® Vai Leu J%>0 hym f&r ÔIu Leu 300 teu «ia Aaa Agn 140 Lys & Pto Leu 155 «iu Leu ®h& se* 170 Ph® Ala Vai Ser 1«5 Ala Ala Asa Th*

Ala Fhs 110 Wet Ala Tyr 125 Ala Lys Ser PA# «lu Asp Tyr Ser Iís« Ãl"§( Ser ISO Qlo Ala. Gli.s 175 ser Lys Pha ss-o «la Vai Ais 2 3S Leu Leu Lsu Tyr S&r ser «lu Tli£* Qla ain Tyr 24:0 Asm Qly Leu 355 Arg: Ffee A*3 270 Arg «lu (?r« 3 »5 l^hf lysr Asp Th* Arg Ãsp Ha 505

Asrt Thr teu 01» Sly Tyr Gly Pr® 31S .320 11« A.íxí .Lyss Pr® H*S teu Pte Assp 330 155 Thr Arg teu &rg ^ΪΤό Gly Tyr Ohe 34S 350 Sar 01 y Asn Tyr Vai Glu Thr Arg 3€5 11 a Thr Ser Pra Fha Tyr Gly Asp 380 teu Ser Pfce &sp dly O!» hys V-3 X 3SS 400 Vai Ala Ai a. Trp Fr® Aâii CãJLy· 410 415 Ãsp· Fhé; Sar Gin Tyr Aap Aap 01» 425 430 Tyr Asp Ser i»ya Arg A«» A.8I3 GXy 445 ÃÍSp si» teu Kce Piro Gin Thr Thr 450 a«r ilis Gin teu Asn Ty-r Ala. 0:1 u 43S 480 Gly Thr Ila Fr*» Mie Thr Trp 450 495 Aass Tkr II ® Asp Ala Glu L-yr lia SOS SX0 Tyr Ala teu Sor Ser Qly Ala Ser S3S Oiy Gly A&r< tea 54 0 teu Fha teu lys Phe Lys Vai Thr teu As» Ser Ala 555 540 Ar^' 21a Ari Tyr Ala Ser Thr Thr SOS 5a r Asn Asu Asp Pte teu vai lis 585 sso Asp Asp A$p teu Thr Tyr Gin Thr SOS ΡΕ1040192

Fhe T&r Asp Fr® li» Fà« Ssif teu 305 310 ffar Sfee teu Ser lie 0ia As» Ser 32$

Tyr teu Sln ®ly Xle 01« Vha His 340

Sly mm Aap Ser Fh* A*ss Tyr Ttp 3 £S 3«0

Tyr Arg Titx l ie Ai a As» Thr Asp 4Õ5

Vai Tyr teu Gly Vai Thr Ly& Vai 420

Lys A&a gIíí Tfer Ser Tfer GX» Thr 435 440

Sis Vai ser Aia «I» Asp ser il« 450 4SS .asp <31«, Fr o* teu Glu fcys M® Tyr 4€5 «70

Cys Ph& Leu Met; Qla Asp Ãrg Arg 4 es

Th» If-is Arg Ser vai Asp Phe pfee

SOO

Thr Glft teu Fro Vai Vai ly» Ala SIS 520 lie il» «si» siy Pr» <3iy ΡΊμ» Thr 530 535 @1«. Ser Se-r Asa Ser II a Ale Lys S45 3S0

Ala teu teu Gin Arg Tyr Arg Vai 565

Asn teu Arg Lbu Phe Vai 01» Ass 580

Tyr xis aba Lys Dar Mas- As» X»ys 505 €00 ΡΕ1040192 506 J?h© Asp Leu €10 Ala «fer -ffer Asa 615 Ser Asa ©I y òihe Ser &&γ S»ys t£0 Asrt €.2 5 ©la Len lie Ile G.ly ÔJÔ Ala Slfe Ser Pite vai 635 Ser Asa -Slu Lye lie €40 Tyr lie Asp Lys lie elu €45 The lie Sro vai 650 ©ϊχι iea (2) INFORMAÇÃO PARA SEQ ID NO:69: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1482 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1479. (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:69: JM5T A&& ASA ASC CAA. ©AT &3A. Am 9ÚG SAA CTT TTT TCT CAA ©CA ORA. Ssr sy» Arsj ter Cila Asp Arg lie Arg· <sl« Leu Pb» S*r ôln Ala ©lu l 5 10 IS A0T CAT TTT Cm AAf TCC A«8 CO» «CA TTT ©CA «TT TCC AAA «TC ©A& Ser Bis Ar§ Asa ser Met s*r» ser Pfe® Ala v&I ser ϊ,γ» P&e ©ia 20 SS 30 Í»TS CT© OT CTA CG» A€A TffiT SOA CAA <3CT ©CA AAT ACA CAT «TA. TE3 Vai irfsit Fha lew Sru «tar «yr Ala ©lo. Ala Ala Aos Thr His Leu 'kau 1$ 40 45 ca TTÃ MÁ S&T OCT CAA «TT TTT ©S& SA* OAA IW 3QA «AT TCT «CA t«ea X>ev lys Aap Ala ©1» vai Phe ®ly Blu elu Trp ely Tyt Ser $er 50 55 so ©AA ©AT ©TT GCT GAA TTT TAT CAT AQh CAA TTA AAA CTT ACA. CAA CAA ©ia. Asp Vai Ais Gltx S?b« Tyr Ris Arg Gin Aati Lys leu Shr Ç.ln ©In gS 70 75 m TAC ACT ©AC CAT «ST βΤΤ AAT «CG TAT AftT ®TT CCS. «TA J»T GGT «TA Tyr T3»r Asp Bis Cys Vai Aso «*p fyr A»» Vai 6Xy Lee &ss» ©Xy tas» 85 00 95 ASA ©ST TCA ACT TAT ©AT ©CA TOS ©TC AAA TTT AAC CST TTT CGC ASA Aang Bly Ser «hr Tyr Ae;p Ma «srp Vai Lys Tha Asa Arg Phe Arg Arg 100 105 us 144 192 240 288 33â 507 ΡΕ1040192 g»a μ act m act sm tta oat cta αϊϊ sa ctt ttc oca ttt tat 38«

Glã M*t Th* L»u Tíir Vsl Leu Asp LéU lie Vai LéU Phe Fríi Ste Tyr xis sao ias «T ATT e»a Tm me tca ma osg gtt mr aca cm cta aca Am me 432

Amp Ile Arg· Leu Tyr Se* Lys Gly Vai S»ya Thr G.lu Ls« Th* Ãrg A.s$s íls> 135 '140 me ttt aos oat oca atf ttt tca ctt aat act ctt m gm tat ® 4«o 11» she Thr Asp sro lie Ffee .s«r Leu As» Tfer Leu sln slu’ Tyr ®ly 14S ISO 1$5 18» cca. jm» ttt rm Am ata « aac tct mi? <m ma cct c&t tta ttt sas

Pr» Thr Pb* Leu Sar Ile Olu As» Ser Ile ftrg Ly» Prcs Mis Leu Pb®

XSS 1"í0 1?S GAT TAT TTA CAÍS CGG ATT «M TTT OVf ACG CCT CTT C» CCT QGT M S7$ Aép tyr Léu sis Gly II® Sltt Ffe» Kis Thr ft*g· L&U Gin Pro ®Iy Tyr

3,8« 1»5 ISO TTT' CK&S AM CAT TÇT TOO MT T&T M TCT OGT MT T&T OTA GAÃ ACT 424 pfes ely &yt* tep ser Fh* As» Tyzr T*p ser ®ly As» Tyr Vai Glu Ttoe ais »oo aos ASA. CCT AST ATA GSA TCT AGT MS ACA ATT ACT TCC ÇÇA TTT mt G&Ã «72

Arg wo Ser He ®iy Sor Se* Ly« th* íx« ftr Ser me& Fhe Tyr cly 210 21S 228 «AT M TCT ACT 8SA CCT STA CM MG CTA AGC TTT «A* GGA CAA MA 720 &*p bys- Ser Th* <3la Pro Vai Gin Lys L«sw se* Ffee ftsp Gly Cl» X>y® »23 340 »45» 240 OTT TAT COA ACT ATA SCT MT ACA GAC STA SC® GCT T®G CCS MT ®ST 7« 4 v*i Tyr A*gf Thr fl« Ala M» Thr &sp vsl M«. Ala Trp Pr» Ae» Gly 245 »S0 2S5

MG GTA TAT TTA CGT GTT AG® AAA GTT GfiT TTT AGT C&& TAT CAT GAT ilS

Lyss val Tyr Le» Gly Vai Thr Lys Vai Asp $Jm S«r ®ln Tyr Asp M» 2S0 2SS 370 CM. MA MT ®M ftCT AGT AÇA CM ACA TAT GAT tCfc MA ASA MC Ml* S$4

Gin Lys As» al« th* S*r th* ®1» Thr -Tyr Aap Ser Lys Arg Mn A»n 275 25D ,284 GGC CAT OTA..AST OCA CA® 6AT TCT ATT SRC CM TTA CC® CCÃ CAÁ ACA SÍ2 ®ly His v&i Ser Ais 01» Aep Se* xl« Anp -Ql» Leu Pr» Pr» Olw T&* 2 PO »:88 200 ACA «AT OftA CCA CTT GAA AM SCA TAT ã®T CAT CÃ® CTT AAT TÃC n3C® 5S0

Thr Mp ΟΙ» P*» Leu Oiti J*ys Ala Tyr Ser «ie Clr, Léu As» tyr Ala 39S 319 31S 320 QAA TST TTC TTA AT® ÇftO GAC COT CGT ®3A ACA ATT COA TTT TTT ÃCT 1008

Qlu eye Phe Le» Itete ®iw Aep Arg Arg sly Thr xie Pr» yhe phc Thr 33S 310 335 ΡΕ1040192 508 το® rcr cat asa me «?a «ac ttt «ve rrt aca rtt sat «ct «aa ars Trp Tfer Sis Rrg Swr ¥al Aâjp Pise Pise Asa Tfcr 11« Asp Ala «2« Lye MO 345 350 2VS5

att «er car ctt cca gtã stq ara «ca ?at «ec ντο tct tca sskp «cr 21« Tíxr «1» Leu &ro Vai V«1 I»y« Má Tyr Alá Leis Sei- Ser «ly Ala 35S ISO M§ TCC ATT' ATT GAA 8GT OCA QGA TTC ACA QQA SGA AAT TTA CTA TTC CTA 5er 21« il« slu «ly Pvo Cly ¥h« Ttar «ly «Xy As» teu Leu* Leu 310 375 3«0 «RR ORA TCÍ AdT AAT TCR ATT 8Cf ARA TTT ÃÃÃ «ΓΤ ACÃ TTA AAT TCR Ly» δϊν Ser Ser Αβπ Ser 21« Ale Ly» Bhm Lye V«1 Tfcr Leu Abií Ser 3»S 3SO 335 400 «CR OOC «TO TTA CRR COR T&T COT' OTA .ROR ATA CSC TAT OCT TCT RCC Ria Ala Leu Lsu 01» Arg Syr A*g Vai Arg Ile Arg Tysf Ais. Ser Thr 40S 4X0 4i.5 ACT AAC TTA COR. CTT TO3P «TO ÇRA RRT TÇA ARC AAT «AT TTT ÇTT STÇ Thr As» Léu Axg Leu Ph.e vai 81» Asso Ser As» Asa R»p Leu Vai 42S 42S 430 ATC TAC ATT AAT ARR ACT ATO AAT AAR ÍSST «AT «AT TTA RCR TAT CÃA 11« Tyr Ile Rs« Lys Thr Hst Reta Lys mp Asp Assp Leu Thr Tyr ola 4$S 44« 445 ACA TTT <3RT CTC OCR RCT ACT AAT TCT ART ATO «OO TTC TOO COT OAT Tfcr Plss Asp Leu Ria Thr Tiar 3um Ser Rsa fíet «ly Phe ser Oly Asp 4§S> 45S 4 se ARO RRT ORR CTT ATA RfA OOR OCR ORR TCT rTC 8TT TCT RRT «RR ARA &y» Ase Olu Leu 21« 11* «2y Ala «lu s«r sim Vai sar Ren Olu Ly« 4S5 4'?0 4?S 480 ATC TRT ATA ORT AAO ATA «RR TTT ATC CGR CTA CRR TTS TAA í le Tyr lie As;p Ly» *2« Olu Phe Ilé Ρτο Vai 01» Leu 4§§ 4SS 1134 1252 X2ÔÓ 1248 1344 :052 144» 2432 (2) INF0RMAÇA0 PARA SEQ ID N0:70: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 493 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:70: 509 ΡΕ1040192

Ses Lya Arg ser Gin fep &X0 XXe Are? -SI» Leu Fhe Ser Sla ala S-lu i S 10 15

Ser His gfee Ajr«r Asn ser M&fc wr& Phs Ala vaj, ser Lys P&e <Slu £S 2$ 3Φ 510 ΡΕ1040192

Vai teu Pfee Leu Pr© Th-r yyr Ala 61« tóa Ma aso Thr His Leu lsu 3S 4$ 4$ .Leu 'Leu Lys Asp Ala 61» Vai Ffes <3Iy cl» 61«. Trp Sly Tyr Ser S&t SÔ SS· gg iSi.» Aâp VAl Ala <Si» Fhe fyv Ui» Ãrg SI» Le» Ay» Le» TAr 616 61» §5 70 75 30

Tyr Tbr f&p Hís Cys va.1 .as» frp- Vyr Asa vai eiy Leu Asb Gly Levas se ss Λ*£ Gly Ser Vhr Tyv Aep Ala Τερ Vai Ay» Pfes Asu Arg Fh« Arg AT9 100 105 110 61« Méfc Th*· Léu TStt- Vai Leu Asp Lé» 11« Vai Leu Fhe Pr© fias tyr 113 120 125

Asp Ile Argr Leu Tyr Ser t*y» 61 y Vai hym ftr olu Leu 'Thr Arg Asp 130 135 140

143 155 iêC

Pr» Har Pbe Leu Ser lia Qlu Asa s®r Ile Argt hys Fr» Hi» X»e» Pfce 1JS XtÚ 175

Asp tyv 'Leu sia eiy lie eiu Pifa* Ki» ttiv Arg Leu sia Fr» 6ly ^yr \m XA5 150

PA® Sly Ay® Asp Ser Phe Asu ϊγΐ' Çrp Ser 6ly Asa Tyr vai <aiu sfcr 155 299 20S

Arg Fr» ser lie sly sor ser i»ya 5$ir lie i&r Ser vr» pfte iyr tíXy giõ 2:1S 220 tep Lys Ser T&r 61u Fr» Vai Gia Lye Lei* Ser Fhô mp Sly Sla Lys 125 * 230 235 34Θ

Vai Tyr Arg Thr lie Alã Aên Thr Aep Vai Ala Μ* Τερ Fr» Ami Qiy 245 250 255 hym val iyr Leu. 61 y Vai Yhr Lys Vai Aap Ser S!» fyr *us& Aep .250 3SS 270 el» Lys Aan. 61« thr Ser ttor S1r T!hs Tyr mp Ser Lys Arg Asa Am 275 200 38.5 <&y Sis Vai Ser Ala Sln Asp Ser IlO Mp «i» t*®* Pr» Fr» 6i« Ibr 250 23B τΐ 00 fltr Asp 61« Pr» Leu 61» Lys Ala T¥« s»* ais ®1ά 1»*** Mto VjfX M.» 3Õ5 310 ®^·"' 120 61» Cya Pbst Lã» Me» Gi» Asp Arg A3?Sf Sly Tte Oe »ro Phm Pha FM‘ 511 ΡΕ1040192 325 330 335

Trp T&r líis Jteg· S®r Vai &sp Ph® Pb® Asa Tte' 11® Asp Ai® Slu &γ& 340 3«5 350

Jle Tfcr Gin £«y pro V«1 Vai Ly» Ala Tyr Ala Leu Ser $er «ly Ala 355 3SB M5 $*r Xle li® Si» Oly Pr© ely Pb® Thx Qly Qly Asn taa &©». pba La»

StO 378 380

Ly» SXu Se*- ser Aso Ser He Ala l*y:s Pb® Lys vai. Tkr Leu Ash se* 3$5 390 355 4Θ0

Ala Ala Eí«v t®v Slíi arg Tyr &rg Va.1 Hsrg *1« Argr Tyr Ala ser Thr 4dS 410 415

Thr Asai t*» Arg 'Leu She Vai. Gin As» Ser A&n Asa Asp Pise &e» Vai 410 435 4JQ lie 'Tyr lie Asss fcy» Th* WeS AS» %-s Mp &sp Asp Leu Thr Tyr «la 435 440 448

Lys Asa <91« bmx XI® 11« ®ly Al» Ole Sor Pfcs Vai Sex .Asa da fcys <ÍSS 470 478 4S0

Xl« Tyr lie Asp· Ly» lie ©1» Pfee 11« Pre ¥al Sln Leu 408 490 (2) INFORMAÇÃO PARA SEQ ID NO:71: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:71: AGACAACTCT ACAGTAAAAG ATG (2) INFORMAÇÃO PARA SEQ ID NO:72: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 512 ΡΕ1040192 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:72: GGTAATTGGT CAATAGAATC 20 (2) INFORMAÇÃO PARA SEQ ID NO:73: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 39 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 21...23. (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:73: CAGAAGATGT TGCTGAATTC NNNCATAGAC AATTAAAAC 39 (2) INFORMAÇÃO PARA SEQ ID NO:74: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 34 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 19...21. (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:74: GATGTTGCTG AATTCTATNN NAGACAATTA AAAC 34 (2) INFORMAÇÃO PARA SEQ ID NO:75: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 513 ΡΕ1040192 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 17 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou G" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 18 (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 19 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:75: CCCATTTTAT GATATTNNNT TATACTCAAA AGG (2) INFORMAÇÃO PARA SEQ ID NO:76: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 64 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 24 (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (25, 27, 28, 30, 34, 36, (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (31, 33, 35, 37, 42, 44) (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C ou T" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 40 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou G" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (26, 29, 32, 38, 41) 514 ΡΕ1040192 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:76: AGCTATGCTG GTCTCGGAAG AAANNNNNNN NNNNNNNNN NNNNAAAAGA AGCCAAGATC 60 GAAT 64 (2) INFORMAÇÃO PARA SEQ ID NO:77: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 40 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:77: GGTCACCTAG GTCTCTCTTC CAGGAATTTA ACGCATTAAC 40 (2) INFORMAÇÃO PARA SEQ ID NO:78: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 65 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (22, 27, 29, 30, 37, 42) (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C ou T" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (23, 26, 28, 31, 38, 40, 43, 44) (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (24, 39) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (25, 32, 33, 41, 46, 47, 48) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou G" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada 515 ΡΕ1040192 (B) LOCALIZAÇAO: 34 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 45 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 35...36 (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C ou T" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:78:

AGCTATGCTG GTCTCCCATT TNNNNNNNNN NNNNNNNNNN NNNNNNNNGT TAAAACAGAA CTAAC (2) INFORMAÇÃO PARA SEQ ID NO:79: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 36 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:79: ATCCAGTGGG GTCTCAAATG GGAAAAGTAC AATTAG (2) INFORMAÇÃO PARA SEQ ID NO:80: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 63 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (23, 27, 31, 36, 44) (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C ou T" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (23, 26, 28, 31, 38, 40, 43, 44 (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" 516 ΡΕ1040192 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (24, 25, 26, 33, 35, 38) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (28, 34, 37) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (29, 30, 32, 39, 42, 45) (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (40, 43) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou G" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 41 (D) OUTRA INFORMAÇÃO:/nota= "N= A, C, T ou G" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 46 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:80: 60 63

CATTTTTACG GATCCAATTT TTNNNNNNN NNNNNNNNN NNNNNNGGAC CAACTTTTT GAG (2) INFORMAÇÃO PARA SEQ ID NO:81: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 62 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (28, 31, 32, 33, 42) (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C ou T" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (29, 38, 39, 41) (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 30 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" 517 ΡΕ1040192 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (34, 35, 40) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou G" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 36 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 37 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:81: GAATTTCATA CGCGTCTTCA ACCTGGTNNN NNNNNNNNN NNTCTTTCAA TTATTGGTCT 60 GG 62 (2) INFORMAÇÃO PARA SEQ ID NO:82: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 73 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (41, 49, 52) (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C ou T" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 42..43 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 44..45 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 46 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (47, 48, 53, 54) 518 ΡΕ1040192 (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (50, 51, 55) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou G" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:82: AAAAGTTTAT CGAACTATAG CTAATACAGA CGTAGCGGCT NNNNNNNNNN NNNNNGTATA 60 TTTAGGTGTT ACG 73 (2) INFORMAÇÃO PARA SEQ ID NO:83: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:83: GGAGTTCCAT TTGCTGGGGC 20 (2) INFORMAÇÃO PARA SEQ ID NO:84: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:84: ATCTCCATAA AATGGGG 17 (2) INFORMAÇÃO PARA SEQ ID NO:85: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 519 ΡΕ1040192 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:85 GCGAAGTAAA AGAAGCCAAG GTCGAATAAG GG (2) INFORMAÇÃO PARA SEQ ID NO:86: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 43 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:86 CCTTTAAGTT TGCGAAATCC ACACAGCCAA GGTCGAATAA GGG (2) INFORMAÇÃO PARA SEQ ID NO:87: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 35 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:87 CCCATTTTAT GATGTTCGGT TATACCCAAA AGGGG (2) INFORMAÇÃO PARA SEQ ID NO:88: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 25 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:88 GGCCAAGTGA AGACCCATGG AAGGC (2) INFORMAÇÃO PARA SEQ ID NO:89: 520 ΡΕ1040192 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:89 GCAGTTTCCG GATTCGAAGT GC (2) INFORMAÇÃO PARA SEQ ID NO:90: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:90 CCGCTACGTC TGTATTA (2) INFORMAÇÃO PARA SEQ ID NO:91: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 17 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:91 ATAATGGAAG CACCTGA (2) INFORMAÇÃO PARA SEQ ID NO:92: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 60 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 521 ΡΕ1040192 (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (22, 26, 29) (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C ou A" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (23, 33, 36) (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C ou T" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (24, 27, 28, 32, 35, 37, 38) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C ou G" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (25, 30, 31, 34) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 39 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G ou C" (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:92: AGCTATGCTG GTCTCTTCTT ANNNNNNNN NNNNNNNNNA CAATTCCATT TTTTACTTGG 60 (2) INFORMAÇÃO PARA SEQ ID NO:93: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 40 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:93: ATCCAGTTGG GTCTCTAAGA AACAAACCGC GTAATTAAGC 40 (2) INFORMAÇÃO PARA SEQ ID NO:94: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear ΡΕ1040192 522 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:94: CCTCAAGGGT TATAACATCC (2) INFORMAÇÃO PARA SEQ ID NO:95: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 55 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (19, 22, 23, 31) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, C (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (20, 26, 27, 29, (D) OUTRA INFORMAÇÃO:/nota= "N= T, G, C (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (21, 32, 34) (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: um de (24, 33) (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 25 (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, T (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 28 (D) OUTRA INFORMAÇÃO:/nota= "N= A, T, G (ix) CARACTERÍSTICA: (A) NOME/CHAVE: base modificada (B) LOCALIZAÇÃO: 36 (D) OUTRA INFORMAÇÃO:/nota= "N= A, G, C (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:95: ou G" 30, 35) ou A" ou T" ou C" ou C" ou C" ou T"

GTACAAAAGC TAAGCTTTNN NNNNNNNNNN NNNNNNCGAA CTATAGCTAA TACAG 55 523 ΡΕ1040192 (2) INFORMAÇÃO PARA SEQ ID NO:96: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 7 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:96:

Ser Lys Arg Ser Gin Asp Arg 1 5 (2) INFORMAÇÃO PARA SEQ ID NO:97: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ix) CARACTERÍSTICA:

(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1...1956.

(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:97: ATO ΑΑ.Ϊ etm AAC AAT COA AOV «AA mt «AT Aee ATA AAC crr ACA CCT 45 Asa Pr» As ri AiSW .Arg 61« HlS ASp Ths· Tla Lys VAX. Thr Aro 1. s IS IS AA£ AST «AA TT« CAA ACT AAC CAT AAT CAA TAT CCT TTA GCT CAC AAT 56 Asr. s«.r >3l:u OlíJ .fisn Kis Asrs Óln Tyr Pro Ala Asp Asss 20 23 30 5777 MT TÇA ÃCft CTA M SM TTA ΜΊ TM AM (M TXT m m ATS 1*4 ASSS SSK' Thr Lew «lu Leu Asn Τ'/i' Lys «lu Pha La» Arg Hat. IS 40 4.5 ACT «AC ÃCT VCT hCQ CAA «TS cm OhC AAC TCT ACA «TA AAA «AT XJS Thr ¢3.1¾ Asjp Ser Ssr Thr <31 li Vai L&U Aap ASft SSií’ Thr VíSl i-y.7 ASp 50 5S ao «£& «TT (X30 ACA ««a ATT TCT «TX «m C&« ATT tta SST CTT GTA MÓ AÍS. 65 «ly Thr G&y Xis Sar Vai Vai «1 V Gis 7S· XI® Lsu «ly Val Vai 80 «ΤΪ CC& GCT 333 «CA crc. ACT TCA. TAT «AA TCA TTT CTT 2SS 524 ΡΕ1040192

Siy vai tei mm Ai*. »!y M* Lsu Thr Ser Phe Tyr Sin 8®r Pti« Mu 35 80 35 MC ACT MA TS© CCA AGT GAT TOT «AC CCA TOS MG GCT ΤΪΤ ATO SCA Asp Tter 11« 3?rp Pró Sêt Asp Ma Asp Ψτο Trp Ιγ® Ma ^hs stes Ma 100 105 XI® «snm fia cro Am «at èM AM sm «AG «Ms mi ca ma bt M4 ©la va.1 s!.íjs vai hm. xle Aep I*y* &y# Xis Siu «Xu Tyr Ala i.ye «er

Xis 128 X2S ma qct ctt oca oag rm cm tm crr cm «t mj ttc w mt rar 4.3¾

Lys Alá. i*« Ala «lu L«U HX» «Xy fceu «Xt* A»b Mn Ph* 31« Aep Tyr 130 131 .14« GTT MT SOS TTÃ MT TCC TO« A3MS AAA AlCA CC?T TTA AST TTfô CSA AS® 48® VAX as® Ais teu Asa ser Trp Ay* í*ys TAr P*» teu Ser Asu A*g S«* 145 ISO 15S IS® AM ASA A0C CAA ©AT TOA Am ATO HM CTT TTT TCT CM «CA «AA AST 528 t*ys A*© S*r <SXa Mp Arg Xis Argr Sln* t«» The Ser QIb Ala Sl® Ser ISS 170 175 CAT TTT CST MT TCC ATO CCS TCA TTT «CA QTT TCC AAA TTC 0&& STS S?«

Hl* í?®e? Arg A*a Ser íftsfc Fr» Ser Pí»e Ala Vai Set: Lys mm- SI» Vai

ISO 1*5 Í*V ex© tff cta ca aca M «c* cm ©cr gca aat aça cst tta tts cm «24 L*t Fhe Leu Oro Thr Tyr Ma «la Ala Ma Asa ftr Hía Leu Aêu Mu

135. 200 SOS TTA AAA «AT GCT ÇAA OTT TTT <3SA SAA «M TOS «SA TÂT Ter TOA ©M S72 teu Lys A*p Ala Gl» Vai Fhé siy ©iu filu Trj? Gly *ryr Ser s**r «X» 210 SIS 220

GtRT «VT GCT SAA TTT TAT CAT ASA CM TTA AAA CTT ACA CAA CSA TAC 720

Asp val Ala ©1« 1¾¾ Tyr HA* Arg Sla t*m &y* Cew Tbr SÍk Sla Tyr 235 230 235 240 &€T OftC CAT TOT CTT AAT TOS «S* MT STT TOA TTA AH «ΘΤ TTA A«S 7«*

Sly ser Thr Tyr asp Ala Ttp vai Ly* Pb* Aan Arg Phe Arg Arg «1« 200 3«5 273 ato act toa act em toa ©at cm att «ta ctt ttc cca ttt tat sat s«a

Mec Thr leu Thr Vai Leu Asp teu Ila Vai Aau Pho Fro 2h« Tyr Asp

27s 2êÕ 2«S ATO C©6 TTA TAC TCA MA «TO STT MA ACA «AA CTA ACA ASA SAC ATT 812 tle Arg Tyr Ser tys Hly Vai Lye TAr SIu Leu Thr Arg A*p 11 e

290 285 30G TTT ACC CAT ÇC& ATT TTT TCA CTT MT ÁCT CTT CAS Gm TAT TOA CCA 560 1008ΡΕ1040192 525

Pfee Tte &sp Fro Lis Phe Ser Leu Asn ?hr Leu Gl» Qlu Tyr «2y txo tm 31S 3IS 32β act rrr tm aqt ata «λα aac tct att osa aaa cct cat tta ttt «κγ Tfeí? f&e Ser 2la «lu Aça $er Xie Arg I»y« Fio His Leu Ffee Asf» 325 230 33S ΤΑΪ m Ç*â SÇ& ATT «A* ΤΪΤ CAT AOS CST CTT CAA CCT ««T TAC TTT Tyr l»eu «1* «ly Ha «1« Pte* Mis Tbr Axg *<e« Sln. Pre «ly Tyr Pfce 340 3*5 35®' m& ma mi te? TTç w? t« tm m «ct **·? ® m& &ct tm «ly t,ym Aep Sair Pi»» kss Tyr Tsp Ser «ly Am Tyr Vai «lu TSir Axg .355 300 365 cct mt w* $8*. *er Asgp aas aca a» act *ee ce& ψη ψαψ mk mt Pxs? sar Tio sly Ser Ser Xys Thr 11« tihr Ser tro P&a Tyr ©ly Asp 3 tO 375 380 aaa ®er act sm cct em m as® cta agc ttt qkp <se& caa aaa ctt Lys Ser Thr «lu Pro Vai Sln Lys Leu Ser The Aap «Xy «In &ys Vai 3SS 3 PO 335 400 tat cm act sm sct aat hm sm <rm cm ser rm cm aat set aã$ Tyr A*a· T*sr lie Ala Aso xhr Asp v«X Ais» Ala Trp Fr» As» «iy Lys 4.05 4Ϊ» 415 CTA TAT XTA «ST CTT AOS AAA ©TT «AT TTT AST CAA ΤΆΤ «AT «AT CAA Vai Tyr Leu «ly Vai Thr Lys Vai Aap 2¾¾ S*r «la Tyr Asp Aep «Xn 420 425 430 AAA AAT «AA ACT AST ACA CAA ACA TAT «AT TCA AAA ASA AAC AAT «SC Lys Aja» «1« Ths Ser Thr SXn Ths· Tyr Asp Ser Lys a*g Aaa As» Oiy 43i§ 440 44 5 CAT CTA Ã8T «CA- CA« SAT TCT ATT CAC CAA TTA CCS C5CA QÃA ACA ACA Mis Vai Ser Ais Slft Asp S«r XX* Asp Slft Leu Pro Sro Ôla Vkac Thr 40® 405 4S® «AT «AA- <5CA CPT <SAA AAA «CA T*f A» CAT CA8 CTT AAT TAC SCS3 GAA Aap G&u Pre Lea «ia Lys Ala Tyr ser sis eia Leu Asa Tyr Ala «la 465 4?» 4 75 480 TCT TTC TTA ÃT« CAG «AC CCT CST «6Α AÇA ATT CCA TTT T$t ACT TOS Cy» Ph« to j«t «1» Asp Arg Ãrg ©ly Tto Ile Pr® Fh« Phe líir Trp 485 45® 45S ACA CAT AQA ACT GTA «AC TTT TTT AAT ACA ATT «AT SCT GAA Mâ ATT «ir His ,*«g ser Vai Asp Fhe Fhé Asa Tbr lie Asp Ale alo Lys lie 500 SOS 510 ACT CAA CTT CCA «TA «TS AAA. «CA TAT ©ÇÇ TTS TCT TC.A CCT «Çf TÇÇ Thr Gin Leu Fro Vsl VOl I.ys Ala Tyr AlA I»e» Ser Ser «iy Ala. Ser 5:15 S30 SIS 105® 1104 li 33 1000 224®

20 0S 1344 usa 1440 140®

1SM 2584

ATT ATT «&A CCT CCA «SA TTC ACA QOA ««A AAT TPA CTA TTC CTA AAA

ÍS3S ΡΕ1040192 526

@iy pro <siv í»h& Th* Sly Gly Mn Le» Pto* Leu Lye SOO ' SM ' 54ô sm tct as? aat tca att cer ss& m sm. st? ac& tta aat tca oca SJuí ser s«r Asis ser lie Ala. 2»ye Ebe ty» Vai fbx Leu A*n ser Ala sso sss seó «OC T3K3 TTA CAA CQA TA? COT OTA ASA ATA COT *AT OTT TCT ACC *CT Ale teu Xteu Ola Arg Tyr Arar Vai Arp Ile Arg Tyr Ale Ser Thr Thr SSS S70 ' s?s AAC TTA CSA CTT ΤΓΤ ®T« CAA «AT TCA AAC AAT «AT ΤΤΓ CTT <5TC ATC Asn Leu Ar3 teu Ph* vai «X» Asa Ser Ass Mn Asp PM L*u vai Jl* S40 58S SSO me ATT «&T MA ÃCT ATS ASX AAA «AT «AT «AT TTA ACA TA* CAA ÀCA Tyr lie Jtóa £y* Tfer Mete Ase I*ys &sp Asp Asp ter Th* Ty*· «la Th* S9$ «90 €<5S TTT «AT CTC «CA ACP ACT AAT TCT AAT ATS «301 TTC TC® «OT «AT AAS í*he Asp teu Ala Thar Thr Asn Ser Asa Met Sly Pha Ser Gly Aap Cya 61Q Olè $M AAT 8AA ÇTT MÁ ATA OTA OTA «*& TCT W COT TCT ttf SM SM **Ç Am CSiu tsr Ile Ile Sly Ala «Xu ser PM Vai ser Mn OTts j,y» IX* 63;» OO S3Ç. £40 T&T ATA «AT **© ATA «AA TMP ATC CCS «m CM TTí3 TAA xyr £1« tep l*jre 11« fila PM xi« ps« v$l sis S45 SSO XSOO ~ 1120 1776

Xô.M 1872

1S2D 1954 (2) INF0RMAÇA0 PARA SEQ ID NO:98: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:98:

Wefc Mm Pró Asrs Asn Srf Ser ®%\t Ki» Asp Th* 11« Lys Vai Tfcr to i $ io i,i fen Se* &lu Lou Slsi Th* Am Asa «la Tyr Vxo Leu Má AI# m& 20 as 30 »ro Asn S«r fffer Leu filu Slu Leu Asu tyy Lys siu Ptm Leu A«g- Ket

as 40 4S

Tfcr filu Aâgp Ser $«x Thr Qlu Vál Leu Mú Am S«* fkr Lyá Assj* 10 SS " S0

Aiu ¥ál fíly ttj; Sly 11« Ser VàX VAI Sly Slu M« Leu «ly Vai Vai SS το 7S 80 ΡΕ1040192 527 fxp. Pha Ai* <3Xy Alá M« Thr Mr Phã Tf* fíln Sêr TM Leu m xi® Trp Pr© Ser Asp AXa Aep Pr© Tsp X*ys AXa PM í*®* Aia ICO 10S 110

elri VAX SJiUs Vai Mtt íle Asp &y* Ly» XX* 61« «liu fyr M* Ly» Ser ÍIS :O0 12S iy’^ Ala LiJS^í Aí.G X Leu G lll Gi y Leli Gi>i Asei A*u Pb* G iu Aísu Xyr J3â

13 V

Vai &sn Ala leu *s© ser Txp Ly» ly® T&r Pr© M» Ser fem Arg Ser 15ÍÍ 15.5 160 L,y.si &r«j ser SXm A*p Arg Xl* Axg· Glu Mu Phs Ser Qlti .Ala 01» Ser 165 175} 175

Hie pise Arg Asas Ser Mst Pre Ser PM Ma Vai Ser Lya PM dlu Vai iso iss xts

Lsm PM Leu Pr© Tfcr Tyr Ala Si» Ala Ala As« Thr Mia leu Leu Leu âôo sós L<ea Lya Aap Ai» 61» Vai PM fêly íll» Slu Txp &ly Tyr Ser Ser Slu 33.0 Μ 5 220

Asp Vai Ale «1« PM Tyr Sfcis Axg Slra Leu Ay» leu Thr 31» Sln Tyr 325 230 235 240

Tfer Asp Mis cy« Val A*» TSrp Tyr As* Vai SXy Mu As» 01 y leu Arg 245 250 255

Oiy ser Tíar 'ryr Asp Ala Trp Vai iys phe asa &rgi ph® Arg Arg <ilu $$0 265 370 & TM &*u T&r vai M« A*f> it-su xl* vai Mu PA* Pr© PM Tyr As-p '775* 3:00

26S lie Arg L®U Tyr Ser fejra Sly Va.l Ly® Thr GXw Mu Thr Arg Asp Jl<? 250 2SS 300 PM Tíjt Asj» Pr» ϊ1« »hm Ser Leu Asn TM l«s SXa Olu Tyr &2y Pr© 3 OS -- 310 315 120

325 330 33S

Oiy lya Asp Ser PM Asn Tyr Typ s«r íSly Aaa Tyr Vai Slu Tkr Arg 3.55 360 sgs

379 3M I.ys Ser Ι&ϊ ®lu . pro Vai ôla Lys Leu Sár ?he As p Gly C?l3-i 1ίψ9 Vai 385 390 355 4ΰβ syr Arg «*ls'ír ile Ala Asn Thr Asp Vai Ala. Ala *rp Pro ®.sn 31 y J..y.·:' 4G5 410 415 V»1 Tyr Deu aly Vai Tfer í*y« Vai Asp Vh.« Ser 31» fyr Asp Asp Sln 420 425 4 3S Lys AS® ¢1 u Thr Ssr Thr «1« Tfcr Tyr Aap Ser Uy-s Aí:'O Mn Aon sly 43S 449 445 líi* Vai ser 410 Ala Ola Asp Sssr 11» Asp Qln 455 Deu Pró 4 6 0 Frs- 3Xu Thr Thr A«p filtt Pto DPU íii.sj Lys Ala Tfyr Ssr His fâlsí Deu As» Tyr Ala olu 465. 470 475 4@0 Cys Pfee JLes Me t 31 n tóp A*g A®g <3Xy Tfer íle iro Pha Thr Trp 4SS 493 495 Tfcr Hls Arg Stsr V'·:» i ASp She iPh# A»« ff**· Ile A»j> Ala «Xu Ãyá 11* SOO .595 5X9 Thx 3la Dou Oro Visl Va i tye Ala fyr AX* teu Se»· Ser Sly Ala S«'r SXã 520 5.75 I.U He Olu oiy Pre '31 y Pfee Thr SXy OXy Aan Deu DeU Leu Lys 53© 535 540 Oju 545 5«.r $sr Aãft Ser 11« .550 Ala Dy» Pise: Dy» V»1 s§s Thr ASA g«.r Ala 5e>0 Ala L® a ia»1» CSl.si Arg Tyr Arg vai Arg H« Arg xyr Ala Ser Thr Thr *£··!> 570 575 Asis Deu Argr &eu Rhs Vai ela Asa g*r A$n Afio Agp Ph& Deu VAl 11* $60 5SS 159 11« jam Dya Thr w«fc Ae». S»y» Asp Asp Agp Deu Thr 1¾¾- $1» thr «»$ f^o «05

Pha Asp .iiffli -Mí Thr Thr As» Ser As» Mefc Siy Phe Se:r 6iy Aap Lya $t$ S15 Ô2Ô asíí siu isgu ;í 3igs 11« sly Ala #lm Ser S»h« vai ser Asn. slu &y» il« 525 550 5.35 &40 fyr He &ep i*y» 11« <3:lu Mie II* iro vai -si» Lew m$ sso (2) INFORMAÇÃO PARA SEQ ID NO:99: (i) CARACTERÍSTICAS DA SEQUÊNCIA: 529

QAACACGACA CCftTCAAQdi T&CJCCftAAC: ccATTESsere M®A$cefAft· c^Mttcsr AT<5A.CCSAAQ AmeCTCCAC 'RãASGfíCTC ac^gocaíta soerre®®»® acasatíçtt Tf&aOSAGCT r&OiCGA&re. crrrct&MC «Aeqcmç». 'mscceaasT qqmstctts TcmsAíieeT t^crSACT*? gcaaí?3TTtg orcaAeaecr «εααοαααμ: Tccenmer oEmsftAcnT Ks&ecc»*ee ce«A«ãseac tcraasTres Jw^TeKJTÇK* crpaçqu&c*. emrTCAÃAG ÁCSCTCASST «rrTGsre&s GfteTTCS»CC <mi»3C»©CT CRASTTW&Crr mc&ACSTOS SCJefÇAATíSG TCTTAGftOSA A©asTTTC©T& gagagatoaç çto&çwts ©ACATFCQTC TmcTCCAA »®<Κ!βΤΡΑΛβ CccsAxcra^c tí&ct$ac<3&c cctgcassaa AocascAasA. a-scctcãcct erscsitcTh? ahfâçm@rt h&^mmhk tmrtxxnc AGACCKTCCA ΤΟάβΑΪΟΡΑ® CftASACCATC SS^C&ísTSC &SAAGTT9ÍW5 CTTCSAK^SS G&TSTTíQCAS CrpSOCCTAA T®3CAÃ.GSTC 0ΗΙ$Λί5&ίβ8 A^ÃSÃfcgfc*. &ífcSMÃTCT «CSOCAtQTTT CCQCACAASA. «*5Cm®RC ΡΕ1040192 (A) COMPRIMENTO: 2000 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:99: ccatcgkso® ««acccsa* chAccmT&c ÍÍASSftACTtfe ACSACSÁSSÃ. <ítT?ClCCS<5 GATSACTCrA CAGTSAAffiSA CSCTCrrKSCSft. òdimwss «mmfecsHnr m&s&ãm&í AClMCTSSG CTTCAGMVTKC 'TSATCCCTO© atcoataaíia mtatommh <mw®care&

C&GAAC&ACT 'FCGASGArrA coTcafteec» CTCSSSTCTA ASCSITCCCA GSÃCCQTATT TTC&s&ftÃCT ccATeccTAe crtrecsetT tacgcacaas c*accAAe&e tcãtctctts «SAftTSGGGTT ACTCCAí^sÃ AOR.TGTTOCC caacaístaca cAOAOeakCPS coteiAAbTOs tc^acctacs AcaeftTOfâar a&ajsTrcwiC cTom?erm itssrrcTerr rccATtcTAC ACAsmííCixm cttcaíCCgat

TACCKSTCCRA CTJTt!CTCT<? CATTSAGAAC ÇTQC&ÍSJQSCÃ TTaASTTTCÃ CAOS&KSTTG AftcmcTGGA sc®»WAcm oerreAWMS? AeTPCfCCAT -LeTA^dTGA CAASAGCA.CT cas*Aeo®s* &TAC»»ca«r ceccAAteu» i&gefisssB mf&mim metesse

AC^tiftA&CCt AOSATAOmA QAGGAACAAT so 12« 180 240 3Ó& MO 420 48 Õ 640 SOB 888 720 780 840 »00 os o 1020 1030 1140 1200 1268 iâtô 138« 530 ΡΕ1040192 cjuícttcgac i 1 tXJATtíÃÀCiíA "rroOAGSAGG eXTACASTCA CCAACrTAAC 5440 TAOSCCSAAT ecTrroiOAT dCAAGACAGG OSTOSCÃCCA ffGGGTTCTt' T&CATGSMSí' is m CACAOGTCTS TCGACTTCTT T.AACACTATC GACGCITIAQA AGATTAC5ICA ^crtscsccse®» 15 GO CilCAÀSSCT? ATGcerrâTc CAGCQGASeT TCCATCMTG CTTCACCQGT 1628 «SCAAC1'T>3C Terrccrma. ti$&csTccme &.& C TC CATOG CCAAGTTCAA AGTSAOACTT 1688 AACTCAGCAa CCTTSCtCCA acgttacagg GTTOSmTCA GATAC-GCAAO CACTACCAAT 1?*G CTTC<3CCTCt XTvíT CCAQ AA cascaacaat ®&TTTCSTrs TCATCTAChT CAAC&AGACT .1808 ATSRACAAAa ACG&TGftCCT CACCmCCAA ACATTOSATC TTSCCACTAC caat&ot-aaí: meo ATeeeAvrer ctKsexa&CAJi GAACGAGCKJ ATCATASSTS cmmmcrs t<ttctctaat :l$30 OAGAASATTT ACU AC .10 SATCí^AGS^C AfTCWG-mo AACTCíA&m s&wcccosís 1580 QCTSCASOAA rrCGATATCA S008 (2) INFORMAÇÃO PARA SEQ ID NO:100: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 653 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:100: M*£ Ala ASÍÍ PrO As;n Aan Arg Ser @lu Kiss Asp Thr lie Lys Vai Thr 1 $ 3.0 X:S Pro Asrs. Ser Sla í,eu Gin Tiir Arr Hia Aán ei» Tyr Paro Léu .Ala Aép 20 2¾ 10 Gro Ai»n Ser TGr L&ti aiu GlU LêSi Asm Tyr Oys slu yité Leu Arg - 3S 40 45 Mefc Th.r aiu Asp Ser Ser ffc* eiu Vai L&U &sp Asn ser Thr Vai Lya m ss 6G Ma vai TiMF ffiky lie Ser Vai Wl Qly Hln Ils Leu Csly vai es 70 ?s ®a V*1 «ty Pr» Pite ΙΟ,ΐ8 Qly Ala Leu Thr Ser Pfee Tyr Slíl Ssiir 8¾ §0 35

Le« Asn Thr lie Tep ftrô Ser f&p Ala Asp Pre Trp Ly« 531 ΡΕ1040192 i«« ias no

Ma Gin Vai Gl» Vai Leu Ile Asp Lyg Lys' Xis Giu Glu Tyr Alia Lya 1.1S 12 δ i.25

Ser Lys Ma Leu Me Glu teu ala Qiy teu Gin Asa Asa PJms Glt* Asp 130 135 140

7yr Vai AM Ala Leu Aisn Sor Trp 14¾ Lyo Thr Fm Leu Ser Leu Arg 145 ISO iss ' ISO lèr Lys Atg Ser Gin Asp A»g Ik Arg Gin Leu £he Ser SIa Ma Gin 155 170 175 S«r ®s 3%ε &rg Asra S«r ttefc Fr» Se» Ph® Ala. Vai Ser Lys Pfee Slu ISO 10S tós

Vai teu Fhe teu Pro THr Tyr Ala GXn Me Me· .Asa T&r Mim teu te« IfS 200 205

Leu Leu t,ye A»p Ale vl» vai Pha *sly aio alu Trp sly Tyr ser Ser 210 21.5 220 61ts Asp Vai Ala Siu pfea Tyr &:r§ ei» te» i<y« Leu shr Sl» ei» 225 230 235 240

Tyr Asa VAI Gly Leu A»« Gly teu 250 2SS val Lys Fhe Asa Argr P*»« A*g A«g 2§S 270 Leu lie Vai Leu Vte P» Pte Tyr 255 vai Ly& TOr elu teu 'rítr Arg *<ç 300 teu Tb.r ?tw Leu ©la Lys Tyr Oiy a15 320 S».T lis Asxr Lys Pro H.i.s teu Fho 330 335 Hi« Tfer Arg teu sla Fr» Gly Tyr 345 35« Tt'p ser <siy as» Tyr vai ©1« Thr 3SS ttox Ile ffor Ser Pro Phe Tyr Gly 30« Lys teu Ser Fhs Asp Gly 03.» Lys 395 400 φχτ liar hsp His Cy» Vai As» Trp 245

Aacgr Gly Sor Tkr Tyr Asp Ma Txp 2S« GLu Mefc Thx Leu Thr Vei !<«» Asp 225 200 A®p Ile Arg tea Tyr Ser Ly» Sly 290 205

Ile Pte TPf Asp Pr» lis Phe Leu 305 11«

Pr® Thr Phs Leu Ser lie Giu Asa 325

Aap Tyr· Leu Qiaa Giy Ha Glu Via® 340

Phe Oiy Lya Asp ser Phe aso Tyr 355 3S3

Arg Pr® 8«? 11« Gly Ser Ser hy*

370 37S

Asp Lys Ser Thr Viu Pr® VM Gl» 38S sm 532 ΡΕ1040192

Vai Tyr Ar<j Thr 11« Ala Asn Thr AS?> VS.I Ais . Ala Trp Pro Asa (51 y 4ÒS 4.1(5 41.5 i.yg Vãi Tyr tótil Oly V«l Ths· Lys vai ASSp : PM SST (Jlfi 'tyr ÃSf» Asp 42Q 425 430 Qlrt L<y® As» Giu thr âer Thr «la Thr Tyr Asp Ser Lys Arg Áss. Asn 435 44 S 44 S siy Hia Vai Ser Ala Gin Aap Ser Ilê Gin Leu Pro' Pr© (Siu Thr 4S3 455 4#e Thr Asp Olu Pro Leu slu Lys .Ala Tyr S«ir Mis Gin Leu ΆΐίΆ Tyr Aia 4«S 4?S 475 400 alu Cys hha Leu set âlis Aep hrg Arg Ôly Thr Sle Pr» hhe M»e Thr 485 4S0 4SS Trp Thr .81» Arg âer Vai Asp Fi»« Phs AS» Thr lia Asp AÍS Slu Lys 508 se s 5X0 lia Thr Ol» Ls« Pr© V»1 Vai Ly& Ala Tyr Ala Leu Ser Ser Sly Ala SIS S29 S:25 Ser 11 e lie d 1 t.J <31 y ?ro >31 y Mas Thr Giy ssly Asíà Leu Leu Phe Leu 530 53 S 540 fcys Sln Ser £«*" Asa ser Ik Ala Lys Ph® Lys Vai Thr Leu Aa*s S«r $4$ SS-0 sss 540 Ala Ala Leu Leu úln Ara Tyr An» Vai Are? 11® Ar» Tyr Ala Ser Thr SS5 S3S 53S tm Aso. Leu Arg Lsu Phe Vai <Si» A-S» s®r ÃSíl Asa Asp PM L®u Vai ISO 585 550 tyw Zls Mfi Lys Thr Ksh Aon Lys Aêp· &sp Asp Lâti Thr Tyx Gin $$& «00 «0$ The Ph& Asp Leu Ala Thr Thr As» S®r Asm Me t: Gly Fh® Ser Sly Asp «10 SIS &2Ú Lys As® aiu Leu lie lia Sly Ma Giu Ser fhe Va i Ser As» SXu Lys S35 OS Si 40 lie Tyr 11« Asp Lys Xle Glu Phe lie fr© Vai Glu Leu S 4 S s 5 o (2) INFORMAÇÃO PARA SEQ ID NO:101: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2050 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples 533

TOasacTCC* oescecrteoí -eoccscrcm çcmACftAtc «rrocsAACfc amstaxavrc mtCMCAMX! AGmCCCWST (SGCTSACAAT M&amrrec tccssa.tsac ea&ASATASc k&m»G(3cm TttoeazCT&s £*.T3a®tmr CCMTCSCSÇ? CAGCTTCT&C sATGcmftTC ccrgeAAaac tttcatogcc β^βΑοτΑϊΰ· ccA*OTcrm Aseemeop e&TTASsTCft acocactcaa e&screa&Ae TÇÇÇft®8W!Ç s^AírTeomA acttptcagc ccxAecrrce ocjGTncmR, στταβ»®βτ& AAGftCTOATC TCTTOCTTCr CSAÃGACSCT ΐΜ3^®»»ΒΑΤβ TT©cca»eTT cmccsTAíss CACfSCCítÇA ACISST&CAA ÇSTSOSOÇTC tamtmuaT tcsac&33tt tcístagasas ctctttccat TCTAOSACAy tccmcjcrsAc OACATCnrCA CÕJA-rCCX-AT CTOCSC&CriP CTCTCCATm ASAftESWSCftt CftSGftASCCX rrsa&CAccA sorrscAACC WKXtTNStrc AACmOSTTO AftACCAJGACC ATCCAfCdaSA ©BTSACAAOA βΟΝΕΤθΑβίΧ A«3¥<3eaSAÃS accakjscca aacoaTST immscTTss AWMmKacT 'rcTCGCímxA ossacsatcas AGSAftSMSSR ftCAAÍSSfâCCA TOWKSMO, ACCACTSM<? Μ££Μ'Τ©3Ά GtóSSCTTÃC ΡΕ1040192 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:101:

53A*CX*6teO AfCTAOQCCT CCATA^PSAftC .AASSGTTÃCTC CAAACfCKSA OrrSCAAACl! eeTAftC&aTA crcnsA-soft sawcac TCCACTSAGG fTCte<Sft.S»A cisasfccasffe STGQSftCMm TTCTTÍSsAST eSSTOSTSTT CftíSTCCTTTC TCAACACC&T CTGGCCTTCA CMOnGfâAAGI TCTTC3ATCXSA TSUMSAAOATC <§s#'y*sSAÃ<3 «MC^TCGAG ÃAAS,e?CCCT TOASTCfCAS ârCTAftSCST CAAGCOÍÍAÃT CX5CACWCAQ WUWTTCCAT©

c$C5Terts@c cracatacoc tctú&eeeoc caocjTgtttg sTssftGea&Te ©sm^Aeree CftÓCTCARiST TOACTCAAC5A STACSCÍ^S&C iWWWSfCm SfiSSATCPAC CfAçmçeJCA Al^mCCTIOA. CTSTGCfCwA TCTTÂTCQTS' TCCAAA.GGC© TPA»QftCA®A GCTÍ*A««ftSS», AACACCCTGG ASSAMACSS tCCAAeWW cftccrcmss actatctoca aggc&tfsag

Tra*®cwee atooscasaa semw»

cctMTmcã .múrcmccT !wmcT

AÃSAAOGASA C&TGTfcCTCA ÂAGCTAS2GRX CAAQ^CTCCA TTS.ACCAACT ÍCCACCPGMA

AateÃe«AAc ttaagtacsc ΰόΑΐτοοτττ ss 3.2¾ 3.80 340 .íoe 3S® oso 4Bí; Ssse 003 720 7#0 54¾ soo aso i&£3 xoso 31*50 3.S00 12 SO 1328 13 80 1000 1500 534 ΡΕ1040192 efesTeeÃÂG ãewíqospksg c^ecAfrccs τμτττμιαψ S8*ereae&g &rçms®s&£ ttcTWMCA ct&tcg&c&c ixamMArv mxmcftc ockitc^tcrr ©sctt&t^c

TTS^CCftSOS SA8C1TCCAT O^TTOSWMSST OCASSCTTCA CCSQmSCAJk CTTeCTCTTC czTmsmsT commcrc catoqccms rrcAmmm c&CTfmcm AúCÂmcTm CTCGXtoCGT? ACA&SÍ&TT08 tatcasatâc scasscacm ccwkpcttcs cererr^GTC osaA&c&eca* acaatsattj- ecmerearc tacatcaaca as^ctato®*.

QMQfCACCW AGMOVSMT mmçrmQC AGTACC&ÃTA 8TMC&TGSS kTTCSamr úfkGRMiAHCa A&CmATCAT AeetOeT&W A^CtTTSTCT CTAATSA&MA GASTKKam SACSÃffiró ÁC3TTCÃTTCC AffrreAACre TAftl&GArCC ccoeeecroc &Bfm*LTXG<S& TATCM&CTV (2) INFORMAÇÃO PARA SEQ ID NO:102: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 2280 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:102:

ΊΤΑ&ΑΑίϊΤΑΑ IWOTraC WfCA^GT AftlSATATSA tmmAMAC «RAAftAQMC ATATACftACT 'TATCASC3AOS SOOeeOAtGC AGAAASAAGA ΑΑ*βά*ΤΑλβ AASTGAATOT ttataatqtt αωίτΑΟΤΤΤΤ ATOGSAAGoe mrmTcm mmmMsrr atgtattaxs xsxMiwmi ααϊρφ&μϊχα aãc&&tcg&& gtgmovtsa ταοθατααλ® ©ttACWSCTA Α£ΑΘΤ6»ΑΧΓ COUULCTftAC CAT&ATCAAT ATCCTTTAGÇ ime&ATCCA JArrOWtóAC ΤίΚϊλ&ΘΛΑΤΤ AAA-TTATAÃA CAATOITESA GAAftSACI*» AGacSSTfCT ACGG&AGXGÇ TASAC&ftCTC TACAGTAABA OajQOWíraS SG&CAGQ&M' TtOÔft^TA GGGCAS&TTT TASGTSaWT AGfâ&GTTCCA TTTGCXOGG© Í^<3EC8CTXSC ATTTTAtfCàA **»»»*& ÃCACTATAXS GCC&AÇTSÃT OCT^ACCCAT S8&&SGCTTT TATGGCACAA GfXSA&GmC TG&X&GATAA SAAAATAOAÇ fi^StATBCl» AAAST&ftftSC TCTTGC&SAíS·

Tme&^exe ττομμ^ατλά. χττοαΑΑα&ίΡ ταχοχταατ® csxTMAi^é ctcgaao&aa .1.560 1M20 Mão 1746 MOS ISO® 152® XSSG 3040 3050

50 ISO 1SS ISO 430 48® MO «0® SSG 535 ΡΕ1040192 TAÃ&ASAA0C CA&GATCGAA ritsAitecce tcatt-ítscàg &GCTQCAAAT ACACAT^TAT ATATTCTTC& S&AS&T&fTO CACTSftCCAT TSATSCA®®® «κ&αατχτα A.ATT>3’TA-CTT ttCCCATTTT ÃftCAMfAÍSAC AtTTOÍACOQ AAcrrrrnís mrmm^A S&MSAATTT CATACGC®TC CÍTCTSSTAAT ΤΑΪΟΤΑΟΛΑΑ ATTffATSSA SATAAATCTA TTATOSAACT A«?M3CT1*:X& tísttaosaaa CTmAimA AT&TGATTCA, AAAM5AAACA GCC&S&A&CA. ACASATSAAC .&fs¥W£wâ M©eÃS&&x TS-mmcTTT tts»ãtacaa ATATTOCTO® TCTTCAOSTS ACTATrecfA MímmQVh AQCCTTGTTA CAA03ATATC TTTTGTGCm AATTCÃAAC& AGMmTCmT TOIACATATC CÍTCfWMSTSST Αδβ*Α1«ΪΑ&Γ cmmTASAT «ammT TSAimTCftA A&TGiftAAQ&A CftA&SSCAAC ATS&SAAAST SEQ ID NO:103:

ACTTTAACJS TftT3%BSTCT ARASSOCSTm AAACAOBACT &GT€rmhm

TtASTJmrr ATrrftC&ÍSOO ASASAttCTT TÇA&TTAITG AiQTA»SftCAA fTÃCTTCCCC AGCTTimTG GACAAÃÃAC-T AAte«tAA«<3 mmtmso

AftTSS&Ã&C» ÍSTACA-CAAAC GATTCT&TTS ASCAATTACC mfCSSiSOTA Wà®»

TTTACTTGíJA cacataqaas €&ACTTC:C.m TAtmíAAAGC S^TKlAGftS SAGSMATT? AAASTTACAT TAAATTCASC TCTACCACTA &CTTAC1SACT AWAAÍTAABA AÍTTAftTTCTA δTΑΤΎ5£3ί5ί?'ΓΤ

(2) INFORMAÇÃO PARA

T£A<?GGAAéT TTTTTCTÇ&A ΤΠ^ΚΑΛΑΉ· C0MÍ*1?&C!J?<*

Tí?C TATTÃAA AGATGCTCAA etmAtrw& tcmmmm,

SSmTAATOT TGOAWAAAT AccarrrrcG cagagaaatg AESATATTOS- fâTTÃTÃCtCA ATOCAATTTT TTCACtTÃAT

AnciAttcsa aa&accxsat

cfuxia.&mTÊSA assvíc&ftAAA

A3K&7CCATGT AA31S3CACAQ CACr?fâAAAA ASCATAmOT sTCôfsssAÃe AÂTOeA‘mv t^SATSCTSA AAASATTACT cxtcexttm tgaaggtçça GT&ATftMT ΤδϋΤΑΜΤΓΓ gtctaasaat aogctatoct ATOATTETCT TSTCATGTAC AAACATTm* 1?C1ÍC0CÃACT TTATASfÃiSS mCAmATcr TTATOCCAST JOUOTefAA tAGOftAS&tS «ΑΧΤΧΤΘΛΦβ AmcftcrrACA aatattaacc 73G 780 840 iso a 60 1030 íaas 3,148 1.2 08 1,¾ 60 1338 1380 1440 ISO» XS60 1S28 iéàò 1740 1808 IM8 1028 108S 2840 2108 2 ISO 2328 2280 536 ΡΕ1040192 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 32 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:103 TAGGCCTCCA TCCATGGCAA ACCCTAACAA TC (2) INFORMAÇÃO PARA SEQ ID NO:104: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 42 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:104 TCCCATCTTC CTACTTACGA CCCTGCAGAA ATACGGTCCA AC (2) INFORMAÇÃO PARA SEQ ID NO:105: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 28 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:105 GACCTCACCT ACCAAACATT CGATCTTG (2) INFORMAÇÃO PARA SEQ ID NO:106: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 25 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 537 ΡΕ1040192 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:106: CGAGTTCTAC CGTAGGCAGC TCAAG 25 (2) INFORMAÇÃO PARA SEQ ID NO:107: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1959 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:107: MÍ3AMM’CAA ACAATCGAÂG AOSATAAAS^ TfAC&CCXAÃ CmímWATTa <sa ATAATCAATA TCCTTT'AGCT ^ACmTccM.. ATTCAACAOT ÁGAASAA^A ISO ívATTTTTAAG MkTSACTM3AA GAGASrrCTA OT^AÂSTGC? ASACAACTCT xm 1 | ATGCMíTÍGG «ACASOAMT TCTSTTsma (^CA&ATTIT AlÈ^T6TOBm 240 GQAGTTCCAT TISCTQGSSC AcrçAcrrcA •rrrxaxcAAx CATrrcTTAA CACTAmTS® 300 CCAAÍ^TÍBiTa CT'3ACCCAT«3· >3ΑΑδ©0ΤΓΓΤ AXSSCÃCAAS TTSAASTÃCT GATAGATAAS 3®Õ AÃAAtASAíSe AGTATeCTAA AAOTAAAGCT CT^GOkGAírr mcAssaTCT TCAAAATAAT TTCtxAAGATT ATGTTAATGC TíSSSAQ&AAA CACCTTTAAG XmiCGAAST 4#C5 A&<^Te<m&T AAdâfiÃACre XXTTCTCAÃS3 ΤΤΠΌαΤΑΑΤ S4S tccatíjcost catto^ast rsvm&vtc efeftSTocxoT rtctmcme AXAtOCACAA ÊQQ GCTGCAA&TA CAC&TÍT&TT QAT-dCTCAAS rsrrmúm-M ÃGAAfSSGSm δδθ TATTOTTCAG AAâA.TST^SC TSAATTCTAT oGmtmcAAf TAAAÃCTTAC ACAACAATAC 72& Mmmee&rr âTOTTAÃOTQ hSTATAATOTT wATTAAATS GTTXAAGAGG ITC^ÇTtAT 7m τφα&ατττμ, OSSTTTTCGC ASAam&tm eXXXAACTíJT ATTAGATGTA mo ATTsmcTTT T CCCATTTTA Tmmwoos r?ATACTCAA AACíu3AA.CTA mo •rtttTACGGA TCCÃAxrrrr tfACTmCTA cGCTTC^çm m&wmcm f£G ACTTTTTTGA ^TATAGAAãA CTCTATKS^ AMC?CTCM*T ΤΑΤΤΤα,ΑΧΤΑ TTTACAGG0G xosa ATnSftATTTC ATACSCGXC? TCftft£CTS®X AAsTATTDTTT CÁATfATXSG X©g(5 538 ΡΕ1040192

ItfWÃM*· fAaÃCCtAÓf ATÃ&3ÂTCTA ÍÍTAÃSACAAT TACTTCCCÇR. 1*40 rrmteâne aíaa&tctrc t^jmwxtsta c&a&agctaa acrrsaftTes acaaaa»siít 1200 mtos&kem Txac&taaMC mjagotascg ecrsoocciSA ASGGmftsay mfmrm&s: .ia«® WACJSfcAAS ΤΤΟΑΧΤΤΧΜί TCiMVTATSAT «SA1TMAAAA .ATKAAACTA-S TACA.CAAACA 1.3 a 0 TATSATPCAA .AftASSAftCftA TSWtATOT». SUSTSCACaC© ATTCTATTS.A '«CCAA^íysm» 1380 CC3WSRAACAR, CASATSMCC ΛΟΤΤβΑΑΑΑΑ GC^TATASTC ATCmCTSUA TmSQCQQM 1440 totwcttaa íocAgâAcee toateeaAC». attccatttt ttãcttqcjac acatasaaot isso gtaísmètttt t^aatacaat mrecsm aasattactc aactmcast .AOTS&AaecA isso TATeccrrax crrcfteesue m?CA«mírr <miuãe«eaw3 oattcácaoss aussaraotta. tsao CT&TTCCXM AAOAATDmS TA&TTCÃATT OCTÃMTTTA MkSTTACATT AAATTCAGCA. 1S80 ©CCCT8TTAC AfiOSAXATC® TQTAASÃATA CGCTATOCTT CTMXACTAA. CMfcOS&CtT 3 040

TfTSXSeAAA ATTCAftACIUt Τ«ΑΤΪΤΪ«ΤΤ <®TCATCT&£lt TrAA*A»íUSár ΤΑτ$Κ»3ΕΛΑΑ ig&O «RTuaxearr taacatatca ακ&γπώλϊ ercGCftACra ctjíattctaa TATeessase isss tos©<xf$a.ta. a$aaik?aact Tmmratèsm ©casasscrr tcç5tttctã& ts&raaakxc asas IMATASAXA A@smOA&TT mTCÇCAOm CAAXX^TAA. tés? (2) INFORMAÇÃO PARA SEQ ID NO:108: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:108:

Met A»» Pro Adn Α&Ϊ1 &rg Ser sSXú His Aísp Thr fie Lys Vai Thr Pro 1 5- 10 15 AS» Ser siu Leu Qln Thr Αίϊϊΐ HiS ASEI ©la Tyr Pro Leu Ala ASp •Asu sõ 2S 30 Pr® Asn Ser Thr Leu ©lu ©lu Leu Asa Tyr Ly# SXu Pb® Leu Arg Meç 3.5 4ΰ 45 Thr <*Iu A&p Ser Ser Thr Slu Vai Leu Aâp As π Ser Thr Vai Lys Asp

50 55 SCS 539 vsl sly «ais ii* ©iy v«A v*l 75 90 Thr Ser Pfec Tyx 61® Ser Phç lc® ÓS OS Asp Br» Trp Ly» Ala Pb* «et Ala XG5 13.0 Lys Ile <3iu Clu tyx Ala Lys Ser xas Leu 61« As a .As® Phe 61® Asp Tyr 140 Ly» Th.r Sr® Leu Ser Leu A*g Ser 15 5 160 Clu La® Phe Ser Cl® Ala clu Ser 170 17S :píse Ale vai. ser uym Pbe el» vai ies 170 Ala Ala Aãn Thr Ris Léu teu Leu '305 61® si® Trp Sly *Çyr Ser Ser 61« aao ©la Leu Lys Leu Thr *3ia Oin Tyr 235 240 A®n Vai ely l>s« A®» sly Lsa Arg tSO 2S5 Lys Phe Asn Arg PI*® Arg Arg <3lu 265 270 Ile Yol .Leu Phe Firo Phe Tvx Asp ass Lys fJur ©lu Leu fhr Arg Asp Ile 300 Thr Tbr Lê® 61®· Lys fyr 6!y Pr® 315- 220 ile Arg Lys Pr® Bis Leu phe Asp 320 335 Thr Arg Leu. Cln fro Oly yyr Pb* 345 350 Ser Cly As® Tyr Vai Qiu Tkr Argf ΡΕ1040192

Alt ¥&1 sly Thí Sly llê S1®* \t§£ BS 70

Sly Val Pr® PM Ala 31 y Ala h»*t 85

Asa Har II* írp Pr® ser Asp Ala 100 61« Va.1 Slu Vai Léu He &sp Lys lis 3,20

Lys Arg Ser Sl» Ciy Arg ile Ar<*

Xâ S

His Phe Arg Asa Ser síac, £fi-® Ser 190 1*® Fhe La® Vr® Thr Tyr Ala <31®. iss aoo

Leu Ly» Asp Ala ®1« vai phe ely *10 *15

Asp Vai Ala Cl® Khe yy*· A,rg Arg 225 130

Th:r Asp sis cya vai Asa Trp 'ryr 245 ©ly Ser Tter Tyr Asp Ala Trp Vai aso f*et ffcr Mu ite vai hm tep lou 275 280 11« Arg Leu Tyr S«r hys 6ly Vai 200 295 P&e T&r Asp Pro 11« Phe Leu Leu 3OS 310

Thr Phe Le® Ser Ile 61« As» Ser 325

Tyr Léu Sln Sly Ile 61« Phe Hie 340

Gly Lye Aa$> Ser Abe As» fyr Trp ΡΕ1040192 540 3S5 3SS Sèt Ile ©ly Ser Ser hy» TMr .> 70 3·'7 5 Lys ger Thr Ôlu Pvo Vai <31». Lys 18S Tyr ftrgf Tfer Ile Ma .te» Thr tep 4ôS Vá,3. yyr Lee, sly vai Thr Lys vai 420 Lys As» Glu Thr Ser Thr Sis Thr 4.3 S 440 Mi* Vai Ser Ala Sis Asp Ser ile 450 455 Aâp Slu Vro Leu 81«. Lye Ala Tyr 46 S 470 •cy» j?he I*®:» M»6 Giss Asp· arg Arg 48» i%r Mi te$ £*r vm m$ Pte Pà® soa ®fcr 01» Leu PT* V»! V*1 Ly* m.a 515 520 Ile Ile si» Sly Pro Gly Phe Thr «a sâs Oltt te£ mr ASA S»X Ilt Ai» Lys 545 550 AI» Leu líSt«. Gl» Arg Tyr Aarg Vai 555 Asa Leu Arg Leu Phe vai <3l» as» seo Tyr Ile te» Lys: thr Met Asa Lys 535 500 Sfee tep Leu Ala Thr Thr As» Ser 610 515 Asa Glu hsv lie II® Sly Ala Qiu 635 Ê3Ó Tyr ile tep Lys Ile si» Phe lie 64 5 3S5

Ile Thr Sar prõ Phe Tyr Sly Asp 380

Leu ser pos &sp sly ela Lys vai 355 400

Vai Ala Ala Trp Fr» As» Sly Lyé «10 ' 415 tep fihe Ser Si» Tyr Asp Aep sl» 425 430

Tyv Asp Ser Lys Arg Asn ten Gly

44S

Asp Gl» Leu Pr» Oru GI» Thr Thr 460

Ser 8Íf Gin Leu te» tyr .Ala Gi» 475 480

Sly Thr Ile í*r<& £h& Phe Thr Trp 4:80 455 A8U· Tte 1:1« Mg Al* @1« Lys 11« SOS 510

Tyr AI» Leu ter Ser Sly Ale Ser 5:3 5

Sly Sly ten Leu Leu vhe Lee Lys 540

Phe Lyo vai Thr tev a&s ter Ala 555 560 teg Ile Arg Tyr Ala Ser Thr thr 670 575

Sèr Asn As» Asp Phe Leu Vai Ile 555 SOO

Asp tep A.sp Leis Tfer tyr Gin thr 605

As» Kefc Sly The Ser Gly Asp Lys 620

Ser The Vai Ser As» Glu Lys Ile 635 640 frtf Vai SI» tmt 650 541 ΡΕ1040192 (2) INFORMAÇÃO PARA SEQ ID NO:109: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 649 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:109:

Pro Thr teu Gl» Gl» teu Μη Tyr Lye Gi» £he teu Arg Apgr Thr Thr 35 40 45

Asp Asn jRsn wal 81» Ala teu Ser Ser Thr Thr Lys ksp Ala II e 30 35 50

Gin &ya Gly Il.« Ser 11« II® Qly Asp Leu Leu Qly Vai Vai Gly P2ut #s 70 75 ®0

Pro Tyr Gly Gly Ala teu Vai Ser Ph® Tyr Thr Aen Leu teu As» Thr 85 #0 95

Ilo Trp Pre Sly 01» &sp me& teu Lys Ala Phe Μβ£ Gl» 61& Vai Sl» IOO 103 110

Ala teu lie Aap Gin Lys lis Ala. Asp Tyr Ala Lya Asp I>y» ALs Thr 1IS 120 125

Ala Glu Leu Ql» Gly teu Lys Asn vai »he Lys Asp- Tyr vai ser Ala 130 13S 140 teu Mg> Ser Trp Asp .Lys Thr fr» teu Thr teu Arg Asp Gly Arg Ser 14S ISO 1SS 160

Gin Gly Arg Ilé Arg Glu Leu Phe Ser Gin Ales Glu Ser Bis Phé Axg 165 17Q 175

Ala Gin lie Tyr Gly Thr Asp Trp Gly Tyr Ser Thr Asp Asp teu Asn 310 SIS 22& 542 ΡΕ1040192 01 u PM hís Tter Lys Sla Lys tâp Leu TI» Xi« §lu $¥* &&& 22$ 220 215 2*0

Cys Ala tye Trp Ty* x»ys Ala 3ly Leu A&p Ly» Leu Ârg Gly Ser ΧΙϊϊ' 245 2SQ 2S?

Tyr Qlu slu Xrp V«1 Lys Ph« Asn &rg Tyr Arg Aspg Olv. Met Thr uo 260 Sô5 270

Thr Vsl Leu Mp Le» »s Thr Leu Mie Mo Lee íyr Vai Axg ftr

275 ISÍí 26S •xyr Thr· Ly» sly Vel Ly» Tbae 61u Leu TLr Ãrg λβρ 'Vel Lata Thr Aap 200 295 390

Pr o lie wal .Ala vai *»» Aen Kefc Asas Oly Tyr &ly Thr Thr Mae Ser 305 HO llS 320

Ama lie olu as» tyr Tle Arg Lys Vro Ki» Leu Phe Asp Tyt Leu Bi* 325 330 335

Ale lie Gin Phe HAs Ser Arg L-2U filrs Pr» 61y Tyr Phe Giy Tiár Asp 346 M§ 3S0 sor Me Asm Tyr Trp Ser <3ly &ΒΠ Tyr Vsl Ser Thr Arg Ser Ser Il« 355 MO 3S5 Oly Ser Asp Slu lie lie Arg Ser Pr» Ph® Tyr Oly As ri t>y s Ser Thr 370 3tS 3S0 Leis Asp Vsl «la Aan Leu Glu Phe Aso Giy Olu tya Vai Phe Arg Ala 3 as 390 3ãS 490 Vai Ala Aon 61y Asa Leu Ale Val Trp pro val Giy Thr sly Gly Thr 405· 41® 415 Lys li» nis Ser Giy vai Thr Lys val Gin Phe Ser Gin Tyr ASB ASp 420 428 430 Arg Lys Á-5p 6lu Vai &rg Tl»r Sisa Thr Tyr As.p Ser Lys AítJ Asn Val 4 35 44 0 445 Giy Giy Ho val Phe Asp Ser 1.1 e Asp Qln Leu FTO Pro lie Thr Thr 45» 455 450 .^.$p Glu Ser Leu Giu Lys Ala Tyr Ser Ki» Sln Leu Asn Tyr vai Arg 4?0 473 4SS Cys pfce Leu X.·^u CXXy Oiíly A*g eiy 11« ile Pro Vai Phe Thz Trp 43$ 430 4 95 Thr lis Lys Ser Val Asp PM Tyr Asb Thr Leu Asp Ser «lu Lys SOO 505 51® Thr >31n Xi« Pro Phe Val hy» Ala phe lie Leu, vul Asn Ser Thr Ser SIS 520 5SS 543 ΡΕ1040192

Vai vai Ala Gly Pra Sly J?he Thr Sly Gly Asp íl© ri© Lys Cy« Thr 53» 53$ 540 A&» Sly Ser Sly Leu Thr Leu Ty* Vai Tbx Pr© Ala Pr© Asp Leu Thr S4S 550 SS5 550 tyr Ser Lye Thr Tyr Ly« 11« Arg lis Argr Tyr Ala S«r Thr ser Gin 5SS S‘7Ô 575

Phe Asp i,ys T&r fttet Αβρ Ly» Sly %an Thr x&w Thr Tyr Asa Ser fitee S»S SOO $05

Ile ely vai ser vai ely sly xie Sly Ser Sly ssp <51u Vai Tyr 11® 53.S €$à S3S s-io

Asp Lys Ile ©1» Phe He Pr© Mat Asp €45 (2) INFORMAÇÃO PARA SEQ ID NO:110: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:110:

Ala Vai 6ly Thr 6!y tlm Ser Vai Vai Gly βΐή Ile tos Sly Vai Vai SS 70 25 sly Vai Pr© pfee Ala oly Ale Leu Thr Ser Phe Tyr Glu S#r Ph« Leu m m ps ΡΕ1040192 544

Αβρ Thr lie T*p Fr© Ser Asp Ala 100 Gin vai Glu Vai Leu Xis Amp Lys llS ISO Lys Ala Leu tó« <S!y Leu sl« Gly X3Ô 133 Vai asm Ala Leu Asa Ser trp Ly» i4,s ISO Lys Arg ser 81» Asp A*g 11® Arg 155 Hia hat® Asa Ser Mefc Er© ser ISO Lsu. ph* Leu Pr© Thr Tyr Ala Olr. 1SS 200 IíSU Lyst A©p Ala Gin Vai Phe GJy 210 215 ftsp Vai Ma Glu 1‘lié Tyr His Ãrg 225 230 fhr Asp ils cya vai Asn Trp iyr a&s Gly Ser Tht ΐ» Asp Ala Tr» Vai a>so Met Thr Leu Thr Vai Leu Asp Leu 275 :380 Vai Argr hm* Tyr Ser Lys Gly Vai ato 335 Phe Thr Asp Pr© fie Ph» Ser Leu 305 110 Thr Ph« Leu ser ilè Glu Aan serias Tyr Leu Gin Gly lie Glu Ph* Hi# 340 Gly Lys Asp Ser Phe Ae» Tyr Trp 355 360 Pr© Ser XX« ®ly Ser Ser lys Thr 370 3'?S A&p Pr© Trp Lye Ale Efoe 54eh Ala 103 110

Ly» He Glu G1ss Tyr Ala Lys Ser 125

La» Gin *#». Asn ph« Glu hsp Tyr 140

155 ISO

Glu Leu Ph« Ser Gin Ala Glu Ser 1.70 175

Pfce Ala vai Ser Lys phe Glu vai 185 100

Ale Ala Αβη Thr Sis L«u irisu &«« 205

Glu Glu τ*ρ Gly tyr Ser Ser Glu 220

Gin Leu Ly» Leu Thr Gin Gin Tyr 23S 240

Mn vai Gly imx Aon Gly te Arg 280 2S3 oys P&e Asa Arg ohe &rg Arg Glu 265 270 íle Vai hm* phfi Pro pfee Tyr A.ap 285

Ly» Thr Glu Leu Thr Argi Aa;p XI® 300

Asa Thr Leu Slo Glu Tyr Gly Pro 3X5 320

Thr Arg Leu Glu Pro Gly Tyr Ser 345 350

Sar Gly As« Tyr Vai Glu Thr Arg 365

Lyg Ser Thr Glu P:ro Vai, Gin .Lys Leu 8ar Phe Asp Gly Gin Ly» Vai 545 ΡΕ1040192 3SS 39Ô 3^5 400

Tyr Arg Tbr Xla Ala Asn Vhr Asp Vai Ala Ala Trp Fra A&s &ky Lys 405 410 415 ll« Tyr phe< O|y val Thr Lya Vai, Assp Mie Ser Gin Tyr Aap Asp Ql» 42C 425 430

Lys ASA Glu Thr Ser Tbr Gin Thr Tyr A»p Ser Lys Arg Atsa Asm Gly 435 440 445

Asg» Glu Ur» Leu Glu Ly* Ala Tyr Ser Mis Gl» Leu As» Tyr Ala Gltt 46S 470 475 488

Tter Gin L»ti Pr© vai vai Lys Ala Tyr Ala Lee Ser Ser Gly Ala Ser SIS 020 525 lie lia Gl» Gly Pr© Gly Pte Thr Gly Gly ASA Lau Lee M» Lee Ly» 530 535 540

Gl« Ser Ser A*« Ser lie Ala Lys Phe Lys Vai Thr Leu Asn Ser Ala 345 550 555 350

Ala Leu Leu. Gin .Arg Tyr Arg Vai Arg lie Arg Tyr Ala Ser Thr Thr §33 S70 375

Asa LSU Arg· Leu Fhe vai Sln as» S#r ASS Aan Asp Pb® 11 e- Vai Ile 550 305 550

Tyr lie Ase. Lys Tbr Mefc Asn 11# A$p ASp Aep Leu Thr Tyr Gin Thr 555 500 605

Phe Asp Leu Ala Tbr Thr As» Ser As» «et Gly Fbe Ser ôly Asp Thr 6:10 6.15 520 A»r Glu Leu. 11® Ile Sly Ala Glu Ser phe Vai Ser Asn Glu Ly» II® 625 630 635 640

Tyr ile Asp Lys Ile Glu Phe Ile Fr® Vai Gl« Leu S4S 550 (2) INFORMAÇÃO PARA SEQ ID NO:111: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: 546 ΡΕ1040192 (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:111:

so SS

Asa Thr lie Trp Pro Ser Asp Ma 100

His Asp Thr 11« Lys ¥«X S&r F*o 10 15

As» Gin Tyr Pro Icv M« A>$p Aso 25 30

Aen Tyr Lye elu She Leu Arg jsset. 4$

Leu Asp Asa Ser Thr Y&I Lya &sp €0

Vai Gly ala lie Leu Sly Vai Vai 7.5 §0

Thr ser Phe Tyr 61» ser phe Leu $0 »5

Vai &a& Ala Lsu As» Ser Trp Lys Lys Thr Fro Leu Ser Leu Arg Ser 1.4$ ISO 1SS 150

1£S 170 17S

180 1SS ISO

Leu Lys Asp Ala ©la Vai Phe ©ly <31u ©lu Trp Sly fyr Ser Ser ©X» 21© 215 22© '&®p Vai Ma ©lu Pb» Tyr His Arg ©1» Leu Lys Leu Thr ©X» ftl» Tyr 225 230 235 240

Thr Asp His Cys ¥al Asa Trp Tyr As π Vai Cíly Leu Ag» <31y Leu Arg

24$ 3SÔ 25S 547 ΡΕ1040192

Gly Ser Tkr Tyr Asp Ala Trp Vai hys Phe ã®» Are- gke Arg Arg ciu 260 aos 270 íSèt Thr teu Thr Vai teu Asp teu II* vai teu Phe Fro Fhe Tyr Aap 27S 380 285 II* Arg teu Tyr 3©r hys ®$y Val Lya Thr Slw tevs Thr Arg A*p ii« aso ass age

Thr Pte teu Ser He Glu Asn Ser lia arg Lys Pr» Mi® Lau Fhs Rsp

525 330 33S

Gly ty» Asp Ser Oh* As» Tyr Trp Ser Qly As» Tyr vai -GIu Thr A:rcj

Pr» 3 55 Sar lie Qly ter Ser ISO Lys Thr lie Thr Ser Αϊ.Ό 345 Phe Tyr Siy Aep 370 375 380 Lys Ser Tkr Glu Pr© Val Cl» Lys teu Ser Asp Giy Gte Lys val 395 350 3 PS 400 Tyr &.rg tkr lie Ala AS© Thr Asp Val Ala Ala Trp Pr© Asr Gly Ay® *«S 43,0 4 IS Val Tyr leu Giy Val Tkr Ly© Val Asp Phs Ser ÕIss Tyr Asp Asp Gin 430 425 430 Lys Asai GIu Thr Ser Tkr Ol» Thr Tyr Asp ser Lys Àeg &Sn Asu aiy 43 S 440 445 lis V«l Ser Ala 01» As p Ser Xle Aâp Gin Leu 5?i:o ?ro Glu Tkr Thr 450 455 4êS£ Asp SI» Pr© teu Glu x*ys Ala Tyr ser His Gin Leu Ãsrt Ala Glu 4SS 470 475 480 cyg PM Lm Gin Mp Arg &pg Gly Tkr 11« Pr© :Ph® Pfc® Thr Trp 485 49® 485 The His Arg Ser Val Asp Phe Phe Asn Tkr fie Asp Ala Slu hys II® SOO 505 510 Thr Gin leu Ir© Vai val Ly^i At$ Tyr Ala teu Sáíi* ser Giy Alei S«r 515 STO 535 Xis «* Blu £ji3;0 siy Pi O <Jly Pii-3 TM 535 siy ciy ASD teu 540 leu pke teu Lya Oi a Ser ter Asm £ssr ile Ala t.ys· Ehe &ya Vai Thr Leu As ή Ser Ala S4S SSO 5SS 550 548 ΡΕ1040192

Ala Leu Laa Qln Arg Tyr Arg Vai, S65 teK La» Arg Leu Wim Vai. Gin Asn 5« o

Tyr XI*. A&n Lyi Ttar M«t Asa Lys 535 600

Ph* Asp L«u Ala xhr xhr aso ser 6M λ l 5 A.sti <31« Leu XI® xla Õly Ala Glu S3S 630

Arg XI a Arg Tyr Ala Ser Tfcr Tfer S70 575

Ser Asm Asa Aap Aha Len Vai lie S8S · 550 &®p âsp âsp 3d&«t %r tyx Qlu ihr

SOS

Asn Mftt Gly phe ser <sly Asp Ly®

MO

Ser F.h.e Vai Ser Asa Cila Lys ile 635 640

Pro vai 81*3. Leu êsõ (2) INFORMAÇÃO PARA SEQ ID NO:112: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: (D) TOPOLOGIA: linear (xi) DESCRIÇÃO DA SEQUÊNCIA: 11« Arg <3&y Qly Arg Ly» 1 s

Tyr Asp Tte Xis Lya V«1 Tlsr Oro 70

Asn Gin Tyr Oro Lau Aio A&p Asn 3S 40

Asa Tyr Lye Glu vho Lsu Arg Met 50 SS

Lao Aep Ser Ser Thr Vai Lys Aap 61 7Q

Vai Sly Oto Xi* Leu Giy Vai Vai

8S

Thr Ser Pfea Tyr Gin. ser £te Leu 100

Wefc As® Pro Asn. .Asa &rg ser Qly ID is

Thr Ala Asp As» Ser Thr ôln vai 6ó

Ala Vai ôly Thr õly xie ser vai 75 se ôly Val pro Phm Ale 8iy Ma mu se m

Gin Vsl 01« v«i Leu lie Aep Lym 125 549 ΡΕ1040192

Lys O e Gl u Glu Tyr Aia Lys Ser 330 135 Leu Gin Asn Aãn Ehe slu Aáp Tyr 546 ISO Lys Ala Era Vái As» Leu Arg Ser 165 Glu Leu Efce Ser SlB. Alá Slu Ser ISO Pfee Ala, Vai Ser Lys Ehe Glu vai 3JS 200 Ala Ala Aso Thr titi» Leu Leu Lee 210 21.5 Cb.i Giu Trp Gly Tyr Ser· Ser Gl « 225 23 0 «31«. Leu Lys Leu Thr <3Xn 245 Gin Tyr Aáá Vál Gly :L®Ui 260 Asti Ser Leu. Arg Lys Pb® .te Arg Pb® Arg Arg Qiu 2 75 280 XI» Vai Leu Phe Põe» Phe Tyr Asp 260 255 hys: THr v.lu L»U Thr Arg Asp Xie 305 310 ASSR. Ala Leu Gin Glu Tyr Qiy Pr·© 325 lie Arg Lys PíÈ Hi S Lee Pbs ASp 340

Thr fceu Arg Pxo <Siy Tyr Ser - 35% 360

Ser oly Asn Tyr Vai Giu Thr Arg iTO 57S

Xle thr Ser Pr& $h® Tyr Gly Asp 386 3#0

Leu Ser Pbe Arp Sly Gin Lys Vai 405 lie Ala Ala Fhe Fra A&p sly Lys

Lys Ala Leu Ala Gin Leu sla <SIy 142

Vai Aáá Alá Leu Asp Sei: Trp Lys 155 160

Arg aje$ ser ela Aap Arg He ftrg 1.70 175

Ui» Wh» kx& Asn Sér líefe Pre Ser 1SS 190

Leu phe Le«. s**» Thr Tyx Ala sl» SOS

Leu Lys Asp Alá Gin Vái Phe sly 220 .Asp XI® Ala fílu Ehe Tyr Gin Arg 235 240 TAr Asp lis êys Vai Asa Trp Tyr 250 255

Oly Ser Thr Tyr Asp Ala Trp Vai 265 270 Mê:t Thr beu Τΐΐΐ V*1 Lsu hap Lev 205 v».l Arg Leu Tyr ser Lys sly vai 300

Wh» tímf Asp pro He Wh» Thr Leu 315 326

Tfcr Pite ser ser lia ®1» As» ser .330 335

Tyr Leu Arg sly li® Glu Phe His 34S 350

Sly Lys Asp Ser Eira As» Tyr T*p 365

Ero Ser lie Giy Ser Asa Asp Tte 300

Lys Ser lie Glu Pro lie Gin Lye 395 400

Tyr Arg Thr He Ala Asm Thr Asp 410 415 11« Tyr Fhe Gly Vai Ttsr Lya v*i. ΡΕ1040192 550

Asp Phe Ser ©In Tyr Asp Asp Sln 43S 440 fyr A#p Ser I<y£s A*g Tyr aa» 31 y 4SÒ 45$ &sp 31» Le» pro Pro Glu Thr t&r 483 47® S*t Hia 61» Leu Asm Tyr Ala Qlu 485 Gly Tfer lie Pr© J?h« Phft Thr Trp-5 OS As» fhr xie &.*3p Ala Glu Lye XX® SIS 520 tyr Ala Leu Ser ser Gly Ala Ser 530 535 gly 31y j&n Leu Leu Pia® léu ly® §45 SSO pfeé Lya Vai Tfer Leu A»» ser Ala 5€S Arg Xla Arg Tyr Ala Ser Tixr Thr 8«0 g®*· As» .As» Asp Pfee Leu Vai Xle 55g 500 ABp «ly Asp Lem Tfer Tyr 31» Tfer 510 SIS AS» MS£ Gly »fte Ser ely mp Thr €25 OQ Ser Pise Vai Ser Aso. Glu Lys Ile €95 42 S 430

Ly& As» Qlu Tfer Ser Tfer Ql». Tfer 445

Tfer Eis &rg Ser vai Asp mm Phe 505 ' 510

Ala Leu Leu Gin Arg Tyr Asrg Vai 570 575

Ffe® Asp Pfee Ala Tfer Ssr Asa s«r &2õ

Tyr Xl® Agp xys Xle Glu g&e lie 0S& £55

Pro vai Sla (2) INFORMAÇÃO PARA SEQ ID N0:113: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 652 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: (D) TOPOLOGIA: linear 551 ΡΕ1040192 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:113:

Met Xl® Arg Qly Gly Aarg Lys Met As» Pm A*» As» &*g Ser Glu 1 § 20 15

His ftsp fhr Xle Lys Thr Tíar 61« Asn &sn Glu vai Pro Tfcr As:» ais 20 25 ' 30 v&l Gin Tyr Pito Leu Ala. Glu Thr Pm As» Pr© Thr teu Glu Asp Lsu 35 40 45

As» Tyr Lye ®Lu Ph® Aeg MSfc Thr Ale Asp As» As» Thr Glu Ale 50 55 00 teu Asp Ser Ser Tfer tht Lys Asp Vai He Gin Lys Gly xle Ser v«l 65 T0 75 80

85 80 SS

Vai Ser Phe Tyr Thr Asm Pfee te» Asa Thr lie Trp Pxo Ser Glu Asp 100 1ÒS .1.10

Pm Trp Lys Ala pise Me% Glu Gin vai Glu Ala teu N*r Asp Útn tys 115 1.30 lã 5

Xle Ala .Aap Tyr Ala Lya Asa Ly$t Ala .Leu Ala Glu Leu. 61» Gly Leu 08 235 140

*45 ISO 1.55 ISO

As» Pr© Vai Ser Ser Arg Aa» Pr» Eis Ser 61» Gly Arg Há A*g Glu 165 i?£s X75 teu Phe Ser *31» Ala ola ser His Phe arg as» ser ftet P*o Ser Ph® 180 185 1:98

Ais lie Ser Gly Tyr Glu Vai teu Phe teu Thr Thr Tyr Ala 01» Ala 1.9 £ 20 0 205

Ala A»n Thr Eis teu Phe teu teu Lys Asp Ala Gl» Xle Tyr Gly 61» 210 215 220 «l» Trp Gly Tyr Glu Lys Glu. Asp lia Ala GCl.u Ph« Tyr Lys btg Gin 22§ 23S 21S 248 teu te® teu Thr Gin Glu Tyr Thr Mp Eis Cys Vai 2>ys Trp Tyr Asn 245 250 255 V»1 Gly teu ftap Lys teu Avg Gly Ser Ser Tyr Glu Ser Trp Vai As» MB 270 552 ΡΕ1040192

Pfc* Aa» Tys Asg Árg Glu Mefc Th» &*·« Thr V*1 jU*« Asp Leu lie 2?S 2âQ 385

Ala A#» 290 phe Pra It&U Tyr • Aap 293 1 Val Arg Leu Tyr : Fro 3S0 lya Gl« val l^y-ss· Thr 3.05 051U Lsxs Th r Arg A8p 3.1 Õ val Xj»í3 Thr &$sp Fr© 315 flé Vai G-ly val Asn 320 Asa L8U Arg Sly 32S Gly Thr Thr phe sor 3l0 Astt ile GlU AS.U Tyr 33S Ils Arg Lys Fico His 340 fceu Pfee Asp Tyr LéU 345 Mie .¾¾ Ils ©lis Phe 3S9 His Thr ATS? vfo& £$'?:« PM 355 íS.ly Tyw- Ty·^ <3-:.y 350 Ae« Asp Ser Fhe A^n 3SS jyr Trp Ser Oiy Asti 379 xyr vai ser Thr Arg 375 Fr® Ser JXe &Y Ser 380 ΑΒΠ Asp Ile ile Thr 385 Ser pr© Pfee Tyr Qly 39S Asm lys ser Ser 0ÍU 3 95 Frç» Val filo Ash Leu 400 ©3.U í?hs A8Í3S Gsly ©lu 40¾ L-ye Val Tyr Arg .&lí& 410 Val AâM Thr ASM 4X5 Leti Ale Vai Trp 5?r® 42:6 Se» Ala. Val Tyr Ser 42S Dly Val Thr i*v» Val 430 Dl ϊχ Phe Ser Sln Ty? Asri 435 j&íS]â· Gla Thr 440 ©lu Ala Ser Thr Gla 445 Thr Tyr Asp .Sèr Ly:S 45Ô A»g Aôf! VlSl Gly Ala 4SS val Ser Trp A#p 3a r 45Ò 11¾ Asp Olrs Leu p.rís Fr© Glu Thr Thr Asp ©Ia 470 Fr© L®U Oiti Lys 475 siy Tyr Ser Hia Sln 480

Pm Vai i«eu Thr Trp Th» Ki& %,ys S«c vai Asp PH® Pha as« Μβ& Xla §00 SOS $10

Asp Se» Ay» Lys li« Thr ei» 'Leu Pro l*eo Val &γ» ala Tyr Ays l*e« SIS 520 S2S <?ln â«» &ly Ala Sei» Val Vai Ala 6ly Pr® Argi Phe Th»· ©iy ®ly Asp 538 531 £46 Π8 Ile úln Qys Tht alu Aso Siy Ser Ma Me Thr ils Ty* Vai Thr S45 $88 SSS £S0 P»« Aep Val Ser Tyr Se» dia Ly» Tyr· Arg Ale &rg il* Hls Tyr Ala SôS 570 575 553 ΡΕ1040192

Sar TSr Ser 01:¾ II» Thr Phe f&r Lati ser L@a &&p Qly Ma Fro p] ssô sts sso Qía Tyr Tyz Pfess Asp Lys Thr Ile &sn Lys oly Asp Tfer &eu T&r SFS -soo eos

Tyr Aon Ser PJm» As» L&u Alá Ist P&« Mmx Th* Pro Ph® 31¾ Leu §er §10 &15 §20

Qly As» Ase Leu siã llfe Sly Vai. Th* -GXy Leú sar Ais Qly Asp Ly& €2§ §30 §3·*» È4&

Vai Tyx íls? Aap I»ys Jle ele Fhfâ II $ pxú ¥&X Asa §45 g,50

Claims

ΡΕ1040192 1 REIVINDICAÇÕES 1. Um polipeptídeo Cry3Bb modificado de B. thuringiensis compreendendo uma a cinco alterações de aminoácidos na sequência primária do polipeptídeo Cry3Bb de SEQ ID NO:98, em que as referidas alterações de aminoácidos são seleccionadas entre: Aspl03 é substituída por ácido glutâmico; Thrl54 é substituída por glicina ou fenilalanina; Prol55 é substituída por histidina; Leul56 é substituída por histidina; Leul58 é substituída por arginina; SerlôO é substituída por asparagina; Lyslôl é substituída por prolina; Argl62 é substituída por histidina; Aspl65 é substituída por glicina; Lysl89 é substituída por glicina; Ser223 é substituída por prolina; Tyr230 é substituída por leucina ou serina; His231 é substituída por arginina, asparagina, serina ou treonina; Thr241 é substituída por serina; Tyr287 é substituída por fenilalanina; Asp288 é substituída por asparagina; Ile289 é substituída por treonina ou valina; Arg290 é substituída por asparagina, leucina ou valina; Leu291 é substituída por arginina; Tyr292 é substituída por fenilalanina; Ser293 é substituída por arginina ou prolina; Phe305 é substituída por serina; Ser311 é substituída por alanina, isoleucina ou treonina; Leu312 é substituída por prolina ou valina; Asn313 e substituída por arginina, histidina, treonina ou valina; Thr314 é substituída por asparagina; Leu315 é substituída por prolina; Gln316 é substituída por ácido aspártico, leucina, metionina ou 2 ΡΕ1040192 triptofano; Glu317 é substituída por alanina, asparagina, lisina ou valina, Tyr318 é substituída por cisteína; Gln348 é substituída por arginina; Val365 é substituída por alanina; e Alal04 é eliminada. 2. 0 polipeptídeo da reivindicação 1, em que Thrl54 é substituída por fenilalanina, Prol55 é substituída por histidina, Leul56 é substituída por histidina e Leul58 é substituída por arginina. 3. o polipeptídeo da reivindicação 1, em que Tyr230 é substituída por leucina e His231 é substituída por serina. 4. 0 polipeptídeo da reivindicação 1, em que Ser223 é substituída por prolina e Tyr230 é substituída por serina. 5. 0 polipeptídeo da reivindicação 1, em que His231 é substituída por arginina. 6. 0 polipeptídeo da reivindicação 1, em qe His231 é substituída por asparagina e Thr241 é substituída por serina. 7. 0 polipeptídeo da reivindicação 1, em que His231 é substituída por treonina. 0 polipeptídeo da reivindicação 1, em que 3 ΡΕ1040192 Arg290 é substituída por asparagina. 9. 0 polipeptídeo da reivindicação 1, em que Ser311 é substituída por leucina, As313 é substituída por treonina e Glu318 é substituída por lisina. Ser311 é 10. 0 polipeptídeo da reivindicação 1, e que substituída por treonina, Glu317 é substituída por lisina e Tyr318 é substituída por cisteína. 11. 0 polipeptídeo da reivindicação 1, em que Ser311 é substituída por alanina, Leu312 é substituída por valina e Gln316 é substituída por triptofano. 12. 0 polipeptídeo da reivindicação 1, em que His231 é substituída por arginina, Ser311 é substituída por leucina, Asn313 é substituída por treonina e Glu317 é substituída por lisina. Ser311 é 13. 0 polipeptídeo da reivindicação 1, em que substituída por treonina, Leu312 é substituída por prolina, Asn313 é substituída por treonina e Glu317 é substituída por asparagina. 14. 0 polipeptídeo da reivindicação 1, em que Ser311 é substituída por alanina e Gln316 é substituída por ácido aspártico. 15. 0 polipeptídeo da reivindicação 1, em que 4 ΡΕ1040192 Ile289 é substituída por treonina, Leu291 é substituída por arginina, Tyr292 é substituída por fenilalanina e Ser293 é substituída por arginina. 16. 0 polipeptídeo da reivindicação 1, em que His231 é substituída por arginina e Ser311 é substituída por leucina. 17. 0 polipeptídeo da reivindicação 1, em que Ser311 é substituída por isoleucina. 18. 0 polipeptídeo da reivindicação 1, em que Ser311 é substituída por isoleucina e Asn313 é substituída por histidina. 19. 0 polipeptídeo da reivindicação 1, em que Asn313 é substituída por valina, Thr314 é substituída por asparagina, Gln316 é substituída por metionina e Glu317 é substituída por valina.
20. O polipeptídeo da reivindicação 1, em que Asn313 é substituída por arginina, Leu315 é substituída por prolina, Gln316 é substituída por leucina e Glu317 é substituída por alanina.
21. O polipeptídeo da reivindicação 1, em que Tyr287 é substituída por fenilalanina, Asp288 é substituída por asparagina e Arg290 é substituída por leucina. 5 ΡΕ1040192 22. 0 polipeptídeo da reivindicação 1, em que Arg290 é substituída por valina. 23. 0 polipeptídeo da reivindicação 1, em que Aspl65 é substituída por glicina. 24. 0 polipeptídeo da reivindicação 1, em que Serl60 é substituída por asparagina, Lyslôl é substituída por prlina, Argl62 é substituída por histidina e Aspl65 é substituída por glicina. 25. 0 polipeptídeo da reivindicação 1, em que Ile289 é substituída por valina e Ser293 é substituída por prolina.
26. Um polipeptídeo Cry3Bb modificado de B. thuringiensis tendo as seguintes alterações de aminoácidos na sequência primária do polipeptídeo Cry3Bb de SEQ ID NO:98: Serl60 é substituída por asparagina, Lysl61 é substituída por prolina, Argl62 é substituída por histidina, Aspl65 é substituída por glicina, Ile289 é substituída por valina e Ser293 é substituído por prolina. 27. 0 polipeptídeo da reivindicação 1, em que Aspl03 é substituída por ácido glutâmico e Alal04 é eliminada. 28. 0 polipeptídeo da reivindicação 1, em que Lysl89 é substituída por glicina. ΡΕ1040192
29. Um polipeptídeo Cry3Bb modificado de B. thuringiensis tendo as seguintes alterações de aminoácidos na sequência primária do polipeptídeo Cry3Bb de SEQ ID NO:98: Aspl03 é substituída por ácido glutâmico, Alal04 é eliminada, Serl60 é substituída por asparagina, Lyslôl é substituída por prolina, Argl62 é substituída por histidina e Aspl65 é substituída por glicina.
30. Um polipeptídeo Cry3Bb modificado de B. thuringiensis tendo as seguintes alterações de aminoácidos na sequência primária do polipeptídeo Cry3Bb de SEQ ID NO:98: Aspl03 é substituída por ácido glutâmico, Alal04 é eliminada, Thrl54 é substituída por fenilalanina, Prol55 é substituído por histidina, Leul56 é substituída por histidina e Leul58 é substituída por arginina.
31. O polipeptídeo da reivindicação 1, em que Aspl65 é substituída por glicina, Ser311 é substituída por treonina e Glu317 é substituída por lisina.
32. Um polipeptídeo Cry3Bb modificado de B. thuringiensis tendo as seguintes alterações de aminoácidos na sequência primária do polipeptídeo Cry3Bb de SEQ ID NO:98: Aspl65 é substituída por glicina, Ile289 é substituída por valina, Ser293 é substituída por prolina, Phe305 é substituída por serina, Ser311 é substituída por alanina, Leu312 é substituída por valina, Gln316 é substituída por triptofano, Gln348 é substituída por arginina e Val365 é substituída por alanina. 7 ΡΕ1040192 33. 0 polipeptídeo da reivindicação 1, em que Ile289 é substituída por valina, Ser293 é substituída por prolina e Gln348 é substituída por arginina. 34. 0 polipeptídeo da reivindicação 1, em que Aspl65 é substituída por glicina e Ser311 é substituída por leucina. 35. 0 polipeptídeo da reivindicação 1, em que Gln348 é substituída por arginina. 36. 0 polipeptídeo da reivindicação 1, em que Aspl65 é substituída por glicina, His231 é substituída por arginina, Ser311 é substituída por leucina, Asn313 é substituída por treonina e Glu317 é substituída por lisina. 37. 0 polipeptídeo de qualquer uma das reivindicações anteriores, o qual compreende uma sequência de aminoácidos seleccionada de entre SEQ ID NO:2, SEQ ID NO:4, SEQ ID NO: 6 , SEQ H u o co SEQ ID NO: 10, SEQ ID NO: 12, SEQ ID NO: 14, SEQ ID NO:16, SEQ ID NO:18, SEQ ID NO : 20, SEQ ID NO: 22, SEQ ID NO : 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO : 32, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 38, SEQ ID NO : 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 46, SEQ ID NO : 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO : 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO : 64, SEQ ID NO: 66, SEQ ID NO: 68, SEQ ID NO: 70, SEQ ID NO: 100, SEQ ID NO:1 02 e SEQ ID NO: 108 . ΡΕ1040192 38. 0 polipeptídeo de qualquer uma das reivindicações anteriores, em que o referido polipeptídeo é codificado por uma sequência de ácido nucleico seleccionada de entre SEQ ID N0:1, SEQ ID N0:3, SEQ ID N0:5, SEQ ID N0:7, SEQ ID NO: 9 , SEQ ID NO:11, SEQ ID NO: 13, SEQ ID NO: 15, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO:21, SEQ ID NO : 23, SEQ ID NO: 25, SEQ ID NO : 2 7 , SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO : 35 , SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO : 43 , SEQ ID NO: 45, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO : 51 , SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO : 59 , SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO:99, SEQ ID NO :io: L ou SEQ ID NO:10 7.
39. Uma composição compreendendo uma quantidade eficaz como insecticida do polipeptídeo Cry3Bb modificado da reivindicação 1, 37 ou 38.
40. A composição da reivindicação 39, compreendendo entre 0,5% e 99% por peso do polipeptídeo Cry3Bb modificado.
41. A composição da reivindicação 39 ou 40 que é obtida por um processo compreendendo o passo de: (a) cultura de uma célula de Bacillus thurin-giensis NRRL B-21744, NRRL B-21745, NRRL B-21746, NRRL B-21747, NRRL B-21748, NRRL B-2174, NRRL B-21750, NRRL B- 9 ΡΕ1040192 21751, NRRL B-21752, NRRL B-21753, NRRL B-21754, NRRL B- 21755, NRRL B-21756, NRRL B-21757, NRRL B-21758, NRRL B- 21759, NRRL B-21760, NRRL B-21761, NRRL B-21762, NRRL B- 21763, NRRL B-21764, NRRL B-21765, NRRL B-21766, NRRL B- 21767, NRRL B-21768, NRRL B-21769, NRRL B-21770, NRRL B- 21771, NRRL B-21772, NRRL B-21773, NRRL B-21774, NRRL B- 217775, NRRL B-21776, NRRL B-21777, NRRL B-21778, NRRL B- 21779 ou EG11098 em condições de cultura eficazes para produzir um polipeptídeo insecticida; e b) obtenção de um polipeptídeo insecticida a partir da referida célula.
42. A composição de qualquer uma das reivindicações 39 a 41, compreendendo uma célula de B. thuringiensis NRRL B-21744, NRRL B-21745, NRRL B-21746, NRRL B-21747, NRRL B- 21748 , NRRL B- 2174, NRRL B-21750, : NRRL B-21751, NRRL B-21752 , NRRL B-21753, NRRL B-21754, NRRL B-21755, NRRL B- 21756, NRRL B-21757, NRRL B-21758, NRRL B-21759, NRRL B- 21760, NRRL B-21761, NRRL B-21762, NRRL B-21763, NRRL B- 21764, NRRL B-21765, NRRL B-21766, NRRL B-21767, NRRL B- 21768, NRRL B-21769, NRRL B-21770, NRRL B-21771, NRRL B- 21772, NRRL B-21773, NRRL B-21774, NRRL B-217775, NRRL B- 21776, NRRL B-21777, NRRL B 1-21778 ou NRRL B-21779.
43. A composição de qualquer uma das reivindicações 39 a 42, em que a referida composição compreende um extracto celular, suspensão celular, fracção proteica, fracçao de cristal, cultura celular, homogenato celular 10 ΡΕ1040192 lisado celular, sobrenadante celular, filtrado celular ou sedimento celular de uma célula de Bacillus thuringiensis NRRL B- -21744, NRRL B-21745, NRRL B-21746, NRRL B-21747, NRRL B- 21748 , NRRL B-2174, NRRL B-21750, NRRL B-21751, NRRL B-21752 , NRRL B-21753, NRRL B-21754 , NRRL B-21755, NRRL B- 21756, NRRL B-21757, NRRL B-21758, NRRL B-21759, NRRL B- 21760, NRRL B-21761, NRRL B-21762, NRRL B-21763, NRRL B- 21764, NRRL B-21765, NRRL B-21766, NRRL B-21767, NRRL B- 21768, NRRL B-21769, NRRL B-21770, NRRL B-21771, NRRL B- 21772, NRRL B-21773, NRRL B-21774, NRRL B-217775, NRRL B- 21776, NRRL B-21777, NRRL B-21778, NRRL B -21779 ou EG11098.
44. A composição de qualquer uma das reivindicações 39 a 43, formuladas como um pó, qrânulos, liquido pulverizado, emulsão, colóide ou solução.
45. A composição de qualquer uma das reivindicações 39 a 44, em que a referida composição é preparada por secagem, liofilização, homogenização, emulsionação, evaporação, separação, extracção, filtração, centrifugação, sedimentação, diluição, cristalização ou concentração.
46. Um polinucleótido compreendendo uma região isolada da sequência que codifica o polipeptídeo de qualquer uma das reivindicações 1 a 38.
47. O polinucleótido da reivindicação 46, consistindo em DNA, cDNA, rRNA ou mRNA. 11 ΡΕ1040192 48. 0 polinucleótido da reivindicação 46 ou 47, em que o referido polinucleótido tem 2000 a 10000 nucleótidos de comprimento, de preferência entre 3000 e 8000 nucleótidos de comprimento.
49. O polinucleótido de qualquer uma das reivindicações 46 a 48, em que a referida região da sequência isolada está operacionalmente ligada a um promotor, o referido promotor expressando a referida região da sequência.
50. O polinucleótido de qualquer uma das reivindicações 46 a 49, em que a referida região da sequência isolada está operacionalmente ligada a um promotor hete— rólogo.
51. O polinucleótido de qualquer uma das reivindicações 46 a 50, em que a referida região da sequência isolada está operacionalmente ligada a um promotor que é expresso numa planta.
52. O polinucleótido de qualquer uma das reivindicações 46 a 51, em que a referida região da sequência isolada está operacionalmente ligada a um promotor constitutivo, induzivel ou especifico de tecido.
53. Um vector compreendendo o polinucleótido de qualquer uma das reivindicações 46 a 52, ou um polinucleótido que codifica o polipeptídeo de qualquer uma das reivindicações 1 a 38. 12 ΡΕ1040192 54. 0 vector da reivindicação 53, definido como um plasmideo, cosmideo, fagomideo, fago, virus ou baculo-virus. 55. 0 vector da reivindicação 53 ou 54, trans formado e replicado num hospedeiro procariótico ou euca-riótico.
56. Um virus compreendendo o polipeptídeo de qualquer uma das reivindicações 1 a 38, ou o polinucleótido de qualquer uma das reivindicações 46 ou 52.
57. Uma célula hospedeira transformada compreendendo o polipeptídeo de qualquer uma das reivindicações 1 a 38, o polinucleótido de qualquer uma das reivindicações 46 a 52, o vector de qualquer uma das reivindicações 53 a 55, ou o vírus da reivindicação 56.
58. A célula hospedeira transformada da reivindicação 57, ainda definida como uma célula procariótica ou eucariótica.
59. A célula hospedeira transformada da reivindicação 57 ou 58, em que a referida célula procariótica é uma célula de eubactéria, arqueabactéria ou cianobactéria, ou em que a referida célula eucariótica é uma célua animal, de fungo ou vegetal. 13 ΡΕ1040192
60. A célula hospedeira transformada de qualquer uma das reivindicações 57 a 59, em que a referida célula é uma célula de E. coli, B. thuringiensis, A. tumefaciens, B. subtilis, B. megaterium, B. cereus, Salmonella spp., ou Pseudomonas spp.
61. A célula hospedeira transformada de qualquer uma das reivindicações 57 a 60, em que a referida célula . é seleccionada de entre : B. thuringiensis NRRL B-21744, NRRL B-21745 , NRRL B-21746 , NRRL B-21747 , NRRL B-21748, NRRL B- 217 4, NRRL B-21750, NRRL B-21751, NRRL B-21752, NRRL B- 21753, NRRL B-21754, NRRL B-21755, NRRL B-21756, NRRL B- 21757, NRRL B-21758, NRRL B-21759, NRRL B-21760, NRRL B- 21761, NRRL B-21762, NRRL B-21763, NRRL B-21764, NRRL B- 21765, NRRL B-21766, NRRL B-21767, NRRL B-21768, NRRL B- 21769, NRRL B-21770, NRRL B-21771, NRRL B-21772, NRRL B- 21773, NRRL B-21774, NRRL B-217775, NRRL B-21776, NRRL B- 21777, NRRL B-21778 e NRRL B-21779.
62. A célula hospedeira transformada da reivindicação 59, em que a referida célula vegetal é uma célula de cereal, árvore, legume, fibra, vegetal, furto, baga, noz, citrino, graminea, cacto, suculenta ou planta ornamental .
63. A célula hospedeira transformada da reivindicação 62, em que a referida célula vagetal é uma célula de milho, arroz, tabaco, alfafa, soja, sorgo, batata, tomate, linho, canola, girassol, algodão, paina, trigo, aveia, cevada ou centeio. 14 ΡΕ1040192
64. A célula hospedeira transformada de qualquer uma das reivindicações 57 a 63, em que o referido polinu-cleótido é introduzido na referida célula através de um vector,vírus, cosmídeo, fagomídeo, fago, plasmídeo ou através de electroporação, transformação, conjugação, bombardeamento com microprojécteis, injecção directa de DNA, transferência de DNA nu, transformação ou transfecção.
65. Uma planta transgénica compreendendo o poli-peptídeo de qualquer uma das reivindicações 1 a 38, o polinucleótido de qualquer uma das reivindicações 46 a 52, o vector de qualquer uma das reivindicações 53 a 55, o vírus da reivindicação 56, ou a célula hospedeira de qualquer uma das reivindicações 57 a 64.
66. A planta transgénica da reivindicação 65, tendo incorporado no seu genoma um polinucleótido selec-cionado que codifica o polipeptídeo de qualque ruma das reivindicações 1 a 38.
67. A planta transgénica da reivindicação 65 ou 66, em que a referida planta é cereal, árvore, legume, fibra, vegetal, furto, baga, noz, citrino, gramínea, cacto, suculenta ou planta ornamental. sorgo,
68. A planta transgénica de qualquer uma das reivindicações 65 a 67, em que a referida planta é uma planta de milho, arroz, tabaco, alfafa, soja, 15 ΡΕ1040192 batata, tomate, linho, canola, girassol, algodão, paina, trigo, aveia, cevada ou centeio.
69. Uma progénie de qualquer uma das gerações da planta transgénica de qualquer uma das reivindicações 65 a 68, a referida progénie compreendendo o polipeptideo, o polinucleótido, o vector, o vírus ou a célula hospedeira como definido na reivindicação 65 ou 66.
70. Uma semente de qualquer uma das gerações da planta transgénica de qualquer uma das reivindicações 65 a 68, a referida semente compreendendo o polipeptideo, o polinucleótido, o vector, o vírus ou a célula hospedeira como definido na reivindicação 65 ou 66.
71. Uma semente de qualquer uma das gerações da progénie da reivindicação 69, a referida semente compreendendo o polipeptideo, o polinucleótido, o vector, o vírus ou a célula hospedeira como definido na reivindicação 66 ou 6 7.
72. A planta transgénica da reivindicação 65, que é obtida através do crescimento da semente da reivindicação 70 ou 71.
73. Um método para a morte de um insecto cole-óptero, o referido método compreendendo o passo de contacto do referido insecto com uma quantidade eficaz em termos de insecticida do polipeptideo modificado da reivindicação 1. 16 ΡΕ1040192
74. Um método de controlo de uma população de insectos coleópteros, o referido método compreendendo o passo de colocar no ambiente da referida população de insectos, uma quantidade eficaz como insecticida do poli-peptídeo modificado da reivindicação 1. 75. 0 método da reivindicação 73 ou 74, em que o referido polipeptídeo modificado é obtido a partir de um extracto celular, suspensão de células, fracção proteica, fracção do cristal, cultura celular, homogenato de células, lisado celular, sobrenadante celular, filtrado celular ou sedimento de células de uma célula de B. thuringiensis NRRL B-21744 , NRRL B-21745, NRRL B-21746 , NRRL B-21747, NRRL B- 21748, NRRL B-2174, NRRL B-21750, NRRL B-21751, NRRL B- 21752, NRRL B-21753, NRRL B-21754, NRRL B-21755, NRRL B- 21756, NRRL B-21757, NRRL B-21758, NRRL B-21759, NRRL B- 21760, NRRL B-21761, NRRL B-21762, NRRL B-21763, NRRL B- 21764, NRRL B-21765, NRRL B-21766, NRRL B-21767, NRRL B- 21768, NRRL B-21769, NRRL B-21770, NRRL B-21771, NRRL B- 21772, NRRL B-21773, NRRL B-21774, NRRL B-217775, NRRL B- 21776, NRRL B-21777, NRRL B ,-21778 e NRRL B -21779. 76. 0 método de qualquer uuma das reivindicações 73 a 75, em que o referido polipeptídeo modificado é colocado no referido ambiente através de vaporização, empoei-ramento, aspersão, enxaguamento, arejamento, nebulização, atomização, injecção do solo, cobertura do solo com mosaicos, revestimento de sementes ou revestimento de plântulas. 17 ΡΕ1040192 77. 0 método de qualquer uma das reivindicações 73 a 76, em que o referido polipeptídeo modificado é formulado como um pó, qrânulos, liquido vaporizado, emulsão, colóide ou solução. 78. 0 método de qualquer uma das reivindicações 73 a 77, em que o referido polipeptideo é preparado por secagem, liofilização, homogenização, emulsificação, evaporação, separação, extracção, filtração, centrifugação, sedimentação, diluição, cristalização ou concentração.
79. Um método de preparação de uma planta trans-génica resistente a Coleópteros, compreendendo os passos de: (a) transformação de uma célula vegetal com um polinucleótido compreendendo uma região da sequência selec-cionada que codifica o polipeptideo da reivindicação 1 ou 39, em que a referida região da sequência está operacionalmente ligada a um promotor que expressa a referida região; e (b) geração a partir da referida célula vegetal de uma planta transgénica que compreende a referida região da sequência seleccionada e que expressa o referido polipeptideo .
80. Um método para matar um insecto coleóptero, compreendendo a alimentação do referido insecto com uma 18 ΡΕ1040192 célula vegetal transformada com um polinucleótido que codifica uma sequência de aminoácidos de um polipeptídeo como definido na reivindicação 37. 81. 0 método da reivindicação 80, em que o referido insecto é morto pela ingestão de uma porção de uma planta transgénica que compreende a referida célula transformada .
82. Um método de preparação de uma semente vegetal resistente ao ataque por insectos coleópteros, o referido método compreendendo os passos de: (a) transformação de uma célula vegetal com um segmento de ácido nucleico compreendendo um polinucleótido que codifica uma sequência de aminoácidos de um polipeptídeo como definido na reivindicação 37 para produzir uma célula vegetal transformada; (b) crescimento da referida célula vegetal transformada em condições eficazes para produzir uma planta transgénica a partir da referida célula; e (c) obtenção a partir da referida planta transgénica, uma semente resistente ao ataque pelo referido insecto Coleóptero.
83. O método da reivindicação 82, em que o passo (a) compreende a transformação da referida célula vegetal 19 ΡΕ1040192 por electroporação, transfecção, introdução de DNA nu, geração de protoplastos, transferência directa do DNA para pólen, embrião ou célula vegetal pluripotente, transformação mediada por Agrobacterium, bombardeamento de partículas ou bombardeamento com microprojécteis. 84. 0 método da reivindicação 82 ou 83, em gue o passo (b) compreende a geração de células vegetais pluri-potentes a partir da referida célula vegetal transformada.