BRPI0207770B1 - Enzimas tendo atividade de alfa amilase, preparação compreendendo as mesmas, polinucleotídeos codificando as referidas enzimas, vetores, células hospedeiras, métodos de produção das referidas enizimas, método de hidrolisar uma ligação de amido, produzir um xarope, liquefação do amido, tratamento de fibras lignocelulósicas, para desengomar o tecido, lavar um objeto, detergente aditivo - Google Patents

Enzimas tendo atividade de alfa amilase, preparação compreendendo as mesmas, polinucleotídeos codificando as referidas enzimas, vetores, células hospedeiras, métodos de produção das referidas enizimas, método de hidrolisar uma ligação de amido, produzir um xarope, liquefação do amido, tratamento de fibras lignocelulósicas, para desengomar o tecido, lavar um objeto, detergente aditivo Download PDF

Info

Publication number
BRPI0207770B1
BRPI0207770B1 BRPI0207770B1 BR PI0207770 B1 BRPI0207770 B1 BR PI0207770B1 BR PI0207770 B1 BRPI0207770 B1 BR PI0207770B1
Authority
BR
Brazil
Prior art keywords
gly
asp
tyr
ala
vai
Prior art date
Application number
Other languages
English (en)
Publication date

Links

Description

(54) Título: ENZIMAS TENDO ATIVIDADE DE ALFA AMILASE, PREPARAÇÃO COMPREENDENDO AS MESMAS, POLINUCLEOTIDEOS CODIFICANDO AS REFERIDAS ENZIMAS, VETORES, CÉLULAS HOSPEDEIRAS, MÉTODOS DE PRODUÇÃO DAS REFERIDAS ENIZIMAS, MÉTODO DE HIDROLISAR UMA LIGAÇÃO DE AMIDO, PRODUZIR UM XAROPE, LIQUEFAÇÃO DO AMIDO, TRATAMENTO DE FIBRAS LIGNOCELULÓSICAS, PARA DESENGOMAR O TECIDO, LAVAR UM OBJETO, DETERGENTE ADITIVO (73) Titular: BASF ENZYMES LLC. Endereço: 3550 John Hopkins Court, San Diego, Califórnia 92121, ESTADOS UNIDOS DA AMÉRICA(US) (72) Inventor: WALTER CALLEN; TOBY RICHARDSON; GERHARD FREY; MATGORZATA SLUPSKA; JANNE S. KEROVUO; JAY M. SHORT; ERIC J. MATHUR; KEVIN GRAY
Código de Controle: A6305A9742725053 0B63EA91973E9FB6
Prazo de Validade: 10 (dez) anos contados a partir de 02/10/2018, observadas as condições legais
Expedida em: 02/10/2018
Assinado digitalmente por:
Liane Elizabeth Caldeira Lage
Diretora de Patentes, Programas de Computador e Topografias de Circuitos Integrados
Relatório Descritivo da Patente de Invenção para ENZIMAS TENDO ATIVIDADE DE ALFA AMILASE, PREPARAÇÃO COMPREENDENDO AS MESMAS, POLINUCLEOTÍDEOS CODIFICANDO AS REFERIDAS ENZIMAS, VETORES, CÉLULAS HOSPEDEIRAS, MÉTODOS DE PRODUÇÃO DAS REFERIDAS ENIZIMAS, MÉTODO DE HIDROLISAR UMA LIGAÇÃO DE AMIDO, PRODUZIR UM XAROPE, LIQUEFAÇÃO DO AMIDO, TRATAMENTO DE FIBRAS LIGNOCELULÔSICAS, PARA DESENGOMAR O TECIDO, LAVAR UM OBJETO, DETERGENTE ADITIVO”.
Dados do Pedido Relacionado
Este pedido reivindica prioridade do Pedido Provisório U.S. no 60/270.495, depositado em 21 de fevereiro de 2001, nova pendência; Pedido Provisório U.S. n° 60/270.496, depositado em 21 de fevereiro de 2001, nova pendência; e Pedido Provisional U.S. n° 60/291.122, depositado em 14 de maio de 2001, nova pendência, todos dos quais estão aqui incorporados por referência em sua totalidade.
Campo da Invenção
Esta invenção refere-se, em geral, a enzimas, polinucleotídeos codificando as enzimas, o uso de tais polinucleotídeos e polipeptídeos, e mais especificadamente a enzimas tendo atividade de alfa amilase.
Fundamento
O amido é um carboidrato complexo freqüentemente encontrado na dieta humana. A estrutura do amido é polímeros de glicose ligados por ligações glicosídicas de a-1,4 e a-1,6, Amilase é uma enzima que catalisa a hidrólise de amidos nos açúcares. Amilase hidrolisa ligações a-1,4 glicosídicas internas no amido, basicamente aleatoriamente, para produzir malto-dextrinas de peso molecular mais baixo. A ruptura do amido é importante no sistema digestivo e comercial mente. Amilases são de considerável valor comercial, sendo empregada nos estágios iniciais (liquefação) do processo do amido; na moagem de milho a úmido; na produção de álcool; como agentes limpadores em matrizes detergentes; na indústria têxtil para desengomar
Segue-se folha 1 a
1a amido; em aplicações para cozedura; na indústria de bebidas; em campos petrolíferos nos processos de perfuração; na coloração de papel reciclado; e em alimentos para animais.
As amilases são produzidas por uma ampla variedade de micro5 organismos incluindo Bacillus e Aspergillus, com a maioria das amilases comerciais sendo produzidas a partir de fontes bacterianas tal como Bacillus licheniformis, Bacillus amyloliquefaciens, Bacillus subtilis, ou Bacillus stearto-
Figure BRPI0207770B1_D0001
Segue-se folha 2 thermophilus. Nos últimos anos, as enzimas em uso comercial têm sido aquelas de Bacillus licheniformis por causa de seu desempenho e estabilidade ao calor, pelo menos em pHs moderadamente alcalinos e neutros.
Em geral, o processamento de amido para frutose consiste de quatro etapas: liquefação do amido granular, sacarificação do amido liquidificado em dextrose, purificação, e isomerização para frutose. O objetivo de um processo de liquefação de amido é converter uma suspensão concentrada de grânulos de polímero de amido em uma solução de dextrinas de extensão de cadeia mais curta solúvel de viscosidade baixa. Esta etapa é essencial para manuseio conveniente com equipamento padrão e para conversão eficiente para glicose ou 103 de outros açúcares. Para liquefazer o amido granular, é necessário gelatinizar os grânulos aumentando-se a temperatura do amido granular para acima de cerca de 72°C. O processo de aquecimento instantaneamente separa os grânulos de amido insolúveis para produzir uma solução de amido solúvel em água. A solução de amido solubilizada é então liquefeita por amilase. Um grânulo de amido é composto de 69-74% de amilopectina; 26-31% de amilose; 11-14% de água; 0,2-0,4% de proteína; 0,5-0,9% de lipídeo; 0,05-0,1% de cinzas, 0,02%0,03% de fósforo, 0,1% de pentosana. Aproximadamente 70% de um grânulo é amorfo e 30% é cristalino.
Um processo de liquefação enzimática comum envolve ajustar o pH de uma pasta fluida de amido granular entre 6,0 e 6,5, o pH ótimo de alfa-amilase derivado de Bacillus licheniformis, com a adição de hidróxido de cálcio, hidróxido de sódio ou carbonato de sódio. A adição de hidróxido de cálcio tem a vantagem de também fornecer íons de cálcio que são conhecidos por estabilizar a alfa-amilase contra desativação. Na adição de alfaamilase, a suspensão é bombeada através de um jato a vapor para instantaneamente aumentar a temperatura entre 80 graus- 115 graus C. O amido é imediatamente gelatinizado e, devido à presença de alfa-amilase, despolimerizado através de hidrólise aleatória de uma ligação glicosídica (1-4) por alfa-amilase a uma massa fluida que seja facilmente bombeada.
Em uma Segunda variação para o processo de liquefação, alfa3 amilase é adicionada à suspensão de amido, a suspensão é mantida em uma temperatura de 80-100 graus C para parcialmente hidrolisar os grânulos de amido, e a suspensão de amido parcialmente hidrolisada é bombeada através de um jato em temperaturas em excesso de cerca de 105 graus C até completamente gelatinizar qualquer estrutura granular restante. Após o resfriamento do amido gelatinizado, uma segunda adição de alfa-amilase pode ser feita para ainda hidrolisar o amido.
Uma terceira variação deste processo é chamada o processo de moagem a seco. Na moagem a seco, todo o grão é moído e combinado com água. O germe é opcionalmente removido por separação por flutuação ou técnicas equivalentes. A mistura resultante, a qual contém amido, fibra, proteína e outros componentes do grão; é liquefeita empregando alfaamilase. A prática geral na técnica é para experimentar liquefação enzimática em uma temperatura inferior quando empregando o processo de moagem a seco. Geralmente, a liquefação em temperatura baixa é acreditada ser menos eficiente do que a liquefação em temperatura elevada na conversão de amido para dextrinas solúveis.
Tipicamente, após a gelatinização a solução de amido é mantida em uma temperatura elevada na presença de alfa-amilase até que um DE de 10-20 seja alcançado, freqüentemente um período de 1-3 horas. O equivalente de dextrose (DE) é o padrão da indústria para medir a concentração de açúcares de redução total, calculado como D-glicose em uma base de peso seco. O amido granular não hidrolisado tem um DE de virtualmente zero, ao mesmo tempo em que o DE de D-glicose é definido como 100.
A moagem a úmido de milho é um processo que produz óleo de milho, farinha de glúten, amido e alimento de glúten. A amilase alcalina é empregada na liquefação do amido e glicoamilase é empregada na sacarificação, produzindo glicose. Milho, uma semente do qual consiste de um revestimento de semente externa (fibra), amido, uma combinação de amido e glicose e o germe interno, é submetido a um processo de quatro etapas, que resulta na produção de amido. O milho é extraído, desgerminado, desfibrado, e finalmente o glúten é separado. No processo de extração, os solúveis
Figure BRPI0207770B1_D0002
Figure BRPI0207770B1_D0003
são reservados. O produto restante após a remoção dos solúveis é desgerminado, resultando na produção de óleo de milho e produção de massa de óleo, que é adicionada aos solúveis da etapa de extração. O produto restante é destibrado e os sólidos de fibra são adicionados à mistura de massa/solúveis. Esta mistura de sólidos de fibra, massa de óleo e solúveis forma um alimento de glúten. Após o desfibramento, o produto restante é submetido à separação de glúten. Esta separação resulta em um amido e farinha de glúten. O amido é então submetido à liquefação e sacarificação para produzir glicose.
O envelhecimento dos produtos cozidos (tal como pão) tem sido reconhecido como um problema que torna-se mais sério quando mais tempo existe entre o momento da preparação do produto de pão e o momento do consumo. O termo envelhecimento é empregado para descrever alterações indesejáveis pelo consumidor nas propriedades do produto de pão após ter deixado o forno, tal como um aumento da firmeza do miolo, uma diminuição da elasticidade do miolo, e alterações na crosta, que torna-se elástica e dura. A firmeza do miolo do pão aumenta ainda durante o armazenamento até um nível, que seja considerado como negativo. O aumento na firmeza do miolo, que é considerado como o aspecto mais importante do envelhecimento, é reconhecido pelo consumidor um longo tempo antes do produto de pão ter de outro modo tornado-se inadequado para o consumo.
Há uma necessidade na indústria para a identificação e otimização de amilases, úteis para vários usos, incluindo processos de liquefação de amido de milho comercial. Essa segunda geração de amilases de ácido oferecerá características de desempenho e/ou preparação melhoradas durante a industrialização de enzimas padrão de Bacillus licheniformis, por exemplo.
Há também uma necessidade da identificação e otimização de amilases tendo utilidade nos produtos de lavagem de louça automática (ADW) e detergente de lavanderia. Nos produtos de ADW, a amilase funcionará em pH 10-11 e em 45-60°C na presença de quelantes de cálcio e condições oxidativas. Para lavanderia, a atividade em pH 9-10 e 40°C na i
Figure BRPI0207770B1_D0004
matriz de detergente apropriada será requerida. As amilases são também úteis no descolamento de têxteis, processos de fermentação, modificação de amido no papel e indústria de polpa e outros processos descritos na técnica.
As publicações discutidas aqui são fornecidas somente para sua divulgação antes da data de depósito do presente pedido. Nada aqui é para ser construído como uma admissão de que a invenção não é intitulada para antecipar tal divulgação por virtude da invenção anterior.
Sumário da Invenção
A invenção fornece um ácido nucléico isolado tendo uma seqüência como apresentada nas SEQ ID N^:1,3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31,33, 35, 37, 39, 41,43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71,73, 75, 77, 79, 81,83, 85, 87, 89, 91,93, 95, 97, 99, 101,
103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131,
133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161,
163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191,
193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221,
223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251,
253, 255, 257, 259, 261, 263, 265, 267, 269, 271, 273, 275, 277, 279, 281,
283, 285, 287, 291,293, 295, 297, 299 e variantes destas tendo pelo menos 50% de identidade de seqüência para SEQ ID N^: 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51,53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97,
99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127,
129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157,
159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187,
189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217,
219, 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247,
249, 251, 253, 255, 257, 259, 261, 263, 265, 267, 269, 271, 273, 275, 277,
279, 281, 283, 285, 287, 291, 293, 295, 297, 299 e codificando polipeptídeos tendo atividade de alfa amilase.
Um aspecto da invenção é um ácido nucléico isolado tendo uma
Figure BRPI0207770B1_D0005
seqüência como apresentada nas SEQ ID NOs: 1, 3, 5, 9, 11, 13, 15, 17, 19, 21,23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59,
61,63, 6£ i, 67, 69, 7 Ί, 73 75, 77,7 '9, 81 , 83, 85, 8 i7, 89, 91, 93, S I5, 97 , 99,
101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129,
131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159,
161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189,
191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219,
221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249,
251, 253, 255, 257, 259, 261, 263, 265, 267, 269, 271, 273, 275, 277, 279,
281, 283, 285, 287, 291, , 293 , 295 s 297 299 (a seguir refe rido ι como se-
qüências de ácido nucléico do Grupo A), seqüências substancialmente idênticas a essas, e seqüências complementares a essas.
Outro aspecto da invenção é um ácido nucléico isolado incluindo pelo menos 10 bases consecutivas de uma seqüência apresentada nas seqüências de ácido nucléico do Grupo A, seqüências substancialmente idênticas a essas, e as seqüências complementares a essas.
Em ainda outro aspecto, a invenção fornece um ácido nucléico isolado codificando um polipeptídeo tendo uma seqüência como apresentada nas SEQ ID NOs: 2, 4, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138,
140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168,
170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198,
202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230,
232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256, 258, 260,
262, 264, 266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286, 288, 290,
292, 294, 296, 298 e variantes destas codificando um polipeptídeo tendo atividade de alfa amilase, e tendo pelo menos 50% de identidade de seqüência para tais seqüências.
Outro aspecto da invenção é um ácido nucléico isolado codificando um polipeptídeo ou um fragmento funcional deste tendo uma seqüên-
Figure BRPI0207770B1_D0006
cia como apresentada nas SEQ ID N2!: 2, 4, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104,
106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134,
136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164,
166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194,
196, 198, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226,
228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256,
258, 260, 262, 264, 266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286,
288, 290, 292, 294, 296, 298 (a seguir referido como seqüências de aminoácido do Grupo B), e seqüências substancialmente idênticas a estas.
Outro aspecto da invenção é um ácido nucléico isolado codificando um polipeptídeo tendo pelo menos 10 aminoácidos consecutivos de uma seqüência como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.
Em ainda outro aspecto, a invenção fornece um polipeptídeo purificado tendo uma seqüência como apresentada na seqüência de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.
Outro aspecto da invenção é um anticorpo purificado ou isolado que especificadamente se aglutina a um polipeptídeo tendo uma seqüência como apresentada nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas.
Outro aspecto da invenção é um anticorpo purificado ou isolado ou fragmento de aglutinação deste, que especificadamente se aglutina a um polipeptídeo tendo pelo menos 10 aminoácidos consecutivos de um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.
Outro aspecto da invenção é um método para preparar um polipeptídeo tendo uma seqüência como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. O método inclui introduzir um ácido nucléico codificando o polipeptídeo em uma célula hospedeira, onde o ácido nucléico é operavelmente ligado a um
Figure BRPI0207770B1_D0007
promotor, e cultivar a célula hospedeira sob condições que permitam a expressão do ácido nucléico.
Outro aspecto da invenção é um método para preparar um polipeptídeo tendo pelo menos 10 aminoácidos de uma seqüência como apre5 sentada nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas. O método inclui introduzir um ácido nucléico codificando o polipeptideo em uma célula hospedeira, onde o ácido nucléico é operavelmente ligado a um promotor, e cultivar a célula hospedeira sob condições que permitam a expressão do ácido nucléico, por meio da qual produzindo o polipeptideo.
Outro aspecto da invenção é um método para gerar uma variante incluindo obter um ácido nucléico tendo uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, seqüências substancialmente idênticas a estas, seqüências complementares às seqüências das seqüências do ácido nucléico do Grupo A, fragmentos compreendendo pelo menos 30 nucleotideos consecutivos das seqüências anteriores, e alterar um ou mais nucleotideos na seqüência para outro nucleotídeo, anular um ou mais nucleotideos. na seqüência, ou adicionar um ou mais nucleotídeos à seqüência.
Outro aspecto da invenção é um meio legível por computador tendo armazenado neste uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou uma seqüência de polipeptideo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a es25 tas.
Outro aspecto da invenção é um sistema de computador incluindo um processador e um dispositivo de armazenamento de dados onde o dispositivo de armazenamento de dados tem armazenado nele uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou um polipeptideo tendo uma seqüência como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.
Figure BRPI0207770B1_D0008
Outro aspecto da invenção é um método para comparar uma primeira seqüência com uma seqüência de referência onde a primeira seqüência é um ácido nucléico tendo uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou um código de polipeptídeo das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. O método inclui leitura da primeira seqüência e da seqüência de referência através do uso de um programa de computador que compara as seqüências; e determinar diferenças entre a primeira seqüência e seqüência de referência com o programa de computador.
Outro aspecto da invenção é um método para identificar uma característica em uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou um polipeptídeo tendo uma seqüência como apresentada nas seqüên15 cias de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, incluindo leitura da seqüência através do uso de um programa de computador que identifica características nas seqüências; e identificar as características na seqüência com o programa de computador.
Outro aspecto da invenção é um ensaio para identificar frag20 mentos ou variantes das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, que retêm a função enzimática dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. O ensaio inclui contatar o polipeptídeo das seqüências de aminoácido do Grupo B, seqüências substancialmente idênticas a estas, ou variante ou fragmento de polipeptídeo com uma molécula de substrato sob condições que permitam a variante ou fragmento de polipeptídeo funcionar, e detectar ou uma diminuição no nível do substrato ou um aumento no nível do produto de reação específico da reação entre o polipeptídeo e substrato por meio da qual identificando um fragmento ou variante de tais seqüências.
A invenção também fornece um processo para preparar uma massa ou um produto cozido preparado da massa que compreende adicio10 nar uma amilase da invenção à massa em uma quantidade que seja eficaz para retardar o envelhecimento do pão. A invenção também fornece uma massa compreendendo a referida amilase e uma pré-mistura compreendendo farinha junto com a referida amilase. Finalmente, a invenção fornece um cozimento enzimático aditivo, que contém a referida amilase.
O uso da amilase de acordo com a presente invenção fornece um efeito antienvelhecimento melhorado quando medido, por exemplo, pela firmeza menor do miolo, elasticidade retida do miolo, capacidade de corte melhorada (por exemplo, menos miolo, miolo não-pastoso), sabor ou aroma agradável.
Breve Descrição dos Desenhos
Os seguintes desenhos são ilustrativos das modalidades da invenção e não são pretendidos limitar o escopo da invenção como abrangido pelas reivindicações.
Figura 1 é um diagrama de bloco de um sistema de computador.
Figura 2 é um diagrama de fluxo ilustrando uma modalidade de um processo para comparar uma nova seqüência de proteína ou nucleotídeo com um banco de dados de sequências a fim de determinar os níveis de homologia entre a nova seqüência e as seqüências na base dos dados.
Figura 3 é um diagrama de fluxo ilustrando uma modalidade de um processo em um computador para determinar se duas seqüências são homólogas.
Figura 4 é um diagrama de fluxo ilustrando uma modalidade de um processo identificador 300 para detectar a presença de uma característica em uma seqüência.
Figura 5 é um gráfico mostrando a atividade residual de várias amilases seguindo aquecimento a 90°C durante 10 minutos no Exemplo 1.
Figura 6 é um gráfico que mostra a percentagem líquida de amido removido versus concentração de enzima em teste de lavagem ADW com alvejantes e quelantes.
Figura 7 é um gráfico mostrando a atividade da amilase de origem em pH 8, 40°C na formulação de ADW em 55°C.
Figure BRPI0207770B1_D0009
Figura 8 é um gráfico da leitura dos dados da tolerância de H2O2 das novas enzimas no Exemplo 4.
Figura 9 é um gráfico dos dados da temperatura e pH para uma seleção das amilases caracterizada. Figura 9a mostra os dados em pH 8 e 40°C e Figura 9b mostra os dados em pH 10 e 50°C.
Figura 10 apresenta as seqüências a serem empregadas em experiências de reagrupamento com as enzimas.
Figura 11 ilustra uma amostra da Curva Padrão do ensaio do
Exemplo 5.
Figura 12 ilustra o perfil da taxa de pH para SEQ ID NO: 127, que tem um pH ótimo neutro e SEQ ID NO: 211, que tem um pH ótimo ao redor de 10.
Figura 13 mostra a estabilidade de Diversas amilases vs. uma enzima comercial, como discutido no Exemplo 2.
Figura 14, mostra o alinhamento da seqüência de a-amilases hipotermofílicas, como apresentado no Exemplo 8. Figura 14a mostra um alinhamento das seqüências de amilase. SEQ ID NO: 81= um clone ambiental; piro = Pyrococcus sp. (cepa: KOD1), Tachibana, Y., Mendez., L., Takagi, M. e Imanaka, T., J. Ferment. Bioeng. 82: 224-232, 1996; piro2= Pyrococcus furiosus, Appl. Environ. Microbiol. 63(9): 3569-3576, 1997; Termo- Thermococcus sp; Termo2= Thermococcus hydrothermalis, Leveque, E e outros, Patente: França 98.05655 05-Maio-1998, não publicada. Figura 14b mostra o alinhamento da seqüência de aminoácido das seqüências identificadas: SEQ ID NO: 81; piro; SEQ ID NO: 75; SEQ ID NO: 77; SEQ ID NO: 83; SEQ ID NO: 85; termo2; SEQ ID NO: 79; termo; piro2; clone A; termo 3. Figura 14c mostra o alinhamento da seqüência de ácido nucléico correspondendo à seqüência de polipeptídeo das Figuras 5 e 6. SEQ ID NO: 81; SEQ ID NO: 75.; SEQ ID NO: 77; SEQ ID NO: 83; SEQ ID NO: 85; SEQ ID NO: 79; clone A; e SEQ ID NO: 73.
Figura 15 é uma árvore de ligação próxima para Thermococcales.
Figura 16 é a seqüência da invenção.
Figure BRPI0207770B1_D0010
Descrição Detalhada da Invenção
A presente invenção refere-se a amilases e polinucleotídeos codificando-os. Como empregado aqui, o termo amilase abrange enzimas tendo atividade de alfa amilase, por exemplo, alfa amilases capazes de hidrolisar ligações de a-1,4-glucano internas em polissacarídeos, incluindo enzimas de amilase capazes de hidrolisar o amido para açúcares em pHs alcalinos ou em pHs acídicos. Amilases da invenção são particularmente úteis nos processos de moagem a úmido de milho, detergentes, processos de cozimento, bebidas e em campo petrolífero (combustível de etanol). As amilases são também úteis no descolamento de têxteis, processos de fermentação, modificação de amido na indústria de polpa e papel e outros processos descritos na técnica.
Os polinucleotídeos da invenção têm sido identificados como polipeptídeos de codificação tendo atividade de alfa amilase ou alcalina. As amilases alcalinas da invenção podem incluir, porém não estão limitadas a SEQ ID NO: 115, SEQ ID NO: 207, SEQ ID NO: 139, SEQ ID NO: 127, SEQ ID NO: 137, SEQ ID NO: 113, SEQ ID NO: 205, SEQ ID NO: 179, SEQ ID NO: 151, SEQ ID NO: 187, SEQ ID NO: 97, SEQ ID NO: 153, SEQ ID NO: 69, SEQ ID NO: 135, SEQ ID NO: 189, SEQ ID NO: 119, SEQ ID NO: 209 e SEQ ID NO: 211.
As alterações nas propriedades que podem ser obtidas nas variantes da invenção são alterações, por exemplo, na especificidade do substrato, aglutinação do substrato, padrão de divagem do substrato, estabilidade térmica , perfil da atividade/pH, perfil da estabilidade/pH [tal como estabilidade aumentada em valores de pH baixos (por exemplo, pH<6, em particular pH<5) ou elevados (por exemplo, pH>9)], estabilidade direcionada à oxidação, dependência de Ca2+, atividade específica, e outras propriedades de interesse. Por exemplo, a alteração pode resultar em uma variante que, quando comparada com a amilase de origem, tenha uma dependência de Ca2+ reduzida e/ou um perfil de atividade/pH alterado.
A presente invenção refere-se a alfa amilases e polinucleotídeos codificando-os. Como empregado aqui, o termo alfa amilase abrange en-
Figure BRPI0207770B1_D0011
zimas tendo atividade de alfa amilase, por exemplo, enzimas capazes de hidrolisar o amido para açúcares. Ao contrário de muitas amilases conhecidas, as amilases da invenção podem não ser enzimas dependentes de cálcio.
É altamente desejável ser capaz de diminuir a dependência de Ca2+ de uma alfa amilase. Conseqüentemente, um aspecto da invenção fornece uma enzima de amilase que tem uma dependência de Ca2+ diminuída quando comparada com amilases de origem ou comerciais. A dependência de Ca2+ diminuída em geral terá a conseqüência funcional que a variante exibe uma atividade amilolítica satisfatória na presença de uma concentração mais inferior de íon de cálcio no veículo estrangeiro do que é necessário para uma enzima de origem ou comercial. Ainda freqüentemente terá a conseqüência de que a variante é menos sensível às condições de depleção de íon de cálcio tal como aquelas obtidas nos veículos contendo agentes de complexação de cálcio (tal como certos buiders detergentes).
Liquefação ou liquefazer'1 significa um processo pelo qual o amido é convertido para dextrinas menos viscosas e de cadeia mais curta. Geralmente, este processo envolve a gelatinização do amido simultaneamente com ou seguido pela adição de alfa amilase. Em processos comerciais, é preferido que o amido granular seja derivado de uma fonte compreendendo milho, trigo, milo, sorgo, arroz ou bulgher. Entretanto, a presente invenção aplica-se a qualquer fonte de amido e grão que seja útil na liquefação, por exemplo qualquer outra fonte vegetal ou grão conhecido por produzir amido adequado para liquefação.
Amido granular ou grânulos de amido significa um componente insolúvel em água de grãos comestíveis que permanecem após a remoção das cascas, fibras, proteínas, gorduras, germe e solúveis através de infusão, craqueamento mecânico, separações, peneiramento, lavagem em contracorrente e etapas de centrifugação típicas do processo de moagem a úmido de grão. O amido granular compreende grânulos de amido intactos contendo, quase exclusivamente, moléculas de amido embaladas (isto é, amilopectina e amilose). No milho, o componente de amido granular com-
Figure BRPI0207770B1_D0012
preende cerca de 99% de amido; o 1% restante sendo compreendido de proteína, gordura, cinzas, fibra e componentes restantes firmemente associados com os grânulos. A estrutura da embalagem do amido granular gravemente retarda a capacidade da alfa-amilase hidrolisar o amido. A gelatinização do amido é utilizada para separar os grânulos para formar uma solução de amido solúvel e facilitar a hidrólise enzimática.
Solução de Amido significa o amido gelatinizado solúvel em água que resulta do aquecimento do amido granular. Sob aquecimento dos grânulos acima de cerca de 72 graus C, o amido granular separa-se para formar uma mistura aquosa de moléculas de amido soltas. Esta mistura compreendendo, por exemplo, cerca de 75% de amilopectina e 25% de amilose em milhos de dente amarelo, forma uma solução viscosa na água. Em processos comerciais para formar glicose ou frutose, é a solução de amido que é liquefeita para formar uma solução de dextrina solúvel. Alfa amilase significa uma atividade enzimática que cliva ou hidrolísa a ligação alfa glicosídica (1-4), por exemplo, aquela nos polímeros de amido, amilopectina ou amilose. As alfa amilases adequadas são as alfa amilases de ocorrência natural bem como amilases de mutantes ou recombinantes que são úteis na liquefação do amido. As técnicas para produzir amilases variantes tendo atividade em um pH ou temperatura, por exemplo, que seja diferente da amilase do tipo selvagem, são incluídas aqui.
A faixa de temperatura da liquefação é geralmente qualquer temperatura de liquefação que seja conhecida por ser eficaz na liquefação do amido. Preferivelmente, a temperatura do amido é entre cerca de 80 graus C a cerca de 115 graus C, mais preferivelmente de cerca de 100 graus C a cerca de 110 graus C, e mais preferivelmente de cerca de 105 graus C a cerca de 108 graus C.
Em uma modalidade, as seqüências de sinal da invenção são identificadas seguindo a identificação dos novos polipeptídeos de amilase. As passagens pelas quais as proteínas são separadas e transportadas para sua localização celular apropriada são freqüentemente referidas como as passagens de objetivação das proteínas. Um dos elementos mais impor-
Figure BRPI0207770B1_D0013
tantes em todos esses sistemas de objetivação é uma seqüência de aminoácido curta na terminação de amino de um polipeptídeo recentemente sintetizado chamado de seqüência de sinal. A seqüência de sinal conduz uma proteína para sua localização apropriada na célula e é removida durante o transporte ou quando a proteína alcança seu destino final. A maioria das proteínas secretadas, de membrana ou lisossômicas tem uma seqüência de sinal amino-terminal que a marca para deslocamento no lúmen do retículo endoplásmico. Mais do que 100 seqüências de sinal para proteínas neste grupo têm sido determinadas. As seqüências variam na extensão de 13 a 36 resíduos de aminoácido. Vários métodos para reconhecer as seqüências de sinal são conhecidos por aqueles versados na técnica. Em uma modalidade, os peptídeos são identificados por um método referido como SinalP. SinalP usa uma rede neural combinada que reconhece ambos peptídeos de sinal e seus sítios de divagem. (Nielsen, H., Engelbrecht, J. Brunalk, S., Von Heijne, G., Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Protein Engineering, vol. 10, n°1, p 1-6 (1997), por meio da qual incorporado por referência). Seria entendido que algumas das amilases da invenção possam não ter seqüências de sinal. Pode ser desejável incluir uma seqüência de ácido nucléico codificando uma seqüência de sinal de uma amilase operavelmente ligada a uma seqüência de ácido nucléico de uma amilase diferente ou, opcionalmente, uma seqüência de sinal de uma proteína de não-amilase pode ser desejada. A Tabela 3 mostra seqüências de sinal da invenção.
As frases ácido nucléico ou seqüência de ácido nucléico como empregadas aqui referem-se a um oligonucleotídeo, nucleotídeo, polinucleotídeo ou a um fragmento de qualquer desses, o DNA ou RNA de origem genômica ou sintética que pode ser de filamento único ou de filamento duplo e pode representar um filamento de sentido ou anti-sentido, a ácido nucléico de peptídeo (PNA), ou a qualquer material tipo DNA ou tipo RNA, natural ou sintético na origem.
Uma seqüência de codificação de ou uma seqüência de nucleotídeo codificando uma proteína ou polipeptídeo particular, é uma se16 qüência de ácido nucléico que é transcrita e traduzida em um polipeptídeo ou proteína quando colocada sob controle de seqüências reguladoras apropriadas.
O termo gene significa o segmento do DNA envolvido na produção de uma cadeia de polipeptídeo; inclui regiões precedendo e seguindo a região de codificação (leitora e trailer) bem como, onde aplicável, intervindo seqüências (íntrons) entre segmentos de codificação individuais (exons).
Aminoácido ou seqüência de aminoácido como empregado aqui refere-se a uma seqüência de proteína, oligopeptídeo, peptídeo ou polipeptídeo, ou a um fragmento, porção ou subunidade de qualquer desses, e a moléculas sintéticas ou de ocorrência natural.
O termo polipeptídeo como empregado aqui, refere-se a aminoácidos unidos a cada outro por ligações de peptídeo ou ligações de peptídeos modificados, isto é, isoésteres de peptídeo, e pode conter aminoácidos modificados exceto os 20 aminoácidos codificados por genes. Os polipeptídeos podem ser modificados ou por processos naturais, tal como processo pós-translacional, ou por técnicas de modificação química que são bem-conhecidas na técnica. As modificações podem ocorrer em qualquer lugar no polipeptídeo, incluindo a cadeia principal do peptídeo, as cadeias laterais do aminoácido e a terminação de amino ou carboxila. Será apreciado que o mesmo tipo de modificação possa estar presente no mesmo grau ou em graus variados em vários sítios em um determinado polipeptídeo. Além disso, um determinado polipeptídeo pode ter muitos tipos de modificações. As modificações incluem acetilação, acilação, ADP-ribósilação, amidação, ligação covalente de fiavina, ligação covalente de uma porção dè heme, ligação covalente de um derivado de nucleotídeo ou nucleotídeo, ligação covalente de um lipídeo ou derivado de lipídeo, ligação covalente de um fosfitidilinositol, ciclização por reticulação, formação de ligação de dissulfeto, desmetilação, formação de reticulação covalente, formação de cisteína, formação de piroglutamato, formilação, gama-carboxilação, glicosilação, formação de âncora GPI, hidroxilação, iodinação, metilação, miristoliação, oxidação, pergilação, processamento proteolítico, fosforilação, prenilaj2e>í ção, racemização, selenoilação, sulfação, e adição mediada por transferência de RNA de aminoácidos para proteínas tal como arginilação (Observe Creighton, T.E., Proteins Structure and Moléculas Properties 2a Edição. , W. H. Freeman e Company, New York (1993); Posttranslational Covalent Modi5 fication of Proteins, B. C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)).
Como empregado aqui, o termo isolado significa que o material é removido de seu ambiente original (por exemplo, o ambiente natural se for de ocorrência natural). Por exemplo, um polipeptídeo ou polinucleotídeo de ocorrência natural presente em um animal vivo não é isolado, porém o mesmo polipeptídeo ou polinucleotídeo, separado de alguns ou todos dos materiais co-existentes no sistema natural, é isolado. Tais polinucleotídeos podem ser parte de um vetor e/ou tais polinucleotídeos ou polipeptídeos podem ser parte de uma composição, e ainda ser isolados pelo fato de que tal vetor ou composição não é parte de seu ambiente natural.
Como empregado aqui, o termo purificado não requer pureza absoluta; mais apropriadamente, é pretendido como uma definição relativa. Os ácidos nucléicos individuais obtidos de uma biblioteca têm sido convencionalmente purificados para homogeneidade eletroforética. As seqüências obtidas desses clones não podem ser obtidas diretamente ou a partir da biblioteca ou a partir do DNA humano total. Os ácidos nucléicos purificados da invenção têm sido purificados a partir do restante do DNA genômico no organismo por pelo menos 104-106 dobras. Entretanto, o termo purificado também inclui ácidos nucléicos que tenham sido purificados a partir do res25 tante do DNA genômico ou de outras seqüências em uma biblioteca ou outros ambientes por pelo menos uma ordem de magnitude, tipicamente duas ou três ordens, e mais tipicamente quatro ou cinco ordens de magnitude.
Como empregado aqui, o termo recombinante significa que o ácido nucléico está adjacente a um ácido nucléico da cadeia principal ao qual ele não está adjacente em seu ambiente natural. Adicionalmente, para ser enriquecido os ácidos nucléicos representarão 5% ou mais dos números de ácido nucléico inserido em uma população de moléculas da cadeia
Figure BRPI0207770B1_D0014
principal de ácido nucléico. As moléculas da cadeia principal de acordo com a invenção incluem ácidos nucléicos tal como vetores de expressão, ácidos nucléicos de auto-replicação, vírus, ácidos nucléicos de integração, e outros vetores ou ácidos nucléicos empregados para manter ou manipular uma inserção de ácido nucléico de interesse. Tipicamente, os ácidos nucléicos enriquecidos representam 15% ou mais do número de ácidos nucléicos inseridos na população de moléculas da cadeia principal recombinante. Mais tipicamente, os ácidos nucléicos enriquecidos representam 50% ou mais do número de ácidos nucléicos inseridos na população de moléculas da cadeia principal recombinante. Em uma modalidade, os ácidos nucléicos enriquecidos representam 90% ou mais do número de ácidos nucléicos inseridos na população de moléculas da cadeia principal recombinante.
Proteínas ou polipeptídeos recombinantes referem-se a polipeptídeos ou proteínas produzidos por técnicas de DNA recombinante; isto é, produzidos de células transformadas por um constructo de DNA exógeno codificando a proteína ou polipeptídeo desejado. As proteínas ou polipeptídeos sintéticos são aqueles preparados por síntese técnica. Os métodos de síntese de peptídeo químicos de fase sólida podem também ser empregados para sintetizar o polipeptídeo ou fragmentos da invenção. Tal método tem sido conhecido na técnica desde o início de 1960 (Merrifield, R. B., J. Am. Chem. Soc. 85: 2149-2154, 1963) (Observe também Stewart, J. M. e Young, J. D., Solid Phase Peptide Synthesis, 2a Edição, Pierce Chemical Co., Rockford, 111, pp 11-12) e tem recentemente sido empregado em kits de síntese e projeto de peptídeo de laboratório comercialmente disponível (Cambridge Research Biochemicals). Tais kits de laboratório comercialmente disponíveis têm geralmente utilizados os ensinamentos de Η. M. Geysen e outros, Proc. Natl. Acad. Sei., USA, 81: 3998 (1984) e prover a subsistência de peptídeos de sintetização nas extremidades de uma multidão de hastes ou pinos todos dos quais estão conectados a uma única placa. Quando um tal sistema é utilizado, uma placa de hastes ou pinos é invertida e inserida em uma segunda placa de reservatórios ou cavidades correspondentes, que contêm soluções para ligar ou ancorar um aminoácido apropriado às extremidades dos pinos ou hastes. Repetindo-se uma tal etapa do processo, isto é, invertendo e inserindo as extremidades dos pinos e das hastes em soluções apropriadas, os aminoácidos são construídos em peptídeos desejados. Além disso, o número de sistemas de síntese de peptídeo FMOC estão disponíveis. Por exemplo, a montagem de um polipeptídeo ou fragmento pode ser realizada em um suporte sólido empregando um sintetizador de peptídeo automatizado Applied Biosystems, Inc. Model 431A . Tal equipamento fornece fácil acesso aos peptídeos da invenção, ou por síntese direta ou por síntese de uma série de fragmentos que podem ser acoplados empregando outras técnicas conhecidas.
Uma seqüência promotora é operavelmente ligada a uma seqüência de codificação quando a polimerase de RNA que inicia a transcrição no promotor transcreverá a seqüência de codificação no mRNA.
Plasmídeos são designados por um caso inferior p precedido e/ou seguido por números e/ou letras maiúsculas. Os plasmídeos de partida aqui estão ou comercialmente disponíveis, publicamente disponíveis em uma base não restrita, ou podem ser construídos de plasmídeos disponíveis de acordo com os procedimentos publicados. Além disso, os plasmídeos equivalentes àqueles descritos aqui são conhecidos na técnica e serão aparentes aos técnicos ordinariamente versados.
Digestão de DNA refere-se à clivagem catalítica do DNA com uma enzima de restrição que atua somente em certas seqüências no DNA. As várias enzimas de restrição empregadas aqui são comercialmente disponíveis e suas condições de reação, co-fatores e outros requerimentos foram empregados como seria conhecido pelos ordinariamente versados na técnica. Para propósitos analíticos, tipicamente 1 pg de plasmídeo ou fragmento de DNA é empregado com cerca de 2 unidades de enzima em cerca de 20 pl de solução de tampão. Para o propósito de isolar os fragmentos de DNA para construção de plasmídeo, tipicamente 5 a 50 pg de DNA são digeridos com 20 a 250 unidades de enzima em um volume maior. As quantidades de substrato e tampões apropriadas para enzimas de restrição particulares são especificadas pelo fabricante. Os tempos de incubação de cerca de 1 hora em 37°C são ordinariamente empregados, porém podem variar de acordo com as instruções dos fornecedores. Após a digestão, a eletroforese de gel pode ser realizada para isolar o fragmento desejado.
Oligonucleotídeo refere-se ou a um polideoxinucleotídeo de 5 filamento único ou dois filamentos de polideoxinucleotídeo complementares que podem ser quimicamente sintetizados. Tais oligonucleotídeos sintéticos têm nenhum 5’ fosfato e desse modo não se ligarão a outro oligonucleotídeo sem adicionar um fosfato com um ATP na presença de cinase. Um oligonucleotídeo sintético se ligará a um fragmento que não tenha sido desfosfori10 lado.
A frase substancialmente idêntico no contexto de dois ácidos nucléicos ou polipeptideos, refere-se a duas ou mais seqüências que tenham pelo menos 50%, 60%, 70%, 80%, e em alguns aspectos 90-95% de identidade de resíduo de aminoácido ou nucleotídeo, quando comparado e alinhado para correspondência máxima, quando medido empregando um dos conhecidos algoritmos de comparação da seqüência ou por inspeção visual. Tipicamente, a identidade substancial existe em uma região de pelo menos cerca de 100 resíduos, e mais comumente as seqüências são substancialmente idênticas em pelo menos cerca de 150-200 resíduos. Em al20 gumas modalidades, as seqüências são substancialmente idênticas na extensão total das regiões de codificação.
Adicionalmente uma seqüência de aminoácido substancialmente idêntica é uma seqüência que difere de uma seqüência de referência por uma ou mais substituições, anulações, ou inserções de aminoácidos conservativos ou não-conservativos, particularmente quando uma tal substituição ocorre em um sítio que não é o sítio ativo da molécula, e desde que o polipeptídeo essencialmente retenha suas propriedades funcionais. Uma substituição de aminoácido conservativo, por exemplo, substitui um aminoácido por outro da mesma classe (por exemplo, substituição de um aminoáci30 do hidrofóbico, tal como isoleucina, valina, leucina, ou metionina, por outro, ou substituição de um aminoácido polar por outro, tal como substituição de arginina por lisina, ácido glutâmico por ácido aspártico ou glutamina por as-
Figure BRPI0207770B1_D0015
paragina). Um ou mais aminoácidos podem ser anulados, por exemplo, de um polipeptídeo de alfa amilase, resultando na modificação da estrutura do polipeptídeo, sem significantemente alterar sua atividade biológica. Por exemplo, os aminoácidos amino- ou carboxil-terminais que não são requeridos para atividade biológica de alfa amilase podem ser removidos. As seqüências de polipeptídeo modificadas da invenção podem ser ensaiadas para atividade biológica de alfa amilase por qualquer quantidade de métodos, incluindo contatar a seqüência de polipeptídeo modificada com um substrato de alfa amilase e determinar se o polipeptídeo modificado diminui a quantidade de substrato específico no ensaio ou aumenta os bioprodutos da reação enzimática de um polipeptídeo de alfa amilase funcional com o substrato.
Fragmentos como empregado aqui são uma porção de uma proteína de ocorrência natural que podem existir em pelo menos duas conformações diferentes. Os fragmentos podem ter a mesma ou substancialmente a mesma seqüência de aminoácido como a proteína de ocorrência natural. Substancialmente a mesma significa que uma seqüência de aminoácido é amplamente, porém não totalmente, a mesma, porém retém pelo menos uma atividade funcional da seqüência a qual está relacionada. Em geral duas seqüências de aminoácidos são substancialmente as mesmas ou substancialmente homólogas se elas são pelo menos cerca de 85% idênticas. Os fragmentos que têm estruturas tridimensionais diferentes, como a proteína de ocorrência natural, são também incluídos. Um exemplo deste, é uma molécula pró-forma, tal como uma pró-proteína de atividade baixa que pode ser modificada por divagem para produzir uma enzima madura com atividade significantemente mais elevada.
Hibridização refere-se ao processo pelo qual um filamento de ácido nucléico se une com um filamento complementar através do empareIhamento da base. As reações de hibridização podem ser sensíveis ê seletivas a fim de que uma seqüência particular de interesse possa ser identificada mesmo em amostras nas quais está presente em concentrações baixas. As condições adequadamente precisas podem ser definidas, por exemplo,
Figure BRPI0207770B1_D0016
pelas concentrações de sal e formamida nas soluções de pré-hibridização e hibridização, ou pela temperatura de hibridização, e são bem-conhecidas na técnica. Em particular, a exatidão pode ser aumentada reduzindo-se a concentração de sal, aumentando-se a concentração de formamida, ou au5 mentando-se a temperatura de hibridização.
Por exemplo, a hibridização sob condições de exatidão elevada pode ocorrer em cerca de 50% de formamida em cerca de 37°C a 42°C. A hibridização pode ocorrer sob condições de exatidão reduzida em cerca de 35% a 25% de formamida em cerca de 30°C a 35°C. Em particular, a hibri10 dização pode ocorrer sob condições de exatidão elevada em 42°C em 50% de formamida, 5 X de SSPE, 0,3% de SDS, e 200 n/ml de DNA de esperma de salmão desnaturado e cisalhado. A hibridização pode ocorrer sob condições de exatidão reduzida como descrito acima, porém em 35% de formamida em uma temperatura reduzida de 35°C. A faixa da temperatura corres15 pondendo a um nível particular de exatidão pode ser ainda reduzida calculando-se a relação da purina para pirimidina do ácido nucléico de interesse e ajustando-se a temperatura conseqüentemente. As variações nas faixas e condições acima são bem-conhecidas na técnica.
O termo variantes refere-se a polinucleotídeos ou polipeptí20 deos da invenção modificados em um ou mais resíduos de, pares de base, códons, íntrons, exons ou aminoácidos (respectivamente) também ainda retendo a atividade biológica de uma alfa amilase da invenção. As variantes podem ser produzidas por qualquer de vários meios, incluindo métodos tal como, por exemplo, PCR propenso a erro, mistura, mutagênesé direcionada ao oligonucleotídeo, montagem de PCR, mutagênese PCR sexual, mutagênese in vivo, mutagênese cassete, mutagênese de conjunto recursivo, mutagênese de conjunto exponencial, mutagênese de sítio específico, reagrupamento de gene, GSSM e qualquer combinação destes. As técnicas para produzir amilase variante tendo atividade em um pH ou temperatura, por exemplo que seja diferente da amilase do tipo selvagem, são incluídas aqui.
As enzimas são catalisadores altamente seletivos. Sua legitimidade é a capacidade de catalisar as reações com estereo-, regio- e quimio23 seletividades excelentes que são não emparelhadas na química sintética convencional. Entretanto, as enzimas são notavelmente versáteis. Elas podem ser feitas para funcionar em solventes orgânicos, operar em pHs extremos (por exemplo, pHs elevados e pHs baixos), temperaturas extremas (por exemplo, temperaturas elevadas e temperaturas baixas), níveis de salinidade extremos (por exemplo, salinidade elevada e salinidade baixa), e catalisar reações com compostos que são estruturalmente não relacionados com seus substratos fisiológicos, naturais.
As enzimas são reativas com respeito a uma ampla faixa de 10 substratos naturais e não naturais, desse modo possibilitando a modificação de virtualmente qualquer composto de indução orgânico. Entretanto, as enzimas, catatisadores químicos tradicionais desiguais são altamente enantio-, e regiosseletivos. O grau elevado da especificidade do grupo funcional exibido pelas enzimas permite que alguém mantenha o registro de cada reação em uma sequência sintética induzindo a um novo composto ativo. As enzimas são também capazes de catalisar muitas reações diversas não relacionadas com sua função fisiológica in nature. Por exemplo, as peroxidases catalisam a oxidação dos.fenóis por peróxido de hidrogênio. As peroxidases podem também catalisar as reações de hidroxilação que não são relaciona20 das com a função nativa da enzima. Outros exemplos são proteases que catalisam a decomposição dos polipeptídeos. Na solução orgânica algumas proteases podem também acilar açúcares, uma função não relacionada com a função nativa dessas enzimas.
Em um aspecto, a invenção inclui um método para liquefazer uma composição contendo amido compreendendo contatar o amido com um polipeptídeo da invenção (por exemplo, um polipeptídeo purificado selecionado de polipeptídeos tendo uma seqüência de aminoácido selecionada a partir do grupo consistindo em: seqüências de aminoácido do Grupo B, variantes tendo pelo menos cerca de 50% de homologia a pelo menos uma das seqüências de aminoácido do Grupo B, em uma região de pelo menos cerca de 100 resíduos, como determinado pela análise com um algoritmo de comparação de seqüência ou por inspeção visual; seqüências complementares a qualquer uma das seqüências de aminoácido do Grupo B; e seqüências complementares a variantes tendo pelo menos cerca de 50% de homologia a qualquer uma das seqüências de aminoácido do Grupo B em uma região de pelo menos cerca de 100 resíduos, como determinado pela análise com um algoritmo de comparação de seqüência ou por inspeção visual; e polipeptídeos tendo pelo menos 10 aminoácidos consecutivos de um polipeptídeo tendo uma seqüência selecionada a partir do grupo consistindo em seqüências de aminoácido do Grupo B). Em uma modalidade preferida, o polipeptídeo é apresentado nas seqüências de aminoácido do Grupo Β. O amido pode ser de um material selecionado de arroz, arroz germinado, milho, cevada, trigo, legumes e batata doce. O xarope de glicose produzido pelo método da invenção é incluído aqui. Um tai xarope pode ser um xarope de maltose, um xarope de glicose, ou uma combinação destes. Em particular, o xarope produzido empregando a amilase da invenção tem um nível mais elevado de fração de DP2 e um nível mais elevado de DP3 (maltotriose e/ou panose) e menos do que os fragmentos DP7 maiores quando comparados com os xaropes produzidos pelas enzimas comerciais. Isto consiste com o perfil de liquefação uma vez que a minoria dos fragmentos amplos estão nos xaropes liquefeitos da invenção.
A invenção também fornece um método para remover amido contendo manchas de um material compreendendo contatar o material com um polipeptideo da invenção. Em um aspecto, a invenção fornece um método para lavar um objeto compreendendo contatar o objeto com um polipeptídeo da invenção sob condições suficientes para lavagem. Um polipeptídeo da invenção pode ser incluído como um aditivo de detergente por exemplo. A invenção também inclui um método para descolar têxteis compreendendo contatar o têxtil com um polipeptideo da invenção sob condições suficientes para descolar.
A invenção também fornece um método para reduzir o envelhecimento de produtos cozidos compreendendo a adição de um polipeptideo da invenção ao produto cozido, antes do cozimento.
A invenção também fornece um método para o tratamento de
Figure BRPI0207770B1_D0017
fibras lignocelulósicas, onde as fibras são tratadas com um polipeptídeo da invenção, em uma quantidade que seja eficiente para melhorar as propriedades das fibras. A invenção inclui um descolorante enzimático de polpa de papel reciclado, onde o polipeptídeo é aplicado em uma quantidade que seja eficiente para o descoloramento eficaz da superfície da fibra.
Qualquer dos métodos descritos aqui inclui a possibilidade da adição de uma segunda alfa amilase ou uma beta amilase ou uma combinação destas. As amilases comerciais ou outras enzimas adequadas para uso em combinação com uma enzima da invenção são conhecidas por aqueles versados na técnica.
A invenção também inclui um método para aumentar o fluxo da produção de fluidos de uma formação subterrânea removendo-se o fluido prejudicial, contendo amido, viscoso formado durante operações de produção e encontrado na formação subterrânea que envolve uma cavidade completa perfurada compreendendo permitir a produção de fluido fluir da cavidade perfurada; reduzir o fluxo de produção dos fluidos da formação abaixo das taxas de fluxo esperadas; formular um tratamento de enzima misturando-se junto um fluido aquoso e um polipeptídeo da invenção; bombeando-se o tratamento de enzima para um local desejado na cavidade perfurada; permitindo a enzima o tratamento para degradar o fluido prejudicial contendo amido, viscoso, por meio do qual o fluido pode ser removido da formação subterrânea para a superfície da cavidade; e onde o tratamento de enzima é eficaz para atacar as ligações alfa glicosídicas no fluido contendo amido.
A presente invenção explora as únicas propriedades catalíticas das enzimas. Ao mesmo tempo em que o uso de biocatalisadores (isto é, enzimas brutas ou purificadas, células vivas ou não-vivas) em transformações químicas normalmente requer a identificação de um biocatalisador particular que reage com um composto de partida específico, a presente invenção emprega biocatalisadores selecionados e condições de reação que são específicos para grupos funcionais que estão presentes em muitos compostos de partida.
Cada biocatalisador é específico para um grupo funcional, ou
Figure BRPI0207770B1_D0018
vários grupos funcionais relacionados, e pode reagir com muitos compostos de partida contendo este grupo funcional.
As reações biocatalíticas produzem uma população de derivados de um único composto de partida. Esses derivados podem ser submeti5 dos a outra rodada de reações biocatalíticas para produzir uma segunda população de compostos derivados. Mil das variações do composto original pode ser produzido com cada iteração de derivatização biocatalítica.
As enzimas reagem em sítios específicos de um composto de partida sem afetar o restante da molécula, um processo que é muito difícil de obter empregando-se métodos químicos tradicionais. Este grau elevado de especificidade biocatalítica fornece os meios para identificar um único composto ativo na biblioteca. A biblioteca é caracterizada pelas séries de reações biocatalíticas empregadas para produzir, uma então chamada história biossintética. A avaliação da biblioteca quanto às atividades biológi15 cas e traçado da história biossintética identifica a seqüência de reação específica produzindo o composto ativo. A seqüência de reação é repetida e a estrutura do composto sintetizado é determinada. Este modo de identificação, diferente de outras sínteses de métodos de avaliação, não requer tecnologias de imobilização, e compostos podem ser sintetizados e testados livres na solução empregando virtualmente qualquer tipo de ensaio de avaliação. É importante observar, que o grau elevado de especificidade de reações de enzima nos grupos funcionais considera o traçado das reações enzimáticas específicas que compõe a biblioteca biocataliticamente produzida.
Existem muitas vantagens na avaliação de bibliotecas de lambda fago para descobertas com base na expressão de amilase. Essas incluem detecção melhorada dos clones tóxicos; acesso melhorado aos substratos; necessidade reduzida de projetar um hospedeiro; passagem secundária do potencial para qualquer inclinação resultante da excisão da massa da biblioteca; e desenvolvimento mais rápido das densidades baixas do clone. Adicionalmente, existem vantagens na avaliação de bibliotecas de lambda fago ha fase líquida sobre a fase sólida. Essas incluem: maior flexi-
Figure BRPI0207770B1_D0019
bilidade nas condições de ensaio; flexibilidade do substrato adicional; sensibilidade mais elevada para clones fracos; e facilidade de automação.
Muitas das etapas do procedimento são realizadas empregando automação robótica possibilitando a execução de milhares de reações biocatalíticas e ensaios de avaliação por dia bem como garantindo um nível elevado de exatidão e reproducibilidade. Como um resultado, uma biblioteca de compostos derivados pode ser produzida em uma questão de semanas o que levaria anos para produzir empregando métodos químicos correntes. (Para outros ensinamentos na modificação de moléculas, incluindo pequenas moléculas, observe PCT/US94/09174, aqui incorporada por referência em sua totalidade).
Em um aspecto, a presente invenção fornece um método nãoestocástico chamado reagrupamento de gene sintético, que é algumas vezes relacionado com a mistura estocástica, evita que os blocos de construções de ácido nucléico não sejam misturados ou concatenados ou quimierizados aleatoriamente, porém são preferivelmente montados não-estocasticamente.
O método de reagrupamento de gene sintético não depende da presença de um nível elevado de homologia entre os polinucleotídeos a serem misturados. A invenção pode ser empregada para não-estocasticamente gerar bibliotecas (ou grupos) de moléculas descendentes compreendidas de 1O100 quimeras diferentes. De modo concebível, o reagrupamento de gene sintético pode ainda ser empregado para gerar bibliotecas compreendidas de 1O1000 quimeras descendentes diferentes. Desse modo, em um aspecto, a invenção fornece um método não-estocástico para produzir um grupo de moléculas de ácido nucléico quiméricas finalizadas tendo uma montagem total a fim de que seja escolhida pelo desenho, cujo método é compreendido das etapas de gerar pelo desenho uma pluralidade de blocos de construção de ácido nucléico específico tendo extremidades ligáveis mutuamente compatíveis úteis, e montagem desses blocos de construção de ácido nucléico, tal que a ordem de montagem total desenhada seja obtida.
Figure BRPI0207770B1_D0020
As extremidades ligáveis mutualmente compatíveis dos blocos de construção de ácido nucléico a serem montadas são consideradas serem úteis por este tipo de montagem ordenada se elas permitem que os blocos de construção sejam acoplados em ordens predeterminadas. Desse modo, em um aspecto, a ordem da montagem geral na qual os blocos de construção de ácido nucléico podem ser acoplados é especificada pelo desenho das extremidades ligáveis e, se mais do que uma etapa de montagem é para ser empregada, então a ordem da montagem total na qual os blocos de construção de ácido nucléico podem ser acoplados é também especificada pela ordem seqüencial das etapas da montagem. Em uma modalidade da invenção, os pedaços de construção recozidos são tratados com uma enzima, tal como uma ligase (por exemplo, ligase de DNA T4) para obter ligação covalente dos pedaços da construção.
Em uma outra modalidade, o desenho dos blocos de construção do ácido nucléico é obtido sob análise das seqüêncías de um grupo de modelos de ácido nucléico progenitor que serve como uma base para produzir um grupo de progênie de moléculas de ácido nucléico quimérico finalizadas. Esses modelos de ácido nucléico progenitor desse modo servem como uma fonte de informação de seqüência que auxilia no desenho dos blocos de construção de ácido nucléico que são para ser mutagenizados, por exemplo, quimerizados ou misturados.
Em uma exemplificação, a invenção provê a subsistência da quimerização de uma família de genes relacionados e sua família codificada de produtos relacionados. Em uma exemplificação particular, os produtos codificados são enzimas. As amilases da presente invenção, por exemplo, alfa amilases ou amilases alcalinas, podem ser mutagenizadas de acordo com os métodos descritos aqui.
Desse modo, de acordo com um aspecto da invenção, as seqüências de uma pluralidade de modelos de ácido nucléico progenitor (por exemplo, polinucleotídeos das seqüêncías de ácido nucléico do Grupo A) são alinhadas a fim de selecionar um ou mais pontos de demarcação, cujos pontos de demarcação podem ser localizados em uma área de homologia.
Figure BRPI0207770B1_D0021
Os pontos de demarcação podem ser empregados para delinear os limites dos blocos de construção de ácido nucléico a serem gerados. Desse modo, os pontos de demarcação identificados e selecionados nas moléculas progenitoras servem como pontos de quimerização potencial na montagem das moléculas progênies.
Tipicamente um ponto de demarcação útil está na área de homologia (compreendida de pelo menos uma base de nucleotídeo homóloga) dividida por pelo menos dois modelos progenitores, porém o ponto de demarcação pode ser uma área de homologia que é dividida por pelo menos metade dos modelos progenitores, pelo menos dois terços dos modelos progenitores, pelo menos três quartos dos modelos progenitores, e preferivelmente em quase todos dos modelos progenitores. Ainda mais preferivelmente um outro ponto de demarcação útil é uma área de homologia que é dividida por todos os modelos progenitores.
Em uma modalidade, o processo de reagrupamento do gene é realizado exaustivamente a fim de gerar uma biblioteca exaustiva. Em outras palavras, todas combinações possíveis ordenadas dos blocos de construção de ácido nucléico são representadas no grupo de moléculas de ácido nucléico quimérico finalizadas. Ao mesmo tempo, a ordem da montagem (isto é, a ordem da montagem de cada bloco de construção na seqüência 5' a 3 de cada ácido nucléico quimérico finalizado) em cada combinação é pelo desenho (ou não-estocástica). Por causa da natureza não-estocástica do método, a possibilidade de produtos laterais não desejados é geralmente reduzida.
Em outra modalidade, o método provê que o processo de reagrupamento de gene seja realizado sistematicamente, por exemplo, para gerar uma biblioteca sistematicamente compartimentalizada, com compartimentos que podem ser avaliados sistematicamente, por exemplo, um por um. Em outras palavras a invenção provê que, através do uso criterioso e seletivo de blocos de construção de ácido nucléico específicos, acoplada com o uso criterioso e seletivo de reações de montagem seqüencialmente graduadas, um desenho experimental pode ser obtido onde os grupos espe-
Figure BRPI0207770B1_D0022
cíficos de produtos progênies são feitos em cada dos vários recipientes de reação. Isto permite que um exame sistemático e procedimento de avaliação sejam realizados. Desse modo, permite que uma quantidade potencial mente muito maior de moléculas progênies seja examinada sistematicamente em grupos menores.
Por causa de sua capacidade de realizar quimerizações de uma maneira que é altamente flexível ainda mais exaustiva e sistemática também, particularmente quando há um nível baixo de homologia entre as moléculas progenitoras, a presente invenção provê a subsistência da geração de uma biblioteca (ou grupo) compreendida de uma grande quantidade de moléculas progênies. Por causa da natureza não-estocástica do reagrupamento de gene da presente invenção, as moléculas progênies geradas preferivelmente compreendem uma biblioteca de moléculas de ácido nucléico quimérico finalizado tendo uma ordem de montagem total que é escolhida pelo desenho. Em uma modalidade particular, uma tal biblioteca gerada é compreendida de mais do que 103 a mais do que 101000 espécies de moléculas de progênies diferentes.
Em um aspecto, um grupo de moléculas de ácido nucléico quimérico finalizado, produzido como descrito é compreendido de um polinucleotídeo codificando um polipeptídeo. De acordo com uma modalidade, este polinucleotídeo é um gene, que pode ser um gene feito pelo homem. De acordo com outra modalidade, este polinucleotídeo é uma passagem de gene, que pode ser uma passagem de gene feita pelo homem. A invenção provê que um ou mais genes feitos pelo homem gerados pela invenção possam ser incorporados em uma passagem de gene feita pelo homem, tal como passagem operável em um organismo eucariótico (incluindo uma planta).
Em outra exemplificação, a natureza sintética da etapa na qual os blocos de construção são gerados permite que o desenho e introdução dos nucleotídeos (por exemplo, um ou mais nucleotídeos, que podem ser, por exemplo, códon ou íntrons ou seqüências reguladoras) possam posteriormente ser opcionalmente removidos em um processo in vitro (por exem31 é'/<
pio, por mutagênese) ou em um processo in vivo (por exemplo, utilizando-se a capacidade de união do gene de um organismo hospedeiro). É apreciado que em muitos exemplos a introdução desses nucleotídeos pode também ser desejada por muitas outras razões além do benefício potencial de criar um ponto de demarcação útil.
Desse modo, de acordo com outra modalidade, a invenção fornece um bloco de construção de ácido nucléico que pode ser empregado para introduzir um íntron. Desse modo, a invenção fornece íntrons funcionais que podem ser introduzidos em um gene feito pelo homem da inven10 ção. A invenção também fornece íntrons funcionais que podem sér introduzidos em uma passagem de gene feito pelo homem da invenção. Conseqüentemente, a invenção provê a subsistência da geração de um polinucleotídeo quimérico que é um gene feito pelo homem contendo um (ou mais) íntrons artificialmente introduzidos.
Conseqüentemente, a invenção também provê a subsistência da geração de um polinucleotídeo quimérico que é uma passagem de gene feito pelo homem contendo um (ou mais) íntron artificialmente introduzido. Preferivelmente, os íntrons artificialmente introduzidos são funcionais em uma ou mais células hospedeiras para a maioria da união de gene de modo que os íntrons de ocorrência natural sirvam funcionalmente na união do gene. A invenção fornece um processo para produzir polinucleotídeos contendo íntrons feitos pelo homem a serem introduzidos em organismos hospedeiros para a recombinação e/ou união.
Um gene feito pelo homem produzido empregando a invenção pode também servir como um substrato para a recombinação com outro ácido nucléico. De outro modo, uma passagem de gene feito pelo homem produzida empregando a invenção pode também servir como um substrato para recombinação com outro ácido nucléico. Em um exemplo preferido, a recombinação é facilitada por, ou ocorre em, áreas de homologia entre o gene contendo o íntron feito pelo homem e um ácido nucléico, que serve como um par recombinante. Em um exemplo particularmente preferido, o par recombinante pode também ser um ácido nucléico gerado pela invenção, in-
Figure BRPI0207770B1_D0023
cluindo um gene feito pelo homem ou uma passagem do gene feito pelo homem. A recombinação pode ser facilitada por ou pode ocorrer em áreas de homologia que existem em um (ou mais) íntron artificialmente introduzido no gene feito pelo homem.
O método de reagrupamento de gene sintético da invenção utiliza uma pluralidade de blocos de construção de ácido nucléico, cada dos quais preferivelmente tem duas extremidades ligáveis. As duas extremidades ligáveis em cada bloco de construção de ácido nucléico podem ser duas extremidades ásperas (isto é, cada tendo uma projeção de zero nucleotí10 deo), ou preferivelmente uma extremidade áspera e uma projeção, ou mais preferivelmente ainda duas projeções.
Uma projeção útil para este propósito pode ser uma projeção 3’ ou uma projeção 5’. Desse modo, um bloco de construção de ácido nucléico pode ter projeção 3' ou alternativamente uma projeção 5' ou alternativa15 mente duas projeções 3' ou alternativamente duas projeções 5'. A ordem total na qual os blocos de construção de ácido nucléico são montados para formar uma molécula de ácido nucléico quimérica finalizada é determinada pelo desenho experimental significativo e não é aleatório.
De acordo com uma modalidade preferida, um bloco de constru20 ção de ácido nucléico é gerado por síntese química de dois ácidos nucléicos de filamento único (também referido como oligos de filamento único) e contatando-os a fim de que os permita recozer para formar um bloco de construção de ácido nucléico de filamento duplo.
Um bloco de construção de ácido nucléico de filamento duplo pode ser de tamanho variável. Os tamanhos desses blocos de construção podem ser pequenos ou grandes. Os tamanhos preferidos de blocos de construção variam de um par de base (não incluindo qualquer projeção) a 100.000 pares de base (não incluindo qualquer projeção). Outras faixas de tamanhos preferidas são também fornecidas, as quais têm limites inferiores de 1 pb a 10.000 bp (incluindo todos os valores de números inteiros envolvidos), e limites superiores de 2 bp a 100.000 bp (incluindo todo o valor de número inteiro envolvido).
Figure BRPI0207770B1_D0024
Muitos métodos existem pelos quais um bloco de construção de ácido nucléico de filamento duplo pode ser gerado, o qual é útil para a invenção; e esses são conhecidos na técnica e podem ser facilmente realizados por aqueles versados na técnica.
De acordo com uma modalidade, um bloco de construção de ácido nucléico de filamento duplo é gerado primeiro gerando-se dois ácidos nucléicos de filamento único e permitindo-os recozer para formar um bloco de construção de ácido nucléico de filamento duplo. Os dois filamentos de um bloco de construção de ácido nucléico de filamento duplo podem ser complementares em todo o nucleotídeo não considerando qualquer que forme uma projeção; desse modo não contendo nenhuma má combinação, não considerando qualquer projeção. De acordo com outra modalidade, os dois filamentos de um bloco de construção de ácido nucléico de filamento duplo são complementares em menos do que todos os nucleotídeos não considerando qualquer que forme uma projeção. Desse modo, de acordo com esta modalidade, um bloco de construção de ácido nucléico de filamento duplo pode ser empregado para introduzir degeneração de códon. Preferivelmente a degeneração de códon é introduzida empregando a mutagênese de saturação de sítio descrita aqui, empregando um ou mais cassetes N, N, G/T ou alternativamente empregando um ou mais cassetes N, N, N.
O método de recombinação in vivo da invenção pode ser realizado cegamente em um grupo de alelos ou híbridos desconhecidos de uma seqüência ou polinucleotídeo específico. Entretanto, não é necessário conhecer a seqüência de DNA ou RNA atual do polinucleotídeo específico.
O método para usar recombinação em uma população misturada de genes pode se útil para a geração de qualquer proteína, por exemplo, interleucina 1, anticorpos, tPA e hormônios do crescimento. Este método pode ser empregado para gerar proteínas tendo a atividade ou especificidade alterada. O método pode também ser útil para a geração de seqüências híbridas de ácido nucléico, por exemplo, regiões promotoras, íntrons, exons, seqüências realçadoras, 31 regiões não traduzidas ou 51 regiões nâo tra-
Figure BRPI0207770B1_D0025
duzidas de genes. Desse modo este método pode ser empregado para gerar genes tendo taxas aumentadas de expressão. Este método pode também ser útil no estudo das seqüências de DNA repetitivas. Finalmente, este método pode ser útil para mudar ribozimas ou aptâmeros.
Em um aspecto, a invenção descrita aqui está direcionada ao uso de ciclos repetidos de reagrupamento redutivo, recombinação e seleção que considera a evolução molecular direcionada de seqüências lineares altamente complexas, tal como recombinação completa de proteínas, DNA ou RNA.
A mistura in vivo de moléculas é útil no fornecimento de variantes e pode ser realizada utilizando a propriedade natural de células para recombinar multímeros. Ao mesmo tempo em que a recombinação in vivo tem fornecido a rotina natural principal para diversidade molecular, a recombinação genética permanece um processo relativamente complexo que envolve (1) o reconhecimento de homologias; (2) divagem de filamentos, invasão de filamento, e etapas metabólicas induzindo à produção de quiasmas recombinantes; e finalmente (3) a resolução de quiasmas em moléculas recombinadas discretas. A formação do quiasma requer o reconhecimento das seqüências homólogas.
Em outra modalidade, a invenção inclui um método para produzir um polinucleotídeo híbrido de pelo menos um primeiro polinucleotídeo e um segundo polinucleotídeo. A invenção pode ser empregada para produzir um polinucleotídeo híbrido introduzindo-se pelo menos um primeiro polinucleotídeo e um segundo polinucleotídeo que divide pelo menos uma região da homologia de seqüência parcial em uma célula hospedeira adequada. As regiões da homologia de seqüência parcial promovem processos que resultam na reorganização da seqüência produzindo um polinucleotídeo híbrido. O termo polinucleotídeo híbrido, como empregado aqui, é qualquer seqüência de nucleotídeo que resulta do método da presente invenção e contém seqüência de pelo menos duas seqüências de polinucleotídeo original. Tais polinucleotídeos híbridos podem resultar de eventos de recombinação intermolecular que promovem a integração da seqüência entre as
Figure BRPI0207770B1_D0026
moléculas de DNA. Além disso, tais polinucleotideos híbridos podem resultar de processos de reagrupamento redutivo intramolecular que utiliza seqüências repetidas para alterar uma seqüência de nucleotídeo em uma molécula de DNA.
A invenção fornece um meio para gerar polinucleotideos híbridos que podem codificar polipeptideos híbridos biologicamente ativos (por exemplo, alfa amilase híbrida). Em um aspecto, os polinucleotideos originais codificam polipeptideos biologicamente ativos. O método da invenção produz novos polipeptideos híbridos utilizando-se processos celulares que in10 tegram a seqüência dos polinucleotideos originais tal que o polinucleotideo híbrido resultante codifique um polipeptídeo demonstrando atividades derivadas dos polipeptideos biologicamente ativos originais. Por exemplo, os polinucleotideos originais podem codificar uma enzima particular de diferentes microorganismos. Uma enzima codificada por um primeiro polinucle15 otídeo de um organismo ou variante pode, por exemplo, funcionar eficazmente sob uma condição ambiental particular, por exemplo, salinidade elevada. Uma enzima codificada por um segundo polinucleotideo de um diferente organismo ou variante pode funcionar eficazmente sob uma condição ambiental diferente, tal como temperaturas extremamente elevadas. Uma seqüência contendo polinucleotideo híbrido dos primeiro e segundo polinucleotídeos originais pode codificar uma enzima que exibe características de ambas enzimas codificadas pelos polinucleotideos originais. Desse modo, a enzima codificada pelo polinucleotideo híbrido pode funcionar eficazmente sob condições ambientais divididas por cada das enzimas codificadas pelo primeiro e segundo polinucleotideos, por exemplo, salinidade elevada e temperaturas extremas.
As enzimas codificadas pelos polinucleotideos da invenção incluem, porém não estão limitadas a, hidrolases, tal como alfa amilases e amilases alcalinas. Um polipeptídeo híbrido resultando do método da inven30 ção pode exibir atividade de enzima especializada não divulgada nas enzimas originais. Por exemplo seguinte a recombinação e/ou reagrupamento redutivo de polinucleotideos codificando atividades de hidrolase, o poli36 peptídeo híbrido resultante codificado por um polinucleotídeo híbrido pode ser avaliado quanto à atividade de hidrolase especializada obtida de cada das enzimas originais, isto é, o tipo de ligação na qual a hidrolase atua e a temperatura na qual a hidrolase funciona. Desse modo, por exemplo, a hi5 drolase pode ser avaliada para determinar aquelas funcionalidades químicas que distinguem a hidrolase híbrida das hidrolases originais, tal como (a) amida (ligações de peptídeo), isto é proteases; (b) ligação de éster; isto é amilases e lipases; (c) acetais; isto é, glicosidase e, por exemplo, a temperatura, pH ou concentração de sal nos quais o polipeptideo híbrido funciona.
As fontes dos polinucleotídeos originais podem ser isoladas de organismos individuais (isolados), coleções de organismos que tenham sido desenvolvidos em veículos definidos (enriquecimento de cultura), ou, organismos não cultivados (amostras ambientais). O uso de um método independente de cultura para obter polinucleotídeos codificando novas bio15 atividades das amostras ambientais é mais preferível uma vez que permite que alguém acesse os recursos armazenados da biodiversidade.
Bibliotecas ambientais são geradas de amostras ambientais e representam os genomas coletivos de organismos de ocorrência natural arquivados nos vetores de clonagem que podem ser propagados em hospe20 deiros procarióticos adequados. Por causa do DNA clonado ser inieialmente extraído diretamente das amostras ambientais, as bibliotecas não são limitadas a pequenas frações de procariotas que podem ser desenvolvidos na cultura pura. Adicionalmente, uma normalização do DNA ambiental presente nessas amostras pode permitir representação mais igual do DNA de todas as espécies presentes na amostra original. Isto pode dramaticamente aumentar a eficiência dos genes de interesse da descoberta de constituintes menores da amostra que pode ser sub-representada por várias ordens de magnitude comparada as espécies dominantes.
Por exemplo, as bibliotecas de gene geradas a partir dê um ou mais microorganismos não cultivados são avaliadas quanto a uma atividade de interesse. As passagens potenciais codificando as moléculas bioativas de interesse são primeiro capturadas nas células procarióticas na forma de
Figure BRPI0207770B1_D0027
bibliotecas de expressão de gene. Os polinucleotídeos codificando as atividades de interesse são isolados de tais bibliotecas e introduzidos em uma célula hospedeira. A célula hospedeira é desenvolvida sob condições que promovem a recombinação e/ou reagrupamento redutivo criando biomoléculas potencialmente ativas com atividades novas ou realçadas.
Os microorganismos dos quais o polinucleotídeo pode ser preparado incluem microorganismos procarióticos, tal como Eubactería e Archaebacteria, e microorganismos eucarióticos inferiores tal como fungos, algumas algas e protozoários. Os polinucleotídeos podem ser isolados de amostras ambientais, caso no qual o ácido nucléico pode ser recuperado sem cultivo de um organismo ou recuperado de um ou mais organismos cultivados. Em um aspecto, tais microorganismos podem ser extremófilos, tal como hipertermófilos, psicrófilos, psicrotrófis, halófilos, barófilos e acidófilos. Os polinucleotídeos codificando enzimas isoladas de microorganismos extremofílicos são particularmente preferidos. Tais enzimas podem funcionar em temperaturas acima de 100°C em fontes de água quente terrestre e ventos térmicos do mar profundo, em temperaturas abaixo de 0°C em águas árticas, no ambiente de sal saturado do Mar Morto, em valores de pH próximos a 0, em depósitos de carvão e origens ricas em enxofre geotérmicas, ou em valores de pH maiores do que 11 em sedimento de esgoto. Por exemplo, várias amilases e lipases clonadas e expressadas de organismos extremofílicos mostram atividade elevada por toda uma ampla faixa de temperaturas e pHs.
Das novas enzimas da presente invenção, muitas foram purificadas e caracterizadas em pH 8, em ambos 40°C e 50°C, e pH 10 em ambos 40°C e 50°C. Das enzimas constatadas serem purificadas e caracterizadas em pH 8 e 40°C, observado ter três vezes (628 U/mg) a atividade específica de uma enzima B. lichenoformis (228 U/mg). Adicionalmente, outra enzima foi observada ter aproximadamente a atividade equivalente (250 U/mg) à enzima B. lichenoformis. Em um pH 10 e 50°C, uma das enzimas tem uma atividade específica de 31 U/mg e outra tem uma atividade específica de 27,5 U/mg, ao mesmo tempo em que B. lichenoformis tem uma ativi38 dade específica de 27 U/mg.
Os polinucleotídeos selecionados e isolados como descrito acima são introduzidos em uma célula hospedeira adequada. Uma célula hospedeira adequada é qualquer célula que é capaz de promover a recombinação e/ou reagrupamento redutivo. Os polinucleotídeos selecionados estão preferivelmente ainda em um vetor que inclui seqüências de controle apropriadas. A célula hospedeira pode ser uma célula eucariótica mais elevada, tal como uma célula de mamífero, ou uma célula eucariótica inferior, tal como célula de levedura, ou preferivelmente, a célula hospedeira pode ser uma célula procariótica, tal como uma célula bacteriana. A introdução do constructo na célula hospedeira pode ser efetuada por transfecção de fosfato de cálcio, transfecção mediada por DEAE-Dextrano, ou eletroporação (Davis e outros, 1986).
Como exemplos representativos de hospedeiros apropriados, podem ser mencionados: células bacterianas, tal como, E. coli, streptomyces, Salmonella typhimurium; células fungais, tal como levedura; células de insetos tal como Drosofila S2 e Spodoptera Sf9; células de animais tal como CHO, COS, ou melanoma de intestinos; adenovírus; e células de planta. A seleção de um hospedeiro apropriado é considerada estar no escopo daqueles versados na técnica dos ensinamentos desta.
Com referências particulares aos vários sistemas de cultura de célula de mamífero que podem ser empregados para expressar a proteína recombinante, os exemplos de sistemas de expressão de mamífero incluem linhagens COS-7 de fibroblastos do rim do macaco, descrito em SV40transformed simian cells support the replication of early SV40 mutants (Gluzman, 1981), e outras linhagens de células capazes de expressar um vetor compatível, por exemplo, as linhagens de células C127, 3T3, CHO, HeLa e BHK. Os vetores de expressão de mamíferos compreenderão uma origem de replicação, um realçador e promotor adequado, e também qualquer sítio de aglutinação de ribossomo necessário, sítio de poliadenilação, sítio de aceitação e doador de união, seqüência de terminação transcricional, e seqüências não transcritas de flanqueação 5'. As seqüências de DNA,
Figure BRPI0207770B1_D0028
derivadas da união SV40, e sítios de poliadenilação podem ser empregados para fornecer os elementos genéticos não transcritos requeridos.
As células hospedeiras contendo os polinucleotídeos de interesse podem ser cultivadas em veículos nutrientes convencionais modifica5 dos quando apropriado para promotores de ativação, selecionando os transformantes ou amplificando os genes. As condições da cultura, tal como temperatura, pH e outros, são aqueles previamente empregados com a célula hospedeira selecionada para expressão, e será aparente aos técnicos ordinariamente versados. Os clones que são identificados como tendo a atividade de enzima especificada podem então ser seqüenciados para identificar a seqüência de polinucleotídeo codificando uma enzima tendo a atividade realçada.
Em outro aspecto, é considerado que o método da presente invenção pode ser empregado para gerar novos polinucleotídeos codificando passagens bioquímicas de um ou mais opérons ou agrupamentos de genes ou porções destes. Por exemplo, as bactérias e muitos eucariotas têm um mecanismo coordenado para regular os genes, cujos produtos estão envolvidos nos processos relacionados. Os genes são agrupados, nas estruturas referidas como agrupamento de genes, em um único cromossomo e são transcritos juntos sob o controle de uma única seqüência reguladora, incluindo um único promotor que inicia a transcrição do agrupamento total. Desse modo, o agrupamento do gene é um grupo de genes adjacentes que são ou idênticos ou relacionados, freqüentemente quanto à sua função. Um exemplo de uma passagem bioquímica codificada por agrupamento de ge25 nes são policetidas. As policetidas são moléculas que são uma fonte extremamente rica de bioatividades, incluindo antibióticos (tal como tetraciclinas e eritromicinas). Agentes anticâncer (daunomicina), imunossupressores (FK506 e rapamicina), e produtos veterinários (monensina). Muitas policetidas (produzidas por sintase de policetidas) são valiosas como agentes tera30 pêuticos. Sintase de policetida são enzimas multifuncionais que catalisam a biossíntese de uma enorme variedade de cadeias de carbono diferindo na extensão e padrões de funcionalidade e ciclização. Os genes de sintase de policetida incluem-se nos agrupamentos de gene e pelo menos um tipo (designado tipo I) de sintase de policetida tem enzimas e genes de tamanho amplo, complicando a manipulação genética e estudos in vitro desses genes/proteínas.
O DNA de agrupamento de gene pode ser isolado de diferentes organismos e ligado nos vetores, particularmente vetores contendo seqüências reguladoras de expressão que podem controlar e regular a produção de uma proteína detectável ou atividade de disposição relacionada com proteína dos agrupamentos de gene ligados. O uso de vetores que têm uma capacidade excepcionalmente ampla para introdução de DNA exógeno é particularmente apropriado para uso com agrupamento de gene e é descrito por modo de exemplo aqui, para incluir o f-fator (ou fator de fertilidade) de E. coli. Este f-fator de E. coli é um plasmídeo que afeta a transferência de freqüência elevada de si próprio durante a conjugação e é ideal para obter e estavelmente propagar amplos fragmentos de DNA, tal como agrupamentos de gene de amostras microbiais misturadas, Uma modalidade particularmente preferida é empregar vetores de clonagem, referidos como vetores de fosmídeos ou de cromossomos artificiais bacterianos (BAC). Esses são derivados de f-fator de E. coli que é capaz de estavelmente integrar amplos segmentos de DNA genômico. Quando integrado com DNA de uma amostra ambiental não cultivada misturada, isto torna possível obter grandes fragmentos genômicos na forma de uma estável biblioteca de DNA ambiental. Outro tipo de vetor para uso na presente invenção é um vetor de cosmídeo. Os vetores de cosmídeo foram originalmente designados para clonar e propagar amplos segmentos de DNA genômico. A clonagem em vetores de cosmídeo é descrita em detalhes em Sambroak e outros, Molecular Cloning: A Laboratory Manual, 2a edição, Cold Spring Harbor Laboratory Press (1989). Uma vez ligado em um vetor apropriado, dois ou mais vetores contendo agrupamentos de gene de sintase de policetida diferentes podem ser introduzidos em uma célula hospedeira adequada. As regiões de homologia de seqüência parcial dividida pelo agrupamento de gene promoverão o processo que resulta na reorganização da seqüência resultando em um agru-
Figure BRPI0207770B1_D0029
pamento de gene híbrido. O novo agrupamento de gene híbrido pode então ser avaliado quanto às atividades realçadas não encontradas nos agrupamentos de gene original.
Portanto, em uma modalidade, a invenção refere-se a um método para produzir um polipeptideo híbrido biologicamente ativo e avaliar um tal polipeptideo quanto à atividade realçada:
(1) introduzindo-se pelo menos um primeiro polinucleotídeo na ligação operável e um segundo polinucleotídeo na ligação operável, referido pelo menos primeiro polinucleotídeo e segundo polinucleotídeo dividindo pelo menos uma região de homologia de seqüência parcial, em uma célula hospedeira adequada;
(2) desenvolvendo-se a célula hospedeira sob condições que promovam a reorganização da seqüência resultando em um polinucleotídeo híbrido em ligações operáveis;
(3) expressando-se um polipeptideo híbrido codificado pelo polinucleotídeo híbrido;
(4) avaliando-se o polipeptideo híbrido sob condições que promovam a identificação da atividade biológica realçada; e (5) isolando-se um polinucleotídeo codificando o polipeptideo híbrido.
Os métodos para avaliação de várias atividades de enzima são conhecidos por aqueles versados na técnica e são discutidos por todo o presente relatório descritivo. Tais métodos podem ser empregados quando isolando os polipeptídeos e polinucleotídeos da invenção.
Como exemplos representativos dos vetores de expressão que podem ser empregados, podem ser mencionados partículas virais, baculovírus, fago, plasmídeos, fagomídeos, cosmídeos, fosmídeos, cromossomos artificiais bacterianos, DNA viral (por exemplo, vacina, adenovírus, vírus de pústula de ave, pseudohidrofobia e derivados de SV40), cromossomos artificiais com base em P1, plasmídeos de levedura, cromossomos artificiais de levedura, e qualquer outro vetor específico para hospedeiros específicos de interesse (tal como bacilus, aspergilo e levedura). Desse modo, por exem42 pio, o DNA pode ser incluído em qualquer uma de uma variedade de vetores de expressão para expressar um polipeptídeo. Tais vetores incluem seqüências de DNA cromossômico, não cromossômico e sintético. Os grandes números de vetores adequados são conhecidos por aqueles versados na técnica, e são comercialmente disponíveis. Os seguintes vetores são fornecidos por modo de exemplo; Bacteriano: vetores pQE (Qiagen), plasmídeos pBluescript, vetores pNH, (vetores lambda-ZAP)(Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); Eucariótico; pXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Entretanto, qualquer outro plasmídeo ou outro vetor pode ser empregado contanto que eles sejam reproduzíveis e viáveis no hospedeiro. Os vetores de número de cópia baixo ou número de cópia elevado podem ser empregados com a presente invenção.
A seqüência de DNA no vetor de expressão é operativamente ligada a uma seqüência de controle de expressão apropriada (promotora) para direcionar a síntese de RNA. Os promotores bacterianos particulares nomeados incluem lacl, lacZ, T3, T7, gpt, lambda PR, PL e trp. Os promotores eucarióticos incluem ÇMV imediato tardio, cinase de timidina de HSV, SV40 precoce e tardia, LTRs de retrovírus, e metalotioneína-l de camun20 dongo. A seleção do promotor e vetor apropriado está bem no nível dos versados ordinários da técnica. O vetor de expressão também contém um sítio de aglutinação de ribossomo para iniciação da translação e um terminador de transcrição. O vetor pode também incluir seqüências apropriadas para amplificar a expressão. As regiões promotoras podem ser selecionadas de qualquer gene desejado empregando vetores de transferase de cloramfenicol (CAT) ou outros vetores com marcadores selecionáveis. Além disso, os vetores de expressão preferivelmente contêm um ou mais genes de marcadores selecionáveis para fornecer um traço fenotípico para a seleção de células hospedeiras transformadas tal como resistência à neomiciná ou re30 ductase de dihidrofolato para cultura de células eucarióticas, ou tal como resistência à ampicilina e tetraciclina em E. coli.
O reagrupamento in vivo é focado em processos interCif moleculares coletivamente referidos como recombinação que na bactéria, é geralmente observado como um fenômeno dependente de RecA. A invenção pode contar com processos de recombinação de uma célula hospedeira para recombinar e reagrupar sequências, ou a capacidade das células de mediar os processos redutivos para diminuir a complexidade de seqüências quase-repetidas na célula por anulação. Este processo de reagrupamento redutivo ocorre por um processo independente de RecA intra molecular.
Portanto, em outro aspecto da invenção, novos polinucleotídeos 10 podem ser gerados pelo processo de reagrupamento redutivo. O método envolve a geração de constructos contatando sequências consecutivas (seqüências de codificação original), sua inserção em um vetor apropriado, e sua introdução subseqüente em uma célula hospedeira apropriada. O reagrupamento da identidade molecular individual ocorre por processos combi15 natórios entre as seqüêncías consecutivas nas regiões de posse de constructos de homologia, ou entre as unidades quase-repetidas. O processo de reagrupamento recombina e/ou reduz a complexidade e extensão das seqüências repetidas, e resulta na produção de novas espécies moleculares. Vários tratamentos podem ser aplicados para realçar a taxa de reagrupa20 mento. Esses incluem tratamento com luz ultravioleta, ou químicos de danificação de DNA, e/ou o uso de linhagem de célula hospedeira exibindo níveis realçados de instabilidade genética. Desse modo o processo de reagrupamento pode envolver recombinações homólogas ou a propriedade natural de seqüêncías quase-repetidas para direcionar sua própria evolu25 ção.
As seqüêncías repetidas ou quase repetidas desempenham um papel na instabilidade genética. Na presente invenção, quaserepetidas são repetições que não são restritas à sua estrutura de unidade original. As unidades quase-repetidas podem ser apresentadas como uma disposição de seqüêncías em um constructo; unidades consecutivas de seqüências similares. Uma vez ligada, as junções entre as seqüêncías consecutivas tornam-se essencialmente invisíveis e a natureza quase-repetitiva
Figure BRPI0207770B1_D0030
do constructo resultante é agora contínua no nível molecular. O processo de anulação das células executa para reduzir a complexidade do constructo resultante operando entre as seqüências quase repetidas. As unidades quase-repetidas fornecem um repertório praticamente ilimitado de modelos nos quais os eventos de deslizamento podem ocorrer. Os constructos contendo as quase-repetidas desse modo, eficazmente fornecem elasticidade molecular suficiente, pela qual os eventos de anulação (e potencialmente inserção) possam ocorrer virtualmente em qualquer lugar nas unidades quase-repetitivas.
Quando as seqüências quase-repetidas são todas ligadas na mesma orientação, por exemplo, do topo para cauda ou vice-versa, a célula não pode distinguir unidades individuais. Conseqüentemente, o processo redutivo pode ocorrer em toda a seqüência. Ao contrário, quando, por exemplo, as unidades estão presentes do topo para o topo, exceto do topo para a cauda, a inversão delineia os pontos finais da unidade adjacente a fim de que a formação de anulação favoreça a perda de unidades discretas. Desse modo, é preferível com o presente método que as seqüências estejam na mesma orientação. A orientação aleatória de seqüências quaserepetidas resultará na perda da eficiência do reagrupamento, ao mesmo tempo em que a orientação consistente das seqüências oferecerá a eficiência superior. Entretanto, ao mesmo tempo em que tendo a minoria das seqüências contíguas na mesma orientação diminui a eficiência, ela pode ainda fornecer elasticidade suficiente para a recuperação eficaz de novas moléculas. Os constructos podem ser feitos com as seqüências quaserepetidas na mesma orientação para permitir eficiência superior.
As seqüências podem ser montadas em uma orientação do topo para cauda empregando qualquer dos diversos métodos, incluindo os seguintes:
(a) Iniciadores que incluem um topo poli-A e cauda polí-T que quando fazem filamento único poderiam fornecer a orientação, podem ser utilizados. Isto é concluído tendo-se a primeira base pequena do iniciador feito de RNA e por esta razão facilmente removeu RNAseH.
(b) Iniciadores que incluem sítios de clivagem de restrição única, podem ser utilizados. Sítios múltiplos, uma batería de seqüências únicas, e síntese repetida e etapas de ligação seriam requeridos.
(c) A base pequena interna do iniciador poderia ser tiolada e uma exonuclease empregada para produzir moléculas apropriadamente com cauda.
A recuperação das seqüências reagrupadas conta com a identificação de vetores de clonagem com um índice repetitivo reduzido (RI). As seqüências de codificação reagrupadas podem então ser recuperadas por amplificação. Os produtos são novamente clonados e expressados. A recuperação dos vetores de clonagem com RI reduzido pode ser afetada:
1) Pelo uso de vetores somente estavelmente mantidos quando o constructo é reduzido na complexidade.
2) Pela recuperação física dos vetores encurtados por procedimentos físicos. Neste caso, o vetor de clonagem seria recuperado empregando procedimentos de isolação de plasmídeo padrão e tamanho fracionado ou em um gel de agarose, ou coluna com um corte de peso molecular baixo utilizando procedimentos padrão.
3) Pela recuperação dos vetores contendo genes interrompidos que podem ser selecionados quando o tamanho da inserção diminui.
4) Pelo uso de técnicas de seleção direta com um vetor de expressão e a seleção apropriada.
As seqüências de codificação (por exemplo, genes) de organismos relacionados podem demonstrar um grau elevado de homologia e codificam completamente diversos produtos de proteína. Esses tipos de seqüências são particularmente úteis na presente invenção como quaserepetições. Entretanto, ao mesmo tempo em que os exemplos ilustrados abaixo demonstram o reagrupamento das seqüências de codificação original quase idênticas (quase-repetições), este processo não é limitado a tais repetições quase idênticas.
Os seguintes exemplos demonstram um método da invenção. As seqüências de ácido nucléico de codificação (quase-repetições), derivadas de três (3) espécies únicas são descritas. Cada seqüência codifica uma proteína com um grupo distinto de propriedades. Cada das seqüências difere por um único ou poucos pares de base em uma única posição na seqüência. As seqüências quase-repetidas são separadamente ou coletivamente amplificadas e ligadas em agrupamentos aleatórios tal que todas possíveis permutações e combinações sejam disponíveis na população de moléculas ligadas. A quantidade de unidades quase-repetidas pode ser controlada pelas condições de montagem. A quantidade medida de unidades quase-repetidas em um constructo é definida como o índice repetitivo (RI).
Uma vez formados, os constructos podem, ou não podem ser fracionados por tamanho em um gel de agarose de acordo com os protocolos publicados, inseridos em um vetor de clonagem, e transfectados em uma célula hospedeira apropriada. As células são então propagadas e o reagrupamento redutivo é efetuado. A taxa do processo de reagrupamento redutivo pode ser estimulada pela introdução de detrimentos de DNA se desejado. A redução no RI é mediada pela formação de anulação entre as seqüências repetidas por um mecanismo intramolecular, ou mediada por eventos tipo recombinação através de mecanismos intermoleculares é imaterial. O resultado final é o reagrupamento das moléculas em todas combinações possíveis.
Opcionalmente, o método compreende a etapa adicional de avaliar os membros da biblioteca do grupo misturado para identificar os membros da biblioteca misturados individuais tendo a capacidade de se aglutinar ou de outro modo interagir, ou catalisar uma reação particular (por exemplo, tal como domínio catalítico de uma enzima) com uma macromolécula predeterminada, tal como por exemplo um receptor de proteináceo, um oligossacarídeo, viron, ou outra estrutura ou composto predeterminado.
Os polipeptídeos que são identificados de tais bibliotecas podem ser empregados para propósitos terapêuticos, diagnóstico, pesquisas e propósitos relacionados (por exemplo, catalisadores, solutos para aumentar a osmolaridade de uma solução aquosa, e outros), e/ou podem ser submeti-
Figure BRPI0207770B1_D0031
dos a um ou mais ciclos de adição de mistura e/ou seleção.
Em outro aspecto, é considerado que antes ou durante a recombinação ou reagrupamento, os polinucleotídeos gerados pelo método da invenção podem ser submetidos a agentes ou processos que promovem a introdução de mutações nos polinucleotídeos originais. A introdução de tais mutações aumentaria a diversidade dos polipeptídeos e polinucleotídeos híbridos resultantes codificados a partir daqui. Os agentes ou processos que promovem mutagênese podem incluir, porém não estão limitados a:(+)CC-1065, ou um análogo sintético tal como (+)-CC-1065-(N3-Adenina (observe Sun e Hurley, (1992); uma adução de 4'-flúor-4-aminobifenila desacetilada ou N-acetilada capaz de inibir a síntese de DNA (observe, por exemplo, van de poli e outros, (1992)); ou uma adução de 4 aminobifenila desacetilada ou N-acetilada capaz de inibir a síntese de DNA (observe também, van de Poli e outros (1992), pp 751-758); cromo trivalente, um sal de cromo trivalente, uma adução de DNA de hidrocarboneto aromático poiicíclico (PAH) capaz de inibir a replicação de DNA, tal como 7-bromometilbenz[a]antraceno (BMA), tris(2,3-dibromopropil)fosfato (Tris-BP), 1,2dibromo-3-cloropropano (DBCP), 2-bromoacroleína (2BA), benzo[a]pireno7,8-diidrodiol-9-10-epóxido (BPDE), um sal de halogênio de platina (II), Nhidróxi-2-amino-3-metilimidazo[4,5-f]-quinolina (N-hidróxi-ÍQ), e N-hidróxi2-amino-1-metil-6-fenilimidazo[4,5-f]-piridina (N-hidróxi-PhlP). Os meios especialmente preferidos para reduzir ou parar a amplificação por PCR consiste de luz UV (+)-CC-1065 e (+)-CC-1065-(N3-Adenina). Os meios particularmente abrangidos são aduções de DNA ou polinucleotídeos compreendendo as aduções de DNA dos grupos de polinucleotídeos ou polinucleotídeos, que pode ser liberado ou removido por um processo incluindo aquecimento da solução compreendendo os polinucleotídeos antes de outro processamento.
Em outro aspecto a invenção está direcionada a um método para produzir proteínas recombinantes tendo atividade biológica tratando-se uma amostra compreendendo polinucleotídeos de modelo de filamento duplo codificando uma proteína do tipo selvagem sob condições de acordo
Figure BRPI0207770B1_D0032
com a invenção que provê a subsistência da produção de polinucleotídeos híbridos ou reagrupados.
A invenção também provê a subsistência do uso de iniciadores de códon proprietário (contendo uma seqüência Ν,Ν,Ν degenerada) para introduzir pontos de mutações em um polinucleotídeo, a fim de que gere um grupo de polipeptídeos progênies no qual uma faixa total de substituições de aminoácido único é representada em cada posição de aminoácido (mutagênese saturada de sítio de gene (GSSM)). Os oligos empregados são compreendidos contiguamente de uma primeira seqüência homóloga, uma seqüência N, N, N degenerada, e preferivelmente porém não necessariamente uma segunda seqüência homóloga. Os produtos translacionais progênies a jusante do uso de tais oligos incluem todas possíveis alterações de aminoácidos em cada sítio de aminoácido junto ao polipeptídeo, porque a degeneração da seqüência de Ν,Ν,Ν inclui códons para todos 20 aminoácidos.
Em um aspecto, um tal oligo degenerado (compreendido de um cassete Ν,Ν,Ν degenerado) é empregado para submeter cada códon original em um modelo de polinucleotídeo parental a uma faixa total de substituição de códon. Em outro aspecto, pelo menos dois cassetes Ν,Ν,Ν degenerados são empregados - ou no mesmo oligo ou não- para submeter pelo menos dois códons originais em um modelo de polinucleotídeo parental a uma faixa total de substituições de códons. Desse modo, mais do que uma seqüência Ν,Ν,Ν pode estar contida em um oligo para introduzir mutações de aminoácido em mais do que um sítio. Esta pluralidade de seqüências Ν,Ν,Ν pode ser diretamente contígua, ou separada por uma ou mais seqüências de nucleotídeos adicionais. Em outro aspecto, os oligos úteis para adições e anulações de introdução podem ser empregados ou sozinhos ou em combinação com os códons contendo uma seqüência de Ν,Ν,Ν, para introduzir qualquer combinação ou permutação de adição, anulação e/ou substituição de aminoácido.
Em uma exemplificação particular, é possível simultaneamente mutagenizar duas ou mais posições de aminoácido contíguo empregando um oligo que contém o tripleto Ν,Ν,Ν contíguo, isto uma seqüência (N,N,N)n degenerada.
Em outro aspecto, a presente invenção provê a subsistência do uso de cassetes degenerados tendo menos degeneração do que a seqüência Ν,Ν,Ν. Por exemplo, pode ser desejável em alguns exemplos empregar (por exemplo, em um oligo) uma seqüência de tripleto degenerada compreendida de somente um N, onde o referido N pode estar na primeira, segunda ou terceira posição do tripleto. Qualquer outra base incluindo qualquer combinação e permutação deste pode ser empregada nas duas posições restantes do tripleto. Alternativamente, pode ser desejável em alguns exemplos empregar (por exemplo, em um oligo) uma seqüência de tripleto Ν,Ν,Ν degenerada, seqüência de tripleto N,N,G/T ou uma seqüência N,N,G/C.
É apreciado entretanto, que o uso de um tripleto degenerado (tal como seqüência de tripleto N,N,G/T ou N,N,G/C) como divulgado na presente invenção seja vantajoso por várias razões. Em um aspecto, esta invenção fornece um meio para sistematicamente e regularmente facilmente gerar a substituição da faixa total de possíveis aminoácidos (para um total de 20 aminoácidos) em cada e todas as posições de aminoácido em um polipeptídeo. Desse modo, para um polipeptídeo de 100 aminoácidos, a invenção fornece um modo para sistematicamente e regularmente facilmente gerar 2000 espécies distintas (isto é, 20 possíveis aminoácidos por vezes de posições de posições de 100 aminoácidos). É apreciado que seja fornecido, através do uso de um oligo contendo uma seqüência de tripleto de N,N,G/T ou N,N,G/C degenerada, 32 seqüências individuais que codificam para 20 possíveis aminoácidos. Desse modo, em um recipiente de reação no qual uma seqüência de polinucleotídeo parental é submetida à mutagênese por saturação empregando um tal oligo, existem 32 polinucleotídeos progênies distintos gerados codificando 20 polipeptídeos distintos. Ao contrário, o uso de um oligo não-degenerado na mutagênese direcionada ao sítio induz a somente um produto de polipeptídeo progênie por recipiente de reação.
Esta invenção também provê a subsistência do uso de oligos não-degenerados, que podem opcionalmente ser empregados em combina50 ção com os iniciadores degenerados divulgados. É apreciado que em algumas situações, seja vantajoso empregar oligos não-degenerados para gerar mutações de ponto específico em um polinucleotídeo de trabalho. Isto fornece um meio para gerar mutações de ponto notável específico, mutações de ponto induzindo a alterações de aminoácido correspondentes, e mutações de ponto que causam a geração de códons de interrupção e a expressão correspondente de fragmentos de polipeptídeo.
Desse modo, em uma modalidade preferida desta invenção, cada recipiente de reação de mutagênese por saturação contém polinucleotídeos codificando 20 moléculas de polipeptídeo progênies tal que todos os 20 aminoácidos sejam representados na posição de um aminoácido específico correspondendo à posição do códon mutagenizado no polinucleotídeo parental. Os polipeptídeos progênies degenerados de 32 dobras gerados de cada recipiente de reação de mutagênese por saturação podem ser submetidos à amplificação clonal (por exemplo, clonado em um hospedeiro E. coli adequado empregando um vetor de expressão) e submetido à avaliação da expressão. Quando um polipeptídeo de progênie individual é identificado por avaliação quanto à exposição de uma alteração favorável na propriedade (quando comparado com o polipeptídeo parental), ele pode ser seqüenciado para identificar a substituição de aminoácido correspondentemente favorável contida aqui.
É apreciado que sob mutagenização de cada e de todas as posições de aminoácido em um polipeptídeo parental empregando mutagênese por saturação como divulgado aqui, alterações de aminoácido favoráveis possam ser identificadas em mais do que uma posição de aminoácido. Uma ou mais novas moléculas progênies pode ser gerada a qual contenha uma combinação de todas ou parte dessas substituições de aminoácido favoráveis. Por exemplo, se 2 alterações de aminoácido favoráveis específicas são identificadas em cada das 3 posições de aminoácido em um polipeptídeo, as permutações incluem 3 possibilidades em cada posição (nenhuma alteração do aminoácido original, e cada de duas alterações favoráveis) e 3 posições. Desse modo, existem 3 x 3 x 3 ou 27 possibilidades totais, inclu-
Figure BRPI0207770B1_D0033
indo 7 que foram previamente examinadas- 6 mutações de ponto único (isto é, 2 em cada das três posições) e nenhuma alteração em qualquer posição.
Em ainda outro aspecto, a mutagênese por saturação de sítio pode ser empregada junto com mistura, quimerização, recombinação e outros processos de mutagenização, junto com a avaliação. Esta invenção provê a subsistência do uso de qualquer processo de mutagênese, incluindo mutagênese por saturação, de uma maneira iterativa. Em uma exemplificação, o uso interativo de qualquer processo de mutagenização é empregado em combinação com a avaliação.
Desse modo em uma exemplificação não-limitante, esta invenção provê a subsistência do uso da mutagênese por saturação em combinação com processos de mutagenização adicionais, tal como processo onde dois ou mais polinucleotideos relacionados são introduzidos em uma célula hospedeira adequada tal que um polinucleotideo híbrido seja gerado por recombinação e reagrupamento redutivo.
Além de realizar a mutagênese junto com a seqüência inteira de um gene, a presente invenção fornece mutagênese que pode ser empregada para substituir cada de qualquer quantidade de bases em uma seqüência de polinucleotideo, onde a quantidade de bases a ser mutagenizada é preferivelmente todos os números inteiros de 15 a 100.000. Desse modo, ao invés de todas as posições de mutagênese junto com uma molécula, uma pode submeter todos ou vários números discretos de bases (preferivelmente uma subsérie totalizando de 15 a 100.000) para mutagênese. Preferivelmente, um nucleotídeo separado é empregado para mutagenização de cada posição ou grupo de posições junto com uma seqüência de polinucleotideo. Um grupo de 3 posições para ser mutagenizado pode ser um códon. As mutações são preferivelmente introduzidas empregando um iniciador mutagênico, contendo um cassete heterólogo, também refere-se como um cassete mutagênico. Os cassetes preferidos podem ter de 1 a 500 bases. Cada posição de nucleotídeo em tais cassetes heterólogos, serão N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G, OU E, onde E é qualquer base que não seja A, C, G, ou T (E pode ser referida como um projeto de oligo).
Em um sentido geral, a mutagênese de saturação é compreendida da mutagenização de uma série completa de cassetes mutagênicos (onde cada cassete é preferivelmente cerca de 1-500 bases em extensão) em seqüência de polinucleotídeo definida ser mutagenizado (onde a seqüência para ser mutagenizado é preferivelmente de cerca de 15 a 100.000 bases em extensão). Desse modo, um grupo de mutações (variando de 1 a 100 mutações) é introduzido em cada cassete para ser mutagenizado. Um agrupamento de mutações para serem introduzidas em um cassete pode ser diferente ou o mesmo de um segundo agrupamento de mutações para serem introduzidas em um segundo cassete durante a aplicação de um ciclo de mutagênese de saturação. Tais agrupamentos são exemplificados serem anulações, adições, agrupamentos de códons particulares, e agrupamentos de cassetes de nucleotídeos particulares.
As sequências definidas para serem mutagenizadas incluem um gene inteiro, passagem, cDNA, uma estrutura de leitura aberta inteira (ORF), e promotor inteiro, realçadores, repressores/transativadores, origem de replicação, íntron, operador, ou qualquer grupo funcional de polinucleotídeo. Geralmente, uma seqüência definida para este propósito pode ser qualquer polinucleotídeo que uma seqüência de polinucleotídeo de 15 bases, e seqüências de polinucleotídeos de extensão entre 15 bases e 15.0000 bases (esta invenção especificadamente nomeia todos os números inteiros envolvidos). As considerações em agrupamentos escolhidos de códons incluem tipos de aminoácidos codificados por um cassete mutagênico degenerado.
Em uma exemplificação particularmente preferida um agrupamento de mutações que podem ser introduzidas em um cassete mutagênico, esta invenção especificamente fornece durante substituições de códons degenerados (empregando oligos degenerados) que codificam para 2, 3, 4, 5,
6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, e 20 aminoácidos em cada posição, e uma biblioteca de polipeptídeos codifica desse modo.
Um aspecto da invenção é um ácido nucléico isolado compre53 endendo uma das seqüências das sequências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, as seqüências complementares a estas, ou um fragmento compreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50 ,75, 100, 150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências de uma seqüência de ácido nucléico de Grupo A (ou as seqüências complementares a estas). Os ácidos nucléicos isolados, podem compreender DNA, incluindo cDNA, DNA genômico, e DNA sintético. O DNA pode ser de duplo filamento ou único filamento, e se o filamento é único pode ser codificado o filamento ou não codificado o filamento (anti-sentido). Alternativamente, os ácidos nucléicos isolados podem compreender RNA.
Como discutido em mais detalhes abaixo, os ácidos nucléicos isolados de uma seqüência de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas estas, podem ser empregados para preparar um dos polipeptideos de uma seqüência de aminoácidos do grupo B, e as seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos de um dos polipeptideos de seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas.
Conseqüentemente, outro aspecto da invenção é um ácido nucléico isolado que codifica uma das seqüências de aminoácidos do Grupo B de polipeptideos, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos de um dos polipeptideos das seqüências de aminoácidos do Grupo B. As seqüências codificadas desses ácidos nucléicos podem ser idênticas para uma das seqüências codificadas de um dos ácidos nucléicos das seqüências de ácidos nucléicos do Grupo A, ou urn fragmento destas ou podem ser seqüências codificadas diferentes que codificam um dos polipeptideos das seqüências de aminoácidos do Grupo B, seqüências substancialmente idênticas a estas, e fragmentos tendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos de um dos polipeptideos das seqüências de aminoácidos de
Grupo B, como um resultado da redundância ou degeneração do código genético. O código genético será conhecido por alguém versado na técnica e pode ser obtido, por exemplo, na página 214 de B. Lewin, Genes VI, Oxford University Press, 1997, a divulgação da qual está incorporada aqui por referência.
O ácido nucléico isolado que codifica um dos polipeptídeos das sequências de aminoácidos do grupo B, e seqüências substancialmente idênticas a estas, pode incluir, porém não está limitado a: somente a seqüência codificada de uma das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, e seqüências de codificação adicional, tal como seqüências indutoras ou seqüências de próproteínas e seqüências não-codificadas, tal como íntrons ou seqüências não-codificadas 5' e/ou 3' das seqüências codificadas. Desse modo, como empregado aqui, o termo polinucleotídeo codificando um polipeptídeo abrangem um polinucleotídeo que inclui somente a seqüência codificada para o polipeptídeo bem como um polinucleotídeo que inclui seqüência nãocodificada e/ou codificada adicional.
Alternativamente, as seqüências de ácidos nucléicos das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, podem ser mutagenizadas empregando técnicas convencionais, tal como mutagênese de sítio direcionado, ou outras técnicas familiares para aqueles versados na técnica, para introduzir alterações silenciosas nos polinucleotídeos de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas. Como empregado aqui alterações silenciosas incluem, por exemplo, alterações que não alteram a seqüência de aminoácido codificada pelo polinucleotídeo. Tais alterações podem ser desejáveis a fim de aumentar o nível do polipeptídeo produzido pelas células hospedeiras contendo um vetor codificando o polipeptídeo introduzindo-se os códons ou pares de códons que ocorre freqüentemente em organismos hospedeiros.
A invenção também refere-se a polinucleotídeos que têm alterações de nucleotídeos que resultam em substituições de aminoácidos, adi55 ções, anulações, fusões e truncações nos polipeptídeos das sequências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas. Tais alterações de nucleotídeo podem ser introduzidas empregando técnicas tal como mutagênese de sítio direcionado, mutagênese química aleatória, anulação de exonuclease III, e outras técnicas de DNA recombinante. Alternativamente, tais alterações de nucleotídeo podem ser variantes alélicos ocorrendo naturalmente que são isoladas identificando-se os ácidos nucléicos que especificadamente hidridizam as sondas compreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas das seqüências de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas (ou as seqüências complementares a estas) sob condições de altamente precisas, moderadas ou baixas como fornecidas aqui.
Os ácidos nucléicos isolados das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, as seqüências complementares a estas, ou fragmentos compreendendo pelo menos 10 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências complementares a estas podem também ser empregados como sondas para determinar quer uma amostra biológica, tal como uma amostra de solo, contém um organismo tendo uma seqüência de ácido nucléico da invenção ou um organismo dos quais o ácido nucléico foi obtido. Em tais procedimentos, uma amostra biológica potencialmente abrigando o organismo dos quais o ácido nucléico foi isolado é obtida e ácidos nucléicos são obtidos da amostra. Os ácidos nucléicos são contatados com as sondas sob condições que permitam a sonda hibridizar especificamente qualquer seqüência complementar das quais estão presentes aqui.
Onde necessário, condições que permitem a sonda hibridizar especificadamente às seqüências complementares podem ser determinadas colocando-se a sonda em contato com as seqüências complementares das amostras conhecidas para conter a seqüência complementar bem como se56 qüências de controle que não podem conter a seqüência complementar. As condições de hibridização, tal como a concentração de sal do tampão de hibridização, a concentração de formamida do tampão de hibridização, ou a temperatura de hibridização, podem ser variadas para identificar as condi5 ções que permitem a sonda hibridizar especificadamente aos ácidos nucléicos complementares.
Se a amostra contém o organismo dos quais o ácido nucléico foi isolado, a hibridização específica da sonda é então detectada. A hibridização pode ser detectada rotulando-se a sonda com um agente detectável tal como um isótopo radioativo, um corante fluorescente ou uma enzima capaz de catalisar a formação de um produto detectável.
Muitos métodos para uso de sondas rotuladas para detectar a presença de ácidos nucléicos suplementares em uma amostra são familiares àqueles versados na técnica. Esses incluem Southern Blots Northern
Blots, procedimentos de hibridização de colônia, e pontos de manchas. Os protocolos para cada desses procedimentos são fornecidos em Ausubel e outros. Protocolos correntes em Molecular Biology, John Wiley 503 Sons, Inc. (1997) e Sambrook e outros, Molecular Cloning: A Laboratory manual 2a edição, Cold Spring Harbor Laboratory Press (1989), as divulgações com20 pletas das quais estão incorporadas aqui por referência.
Alternativamente, mais do que uma sonda (pelo menos uma das quais é capaz de especificadamente hidridizar quaisquer seqüências complementares que estão presentes na amostra de ácido nucléico), pode ser empregada em uma reação de amplificação para determinar se a amostra contém um organismo contendo uma seqüência de ácido nucléico da invenção (por exemplo, um organismo dos quais o ácido nucléico foi isolado). Tipicamente, as sondas compreendem oligonucleotídeos. Em uma modalidade, a reação de amplificação pode compreender uma reação por PCR. Os protocolos PCR são descritos em Ausubel e Sambrook, supra. Alternativa30 mente, a amplificação pode compreender uma reação de cadeia de ligase, 3SR, ou reação de deslocamento de filamento. (Observe Barany, F., The Ligase Chain Reaction in a PCR World, PCR Methods and Applications
C1} ι
1:5-16,1991; E. Fahy e outros, Self-sustained Sequence Replication (3SR): An lsothermal Transcription-based Amplification System Alternative to PCR, PCR Methods and Applications 1:25-33, 1991; and Walker G.T. et al., Strand Displacement Amplification-an lsothermal in vitro DNA Amplification Technique, Nucleic Acid Research 20:1691-1696, 1992, as divulgações das quais estão incorporadas aqui por referência em sua totalidade). Em tais procedimentos, os ácidos nucléicos na amostra são contatados com as sondas, a reação de amplificação é realizada, e qualquer produto de amplificação resultante é detectado. O produto de amplificação pode ser detectado realizando-se eletroforese de gel nos produtos de reação e manchando o gel com um interlocutor tal como brometo de etídio. Alternativamente, uma ou mais das sondas podem ser rotuladas com um isótopo radioativo e. a presença de um,produto de amplificação radiçativo pode ser detectada por auto-radiografia após eletroforese em gel.
As sondas derivadas das seqüências próximas das extremidades das seqüências de seqüências de ácidos nucléicos do grupo A, e seqüências substancialmente idênticas a estas, podem também ser empregadas em procedimentos de comportamento do cromossomo para identificar clones contendo seqüência genômica localizada adjacente às seqüências das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas. Tais métodos permitem o isolamento de genes que codificam proteínas adicionais do organismo hospedeiro.
Os ácidos nucléicos isolados de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, as seqüências complementares a estas, ou um fragmento compreendendo pelo menos 10 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências complementares a estas podem ser empregados como sondas para identificar e isolar ácidos nucléicos relacionados. Em algumas modalidades, os ácidos nucléicos relacionados, podem ser cDNAs ou DNAs genômicos dos organismos a não ser que um dos quais dos ácidos nucléicos estivesse
Figure BRPI0207770B1_D0034
isolado. Por exemplo, os outros organismos podem ser organismos relacionados. Em tais procedimentos, uma amostra de ácido nucléico é contatada com uma sonda sob condições que permitem a sonda hibridizar especificadamente às seqüências relacionadas. A hibridização da sonda aos ácidos nucléicos do organismo relacionado é então detectada empregando qualquer dos métodos descritos acima.
Em reações de hibridização de ácido nucléico, as condições empregadas para alcançar um nível particular de precisão variarão, dependendo da natureza dos ácidos nucléicos sendo hibridizados. Por exemplo, a extensão, grau de complementaridade, composição de seqüência de nucleotídeo (por exemplo, GC v. conteúdo AT), e tipo de ácido nucléico (por exemplo, RNA v. DNA) das regiões de hibridização dos ácidos nucléicos podem ser consideradas em condições de hibridização selecionadas. Uma consideração adicional é se um dos ácidos nucléicos é imobilizado, por exemplo, em um filtro.
A hibridização pode ser realizada sob condições precisas baixas, precisas moderadas ou altamente precisas. Como um exemplo de hibridização de ácido nucléico, uma membrana de polímero contendo ácidos nucléicos desnaturados imobilizados é primeiro pré-hibridizada durante 30 minutos em 45°C em uma solução consistindo de 0,9 M de NaCI, 50mM de NaH2PO4, pH 7,0; 5,0 mM de Na2EDTA, 0,5% de SDS, 10x Denhardfs, e 0,5 mg/ml de ácido polirriboadenílico. Aproximadamente 2 x 107 cpm (atividade específica 4-9 x 108 cpm/pg) de 32P de sonda de oligonucleotídeo de extremidade rotulada são então adicionados à solução. Após 12-16 horas de incubação, a membrana é lavada durante 30 minutos em temperatura ambiente em 1 x SET (150mM de NaCI, 20mM de Tris cloridrato, pH 7,8, 1mM de Na2EDTA) contendo 0,5% de SDS, seguido por uma lavagem de 30 minutos em 1x SET fresco em Tm-10°C para a sonda de oligonucleotídeo. A membrana é então exposta para película auto-radiográfica para detecção de sinais de hibridização.
Variando-se a precisão das condições de hibridização empregadas para identificar ácidos nucléicos, tal como cDNAs ou DNAs genômi59 cos, que hibridizam a sonda detectável, ácidos nucléicos tendo níveis diferentes de homologia a sonda podem ser identificados e isolados. A precisão pode ser variada conduzindo-se a hibridização em temperaturas variadas abaixo das temperaturas de fundição das sondas. A temperatura de fundi5 ção, Tm, é a temperatura sob resistência iônica definida e pH) na qual 50% das seqüências alvo hibridizam para uma sonda perfeitamente complementar. As condições altamente precisas são selecionadas para serem iguais ou cerca de 5°C abaixo do que Tm durante uma sonda particular. A temperatura de fundição da sonda pode ser calculada empregando as seguintes fór10 mulas:
Para as sondas entre 14 e 70 nucleotídeos em extensão a temperatura de fundição (Tm) é calculada empregando a fórmula: Tm= 81,5+16,6(log[Na+J)+0,41 (fração G+C)-(600/N) onde N é a extensão da sonda.
Se a hibridização é realizada em uma solução contendo formamida, a temperatura de fundição pode ser calculada empregando a equação: Tm=81,5 +16,6(log[Na+])+0,41(fração G+C)-(0,63% de formamida)(600/N) onde N é a extensão da sonda.
A pré-hibridização pode ser realizada em 6x SSC, 5X reagente de Denhardt, 0,5% de SDS, 100 gg de DNA de esperma de salmão fragmentado desnaturado ou 6X SSC, 5x reagente de Denhardt, 0,5% de SDS. 100 pg de DNA de esperma de salmão fragmentado desnaturado, 50% de formamida. As fórmulas para SSC e soluções de Denhardt estão listadas em Sambrook e outros, supra.
A hibridização é conduzida adicionado-se a sonda detectável a soluções de pré-hibridização listadas acima. Onde a sonda compreende DNA de filamento duplo, é desnaturada antes da adição da solução de hibridização. O filtro é contatado com a solução de hibridização durante um período suficiente de tempo para permitir a sonda hibridizar os cDNas ou
DNAs genômicos contendo seqüências complementares a isto ou homólogos destes. Para sondas sobre 200 nucleotídeos em extensão, a hibridização pode ser realizada em 15-25°C abaixo da Tm. Para sondas curtas, tal
Figure BRPI0207770B1_D0035
como sondas de oligonucleotídeos, a hibridização pode ser conduzida em 510°c abaixo de Tm. Tipicamente, para hibridizações em 6X SSC, a hibridização é conduzida em aproximadamente 68°C. Freqüentemente, durante hibridizações em 50% de formamida contendo soluções, a hibridização é conduzida em aproximadamente 42°C.
Todas as hibridizações precedentes serão consideradas serem sob condições altamente precisas.
Seguinte a hibridização, o filtro é lavado para remover qualquer sonda detectável de ligação não-específica. A precisão empregada para lavar os filtros pode também ser variada dependendo da natureza dos ácidos nucléicos sendo hibridizados, a extensão dos ácidos nucléicos sendo hibridizados, o grau de complementaridade, a composição de seqüência do nucleotídeo (por exemplo, GC v. conteúdo AT), e o tipo de ácido nucléico (por exemplo, RNA v. DNA). Os exemplos das condições de lavagem precisas progressivamente altamente elevadas são como segue: 2xSSC, 0,1% de SDS em temperatura ambiente durante 15 minutos (precisão baixa); 0,1X SSC, 0,5% de SDS em temperatura ambiente durante 30 minutos a 1 hora (precisão moderada); 0,1 x SSC, 0,5% de SDS durante 15 a 30 minutos entre a temperatura de hibridização e 68°C (precisão elevada); e 0,15M de NaCI durante 15 minutos em 72°C (precisão muito elevada). Uma lavagem de precisão baixa final pode ser conduzida em 0,1X SSC em temperatura ambiente. Os exemplos acima são meramente ilustrativos de uma série de condições que podem ser empregadas para filtros de lavagens. Alguém versado na técnica conhecerá que existem numerosas receitas durante lavagem precisas diferentes. Alguns outros exemplos são determinados abaixo.
Os ácidos nucléicos que tenham hibridizado a sonda são identificados por auto-radiografia ou outras técnicas convencionais.
O procedimento acima pode ser modificado para identificar ácidos nucléicos tendo níveis de redução de homologia à seqüência da sonda. Por exemplo, para obter ácidos nucléicos de homologia reduzida à sonda detectável, condições menos precisas podem sere empregadas. Por exemplo, a temperatura de hibridização pode ser reduzida em incrementos de
5°C de 68°C a 42°C em um tampão de hibridização tendo uma concentração de Na+ de aproximadamente 1M. Seguinte a hibridização, o filtro pode ser lavado com 2x SSC, 0,5% de SDS na temperatura de hibridização. Essas condições são consideradas serem condições moderadas acima de 50°C e condições baixas abaixo de 50°C. Um exemplo específico de condições de hibridização moderadas é quando a hibridização acima é conduzida em 55°C. Um exemplo específico de condições de hibridização de precisão baixa é quando a hibridização acima é conduzida em 45°C.
Alternativamente, a hibridização pode ser realizada em tampões, tal como 6xSSC, contendo formamida em uma temperatura de 42°C. Neste caso, a concentração da formamida no tampão de hibridização pode ser reduzida em 5% de incrementos de 50% a 0% para identificar clones tendo níveis de redução de homologia à sonda. Seguinte a hibridização, o filtro pode ser lavado com 6X SSC, 0,5% de SDS em 50°C. Essas condições são consideradas serem condições moderadas acima de 25% de formamida e condições baixas abaixo de 25% de formamida. Um exemplo específico de condições de hibridização moderadas é quando a hibridização acima é conduzida em 30% de formamida. Um exemplo especifico de condições de hibridização de precisão baixa é quando a hibridização acima é conduzida em 10% de formamida.
Por exemplo, os métodos precedentes podem ser empregados para ácidos nucléicos isolados tendo uma seqüência com pelo menos cerca de 97%, pelo menos 95%, pelo menos 90%, pelo menos 85%, pelo menos 80%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelo menos 55%, ou pelo menos 50% de homologia para uma seqüência de ácido nucléico selecionado a partir do grupo consistindo em uma das seqüências de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos cerca de 10,15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas destes, e a seqüências complementares destas. A homologia pode ser medida empregando o algoritmo de alinhamento. Por exemplo, os polinucleotídeos homólogos podem ter uma seqüência de codificação que é
Figure BRPI0207770B1_D0036
uma variante alélica de ocorrência natural de uma das seqüêncías de codificação descritas aqui. Tais variantes alélicas podem ter uma substituição, anulação ou adição de um ou mais nucleotídeos quando comparadas aos ácidos nucléicos das seqüêncías de ácidos nucléicos do Grupo A ou as se5 qüências complementares a estas.
Adicionalmente, os procedimentos acima podem ser empregados para ácidos nucléicos isolados que codificam polipeptídeos tendo pelo menos cerca de 99%, 95%, pelo menos 90%, pelo menos 80%, pelo menos 80%, pelo menos 75%, pelo menos 70%, pelo menos 65%, pelo menos
60%, pelo menos 55%, ou pelo menos 50% de homologia para um polipeptídeo tendo a seqüência de uma das seqüêncías de aminoácidos do Grupo B, e seqüêncías substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35 ,40, 50, 75, 100, ou 150 aminoácidos consecutivos destes como determinado empregando um algoritmo de allinhamento de seqüência (por exemplo, tal como o algoritmo 3,0t78 da versão FASTA com os parâmetros característicos).
Outro aspecto da invenção é um polipeptídeo purificado ou isolado compreendendo a seqüência de uma das seqüêncías de ácidos nucléicos do Grupo A, e seqüêncías substancialmente idênticas a estas, ou frag20 mentos compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. Uma discussão acima, tais polipeptídeos podem ser obtidos por inserção de um ácido nucléico codificando o polipeptídeo em um vetor tal que a seqüência de codificação é operavelmente ligada a uma seqüência capaz de conduzir a expressão do polipeptídeo codificado em uma célula hospedeira adequada. Por exemplo, o vetor de expressão pode compreender um promotor, um sítio de aglutinação de ribossomo para iniciação da translação e um terminador de transcrição. O vetor pode também incluir seqüêncías apropriadas durante expressão de amplificação.
Os promotores adequados para expressar o polipeptídeo ou fragmentos destes em bactéria incluem os promotores E. coli lac ou trp, o promotor lacl, o promotor lacZ, o promotor T3, o promotor 77, o promotor
Figure BRPI0207770B1_D0037
gpt, o promotor lambda PR, o promotor lambda PL, promotores de óperons codificando enzimas glicolfticas tal como cinase de 3-fosfogiicerato (PGK), e o promotor de fosfatase ácida. Os promotores de fungos incluem promotor de fator V. Os promotores eucarióticos incluem o promotor de CMV imediato precoce, promotor de cinase de timidina HSV, promotores de choque térmico, o promotor SV40 tardio e próximo, retrovírus de LTRs, e promotor de metalotioneina-l de camundongo. Outros promotores conhecidos para expressão de controle de genes em células procarióticas ou eucarióticas ou seus vírus podem também ser empregados.
Os vetores de expressão de mamíferos podem também compreender uma origem de replicação, qualquer sítio de aglutinação de ribossomo necessário, um sítio de poliadenilação, doador de emenda e sítio aceptor, seqüências de terminação transcricional, e seqüências não transcritas de flanqueação 5'. Em algumas modalidades, as seqüências de DNA derivadas de emendas SV40 e sítios de poliadenilação podem ser empregados para fornecer os elementos genéticos não transcritos requeridos.
Os vetores para expressão de polipeptídeo ou fragmentos destes em células eucarióticas podem também conter realçadores para aumentar os níveis de expressão. Os realçadores são elementos atuandtes-cis de DNA, freqüentemente de cerca de 10 a cerca de 300 bp em extensão que atua em um promotor para aumentar sua transcrição. Os exemplos incluem o realçador SV40 no último lado da origem de replicação bp 100 a 270, o realçador do promotor citomegalovírus próximo, o realçador de polioma no último lado da origem de replicação, e os realçadores de adenovírus.
Além disso, os vetores de expressão tipicamente contêm um ou mais genes de marcadores selecionados para permitir seleção de células hospedeiras contendo o vetor. Tais marcadores selecionados incluem genes codificando dihidrofolato reductase ou resistência da neomicina à conferência de genes para cultura de células eucarióticas, tetraciclina de conferência de genes ou resistência à ampicilina em E. coli, e o gene TRP1 S. cerevisiae.
Figure BRPI0207770B1_D0038
Em algumas modalidades, o ácido nucléico codifica um dos polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes são agrupados na fase apropriada com uma seqüência líder capaz de secreção direta do polipeptídeo translado ou fragmento destes. Opcionalmente, o ácido nucléico pode codificar um polipeptídeo de fusão em que um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes é fundido a peptídeos heterológos ou polipeptídeos, tal como peptídeos de identificação N-terminal que confere características desejadas, tal como estabilidade aumentada ou purificação simplificada.
A seqüência de DNA apropriada pode ser inserida no vetor por uma variedade de procedimentos. Em geral, a seqüência de DNA está ligada à posição desejada no vetor seguindo digestão do inserto e o vetor com endonucleases de restrição apropriadas. Alternativamente, as extremidades cegas em tanto no inserto como no vetor podem ser ligadas. Uma variedade de técnicas de clonagem são divulgadas em Ausubel e outros, Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997 e Sambrook e outros, Molecular Cloning: A Laboratory Manual segunda edição Ed., Cold Spring harbor Laboratory Press (1989), as divulgações completas das quais estão incorporadas aqui por referência. Tais procedimentos e outros são julgados estarem no escopo da invenção por aqueles versados na técnica.
O vetor pode ser, por exemplo, na forma de um plasmídeo, uma partícula viral, ou um fago. Outros vetores incluem seqüências cromossômica, não cromossômica e DNA sintético, derivados de SV40; plasmídeos bactericidas, DNA fago, baculovírus, plasmídeos de levedura, vetores derivados de combinações de plasmídeos e DNA fago, DNA viral, tal como vacina, adenovírus, vírus de pústula de ave, e pseudohidrofobia. Uma variedade de vetores de expressão e clonagem para uso com hospedeiros euca65 rióticos e procarióticos são descritos por Sambrook, e outros, Molecular Cloning: A Laboratory Manual, segunda edição, Cold Spring Harbor, N. Y.; (1989), a divulgação das quais é aqui incorporada por referência.
Os vetores de bactérias particulares que podem também ser empregados incluem os plamídeos comercialmente disponíveis compreendendo elementos genéticos das cavidades de vetores de clonagem conhecidos pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Sweden), GEM1 (Promega Biotec, Madison, Wl, USA) pQE70, pQE60, pQE-9 (Quiagen), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5 (Pharmacia), pKK232-8 e pCM7. Os vetores eucarióticos particulares incluem pSV2CAT, pOG44, pXT1, pSG (Stratagene) pSVK3, pBPV, pMSG, e pSVL (Pharmacia). Entretanto, qualquer outro vetor pode ser empregado enquanto é reproduzível e viável na célula hospedeira.
A célula hospedeira pode ser qualquer das células hospedeiras familiares para aqueles versados na técnica, incluindo células procarióticas, células eucarióticas, células de mamíferos, células de insetos, ou células de plantas. Como exemplos representativos de hospedeiros apropriados, podem ser mencionados: células bactericidas, tal como E. coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium e várias espécies com Pseudomonas genera, Streptomyces, e Staphylococcus, células fúngicas, tal como levedura, células de insetos tal como Drosophila S2 e Spodoptera Sf9, células de animais tal como CHO, COS ou melanoma de intestinos, e adenovírus. A seleção de um hospedeiro apropriado está dentro da capacidade daqueles versados na técnica.
O vetor pode ser introduzido nas células hospedeiras empregando qualquer uma das variedades de técnicas, incluindo transformação, transfecção, transdução, infecção viral, pistolas de gene, ou transferência de gene mediada por Ti. Os métodos particulares incluem transfecção de fosfato de cálcio, transfecção mediada por Dextrano-DEAE, lipofecção ou eletroporação (Davis, L., Dibner. M., Battey, I., Basic Methods in Molecular Biology, 1986)).
Figure BRPI0207770B1_D0039
Onde apropriado, as células hospedeiras engenheiradas podem ser cultivadas em veículo de nutriente convencional modificado como apropriado para promotores de ativação, transformantes de seleção ou amplificação de genes da invenção. Seguindo a transformação de uma cepa hospedeira adequada e crescimento das cepas hospedeiras para uma densidade de célula apropriada, o promotor selecionado pode ser induzido por modos apropriados (por exemplo, mudanças de temperatura ou indução química) e as células podem ser cultivadas durante um período adicional para permiti-los produzir o polipeptídeos desejado ou fragmento deste.
As células são colhidas tipicamente por centrifugação, quebradas por modos químicos ou físicos, e o extrato bruto resultante é retido durante ainda a purificação. As células microbiais empregadas para expressão de proteínas podem ser quebradas por qualquer método conveniente, incluindo ciclo de congelamento-descongelamento, sonicação, quebra mecânica ou uso de agente de lise de células. Tais métodos são bem-conhecidos por aqueles versados na técnica. O polipeptídeo expressado ou fragmento deste pode ser recuperado e purificado de culturas de células recombinantes por métodos incluindo sulfato de amônio ou precipitação em etanol, extração de ácido, cromatografia de permuta de cátion ou ânion, cromatografia de fosfocelulose, cromatografia de interação hidrofóbica, cromatografia por afinidade, cromatografia por hidroxilapatita, e cromatografia por lecitina. As etapas de redobramento de proteínas podem ser empregadas, quando necessárias, completando-se a configuração do polipeptídeo. Se desejado, a cromatografia líquida de alto desempenho (HPLC) pode ser empregada durante as etapas de purificação final.
Vários sistemas de cultura de células de mamíferos podem também ser empregados para expressar proteína recombinante. Os exemplos de sistemas de expressão de mamíferos incluem a linhagem de COS-7 de fibroblastos de rim de macacos (descritos por Gluzman, Cell, 23:175, 1981), e outras linhagens de células capazes de expressar proteínas de um vetor compatível, tal como as linhagens de células C127, 3T3, CHO, HeLa e BHK.
Os constructos em células hospedeiras podem ser empregados
Figure BRPI0207770B1_D0040
de uma maneira convencional para produzir o produto de gene codificado pela seqüência recombinante. Dependendo do hospedeiro empregado em um procedimento de produção recombinante, os polipeptídeos produzidos pelas células hospedeiras contendo o vetor podem ser glicosilados ou podem ser não-glicosilados. Os polipeptídeos da invenção podem ou não pode também incluir um resíduo de aminoácido de metionina inicial.
Alternativamente, os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idêntica a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser produzidos sinteticamente por síntese de peptídeo convencional. Em outras modalidades, os fragmentos ou porções dos polipeptídeos podem ser empregados para produzir o polipeptídeo de extensão total correspondente por síntese de peptídeo; destes, os fragmentos podem ser empregados como intermediários para produção de polipeptídeos de extensão total.
Os sistemas de translação livre de células podem ser empregados para produzir um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes empregando mRNAs transcritos de um constructo de DNA compreendendo um promotor operavelmente ligado a um ácido nucléico codificando o polipeptídeo ou fragmentos destes. Em algumas modalidades, o constructo de DNA pode ser linearizado antes de conduzir uma reação de transcrição in vitro. O mRNA transcrito é então incubado com um extrato de translação livre de célula apropriado, tal como um extrato reticulócito de coelho, para produzir o polipeptídeo desejado ou fragmento deste.
A invenção também refere-se a variantes dos polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. O termo variante inclui derivados ou análogos desses polipeptídeos.
Figure BRPI0207770B1_D0041
Em particular, as variantes podem diferir na seqüência de aminoácidos de poliepptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, por uma ou mais substituições, adições, anulações, fusões e truncações, que podem estar presentes em qualquer combinação.
As variantes pode ser de ocorrência natural ou criadas in vitro. Em particular, tais variantes podem ser criadas empregando técnicas de engenharia genética tal como mutagênese direcionada por sítio, mutagênese de química aleatória, procedimentos de anulação de Exonuclease III, e técnicas de clonagem padrão. Alternativamente, tais variantes, fragmentos, análogos, ou derivados podem ser criados empregando síntese química ou procedimentos de modificação.
Outros métodos de preparação de variantes são também familiares para aqueles versados na técnica. Esses procedimentos incluem nos quais as seqüências de ácidos nucléicos obtidos de isolados naturais são modificadas para gerar ácidos nucléicos que codificam polipeptídeos tendo características que realçam seu valor em aplicações de laboratório e industriais. Em tais procedimentos, um número amplo de seqüência de variantes tendo um ou mais nucleotídeos diferentes com respeito à seqüência obtida dos isolados naturais são gerados e caracterizados. Tipicamente, esses nucleotídeos diferentes resultam em mudanças de aminoácidos com respeito á polipeptídeos codificados pelos ácidos nucléicos do isolados naturais.
Por exemplo, as variantes podem ser criadas empregando PCR propensa a erros. Em PCR propensa a erros, a PCR é desempenhada sob condições onde a fidelidade da cópia da polimerase de DNA é curta, tal que uma taxa elevada de ponto de mutação é obtida junto com a extensão completa do produto PCR. PCR propensa a erro é descrita em Leung, D.W. e outros, Technique, 1: 11-15, (1989) e Caldwell, R.C. & Joyce G.F., PCR
Methods Applic., 2:28-33, 1992, a divulgação dos quais está incorporada aqui por referência em sua totalidade. Brevemente, em tais procedimentos, os ácidos nucléicos para serem mutagenizados são misturados com inicia69 dores PCR, tampão de reação, MgCI2, MnCI2, polimerase Taq e uma concentração apropriada de dNTPs para alcançar uma taxa elevada no ponto de mutação junto com a extensão completa do produto PCR. Por exemplo, a reação pode ser realizada empregando 20 moles de ácido nucléico para serem mutageinizados, 30pmol de cada iniciador PCR, um tampão de reação compreendendo 50mM de KCI, 10mM de Tris de HCl (pH8,3) e 0,01% de gelatina, 7mM de MgCI2, 0,5mM de MnCI2, 5 unidades de polimerase Taq, 0,2mM de dGTP, 0,2mM de dATP, 1mM de dCTP, e 1mM de dTTP. PCR pode ser realizada durante 30 ciclos de 94°C durante 1 minuto, 45°C durante 1 minuto, 72°C durante 1 minuto. Entretanto, será apreciado que esses parâmetros podem ser variados como apropriados. Os ácidos nucléicos mutagenizados são clonados em um vetor apropriados e as atividades dos polipeptideos codificados pelos ácidos nucléicos mutagenizados são avaliadas.
As variantes podem também ser criadas empregando mutagênese direcionada a oligo nucleotideos para gerar mutações de sítio específicas em qualquer DNA clonado de interesse. A mutagênese de oligonucleotídeos é descrita em Reidhaar-olson, J.F. O Sauer, R. T. e outros, Science, 241-53-57, 1988, a divulgação dos quais está incorporada aqui por referência em sua totalidade. Brevemente, em tais procedimentos uma pluralidade dos oligonucleotídeos de filamentos duplos portando uma ou mais mutações para serem introduzidas no DNA clonado são sintetizados e inseridos no DNA clonado para serem mutagenizado. Os clones contendo o DNA mutagenizados são recuperados e as atividades dos polipeptideos de sua codificação são avaliadas.
Outro método para gerar variantes é agrupamento PCR. O agrupamento PCR envolve o agrupamento de um produto PCR de uma mistura de pequenos fragmentos de DNA. Um número amplo de reações PCR diferentes ocorre em paralelo no mesmo frasco, com os produtos de uma reação afetando os produtos de outra reação. O agrupamento PCR é descrito em Patente dos U.S. Njj 5.965.408, depositada em 9 de julho de 1996, intitulada, Method of DNA Reassembly by Interrupting Synthesis, a divulgação da qual está incorporada aqui por referência em sua totalidade.
Ainda outro método de gerar variantes é mutagênese PCR sexual. Em mutagênese PCR sexual, a recombinação homologa forçada ocorre entre moléculas de DNA de diferentes porém sequências de DNA altamente relacionadas in vitro, como um resultado da fragmentação aleatória da molécula de DNA com base na seqüência homóloga, seguida pela fixação da passagem da extensão do iniciador em uma reação PCR. A mutagênese PCR sexual é descrita em Stemmer, W. P. PNAS, USA, 91:1074710751, 1994, a divulgação do qual está incorporada aqui por referência. Brevemente, em tais procedimentos uma pluralidade de ácidos nucléicos serem recombinados são digeridos com DNAse para gerar fragmentos tendo um tamanho médio de 50-200 nucleotídeos. Os fragmentos do tamanho médio desejado são purificados e re-suspensos em uma mistura PCR. PCR é conduzida sob condições que facilitam a recombinação entre os fragmentos de ácido nucléico. Por exemplo, PCR pode ser realizada por re-suspensão dos fragmentos purificados em uma concentração de 10-30ng/:1 em uma solução de 0,2mM de cada dNTP, 2,2mM de MgCI2) 50mM de KCI, 10mM de Tris HCI, pH 9,0, e 0,1% de Triton X-100. 2,5 unidades de polimerase Taq por 100:1 de mistura de reação são adicionadas e PCR é realizada empregando o seguinte regime: 94°C durante 60 segundos, 94°C durante 30 segundos, 50-55°C durante 30 segundos, 72°C durante 30 segundos (30-45 vezes) e 72°C durante 5 minutos. Entretanto, será apreciado que esses parâmetros possam ser variados quando apropriado. Em algumas modalidades, os oligonucleotídeos podem ser incluídos nas reações PCR. Em outras modalidades, o fragmento Klenow de polimerase DNA I pode ser empregado em uma primeira série de reações PCR e polimerase Taq pode ser empregada em uma série subseqüente de reações PCR. As seqüências recombinantes são isoladas e as atividades dos polipeptideos de sua codificação são avaliadas.
As variantes podem também ser criadas por mutagênese in vivo. Em algumas modalidades, mutações aleatórias em uma seqüência de interesse são geradas propagando-se a seqüência de interesse em uma cepa de bactéria, tal como uma cepa de E.coli, que carrega as mutações em uma ou mais das passagens de reparo de DNA. Tais cepas mutadoras têm uma mutação aleatória mais elevada do que aquelas de um parente do tipo selvagem. Propagar o DNA em uma dessas cepas eventualmente gerará mutações aleatórias no DNA. As cepas mutadoras adequadas para uso durante mutagênese in vivo são descritas em publicação PCT N9 WO 91/16427, publicada em 31 de outubro de 1991, intitulada Methods for Phenotype Creation from Multiple Gene Populations a divulgação das qual está incorporada aqui por referência em sua totalidade.
As variantes podem também ser geradas empregando mutagênese cassete. Na mutagênese cassete uma pequena região de uma molécula de DNA de filamento duplo é substituída com um cassete de oligonucleotídeo sintético que difere da seqüência nativa. O oiigonucleotídeo freqüentemente contém seqüência nativa aleatória completamente e/ou parcialmente.
A mutagênese do conjunto recursivo pode também ser empregada para gerar variantes. A mutagênese de conjunto recursivo é um algoritmo para projetar proteínas (mutagênese de proteína) desenvolvido para produzir populações diversas de mutantes fenotipicamente relacionados àqueles membros que diferem na seqüência de aminoácidos. Este método usa um mecanismo de realimentação para cargas sucessivas de controle de mutagênese cassete combinatória. A mutagênese de conjunto recursivo é descrita emArkin, A.P. e Youvan, D. C., PNAS, USA, 89:7811-7815, 1992, a divulgação dos quais está incorporada aqui por referência em sua totalidade.
Em algumas modalidades, as variantes são criadas empregando mutagênese de conjunto exponencial. A mutagênese de conjunto exponencial é um processo para gerar bibliotecas combinatórias com um percentual elevado de mutantes funcionais e únicos, onde pequenos grupos de resíduos são colocados aleatoriamente em paralelo para identificar, em cada posição alterada, aminoácidos que induzem à proteínas funcionais. A mutagênese de conjunto exponencial é descrita em Delegrave, S., e Youvan, D. C.
Biotechnology Research, 11:1548-1552, 1993, a divulgação dos quais está incorporada aqui por referência em sua totalidade. Mutagênese de sítio direcionado e aleatória são descritas em Arnold, F. H., Current Opinion in Biotechnology, 4:450-455, 1993, a divulgação do qual está incorporada aqui por referência em sua totalidade.
Em algumas modalidades, as variantes são criadas empregando procedimentos de mistura onde as porções de uma pluralidade de ácidos nucléicos que codificam polipeptídeos distintos são fundidas juntas para produzir seqüências de ácidos nucléicos quiméricos que codificam polipeptídeos quiméricos como descrito em Patente U.S. N9 5.965.408, depositada em 9 de julho de 1996, intitulada, Method of DNA Reassembly by Interrupting Synthesis, e Patente U.S. N9 5.939.250, depositada em 22 de maio de 1996, intitulada, Production of Enzymes Having Desired Activities by Mutagenesis, ambas das quais estão incorporadas aqui por referência.
As variantes dos polipeptídeos das seqüências de aminoácidos do Grupo B podem ser variantes nas quais um ou mais resíduos de aminoácidos dos polipeptídeos das seqüências de aminoácido de Grupo B são substituídos com um resíduo de aminoácido conservado ou não-conservado (preferivelmente um resíduo de aminoácido conservado) e tais resíduos de aminoácidos substituídos podem ou não podem ser um codificado pelo código genético.
As substituições conservativas são aquelas que substituem um determinado aminoácido em um polipeptídeo por outro aminoácido de outras características. Tipicamente vistas como substituições conservativas são as seguintes substituições: substituições de um aminoácido alifático tal como alanina, valina, leucina, e isoleucina por outro aminoácido alifático; substituição de uma serina por uma treonina ou vice-versa; substituição de um resíduo acídico tal como ácido aspártico e ácido glutâmico por outro resíduo acídido, substituição de um resíduo portando um grupo amida, tal como asparagina e glutamina, por outro resíduo portanto um grupo amida; permuta de um resíduo básico tal como lisina e arginina por outro resíduo básico; e substituição de um resíduo aromático tal como fenilalanina, tirosi-
Figure BRPI0207770B1_D0042
na, por outro resíduo aromático.
Outras variantes são aquelas em que um ou mais dos resíduos de aminoácidos dos polipeptideos das seqüências de aminoácidos do Grupo B incluem um grupo substituinte.
Ainda outras variantes são aquelas em que o polipeptídeo é associado com outro composto, tal como um composto para aumentar a meiavida do polipeptídeo (por exemplo, polietileno glicol).
As variantes adicionais são aquelas em que os aminoácidos adicionais são fundidos ao polipeptídeo, tal como seqüência líder, uma seqüência secretora, uma seqüência de pró-proteína ou uma seqüência que facilita a purificação, enriquecimento, ou estabilização do polipeptídeo.
Em algumas modalidades, os fragmentos, derivados e análogos retêm as mesmas funções biológicas ou atividades como os polipeptideos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes. Em outras modalidades, o fragmento, derivado, ou análogos incluem uma pró-proteína, tal que o fragmento, derivado, ou análogo possa ser ativado por clivagem da porção de pró-proteína para produzir um polipeptídeo ativo.
Outro aspecto da invenção são polipeptideos ou fragmentos destes que têm pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, ou mais do que cerca de 95% de homologia para um dos polipeptideos das seqüências de aminoácidos do grupo B, e seqüências substancialmente idênticas destes, ou um fragmento compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. A homologia pode ser determinada empregando qualquer dos programas descritos acima que alinhe os polipeptideos ou fragmentos sendo comparados e determina a extensão da identidade do aminoácido ou similaridade entre eles. Será apreciado que a homologia do aminoácido inclui substituições de aminoácidos conservativos tal como aqueles descritos acima.
Os polipeptídeos ou fragmentos tendo homologia de um dos polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, ou um fragmento compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser obtidos isolando-se os ácidos nucléicos codificando-os empregando as técnicas descritas acima.
Alternativamente, os fragmentos ou polipeptídeos homólogos podem ser obtidos através de enriquecimento bioquímico ou procedimentos de purificação. A seqüência dos polipeptídeos potencialmente homólogos ou fragmentos pode ser determinada por digestão proteolítica , eletroforese por gel e/ou microssequenciamento. A seqüência dos fragmentos ou polipeptídeos homólogos prospectivos pode ser comparada a um dos polipeptídeos das seqüências do aminoácido do Grupo B, e seqüências substancialmente idênticas destes, ou um fragmento compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes empregando quaisquer dos programas descritos acima.
Outro aspecto da invenção é um ensaio para identificar fragmentos ou variantes das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, que retêm a função enzimática dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas destes. Por exemplo, os fragmentos ou variantes dos referidos polipeptídeos, podem ser empregados para catalisar reações bioquímicas que indicam que os fragmentos ou variantes retêm a atividade enzimática dos polipeptídeos nas seqüências de aminoácidos do Grupo B.
O ensaio para determinar se os fragmentos de variantes retêm a atividade enzimática dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas destes incluem as etapas de: contatar o fragmento de polipeptideo ou variante com uma molécula de substrato sob condições que permitem o fragmento de polipeptideo ou variante funcionar, e detectar ou aumento no nível do substrato ou uma redução no nível do produto de reação específico da reação entre o polipeptideo e substrato.
Figure BRPI0207770B1_D0043
Os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser empregados em uma variedade de aplicações. Por exemplo, os polipeptídeos ou fragmentos destes podem ser empregados para catalisar reações bioquímicas. De acordo com um aspecto da invenção, existe um processo para utilizar os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou polinucleotídeos codificando tais polipeptídeos para ligações glicosídicas hidrolisadas. Em tais procedimentos, uma substância contendo uma ligação glicosídica (por exemplo, amido) é contatada com um dos polipeptídeos das seqüências de aminoácido do Grupo B, ou seqüências substancialmente idênticas destes sob condições que facilitam a hidrólise da ligação glicosídica.
Os polipeptídeos de seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes, podem também ser empregados na liquefação e sacarificação do amido. Empregando os polipeptídeos ou fragmentos destes desta invenção, a liquefação pode ser realizada em um pH menor do que com prévias enzimas. Em uma modalidade, a liquefação é realizada em um pH de 4,5. Adicionalmente, os polipeptídeos ou fragmentos destes desta invenção são cálcio menos dependente do que enzimas previamente empregadas nesses processos. Na liquefação as amilases são empregadas para hidrolisar o amido. Em uma modalidade preferida, os polipeptídeos ou fragmentos destes desta invenção são termoestáveis em 90-95°C.
Os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes, podem também ser empregados para gerar anticorpos que aglutinam especificadamente aos polipeptídeos ou fragmentos. Os anticorpos resultantes podem ser empregados em procedimentos de
Figure BRPI0207770B1_D0044
cromatografia de imunoafinidade para isolar ou purificar o polipeptídeo ou para determinar se o polipeptídeo está presente em uma amostra biológica. Em tais procedimentos, uma preparação de proteína, tal como um extrato, ou uma amostra biológica é contatada com um anticorpo capaz de aglutinar especificadamente a um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas destes, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes.
Em procedimentos de imunoafinidade, o anticorpo está ligado a um suporte sólido, tal como uma conta ou outra matriz de coluna. A preparação da proteína é colocada em contato com o anticorpo sob as condições em que o anticorpo aglutina especificadamente a um dos polipeptídeos de seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, ou fragmentos destes. Após a lavagem para remover proteínas de ligação não-especificadamente, os polipeptídeos especificadamente ligados são eluídos.
A capacidade das proteínas em uma amostra biológica aglutinar ao anticorpo pode ser determinada empregando qualquer de uma variedade dos procedimentos familiares para aqueles versados na técnica. Por exemplo, a aglutinação pode ser determinada rotulando-se o anticorpo com um rótulo detectável tal como um agente fluorescente, um rótulo enzimático, ou um radioisótopo. Alternativamente, a aglutinação do anticorpo na amostra pode ser detectada empregando um anticorpo secundário tendo um tal rótulo detectável. Ensaios particulares incluem ensaios ELISA, ensaios sanduíche, radioimunoensaios, e Western Blots.
Os anticorpos policlonais gerados contra os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser obtidos por injeção direta dos polipeptídeos em um animal ou administrando-se os polipeptídeos a um animal, por exemplo, um não-humano. O anticorpo desse modo obtido então aglutinará o polipeptídeo propriamente dito. Desta maneira, ainda uma seqüência codificando somente um fragmento do polipeptídeo pode ser empregada para gerar anticorpos que podem aglutinar para aqueles polipeptídeos nativos inteiros. Tais anticorpos podem então ser empregados para isolar o polipeptídeo a partir de poli5 peptídeos que expressam células.
Para preparação de anticorpos monoclonais, qualquer técnica que fornece anticorpos produzidos por cultura de linhagem de células contínua pode ser empregada. Os exemplos incluem a técnica da hibridoma (Kohler e Milstein, Nature, 256:495-497, 1975, a divulgação da qual é incorpo10 rada aqui por referência), a técnica de trioma, a técnica de hibridoma de célula B humana (Kozbor e outros, Immunology Today 4:72, 1983, a divulgação da qual está incorporada aqui por referência), e a técnica de hibridoma EBV (cole e outros, 1985, em Monoclonal Antibodies and Câncer Therapy, Alan R. Liss. Inc., pp.77-96, a divulgação da qual está incorporada aqui por referência).
As técnicas descritas para a produção de anticorpos de cadeia única (Patente U.S. NQ 4.946.778, a divulgação da qual está incorporada aqui por referência) podem ser adaptadas para produzir anticorpos de cadeia única para os polipeptídeos das seqüências de aminoácidos do Grupo
B, e seqüências substancialmente idênticas a estas ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. Alternativamente, os camundongos transgênicos podem ser empregados para expressar anticorpos humanizados para esses polipeptídeos ou fragmentos destes.
Anticorpos gerados contra os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser empregados na peneiração para polipeptídeos similares de outros organismos e amos30 tras. Em tais técnicas, os polipeptídeos do organismo são contactados com o anticorpo e aqueles polipeptídeos que especificadamente aglutinam o anticorpo são detectados. Qualquer dos procedimentos descritos acima pode
Figure BRPI0207770B1_D0045
ser empregado para detectar a aglutinação do anticorpo. Um tal ensaio de peneiração é descrito em Methods for Measuring Cellulase Activities, Methods in Enzymology, Volume 160, pp. 87-116, que está aqui incorporado por referência.
Como empregado aqui o termo seqüência de ácido nucléico como apresentada em SEQ ID N2!: 1, 3, 5, 9, 11, 13, 15, 17, 19, 21,23, 25, 27, 29, 31, 33, 35, 37, 39, 41,43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65,
67, 69, 71 I, 73, 75, 77, 7I 3, 81, 83, 85, 87, 89, 91, 93, 9 5, 97, 99, 101, 103,
105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133,
135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163,
165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193,
195, 197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223,
225, 227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253,
255, 257, 259, 261, 263, 265, 267, 269, 271, 273, 275, 277, 279, 281, 283,
285, 287, 289, 291, 293, 295,: 297, 299 abrange a s seq üências de nuci leotí-
deo de seqüências de ácido nucléico do Grupo A, e as seqüêncías substancialmente idênticas a estas, bem como as seqüências homólogas para seqüências de ácido nucléico do Grupo A, e fragmentos destas e seqüências complementares para todas as seqüências precedentes. Os fragmentos incluem porções de SEQ ID l\T: 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41,43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81,83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135,
137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165,
167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195,
197, 199, 201, 203, 205, 207, 209, 211, 213, 215, 217, 219, 221, 223, 225,
227, 229, 231, 233, 235, 237, 239, 241, 243, 245, 247, 249, 251, 253, 255,
257, 259, 261, 263, 265, 267, 269, 271, 273, 275, 277, 279, 281, 283, 285,
287, 289, 291,293, 295, 297 e 299, compreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 nucleotídeos consecutivos das seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas destas. A seqüência homóloga e fragmentos das se-
Figure BRPI0207770B1_D0046
qüências do ácido nucléico do Grupo A, e seqüências substancialmente idênticas destas, referem-se a uma seqüência tendo pelo menos 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, ou 50% homólogos dessas seqüências. A homologia pode ser determinada empregando qualquer dos programas de computador e parâmetros descritos aqui, incluindo 3,0t78 de versão FASTA com os parâmetros característicos. A seqüência homóloga pode incluir seqüências de RNA em que as uridinas substituiem as timinas nas seqüências de ácido nucléico como apresentadas nas seqüências de ácidos nucléicos do Grupo A. A seqüência homóloga pode ser obtida empregando qualquer dos procedimentos descritos aqui ou pode resultar da correção de erro de seqüência. Será apreciado que a seqüência de ácido nucléico como apresentada na seqüência de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, pode ser representada no formato de caráter único tradicional (Observe o revestimento dianteiro interno de Stryer, Lubert. Biochemistry, 3a edição, W. H. Freeman & Co., New York) ou em qualquer outro formato que registre a identidade do nucleotídeo em uma seqüência.
Como empregado aqui o termo uma seqüência de polipeptídeo como apresentada em SEQ ID NX 2, 4, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134,
136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164,
166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194,
196, 198, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226,
228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256,
258, 260, 262, 264, 266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286,
288, 290, 292, 294, 296, 298 abrange a seqüência de polipeptídeo das seqüências de aminoácidos do Grupo B, e as seqüências substancialmente idênticas a estas, que são codificadas por uma seqüência como apresentada em SEQ ID N^: 2, 4, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76,
78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142,
144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172,
174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 202, 204,
206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234,
236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256, 258, 260, 262, 264,
266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286, 288, 290, 292, 294,
296, 298, seqüências de polipeptídeo homólogas aos polipeptídeos da seqüência de aminoácido do Grupo B, e as seqüências substancialmente idênticas a estas, ou fragmentos de qualquer das seqüências precedentes. As seqüências de polipeptídeos homólogas referem-se a uma seqüência de polipeptídeo tendo pelo menos 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55% ou 50% homólogo .para uma das seqüências de polipeptídeos da seqüência de aminoácidos do Grupo B. A homologia pode ser determinada empregando qualquer dos programas de computadores e parâmetros descritos aqui, incluindo 3,0t78 de versão FASTA com os parâmetros característicos ou com qualquer parâmetro modificado. A seqüência homóloga pode ser obtida empregando qualquer dos procedimentos descritos aqui ou qualquer resultado da correção de erro de seqüência. Os fragmentos de polipeptídeos compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos dos polipeptídeos da seqüência de aminoácidos do Grupo B, e as seqüências substancialmente idênticas destes. Será apreciado que os polipeptídeos codificados como apresentados na seqüência de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estes, podem ser representados no formato de caráter único tradicional ou formato de três letras (Observe o revestimento dianteiro interno de Stryer, Lubert, Biochemistry, 3a Edição, W. H. Freeman & Co., New York) ou em qualquer outro formato que refere-se à identidade dos polipeptídeos em uma seqüência.
Será apreciado para aqueles versados na técnica que uma seqüência de ácido nucléico como apresentada em SEQ ID N7 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51,
53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91,
93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123,
125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153,
155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183,
185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211, 213,
215, 217, 219, 221, 223, 225, 227, 229, 231, 233, 235, 237, 239, 241, 243,
245, 247, 249, 251, 253, 255, 257, 259, 261, 263, 265, 267, 269, 271, 273,
275, 277, 279, 281, 283, 285, 287, 289, 291, 293, 295, 297, 299 . e um; a se-
qüência de polipeptídeo como apresentada em SEQ ID Nfj 2, 4, 6, 10, 12,
14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 42, 44, 46, 48, 50, 52,
54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 80, 92,
94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 12, 124,
126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154,
156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184,
186, 188, 190, 192, 194, 196, 198, 202, 204, 206, 208, 210, 212, 214, 216,
218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246,
248, 250, 252, 254, 256, 258, 260, 262, 264, 266, 268, 270, 272, 274, 276,
278, 280, 282, 284, 286, 288, 290, 292, 294, , 296, 298 podem ser armaze-
nadas, registradas, e preparadas por qualquer meio que pode ser lido e acessado por um computador. Como empregado aqui, as palavras registrado e armazenado refere-se a um processo para informação de armazenagem em um meio de computador. Um técnico versado pode adotar facilmente qualquer dos métodos atualmente conhecidos para registrar a informação em um meio legível por computador para gerar preparações compreendendo uma ou mais seqüências de ácidos nucléicos como apresentadas em seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, uma ou mais seqüências de polipeptídeos como apresentadas nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destas. Outro aspecto da invenção é um meio legível por computador tendo registrado neste pelo menos 2, 5, 10, 15, ou 20 seqüências de ácidos nucléicos como apresentadas nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas.
Outro aspecto da invenção é um meio legível por computador tendo registrado nele uma ou mais das seqüências de ácido nucléico como apresentadas nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas. Outro aspecto da invenção é um meio legível por computador tendo registrado neste uma ou mais das seqüências de polipeptídeos como apresentadas nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas nestas. Outro aspecto da invenção é um meio legível por computador tendo registrado nestes pelo menos 2, 5, 10, 15, ou 20 das seqüências como apresentadas acima.
O meio legível por computador inclui meio legível magneticamente, meio de leitura óptica, meio de leitura eletrônica e meio magnético óptico. Por exemplo, o meio legível por computador pode ser um disco rígido, um disco mole, uma fita magnética, CD-ROM, Disco Versátil Digital (DVD), Memória de Acesso Aleatória (RAM), ou Memória Somente para Leitura (ROM) bem como outros tipos de meios conhecidos para aqueles versados na técnica.
As modalidades da invenção incluem sistemas (por exemplo sistemas com base na internet), particularmente sistemas de computador que armazenam e manipulam a seqüência de informação descrita aqui. Um exemplo de um sistema de computador 100 é ilustrado na forma de diagramas de blocos na Figura 1. Como empregado aqui, um sistema de computador refere-se aos componentes hardware, componentes software, e componentes de armazenamento de dados empregados para analisar uma seqüência de nucleotídeo de uma seqüência de ácido nucléico como apresentada nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas nestas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácidos do Grupo Β. O sistema de computador 100 tipicamente inclui um processador para processar, acessar e manipular a seqüência de dados. O processador 105 pode ser qualquer tipo bem-conhecido de unidade de processamento central, tal como, por
Figure BRPI0207770B1_D0047
exemplo, o Pentium III da Intel Corporation, ou processador similar do Sun, Motorola, Compaq, AMD ou International Business Machines.
Tipicamente o sistema de computador 100 é um sistema de propósito geral que compreende o processador 105 e um ou mais componentes de armazenamento de dados internos 110 para armazenamento de dados, e um ou mais dispositivos de correção de dados para corrigir os dados armazenados nos componentes de armazenamento de dados. Um técnico versado na técnica pode facilmente apreciar que qualquer um dos sistemas de computadores correntemente disponíveis é adequado.
Em uma modalidade particular, o sistema de computador 100 inclui um processador 105 conectado a um barramento que está conectado a uma memória principal 115 (preferivelmente implementado como RAM) e um ou mais dispositivos de armazenamento de dados internos 110, tal como um disco rígido e/ou outro meio legível por computador tendo registrado os dados nestes. Em algumas modalidades, o sistema de computador 100 ainda inclui um ou mais dispositivos de correção de dados 118 para ler os dados armazenados nos dispositivos de armazenamento de dados internos 110.
O dispositivo de correção de dados 118 pode representar, por exemplo, um drive de disco mole, um drive de disco compacto, um drive de fita magnética, ou um modem capaz da conexão de um sistema de armazenamento de dados à distância (por exemplo através da internet)etc. Em algumas modalidades, o dispositivo de armazenamento de dados internos 110 é um meio legível por computador removível tal como um disco macio, um disco compacto, uma fita magnética, etc contendo a lógica de controle e/ou os dados registrados destes. O sistema de computador 100 pode vantajosamente incluir ou ser programado pelo software apropriado para ler a lógica do controle e/ou os dados dos componentes de armazenamento de dados uma vez inseridos no dispositivo de correção de dados.
O sistema de computador 100 inclui um monitor 120 que é empregado para exibir o rendimento para um usuário do computador. Deveria também ser notado que o sistema de computador 100 pode ser ligado a ou84 tros sistemas de computador 125a-c em uma rede ou rede de área ampla para fornecèr acesso centralizado ao sistema de computador 100.
Software para acessar e processar as seqüências de nucleotídeo de uma seqüência de ácidos nucléicos como apresentadas nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de amino ácidos do Grupo B, e seqüências substancialmente idênticas nestas, (tal como ferramentas de busca, ferramentas de comparação, e ferramentas de modelação, etc) pode residir na execução durante a memória principal 115.
Em algumas modalidades, o sistema de computador 100 pode ainda compreender um algoritmo de comparação de seqüência para comparar uma seqüência de ácido nucléico como apresentada em seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destas, armazenados em um meio legível por computador para uma seqüência de nucleotídeo ou polinucleotídeo armazenadas em um meio legível por computador. Um algoritmo de comparação de seqüência refere-se a um ou mais programas que são implementados (localmente ou remotamente) no sistema de computador 100 para comparar uma seqüência de nucleotídeo com outras seqüências de nucleotídeos e/ou compostos armazenados em um dispositivo de armazenamento de dados. Por exemplo, o algoritmo de comparação de seqüência pode comparar as seqüências de nucleotídeos de uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas destas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácidos no Grupo B, e seqüências substancialmente idênticas nestas, armazenadas em meio legível por computador para armazenar as seqüências de referências de um meio legível por computador para identificar homologias ou motivos estruturais. Vários programas de comparação de seqüência identificados em outro lugar neste relatório descritivo de patente são particularmente contemplados para uso neste aspecto da invenção. As homologias de seqüência de ácido nucléico e/ou proteína podem ser avaliadas empregando qualquer das variedades de algoritmo de comparação de seqüência e programas conhecidos na técnica. Tais algoritmos e programas incluem, porém não estão limitados a TBLASTN, BLASTP, FASTA, TFASTA, e CLUSTALW (Pearson e Lipman, Proc. Natl. Acad. Sei. USA 85(8):2444-2448, 1988; Altschul e outros J. Mol. Biol. 215(3): 403-410, 1990; Thompson e outros, Nucleic Acids Res. 22(2): 46734680, 1994; Higgins e outros, Methods Enzymol. 266:383-402, 1996, Altschul e outros, J. Mol. Biol 215(3):403-410, 1990; Altschul e outros, Nature Genetics 3:266-272, 1993).
A homologia ou identidade é freqüentemente medida empregando o software de anáíise de seqüência (por exemplo, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, Wl 53705). Tais seqüências similares de software semelhantes designando-se graus de homologia para várias anulações, substituições e outras modificações. Os termos homologia e identidade no contexto de dois ou mais ácidos nucléicos ou seqüências de polipeptídeos, referem-se a duas ou mais seqüências ou sub-seqüências que são as mesmas ou têm um percentual especificado de resíduos de aminoácidos ou nucleotídeos que são os mesmos quando comparados e alinhados para correspondência máxima durante uma janela de comparação ou região designada como medida empregando qualquer número de algoritmos de comparação de seqüência ou por alinhamento manual e inspeção visual.
Para comparação de seqüência, tipicamente uma seqüência atua como uma seqüência de referência, àquela seqüência teste quando comparado. Quando empregando um algoritmo de comparação de seqüência, seqüências de referência e teste são registradas em um computador, coordenadas subseqüentes são designadas, se necessário e parâmetros de programa de algoritmo de seqüência são designados. Os parâmetros de programa característicos podem ser empregados, ou parâmetros alternati86 vos podem ser designados. O algoritmo de comparação de seqüência em seguida calcular o percentual das identidades de seqüência durante as seqüências testes relativas à seqüência de referência, com base nos parâmetros do programa.
Uma janela de comparação, como empregado aqui, inclui referência para um segmento de qualquer um dos números de posições contíguas selecionadas a partir do grupo consistindo em 20 a 600, freqüentemente cerca de 50 a cerca de 200, mais freqüentemente cerca de 100 a cerca de 150 na qual uma seqüência pode ser comparada a uma seqüência de referência do mesmo número de posições contíguas após as duas seqüências serem otimamente alinhadas. Os métodos de alinhamento da seqüência para comparação são bem-conhecidos na técnica. O alinhamento ótimo das seqüências para comparação pode ser conduzido, por exemplo, pelo algoritmo de homologia local de Smith & Waterman, Adv. Appl. Math.
2:482, 1981, pelo algoritmo de alinhamento da homologia de Needleman &
Wunsch, J. Mol. Biol 48:443, 1970; pela pesquisa da similaridade do método de person & Lipman, Proc. Nat'l. Acad. Sei. USA 85:2444, 1988, por implementações computadorizadas desses algoritmos (GAP, BESTFIT, FASTA, e TFASTA na Wisconsin Genetics Software Package, Genetics Computer
Group, 575 Science Dr., Madison, Wl), ou por alinhamento manual e inspeção visual. Outros algoritmos para determinar a homologia ou a identidade incluém, por exemplo, além de um programa BLAST (Basic Local Alignment Search Tool at the National Center for Biological Information), ALIGN, AMAS (Analysis of Multiply Aligned Sequences), AMPS (Protein Multiple Sequence
Alignmemt), ASSET (Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (Blocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman algorithm, DARWIN, Las Vegas algorithm, FNAT (Forced
Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence Analysis Package), GAP (Global Alignment Construction Q Analysis Workbench), MAP (Multiple Alignment Program),
Figure BRPI0207770B1_D0048
GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison), LALIGN (Local Sequence Alignment), LCP (Local Content Program), MACAW (Multiple Alignment Program), MBLKP, MBLKN, ΡΙΜΑ, (Pattern-lnduced Multisequence Alignment), SAGA (Sequence Alignment by Genetic Algorithm) e WHAT-IF. Tais programas de alinhamento podem ser empregados para rede de banco de dados de genoma para identificar seqüências de polinucleotídeos tendo seqüências substancialmente idênticas. Vários bancos de dados de genoma são disponíveis, por exemplo, uma porção substancial para o genoma humano é disponível como parte do Projeto de seqüenciamento do Genoma Humano(J.Roach, http://weber.u.Washington.edu/-roach/human_genome_progress 2.html) (Gibbs, 1995). Pelo menos vinte e um outros genomas têm anteriormente sido seqüenciados, incluindo por exemplo, M. genitalium (Fraser e outros, 1995), M. jannaschii (Bult e outros, 1996), H. influenzae (Fleischmann e outros, 1995), E. coli (Blattner e outros, 1997), e levedura (S. cerevisiae) (Mewes e outros, 1997), e D.melanogaster (Adams e outros, 2000). O Progresso significante tem também sido feito no seqüenciamento de genomas de organismo de modelo, tal como camundongos, C. elegans, e Arabadopsis sp. Vários bancos de dados contendo informação genômica anotada com algumas informações funcionais são mantidos por diferentes organizações, e são acessíveis através da internet, por exemplo, http://wwwtigr.org/tdb; http://www.genetics.wisc.edu.; http://genome-www.stanford.edu/~ball;
http://hiv-web.lanl.gov; http://www.ncbi.nlm.nih.gov; http://www.ebi.ac.uk; http://Pasteur.fr/other/biology; and http://www.genome.wi.mit.edu.
Um exemplo de um algoritmo útil são algoritmo BLAST e BLAST 2.0, que são descritos em Altschul e outros, Nuc. Acids Res.25:3389-3402, 1977, e Altschull e outros, J. Mol. Biol. 215:403-410, 1990 respectivamente. Software para desempenhar análise BLAST é publicamente disponível através do National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/)· Este algoritmo envolve primeiro identificar os pares de seqüência de marca elevada (HSPs) identificando-se palavras pequenas de W extensão na seqüência da pergunta, que ou iguala ou satisfaz alguns valores positivos com algumas marcas T quando alinhadas com uma palavra da mesma extensão em uma seqüência de banco de dados. T é re. ferido como o princípio da marca da palavra adjacente (Altschul e outros, supra). Essas pequenas expressões contíguas iniciais atuam como sementes para pesquisas de iniciação HSPs por mais tempo encontrada contendoas. As comparações das expressões contíguas iniciais são estendidas em ambas direções junto com cada seqüência durante até que a marca de alinhamento cumulativa possa ser aumentada. As marcas cumulativas são calculadas, empregando, para seqüências de nucleotídeos, os parâmetros M (marca prêmio para um par de resíduos semelhantes; sempre >0). Para as seqüências de aminoácidos, uma matriz de marca é empregada para calcular a marca cumulativa. A extensão das expressões contíguas em cada direção é detida quando: a queda da marca de. alinhamento cumulativo pela quantidade X de seu valor máximo alcançado, a marca cumulativa parte de zero ou abaixo, devido à acumulação de um ou mais alinhamentos de resíduos de marcas negativas; ou o fim ou a seqüência é reagida. Os parâmetros de algoritmo BLAST W, T, e X determinam a sensibilidade e velocidade do alinhamento. O programa BLASTN (para seqüência de nucleotídeos) emprega como características uma longa extensão (W) de 11, uma expectativa (E) de 10, M= 5, N= -4 e uma comparação de ambos filamentos. Para seqüências de aminoácidos, o programa BLASTP usa como característica uma longa extensão de 3, e expectativa (E) de 10, e a matriz de marcação BLOSUM62 (observe Henikoff & Henikoff, Proc. Natl. Acad. Sei. USA 89:10915, 1989) alinhamentos (B) de 50, expectativa (E) de 10, M= 5, N -4, e uma comparação de ambos filamentos.
O algoritmo BLAST também realiza uma análise estatística da similaridade entre duas seqüências (observe, por exemplo Karlin & Altschul, Proc. Natl. Acad. Sei. USA 90:5873, 1993). Uma medida da similaridade fornecida por algoritmo BLAST é a probabilidade da soma ser menor (P(N)), que fornece uma indicação da probabilidade pela qual uma conbinação entre dois nucleotídeos ou seqüência de aminoácidos ocorrería por alteração. Por exemplo, um ácido nucléico é considerado similar a uma seqüência de
Figure BRPI0207770B1_D0049
referência se a probabilidade de soma menor em uma comparação do ácido nucléico teste com o ácido nucléico de referência é menos do que cerca de 0,2, mais preferivelmente menos do que cerca de 0,01, e mais preferivelmente menos do que cerca de 0,001.
Em uma modalidade, as homologias da seqüência de ácido nucléico e proteína são avaliadas empregando Basic Local Alignment Search Tool (BLAST). Em particular, cinco programas BLAST específicos são empregados para realizar o seguinte teste:
(1) BLASTP e BLAST3 comparam uma seqüência examinada de aminoácido contra um banco de dados da seqüência de proteína;
(2) BLASTN compara uma seqüência examinada de nucleotídeo contra um banco de dados da seqüência de nucleotídeo;
(3) BLASTX compara os produtos.de translação conceituais de seis estruturas de uma seqüência de nucleotídeo examinada (ambos filamentos) contra um banco de dados da seqüência da proteína;
(4) TBLASTN compara uma seqüência de proteína examinada contra um banco de dados da seqüência de nucleotídeo traduzida em todas as seis estruturas de leitura (ambos filamentos); e (5) TBLASTX compara as translações das seis estruturas de uma seqüência examinada de nucleotídeo contra as translações de seis estruturas de um banco de dados da seqüência de nucleotídeo.
O programa BLAST identifica seqüências homólogas por identificação de segmentos similares, que são referidos aqui como pares de segmento de marca elevada, entre uma seqüência de ácido nucléico ou aminoácido examinada e uma seqüência teste que é preferivelmente obtida de um banco de dados da seqüência de ácido nucléico de proteína. Os pares do segmento de marca elevada são preferivelmente identificados (isto é, alinhados) através de uma matriz de marcação, muitos dos quais são conhecidos na técnica. Preferivelmente, a matriz de marcação empregada é a matrix BLOSUM62 (Gonnet e outros, Science 256: 1443-1445, 1992; Henikoff e Henikoff, Proteins, 17:49-61 1993), Menos preferivelmente, as matrizes PAM ou PAM250 podem também ser empregadas (observe, por exemplo, Schwartz e Dayhoff, eds. 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Os programas BLAST são acessíveis através da Biblioteca Nacional de Medicina U.S., por exemplo, em www.ncbi.nlm.nih.gov.
Os parâmetros empregados com os algoritmos acima podem ser adaptados dependendo da extensão da seqüência e grau da homologia estudada. Em algumas modalidades, os parâmetros podem ser os parâmetros de omissão empregados pelos algoritmos na ausência de instruções do usuário.
A Figura 2 é um diagrama de fluxo ilustrando uma modalidade de um processo 200 para comparar uma nova seqüência de proteína ou nucleotídeo com um banco de dados das seqüências a fim de determinar os níveis de homologia entre a nova seqüência e as seqüências no banco de dados. O banco de dados das seqüências pode ser um banco de dados privado armazenado em um sistema de computador 100, ou um banco de dados público tal como GENBANK que está disponível na Internet.
O processo 200 inicia em um estado inicial 201 e então move-se para um estado 202 onde a nova seqüência a ser comparada é armazenada em uma memória em um sistema de computador 100. Como discutido acima, a memória pode ser qualquer tipo de memória, incluindo RAM ou um dispositivo de armazenamento interno.
O processo 200 então se move para o estado 204 onde o banco de dados das seqüências é aberto para análise e comparação. O processo 200 então se move para um estado 206 onde a primeira seqüência armazenada no banco de dados é lida em uma memória no computador. Uma comparação é então realizada em um estado 210 para determinar se a primeira seqüência é a mesma como a segunda seqüência. É importante observar que esta etapa não está limitada a realizar uma comparação exata entre a nova seqüência e a primeira seqüência no banco de dados. Os métodos bem-conhecidos são conhecidos por aqueles de experiência na técnica para comparar duas seqüências de proteína ou nucleotídeo, mesmo se elas não
Figure BRPI0207770B1_D0050
são idênticas. Por exemplo, as aberturas podem ser introduzidas em uma seqüência a fim de aumentar o nível de homologia entre as duas seqüências testadas. Os parâmetros que controlam ou as aberturas ou outras características que são introduzidas em uma seqüência durante a comparação são normalmente introduzidos pelo usuário do sistema do computador.
Uma vez que uma comparação das duas seqüências tenha sido realizada no estado 210, uma determinação é feita em um estado de decisão 210 se as duas seqüências são as mesmas. Certamente, o termo mesma não está limitado a seqüências que são absolutamente idênticas. As seqüências que estão nos parâmetros de homologia introduzidos pelo usuário serão marcadas como mesmas no processo 200.
Se uma determinação é feita que as duas seqüências são a mesma, o processo 200 se move para um estado 214 onde o nome da seqüência do banco de dados é exibido pelo usuário. Este estado notifica o usuário que a seqüência com o nome exibido executou as restrições de homologia que foram introduzidas. Uma vez que o nome da seqüência armazenada é exibido pelo usuário, o processo 200 se move para um estado de decisão 218 onde uma determinação é feita se a maioria das seqüências existe no banco de dados. Se as seqüências não mais existem no banco de dados, então o processo 200 termina em um estado final 220. Entretanto, se a maioria das seqüências existem no banco de dados, então o processo 200 se move para um estado 224 onde um indicador é movido para a próxima seqüência no banco de dados a fim de que ele possa ser comparado com a nova seqüência. Desse modo, a nova seqüência é alinhada e comparada com todas as seqüências do banco de dados.
Seria observado que se uma determinação foi feita no estado de decisão 212 no qual as seqüências não foram homólogas, então o processo 220 se moveria imediatamente para o estado de decisão 218 a fim de determinar se qualquer outra seqüência estava disponível no banco de dados para comparação.
Conseqüentemente, um aspecto da invenção é um sistema de computador compreendendo um processador, um dispositivo de armazena92 mento de dados tendo armazenado neste uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, um dispositivo de armazenamento de dados tendo recuperavelmente armazenado neste seqüências de nucleotídeo de referência ou seqüências de polipeptídeo a serem comparadas com uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, e um çomparador de seqüência para conduzir a comparação. O çomparador de seqüência pode indicar um nível de homologia entre as seqüências comparadas ou identifica os motivos estruturais no código de ácido nucléico descrito acima das seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do grupo B, e seqüências substancialmente idênticas a esta, ou pode identificar motivos estruturais nas seqüências que são comparados com esses códigos de ácido nucléico e códigos de polipeptídeo. Em algumas modalidades, o dispositivo de armazenamento de dados pode ter armazenado nele as seqüências de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácido nucléico como apresentadas nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências de polipeptídeo como apresentadas nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.
Outro aspecto da invenção é um método para determinar o nível de homologia entre uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, e uma seqüência de nucleotídeo de referência. O método inclui ler o código de ácido nucléico ou o código de polipeptideo e a seqüência de polipeptideo ou nucleotídeo de referência através do uso de um programa de computador que determina os níveis de homologia e determinar a homologia entre o código de ácido nucléico ou código de polipeptídeo e a seqüência de polipeptideo ou nucleotídeo de referência com o programa do computador. O programa do computador pode ser qualquer de vários programas de computador para determinar os níveis de homologia, incluindo aqueles especificadamente enumerados aqui, (por exemplo, BLAST2N com o parâmetro de omissão ou com qualquer parâmetro modificado). O método pode ser implementado empregando os sistemas de computador descritos acima. O método pode também ser realizado lendo-se pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácido nucléico descritas acima como apresentadas nas seqüências de ácido nucléico do Grupo A, ou as seqüências de polipeptideo como apresentadas nas seqüências de aminoácido do Grupo B através do uso do programa de computador e determinar a homologia entre os códigos de ácido nucléico ou códigos de polipeptideo e seqüências de nucleotídeo de referência e seqüências de polipeptideo.
Figura 3 é um diagrama de fluxo ilustrando uma modalidade de um processo 250 em um computador para determinar se duas seqüências são homólogas. O processo 250 inicia em um estado inicial 252 e então se move para um estado 254 onde a primeira seqüência a ser comparada é armazenada em uma memória. A segunda seqüência a ser comparada é então armazenada em uma memória em um estado 256. O processo 250 então se move para um estado 260 onde a primeira posição na primeira seqüência é lida e em seguida para um estado 262 onde a primeira posição da segunda seqüência é lida. Deveria ser entendido que se a seqüência é uma seqüência de nucleotídeo, então a posição normalmente seria ou A, T, C, G ou U. Se a seqüência é uma seqüência de proteína, então está preferivelmente no código de aminoácido de letra minúscula a fim de que as primeira e segunda seqüências possam ser facilmente comparadas.
Uma determinação é então feita em um estado de decisão 264 se as duas posições são as mesmas. Se elas são as mesmas então o processo 250 se move para um estado 268 onde as posições próximas nas primeira e segunda seqüências são lidas. Uma determinação é então feita se as posições próximas são as mesmas. Se elas são, então o processo 250 contínua este loop até que as duas posições não sejam mais as mesmas. Se uma determinação é feita de que as duas posições próximas não são as mesmas, o processo 250 se move para um estado de decisão 274 para determinar se existem mais posições ou seqüências a serem lidas.
Se não existe mais posição a ser lida, então o processo 250 se move para um estado 276 onde o nível de homologia entre as primeira e segunda seqüências é exibido pelo usuário. O nível de homologia é determinado calculando-se a proporção de posições entre as seqüências que foram as mesmas da quantidade total de seqüências na primeira seqüência. Desse modo, se todas as posições em uma primeira seqüência de 100 nucleotídeos alinhada com uma das posições em uma segunda seqüência, o nível de homologia seria de 100%.
Alternativamente, o programa de computador pode ser um programa de computador que compara as seqüências de nucleotídeo de uma seqüência de ácido nucléico como apresentadas na invenção, com uma ou mais seqüências de nucleotídeo de referência a fim de determinar se o código do ácido nucléico das seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, difere de uma seqüência de ácido nucléico de referência em uma ou mais posições. Opcionalmente um tal programa registra a extensão e identidade dos nucleotídeos inseridos, anulados ou substituídos com respeito à seqüência ou do polinucleotídeo de referência ou de uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta. Em uma modalidade, o programa de computador pode ser um programa que determina se uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, contêm um único polimorfismo de nucleotídeo (SNP) com respeito a uma seqüência de nucleotídeo de referência.
Conseqüentemente, outro aspecto da invenção é um método para determinar se uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, diferem em um ou mais nucleotídeos de uma seqüência de nucleotídeo de referência compreendendo as etapas de leitura do código de ácido nucléico e as seqüências de nucleotídeo de referência através do uso de um programa de computador que identifica as diferenças entre as seqüências de ácido nucléico e identificar as diferenças entre o código de ácido nucléico e a seqüência de nucleotídeo de referência com o programa de computador. Em algumas modalidades, o programa de computador é um programa que identifica polimorfismos de nucleotídeo únicos. O método pode ser implementado pelos sistemas de computador descritos acima e o método ilustrado na Figura 3. O método pode.também ser realizado lendose pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácido nucléico como apresentadas nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, e a$ seqüências de nucleotídeo de referência através do uso do programa de computador e identificar as diferenças entre os códigos de ácido nucléico e as seqüências de nucleotídeo de referência com o programa de computador.
Em outras modalidades o sistema com base no computador pode ainda compreender um identificador para identificar características em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta.
Um identificador refere-se a um ou mais programas que identifica certas características em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta. Em uma modalidade, o identificador pode compreender um programa que identifica uma estrutura de leitura aberta em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta.
A figura 5 é um diagrama de fluxo ilustrando uma modalidade de um processo do identificador 300 para detectar a presença de uma característica em uma seqüência. O processo 300 inicia em um estado inicial 302 e então se move para um estado 304 onde a primeira seqüência que será verificada quanto às características está armazenada em uma memória 115 no sistema de computador 100. O processo 300 então se move para um estado 306 onde um banco de dados das características de seqüência é aberto. Um tal banco de dados incluiría uma lista de cada dos atributos da característica junto com o nome da característica. Por exemplo, um nome da característica poderia ser Códon de Iniciação e o atributo seria ATG. Outro exemplo seria o nome da característica Caixa TAATAA e o atributo da característica seria TAATAA. Um exemplo de um tal banco de dados é produzido pela Universidade de Wisconsin Genetics Computer Group (www.gcg.com). Alternativamente, as características podem ser motivos de polipeptídeos estruturais tal como alfa hélices, beta folhas, ou motivos de polipeptídeo funcional tal como sítios ativos enzimáticos, motivos de hélicegiro-hélice ou outros motivos conhecidos por aqueles versados na técnica.
Uma vez que o banco de dados das características é aberto no estado 306, o processo 300 se move para um estado 308 onde a primeira característica é lida no banco de dados. Uma comparação do atributo da primeira característica com a primeira seqüência é então feita em um estado 310. Uma determinação é então feita em um estado de decisão 316 se o atributo da característica foi constatado na primeira seqüência. Se o atributo foi constatado, então o processo 300 se move para um estado 318 onde o nome da característica constatada é exibido pelo usuário.
O processo 300 então se move para um estado de decisão 320 onde uma determinação é feita se as características em movimento existem no banco de dados. Se as características não mais existem, então o processo 300 termina em um estado final 324. Entretanto, se mais características existem no banco de dados, então o processo 300 lê as características pró97 ximas da seqüência em um estado 326 e loops voltam para o estado 310 onde o atributo da próxima característica é comparado com a primeira seqüência.
Seria observado, que se os atributos de características não são constatados na primeira seqüência no estado de decisão 316, o processo 300 se move diretamente para o estado de decisão 320 a fim de determinar se mais características existem no banco de dados.
Conseqüentemente, outro aspecto da invenção é um método para identificar uma característica em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta,, compreendendo ler os códigos de ácido nucléico ou códigos de polipeptídeo através do uso de um programa de computador que identifica as características nesta e identificar as características nos códigos de ácido nucléico com o programa de computador. Em uma modalidade, o programa de computador compreende um programa de computador que identifica estruturas de leitura aberta. O método pode ser realizado por leitura de uma única seqüência ou pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 das seqüências de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências de polipeptídeo como apresentadas nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, através do uso do programa de computador e identificar as características nos códigos de ácido nucléico ou códigos de polipeptídeo com o programa de computador.
Uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, podem ser armazenadas e manipuladas em diversos programas de processador de dados em uma variedade de formatos. Por exemplo, uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, podem ser armazenadas como um texto em um campo de processamento de palavras, tal como MicrosoftWORD ou WORDPERFECT ou como um campo ASCII em uma variedade de famílias de programas de banco de dados àqueles versados na técnica, tal como DB2, SYBASE, ou ORACLE. Além disso, muitos bancos de dados e programas de computador podem ser empregados como algoritmos de comparação de seqüência, identificadores, ou fontes de seqüências de nucleotídeo de referência ou seqüências de lipeptídeo a serem comparadas com a seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. A seguinte lista é pretendida não limitar a invenção porém fornece orientação para programas e bancos de dados que são úteis com as seqüências de ácido nucléico como apresentadas nas seqüências de ácido nucléico do Grupo A, e seqüências substanci20 almente idênticas a estas, ou as seqüências de polipeptídeos como apresentadas nas seqüências de aminoácido do Grupo B, e seqüências substanciálmente idênticas a estas.
Os programas e bancos de dados que podem ser empregados incluem, porém não estão limitados a: MacPattern (EMBL), DiscoveryBase (Molecular Applications Group), GeneMine (Molecular Applications Group), Look (Molecular Applications Group), MacLook (Molecular Applications Group), BLAST e BLAST2 (NCBI), BLASTN e BLASTX (Altschul e outros, J. Mol. Biol, 215: 403, 1990), FASTA (Pearson e Lipman, Proc. Natl. Acad. Sei. USA, 85: 2444, 1988), FASTDB (Brutlag e outros Comp. App. Biosci 6:23730 245, 1990), Catalyst (Molecular Simulations Inc.), CatalySt/SHAPE (Molecular Simulations Inc.), Cerius 2.DBAaccess (Molecular Simulations Inc.), HypoGen (Molecular Simulations Inc.), Insight II, (Molecular Simulations
Inc), Discover (Molecular Simulations Inc.), CHARMm (Molecular Simulations Inc.), Felix (Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), Modeler (Molecular Simulation Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), Weblab (Molecular Simulations Inc.), WebLab Diversity Explorer ((Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulation Inc.), o banco de dados MDL de Available Chemicals Directory, o banco de dados MDL de Drug Data Report, o banco de dados de Comprehensive Medicinal Chemistry, banco de dados Derwenfs World Drug Index, o banco de dados BioByteMasterFile, o banco de dados Genbank, e o banco de dados Genseqn. Muitos outros programas e banco de dados seriam aparentes àqueles versados na técnica determinada na presente invenção.
Os motivos que podem ser detectados empregando os programas acima incluem zíperes de leucina de codificação de seqüência, motivos de hélice-giro-hélice, sítios de glicosilação, sítios de ubiquitinação, alfa hélices, e beta folhas, peptídeos de sinal codificando seqüência de sinal que conduz a secreção das proteínas codificadas, seqüências implicadas na regulação da transcrição tal como homeoboxes, extensões acídicas, sítios ativos enzimáticos, sítios de aglutinação de substrato, e sítios de divagem enzimática.
A presente invenção explora a única propriedade catalítica das enzimas. Ao mesmo tempo em que o uso de biocatalisadores (isto é, enzimas brutas ou purificadas, células vivas e não-vivas) em transformações químicas normalmente requer a identificação de um biocatalisador que particular reage com um composto de partida específico, a presente invenção usa condições de reação e biocatalisadores selecionados que são específicos de grupos funcionais que estão presentes em muitos compostos de partida, tal como pequenas moléculas. Cada biocatalisador é específico para um grupo funcional, ou vários grupos funcionais relacionados, e pode reagir com muitos compostos de partida contendo este grupo funcional.
Figure BRPI0207770B1_D0051
100
As reações biocatalíticas produzem uma população de derivados de um único composto de partida. Esses derivados podem ser submetidos a outra rodada de reações biocatalíticas para produzir uma segunda população de compostos derivados. Milhares de variações do composto ou pequena molécula original pode ser produzida com cada iteração de derivatização biocatalítica.
As enzimas reagem em sítios específicos de um composto de partida sem afetar o resto da molécula, um processo que é muito difícil de obter empregando métodos químicos tradicionais. Este grau elevado de especificidade biocatalítica fornece os meios para identificar um único composto ativo na biblioteca. A biblioteca é caracterizada pelas séries de reações biocatalíticas empregadas para produzir, uma então chamada história biossintética. A avaliação da biblioteca quanto às atividades biológicas e traçado da história biossintética identifica a seqüência de reação específica produzindo o composto ativo. A seqüência de reação é repetida e a estrutura do composto sintetizado é determinada. Este modo de identificação, diferente de outras sínteses e métodos de avaliação, não requer tecnologias de imobilização, e compostos podem ser sintetizados e testados livres na solução empregando virtualmente qualquer tipo de ensaio de avaliação. É importante observar, que o grau elevado de especificidade de reações de enzima nos grupos funcionais considera o traçado das reações enzimáticas específicas que compõe a biblioteca biocataliticamente produzida.
Muitas das etapas do procedimento são realizadas empregando automação robótica possibilitando a execução de milhares de reações biocatalíticas e ensaios de avaliação por dia bem como garantindo um nível elevado de exatidão e reproducibilidade. Como um resultado, uma biblioteca de compostos derivados pode ser produzida em uma questão de semanas o que levaria anos para produzir empregando métodos químicos correntes.
Em uma modalidade particular, a invenção fornece um método para modificar pequenas moléculas, compreendendo contatar um polipeptídeo codificado com um polinucleotídeo ou fragmentos enzimaticamente ativos descrito aqui destes com uma pequena molécula para produzir uma
Figure BRPI0207770B1_D0052
101 molécula pequena modificada. Uma biblioteca de pequenas moléculas modificadas é testada para determinar se uma molécula pequena modificada está presente na biblioteca que exibe uma atividade desejada. Uma reação biocatalítica específica que produz a pequena molécula modificada da atividade desejada é identificada sistematicamente eliminando-se cada das reações biocatalíticas empregadas para produzir uma porção da biblioteca, e então testar as pequenas moléculas produzidas na porção da biblioteca quanto à presença ou ausência das pequenas moléculas modificadas com a atividade desejada. As reações biocatalíticas específicas que produzem a pequena molécula modificada da atividade desejada são opcionalmente repetidas. As reações biocatalíticas são conduzidas com um grupo de biocatalisadores que reage com as porções estruturais distintas encontradas na estrutura de uma pequena molécula, cada biocatalisador é específico para uma porção estrutural ou um grupo de porções estruturais relacionadas; e cada biocatalisador reage com muitas pequenas moléculas diferentes que contêm a porção estrutural distinta.
Em outra modalidade, as novas amilases alcalinas da invenção foram identificadas avaliando-se igualmente atividade em pH elevado e identificação de amilases com estabilidade em uma formulação de lavagem de louça automática (ADW). As comparações foram feitas com a amilase derivada de Bacillus lichenformis. Um estudo da dependência da hidrólise no pH mostrou que a maioria das amilases alcalinas da invenção tiveram um pH ótimo de 7 ou menos, a exceção é o clone B com um pH ótimo de aproximadamente 8. A amilase alcalina da invenção retém a atividade nas formulações de ADW, embora o clone B seja sensível a temperaturas elevadas. Preferivelmente, quando empregada em produtos de ADW, a amilase alcalina da invenção funcionará em um pH 10-11 e em 45-60°C.
A invenção será ainda descrita com referência aos seguintes exemplos; entretanto, é para ser entendido que a invenção não é limitada a tais exemplos.
Exemplos
Exemplo 1
102
Identificação e Caracterização da g-Amilase Termoestável
O presente exemplo mostra a identificação de novas amilases de ácido. O programa de avaliação foi realizado sob condições de pH baixo ou neutro. As bibliotecas de DNA geradas de amostras de pH baixo foram objetivadas pela descoberta. Este esforço permitiu a descoberta de centenas de clones tendo a capacidade de degradar o amido. A seqüência de DNA e análise de bioinformática classificou muitos desses genes quando a amilase previamente não identificou.
Estudos Bioquímicos
A análise bioquímica dos clones genômicos de amilase mostrou que muitos tiveram pH ótimos menores do que pH 6. Os lisatos desses clones genômicos foram testados quanto à tolerância térmica por incubação em 70°C, 80°C, 90°C ou 100°C durante 10 minutos e medição da atividade residual em pH 4,5. Esses clones retendo >50% da atividade após o tratamento a quente em 80°C foram escolhidos para outra análise. Esses clones foram incubados em 90°C durante 10 minutos em pH 6,0 e 4,5 e testados quanto à atividade residual em pH 4,5 (Figura 1). Uma quantidade de clones reteve >40% de sua atividade seguindo este tratamento. Para propósito comparativo, a atividade residual de uma amilase envolvida, clone c, foi equivalente ao melhor das enzimas de segunda geração; a atividade específica do clone c foi maior.
A atividade térmica dos clones com atividade residual após o tratamento a quente em 90°C em pH 4,5 foi medida em temperatura ambiente, 70°C e 90°C em pH 4,5. A Tabela 1 mostra que a taxa de hidrólise de SEQ ID NO: 87 (amilase de B. stearothermophilus) e SEQ ID NO: 113 (amilase de B. licheniformis) diminui em temperaturas mais elevadas, ao mesmo tempo em que a taxa para SEQ ID NO: 125 contínua a aumentar quando a temperatura é aumentada para 70°C e somente reduz por volta de 50% em 90°C.
Avaliação do Candidato
Com base na atividade residual em pH 4,5 após um tratamento a quente de 90°C, a atividade específica e taxa de hidrólise de amido em
103
90°C quando comparada com amilase B. licheniformis, SEQ ID NO: 125 são comparadas com o clone c de amilase envolvido em um ensaio de liquefação de amido.
Temperatura ambiente 70°C 90°C
SEQ ID NO.: 871 1,25 1,43 0,33
SEQ ID NO.: 1132 3,3 1,9 0,39
SEQ ID NO.: 125 1,9 47 19
Tabela 1. Taxas de hidrólise de amido rotulado de tinta (relativo às unidades de fluorescência/s) de três clones genômicos em pH 4,5 e 3 diferentes temperaturas. 1amilase B. stearothermofilus,2 amilase B. licheniformis.
Exemplo 2
Amilase Termoestável Ativa em pH Alcalino
O foco inicial deste exemplo foi a avaliação de um painel existente de amilase em uma formulação de lavagem de louça automática comercial (ADW). Este esforço identificou dois candidatos: um com atividade em pH elevado (SEQ ID NO: 115) e outro com estabilidade na formulação de ADW (SEQ ID NO: 207). Os estudos também incluem a identificação de amilase de pH elevado. Este esforço permitiu a descoberta de milhares de clones tendo a capacidade de degradar o amido. A seqüência de DNA e análise bioinformática classificaram muitos desses genes como amilase previamente não identificada. As estruturas de leitura aberta restantes foram neopululanase, amilopululanase e amilomaltase. Os estudos de aplicações e bioquímicos extensivos mostraram que 3 candidatos:(clone B, SEQ ID NO: 147 e SEQ ID NO: 139) tiveram atividade específica elevada em pH 10, porém infelizmente perderam a estabilidade na formulação de ADW. Em resumo, um painel de novas amilases cada tendo fenótipos desejáveis para a aplicação de ADW tem sido identificado.
Estudos Bioquímicos
A análise bioquímica dos clones genômicos de amilase mostrou que muitos deles hidrolisaram o amido em pH 10 e 50°C. Para produzir quantidades suficientes de enzima para outro teste de aplicação e bioquími104 co, a estrutura de leitura aberta de amilase dos 40 clones genômicos mais ativos foi subclonada nos vetores de expressão. Este esforço inclui preparar 2 constructos para aqueles clones contendo uma seqüência de sinal putativo e estabelecer as condições de desenvolvimento e indução para cada sub-clone (mais e menos o peptídeo de sinal de amilase).
A proteína ativa solúvel foi prosperamente purificada para homogeneidade de 34 subclones e atividade específica (unidades/mg, onde 1 unidade= pmol de açúcares de redução/min) foi medida em pH 8 e pH 10 (40°C e 50°C) empregando 2% de amido no tampão. A amilase de Bacillus licheniformis (SEQ ID NO: 113) foi escolhida como a marca de referência para esses estudos. A atividade específica foi determinada removendo-se as amostras em vários pontos de tempo durante uma reação de 30 minutos e analisando quanto aos açúcares de redução. A taxa inicial foi determinada ajustando-se as curvas de progresso com uma equação linear. Uma compa15 ração do candidato topo é mostrada na Tabela 2.
Um estudo para determinar a dependência da taxa de hidrólise em pH mostrou que somente o clone B é uma amilase alcalina com um pH ótimo de aproximadamente 8; todos os outros tiveram pH ótimo de 7 ou menos. Entretanto, é claro que o painel de comparações incluiu várias amila20 ses de chumbo com atividade apreciável em pH 10 e 50°C.
Tabela 2: Atividades Específicas (U/mg de Enzima Pura) de Amilase
Enzima Atividade Específica pH 8, 40°C Atividade Específica pH 10, 50°C
Clone B 682 20
SEQ ID NO.: 139 430 33
SEQ ID NO.: 127 250 47
SEQ ID NO.: 137 230 3
SEQ ID NO.: 113 (B. licheniformis) 228 27
SEQ ID NO.: 205 163 4
Resíduo <40
Estabilidade
105
A estabilidade na presença da formulação de ADW foi medida para cada dos 3 candidatos topo identificados através da análise bioquímica. O ponto de referência desses estudos foi uma enzima comercial na matriz de formulação. A figura 13 ilustra a atividade residual (medida em pH 8 e 50°C) após uma incubação de 30 minutos em 50°C na presença de vários componentes da formulação de ADW; pH 8, pH10.8, solução de ADW (com alvejamento) e solução de ADW (sem alvejamento). A atividade medida após a incubação é expressada como um percentual da atividade original. Os dados mostram que o clone B foi muito sensível à temperatura elevada, enquanto as outras amilases foram menos afetadas. Qúando as enzimas foram incubadas em pH e temperatura elevados a enzima comercial SEQ ID NO: 139 tornou-se menos estável; entretanto, SEQ IDNO:127 reteve atividade total. O comportamento aparentemente anormal de SEQ ID NO: 127 após pH 10 de incubação versus pH 8 foi observado em experiências repetidas.
Quando a atividade da amilase do amido rotulado a seco é medida na matriz de ADW em 50°C, a amilase comercial exibiu aproximadamente 5% de sua atividade em pH 8. No mesmo ensaio, clone B, SEQ ID NO: 139 e SEQ ID NO: 127 exibiram < 2% de sua atividade original medida em pH 8.
Testes de Lavagem
Os testes de lavagem empregando slides revestidos por amido foram realizados para calibrar o desempenho de cada das enzimas purificadas em comparação à amilase comercial. Os slides revestidos por amido espaguete foram preparados de acordo com o protocolo. Dois s/ides revestidos por amido pré-pesados foram colocados no verso para reforçar em um tubo cônico de 50 ml e 25 ml da solução de ADW, ± enzima foram adicionados por tubo. Os tubos foram incubados durante 20 minutos em 50°C com rotação suave em um carrossel vertical. Seguindo o período de incubação, os slides foram imediatamente enxaguados em água e novamente secados durante a noite. Todas experiências foram fundidas em duplicatas ea enzima comercial foi fundida como um controle positivo. Os resultados (Figura
106
6) dessas experiências são expressados como % líquido de amido removido, por exemplo % de amido removido em ADW com enzima, menos o % do amido removido em ADW sozinho.
Exemplo 3
Otimização de Gene
As propriedades das enzimas podem ser melhoradas por várias estratégias de evolução, incluindo Gene Site Saturation Mutagenesis (GSSM®) e Gene Reassembly®, (Diversa Corporation, San Diego, CA). Tais técnicas serão aplicadas aos genes de amilase divulgados a fim de gerar um grupo de variantes que podem ser peneiradas para melhorar o desempenho.
As moléculas parenterais durante evolução serão uma ou todas das seguintes: SEQ ID NO: 113, SEQ ID NO: 139, SEQ ID NO: 115 e SEQ ID NO: 127 (uma forma truncada de SEQ ID NO: 127).
Uma peneira de passagem elevada tem sido desenvolvida para taxar o desempenho das enzimas na presença de desempenho de ADW. O desenvolvimento de um HTS é de suprema importância em qualquer programa de evolução. O HTS é automatizado e tem mostrado resultados consistentes para a amilase parenteral (Figura 7). As amilases parenterais têm atividades mensuráveis na formulação de ADW, entretanto altamente reduzido relativo à atividade de pH 8.
Mutantes de SEQ ID NO: 81 Gerados por GSSM ou por Mutação Aleatória GSSM
Hospedeiro: E.coli, XL1-blue MRF'
Vetor: pSE420
Origem: SEQ ID NO: 81
Os resíduos mutados incluídos #2 a #93, #118-159, #389 e #433.
Listas de Clones de Amilases Ativas Elevadas que têm sido Seqüenciados
Nome Alteração Dados em E.coli
SEQ ID NO: 81/4L Y4V, TAT para GTG 2x Aumentada em Atividade
SEQ ID NO: 81/4A Y4A, TAT para GCG 2x Aumentada em Atividade
107
SEQ ID NO: 81/30V SEQ ID NO: 81/31Q SEQ ID NO: 81-4V-30V SEQ ID NO: 81-2C SEQ ID NO: 81-4C
T30V, ACC para GTT 131Q, ATC para TAG 4V + 30V C154A&C155A C154A, C155A& C389A, C433A
2,5x Aumentada em Atividade 1,5x Aumentada em Atividade 3x Aumentada em Atividade
1,2x Aumentada em Atividade 2x Aumentada em Atividade
Nota:
Para SEQ ID NO: 81/31Q, o códon TAG deve codificar durante um códon parado, porém codificar para Gin em XL1-blue MRF' células por causa da mutação supE do hospedeiro.
Mutação Aleatório
As mutações aleatórias foram introduzidas à SEQ ID NO: 81 por PCR propensa a erro como segue:
Uso de dATP, dCTP, dGTP, ou dTTP não equilibrado na reação para introduzir mutações;
- Uso de concentração diferente de MnCI2 na reação para introduzir mutações;
Uso de combinação de dois métodos acima.
Confirmação de Novos Clones Ativos desenvolver os mutantes superiores da peneiração primária em tubos 15 de Falcon de 15 mL e induzir com IPTG de 1 mM;
Re-Ensaio empregando amido RBB como substrato;
Seqüência do Clone para confirmar a mutação.
Lista de Clones de Amilase Ativa Elevada que têm sido Seqüenciados
Nome Dados do Frasco de Mistura Dados no Fermentador
SEQ ID NO: 1,3-2x Aumentada mesmo como
81-4C-UM1 em Atividade SEQ ID NO: 81-4C
SEQ ID NO: 2x Aumentada mesmo como
81-4C-UM2 em Atividade SEQ ID NO: 81-4C
Exemplo 4
Caracterização de g-Amilases tendo Atividade em pH Alcalino
Figure BRPI0207770B1_D0053
108
As amilases da invenção tendo atividade de pH alcalino foram ainda caracterizadas. Os cinéticos em 2% de amido de pH 8 e 10 (40°C e 50°C) foram realizados.
Tabela 4:
Clones, Atividades Específicas pH 8, 40°C pH 10, 50°C
SEQ ID NO: 113(fí. Lichenoformis) 228 unidades/mg 27 unidades/mg
Clone B 682 unidades/mg 31 unidades/mg
SEQ ID NO: 139 430 unidades/mg 33 unidades/mg
SEQ ID NO: 127 540 unidades/mg 50 unidades/mg
Controle 0GLS (E.coli) 1,8 unidades/mg 0 unidades/mg
1 unidade de atividade é definida como liberação de 1 μιτιοΙ reduzindo açucares por minuto.
Exemplo 5
Ensaio de Atividade de Amilase: BCA Reduzindo Ensaios Finais
A atividade de amilase de clones de interesse foi determinada empregando a seguinte metodologia.
1. Preparar 2 soluções de substratos, como segue:
a) 2% de amido solúvel (batata) solução de pH 8 dissolvendo-se 2gm de amido de batata em 100 ml de 100 mM de fosfato de sódio pH 8).
b) 2% de amido solúvel (batata) solução de pH 10 dissolvendo-se 2 gm de amido de batata em 100 ml de 100 mM de carbonato de sódio.
Aquecer ambas soluções em um banho de água em ebulição, ao mesmo tempo em que misturando, durante 30-40 minutos até que dissolva o amido.
2. Preparar a solução A de 64 mg/ml de monohidrato de carbonato de 20 sódio, 24 mg/ml de bicarbonato de sódio e 19,5 mg/ml de BCA (sal de dissódio de 4,4'-dicarbóxi-2,2'-biquinolina (Sigma Chemical cat # D-8284). Adicionado acima para dH2O.
3. Preparar solução B combinando-se 1,24 mg/ml de pentahidrato de sulfato cúprico e 1,26 mg/ml de L-serina. Adicionar a mistura para dH2O.
4. Preparar um reagente trabalhando de uma relação 1:1 de soluções
Figure BRPI0207770B1_D0054
109
Ae Β.
5. Preparar uma solução padrão de maltose de 10 mM de Maltose em dH2O, onde os 10mM de maltose são combinados em 2% de amido solúvel em pH desejado para uma concentração final de 0, 100, 200, 300, 400, 600 μΜ.
A curva padrão será gerada para cada série de tempo exato. Desde que a curva é determinada adicionando-se 10 μΙ dos padrões do reagente trabalhados trabalham até 0, 1,2, 3, 4, 6 nmol de maltose.
6. Adicionar alíquota de 1 ml de solução de substrato nos tubos microcentrifugados, equilibrar a temperatura desejada (5 minutos) em bloco aquecido ou banho de água aquecida. Adicionar 50 μΙ de solução de enzima para dentro da tampa do tubo.
7. Ao mesmo tempo em que a solução é misturada equilibrando 5 ml de ambas solução A & B. Adicionar alíquota de 100 ml para placa PCR de 96 cavidades. Placa de série no gelo.
8. Após 5 minutos de equilíbrio de temperatura, fechar com as tampas nos tubos, inverter e vórtice 3 vezes. Adicionar imediatamente alíquota de 10μΙ na placa como t = 0 (zero tempo exato). Permitir a mistura de enzima no bloco aquecido e adicionar alíquota de 10μΙ em cada tempo exato desejado (por exemplo, 0, 5, 10, 15, 20, 30 minutos).
9. Garantir que 12 cavidades sejam deixadas esvaziar (somente trabalhando reagente com alíquota) para a adição de 10μΙ de padrões, para a curva padrão.
10. Quando todos os tempos exatos são coletados e padrões são adicionados, a placa coberta e aquecida a 80°C durante 35 minutos. Resfriar a placa no gelo durante 10 minutos. Adicionar 100 μΙ de H2O para todas as cavidades. Misturar e adicionar alíquota de 10 μΙ na placa de 96 cavidades de fundo chato e ler a absorção em 560 nm.
11. Zerar cada tempo exato da amostra contra seu próprio t =0 (subtrair a média t = 0 valor A560 de outro valor A560 médio). Converter ο A560 (experimental) para umole (Dividir A560(experimental) pelo declive da curva padrão (A560/umole). Gerar um declive de tempo exato e o umole (em umole/minuto), multiplicar por 100 (como o valor umole calcular somente
Figure BRPI0207770B1_D0055
110 para os 1ΟμΙ empregados no ensaio, nenhuma quantidade feita no rxn de 1 ml). Para obter a atividade específica dividir o declive (em umole/minuto) pelo mg da proteína. Todos os pontos mostram ser feitos em um mínimo em duplicatas com os três melhores testes. Um exemplo de curva padrão é apresentado na Figura 11.
Tabela 5: Dados da Amostra
Clone Diluição Minutos A560-1 A560-2 A 560 Médio Zeroed A 560 (A560exp/std declive) umole
ENZ 50 0 0,1711 0,1736 0,17235 0 0,0000
5 0,2104 0,2165 0,21345 0,0411 0,0005
10 0,2492 0,2481 0,24865 0,0763 0,0009
15 0,2984 0,2882 0,2933 0,12095 0,0014
20 0,3355 0,3409 0,3382 0,16585 0,0020
30 0,3942 0,3805 0,38735 0,215 0,0026
40 0,4501 0,4412 0,44565 0,2733 0,0033
Atividade = 0,008646 umole/minuto
Concentração da Proteína Dividida (mg/ml) por qualquer diluição para obter mg empregado no ensaio.10 Dividir o declive acima por mg empregado no ensaio para obter a atividade específica.
Atividade Específica = 24,93 umole/minuto/mg (Observe por exemplo, Dominic W.S. Wong. Sarah B. Batt, e
George H. Robertson (2000). O microensaio de peneiramento rápido de ati15 vidade alfa amilase. J. Agric. Foood Chem. 48,4540-4543 e Jeffrey D. Fox e
John F. Robyt, (1991). Miniaturização de três análises de carboidratos empregando um leitor de placa de microamostra. Anal. Biochem. 195, 93-96, aqui incorporadas por referência).
Exemplo 6
Peneiramento para Atividade de a-amilase
A atividade de amilase de clones pode ser ensaiada por vários métodos conhecidos na técnica. O seguinte é a metodologia geral que foi empregada na presente invenção. As várias placas peneiradas, por placa,
111 mostraram ser aproximadamente 10.000 pfu’s. Para cada biblioteca de DNA: pelo menos 50.000 placas por biblioteca isolada e 200.000 placas por biblioteca não-isolada mostram ser peneiradas dependendo do título pfu para o lisado amplificado de Expresso Zap λ.
Determinação do Título da Biblioteca Lambda
1) pL da biblioteca amplificada de Expresso Zap lambda armazenada adicionado a 600μΙ_ de células E.coli MRF’ (OD600= 1,0). Para diluir tronco MRF', 10mM de MgSO4 são empregados.
2) Incubar em 37°C durante 15 minutos.
3) Transferir suspensão de 5-6 ml de ágar de topo NZY em 50°C e suavemente misturar.
4) Derramar imediatamente a solução de ágar em placa de veículo NZY (150 mm) amplo.
5) Permitir ágar de topo para solidificar completamente (aproximadamente 30 minutos), em seguida inverter placas.
6) Incubar a placa em 39°C durante 8-12 horas.
7) Número de placas é aproximado. Título fago determinado para produzir 10.000 pfu/placa. Diluir uma alíquota de fago de Biblioteca com tampão SM se necessário.
Peneiramento de Substrato
1) Expresso Zap Lambda (50.000 pfu) de biblioteca amplificada adicionado a 600 pL de células MRF de E.coli (OD600 = 1,0). Para bibliotecas não-desenvolvidas, preparar 4 tubos (50.000 pfu por tubo).
2) Incubar em 37°C durante 15 minutos.
3) Ao mesmo tempo em que fago/suspensão de célula são incubados, 1,0 mL de substrato de amido vermelho (1,2% peso/volume) é adicionado para 6,0 mL de ágar de topo NZY em 50°C e cuidadosamente misturado. Manter a solução em 50°C até que necessite.
4) Transferir 1/5 (10.000 pfu) da suspensão de célula para substrato/solução de ágar de topo e misturar suavemente.
5) Solução é imediatamente derramada em placas de veículo NZY (150 mm) amplo.
112
6) Permitir o ágar de topo solidificar completamente (aproximadamente 30 minutos), em seguida inverter a placa.
7) Repetir os procedimentos 4-64 vezes para o resto da suspensão de célula (1/5 de cada tempo de suspensão).
8) Incubar as placas em 39°C durante 8-12 horas.
9) Placas observadas para zonas de clareamento (halos) em volta das placas.
10) Placas com halos são nucleadas de ágar e transferidas para um microtubo estéril. Um furo amplo de 200μΙ_ de extremidade da pipeta bem trabalhado para remover (núcleo) o tampão de ágar contendo a placa desejada.
11) Fagos são re-suspensos em 500pL de tampão SM. 20 ml de clorofórmio são adicionados para inibir qualquer outro desenvolvimento de célula.
12) Suspensão de fago puro é incubada em temperatura ambiente durante 4 horas ou durante a noite antes da próxima etapa.
Isolação de Clones Puros
1) 10μΙ_ da suspensão de fago re-suspensa são adicionados à 500μΙ_ de células MRF's de E.coli (OD600=1,0).
2) Incubar em 37°C durante 15 minutos.
3) Ao mesmo tempo em que fago/suspensão de célula está incubando, 1mL do substrato de amido vermelho (1,2% peso/volume) é adicionado a 6,0 mL de ágar de topo de NZY em 50°C e vagarosamente misturado. Manter a solução em 50°C se necessário.
4) Suspensão de célula é transferida ao substrato/ágar de topo e gentilmente misturada.
5) Solução é imediatamente derramada em placa de veículo NZY (150 mm) amplo.
6) Permitir o ágar de topo solidificar completamente (aproximadamente 30 minutos), em seguida inverter placa.
7) Placa incubada em 39°C durante 8-12 horas.
8) Placa observada durante a zona de clareamento (halo) em cerca de
113 uma placa única (clone puro). Se uma placa única não pode ser isolada, ajustar o título e a suspensão de fago chapeada novamente.
9) Placa única com halo é nucleada de ágar e transferida a um microtubo estéril. Uma extremidade de pipeta de 200μΙ_ de furo grande bem trabalhado para remover (núcleo) o tampão ágar contendo a placa desejada. Para amplificar o título, o núcleo 5 de placas ativas únicas em um microtubo.
10) Fagos são re-suspensos em 500μΙ_ de tampão SM. 20μΙ_ de clorofórmio são adicionados para inibir qualquer outro desenvolvimento de célula.
11) Suspensão de fago puro é incubada em temperatura ambiente durante 4 horas ou durante a noite antes da próxima etapa. A suspensão de fago puro é depositada em -80°C adicionando-se DMSO na suspensão de fago (7% de volume/volume).
Excisão de Clone Puro
1) 100μΙ_ de suspensão de fago puro são adicionados a 200μΙ_ de células MRF, de E.coli (OD600 = 1,0). Para isto, 1,0μΙ_ de fago de auxiliar de ExAssist (>1 x 106 pfu/mL; Stratagene) é adicionado. Uso de tubo Falcon 2059 durante excisão.
2) Suspensão é incubada em 37°C durante 15 minutos.
3) 3,0 mL de 2x veículo YT são adicionados para suspensão de célula.
4) Incubado em 30°C durante pelo menos 6 horas ou durante a noite ao mesmo tempo em que sacudindo.
5) Tubo transferido em 70°C durante 20 minutos. A suspensão de fagomídeo pode ser armazenada em 4°C durante 1 a 2 meses.
6) 100 μί de suspensão de fagomídeo transferidos para um microtubo contendo 200 μί de células Exp 505 de E.coli (OD600=1,0).
7) Suspensão incubada em 37°C durante 15 minutos.
8) 300 μί de SOB são adicionados na suspensão.
9) Suspensão é incubada em 37°C durante 30 a 45 minutos.
10) 100pL de suspensão são transferidos a uma placa de veículo LB (90 mm) pequeno contendo Kanamicina (veículo LB com Kanamicina
Figure BRPI0207770B1_D0056
114
50gg/mL) para bibliotecas de DNA de Expresso Zap ou Ampicilina (veículo LB com Kanamicina 100 gg/ml) para bibliotecas de DNA II Zap.
11) O resto da suspensão é transferido para outra placa de veículo LB pequeno.
12) Uso de contas de vidro estéril para distribuir uniformemente a suspensão na placa.
13) Placas são incubadas em 30°C durante 12 a 24 horas.
14) Placa observada durante colônias.
15) Colônia única inoculada em veículo líquido LB contendo antibiótico adequado e incubada em 30°C durante 12 a 24 horas.
16) Estoque de glicerol pode ser preparado adicionando-se 80% de glicerol na cultura de líquido (15% em volume/volume) e armazenado em 80°C.
Verificação da Atividade
1) 50gL de cultura de líquido são transferidos para um microtubo. Adicionar 500 μί de 8% de pH 7 de Azul Amilopectina no mesmo tubo. Preparar 2 tubos para cada clone.
2) Atividade é testada em 50°C durante 3 horas e durante a noite. Uso de tampão de pH 7 como controle.
3) Resfriar o espécime teste em banho de água gelada durante 5 minutos.
4) Adicionar 750pL de Etanol e misturar vagarosamente.
5) Centrifugar em 13000 rpm (16000 g's ) durante 5 minutos.
6) Medir OD do sobrenadante em 595 nm.
Análise RFLP
1) 1,0 mL de cultura de líquido é transferido para um microtubo estéril.
2) Centrifugar em 13200 rpm (160Ó0 g's) durante 1 minuto.
3) Descartar o sobrenadante. Adicionar outro 1,0 mL de cultura de líquido no mesmo microtubo estéril.
4) Centrifugar em 13200 rpm (16000 g's) durante 1 minuto.
5) Descartar o sobrenadante.
115
6) Seguir o protocolo de mini kit de execução QIAprep para isolação do plasmídeo.
7) Checar a concentração de DNA empregando BioFotômetro.
8) Usar Sac I e Κρη I durante primeira dupla digestão. Incubado em 37°C durante 1 hora.
9) Empregar Pst I e Xhol durante segunda dupla digestão. Incubado em 37°C durante 1 hora.
10) Adicionar carregamento seco na amostra digerida.
11) Fundir a amostra digerida em um gel de agarose de 1,0% durante 1-1,5 horas em 120 volts.
12) Visão do gel com formador de imagem do gel. Todos os clones com um padrão de digestão diferente serão enviados para análise de seqüência.
Exemplo 7
Ensaio para Amilase
Preparação de Culturas de Hospedeiro
1. Iniciar durante a noite a cultura de células hospedeiras MRF, de XL1Azul. Empregar uma .colônia única de uma placa de listas para inocular 10 mL de LB suplementado com 20 gg/mL de tetraciclina. Desenvolver durante a noite a cultura sacudindo em 37°C durante pelo menos 16 horas.
2. Utilizar técnica asséptica, inocular uma cultura de dia LBTet de 100 ml fresco com hospedeiro MRF, de XL1-Azul da cultura LBTet durante a noite.
3. Desenvolver em um misturador 37°C até que OD alcance 0,75-1,0.
4. Células hospedeiras péletes em 1000 x g durante 10 minutos e gentilmente re-suspensas em 10mM de MgSO4 em OD5.
5. Diluir uma pequena quantidade de células hospedeiras para OD1 para uso em titulação e pintooling.
6. Preparações de hospedeiro podem ser empregadas durante até 1 semana quando armazenado no gelo ou em 4°C.
Observações
Figure BRPI0207770B1_D0057
116
- Para o tempo de desenvolvimento curto durante o dia da cultura, usar 1/2 X na concentração Tet usual em LB (1/2 X = 10 pg/mL), ou omitir o antibiótico totalmente.
- Não usar NZY quando selecionando com Tetraciclina. A concentração do Mg++ elevado no veículo NZY rende Tet inativo.
Bibliotecas de Lambda de Titulação
7. Colocar três tubos de microfuga estéril em uma prateleira.
8. Adicionar um alíquota de 995 pL de células hospedeiras preparadas em um tubo e 45 pL em células hospedeiras OD1 preparadas em cada dos dois tubos restantes.
9. Adicionar 5 pL de biblioteca lambda ao tubo contendo células hospedeiras de 995 pL e misturar por vórtice. Isto resulta em um fator de diluição de 200.
10. Preparar 1/2.000 e 1/20.000 diluições adicionando-se consecutivamente 5 pL de prévia diluição aos dois tubos restantes contendo 45 pL de células hospedeiras preparadas. A mistura por vórtice após cada diluição foi feita.
11. Permitir fago para absorver o hospedeiro por incubação em 37°C durante 15 minutos.
12. Por enquanto, a pipeta de 100 pL de células hospedeiras OD1 preparadas para cada dos três tubos 2059 Falcon.
13. Adicionar 5pL de cada diluição para um tubo 2059 separado contendo células hospedeiras.
14. Cada placa adicionando-se 3 mL de ágar de topo a cada tubo e derramar rapidamente sobre placas NZY de 90 mm. Garantir uma distribuição ainda macia antes de endurecer o ágar de topo.
15. Inverter as placas e incubar em 37°C durante a noite.
16. Placas de contagem e calcular o título do estoque da biblioteca (as placas formando unidades (pfu) por pL).
Peneiramento de Microtítulo Lambda para Amilase
Preparação
1. Preparar uma quantidade suficiente de cultura de hospedeiro MRF, de
Figure BRPI0207770B1_D0058
117
Azul-XL1, como descrito acima, para a quantidade da peneiração planejada. Uma cultura de 100 mL é freqüentemente suficiente para biblioteca de 2-3 de peneiração.
2. Várias garrafas de autoclave compatíveis com o dispensor QFÍII2. Essas são as garrafas Corning de boca larga, 250 mL contendo um anel de selo em volta da borda.
3. Verificar se são as quantidades suficientes de placas, ágar de topo, amido BODIPY, solução de amido vermelho, etc. disponível para a peneira.
4. Tabela da Execução do robô do dia 2 com um reprèsentativo de automação.
Dia 1
1. Rotular as placas de 1536 cavidades (preta) com peneira de biblioteca e número de placa. Engrossadores de tubo Tough-Tags®, intervindo no modo de meia largura, são ideais para placas de 1536 cavidades rotuladas.
2. Calcular volumes de biblioteca, células hospedeiras e veículo NZY necessários para a peneiração. Isto é feito facilmente com uma extensão da folha Excel.
3. Combinar os volumes calculados da biblioteca lambda e células hospedeiras OD5 na garrafa Corning de boca larga de 250 mL estéril (contendo um anel de seleção).
4. Permitir absorção para ocorrer em 37°C durante 15 minutos.
5. Adicionar o volume calculado do veículo NZY e misturar bem. Isto é referido como a suspensão de veículo de fago de célula.
6. Desempenhar um título concomitante combinando-se 50 gL de suspensão de veículo de fago de célula com 250gL de células hospedeiras OD1 em um tubo 2059 Falcon, em seguida revestindo com 9mL de ágar de topo sob uma placa NZY de 150 mm. A placa título concomitante incubada em 37°C durante a noite.
7. Carregar o dispensor com o restante da suspensão e disposição de cada placa de 1536 cavidades rotuladas em 4 gL por cavidade. Se o
Figure BRPI0207770B1_D0059
118 dispensor permite bolhas de ar em algumas cavidades, elas podem ser removidas centrifugando-se as placas em 200 x g durante 1 minuto.
8. Adicionar 0,5 μΙ_ de fago de controle positivo para cavidade de posição
AD46 de pelo menos duas das placas de ensaio. Uso de um clone de lambda de amilase positiva forte para este propósito. As versões lambda de SEQ ID NO: 113 ou SEQ ID NO: 199 são boas escolhas de controles positivos.
9. Placas de ensaio incubadas em 37°C durante a noite em um incubador umidificado (> 95%).
Dia 2
1. Contar o pfu na placa título concomitante e determinar a densidade da semente média por cavidade (em pfu por cavidade).
2. Pintool pelo menos 2 placas de cada peneira de biblioteca (preferivelmente os controles positivos contendo 2) como segue:
a) Preparar placas de gramado de hospedeiro 2 para atuar como uma superfície em que pintoor·.
combinar 250 μΙ_ de células hospedeiras OD1 com 2 ml de 2% de amido vermelho e placas com 9 ml de ágar de topo com placas NZY de 150 mm. O controle de cada placa de tanto nível quanto possível como o ágar de topo solidifica a fim de produzir uma coloração uniforme vermelha através das placas.
b) empregar um ''pintoor' de 1536 posições esterilizado por chama duas vezes, reproduzir pelo menos 2 das placas de peneiramento nas placas de gramado do hospedeiro.
c) Placas e placas de recipiente pintooled em uma tampa de fluxo laminar com as tampas durante cerca de 15-30 minutos (para abertura de excesso de umidade).
d) Substituir as tampas e incubado invertido em 37°C durante a noite.
3. Preparar o tampão de substrato de amido 2x BODIPY como segue:
a) Calcular o volume total de 2x o substrato da solução tampão necessários para todas as placas de peneiração em 4μΙ_ por cavi-
Figure BRPI0207770B1_D0060
119 dade (incluindo qualquer volume de espaço morto extra requerido pelo dispensador) e medir esta quantidade de 100 mM de CAPS de pH 10,4 em um veículo apropriado para o dispensador empregado.
b) Corrigir o bastante 0,5 mg de tubos de amido BODIPY para produzir o volume requerido de 2x o substrato tampão (calculado na etapa a) acima em uma concentração final de 20-30 gg/mL.
c) Dissolver cada 0,5mg de tubo em 50μΙ_ de DMSO em temperatura ambiente, protegido da luz, com vórtice frequente. Isto torna maior do que 15 minutos; alguns grupos de produção de amido BODIPY dissolvem melhor do que outros.
d) Adicionar 50μΙ_ de tampão CAPS de 100mM pH 10,4 a cada tubo e misturar por vórtice.
e) Agrupar os conteúdos de todos os tubos e remover qualquer agregado não dissolvido centrifugando-se durante 1 minuto em velocidade máxima em uma microfuga.
f) Adicionar o sobrenadante do resto do tampão CAPS de 100mM medido na etapa a) acima.
g) Proteger o 2x tampão de substrato da luz embrulhando-se em lâmina.
4. Tomar as placas e tampão de substrato no ambiente de automatização e programar o robô com os seguintes parâmetros:
a) dispensar 4μΙ_ do tampão de substrato por cavidade.
b) primeira leitura em 1 hora pós-substrato, segunda leitura em 9 horas, e terceira leitura em 17 horas; com 37°C de incubação entre as leituras.
c) filtro de excitação: 485 nm; filtro de emissão: 535 nm.
d) série de ganho Spectrafluor em 70, ou o ganho ótimo para a batelada de 2x o tampão de substrato preparado.
e) garantir que o incubador empregado protegerá as placas de ensaio da luz.
Dia 3
120
1. Checar as placas pintooled para clareadores na grama de bactéria em todas as posições correspondendo às cavidades na placa de ensaio apropriada. Checar também para clareadores no amido vermelho em qualquer das posições fixas. Se as placas contendo controles positivos fossem empregadas para pintooling, deveria ser capaz de observar uma zona de clareamento ampla no fundamento do vermelho. Ser cuidadoso dos contaminantes que também forma zonas de clareamento no amido vermelho (observe observação Contaminants That Form Clearing Zones in Red Starch, no final do Exemplo 7).
2. Identificar a observação putativa do registro dos dados produzidos pelo computador robô. O programa KANAL produzido por Engenheiros simplifica a análise de dados. Como uma norma de manuseio , uma observação putativa é caracterizada como uma cavidade tendo intensidade de sinal enxaguando pelo menos 1,5 dobras durante o fundamento.
3. Para cada putativo, remover 2μΙ_ da cavidade e adicionar a um tubo contendo 500μΙ_ de tampão SM e 50μΙ_ de CHCI3. O vórtice para misturar e depósito em 4°Ç. Esta solução será referida mais adiante como o tronco 4e-3. As placas de peneiração original devem ser depositadas em 4°C, protegidas da luz, pelo menos até que as fugas sejam concluídas.
Isto é o método recomendado de quebra da observação putativa. É um ensaio de fase líquida que alivia na confirmação da atividade do amido BODIPY. Alternativamente, comparação putativa pode ser colocada diretamente nas placas de fase sólida contendo amido vermelho tal que 2.000-3.000 pfu por comparação são examinados para zonas de clareamento. Entretanto, a incapacidade de observar as zonas de clareamento no amido vermelho não é necessariamente uma indicação que uma comparação putativa foi um positivo falso. Então necessitará ser ensaiado empregando o formato em que foi originalmente identificado (isto é, fase líquida empregando amido BODIPY como substrato). Além disso, muitos positivos fracos são mais facilmente identificados empregando o método detalhado
121 abaixo.
Dia 1
1. Em um tubo cônico de 50 ml, estéril combinar 0,5 mL de células hospedeiras OD5 com 45,5 ml de NZY. Isto será referido a uma suspensão de veículo de hospedeiro.
2. Para cada comparação putativa ser analisada, alíquota de 1 mL de suspensão de veículo de hospedeiro em cada dos três tubos de microfuga estéril.
3. Série de pipetman de 12 canais no modo de multidispensa com um tamanho de alíquota de 20 pL e um número de alíquota de 2x. Montas o pipetman com uma série clara de extremidades estéreis.
4. Derramar cerca de 1 ml de suspensão de veículo de hospedeiro em uma nova bacia de solução estéril e carregar o pipetman de multicanal.
5. Dispensar 20pL por cavidade na última fila (fila P) de uma placa de 384 cavidades pretas (12 canais x2 = 24 cavidades). Esta fila será empregada para o controle.
6. Expelir o líquido restante das extremidades comovendo-se as extremidades contra a superfície da bacia e pressionando o botão RESET no pipetman. Derrubar o pipetman para baixo de um modo para prevenir a contaminação das extremidades. Não existe necessidade de mudar as extremidades neste ponto.
7. Derramar o restante do fluido na bacia em um recipiente de refugo (tipo um becher) tomando cuidado para evitar a contaminação de borrifos para trás.
8. Para a primeira putativa ser analisada, tomar 111 pL de tronco 4e-3 (observe dia 2 em Lambda Microtiter Screening for Amylases) e adicionar ao primeiro em uma série de três tubos contendo 1mL de suspensão de veículo de hospedeiro (etapa 2). Vórtex para misturar. Isto é diluição A.
9. Tomar 111 pL de Diluição A e adicionar ao próximo tubo da série. Vórtex para misturar. Isto é diluição B.
10. Tomar 111 pL de Diluição B e adicionar ao último tubo da série. Vórtex
Figure BRPI0207770B1_D0061
122 para misturar. Isto é diluição C. Você deve agora ter três diluições de fago, onde as concentrações de cada difere por um fator de 10.
11. Derramar os conteúdos de Diluição C (o mais diluído das 3 amostras) na solução da bacia e carregar o pipetman de multicanal.
12. Dispensar 20 μΙ_ por cavidade na primeira fila da placa de 384 cavidades (12 canais x 2 = 24 cavidades).
13. Expelir o líquido restante nas extremidades comovendo-se as extremidades contra a superfície da bacia e pressionando-se o botão RESET no pipetman. Derrubar o pipetman para baixo de um modo para prevenir a contaminação das extremidades. Não existe a necessidade de mudar as extremidades neste ponto.
14. Esvaziar a bacia como descrito acima.
15. Derramar os conteúdos da Diluição B na mesma bacia e carregar o pipetman de multicanal.
16. Dispensar 20μΙ_ por cavidade na segunda fila das placas de 384 cavidades.
17. Realizar as etapas 13-16 similarmente para dispensar a Diluição A na terceira fila da placa..
18. Após todas três diluições terem sido revestidas nas terceiras 3 filas das placas, descartar todas as extremidades e a bacia de solução no recipiente de refugo bioperigoso.
19. Montar o pipetman com uma série clara de extremidades estéreis e aberta uma nova bacia de solução estéril.
20. Repetir as etapas 8-19 para cada comparação putativa restante, empregando filas restantes sobre a placa aciona para fila O. Cinco comparações putativas podem ser analisadas em uma placa de 384 cavidades, com a última fileira (fila P) exceto para os controles.
21. Adicionar 0,5 μΙ_ de cada controle para uma cavidade separada. Empregar pelo menos 2-3 controles separados, preferivelmente revestindo uma faixa de atividade.
22. Placas de ensaio incubadas em 37°C durante a noite em um incubador umidificado (> 95%).
Figure BRPI0207770B1_D0062
123
Dia 2
1. Derramar todas as placas breakout em um gramado de hospedeiro com amido vermelho empregando o mesmo método descrito para Dia 2 em Lambda Microtiter Screening for Amylases, exceto que um pintoof' de posição 384 é empregado.
2. Preparar o tampão de substrato de amido 2x BODIPY como segue:
a) Calcular o volume total de 2x de solução de tampão de substrato necessários para todas as placas breakout em 20μΙ_ por cavidade (incluindo qualquer volume de espaço morto extra requerido pelo dispensador) e medindo esta quantidade de 100mM de CAPS pH 10,4 em um recipiente apropriado para o dispensador empregado.
b) Corrigir o suficiente 0,5 mg de tubos de amido BODIPY para produzir o volume requerido de 2x o tampão de substrato [calculado na etapa a) acima] em uma concentração final de 20-30 μg/ml.
c) Dissolver cada 0,5mg de tubo em 50μΙ_ de DMSO em temperatura ambiente, protegido da luz, com vórtice freqüente. Isto toma mais do que 15 minutos; alguns grupos de produção de amido BODIPY dissolvem melhor do que outros.
d) Adicionar 50μΙ_ de tampão de 100 mM de CAPS pH 10,4 a cada tubo e misturar por vórtice.
e) Derramar os conteúdos de todos os tubos e remover qualquer agregado não dissolvido centrifugando-se durante 1 minuto em velocidade máxima em um microfugo.
f) Adicionar o sobrenadante do resto do tampão CAPS de 10OmM medido na etapa a) acima.
g) Proteger o tampão de substrato 2x da luz embrulhando-se na lâmina.
3. Dispensar 20μ1_ por cavidade em todas as placas de breakout.
4. Embrulhar todas as placas em lâmina de alumínio e incubado em temperatura ambiente durante 2-6 horas.
5. Ler cada placa no Espectrafluor com as seguintes montagens:
Figure BRPI0207770B1_D0063
124
a) leitura fluorescente (filtro de excitação: 485 nm, filtro de emissão: 535 nm)
b) definição da placa: 384 cavidades pretas
c) leitura do topo
d) ganho ótimo
e) número de flashes:3
6. Na extensão da folha Excel resultante, chart cada 3 filas putativa S' em um gráfico separado e checar durante atividade. Garantir que os controles positivos produzam sinais durante o fundamento.
7. Para cada putativa que aparece tem um sinal real entre as cavidades, colhetar uma amostra de uma cavidade positiva como segue:
a) Selecionar uma cavidade positiva de uma fila representante da diluição inicial mais elevada.
b) Transferir 2μΙ_ daquela cavidade em um tubo contendo 500μΙ_ de SM e 50μΙ_ de CHCI3. Isto é referido como um tronco breakout.
c) Depósito em 4°C.
8. Empregar métodos previamente descritos, placas cerca de 10μΙ_ de cada tronco breakout em placas de NZY de 150 mm empregando amido vermelho. O objetivo é obter várias placas de cavidades separadas (pelo menos 20) das quais os núcleos isolados.
Dia 3
1. Checar as placas pintooled para uma incidência aceitável de clareadores no gramado de bactérias correspondendo às cavidades na placa de ensaio associada. Também checar durante clareamento no amido vermelho nos controles positivos e em qualquer putativa testada. Ser cuidadoso de contaminantes que também forma zonas de clareamento em amido vermelho (observe abaixo).
2. Das placas de fase sólida contendo diluições de troncos breakout, vários núcleos de placas isoladas, cada com 500μΙ_ de SM com 50μί_ de CHCI3. Isto refere-se como o tronco isolado.
3. Os troncos isolados podem então ser individualmente testados no amido BODIPY empregando métodos descritos acima. Esta etapa pode
Figure BRPI0207770B1_D0064
125 ser omitida se a placa que foi nucleada na etapa 2 produziu uma zona de clareamento no fundamento do amido vermelho. Os troncos isolados foram então individualmente testados no amido BODIPY empregando métodos descritos acima. Entretanto, esta etapa pode ser omitida se a placa que foi nucleada na etapa 2 produziu uma zona de clareamento no fundamento do amido vermelho.
Excisão
Dia 1
1. Em um tubo Falcon 2059, misturar 200 μΙ_ de hospedeiro MRF' de XL1 Azul OD1, 100μΙ_ de tronco isolado Lambda e 1 μ!_ de tronco de fago de ExAssist.
2. Incubar em 37°C o sacudidor durante 15 minutos.
3. Adicionar 3 mL do veículo NZY.
4. Incubar em 30°C o misturador durante a noite.
Dia 2
1. Aquecer o tubo de excisão a 70°C durante 20 minutos.
2. Centrifugar 1000 x g durante 10 minutos.
3. Em um tubo Falcon 2059, combinar o sobrenadante de 50μί com 200pL de hospedeiro EXP505 OD1.
4. Incubar em misturador a 37°C durante 15 minutos.
5. Adicionar 300μί de veículo SOB.
6. Incubar em misturador a 37°C durante 30-45 minutos.
7. Placas de 50μί na placa de LBkan5o amplo empregando contas de vidro estéril. Se as placas são secas, veículo SOB extra pode ser adicionado para desembolsar auxílio às células.
8. Placa incubada em 30°C durante pelo menos 24 horas.
9. Cultivar um isolado para seqüência e/ou RFLP.
Desenvolver em 30°C de número de cópias de plasmídeo reduzido e é empregado para atenuar a toxicidade aparente de alguns clones de amilase.
Contaminantes que Formam Zonas de Clareamento em Amido Vermelho
Quando empregando amido vermelho no veículo sólido para
Figure BRPI0207770B1_D0065
126 fago de ensaio para atividade de amilase, é comum observar unidades de formação de colônia (cfu) contaminantes que formam zonas de clareamento no amido vermelho. Para placas pintooled, é importante distinguir clones de fago de amilase positiva desses contaminantes quando eles alinham com uma posição de cavidade particular. A fonte dos micróbios contaminantes é presumivelmente os 2% de solução de tronco de amido vermelho, que não pode ser esterilizado por autoclavagem ou por filtração após preparação. É pensamento que eles são organismos oportunistas que sobrevivem metabolizando-se o amido vermelho. A fim de reduzir esses contaminantes, as téc10 nicas úteis estéreis quando fazendo 2% de soluções de amido vermelho e depósito ou em 4°C ou no gelo.
Exemplo 8
Análise Bioinformática
Uma análise de bioinformática inicial foi feita com as seqüências de α-amilase hipertermofílica conhecidas. A figura 14a mostra um alinhamento de algumas seqüências das quais tem sido depositadas no banco de dados NCBI. Esta análise revelou o potencial para iniciadores degenerados designados à PCR o gene menos inteiro sua seqüência de sinal (observe Figura 14a), produzindo potencialmente nova alfa-amilase de extensão total de uma biblioteca.
As seguintes bibliotecas foram peneiradas por PCR de DNA genômico:
Tabela 6:
Biblioteca # Nome Positivo PCR Subclonado
5 A.lithotropicus Não
13 Pyrodictium occultum Não
17 Pyrodictium TAG11 Não Sim
113 Deep sea inrichment Sim Sim
170 Deep sea enrichment Sim Sim
198 Archaeglobus Não
206 Acidianus sp Não
453 Mixed iceland enrich Não
455 Mixed iceland enrich Sim Sim
A figura 14b mostra um alinhamento da seqüência identificada e
Figure BRPI0207770B1_D0066
127 a tabela abaixo lista suas identidades de percentuais relativas.
Figure BRPI0207770B1_D0067
Figure BRPI0207770B1_D0068
128
Tabela 7: % da Identidade da Seqüência do Nucleotídeo
SEQ ID NO.: 79 83 84 73 83,8 84 LO LO co 85,4 83,3 83 o o
SEQ ID NO.: 85 82,6 82,8 r-‘ r- 83,2 84,7 CM lo oo 84,9 96 100
SEQ ID NO.: 83 82,1 82,9 LL 82,8 φ 00 <q φ oo 84,8 100
SEQ ID NO.: 77 82,6 82,2 74,2 83,8 88,8 00 oo 03 100
SEQ ID NO.: 75 82,5 82 74 83,5 88,9 o o T—
Therme 2 80,1 80,5 71,1 . 81,7 100
Therme 82,1 82,5 71,5 100
Piro 2 75,1 74,8 100
Piro 91,7 100
SEQ ID NO.: 81 o o
SEQ ID NO.: 81 Piro Piro 2 Therme Therme 2 SEQ ID NO.: 75 SEQ ID NO.: 77 SEQ ID NO.: 83 SEQ ID NO.: 85 SEQ ID NO.: 79 Clone A
129
A identidade de aminoácido varia de cerca de 85-98% de identidade. Conseqüentemente, essas seqüências são úteis na mistura de genes como descrito aqui.
A figura 14c mostra o alinhamento do ácido nucléico das seqüências de polipeptídeo correspondentes acima. A expressão dessas amilases no pSE420 do vetor de expressor e XL1-Azul de linhagem de células hospedeiras mostra 1703 e 1706 tendo atividade de amilase.
Exemplo 9
Caracterização da Biblioteca de alfa-Amilase GP-1 63 de pH ótimo e Determinação de Atividade Específica
Em experiências iniciais, a SEQ ID NO: 81 de Thermococcus mostrou que foi eficaz em ambas liquefação de amido para moagem a úmido de milho e descolando para tecidos. Esta enzima tem um pH ótimo de 4,5 a 5,0. Neste pH inferior, é possível usar pouco ou nenhum cálcio que diminui todos Os custos de operação e menos formação de subproduto. Além disso, neste pH inferior, existe química reduzida usada e íon de permuta de carga. O padrão de indústria de amilase B.licheniformis é subótimo em ambos termoestabilidade e pH ótimo. A amilase 63GP-1 tem uma atividade específica de aplicação mais elevada comparada à amilase B.licheniformis e portanto muito menos enzima é requerida para hidrolisar uma tonelada de amido (tanto como enzima de menos 20 dobras pode ser empregada).
O pH ótimo para a hidrólise de amido foi determinado reagindose 50μΙ_ do GP-1, 0,35 U/ml, com uns 100 ml de 1% de solução de amido solúvel (0,0175 U/g de amido) durante 30 minutos em 95°C. As extremidades de redução geradas na solução de amido liquefeito foram medidas pelo ensaio de neocupronina, descrito aqui. O percentual de hidrólise de amido de milho foi determinado medindo-se várias extremidades de redução de açucares produzidas com o ensaio de neocupronina. Setenta gramas de solução tampão (pH4-7) foram pesados e 100ppm de cálcio foram adicionadas. Trinta gramas de amido de milho foram misturados na solução tampão para formar uma pasta fluida de amido. A enzima foi adicionada e os recipientes selados e incubados em 95°C durante 30 minutos com uma taxa de
Figure BRPI0207770B1_D0069
130 aquecimento inicial de seis graus C por minuto. Uma amostra de 1ml foi extraída de becheres de reação e analisadas por ensaio de neocupronina. O ótimo para GP-1 foi entre pH 4,5 e 5, ao mesmo tempo que a amilase comercial B.licheniformis realizou otimamente em cerca de pH 6,0.
Exemplo 10
Reagrupamento da Ligação de Amilase
Nove fragmentos (cada cerca de 150 bp) foram amplificados de cada dos clones de origem SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79, revestindo a estrutura de leitura aberta total. Os iniciadores são fornecidos na Tabela 8.
Tabela 8
GAACACTAGTAGGAGGTAACTTATGGCAAAGTATTCCGAGCTCGAAG
GAACGGTCTCATTCCGCCAGCCAGCAAGGGGATGAGCGG
GAACCGTCTCAAAACACGGCCCATGCCTACGGC
GAACGTCTCACCTCGACTTCCACCCCAACGAGGTCAAG
GAACGTCTCAGGCGCTTTGACTACGTGAAGGGC
GAACGGTCTCAACAAGATGGATGAGGCCTTTG
GAACCGTCTCACGATATAATCTGGAACAAGTACCTTGC
GAACCGTCTCAGAAGCACGAGCATAGTTTACTACG
GAACCGTCTCAAAGGTGGGTTTATGTGCCG
GAACGTCTCAGGAATCCAAATGGCGGATATTCCCGC
GAACGGTCTCAGTTTATCATATTGATGAGCTCC
GAACCGTCTCAGAGGTAGTTGGCAGTATATTTG
GAACGTCTCACGCCAGGCATCAACGCCGATG
GAACGTCTCATTGTAGTAGAGCGGGAAGTC
GAACGGTCTCAATCGGTGTCGTGGTTTGCTAC
GAACCGTCTCACTTCCACCTGCGAGGTGGTC
GAACCGTCTCACCTTCCAACCTTGCTCGAGC
TCGAGACTGACTCTCACCCAACACCGCAATAGC
GAACACTAGTAGGAGGTAACTTATGGCCAAGTACCTGGAGCTCGAAG
AGG
GAACGGTCTCATTCCCCCGGCGAGCAAGGGC
GAACCGTCTCAAAACACCGCCCACGCCTACGG
GAACGTCTCACCTCGACTTCCACCCCAAC
GAACGTCTCAGGCGCTTCGACTACGTCAAGG
GAACGGTCTCAACAAGATGGACGCGGCCTTTGAC
GAACCGTCTCACGATATAATTTGGAACAAGTACCC
GAACCGTCTCAGAAGCACCGACATAGTCTAC
GAACCGTCTCAAAGGTGGGTCTACGTTCCG
GAACGTCTCAGGAATCCATATTGCGGAGATTCCGGC
GAACGGTCTCAGTTTATCATGTTCACGAGCTC
GAACCGTCTCAGAGGTAGTTGGCCGTGTACTTG
GAACGTCTCAGCCATGCGTCAACGCCGATG
GAACGTCTCATTGTAGTAGAGCGGGAAGTCG
GAACGGTCTCAATCGGTGTCGTGGTTTGCAACG
SEQ ID NO:
258 Spel
259 Bsal
260 BsmBI
261 BsmAI
262 BsmAI
263 Bsal
264 BsmBI
265 BsmBI
266 BsmBI
267 BsmAI
268 Bsal
269 BsmBI
270 BsmAI
271 BsmAI
272 Bsal
273 BsmBI
274 BsmBI
275
276 Spel
277 Bsal
278 BsmBI
279 BsmAI
280 BsmAI
281 Bsal
282 BsmBI
283 BsmBI
284 BsmBI
285 BsmAI
286 Bsal
287 BsmBI
288 BsmAI
289 BsmAI
290 Bsal
Figure BRPI0207770B1_D0070
131
Tabela 8 - continuação -
Figure BRPI0207770B1_D0071
•5
Figure BRPI0207770B1_D0072
GAACCGTCTCACTTCCACCGGCGAGGTGGTCGTG
GAACCGTCTCACCTTCCGGCCTTGCTCGAGCC
TCGAGACTGACTCTCAGCCCACCCCGCAGTAGCTC
GAACACTAGTAGGAGGTAACTTATGGCCAAGTACTCCGAGCTGGAAG
AGG
GAACGGTCTCATTCCTCCCGCGAGCAAGGG
GAACCGTCTCAAAACACCGCCCACGCCTATG
GAACGTCTCACCTCGACTTCCACCCGAACGAGC
GAACGTCTCAGGCGCTTCGACTACGTCAAGG
GAACGGTCTCAACAAGATGGACGAGGCCTTCG
GAACCGTCTCACGATATAATCTGGAACAAG
GAACCGTCTCAGAAGCACTGACATCGTTTACTACG
GAACCGTCTCAAAGGTGGGTTTACGTTCCG
GAACGTCTCAGGAATCCATATCGCCGAAAT
GAACGGTCTCAGTTTATCATGTTTATGAGC gaaccgtctcagagGtagttggccgtgtatttac
GAACGTCTCACGCCAGGCATCGATGCCGAT
GAACGTCTCATTGTAGTAGAGGGCGAAGTCAAAG
GAACGGTCTCAATCGGTATCGTGGTTGGCTACAAAC
GAACCGTCTCACTTCCTCCGGCGAGGTTGTCATG
GAACCGTCTCACCTTCCGGCTTTGCTTGAGGC
TCGAGACTGACTCTCACCCAACACCGCAGTAGCTCC
CACACAGCAGCAACCAACCTCGAGACTGACTCTCASCC
291 BsmBI
292 BsmBI
293
294 Spel
295 Bsal
296 BsmBI
297 BsmAI
298 BsmAI
299 Bsal
300 BsmBI
301 BsmBI
302 BsmBI
303 BsmAI
304 Bsal
305 BsmBI
306 BsmAI
307 BsmAI
308 Bsal
309 BsmBI
310 BsmBI
311
312 Bbvl
As condições empregadas para PCR foram como segue: 3 minutos 94°C, (30 segundos 94°C; 30 segundos 55°C, 30 segundos 68°C) x 30 ciclos, seguidos por 10 minutos em 68°C. Os produtos PCR correspondendo a regiões homólogas das três origens foram agrupados (1:1:1), cortados com a enzima de restrição apropriada (observe Tabela 8), e purificados por gel. Quantidades iguais de agregados de fragmentos foram combinadas e ligadas (16°C; durante a noite). Os produtos de ligação de 450bp resultante foram purificados por gel e ligados para produzir genes de amilase de extensão total. Os produtos de extensão total resultante foram purificados por gel e amplificados por PCR empregando uma mistura de iniciadores F1 SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79 e iniciador (SEQ ID NO: 312). As condições empregadas para PCR foram como segue: 3 minutos 94°C, (30 segundos 94°C; 30 segundos 50°C, 60 segundos 68°C) x 30 ciclos, seguidos por 10 minutos em 68°C. Os produtos PCR resultante (~1,4 kbp) foram purificados, cortados com Spel e Bbvl, purificados por gel, ligados por pMYC(vetor de Mycogen, cortado com Spel/Xhol), e transformados em E.coli de Topo 10. O DNA de plasmídeo de um agregado de -21000 co15
Figure BRPI0207770B1_D0073
132 lônias foi isolado e transformado nos Pseudomonas.
Peneiramento de α-amilase Reagrupada
O Pseudomonas fluorescens transformado (MB214) contendo pMYC derivado dos clones de origem SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79 foi classificado como placas de 96 ou 384 cavidades por FACS e tratado com uréia 6M. A peneiração primária empregando amido RBB e/ou amido FITC como substratos foi realizada como descrito mais totalmente abaixo. Os clones ativos elevados foram peneirados empregando amido RBB como substrato empregando culturas induzidas e por ensaio de liquefação. Os troncos e clones ativos elevados de novas seqüências com base nos dados de liquefação foram realizados.
A biblioteca de amilase reagrupada transformada (MB214)Pf), foi coletada e classificada em placas de 96 cavidades (ou placas de 384 cavidades) em 1 célula/cavidade em 50μΙ de LB + Tet. As placas foram incubadas durante 24 horas em 30°C. As placas replicadas foram feitas correspondendo a cada das cavidades durante armazenagem. Quarenta e cinco (45) μΙ_ de 12M de uréia foram adicionados a cada cavidade e as placas foram sacudidas durante .10 minutos. As placas manteram temperatura ambiente durante pelo menos 1 hora e o lisado armazenado em 4°C.
Ensaio Empregando Amido RBB
75μΙ de substrato de amido RBB (1% de amido de milho isolúvel RBB em 50mM de tampão NaAc, pH= 4,5) foram adiconados em cada cavidade de uma nova placa de 96 cavidades (fundo V). Cinco micro-litros de lisado de enzima foram transferidos em cada cavidade com substrato empregando Biomek ou Zymark. As placas foram seladas com fita de seleção de alumínio e brevemente sacudidas no misturador. As placas foram incubadas em 90°C durante 30 minutos, seguidas por resfriamento em temperatura ambiente durante cerca de 5 a 10 minutos. Cem microlitros de 100% de etanol foram adicionados para cada cavidade, as placas seladas e brevemente sacudidas no misturador. As placas foram então centrifugadas em 400rpm durante 20 minutos empregando centrífuga de topo de bancada. 100μΙ de sobrenadante foram transferidos em uma nova placa de 96 cavi133 • 10 dades (fundo uniforme) por Biomek e leitura de OD595. Controles: SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79.
Ensaio Empregando Amido FITC
Adicionar 50μΙ de substrato (0,01% de amido FITC em 100mM de tampão NaAc, pH = 4,5) em cada cavidade de uma nova placa de 384 cavidades. Transferidos 5μΙ de lisado de enzima em cada cavidade com substrato e incubadas as placas em temperatura ambiente durante a noite. A mudança da polarização do substrato, excitação em 485 nm, emissão em 535nm, foi lida durante cada cavidade. Controles: SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79. Preferivelmente as placas de 96 cavidades são empregadas para todos os ensaios.
Confirmação de Novos Clones Ativos
Cada clone positivo de peneiração foi desenvolvido e induzido empregando um protocolo padrão. Cada clone foi examinado para desenvolver (isto é, com o passar do tempo a densidade da célula), atividade no nível por célula (ensaio de amido RBB e ensaio de liquefação), expressão (gel de proteína) e solubilidade da proteína (por análise de microscópio). Os clones.elevados novos confirmados foram transferidos durante fermentação.
Embora a invenção tenha sido descrita em detalhes com referência a certas modalidades preferidas desta, será entendido que as modificações e variações estão dentro do espírito e escopo daquilo que é descrito e reivindicado. Tahala 3
SEQ ID NO,
SEQ IDNO: 87 SEQ ID NO: 91 SEQ IDNO: 93 SEQ ID NO: 97 SEQ ID NO: 99 SEQ IDNO: 103 SEQ IDNO: 105 SEQ ID NO: 109 SEQ IDNO: 111 SEQ IDNO: 113 SEQ IDNO: 117 SEQ IDNO: 119 SEQ IDNO: 123 SEQ ID NO: 125
Seqüência de Sinal
AA1-23 (SEQ IO NO:213) AA1-23 (SEQ IDNO: 214} AA1-33(SEQ ID NO: 215) AA1-31 (SEQ ID NO: 216) AA1-30(SEQ ID NO: 217) ÁA1-22 (SEQ ID NO: 218) AA1-33 (SEQ ID NÓ: 219) AA1-25 (SEQ ID NO: 220) AA1-35(S£Q ID NO: 221) AA1-26 (SEQ ID NO: 222) AA1-21 (SEQ IDNO: 223) AA1-3Q(SEQ IDNO: 224) AA1-35(SEQ ID NO: 225) AA1-28(SEQ ID NO: 226)
134
Tabela 3 - continuação
SEQ ID NO.
SEQ ID NO: 127 SEQ ID NO: 131 SEQ ID NO: 133 SEQ ID NO: 137 SEQ ID NO: 139 SEQ ID NO: 141 SEQ ID NO: 143 SEQ ID NO: 145 SEQ ID NO: 147 SEQ ID NO: 149 SEQ ID NO: 69 SEQ ID NO: 153 SEQ ID NO: 155 SEQ ID NO: 157 SEQ ID NO: 159 SEQ ID NO: 161 SEQ ID NO: 167 SEQ ID NO: 169 SEQ ID NO: 173 SEQ ID NO: 175 SEQ ID NO: 177 SEQ ID NO: 179 SEQ ID NO: 185 SEQ ID NO: 189 SEQ ID NO: 191 SEQ ID NO: 193 SEQ ID NO: 197 SEQ ID NO: 199 SEQ ID NO: 201 SEQ ID NO: 203 SEQ ID NO: 205 SEQ ID NO.:73 SEQ ID NO.: 79
Seqüência de Sinal
AA1-30 (SEQ IDNO: 227) AA1-30 (SEQ ID NO: 228) AA1-30 (SEQ ID NO: 229) AA1-28 (SEQ ID NO: 230) AA1-23 (SEQ IO NO: 231) AA1-23 (SEQ ID NO: 232) AA1-30 (SEQ ID NO: 233) AA1-27 (SEQ ID NO: 234) AA1-29 (SEQ ID NO: 235) AA1-28 (SEQ ID NO: 236) AA1-27 (SEQ ID NO: 237) AA1-26 (SEQ ID NO: 238) AA1-33 (SEQ ID NO: 239) AA1-25 (SEQ ID NO: 240) AA1-25 (SEQ ID NO: 241) AA1-36 (SEQ ID NO: 242) AA1-36 (SEQ ID NO: 243) AA1-23 (SEQ ID NO: 244) AA1-25 (SEQ ID NO: 245) AA1-22 (SEQ ID NO: 246) AA1-23 (SEQ ID NO: 247) AA1-23 (SEQ ID NO: 248) AA1-25 (SEQ ID NO: 249) AA1-36 (SEQ ID NO: 250) AA1-25 (SEQ ID NO: 251) AA1-25 (SEQ ID NO: 252) AA1-23 (SEQ ID NO: 253) AA1-23 (SEQ ID NO: 254) AA1-30 (SEQ ID NO: 255) AA1-25 (SEQ ID NO: 256) AA1-16 (SEQ ID NO: 257) AA1-16(SEQ IDNO: 7) AA1-26 (SEQ ID NO: 8)

Claims (61)

  1. REIVINDICAÇÕES
    1. Ácido nucléico isolado, caracterizado pelo fato de que compreende uma sequência que codifica um polipeptídeo tendo atividade de amilase alfa, em que referida sequência é selecionada a partir do grupo 5
    5 consistindo em (a) uma sequência de ácido nucléico como definida em SEQ ID
    NO: 53;
    (b) uma sequência de ácido nucléico complementar à sequência de ácido nucléico como definida em SEQ ID NO: 53.
    io 2. Polipeptídeo purificado possuindo atividade amilase, caracterizado pelo fato de ser selecionado a partir do grupo consistindo em um polipeptídeo tendo uma sequência de aminoácido de SEQ ID NO: 54.
    3. Método de produzir um polipeptídeo como definido na reivindicação 2, caracterizado pelo fato de que compreende as etapas de
    15 introduzir um ácido nucléico codificando o polipeptídeo em uma célula hospedeira sob condições que permitem a expressão do polipeptídeo, e recuperar o polipeptídeo.
    4. Método de hidrolisar uma ligação de amido, caracterizado pelo fato de que compreende contatar uma substância contendo o amido com
    20 um polipeptídeo como definido na reivindicação 2 sob condições que facilitam a hidrólise da ligação carbono-halogênio.
    5. Método para catalisar a decomposição de um amido, 30 caracterizado pelo fato de que compreende a etapa de contatar uma amostra contendo amido com um polipeptídeo como definido na reivindicação 2 sob
    25 condições que facilitam a decomposição do haloalcano ou ácido halocarboxílico.
    6. Preparação de proteína, caracterizada pelo fato de que compreende um polipeptídeo como definido na reivindicação 2 e em que a preparação de proteína é um líquido.
    30 7. Preparação da proteína, caracterizada 5 pelo fato de que compreende um polipeptídeo como definido na reivindicação 2 e em que o polipeptídeo é um sólido.
    Petição 870180038850, de 10/05/2018, pág. 8/10
    8. Vetor de clonagem, caracterizado pelo fato de que compreende uma sequência de ácido nucleico como definida na 10 reivindicação 1 que codifica um polipeptídeo tendo atividade de amilase alfa.
    9. Célula hospedeira de bactéria, levedura ou fungo, 5 caracterizada pelo fato de que compreende uma sequência de ácido nucleico como definida na reivindicação 1 que codifica um polipeptídeo tendo atividade de amilase alfa.
    10. Vetor de expressão capaz de replicar em uma célula hospedeira, caracterizado pelo fato de que compreende um polinucleotídeo
    10 tendo uma sequência de ácido nucleico como definida na reivindicação 1.
    11. Vetor de acordo com a reivindicação 8 ou 10, caracterizado pelo fato de ser selecionado a partir do grupo consistindo em vetores virais, vetores de plasmídeo, vetores de fago, vetores de fagomídio, cosmídio, bacteriófagos, cromossomos artificiais, vetores de adenovírus, e vetores virais
    15 adeno associados.
    12. Célula hospedeira de bactéria, levedura ou fungo, caracterizada pelo fato de que compreende um vetor de expressão como 25 definido na reivindicação 12.
    13. Célula hospedeira de acordo com a reivindicação 9 ou 12, 20 caracterizada pelo fato de que o hospedeiro é selecionado a partir do grupo consistindo em procariotos, fungos e leveduras.
    14. Método para liquefazer uma composição contendo amido, 30 caracterizado pelo fato de que compreende contatar o amido com um polipeptídeo como definido na reivindicação 2.
    25 15. Método para lavar um objeto, caracterizado pelo fato de que compreende contatar referido objeto com um polipeptídeo como definido na reivindicação 2 sob condições suficientes para referida lavagem.
    16. Método para desengomar o tecido, caracterizado pelo fato de que compreende contatar referido tecido com um polipeptídeo como
    30 definido na reivindicação 2 sob condições suficientes 5 para a referida desengomagem.
    17. Método para o tratamento de fibras lignocelulósicas, caracterizado pelo fato de que as fibras são tratadas com um polipeptídeo
    Petição 870180038850, de 10/05/2018, pág. 9/10 como definido na reivindicação 2 em uma quantidade que é eficiente para melhorar as propriedades das fibras.
    18. Método de acordo com a reivindicação 17, para descoloração enzimática da polpa de papel reciclado, caracterizado pelo fato
    5 de que o polipeptídeo como definido na reivindicação 2 é aplicado em uma quantidade que é eficiente para descoloração eficaz da superfície da fibra.
    19. Método para liquefação do amido, caracterizado pelo fato de que compreende contatar referido amido com um polipeptídeo como definido na reivindicação 2 sob condições suficientes para referida liquefação.
    io 20. Detergente aditivo, caracterizado pelo fato de que compreende um polipeptídeo como definido na reivindicação 2.
    21. Método para produzir um xarope de glicose elevada ou maltose elevada ou uma mistura de xarope, caracterizado pelo fato de que compreende:
    15 liquefazer o amido empregando uma quantidade suficiente de um polipeptídeo como definido na reivindicação 2 para obter uma amido 25 hidrolase solúvel; e sacarificar a amido hidrolase solúvel, desse modo resultando em um xarope.
    20 22. Método de acordo com qualquer uma das reivindicações
    14, 19, ou 21, caracterizado pelo fato de que o amido é de um material selecionado a partir de arroz, arroz germinado, milho, cevada, trigo, legumes e batata doce.
    23. Método de acordo com qualquer uma das reivindicações
    25 14,19, ou 22, caracterizado pelo fato de que compreende ainda a adição de uma segunda amilase alfa ou uma amilase beta ou uma combinação das mesmas.
    Petição 870180038850, de 10/05/2018, pág. 10/10
    1/116 • · · ·
    FIG 1 • · · ·
  2. 2/116 ··· ··· ···
    201
    NãO 220
    C Fim
    FIG 2
  3. 3/116
    252
    FIG 3
  4. 4/116
    302
    Não
    FIG 4
  5. 5/116 :· · · · · · · • · · · · · · φ
    Ξ3 ω
    Φ φ
    Ό
    Φ
    Ό ’>
    Φ
    Φ
    Τ3
    -S θ'
    0SEQ 10 ΝΟ 17 □SEOIDWO. 127 SEQ 10 »Ο l<7 UQIDNOJI) SEQIDNO:I03 QUOIONO:»! QUQIDNO.I1>
    SIQIDNO: I» pH 6 pH 4.5
    FIG 5
  6. 6/116 % em rede de amido removido ♦ Comercial SEQ ID NO: 113 ♦ SEQIDNO: 139 ♦ SEQIDNO: 127
    Concentração de enzima(mg/l)
    FIG 6
    1: * : :
  7. 7/116
    FIG 7 » · · · · ··· ··· ··· · • · f · S · · · · · * ·
  8. 8/116 ··«··· · · ·
    Tolerância h2o2
    Tempo em im H2o2(min)
    FIG 8 • Λ »«· ··*··· *
    Ι··« · · * ·
  9. 9/116
    FIG 9a
    Atividade específica (pH 8.40 C) (Com atividade >4U/mg)
    FIG 9b
    Atividade específica @ pH 10, 50C » 4 ' »
  10. 10/116
    SEQ XD NO.:113 (1) SEQ ID NO.:127 (1) · SEQ XD NO.:115 íl) 1 SEQ XD NO. :113(76) | SEQ XD NO.:127(79) 1 SEQ XD NO.:115(81) | SEQ ID NO.:113(156) SEQ ID NO.:127(159) SEQ XD NO.:115(150) SEQ XD NO.:113(234) SBQ XD NO. :127(239) SEQ XD NO. .115(200) SBQ XD NO. :113.(312) SEQ XD »0.:127(317) SBQ XD NO.:115(272) SBQ XD NO. :113(390) SEQ XD NO. :127(392) SEQ XD NO.:115(331) SEQ XD NO.:113(468) SEQ XD NO.:1271470) SEQ XD NO.:115(410) SEQ ID NO.:113 (485) SBQ XD NO.:127 (541) SEQ ID NO.:115 (437)
    -XANLNi
    161 _ ιβο eovtavevopadiwSvxsCQQikantkfhfpgrggtysdfk EWVQAVEVNPggRNQETsSrYQIQAMTKFDFPGRGNTYSSFK PPSgVXSgKYgAHYMDPHPN-..........
    wnwxnruuTgwu£»att<u«N*WJAKUi»«-NtaimivaHiBNtef«xuxj4i2«UiiguxvnrgvAM<ipvKW'
    KRWYHFDGTiwDESgKLNBSTKrEGTGKAfDfEVDjjENGNÍDYLMjftDLOMDHPíWTEUOW'
    - - --N|STSECTroOFPD£®Hl.VPFNaiqp.S*SNES--------------------------Y.
    241
    HnfenJpWKHVRgiffCKEBtWBBylBniB hikys γγρε^Λη vrsqtrknlfaEgBksydvhf gGYGAWVj^DÍLSOWGO——gAaGjYSErrHVD rfjHCTNF YITKTSt^HS ís5g--
    401
    IARg^YfiY
    481
    BGEPXVN561
    ÍOYIOHQglIC ítBivJyddSeJi
    320
    KXflFBAgSTQCGO YDHRKI.LNG - mwrwgsxssGYflcHRyxxwB - JyfmdeSfpnknipaJvyaBSgb
    400
    GTKOSSQ- -rsxpaBkhkxepBl
    YYGIPKYN.....X^ÕksKXOpLL
    YEEM1NKD--------KIJíNg---g
    480 «•V iDXSVMlSGXAAglTDGPgGMtRMYViatQHXGSTgHDSTeHRS—EPWmSW ilDSKPNSGIJUEXTOGFGCgKWNYVgXKHAGKV£gD&rgNXS--fTVTXNÃDS ~CPlPGL-STYgaG3DWXERwgHVBSKPAGYTIH8YTCHLGGWVDRg!g8YD§
    560
    SIÍVQR..........................-...................
    _5IKvJkTSQVTPTVKNXTTISGGNVYWGNX PBLONWNTANA1 KMTPSSYPTNKATXALP
    SYggHSSAGVC..............-......................................
    605
    FIG 10
  11. 11/116
    y = 83.565X R2 = 0.9967 Maltose de pH 10 na curva «4 S oj « oi oi 1 IOB> IW OCO OOM Maltose umol toa* 0 «
    FIG 11
  12. 12/116
    Efeito do pH
    PH
    SEQIDNO.211 -^SÊQIDNO. 127
    FIG 12
  13. 13/116
    FIG 13
  14. 14/116 • · · · · · ·
    FIG 14a:
    SEQ IDNO:8I Piro
    Piro 2 Termo
    Termo 2 Con-senso
    SEQIDNO: 81 Piro
    Piro 2 Termo
    Termo 2 Con-senso
    SEQIDNO: 81 Piro
    Piro 2 Termo
    Termo 2 Con-senso
    SEQIDNO: 81 Piro
    Piro 2 Termo
    Termo 2 Con-senso _________________MKK FVALFITMFF WSMAW.....AQPASAAK __________ MKK FVALLITMFF WSMAAV.....AQPASAAK __________ VNIKK LTPLLTLLLF FI...VL.....ASPVSAAK
    SESQCTATCT WRWYMSAKK LLALLFVLAV LVGVAVIPAR VGIAPVSAGA ____________________________MA RKVLVALLVF LWLSVSAVP
    .....................................-........SA- Indicador de senso
    51 . 100 YS..ELEEGG VIMQAFYWDV PGGGIWWDTI RSKIPEWYEA GISAIWIPPA YS..ELEEGG VIMQAFYWDV PAGGIWWDTI RSKIPEWYEA GISAIWIPPA YL..ELEEGG VIMQAFYWDV PGGGIWWDHI RSKIPEWYEA GISAIWLPPP TSRPSLEEGG VIMQAFYWDV PAGGIWWDTI RSKIPDWASA GISAIWIPPA AKAETLENGG VIMQAFYWDV PGGGIWWDTI AQKIPDWASA GISAIWIPPA -----DB-GG VIMQAFYWDV P-GGIWWD-I --KIP-W--A GISAIW-PPlffl 15 O
    SKGMSGGYSM GYDPYDFFDL GBYNQKGTIE TRFGSKQELI NMINTAHAYG SKGMGGAYSM GYDFYDFFDL GEYNQKGTVE TRFGSKQELI NMINTAHAYG SKGMSGGYSM GYDPYDYFDL GEYYQKGTVE TRFGSKEELV RLIQTAHAYG SKGMSGAYSM GYDFYDFFDL GEYYQKGTVE TRFGSKQELI NMINTAHSYG SKGMSGGYSM GYDPYDFFDL GEYYQKGSVE TRFGSKEELV NMINTAHAHN SKGM-G-YSM GYDPYD-FDL GEY-QKG--E TRFGSK-EL- --I-TAH--151 200
    IKVIADIVIN HRAGGDLEWN PFVGDYTWTD FSKVASGKYT ANYLDFHPNE IKVIADIVIN HRAGGDLEWN PFVGDYTWTD FSKVASGKYT ANYLDFHPNE IKVIADWIN HRAGGDLEWN PFVGDYTWTD FSKVASGKYT ANYLDFHPNE IKVIADIVIN HRAGGDLEWN PFTNSYTWTD FSKVASGKYT ANYLDFHPNE MKVIADIVIN HRAGGDLEWN PFTNSYTWTD FSKVASGKYT ANYLDFHPNE -KVIAD-VIN HRAGGDLEWN PF---YTWTD FSKVASGKYT ANYLDFHPNE
    SEQIDNO: 81
    Piro Piro 2 Termo
    Termo 2 Con-senso
    SEQIDNO: 81 Piro
    Piro 2 Termo
    Termo 2 Con-senso
    SEQIDNO: 81 Piro
    Piro 2 Termo
    Termo 2 Con-senso
    201
    VKCCDEGTFG
    VKCCDEGTFG
    LHCCDEGTPG
    VKCCDEGTFG
    LHAGDSGTFG •-—D-GTFG
    251
    KGYGAWWKD KGYGAWWKD KGYGAWWRD KGYGAWWKD KGYAPWWKN KGY--WW-301
    MDEAFDNKNI
    MDEAFDNTNI
    MDEAFDNNNI
    MDEAFDNKNI
    MDEAFDNNNI
    MDEAFDN-NI
    GFPDIAHEKS
    GFPDIAHEKE
    GFPDICHHKE
    GFPDIAHEKS
    GYPDICHDKS
    G-PDI-H-KWLNWWGGWAV WLNWWGGWAV WLNWWGGWAV WLKWW. ALAV WLNRWGGWAV WL--W---AV
    PALVSALQNG
    PALVDALQNG
    PALVYALQNG
    PALVSALQNG
    PALVDALKNG
    PALV-AL-NG
    WDQHWLWASD
    WDQHWLWASD
    WDQYWLWKSN
    WDQYWLWASQ
    WDQHWLWASN
    WDQ-WLW-SGEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    QTWSRD PFK GTWSRDPFK QTWSRD PFK QTWSRD PFK GTWSRDPFK -TWSRD PFK
    ESYAAYLRSI ESYAAYLRSI ESYAAYLRSI KSYAAYLRSI ESYAAYLR SI -SYAAYLRSI
    LLNWAYSSGA
    LLNWAYSSGA
    LLSWAYESGA
    LLNWAYSSGA
    LLSWAYDSGA
    LL-WAY-SGA
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    25 0
    GVDAWRFDYV
    GVDAWRFDYV
    GFDGWRFDYV
    GIDAWRFDYV
    GIDAWRFDYV
    G-D-WRFDYV
    300
    KVFDFPLYYK KVFDFPLYYK KVFDFPLYY K KVFDFPLYY K KVFDFPLYYK KVFDFPLYY K
    35 0
    DIIWNKYLAY
    DIIWNKYPAY
    DIIWNKYPAY
    DIIWNKYPAY
    NIIWNKYPAY
    -IIWNKY-AY • ·
  15. 15/116
    FIG 14a(cont.)
    SEQ ID NO: 81 Piro Piro 2 Termo Termo 2 Con-senso 351 AFILTYEGQP VIFYRDYEEW AFILTYEGQP VIFYRDYEEW AFILTYEGQP VIFYRDFEEW AFILTYEGQP VIFYRDYEEW AFILTYEGQP AIFYRDYEEW AFILTYEGQP -IFYRD-EEW LNKDRLNNLI LNKDKLNNLI LNKDKLINLI LNKDRLKNLI LNKDRLRNLI LNXD-L- NLI WIHDHLAGGS WIHDHLAGGS WIHDHLAGGS WIHNNLAGGS WIHDHLAGGS WIH--LAGGS 400 TSIVYYDSDE TSIVYYDSDE TTIVYYDNDE TSIVYYDNDE TDIIYYDSDE T-I-YYD-DE 401 45 0 SEQ ID NO: 81 MIFVRNGYGS KPGLITYINL GSSKVGRWVY VPKFAGACIH EYTGNLGGWV Piro LIFVRNGDSK RPGLITYINL GSSKVGRWVY VPKFAGACIH EYTGNLGGWV Piro 2 LIFVRNGDSR RPGLITYINL SPNWVGRWVY VPKFAGACIH EYTGNLGGWV Termo LIFVRNGYGN KPGLITYINL GSSKVGRWVY VPKFAGSCIH EYTGNLGGWV * Termo 2 LIFVRNGYGD RPGLITYINL GSSKAGRWVY VPKFAGSCIH EYTGNLGGWI Con-senso -IFVRNG--- -PGLITYINL -----GRWVY VPKFAG-CIH EYTGNLGGW- 451 486 SEQ ID NO: 81 DKYVYSSGWV YFEAPAYDPA NGQYGYSVWS YCGVG* Piro DKYVESSGWV YLEAPAYDPA SGQYGYTVWS YCGVG* Piro 2 DKRVDSSGWV YLEAPPHDPA NGYYGYSVWS YCGVG* Termo DKYVGSNGWV YLEAPAHDPA KGQYGYSVWS YCGVG* Termo 2 DKWVDSSGRV YLEAPAHDPA NGQYGYSVWS YCGVG* Con-senso DK-V-S-G-V Y-EAP--DPA -G-YGY- VWS YCGVG*
    Indicador de anti-senso • · · ··· ···
  16. 16/116
    FIG 14b
    SEQIDNO: 81
    Piro
    SEQIDNO: 73 Termo 2
    SEQIDNO: 75 SEQIDNO: 77 SEQIDNO: 83 SEQIDNO: 85
    SEQ IDNO:79 Termo Piro 2
    CLONEA
    Con-senso
    1 50 ________________________MKKFVA LFITMFFVVS MAWAQPASA ____________________-___MKKFVA LLITMFFVVS MAAVAQPASA ____________________________MA RKVLVALLVF LWLSVSAVP
    ------------------------MKPAKL LVFVLWSIL AGLYAQPAGA
    SESQCTATCT WRWYMSAKK LLALLFVLAV LVGVAVIPAR VGXAPVSAGA
    ----------- VNIKK LTPLLTLLLF FIVLASPVSA
    -------------------- MRRSARV LVLIIAFFLL AGIYYPSTSA
    SEQIDNO: 81
    Piro
    SEQIDNO: 73 Termo 2
    SEQIDNO: 75 SEQIDNO: 77 SEQIDNO: 83
    SEQIDNO: 85 SEQIDNO: 79
    Termo Piro 2
    CLONEA
    Con-senso
    AKYSELEEGG
    AKYSELEEGG
    ---MALEEGG
    AKAETLENGG
    ---MALEEGG —MALEEGG
    ---MALEEGG
    ---MALEEGG
    AKYLELEEGG TSRPSLEEGG AKYLELEEGG AKYSELEQGG .......-GG
    VIMQAFYWDV
    VIMQAFYWDV
    LIMQAFYWDV
    VIMQAFYWDV
    LIMQAFYWDV
    LIMQAFYWDV
    LIMQAFYWDV
    LIMQAFYWDV
    VIMQAFYWDV
    VIMQAFYWDV
    VIMQAFYWDV
    VIMQAFYWDV
    -IMQAFYWDV
    PGGGIWWDTI
    PAGGIWWDTI
    PGGGIWWDTI
    PGGGIWWDTI
    PMGGIWWDTI
    PMGGIWWDTI
    PGGGIWWDTI
    PGGGIWWDTI
    PSGGIWWDTI
    PAGGIWWDTI
    PGGGIWWDHI
    PEGGIWWDTI
    P-GGIWWD-I
    RSKIPEWYEA RSKIPEWYEA AQKIPDWASA AQKIPDWASA AQKIPDHASA AQKIPDWASA AQKIPEWASA AQKIPEWASA RQKIPEWYDA RSKIPDWASA RSKIPEWYEA RQKIPEWYDA — KIP-W- -A
    100
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWIPPA
    GISAIWLPPP
    GISAIWIPPA
    GISAIW-PPSEQIDNO: 81
    Piro
    SEQIDNO: 73 Termo 2
    SEQIDNO: 75 SEQIDNO: 77 SEQIDNO: 83 SEQIDNO: 85 SEQIDNO: 79
    Termo Piro 2
    CLONE A Con-senso
    101 15 0 SKGMSGGYSM GYDPYDFFDL GEYNQKGTIS TRFGSKQELI NMINTAHAYG SKGMGGAYSM GYDPYDFFDL GEYNQKGTVE TRFGSKQELI NMINTAHAYG SKGMSGGYSM GYDPYDFFDL GEYYQKGSVE TRFGSKEELV NMINTAHAHN SKGMSGGYSM GYDPYDFFDL GEYYQKGSVE TRFGSKEELV NMINTAHAHN SKGMSGGYSM GYDPYDYFDL GEYYQKGTVE TRFGSKQELI NMINTAHAYG SKGMSGGYSM GYDPYDYFDL GEYYQKGTVE TRFGSKQELI NMINTAHAYG SKGMSGGYSM GYDPYDFFDL GEYYQKGTVE TRFGSKEELV NMINTAHSYG SKGMSGGYSM GYDPYDFFDL GEYYQKGTVE TRFGSKEELV NMINTAHSYG SKGMGGAYSM GYDPYDFFDL GEYDQKGTVE TRFGSKQELV NMINTAHAYG SKGMSGAYSM GYDPYDFFDL GEYYQKGTVE TRFGSKQELI NMINTAHSYG SKGMSGGYSM GYDPYDYFDL GEYYQKGTVE TRFGSKEELV RLIQTAHAYG SKGMGGAYSM GYDPYDYFDL GEFYQKGTVE TRFGSKEELV NMISTAHQYG SKGM-G-YSM GYDPYD-FDL GE--QKG--E TRFGSK-EL- --I-TAH--SEQIDNO: 81 Piro
    SEQIDNO: 73 Termo 2
    SEQIDNO: 75 SEQIDNO: 77 SEQIDNO: 83 SEQIDNO: 85 SEQIDNO: 79
    Termo Piro 2
    CLÓNEA
    Con-senso
    151
    IKVIADIVIN
    IKVIADIVIN
    MKVIADIVIN
    MKVIADIVIN
    MKVIADIVIN
    MKVIADIVIN
    IKVIADIVIN
    IKVIADIVIN
    IKVIADIVIN
    IKVIADIVIN
    IKVIADWIN
    IKVIADIVIN
    -KVIAD-VIN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGGLSWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGGDLEWN
    HRAGG-LEWN
    PFVGDYTWTD PFVGDYTWTD PFTNSYTWTD PFTNSYTWTD PFVNDYTWTD PFVNDYTWTD PFVNDYTWTD PFVNDYTWTD PFVNDYTWTD PFTNSYTWTD PFVGDYTWTD PYVGDYTWTD P—- —— YTWTD
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYT
    FSKVASGKYK
    FSKVASGKY200
    ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE AHYMDFHPNN A-Y-DFHPN ··· ··· ··· ·
  17. 17/116
    14b(cont.)
    SEQ ID NO: 81
    Piro
    SEQ ID NO: 73
    Termo 2
    SEQ IDNO: 75 SEQ ID NO: 77 SEQ IDNO: 83 SEQ IDNO: 85 SEQ IDNO: 79
    Termo Piro 2
    CLONEA Con-senso
    SEQ IDNO: 81 Piro
    SEQ IDNO: 73 Termo 2
    SEQ ID NO: 75 SEQ ID NO: 77 SEQ IDNO: 83 SEQ ID NO: 85 SEQ ID NO: 79
    Termo Piro 2
    CLONEA Con-senso
    SEQ1D NO: 81
    Piro
    SEQ IDNO: 73 Termo 2
    SEQ ID NO: 75 SEQ IDNO: 77 SEQ ID NO: 83 SEQ IDNO: 85 SEQ IDNO: 79
    Termo Piro 2
    CLONEA Con-senso
    SEQIDNO:8Í
    Piro
    SEQ IDNO: 73 Termo 2
    SEQ IDNO: 75 SEQ IDNO: 77 SEQ IDNO: 83 SEQ IDNO: 85 SEQ IDNO: 79
    Termo Piro 2
    CLONEA Con-senso
    201
    VKCCDEGTFG
    VKCCDEGTPG
    LHAGDSGTFG
    LHAGDSGTFG
    LHAGDSGTFG
    LHAGDSGTFG
    LHCCDEGTFG
    LHCCDEGTFG
    VKCCDEGTFG
    VKCCDEGTFG
    LHCCDEGTFG
    YSTSDEGTFG
    ----D-GTFG
    251
    KGYGAWWKD KGYGAWWKD KGYAPWWKN KGYAPWWKN KGYAPWWRD KGYAPWWKD KGYGAWWND KGYGAWWND KGYGAWWKD KGYGAWWKD KGYGAWWKD KGYGAWWKD KGY--WW-301
    MDEAFDNKNI
    MDEAFDNTNI
    MDEAFDNNNI
    MDEAFDNNNI
    MDEAFDNNNI
    MDEAFDNNNI
    MDEAFDNTNI
    MDEAFDNTNI
    MDAAFDNKNI
    MDEAFDNKNI
    MDEAFDNNNI
    MDEAFDNKNI
    MD-AFDN-NI
    351
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    AFILTYEGQP
    GFPDIAHEKS
    GFPDIAHEKS
    GYPDICHDKS
    GYPDICHDKS
    GYPDICHDKS
    GYPDICHDKS
    GYPDICHDKS
    GYPDICHDKS
    GFPDIAHEKS
    GFPDIAHEKS
    GFPDICHHKE
    GFPDIDHLVP
    G-PDI-H--WLNWWGGWAV WLNWWGGWAV WLNRWGGWAV WLNRWGGWAV WLNWWGGWAV WLNWWGGWAV WLSWWGGWAV WLSWWGGWAV WLDWWGGWAV WLKWW.ALAV WLNWWGGWAV WLSQWGGWAV WL--W---AV
    PALVSALQNG
    PALVDALQNG
    PALVDALKNG
    PALVDALKNG
    PALVDALRYG
    PALVDALRYG
    PALVDALRYG
    PALVYALKNG
    PALVEALKNG
    PALVSALQNG
    PALVYALQNG
    PALVYAIQNG
    PALV-A---G
    VIFYRDYEEW
    VIFYRDYEEW
    AIFYRDYEEW
    AIFYRDYEEW
    TIFYRDYEEW
    TIFYRDYEEW
    VIFYRDYEEW
    VIFYRDYEEW
    TIFYRDYEEW
    VIFYRDYEEW
    VIFYRDFEEW
    VIFYRDYEEW
    -IFYRD-EEW
    LNKDRLNNLI LNKDKLNNLI LNKDRLRNLI LNKDRLRNLI LNKDKLKNLI LNKDKLKNLI LNKDKLNNLI LNKDKLNNLI LNKDRLRNLI LNKDRLKNLI LNKDKLINLI LNKDKLNNLI LNKD-L- NLI
    WIHDHLAGGS
    WIHDHLAGGS
    WIHDHLAGGS
    WIHDHLAGGS
    WIHDNLAGGS
    WIHDNLAGGS
    WIHDHLAGGS
    WIHDHLAGGS
    WIHDHLAGGS
    WIHNNLAGGS
    WIHDHLAGGS
    WIHEHLAGGS
    WIH--LAGGS
    WDQHWLWASD
    WDQHWLWASD
    WDQHWLWASN
    WDQHWLWASN
    WDQYWLWASQ
    WDQYWLWASQ
    WDQYWLWASS
    WDQYWLWASS
    WDQYWLWASN
    WDQYWLWASQ
    WDQYWLWKSN
    FNQYWLWASN
    --Q-WLW-SGEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    GEYWDTNVDA
    QTWSRDPFK
    GTWSRDPFK
    GTWSRDPFK
    GTWSRDPFK
    QTWSRDPPK
    QTWSRDPFK
    QTWSRDPFK
    GTWSRDPFK
    GTWSRDPFK
    QTWSRDPFK
    QTWSRDPFK
    ETWSRDPFK
    -TWSRDPFK
    ESYAAYLRSI esyaaylrsi
    ESYAAYLRSI
    ESYAAYLRSI
    ESYAAYLRSI
    ESYAAYLRSI
    ESYAAYLRSI
    ESYAAYLRSI
    ESYAAYLRSI
    KSYAAYLRSI
    ESYAAYLRSI
    ESYAAYLRSI
    -SYAAYLRSI
    LLNWAYSSGA LLNWAYSSGA LLSWAYDSGA LLSWAYDSGA VLNWAYSSGA VLNWAYSSGA LLNWAYSSGA LLNHAYNSGA LLNWAYSSDA LLNWAYSSGA LLSWAYESGA LLNWAYSSGA -L-WAY-S-A
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    AVTFVANHDT
    25 0
    GVDAWRFDYV
    GVDAWRFDYV
    GIDAWRFDYV
    GIDAWRFDYV
    GIDAWRFDYV
    GIDAWRFDYV
    GVDAWRFDYV
    GVDAWCFDYV
    GVDAWRFDYV
    GIDAWRFDYV
    GFDGWRFDYV
    GIDAWRFDYV
    G-D-W-FDYV
    300
    KVFDFPLYYK KVFDFPLYYX KVFDFPLYYK KVFDFPLYYX KVFDFALYY X KVFDFALYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDF-LYYK
    350
    DIIWNKYLAY
    DIIWNKYPAY
    NIIWNKYPAY
    NIIWNKYPAY
    DIIWNKYPAY
    DIIWNKYPAY
    DIIWNKYPAY
    DIIWNKYPAY
    DIIWNKYPAY
    DIIWNKYPAY
    DIIWNKYPAY
    NIIWNKYPAY
    -IIWNKY-AY
    400
    TSIVYYDSDE
    TSIVYYDSDE
    TDIIYYDSDE
    TDIIYYDSDE
    TDIVYYDNDE
    TDIVYYDNDE
    TDIVYYDSDE
    TDIVYYDSDE
    TDIVYYDNDE
    TSIVYYDNDB
    TTIVYYDNDB
    TKILYYDDDE
    T-I-YYD-DE • · · ··· ··· ··· ·
    I · · · · · · ···
  18. 18/116 *····· · · ·
    FIG 14b(cont.)
    SEQ ID NO: 81 401 MIFVRNGYGS Piro LIFVRNGDSK SEO ID NO: 73 LIFVRNGYGD Termo 2 LIFVRNGYGD SEQ ID NO: 75 LIFVRNGYGS SEQ ID NO: 77 LIFVRNGYGS SEQ1D NO: 83 LIFVRNGYGT SEQ IDNO: 85 - LIFVRNGYGT SEQ IDNO: 79 LIFVRNGYGD Termo LIFVRNGYGN Piro 2 LIFVRNGDSR CLONE A LIFMREGYGD Con-senso -IF-R-G- —
    SEQ ID NO: 81 451 VDKYVYSSGW Piro VDKYVESSGW SEQ ID NO: 73 IDKWVDSSGR Termo 2 IDKWVDSSGR SEQ ID NO: 75 VDKWVDSSGW SEQ ID NO: 77 VDKWVDSSGW SEQ ID NO: 83 IDKYVSSSGW SEQ ID NO: 85 IDKYVSSSGW SEQ IDNO: 79 VDKWVDSSGW Termo VDKYVGSNGW Piro 2 VDKRVDSSGW CLONE A VDRYVQYDGW Con-senso -D--V---G-
    KPGLITYINL GSSKVGRWVY RPGLITYINL GSSKVGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL ASSKAGRWVY KPGLITYINL GSSKVGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKVGRWVY RPGLITYINL SPNWVGRWVY RPGLITYINL GSDWAERWVN -PGLITYINL -.....RWVVYFEAPAYDP ANGQYGYSVW VYLEAPAYDP ASGQYGYTVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGYYGYSVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGYYGYSVW VYLEAPAHDP AKGQYGYSVW VYLEAPPHDP ANGYYGYSVW VKLTAPPHDP ANGYYGYSVW V---AP--DP A-G-YGY-VW
    45 0
    V.PKFAGACI HEYTGNLGGW V.PKFAGACI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGSLGGW V.PKFAGACI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGACI HEYTGNLGGW VGSKFAGYTI HEYTGNLGGW V--KFAG--I HEYTG-LGG.W
    487
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYCGVG*
    SYAGVG*
    SY-GVG*
    ··· ··· ··· ·
  19. 19/116
    FIG 14c:
    SEQ ID NO: 13 SEQ ©NO 15 SEQ ©NO 75 SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NO: 79 SEQ ©NO II
    CLONE A Con-senso
    ---ATGAAGC CTGCGAAACT CCTCGTCTTT GTGCTCGTAG TCTCTATCCT
    ---ATGAAGA AGTTTGTCGC CCTGTTCATA ACCATGTTTT TCGTAGTGAG
    ATGAGGAGAT CCGCAAGGGT TTTGGTTCTG ATTATAGCOT TTTTCCTCCT
    SEQ ©NO: »3 SEQ ©NO 15 SEQ ©NO: 75 SEQ ID NO: 77 SEQ ID NQ 73 SEQ ID NQ 79 SEQ ID Natl
    CLONE A Con-senso
    51 100
    -------------------- ATGGCTCTGG
    ----------------------------------------- ATGGCTCTGG
    ---------------------------------------- ATGGCTCTGG
    -------------------- ATGGCTCTGG
    ---------------------------------------- ATGGCTCTGG
    CGCGGGGCTC TACGCCCAGC CCGCGGGGGC GGCCAAGTAC CTGGAGCTCG CATGGCAGTC GTTGCACAGC CAGCTAGCGC CGCAAAGTAT TCCGAGCTCG GGCGGGGATT TACTACCCCT CCACGAGTGC CGCGAAGTAC TCCGAGCTGG
    SEQ ID Na 13 SEQ ID Na 15 SEQ ID NO: 75 SEQ ID Na 77 SEQ ID NQ 73 SEQ ID NQ. 79 SEQ ID Να II
    CLONE A Con-senso
    SEQID NO 13 SEQ ID NO 15 SEQID NO 75 SEQ ©NO 77 SEQ ©NO 73 SEQ ©NO 79 SEQ ©NO II
    CLONEÁ Con-senso
    SEQ ©NO 13 SEQ ©NO 15 SEQ ©NO 75 SEQ IDNO 77 SEQ IDNO: 73 SEQ IDNO 79 SEQ IDNO 11
    CLONE A
    Con-senso
    101
    AAGAGGGCGG AAGAGGGCGG AAGAGGGCGG AAGAGGGCGG TAGAGGGCGG AAGAGGGCGG AAGAAGGCGG AGCAGGGCGG -----GGCGG
    151
    GGAATCTGGT
    GGAATCTGGT
    GGAATCTGGT
    GGAATCTGGT
    GGAATCTGGT
    GGAATATGCT
    GGAATCTGGT
    GGAATCTGGT
    GGAAT-TGGT
    201
    AGGAATCTCA AGGAATCTCA CGGGATTTCG CGGGATTTCG CGGGATTTCG CGGAATCTCC GGGAATATCC AGGCATATCC -GG-AT- TCGCTCATAATG GCTTATAATG GCTTATAATG GCTCATAATG GCTTATAATG CGTCATAATG CGTTATAATG AGTCATAATG —T-ATAATG
    GGGACACAAT
    GGGACACCAT
    GGGACACGAT
    GGGACACGAT
    GGGACACCAT
    GGGACACAAT
    GGGACACCAT
    GGGACACAAT
    GGGACAC-AT
    GCGATATGGA
    GCGATATGGA
    GCGATATGGA
    GCGATATGGA
    GCAATATGGA
    GCAATATGGA
    GCCATTTGGA
    GCCATCTGGA
    GC-AT-TGGA
    CAGGCCTTCT
    CAGGCATTCT
    CAGGCATTCT
    CAGGCCTTCT
    CAGGCCTTCT
    CAGGCGTTCT
    CAGGCCTTCT
    CAGGCCTTCT
    CAGGC-TTCT
    AGCTCAAAAG AGCCCAGAAG AGCCCAGAAG AGCCCAGAAG AGCCCAGAAG ACGGCAGAAG CAGGAGCAAG ACGGCAGAAG .......AAG
    TTCCACCAGC
    TTCCACCAGC
    TTCCCCCCGC
    TCCCTCCCGC
    TTCCTCCCGC
    TTCCCCCGGC
    TTCCGCCAGC
    TACCCCCGGC
    T-CC-CC-GC
    ACTGGGATGT
    ATTGGGACGT
    ACTGGGACGT
    ACTGGGACGT
    ACTGGGACGT
    ACTGGGACGT
    ACTGGGACGT
    ACTGGGACGT
    A-TGGGA-GT
    ATACCCGAAT
    ATACCCGAAT
    ATACCCGACT
    ATACCCGACT
    ATACCCGACT
    ATACCGGAGT
    ATACCGGAGT
    ATCCCTGAAT
    AT-CC-GA-T
    GAGTAAGGGC
    GAGTAAGGGA
    GAGCAAGGGT
    GAGCAAGGGT
    GAGTAAGGGC
    GAGCAAGGGC
    CAGCAAGGGG
    GAGCAAGGGC
    -AG-AAGGG150
    TCCTGGAGGA
    CCCAGGTGGA
    CCCCATGGGA
    CCCCATGGGA
    CCCAGGTGGA
    GCCTTCAGGA
    CCCAGGTGGA
    TCCGGAGGGA
    -CC----GGA
    200
    GGGCAAGTGC GGGCAAGTGC GGGCAAGCGC GGGCAAGCGC GGGCGAGCGC GGTACGATGC GGTACGAGGC GGTACGATGC GG------GC
    2S0
    ATGAGCGGTG
    ATGAGCGGTG
    ATGAGCGGCG
    ATGAGCGGCG
    ATGAGCGGCG
    ATGGGCGGCG
    ATGAGCGGCG
    ATGGGCGGGG
    ATG-GCGG-G
  20. 20/116
    FIG 14C(cont.)
    SEQ ID Να 13 SEQ ID NO: 15 SEQ ID Na 75 SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NO: 79 SEQ ID NO: II
    CLONEA Con-senso
    251
    GTTATTCCAT GGGCTACGAT GTTATTCCAT GGGCTACGAT GCTATTCGAT GGGCTACGAC GCTATTCGAT GGGCTACGAC GCTATTCGAT GGGCTACGAC CCTATTCGAT GGGCTACGAC GTTACTCGAT GGGCTACGAT CCTACTCGAT GGGCTACGAC --TA-TC-AT GGGCTACGACCCTACGATT TCTTTGACCT CCCTACGATT TCTTTGACCT CCCTACGATT ATTTTGACCT CCCTACGATT ATTTTGACCT CCCTACGATT TCTTCGACCT CCCTACGACT TCTTTGACCT CCCTACGATT TCTTTGACCT CCCTACGATT ACTTCGATCT CCCTACGA-T --TT-GA-CT
    300
    CGGCGAGTAC
    CGGCGAGTAC
    CGGTGAGTAC
    CGGTGAGTAC
    CGGTGAGTAC
    CGGTGAGTAC
    CGGCGAGTAC
    GGGCGAGTTT
    -GG-GAGT-SEQ ID NO: «3 SEQ ID NO: 15 SEQ ID NO: 75 SEQ ID NO: 77 SEQ ID Μλ 73 SEQ ID NO. 79 SEQ ID Να II
    CLONEA Con-senso
    301
    TATCAGAAGG
    TATCAGAAGG
    TACCAGAAGG
    TACCAGAAGG
    TACCAGAAGG
    GACCAGAAGG
    AACCAGAAGG
    TACCAGAAGG
    -A-CAGAAGG
    SEQ ID Na 13 SEQ ID NO: 15 SEQ ID Na 75 SEQ ID Na 77 SEQ ID NO: 73 SEQ ID Na 79 SEQ ID NO: II
    CLONE A Con-senso
    351
    GAACATGATA
    GAACATGATA
    AAACATGATA
    AAACATGATA
    GAACATGATA
    GAACATGATA
    CAATATGATA
    CAACATGATC
    -AA-ATGATGGACAGTTGA GGACAGTTGA GAACGGTGGA GAACGGTGGA GAAGCGTTGA GAACGGTAGA GAACCATCGA GAACCGTTGA G-A-—T-GA
    AACACCGC AC AACACCGCAC AACACCGCCC AACACCGCCC AACACCGCCC AACACCGCCC AACACGGCCC TCCACGGCCC —CAC-GC-C
    GACGCGCTTC GACGCGCTTC AACAAGATTC AACGAGGTTC GACCCGCTTC GACGCGCTTT AACGCGCTTT GACCCGCTTC -AC—G-TTACTCCTACGG ACTCCTACGG ACGCCTATGG ACGCCTATGG ATGCTCACAA ACGCCTACGG ATGCCTACGG ACCAGTACGG A.....A--GGCTCAAAGG
    GGCTCAAAGG
    GGCTCAAAGC
    GGCTCAAAGC
    GGATCAAAAG
    GGCTCCAAGC
    GGCTCTAAAC
    GGCTCCAAGG
    GG-TC-AA—
    CATAAAGGTG
    CATAAAGGTG
    CATGAAGGTA
    CATGAAGGTA
    CATGAAGGTC
    CATCAAGGTC
    CATAAAGGTC
    CATCAAGGTT
    CAT-AAGGT350
    AAGAACTGGT
    AAGAACTGGT
    AGGAGCTCAT
    AGGAGCTCAT
    AGGAGCTTGT
    AGGAGCTCGT
    AGGAGCTCAT
    AAGAGCTCGT
    A-GA-CT--T
    400
    ATAGCAGACA
    ATAGCGGACA
    ATAGCCGATA
    ATAGCCGATA
    ATAGCGGACA
    ATCGCAGACA
    ATAGCGGACA
    ATAGCGGACA
    AT-GC-GA-A
    SEQ ID Na 13 SEQ ID Na 15 SEQ ID Na 75 SEQ ID NO: π SEQ ID NO: 73 SEQ ID Na 79 SEQIDNa.lt
    CLONEA Con-senso
    SEQ ID Na 13 SEQ ID Na 15 SEQ ID NO: 75 SEQ Π3 Na 77 SEQ Π3 Na 73 SEQ ID Na 79 SEQ ID Να II
    CLONE A
    Con-senso
    401 . TAGTCATAAA
    TAGTCATAAA TAGTCATCAA TAGTCATCAA TAGTCATCAA TAGTAATCAA TCGTCATAAA TAGTGATAAA T-GT-AT -AA
    451
    AACGACTATA AACGACTATA AACGACTATA AACGACTATA AACAGCTACA AATGACTACA GGGGACTACA GGCGACTATA .....CTA-A
    CCACCGCGCC
    CCACCGCGCC
    CCACCGCGCC
    CCACCGCGCC
    CCACCGCGCC
    CCACCGCGCC
    CCACCGCGCA
    CCACCGCGCA
    CCACCGCGCCCTGGACAGA CCTGGACAGA CCTGGACCGA CCTGGACCGA CCTGGACCGA CCTGGACGGA CCTGGACGGA CCTGGACGGA CCTGGAC- GA
    GGTGGAGACC GGTGGAGGCC GGCGGCGATC GGCGGTGACC GGCGGCGACC GGAGGAGACC GGCGGAGACC GGTGGAGACC GG-GG-G—C
    CTTCTCAAAA CTTCTCAAAA CTTCTCGAAG CTTCTCAAAG TTTCTCGAAG CTTCTCGAAG CTTCTCAAAG CTTTTCTAAG -TT-TC-AATTGAGTGGAA
    TCGAGTGGAA
    TGGAGTGGAA
    TGGAGTGGAA
    TGGAGTGGAA
    TTGAGTGGAA
    TCGAGTGGAA
    TCGAATGGAA
    T-GA-TGGAA
    GTCGCCTCCG
    GTCGCCTCCG
    GTCGCGTCGG
    GTCGCGTCGG
    GTCGCGTCGG
    GTCGCTTCCG
    GTGGCCTCGG
    GTCGCCTCCG
    GT-GC-TC-G
    450
    CCCCTTCGTG CCCCTTCGTG CCCCTTCGTG CCCCTTCGTG TCCTTTCACC CCCCTTCGTC CCCGTTCGTT CCCATACGTC -CC-T-C--500
    GTAAATATAC
    GTAAATATAC
    GTAAATACAC
    GTAAATACAC
    GCAAGTACAC
    GCAAGTACAC
    GCAAATATAC
    GGAAATACAA
    G-AA-TA-A- • · · ·*« ··· ··· »
    I · X · · · · ···
  21. 21/116 ·«···· · « ·
    FIG 14C(cont.)
    SEQ ID NO. 13 SEQ ID NO lí SEQ ID NO 75 SEQ ID NO: 77 SEQ ID NO 73 SEQ ID NO 79 SEQ ID NO: II
    CLONE A Con-senso
    501
    GGCCAACTAC
    AGCCAACTAC
    GGCCAACTAC
    GGCCAACTAC
    GGCCAACTAC
    GGCCAACTAC
    TGCCAACTAC
    GGCCCACTAC
    -GCC-ACTAC
    SEQ ID NO II SEQ ID NO 15 SEQ ID NO 75 SEQ ID NO 77 SEQ ID NO 73 SEQ ID NO 79 SEQ1DNOI1
    CLONE A Con-senso
    551
    GTACCTTTGG
    GTACCTTTGG
    GAACATTTGG
    GAACATTTGG
    GAACATTTGG
    GCACCTTTGG
    GCACATTTGG
    GAACCTTCGG
    G-AC-TT-GG
    CTTGACTTCC
    CTTGACTTCC
    CTCGACTTCC
    CTCGACTTCC
    CTCGACTTCC
    CTCGACTTCC
    CTCGACTTCC
    ATGGACTTCC
    -T-GACTTCC
    AGGATACCCT
    AGGATACCCT
    AGGCTATCCC
    AGGCTATCCC
    AGGCTATCCC
    AGGGTTCCCG
    AGGCTTCCCA
    TGGCTTCCCA
    -GG-T--CCACCCAAACGA ACCCAAACGA ACCCGAACGA ACCCGAACGA ACCCGAACGA ACCCCAACGA ACCCCAACGA ATCCAAACAA A-CC-AAC- A
    GATATATGTC
    GATATATGTC
    GACATATGCC
    GACATATGCC
    GACATATGCC
    GACATAGCCC
    GACATAGCCC
    GACATTGATC
    GA-AT----C
    GCTTCACTGT
    GCTTCACTGT
    GCTCCACGCG
    GCTCCATGCG
    GCTTCACGCG
    GGTCAAGTGC
    GGTCAAGTGC
    CTACAGCACC
    ACGACAAAAG ACGACAAAAG ACGACAAGAG ACGACAAGAG ACGACAAGAG ACGACAAGAG ACGAGAAGAG ACCTCGTGCC AC........
    550
    TGTGATGAAG
    TGTGATGAAG
    GGCGATTCCG
    GGCGATTCCG
    GGCGATTCCG
    TGCGACGAGG
    TGTGACGAGG
    TCAGACGAGG
    ---GA----G
    600
    CTGGGACCAG CTGGGACCAG CTGGGACCAG CTGGGACCAG CTGGGACCAG CTGGGACCAG CTGGGACCAG CTTCAACCAG CT---ACCAG
    SEQ ID NO 13 SEQ ID NO 15 SEQ Π3 NO 75 SEQ ID NO 77 SEQ ID NO 73 SEQ ID NO 79 SEQ ID NO 11
    CLONE A Con-senso
    601
    TACTGGCTCT
    TACTGGCTCT
    TACTGGCTCT
    TACTGGCTCT
    CACTGGCTCT
    TACTGGCTCT
    CACTGGCTCT
    TACTGGCTGT
    -ACTGGCT-T
    GGGCGAGCAG
    GGGCGAGCAG
    GGGCCAGCCA
    GGGCCAGCCA
    GGGCCAGCAA
    GGGCGAGCAA
    GGGCGAGCGA
    GGGCGAGCAA
    GGGC-AGC-CGAAAGCTAC
    CGAAAGCTAC
    GGAGAGCTAC
    GGAGAGCTAC
    CGAAAGCTAC
    CGAGAGCTAC
    TGAGAGCTAC
    CGAGAGCTAC
    -GA-AGCTAC
    GCTGCCTACC
    GCTGCCTACC
    GCGGCCTATC
    GCGGCATATC
    GCCGCCTACC
    GCCGCCTACC
    GCCGCCTACC
    GCCGCCTACC
    GC-GC-TA-C
    650
    TCAGGAGCAT
    TCAGGAGCAT
    TCAGGAGCAT
    TCAGGAGCAT
    TCCGGAGCAT
    TCAGGAGCAT
    TAAGGAGCAT
    TCAGGAGCAT
    T--GGAGCAT
    SEQ ID NO: 13 651 AGGGGTTGAC SEQ ID NO 15 AGGGGTTGAC SEQ ID NO: 75 CGQCATCGAC SEQ ID NO: 77 CGGCATCGAT SEQ Π> NO 73 CGGCATCGAC SEQ ID NO 79 CGGCGTTGAC SEQ ID NO 11 CGGCGTTGAT CLONEA AGGGATCGAT Con-senso -GG--T- GA- SEQ ID NO 13 701 TTGTTAACGA SEQ ID NO 15 TTGTTAACGA SEQ Π3 NO: 75 TCGTCAGGGA SEQ ID NO 77 TCGTCAAGGA SEQ Π> NO 73 TCGTTAAGAA SEQ ID NO 79 TCGTCAAGGA SEQ ID NO II TCGTCAAGGA CLONEA TCGTCAAGGA Con-senso T-GT-A---A
    GCCTGGCGTT TCGACTACGT GCCTGGIGTT TCGACTACGT GCCTGGCGCT TCGACTACGT GCCTGGCGCT TCGACTACGT GCCTGGCGCT TCGACTACGT GCATGGCGCT TCGACTACGT GCCTGGCGCT TTGACTACGT GCCTGGCGCT TTGACTACGT GC-TGG-G-T T-GACTACGT
    CTGGCTCAGC TGGTGGGGAG CTGGCTCAGC TGGTGGGGAG CTGGCTGAAC TGGTGGGGAG CTGGCTGAAC TGGTGGGGAG CTGGCTGAAC CGGTGGGGCG CTGGCTGGAC TGGTGGGGAG CTGGCTCAAC TGGTGGGGCG CTGGCTGAGT CAGTGGGGCG CTGGCT......GTGGGG- G
    700
    CAAGGGCTAC GGAGCATGGG CAAGGGCTAC GGAGCCTGGG CAAGGGCTAT GCTCCCTGGG CAAGGGCTAT GCTCCCTGGG CAAGGGCTAC GCTCCCTGGG CAAGGGCTAC GGAGCGTGGG GAAGGGCTAC GGAGCGTGGG TAAGGGCTAC GGCGCGTGGG -AAGGGCTA- G---C-TGGG
    750
    GCTGGGCCGT TGGAGAGTAC GCTGGGCCGT TGGAGAGTAC GCTGGGCAGT TGGAGAGTAC GCTGGGCGGT TGGAGAGTAC GCTGGGCGGT TGGAGAGTAC GCTGGGCCGT CGGGGAGTAC GCTGGGCCGT TGGCGAGTAC GCTGGGCCGT CGGCGAGTAC GCTGGGC-GT -GG-GAGTAC • ··· ·» ··· ·
    «. · · · · ·«· k * fc « * · k ·
  22. 22/116
    FIG 14C(cont.)
    751
    SEQ ID NO: 83 TGGGACACGA ACGTTGATGC ACTCCTCAAC TGGGCATACA SEQ ID NO: 15 TGGGACACTA ACGTTGATGC ACTCCTCAAC TGGGCATACA SEQ ID NO: 75 TGGGACACCA ACGTCGACGC TGTTCTCAAC TGGGCATACT SEQ ID NO: 77 TGGGACACCA ACGTCGACGC TGTTCTCAAC TGGGCATACT SEQ ID NO:'73 TGGGACACCA ACGTCGATGC ACTCCTGAGC TGGGCCTACG SEQ ID NO. 79 TGGGACACAA ACGTTGATGC ACTGCTCAAC TGGGCCTACT SEQIDNO:ll TGGGACACCA ACGTTGATGC ACTCCTCAAC TGGGCCTACT
    CLONE A TGGGACACCA ACGTCGATGC GCTCCTCAAC TGGGCCTACA Con-senso TGGGACAC-A ACGT-GA-GC --T-CT-A-C TGGGC-TAC800
    GCAGCGGCGC
    ACAGCGGCGC
    CGAGCGGTGC
    CGAGCGGTGC
    ACAGCGGTGC
    CGAGCGATGC
    CGAGCGGCGC
    GCAGCGGCGC
    --AGCG--GC
    SEQ ID NO: 13 SEQ ID NO: 15 SEQ ID NO: 75 SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NO: 79 SEQ ID NO: II
    CLONEA Con-senso
    801
    CAAGGTCTTT
    CAAGGTCTTT
    CAAGGTCTTT
    CAAGGTCTTT
    TAAAGTCTTC
    AAAAGTCTTC
    CAAGGTCTTC
    CAAGGTCTTC
    -AA-GTCTTGACTTCCCGC
    GACTTCCCGC
    GACTTCGCCC
    GACTTCGCCC
    GACTTCCCGC
    GACTTCCCGC
    GACTTCCCGC
    GACTTCCCGC
    GACTTC-C-C
    TCTACTACAA
    TCTACTACAA
    TCTACTACAA
    TCTACTACAA
    TCTACTACAA
    TCTACTACAA
    TCTACTACAA
    TCTACTACAA
    TCTACTACAA
    GATGGACGAA
    GATGGACGAA
    GATGGACGAG
    GATGGACGAG
    GATGGACGAG
    GATGGACGCG
    GATGGATGAG
    GATGGACGAG
    GATGGA-G-850
    GCCTTCGACA
    GCCTTCGACA
    GCCTTCGATA
    GCCTTCGATA
    GCCTTCGATA
    GCCTTTGACA
    GCCTTTGACA
    GCCTTTGACA
    GCCTT-GA-A
    SEQ ID NO: 13 SEQ ID NO: 15 SEQ ID NO: 75 SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NO: 79 SEQ ID NO: II
    CLONEA Con-senso
    851
    ACACCAACAT
    ATACCAACAT
    ACAACAACAT
    ACAACAACAT
    ACAACAACAT
    ACAAGAACAT
    ACAAAAACAT
    ACAAGAACAT
    A-A--AACAT
    SEQIDNO:» SEQ ID NO: 15 SEQ ID NO: 75 SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NO: 79 SEQ ID NO: II
    CLONE A Con-senso
    901
    GTCAGCCGCG
    GTCAGCCGCG
    GTCAGCCGCG
    GTCAGCCGCG
    GTCAGCCGCG
    GTCAGCCGCG
    GTCTCCCGCG
    GTCAGCAGGG
    GTC--C-G-G
    CCCGGCATTA
    CCCCGCTTTG
    TCCCGCCCTG
    TCCCGCCCTG
    CCCCGCCCTC
    TCCCGCACTC
    TCCAGCGCTC
    TCCCGCCCTC
    -CC-GC--TATCCCTTCAA
    ACCCATTCAA
    ACCCGTTCAA
    ACCCGTTCAA
    ACCCGTTCAA
    ACCCGTTTAA
    ACCCGTTCAA
    ATCCCTTCAA
    A-CC-TT-AA
    GTGGATGCAC GTTTACGCCC GTGGACGCCC GTGGACGCCC GTGGACGCCC GTCGAGGCCC GTCTCTGCCC GTTTACGCCA GT----GC- GGCGGTAACT GGCGGTAACT GGCTGTGACG GGCTGTGACG AGCCGTGACC GGCCGTAACC GGCCGTAACC GGCCGTTACC -GC-GT-AC TCAGATACGG TCAAGAATGG TCAGATACGG TCAGATACGG TCAAGAACGG TCAAGAACGG TTCAGAACGG TCCAGAACGG T-----A-GG
    TTCGTTGCCA
    TTCGTTGCCA
    TTTGTAGCCA
    TTTGTAGCCA
    TTCGTTGCCA
    TTCGTTGCAA
    TTTGTAGCAA
    TTCGTGGCTA
    TT-GT-GC-A
    900
    CCAGACAGTG
    CGGGACAGTG
    CCAGACAGTG
    TCAGACAGTG
    AGGCACGGTC
    GGGCACAGTC
    CCAGACTGTT
    TGAAACCGTC
    ----AC-GT950
    ACCACGATAC
    ACCACGATAC
    ACCACGATAC
    ACCACGATAC
    ACCACGATAC
    ACCACGACAC
    ACCACGACAC
    ACCACGATAC
    ACCACGA-AC
    SEQ ID NO: 13 SEQ ID NO: 15 SEQ ID NO: 75 SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NO: 79 SEQ ID NO: 11
    CLONEA
    Con-senso
    951
    AGATATAATC
    AGATATAATC
    CGACATAATC
    CGACATAATC
    CAACATAATC
    GGACATAATT
    CGATATAATC
    GAACATAATC
    --A-ATAATTGGAACAAGT
    TGGAACAAGT
    TGGAACAAGT
    TGGAACAAGT
    TGGAACAAGT
    TGGAACAAGT
    TGGAACAAGT
    TGGAACAAGT
    TGGAACAAGT
    ATCCGGCTTA ATCCGGCTTA ATCCAGCCTA ATCCAGCCTA ATCCGGCCTA ACCCGGCCTA ACCTTGCTTA ACCCTGCCTA A-C- -GC-TA
    TGCATTCATC
    TGCATTCATC
    CGCGTTCATC
    CGCGTTCATC
    CGCCTTCATC
    CGCCTTCATC
    TGCTTTCATC
    TGCCTTCATC
    -GC-TTCATC
    1000
    CTTACCTATG
    CTTACCTATG
    CTCACCTACG
    CTCACCTACG
    CTCACCTATG
    CTCACCTACG
    CTCACCTACG
    CTCACCTACG
    CT-ACCTA-G
  23. 23/116 • ··· 1 · * > 4 · > · «
    FIG 14C(cont.)
    SEQ ID NO: 13 SEQ ID NO: lí SEQ ID NO: 75 SEQ ID NO: 77 SEQIDNÒ:73 SEQ ID NO: 79 SEQ ID NO: II
    CLONE A Con-senso
    1001
    AGGGACAGCC
    AGGGACAGCC
    AGGGCCAGCC
    AGGGCCAGCC
    AGGGACAGCC
    AGGGCCAGCC
    AAGGCCAGCC
    AAGGTCAGCC
    A-GG-CAGCC
    TGTTATATTC
    TGTTATATTC
    GACAATATTC
    GACAATATTC
    GGCAATATTC
    GACGATATTC
    CGTCATATTT
    CGTCATCTTC
    ----AT-TTTACCGCGACT
    TACCGCGACT
    TACCGCGACT
    TACCGCGACT
    TACCGCGACT
    TACCGCGACT
    TACCGCGACT
    TACCGCGACT
    TACCGCGACT
    ACGAGGAGTG acgaggagtg
    ACGAGGAGTG
    ACGAGGAGTG
    ACGAGGAGTG
    ACGAGGAGTG
    ACGAGGAGTG
    ACGAGGAGTG
    ACGAGGAGTG
    1050
    GCTCAACAAG
    GCTCAACAAG
    GCTCAACAAG
    GCTCAACAAG
    GCTCAACAAG
    GCTCAACAAG
    GCTCAACAAG
    GCTCAACAAG
    GCTCAACAAG
    SEQ ID NO: 13 SEQ ID NO: lí SEQIDNO:7Í SEQ ID NO: 77 SEQ ID NCh 73 SEQ ID NO: 79 SEQ ID NO: II
    CLONE A Con-senso
    1051
    GATAAGCTTA GATAAGCTTA GACAAGCTCA GATAAGCTCA GACAGGCTCA GACAGGCTCA GACAGGTTGA GACAAACTCA GA-A- —T-A
    ACAACCTCAT
    ACAACCTCAT
    AGAACCTCAT
    AGAACCTCAT
    GGAACCTCAT
    AGAACCTCAT
    ACAACCTCAT
    ACAACCTCAT
    --AACCTCAT
    CTGGATACAC CTGGATACAC CTGGATACAT CTGGATACAT CTGGATACAC CTGGATACAC ATGGATACAC ATGGATTCAC -TGGAT-CAGATCACCTTG
    GATCACCTTG
    GACAACCTCG
    GACAACCTCG
    GACCACCTCG
    GACCACCTCG
    GACCACCTCG
    GAGCACCTGG
    GA--ACCT-G
    1100
    CTGGAGGGAG
    CTGGAGGGAG
    CCGGAGGGAG
    CCGGAGGGAG
    CGGGAGGAAG
    CCGGTGGAAG
    CAGGTGGAAG
    CAGGGGGAAG
    C-GG-GG-AG
    SEQ ID NO: 13 SEQ IDNO:IÍ SEQIDNO:7í SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NG 79 SEQ ID Να II
    CLONEA Con-senso
    1101
    TACTGACATT TACTGACATT CACTGACATC CACTGACATC CACAGACATC CACCGACATA CACGAGCATA CACCAAGATC -AC-- —ATGTTTACTACG
    GTTTACTACG
    GTTTACTACG
    GTTTACTACG
    ATCTACTACG
    GTCTACTACG
    GTTTACTACG
    CTCTACTACG
    -T-TACTACG
    ACAGCGACGA
    ACAGCGACGA
    ACAACGACGA
    ACAACGACGA
    ACAGCGACGA
    ATAACGATGA
    ACAGCGACGA
    ACGACGATGA
    A---CGA-GA
    GCTTATCTTT
    GCTTATCTTT
    GCTGATATTC
    GCTGATATTC
    GCTTATCTTC
    ACTCATCTTC
    GATGATTTTC
    GCTCATCTTC
    --T-AT-TT1150
    GTGAGAAACG
    GTGAGAAACG
    GTGAGAAACG
    GTGAGAAACG
    GTGAGAAACG
    GTCAGGAACG
    GTGAGGAACG
    ATGAGGGAAG
    -T-AG--A-G
    SEQ ID Na 13 SEQ ID Na lí SEQIDNa7í SEQ ID Na 77 SEQ ID Na 73 SEQ ID Na 79 SEQ ID Να II
    CLONEA Con-senso
    1151
    GCTATGGCAC GCTATGGCAC GCTACGGAAG GCTACGGAAG GCTACGGGGA GCTACGGGGA GCTATGGAAG GCTACGGCGA GCTA-GG- —
    CAAACCAGGA CAAACCAGGA CAAGCCGGGA CAAGCCGGGA CAAGCCGGGA CAAGCCGGGG CAAGCCTGGC CAGGCCCGGG CA—CC-GGCTGATAACCT CTGATAACCT CTGATAACAT CTGATAACAT CTGATAACCT CTTATAACCT CTTATAACTT CTTATAACCT CT-ATAAC-T
    ATATCAACCT
    ATATCAACCT
    ACATCAACCT
    ACATCAACCT
    ACATCAACCT
    ACATCAACCT
    ACATCAACCT
    ACATCAACCT
    A-ATCAACCT
    1200 CGGCTCAAGC CGGCTCAAGC CGGCTCAAGC CGCCTCAAGC CGGCTCAAGC AGGCTCGAGC CGGCTCGAGC CGGTAGCGAC -G.......C
    SEQ ID Na 13 SEQ ID Na lí SEQIDNa7S SEQ ID Ntt 77 SEQ ID Na 73 SEQ ID Na 79 SEQ ID Να II
    CLONE A
    Con-senso
    1201
    AAAGTTGGAA AAAGCTGGAA AAAGCCGGAA AAAGCCGGAA AAGGCCGGAA AAGGCCGGGA AAGGTTGGAA TGGGCGGAGA -—G—G—A
    GGTGGGTCTA GGTGGGTCTA GGTGGGTTTA GGTGGGTTTA GGTGGGTCTA GGTGGGTCTA GGTGGGTTTA GATGGGTGAA G-TGGGT--A
    CGTT...CCA CGTT...CCA CGTT.. .CCG CGTT...CCG CGTT.. .CCG CGTT.. .CCG TGTG...CCG CGTTGGCTCA -GT-----CAAGTTCGCCG
    AAGTTCGCCG
    AAGTTCGCAG
    AAGTTCGCAG
    AAGTTCGCAG
    AAGTTCGCGG
    AAGTTCGCGG
    AAGTTCGCGG
    AAGTTCGC-G
    1250 GTTCATGCAT GTTCATCCAT GCTCGTGCAT GCTCGTGCAT GCTCGTGCAT GAGCGTGCAT GCGCGTGCAT GCTATACAAT G-------AT
    V
  24. 24/116
    FIG 14C(cont.)
    SEQ ID NO: (3 SEQ ID NO: 15 SEQ ID NO: 75 SEQ ID NO: 77 SEQ ID NO: 73 SEQ ID NO: 79 SEQ ID NO: 11
    CLONE A Con-senso
    SEQ ID NO: 13 SEQ ID NO: 15 SEQ ©NO: 75 SEQ ID NO: 77 SEQ©NO:73 SEQ ID NO: 79 SEQ ID Να II
    CLONEA Con-senso
    1251
    CCAOGAGTAC CCACGAGTAC ACACGAGTAC ACACGAGTAC ACACGAGTAC CCACGAGTAC CCACGAGTAT CCACGAATAC -CACGA- TA1301
    CCAGCGGCTG CCAGCGGCTG CAAGCGGCTG CAAGCGGCTG CAAGCGGTCG CAAGCGGGTG CAAGCGGCTG ACGACGGCTG — --CGG--G
    ACCGGCAACC ACCGGCAGCC ACCGGCAACC ACCGGCAATC ACCGGCAACC ACCGGCAACC ACTGGTAACC ACCGGAAACC AC-GG-A- -C
    GGTCTATCTT
    GGTCTACCTT
    GGTTTACCTC
    GGTCTACCTC
    GGTCTACCTT·
    GGTGTACCTC
    GGTCTATTTC
    GGTCAAGCTT
    GGT--A--TTCGGCGGTTG
    TCGGCGGTTG
    TCGGCGGCTG
    TCGGCGGCTG
    TCGGCGGCTG
    TCGGCGGCTG
    TCGGAGGCTG
    TCGGCGGCTG
    TCGG-GG-TG
    GAGGCCCCAG GAGGCCCCGG GAGGCTCCTG GAGGCTCCTG GAGGCCCCCG GAGGCCCCTG GAAGCTCCAG ACCGCTCCGC ---GC-CC- GATAGACAAG
    GATAGACAAG
    GGTGGACAAG
    GGTGGACAAG
    GATTGACAAG
    GGTGGACAAG
    GGTAGACAAG
    GGTCGACAGG
    G-T-GACA-G
    CCCACGACCC
    CCCACGACCC
    CCCACGACCC
    CCCACGACCC
    CCCACGACCC
    CCCACGACCC
    CTTACGACCC
    CACACGATCC
    C--ACGA-CC
    1300 TACGTCTCCT TACGTCTCCT TGGGTGGACT TGGGTGGACT TGGGTTGACT TGGGTGGACT TACGTCTACT TACGTCCAGT T—GT- T
    1350
    GGCGAACGGC
    GGCCAATGGC
    GGCCAACGGC
    GGCCAACGGC
    GGCCAACGGC
    GGCCAACGGC
    TGCCAACGGG
    GGCAAACGGC
    -GC-AA-GGS£Q©Nai3 SEQ ID NO: 15 SEQ ID Na 75 SEQ©NO:77 SEQ ID NO: 73 SEQ ©NO: 7» SEQ ©Na II
    CLONE A Con-senso
    1351 1393 TACTACGGCT ACTCCGTATG GAGCTACTGC GGGGTTGGGT GACAGTATGGCT ACTCCGTCTG GAGCTATTGC GGGGTTGGGT GACAGTACGGCT ACTCCGTTTG GAGCTATTGC GGTGTTGGGT GACAGTACGGCT ACTCCGTCTG GAGCTACTGC GGTGTTGGGT GACAGTACGGCT ACTCCGTATG GAGCTACTGC GGTGTTGGGT GATATTACGGCT ACTCCGTCTG GAGCTACTGC GGGGTGGGCT GACAGTATGGCT ACTCCGTGTG GAGCTATTGC GGTGTTGGGT GATATTACGGCT ACTCGGTCTG GAGCTACGCC GGAGTTGGAT GA- A-TA-G GCT ACTC-GT-TG GAGCTA---C GG-GT-GG-T GA·«· *·· ···
  25. 25/116
    FIG 15
    CRI
    100
    5» rGR3 1JGR2 1GR5 <(>R4 'GR5
    94 —T. profundo
    Í-T. barosjiíi
    T.eeto 'P/sp.KOJM T. peptoBophih» T.*sp. SM-2
    T. «tettcri
    ι. liytinwnurniin.s % de diferença de seqüência
    CS1 T.reUr 5.2% CR! P. filMVIU 73% T.cdcr P. AirLoais 4.9%
    -T. raesicalis T fumicolans
    -Γ. liionilis T. barophilus iP.hcrikoshii.«q lp.shokiii.setj r-P. abttsi I—P. furicsus
    M. fervidas
    -M. thiTRtnlith.
    M. igncwt A. fiilgübu
    Valores tirados por 100 replicados
    Suramil fc Xaran. DaçvSci Kctcjnà Pu II. ic jwvix '«· ·»· »·«
  26. 26/116
    FIG 16
    SEQIDNO.: 1 atggcaaagtattccgagctcgaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggáacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg gtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgotcaactgggcctactcgagcgatgcaaaagtcttcgactt cccgctctactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagcc gcgacccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgag ggccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccgg aggaagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaa cctcgcctcaagcaaagccggàaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggt ggacaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagc tactgcggtgttgggtga
    SEQIDNO.: 2
    Met A!- Lys Tyr Ssr Glu Leu Glu Glu Gly Gly Leu Ile Mcí Gin Ale rha Tyr Trp v ai πυ mci
    Gly Gly De Trp Trp Asp Thr He Ala Gin Lys De Pro Asp Trp Ala Ser Ala Gly De Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai De Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser De Gly De Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe De Leu Thr Tyr Glu Gly Gin Pro Thr De Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu De Trp De His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr De Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys De His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQIDNO.: 3 atggccaagtacctggagctcgaagagggcgggctcatoatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgaçtgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctacggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaacccct tcgtcaatgactacacctggacggacttctcgaaggtcgcttccggcaagtacacggccaattacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggclgaactggt gggsaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgac ccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggcc
  27. 27/116
    Fig 16(cont.) agccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggagga agcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctc gcctcaagcgaagccggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtgg acaagtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagctatt gcggtgttgggtga
    SEQ ID NO.: 4
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pto Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser He Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin TTir Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Glu Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asn Prn AJa Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 5 atggccaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcaagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgac ccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtaccttgcttatgctttcatcctcacctacgaaggccag cccgtcatattctaccgcgaccacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaag caccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggc tcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagacaa gtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactgcggg gtgggctga
    SEQ IDN0.:6
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly
  28. 28/116
    Fig 16(cont.)
    Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Tip Vai Vai Lys Asp Tip Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp His Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Tip Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 9 atggccaagtactccgagctggaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatg cgggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggacgaggccttcgataacaacaacattcccgccctggtggacgcr.rtçagntacggtc^gsjsgtggícsgvtgug acccgncaaggctgtgacgtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggc cagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggagg aagcactgacatcgtttactacgacaacgacgagctgatattcgcgagaaacggctacggaagcaagccgggactgataacatacatcaacct cgcctcaagcaaagccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtgg acaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctac tgcggtgttgggtga
    SEQ ID NO.: 10
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Tip Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Ala Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu ·«···· « · · · ·
    Fig 16(cont.)
  29. 29/116 ··· ···
    Tyr Thr Gly Asn Leu Gly Gly Tip Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Tip Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 11 atggccaagtacctggagctcgaggagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggtcagacagtggtcagccgcg acccgttcaaggctgtgacgtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggc cagccgacaatattctaccgcgactacgaggagtggctcaacaaggatacgctcaagaacctcatctggatacatgacaacctcgccggagg aagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacctc ggctcgagcaaggttggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtgg acaagtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagctac tgcggtgttggctga
    SEQ IDNO.: 12
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Are Phe Gly Ser Lys Gin Gin Leu Vai Asn Met lie Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp De Vai íle Asn His Arg Ala Gly Gly Asp Leu Glu Tip Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg, Asp Tyr Glu Glu Trp Leu Asn Lys Asp Thr Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr lie Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQID NO.: 13 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtatgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaac atgataaacacggcacatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgtt cgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagtg ctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctac gccgcctacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg gtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgactt
  30. 30/116
    Fig 16(cont.) cccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggàacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggag gaagcactgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacct aggctcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtag acaagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactg cggígttggctga
    SEQIDNO.: 14
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly He Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Tip Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Tip Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Ajg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn T.en Gly Ser Ser Lys Ala Gly Aig Trp 'vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQIDNO.: 15 atggccaagtactccgagctggaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatg cgggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg gtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgactt cccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatttggaacaagtacccggcctacgccttcatcctcacctacgaggg ccagccgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatctggatacacgaccaccttgccggtg gaagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacc tcgcctcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtag acaagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgc gglgttgggtga
    SEQIDNO.: 16
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Tip Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp
  31. 31/116
    Fig 16 (cont.)
    Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Tip Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu GIn Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Ττρ Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr fle Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQID NO.: 17 atggccaagtactccgagctggaagggggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccaggagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagcta cgccgcctacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactegctggaef ggtgeggaggctgggrpgícgggg2gísctgggaçaeaaacgrtgargcactgctcaactgggcctactcgagcgatgcaaaagtcttcgac ttcccgctctactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagc cgcgacccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacga gggccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccg gaggaagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaa cctcggctcgagcaaggttggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggt ggacaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagc tactgcggtgttgggtga
    SEQID NO.: 18
    Met Ala Lys Tyr Ser Glu Leu Glu Gly Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Glu Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai • · · ··· ··· ··· · (J »····· · · ··· *-**r >
    » · ί · · · · · · · A-r7-’
    Fig I6(cont.)
  32. 32/116
    Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys He His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ IDNO.: 19 atggccaagtacctggagctcgaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgaccttggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttc gttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgcg ggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgc ggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtgg gggggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgcc ctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgaccc gttcaaggccgtaacctttgtagcaaaccacgacaccgatataatttggaacaagtacccggcctacgccttcatcctcacctacgagggccag ccgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaaçctcatctggatacacgaccacctcgccggtggaag cactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctcgc ctcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagcatactggtaacctcggaggctgggtagaca agtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactgcgg tgttggctga
    SEQ ID NO.: 20
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Tle Trp He rro rro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys He His Glu His Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 21 atggccaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcctcccgggagcaagggtatgagcggcggctattcgatgg gctacgacccctacgatgatttggacctgggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaac atgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgtt cgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac
  33. 33/116
    Fig 16 (cont.) gcggtatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg gtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgactt cccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatttggaacaagtacccggcctacgccttcatcctcacctacgaggg ccagccgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatctggatacacgactacctcgccggtg gaagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacc tcgcctcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtag acaagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgc * ggtgttggctga
    SEQ ID NO.: 22
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Gly Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Asp Leu Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Vai Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tvr Arg Asp Tvr Glu Gly Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp Tyr Leu Àla Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 23 atggccaagtactccgagctggaagagggcggcgttatagtgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatg cgggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg gtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgactt cccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggag gaagcatgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacctc ggctcgagcaaggttggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtgg acaagtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagctatt gcggtgttggctga
    SEQ ID NO.: 24 ι ι ’ :
  34. 34/116
    Fig 16(cont.)
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Vai Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Tip Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Tip Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Tip Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe VaLAla Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe He Leu Thr Tyr Glu Gly Gin Pro Thr He Phe. Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Met Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 25 atggccaagtacctggagctcgaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtçgaaccccttcgt gaacgsctatacctggãúugaUicicaaaggrcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcgg catatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtgggg aggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctc tactacaagatggacgaggccttcgataacaacaacattcccgccctggtgggcgccctcagatacggtcagacagtggtcagccgcgaccc gttcaaggctgtgacgtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccagc cgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaagc accgacatagtctactacgataacgatgaactcatcttcgtcaggcacggctacggggacaagccggggcttataacctacatcaacctaggct cgagcaaggccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaa gtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctattgcg gtgttgggtga
    SEQ ID NO.: 26
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala He Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly TyT Pro Asp Ile Cys His Asp Lys Ser Tip Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Gly Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp tt »
    Fig 16(cont.)
    Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile He Tip Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg His Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 27 atggcaaagtattccgagctcgaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccatc aggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcctcccgcgagcaagggtatgagcggcggctattcgatggg ctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacatg ataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttcgt tggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcgg catatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtgggg aggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctc tactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagccgcgacc cgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccag ccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaag cactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctcgc gtcaagcaaagccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggaca agtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctactgc ggtgttgggtga
    SEQ ID NO.: 28
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu He Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin TyT Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 29 atggccaagtacctggagctcgaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacggt agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa „ ·
    36/116
    Fig 16(cont.) catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggtctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgac ccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtaccttgcttatgccttcatcctcacctacgaaggccag cccgtcatattctaccgcgactacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcagggggaag caccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggc tcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagacaa gtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactgcggt gttgggtga
    SEQ IDNO.: 30
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Vai Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai He Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Vai Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Lc? Asn Trp A.la Tyr Ser Ser Gly Ah Lys Vs! Phs Asp Phe Ala Lcü Tyr Tyr Ly& Mci Asp Giu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ IDNO.: 31 atggcaaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaggataccggagtggtacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatg cgggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactgg tggggcggctgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgacttc ccgctctactacaagatggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggtcagacagtggtcagccgc gacccgttcaaggctgtgacgtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctggccggag gaagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaccggctatggaagcaagcctggccttataacttacatcaacct cggctcgagcaaggttggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtaga caagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgcg gtgttggctga
    37/116
    Fig 16 (cont.) ······ · · ·
    SEQ IDNO.:32
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Mel Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Arg lie Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Tip Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Thr Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQIDNO.: 33 atggccaagtactccgagctggaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacacggccoatgcçtnpggcoí33aggícatagcggâcâiügíi;aiaaaccaccgcgcaggcggagacctcgagtggaacccgttc gttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgcg ggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgc ggcatatctcaggagcatcggcatcgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactggtg gggcggctgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgactttcc gctctactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagccgcg acccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaccaagtaccttgcttatgctttcatcctcacctacgaaggcca gcccgtcatattctaccgcgactacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaag caccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggc tcgagcaaggccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaa gtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctactgcg gtgttggctga
    SEQIDNO.: 34
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Tip Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala
    Fig 16 (cont.)
  35. 38/116 • ··· ··· ·· · » • · · · · · · • · · · · · «
    Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Thr Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Tip Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 35 atggccaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctacggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaacccct tcgtcaatgactacacctggacggacttctcgaaggtcgcttccggcaagtacacggccaactacctcgacttccaccccaacgaggtcaagtg ctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctac gccgcctacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactggÊacaccaacgtcSacSctgttctcaactggêcatactcSa6cS6t6ccaaÊStctttÊacttcS ccctctactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagccgc gacccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacgtcgccggag gaagcaccgacatagtctactacgataacgatgaactcatcttcgtcaggaaeggctacggggacaagccggggcttataacctacatcaacct aggctcgagcaaggccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtgg acaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctac tgcggtgttgggtga
    SEQ ID NO.: 36
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Tip Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu lie Trp Ile His Asp Asn Vai Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tip Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 71 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat
    Fig 16(cont.)
  36. 39/116 acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtagcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatg cgggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgac ccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggcc agccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatetggatacatgacaacctcgccggagga agcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctc gcctcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcalccacgagtatactggtaacctcggaggctgggtaga caagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactgc ggggtgggctga
    SEQ ID NO.: 72
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Tip Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lyç Va! Phe Asp The Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr He Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Tip Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr He Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 49 gtggtttatgacgatgtccgctatgacctttatgccgtaggcatgggccgtgtttatcatgttcacgagctcctgcttggagccaaagcgcgtctct accgttcccttctggtcgtactcaccgaggtcaaagaagtcgtaggggtcgtagcccatcgaataggcgccgcccatgcccttgctcgccggg ggaatccatatcgccgaaatcccggcgcttgcccagtcgggtatcttctgggctatcgtgtcccaccagattcctcccatggggacgtcccagta gaaggcctgcattatgagcccgccctcttcgagcccggaatactttgccataagttacctcctactagtagattaaaattctgtttcctgtgtgaaatt gtt
    SEQIDNO.: 50
    Vai Vai Tyr Asp Asp Vai Arg Tyr Asp Leu Tyr Ala Vai Gly Met Gly Arg Vai Tyr His Vai His Glu Leu Leu Leu Gly Ala Lys Ala Arg Leu Tyr Arg Ser Leu Leu Vai Vai Leu Thr Glu Vai Lys Glu Vai Vai Gly Vai Vai Ala His Arg Ile Gly Ala Ala His Ala Leu Ala Arg Arg Gly Asn Pro Tyr Arg Arg Asn Pro Gly Ala Cys Pro Vai Gly Tyr Leu Leu Gly Tyr Arg Vai Pro Pro Asp Ser Ser His Gly Asp Vai Pro Vai Glu Gly Leu His Tyr Glu Pro Ala Leu Phe Glu Pro Gly Ile Leu Cys His Lys Leu Pro Pro Thr Ser Arg Leu Lys Phe Cys Phe Leu Cys Glu Ile Vai
  37. 40/116
    Fig l6(cont.)
    SEQIDNO.: 51 ,
    ATGGCCAAGTACCTGGAGCTCGAAGAGGGCGGGGTCATAATGCAGGCGTTCTACTGGG acgtgccttcaggaggaatatggtgggacacaatacggcagaagataccggagtggt
    ACGATGCCGGAATCTCCGCAATATGGATTCCCCCGGCGAGCAAGGGCATGGGCGGCGC
    CTATTCGATGGGCTACGACCCCTACGACTTCTTTGACCTCGGTGAGTACGACCAGAAG
    GGAACGGTAGAGACGCGCTTTGGCTCCAAGCAGGAGCTCGTGAACATGATAAACACC
    GCCCACGCCTATGGCATGAAGGTAATAGCCGATATAGTCATCAACCACCGCGCCGGCG
    GTGACCTGGAGTGGAACCCCTTCGTGAACGACTATACCTGGACCGACTTCTCAAAGGT
    CGCGTCGGGTAAATACACGGCCAACTACCTCGACTTCCACCCCAACGAGGTCAAGTGC
    TGTGACGAGGGCACATTTGGAGGCTTCCCAGACATAGCCCACGAGAAGAGCTGGGAC
    CAGCACTGGCTCTGGGCGAGCGATGAGAGCTACGCCGCCTACCTAAGGAGCATCGGCG
    TTGATGCCTGGCGCTTTGACTACGTGAAGGGCTACGGAGCGTGGGTCGTCAAGGACTG
    GCTCAACTGGTGGGGCGGCTGGGCCGTTGGCGAGTACTGGGACACCAACGTTGATGCA
    CTCCTCAACTGGGCCTACTCGAGCGGCGCCAAGGTCTTCGACTTCCCGCTCTACTACAA
    GATGGATGAGGCCTTTGACAACAAAAACATTCCAGCGCTCGTCTCTGCCCTTCAGAAC
    GGCCAGACTGTTGTCTCCCGCGACCCGTTCAAGGCCGTAACCTTTGTAGCAAACCACG
    ACACCGATATAATCTGGAACAAGTATCCAGCCTACGCGTTCATCCTCACCTACGAGGG
    CCAGCCGACAATATTC.TACCGCGACTACGAGGAGTGGCTCAACAAGGATAAGCTCAAG
    AACCTCATCTGGATACATGACAACCTCGCCGGAGGAAGCACTGACATCGTTTACTACG
    ACAACGACGAGCTGATATTCGTGAGAAACGGCTACGGAAGCAAGCCGGGACTGATAA
    CATACATCAACCTCGCCTCAAGCAAAGCCGGAAGGTGGGTTTACGTTCCGAAGTTCGC
    AGGCTCGTGCATACACGAGTACACCGGCAATCTCGGCGGCTGGGTGGACAAGTGGGTG
    GACTCAAGCGGCTGGGTCTACCTCGAGGCTCCTGCCCACGACCCGGCCAACGGCCAGT
    ACGGCTACTCCGTCTGGAGCTATTGCGGTGTTGGCTGA
    SFn τη wn : 52
    MAfCYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMGGAYS
    MGYDPYDFFDLGEYDQKGTVETRFGSKQELVNMINTAHAYGMKVIADIVINHRAGGDLE
    WNPFVNDYTWTDFSKVASGKYTANYLDFHPNEVKCCDEGTFGGFPDIAHEKSWDQHWL
    WASDESYAAYLRSIGVDAWRFDYVKGYGAWWKDWLNWWGGWAVGEYWDTNVDAL
    LNWAYSSGAKVFDFPLYYKMDEAFDNKNIPALVSALQNGQTWSRDPFKAVTFVANHDT
    DIIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTDIVYYDNDELI
    FVRNGYGSKPGLITYINLASSKAGRWVYVPKFAGSCIHEYTGNLGGWVDKWVDSSGWVY
    LEAPAHDPANGQYGYSVWSYCGVG
    SEQ ID NO.: 37 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgctttgactacgtgaagggctacggagcgcgggtcgtcaaggaclggctcaactg gtggggcggctgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgactt cccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattctatcgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggagg aagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacct cgcctcaagcaaagccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtgg ι : · t:
    Fig 16(cont.)
  38. 41/116 acaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctac tgcggggtggggtga
    SEQ ID NO.: 38
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai He Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Tip Trp Asp Thr Ile Arg Gin Lys He Pro Glu Trp Tyr Asp Ala Gly He Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Tip Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Tip Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Arg Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Tip Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tip Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 39 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatategtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcccgcgagcaggggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaaccccttcgt gaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcgg catatctcaggagcatcggtatcgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactggtggg gcggctgggccgttggcgagtactgggaccccaacgttgatgccctcctcccctgggcctactcgagcggcgccaaggtcttcgacttcccgc tctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgacccg ttcaaggccgtaacctttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccagcc gacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaagca ccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggctc gagcaaggccggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtggacaa gtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagctactgcg gggtgggctga
    SEQ ID NO.: 40
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Tip Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Arg Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala
    Fig 16 (cont.)
  39. 42/116
    Tyr Leu Arg Ser Ile Gly He Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Pro Asn Vai Asp Ala Leu Leu Pro Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Tip Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQIDNO.: 41 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttòtactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttc gttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgcg ggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgc ggcatatctcaggagcatcggcatcgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactggtg gggcggctgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgacttccc gctctactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagccgcg acccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggc cagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggagg aagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacctc ggctcgagcaaggnggaaggigggiíiaigígccgsagttcg=gggcgcgt2catccacgagtatactggtaacctcggaggctgggtagac aagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactgcg gtgttgggtga
    SEQ ID NO.: 42
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Tip Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    Fig 16 (cont.)
  40. 43/116
    SEQ ID NO.: 43 atggccaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagcta cgccgcctacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggact ggtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgac ttcccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgc gacccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagg gccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgtcggag gaagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacct cggctcgagcaaggttggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtgg acaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctac tgcggtgttggctga
    SEQ ID NO.: 44
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lyc Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Vai Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQID NO.: 45 atggccaagtactccgacctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagcta cgccgcctacctaaggagcatcggcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactg gtggggcggetgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgáctt cccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggag <
    » ;
  41. 44/116
    Fig 16 (cont.) gaagcaccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacct aggctcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtag acaagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgc ggtgttgggtga
    SEQ ID NO.: 46
    Met Ala Lys Tyr Ser Asp Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp TyT Vai Lys Gly Tyr Gly Ala Tip Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 47 atggccaagtacaccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccaccccaacgaggtcaagtg ctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctac gccgcctacctaaggagcatcggcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactgg tggggcggttgggcegttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgacttc ccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcga cccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtaccttgcttatgctttcatcctcacctacgaaggcca gcccgtcatattctaccgcgactacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaag cacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacctcggct cgagcaaggttggaaggtgggtttacgttccgaagttcgcaggcccgtgcatacacgagtacaccggcaatctcggcggctgggtggacaag tgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctactgcgg tgttgggtag
    SEQ ID NO.: 48
    Met Ala Lys Tyr Thr Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys
    Fig 16 (cont.)
  42. 45/116
    Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn ValAsp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn He Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp He His Asp His Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Pro Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ IDNO.: 53
    ATGGCCAAGTACTCCGAGCTGGAAGAGGGCGGCGTTATAATGCAGGCCTTCTACTGGG
    ACGTCCCAGGTGGAGGAATCTGGTGGGACACCATCAGGAGCAAGATACCGGAGTGGT
    ACGAGGCGGGAATATCCGCCATTTGGATTCCCCCGGCGAGCAAGGGCATGGGCGGCG
    CCTATTCGATGGGCTACGACCCCTACGACTTCTTTGACCTCGGTGAGTACGACCAGAA
    GGGAACGGTAGAGACGCGCTTTGGCTCCAAGCAGGAGCTCGTGAACATGATAAACAC
    GGCCCATGCCTACGGCATAAAGGTCATAGCGGACATCGTCATAAACCACCGCACAGGC
    GGAGACCTCGAGTGGAACCCGTTCGTTGGGGACTACACCTGGACGGACTTCTCAAAGG
    TGGCCTCGGGCAAATATACTGCCAACTACCTCGACTTCCACCCCAACGAGGTCAAGTG
    CTGTGACGAGGGCACATTTGGAGGCTTCCCAGACATAGCCCACGAGAAGAGCTGGGA
    CCAGCACTGGCTCTGGGCGAGCGATGAGAGCTACGCCGCCTACCTAAGGAGCATCGGC
    G Γ1 GaTGCCTGGCGCTTCGACTACGTCAAGGGCTACGGAGCGTGGGTCGTCAAGGACT
    GGCTGGACTGGTGGGGAGGCTGGGCCGTCGGGGAGTACTGGGACACAAACGTTGAlG cactgctcaactgggcctactcgagcgatgcaaaagtcttcgacttcccgctctactac
    AAGATGGATGAGGCCTTTGACAACAAAAACATTCCAGCGCTCGTCTCTGCCCTTCAGA
    ACGGCCAGACTGTTGTCTCCCGCGACCCGTTCAAGGCCGTAACCTTTGTAGCAAACCA
    CGACACCGATATAATCTGGAACAAGTATCCAGCCTACGCGTTCATCCTCACCTACGAG
    GGCCAGCCGACAATATTCTACCGCGACTACGAGGAGTGGCTCAACAAGGATAAGCTCA
    AGAACCTCATCTGGATACATGACAACCTCGCCGGAGGAAGCACTGACATCGTTTACTA
    CGACAACGACGAGCTGATATTCGTGAGAAACGGCTACGGAAGCAAGCCGGGACTGAT
    AACATACATCAACCTCGCCTCAAGCAAAGCCGGAAGGTGGGTCTACGTTCCGAAGTTC
    GCGGGAGCGTGCATCCACGAGTACACCGGCAACCTCGGCGGCTGGGTGGACAAGTGG
    GTGGACTCAAGCGGGTGGGTGTACCTCGAGGCCCCTGCCCACGACCCGGCCAACGGCT
    ATTACGGCTACTCCGTCTGGAGCTACTGCGGTGTTGGCTGA
    SEQ ID NO.: 54
    MAKYSELEEGGVIMQAFYWDVPGGGrWWDTIRSKIPEWYEAGISAIWIPPASKGMGGAYS
    MGYDPYDFFDLGEYDQKGTVETRFGSKQELVNMINTAHAYGIKVIADIVINHRTGGDLEW
    NPFVGDYTWTDFSKVASGKYTANYLDFHPNEVKCCDEGTFGGFPDIAHEKSWDQHWLW
    ASDESYAAYLRSIGVDAWRFDYVKGYGAWWKDWLDWWGGWAVGEYWDTNVDALL
    NWAYSSDAKVFDFPLYYKMDEAFDNKNIPALVSALQNGQTVVSRDPFKAVTFVANHDTD
    IIWNKYPAYAFILTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTDIVYYDNDELIF
    VRNGYGSKPGLITYINLASSKAGRWVYVPKFAGACIHEYTGNLGGWVDKWVDSSGWVY
    LEAPAHDPANGYYGYSVWSYCGVG
    SEQ ID NO.: 55 * ϊ *
  43. 46/116
    Fig 16 (cont.)
    ATGGCCAAGTACCTGGAGCTCGAGGAGGGCGGGGTCATAATGCAGGCGTTCTACTGGG acgtgccttcaggaggaatatggtgggacacaatacggcagaagataccggagtggt
    ACGATGCCGGAATCTCCGCAATATGGATTCCCCCGGCGAGCAAGGGCATGGGCGGCGC
    CTATTCGATGGGCTACGACCCCTACGACTTCTTTGACCTCGGTGAGTACGACCAGAAG
    GGAACGGTAGAGACGCGCTTTGGCTCCAAGCAGGAGCTCGTGAACATGATAAACACC
    GCCCACGCCTATGGCATGAAGGTAATAGCCGATATAGTCATCAACCACCGCGCCGGCG
    GTGACCTGGAGTGGAACCCCTTCGTGAACGACTATACCTGGACCGACTTCTCAAAGGT
    CGCGTCGGGTAAATACACGGCCAACTACCTCGACTTCCACCCGAACGAGCTCCATGCG
    GGCGATTCCGGAACATTTGGAGGCTATCCCGACATATGCCACGACAAGAGCTGGGACC
    AGTACTGGCTCTGGGCCAGCCAGGAGAGCTACGCGGCATATCTCAGGAGCATCGGCAT
    CGATGCCTGGCGCTTTGACTACGTGAAGGGCTACGGAGCGTGGGTCGTCAAGGACTGG
    CTCAACTGGTGGGGCGGCTGGGCCGTTGGCGAGTACTGGGACACCAACGTTGATGCAC
    TCCTCAACTGGGCCTACTCGAGCGGCGCCAAGGTCTTCGACTTCCCGCTCTACTACAAG
    ATGGATGAGGCCTTTGACAACAAAAACATTCCAGCGCTCGTCTCTGCCCTTCAGAACG
    GCCAGACTGTTGTCTCCCGCGACCCGTTCAAGGCCGTAACCTTTGTAGCAAACCACGA
    CACCGATATAATCTGGAACAAGTACCTTGCTTATGCTTTCATCCTCACCTACGAAGGCC
    AGCCCGTCATATTCTACCGCGACTACGAGGAGTGGCTCAACAAGGACAGGTTGAACAA
    CCTCATATGGATACACGACCACCTCGCAGGTGGAAGCACGAGCATAGTTTACTACGAC
    AGCGACGAGATGATCTTCGTGAGGAACGGCTATGGAAGCAAGCCTGGCCTTATAACTT φ ACATCAACCTCGGCTCGAGCAAGGTTGGAAGGTGGGTTTACGTTCCGAAGTTCGCAGG
    CTCGTGCATACACGAGTACACCGGCAATCTCGGCGGCTGGGTGGACAAGTGGGTGGAC TCAAGCGGCTGGGTCTACCTCGAGGCTCCTGCGCACGACCCGGCCAACGGCCAGTACG GCTACTCCGTCTGGAGCTATTGCGGTGTTGGCTGA
    SEQ ID NO.: 56
    JVLvKYLELEEGGVIMQ.WVDVPSG^TWWDTIROKIPEWYDAGISAIWIPPASKGMGGAYS
    - - MGYDPYDFFDLGEYDQKGTVETRFGSKQELVNMINTAHAYGMKVIADIVINHKAGÜDLE
    WNPFVNDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDICHDKSWDQYWL WASQESYAAYLRS1GIDAWRFDYVKGYGAWVVKDWLNWWGGWAVGEYWDTNVDALL NWAYSSGAKVFDFPLYYKMDEAFDNKN1PALVSALQNGQTVVSRDPFKAVTFVANHDTD IIWNKYLAYAFILTYEGQPVIFYRDYEEWLNKDRLNNLIWIHDHLAGGSTSIVYYDSDEMIF VRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGSCIHEYTGNLGGWVDKWVDSSGWVYL EAPAHDPANGQYGYSVWSYCGVG
    SEQ ID NO.: 57
    ATGGCCAAGTACCTGGAGCTCGAAGAGAGCGGGGTCATAATGCAGGCGTTCTACTGGG
    ACGTGCCTTCAGGAGGAATATGGTGGGACACAATACGGCAGAAGATACCGGAGTGGT
    ACGATGCCGGAATCTCCGCAATATGGATTCCTCCCGCGAGCAAGGGTATGAGCGGCGG
    WJ CTATTCGATGGGCTACGACCCCTACGATTATTTTGACCTCGGTGAGTACTACCAGAAGG
    GAACGGTGGAAACGAGGTTCGGCTCAAAGCAGGAGCTCATAAACATGATAAACACCG CCCACGCCTACGGCATCAAGGTCATCGCAGACATAGTAATCAACCACCGCGCCGGAGG AGACCTTGAGTGGAACCCCTTCGTCAATGACTACACCTGGACGGACTTCTCGAAGGTC GCTTCCGGCAAGTACACGGCCAACTACCTCGACTTCCACCCCAACGAGGTCAAGTGCT GTGACGAGGGCACATTTGGAGGCTTCCCAGACATAGCCCACGAGAAGAGCTGGGACC AGCACTGGCTCTGGGCGAGCGATGAGAGCTACGCCGCCTACCTAAGGAGCATCGGCGT TGATGCCTGGCGCTTTGACTACGTGAAGGGCTACGGAGCGTGGGTCGTCAAGGACTGG CTCAACTGGTGGGGTGGCTGGGCCGTCGGGGAGTACTGGGACACAAACGTTGATGCAC TGCTCAACTGGGCCTACTCGAGCGATGCAAAAGTCTTCGACTTCCCGCTCTACTACAAG ATGGACGAGGCCTTCGATAACAACAACATTCCCGCCCTGGTGGACGCCCTCAGATACG GTCAGACAGTGGTCAGCCGCGACCCGTTCAAGGCTGTGACGTTTGTAGCCAACCACGA
  44. 47/116
    Fig 16 (cont.) taccgatataatctggaacaagtaccttgcttatgctttcatcctcacctacgaaggcc
    AGCCCGTCATATTCTACCGCGACTACGAGGAGTGGCTCAACAAGGACAGGTTGAACAA
    CCTCATATGGATACACGACCACCTCGCAGGTGGAAGCACTGACATCGTTTACTACGAC
    AACGACGAGCTGATATTCGTGAGAAACGGCTACGGAAGCAAGCCGGGACTGATAACA
    TACATCAACCTCGCCTCAAGCAAAGCCGGAAGGTGGGTCTACGTTCCGAAGTTCGCGG
    GAGCGTGCATCCACGAGTACACCGGCAACCTCGGCGGCTGGGTGGACAAGTGGGTGG
    ACTCAAGCGGGTGGGTGTACCTCGAGGCCCCTGCCCACGACCCGGCCAACGGCTATTA
    CGGCTACTCCGTCTGGAGCTATTGCGGTGTTGGCTGA
    SEQ ID NO.: 58
    MAKYLELEESGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMSGGYS
    MGYDPYDYFDLGEYYQKGTVETRFGSKQELINMINTAHAYGIKVIADIVINHRAGGDLEW
    NPFVNDYTWTDFSKVASGKYTANYLDFHPNEVKCCDEGTFGGFPDLAHEKSWDQHWLW
    ASDESYAAYLRSIGVDAWRFDYVKGYGAWWKDWLNWWGGWAVGEYWDTNVDALL
    NWAYSSDAKVFDFPLYYKMDEAFDNNNIPALVDALRYGQTWSRDPFKAVTFVANHDTD nWNKYLAYAFILTYEGQPVIFYRDYEEWLNKDRLNNLIWIHDHLAGGSTDIVYYDNDELIF
    VRNGYGSKPGLITYINLASSKAGRWVYVPKFAGACIHEYTGNLGGWVDKWVDSSGWVY
    LEAPAHDPANGYYGYSVWSYCGVG
    SEQ ID NO.: 59 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacaccgcccacgcctacggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaaccccttcg tcaateactacacctggacggacttctcgaaggtcgcttccggcaagtacacggccaactacctcgacttccacccgaacgagctccatgcgg gcgattccggaacatttggaggctatcccgauaíaígccacgac2?g»gcteggaccagtactggctctgggccagccaggagagctacgcg gcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggaciggcígaactggtggg gaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccct ctactacaagatggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggtcagacagtggtcagccgcgacc cgttcaaggctgtgacgtttgtagccaaccacgataccgatataatttggaacaagtacccggcctacgccttcatcctcacctacgagggccag ccgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatctggatacacgaccacctcgccggtggaag cactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctcgc gtcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagaca agtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgcggt gttgggtga
    SEQ ID NO.: 60
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr ti • · · · · ··· ··· ··· · • · £·»··· · · ···
    Fig 16 (cont.)
  45. 48/116 ······ · · ·
    Ala Phe Ile Leu Thi Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Tip Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 61 atggccaagtactccgagctgaaaaagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgaggcgggaatatccgccatttggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat galaaacaccgcccacgcctacggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaaccccttcg tcaatgactacacctggacggacttctcgaaggtcgcttccggcaagtacacggccaactacctcaacttccacccgaacgagctccatgcgg gcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcg gcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactggtg gggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgacttccc gctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgacc cgttcaaggccgtaacctttgtagcaaaccatgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccag ccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaag caccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggc tcgagcaaggccggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtggaca agtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagctactgc ggggtgggctga
    SEQ IDNO.: 62
    Met Ala Lys Tyr Scí Glu Leu Lys Ly? Clv Glv Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Glu Ala Giy lie Sci Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asn Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Tip Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Tip Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 63 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggccatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg
  46. 49/116
    Fig 16 (cont.) ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagcta cgccgcctacctaaggagcatcggcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactg gtggggcggctgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgactt cccgctctactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagcc gcgacccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgag ggccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccgg aggaagcaccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaa cctaggctggagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctggg tagacaagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagcta ctgcggggtggggtga
    SEQ ID NO.: 64
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Πβ Asn Thr Ala His Ala Tyr Gly Ile Lys Ala He Ala Asp He Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tvr Glu Glv Gin pro ng puc ·τ·„ ~-JU q1u
    Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr TyT Ile Asn Leu Gly Trp Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 65 atggccaagtactccgagctggaagaaggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtggggcaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaaccccttcgt gaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcgg catatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtgggg aggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctc tactacaagatggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggtcagacagtggtcagccgcgaccc gttcaaggctgtgacgtttgtagccaaccacgataccgatataatttggaacaagtacccggcctacgccttcatcctcacctacgagggccagc cgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatctggatacacgaccacctcgccggtggaagc acgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacctcggctc gagcaaggttggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaagt gggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctattgcggt gttggctga • «
  47. 50/116
    Fig l6(cont.)
    SEQ ID NO.: 66
    Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Tip Asp Vai Pro Gly Gly Gly Ile Trp Trp Gly Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Tip He Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu. Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala' Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai TyT Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 67 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcgggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttc gttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttceaccccaacgaggtcaagtgct gtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctacg ccgcctacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactggt ggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgacttc ccgctctactacaagatggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggtcagacagtggtcagccgc gacccgttcaaggctgtgacgtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggag gaagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacct cggctcgagcaaggttggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtg gacaagtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagcta ctgcgtggtgggctga
    SEQ ID NO.: 68
    Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe TyT Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu
  48. 51/116
    Fig 16 (cont.)
    Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu He Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser He Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Vai Vai Gly SEQ ID NO.: 73 atggctctggaagagggcgggcttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccatagcccagaagat acccgactgggcgagcgccgggatttcggcaatatggattcctcccgcgagtaagggcatgagcggcggctattcgatgggctacgacccct acgatttcttcgacctcggtgagtactaccagaagggaagcgttgagacccgcttcggatcaaaagaggagcttgtgaacatgataaacaccgc ccatgctcacaacatgaaggtcatagcggacatagtcatcaaccaccgcgccggcggcgacctggagtggaatcctttcaccaacagctacac ctggaccgatttctcgaaggtcgcgtcgggcaagtacacggccaactacctcgacttccacccgaacgagcttcacgcgggcgattccggaa catttggaggctatcccgacatatgccacgacaagagctgggaccagcactggctctgggccagcaacgaaagctacgccgcctacctccgg agcatcggcatcgacgcctggcgcttcgactacgtcaagggctacgctccctgggtcgttaagaactggctgaaccggtggggcggctgggc ggttggagagtactgggacaccaacgtcgatgcactcctgagctgggcctacgacagcggtgctaaagtcttcgacttcccgctctactacaag atggacgaggccttcgataacaacaacatccccgccctcgtggacgccctcaagaacggaggcacggtcgtcagccgcgacccgttcaaag ccgtgaccttcgttgccaaccacgataccaacataatctggaacaagtatccggcctacgccttcatcctcacctatgagggacagccggcaat attctaccgcgactacgaggagtggctcaacaaggacaggctcaggaacctcatctggatacacgaccacctcgcgggaggaagcacagac atcatctactacgacagcgacgagcttatcttcgtgagaaacggctacggggacaagccgggactgataacctacatcaacctcggctcaagc aaggccggaaggtgggtctacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaacctcggcggctggattgacaagtgggt tgactcaagcggtcgggtctaccttgaggcccccgcccacgacccggccaacggccagtacggctactccgtatggagctactgcggtgttg ggtga
    SEQ ID NO.: 74
    Met Ala Leu Glu Glu Gly Gly Leu He Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Ser Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala His Asn Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Thr Asn Ser Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly He Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asn Trp Leu Asn Arg Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Ser Trp Ala Tyr Asp Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asn Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Ala Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Arg Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Ile Tyr Tyr Asp Ser Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr He Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Ile Asp Lys Trp Vai Asp Ser Ser Gly Arg Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 75 atggctctggaagagggcgggcttataatgcaggcattctactgggacgtccccatgggaggaatctggtgggacacgatagcccagaagat acccgactgggcaagcgccgggatttcggcgatatggattccccccgcgagcaagggtatgagcggcggctattcgatgggctacgacccct
    Fig1 16 (cont.)
  49. 52/116 acgattattttgacctcggtgagtactaccagaagggaacggtggaaacaagattcggctcaaagcaggagctcataaacatgataaacaccg cccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggcgatctggagtggaaccccttcgtgaacgactata cctggaccgacttctcgaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccacgcgggcgattccgga acatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcggcctatctcag gagcatcggcatcgacgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcagggactggctgaactggtggggaggctggg cagttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctctactacaag atggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggccagacagtggtcagccgcgacccgttcaaggc tgtgacgtttgtagccaaccacgataccgacataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccagccgacaatat tctaccgcgactacgaggagtggctcaacaaggacaagctcaagaacctcatctggatacatgacaacctcgccggagggagcactgacatc gtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctcggctcaagcaaa gccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaacctcggcggctgggtggacaagtgggtgga ctcaagcggctgggtttacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtttggagctattgcggtgttgggtga
    SEQ IDNO.: 76
    Met Ala Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ue Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ue Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ue Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Tip Vai Vai Arg Asp Trp Leu Asn Trp Trp Gly Gly Tip Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ue Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ue Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ue Phe Tyr Arg Asp Tyr Glu Glu Tip Leu Asn Lys Asp Lys Leu Lys Asn Leu Ue Trp Ue His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ue Vai Tyr Tyr Asp Asn Asp Glu Leu Ue Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ue Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Tip Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 77 atggctctggaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgatagcccagaagat acccgactgggcaagcgccgggatttcggcgatatggatccctcccgcgagcaagggtatgagcggcggctattcgatgggctacgacccct acgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacatgataaacaccg cccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaaccccttcgtgaacgactata cctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgcgggcgattccggaa catttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcggcatatctcagg agcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtggggaggctgggc ggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctctactacaaga tggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggtcagacagtggtcagccgcgacccgttcaaggct gtgacgtttgtagccaaccacgataccgacataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccagccgacaatatt ctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggagggagcactgacatcg tttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctcgcctcaagcaaag ccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaagtgggtggac tcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctactgcggtgttgggtga
    Fig 16 (cont.)
  50. 53/116 • ··· · · · · ·
    SEQ ID NO.: 78
    Met Ala Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp He Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp He Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe He Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 79 atgaagcctgcgaaactcctcgtctttgtgctcgtagtctctatcctcgcggggctctacgcccagcccgcgggggcggccaagtacctggagc tcgaagagggcggcgtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaatacggcagaagataccgga gtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatgggctacgacccctacgactt ctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaacatgataaacaccgcccacg cctacggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaaccccttcgtcaatgactacacctgga cggacttctcgaaggtcgcttccggcaagtacacggccaactacctcgacttccaccccaacgaggtcaagtgctgcgacgagggcacctttg gagggttcccggacatagcccacgagaagagctgggaccagtactggctctgggcgagcaacgagagctacgccgcctacctcaggagca tcggcgttgacgcatggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactggtggggaggctgggccgt cggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgacttcccgctctactacaagatg gacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagccgcgacccgtttaaggccgt aaccttcgttgcaaaccacgacacggacataatttggaacaagtacccggcctacgccttcatcctcacctacgagggccagccgacgatattc taccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatctggatacacgaccacctcgccggtggaagcaccgacatag tctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggctcgagcaagg ccgggaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtggacaagtgggtgga ctcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagctactgcggggtgggct
    6a
    SEQ IDNO.: 80
    Met Lys Pro Ala Lys Leu Leu Vai Phe Vai Leu Vai Vai Ser Ile Leu Ala Gly Leu Tyr Ala Gin Pro Ala Gly Ala Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin TyT Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala
  51. 54/116
    Fig 16 (cont.)
    Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys He His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ IDN0.:81 atgaagaagtttgtcgccctgttcataaccatgtttttcgtagtgagcatggcagtcgttgcacagccagctagcgccgcaaagtattccgagctc gaagaaggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccatcaggagcaagataccggagt ggtacgaggcgggaatatccgccatttggattccgccagccagcaaggggatgagcggcggttactcgatgggctacgatccctacgatttctt tgacctcggcgagtacaaccagaagggaaccatcgaaacgcgctttggctctaaacaggagctcatcaatatgataaacacggcccatgccta cggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttcgttggggactacacctggacg gacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagtgctgtgacgagggcacatttggag gcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctacgccgcctacctaaggagcatcg gcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactggtggggcggctgggccgttggc gagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgacttcccgctctactacaagatggatg aggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgacccgttcaaggccgtaaccttt gtagcaaaccacgacaccgatataatctggaacaagtaccttgcttatgctttcatcctcacctacgaaggccagcccgtcatattctaccgcgac tacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaagcacgagcatagtctactacga cagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacctcggctcgagcaaggttggaaggtg ggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagacaagtacgtctactcaagcggctg ggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgcggtgttgggtga
    SEQ ID NO.: 82
    Met Lys Lys Phe Vai Ala Leu Phe He Thr Met Phe Phe Vai Vai Ser Met Ala Vai Vai Ala Gin Pro Ala Ser Ala Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp He Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asn Gin Lys Gly Thr Ile Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai He Ala Asp Ile Vai lie Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn He Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    Fig 16 (cont.)
  52. 55/116
    SEQ ID NO.: 83 atggctctggaagacggcgggctcataatgcaggccttctactgggatgttcctggaggaggaatctggtgggacacaatagctcaaaagata cccgaatgggcaagtgcaggaatctcagcgatatggattccaccagcgagtaagggcatgagcggtggttattccatgggctacgatccctac gatttctttgacctcggcgagtactatcagaaggggacagttgagacgcgcttcggctcaaaggaagaactggtgaacatgataaacaccgca cactcctacggcataaaggtgatagcagacatagtcataaaccaccgcgccggtggagaccttgagtggaaccccttcgtgaacgactatacct ggacagacttctcaaaagtcgcctccggtaaatatacggccaactaccttgacttccacccaaacgagcttcactgttgtgatgaaggtacctttg gaggataccctgatatatgtcacgacaaaagctgggaccagtactggctctgggcgagcagcgaaagctacgctgcctacctcaggagcata ggggttgacgcctggcgtttcgactacgtcaagggctacggagcatgggttgttaacgactggctcagctggtggggaggctgggccgttgga gagtactgggacacgaacgttgatgcactcctcaactgggcatacagcagcggcgccaaggtctttgacttcccgctctactacaagatggacg aagccttcgacaacaccaacatcccggcattagtggatgcactcagatacggccagacagtggtcagccgcgatcccttcaaggcggtaacttt cgttgccaaccacgatacagatataatctggaacaagtatccggcttatgcattcaíccttacctatgagggacagcctgttatattctaccgcgac tacgaggagtggctcaacaaggataagcttaacaacctcatctggatacacgatcaccttgctggagggagtactgacattgtttactacgacag cgacgagcttatctttgtgagaaacggctatggcaccaaaccaggactgataacctatatcaacctcggctcaagcaaagttggaaggtgggtc tacgttccaaagttcgccggttcatgcatccacgagtacaccggcaacctcggcggttggatagacaagtacgtctcctccagcggctgggtct atcttgaggccccagcccacgacccggcgaacggctactacggctactccgtatggagctactgcggggttgggtga
    SEQID NO.: 84
    Met Ala Leu Glu Asp Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Glu Trp Ala Ser Ala Gly lie Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Cys Cys Asp Glu Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Ser Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Ser Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Thr Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Ile Asp Lys Tyr Vai Ser Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO.: 85 atggctctggaagagggcgggcttataatgcaggcattctattgggacgtcccaggtggaggaatctggtgggacaccatagcccagaagata cccgaatgggcaagtgcaggaatctcagcgatatggattccaccagcgagtaagggaatgagcggtggttattccatgggctacgatccctac gatttctttgacctcggcgagtactatcagaaggggacagttgagacgcgcttcggctcaaaggaagaactggtgaacatgataaacaccgca cactcctacggcataaaggtgatagcggacatagtcataaaccaccgcgccggtggaggcctcgagtggaaccccttcgtgaacgactatacc tggacagacttctcaaaagtcgcctccggtaaatatacagccaactaccttgacttccacccaaacgagcttcactgttgtgatgaaggtacctttg gaggataccctgatatatgtcacgacaaaagctgggaccagtactggctctgggcgagcagcgaaagctacgctgcctacctcaggagcata ggggttgacgcctggtgtttcgactacgtcaagggctacggagcctgggttgttaacgactggctcagctggtggggaggctgggccgttgga gagtactgggacactaacgttgatgcactcctcaactgggcatacaacagcggcgccaaggtctttgacttcccgctctactacaagatggacg aagccttcgacaataccaacatccccgctttggtttacgccctcaagaatggcgggacagtggtcagccgcgacccattcaaggcggtaacttt cgttgccaaccacgatacagatataatctggaacaagtatccggcttatgcattcatccttacctatgagggacagcctgttatattctaccgcgac tacgaggagtggctcaacaaggataagcttaacaacctcatctggatacacgatcaccttgctggagggagtactgacattgtttactacgacag cgacgagcttatctttgtgagaaacggctatggcaccaaaccaggactgataacctatatcaacctcggctcaagcaaagctggaaggtgggtc
  53. 56/116
    Fig 16 (cont.) tacgttccaaagttcgccggttcatgcatccacgagtacaccggcagcctcggcggttggatagacaagtacgtctcctccagcggctgggtct accttgaggccccggcccacgacccggccaatggccagtatggctactccgtctggagctattgcggggttgggtga
    SEQ ID NO.: 86
    Met Ala Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr He Ala Gin Lys Ile Pro Glu Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys. Vai Ile Ala Asp He Vai Ile Asn His Arg Ala Gly Gly Gly Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Cys Cys Asp Glu Gly Thr Phe Gly Gly Tyr Pro Asp He Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Ser Glu Ser Tyr Ala Ala Tyr Leu Arg Ser He Gly Vai Asp Ala Trp Cys Phe Asp TyT Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Asn Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Tyr Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe He Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Ser Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Thr Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Ser Leu Gly Gly Trp Ile Asp Lys Tyr Vai Ser Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ ID NO: 87 atgttcctgctcgcgtttttgctcactgcctcgctgttctgcccaacaggacagcccgccaaggctgccgcaccgtttaacggcaccatgatgca gtattttgaatggtacttgccggatgatggcacgttatggaccaaagtggccaatgaagccaacaacttatccagccttggcatcaccgctctttg gctgccgcccgcttacaaaggaacaagccgcagcgacgtagggtacggagtatacgacttgtatgacctcggcgaattcaatcaaaaaggga ccgtccgcacaaaatacggaacaaaagctcaatatcttcaagccattcaagccgcccacgccgctggaatgcaagtgtacgccgatgtcgtgtt cgaccataaaggcggcgctgacggcacggaatgggtggacgccgtcgaagtcaatccgtccgaccgcaaccaagaaatctcgggcacctat caaatccaagcatggacgaaatttgattttcccgggcggggcaacacctactccagctttaagtggcgctggtaccattttgacggcgttgattgg gacgaaagccgaaaattgagccgcatttaçaaattccgcggcatcggcaaagcgtgggattgggaagtagacacggaaaacggaaactatg actacttaatgtatgccgaccttgatatggatcatcccgaagtcgtgaccgagctgaaaaactgggggaaatggtatgtcaacacaacgaacatt gatgggttccggcttgatgccgtcaagcatattaagttcagtttttttcctgattggttgtcgtatgtgcgttctcagactggcaagccgctatttaccg tcggggaatattggagctatgacatcaacaagttgcacaattacattacgaaaacagacggaacgatgtctttgtttgatgccccgttacacaaca aattttataccgcttccaaatcagggggcgcatttgatatgcgcacgttaatgaccaatactctcatgaaagatcaaccgacattggccgtcacctt cgttgataatcatgacaccgaacccggccaagcgctgcagtcatgggtcgacccatggttcaaaccgttggcttacgcctttattctaactcggc aggaaggatacccgtgcgtcttttatggtgactattatggcattccacaatataacattccttcgctgaaaagcaaaatcgatccgctcctcatcgc gcgcagggattatgcttacggaacgcaacatgattatcttgatcactccgacatcatcgggtggacaagggaaggggtcactgaaaaaccagg atccgggctggccgcactgatcaccgatgggccgggaggaagcaaatggatgtactgttggcaaacaacacgctggaaaagtgttctatga
    SEQIDNO: 88
    Met Phe Leu Leu Ala Phe Leu Leu Thr Ala Ser Leu Phe Cys Pro Thr Gly Gin Pro Ala Lys Ala Ala Ala Pro Phe Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr Leu Pro Asp Asp Gly Thr Leu Trp Thr Lys Vai Ala Asn Glu Ala Asn Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Arg Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Leu Gin Ala Ile Gin Ala Ala His Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asp His Lys Gly Gly Ala Asp Gly Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu Ile Ser Gly Thr TyT Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp •
  54. 57/116
    Fig 16(cont.)
    Gly Vai Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Vai Asn Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Vai Arg Ser Gin Thr Gly Lys Pro Leu Phe Thr Vai Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys Leu His Asn Tyr lie Thr Lys Thr Asp Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gin Pro Thr Leu Ala Vai Thr Phe Vai Asp Asn His Asp Thr Glu Pro Gly Gin Ala Leu Gin Ser Trp Vai Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Gin Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Vai Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Cys Trp Gin Thr Thr Arg Trp Lys Ser Vai Leu
    SEQ ID NO: 89 atgaaagaagcggttgtgtatcaaattttcccggatcggttctttaatggcaacccttcaaatgataacagcaagcagcaggcacgcggggcgc agccgattgagcatcgcgattggtcggatttgcccgataatccgcgcctgaaagggacgagcggctacgatggcgacggtgaatggtcgaat gactttttcggcggagacatcgccggaattgaacaaaagttggattatttgcagtcgcttggagtgaacacgatttacttaaatccgatcgccaatg cgccatcgaaccataaatatgatgcgagcaattacaaagaattggatccgatgttcggttccccggaagaattccaatcgtttgtgcaggcgcttg cgaaccgggggatgcatctcatcttagacggggtgttcaaccacgtatccgacgattcgatttactttgaccgctaccaccgctatccgaccgtc ggtgcgtatgaatattgggaagcggtttacgatttgatgaatgaaaaaggattgagcgaggaagaagcgcggaaacaagtggaagagaagttc aaacaagagggacagacgttcagcccgtatgggtttcatctttggttcaatattgaaaacaaaaaagtcaatggccattatcaataccaatcatggt ggggctatgacagtctgccggagtttaagtcggtgacgggggaaaaagtgccgcatccgagtgaattgaacaacgatgcgctcgcgaattac attttccgtgaatcggattcggtggcgaaaagctggattgccctcggcgcctccggctggcggttggatgtggccaatgaggtggatccggcgt tttggcgcgagtttcgccaagaattgcttcaagggtcgtacggccgcggtccgacgttaaaagagggggagcagccgctcattttaggggaaa tttgggatgacgcatcgaaatattttctaggcgaccagtacgattccgtgatgaactaccggttccgcggggcggtgcttgactttttgaaaaacg gaaatgcagaagaggcggacaagcggctgacggccataagggaagactacccaagtgaagcgttttatgcgctgatgaacttaatcggttcg catgacacggcgcgggcggtctttctgcttgggaacggaacggattcatccgagcgggcggagcttgatccgaattataatgaggaacttggg aaaaagcggctcaagctggcggtgattttgcagatgggatacccgggagcgccgacgatttattacggcgatgaagcgggagtaacaggctc aaaagacccagacaaccgccgcacgtatccgtggggcaaagaagatcaaaatctgttgtcccattatcagaaagtggggcacattcgccagc accatcaatcgttgttggcccatggcgacatcaagacggtgtatgcgcaaggggatgtatacgtatttgcccgccaatacgggcgtgaagcgg cgctcattgccatcaaccgcggcaatgaggacaagacggtggcgcttgacgtcgcttcgttgcttccgaacggcaccgtgcttacggatgagtt gcatgatggcggggaagctacggtcgctggcggaacgttgacggtcacgattccggccctggatggacggatgatgtttgggacggtgacg gcggaaatgccggcagcagtcagcaatttgcaggcgagcgcttcggatggctgcgtgacgttaacgtgggaaggaaatgcatcgagatacc gaatttacgagtccacgttaaaaggtgccggttatacgatggtgcaagagacggaaacaacttcggccacgatcggttcgttgacgaacggaa cagcctattactttgccgttgcggcggtcgatgaaaacgggaatgaatcaccgaaggtcgaaacgaatcgcgtcgttcctcattacccgctgac gagcgacaatgtccagttcgtgacaacgttaagcgatgccacactggatttgtcaaagccgcagcaagtggatgtccatgtcaacatcgacaat gtgacaagcaaaggagcagctgatgggttgcaagcggtgttgcaagtgaaaggcccgcatgacgaaacatggaaagaatacagagcggctt accaaggacaagacggcgacgccaacgtgttccgagctgccttcactccgctcgccgcagggacgtatacgtatcgttatgcgctgacgacc aaccttggcgaggagtggatgtatacagaagagaagcaagtgacgtttgcggcagacaacagcgaccaaatagcgccagcagacgccatcg agctgcggcagcctgcggttgaatcgggacaagtgaatttatcatggacgtttgttgggaaaaaagatggggatgcttatttgttagccatcgag cgcaacggtgatatcgtgcatacaaccacttcgatcggcgattcatttacagactacgatgtcgaaaacggcaccgagtacacgtatgttgtcaa gttgtatgaccgcgccggcaatgttgtggcgtcaaacacggtcaaggtgacgccggacattgtgatggtgaaagtgatttttaaagtgagagcg ccggattacacaccgttggatgcccgaattacgattccgaacagcttgaacggctggaacacaggggcctgggagatgtcgcgcaacggtgc ggtgacgcccgattggcaatttaccgtcgaggtgcaggaaggggaaacgatcacctataagtatgtgaaaggcggatcgtgggatcaagagg ggttggccgaccatacgcgtgaggacgacaacgatgatgacgtgagctactacggctatgggacgattggcaccgacttgaaagtgacggtc cacaatgaaggaáacaatacgatgattgtgcaagaccgcattttgcgctggatcgatatgccggtcgtcatcgaagaggtgcaaaaacaagga agtcaagtgacgatcaagggcaatgccattaaaaacggtgttttgacgatcaatggcgagcgggtgccgattgatggccggatggcattctcgt acacgtttgcgccggccagccatcaaaaagaagtgttgatccatatcgaaccatcggccgaaagcaaaacagccattttcaacaacgacggcg
  55. 58/116
    Fig 16 (cont.) ······ · · · gagcgattgcgaaaaacacaaaagattacgtgctgaatttagaaacgaagcaattcaaaaagcttctcgagagtacttctagagcggccgcgg gcccatcgattttccacccgggtggggtaccaggta
    SEQ ID NO: 90
    Met Lys Glu Ala Vai Vai Tyr Gin Ile Phe Pro Asp Arg Phe Phe Asn Gly Asn Pro Ser Asn Asp Asn Ser Lys Gin Gin Ala Arg Gly Ala Gin Pro Ile Glu His Arg Asp Trp Ser Asp Leu Pro Asp Asn Pro Arg Leu Lys Gly Thr Ser Gly Tyr Asp Gly Asp Gly Glu Trp Ser Asn Asp Phe Phe Gly Gly Asp Ile Ala Gly Ile Glu Gin Lys Leu Asp Tyr Leu Gin Ser Leu Gly Vai Asn Thr Ile Tyr Leu Asn Pro Ile Ala Asn Ala Pro Ser Asn His Lys Tyr Asp Ala Ser Asn Tyr Lys Glu Leu Asp Pro Met Phe Gly Ser Pro Glu Glu Phe Gin Ser Phe Vai Gin Ala Leu Ala Asn Arg Gly Met His Leu He Leu Asp Gly Vai Phe Asn His Vai Ser Asp Asp Ser He Tyr Phe Asp Arg Tyr His Arg Tyr Pro Thr Vai Gly Ala Tyr Glu Tyr Tip Glu Ala Vai Tyr Asp Leu Met Asn Glu Lys Gly Leu Ser Glu Glu Glu Ala Arg Lys Gin Vai Glu Glu Lys Phe Lys Gin Glu Gly Gin Thr Phe Ser Pro Tyr Gly Phe His Leu Trp Phe Asn Ile Glu Asn Lys Lys Vai Asn Gly His Tyr Gin Tyr Gin Ser Trp Trp Gly Tyr Asp Ser Leu Pro Glu Phe Lys Ser Vai Thr Gly Glu Lys Vai Pro His Pro Ser Glu Leu Asn Asn Asp Ala Leu Ala Asn Tyr Ile Phe Arg Glu Ser Asp Ser Vai Ala Lys Ser Trp Ile Ala Leu Gly Ala Ser Gly Trp Arg Leu Asp Vai Ala Asn Glu Vai Asp Pro Ala Phe Trp Arg Glu Phe Arg Gin Glu Leu Leu Gin Gly Ser Tyr Gly Arg Gly Pro Thr Leu Lys Glu Gly Glu Gin Pro Leu Ile Leu Gly Glu Ile Trp Asp Asp Ala Ser Lys Tyr Phe Leu Gly Asp Gin Tyr Asp Ser Vai Met Asn Tyr Arg Phe Arg Gly Ala Vai Leu Asp Phe Leu Lys Asn Gly Asn Ala Glu Glu Ala Asp Lys Arg Leu Thr Ala Ile Arg Glu Asp Tyr Pro Ser Glu Ala Phe Tyr Ala Leu Met Asn Leu He Gly Ser His Asp Thr Ala Arg Ala Vai Phe Leu Leu Gly Asn Gly Thr Asp Ser Ser Glu Arg Ala Glu Leu Asp Pro Asn Tyr Asn Glu Glu Leu Gly Lys Lys Arg Leu Lys Leu Ala Vai Ile Leu Gin Met Gly Tyr Pro Gly Ala Pro Thr Ile Tyr Tyr Gly Asp Glu Ala Gly Vai Thr Gly Ser Lys Asp Pro Asp Asn Arg Arg Thr Tyr Pro Trp Gly Lys Glu Asp Gin Asn Leu Leu Ser His Tyr Gin Lys Vai Gly His He Arg Gin His His Gin Ser Leu Leu Ala His Gly Asp Ile Lys Thr Vai Tyr Ala Gin Gly Asp Vai Tyr Vai Phe Ala Arg Gin Tyr Gly Arg Glu Ala Ala Leu Ile Ala Ile Asn Arg Gly Asn Glu Asp Lys Thr Vai Ala Leu Asp Vai Ala Ser Leu Leu Pro Asn Gly Thr Vai Leu Thr Asp Glu Leu His Asp Gly Gly Glu Ala Thr Vai Ala Gly Gly Thr Leu Thr Vai Thr Ile Pro Ala Leu Asp Gly Arg Met Met Phe Gly Thr Vai Thr Ala Glu Met Pro Ala Ala Vai Ser Asn Leu Gin Ala Ser Ala Ser Asp Gly Cys Vai Thr Leu Thr Trp Glu Gly Asn Ala Ser Arg Tyr Arg lie Tyr Glu Ser Thr Leu Lys Gly Ala Gly Tyr Thr Met Vai Gin Glu Thr Glu Thr Thr Ser Ala Thr Ile Gly Ser Leu Thr Asn Gly Thr Ala Tyr Tyr Phe Ala Vai Ala Ala Vai Asp Glu Asn Gly Asn Glu Ser Pro Lys Vai Glu Thr Asn Arg Vai Vai Pro His Tyr Pro Leu Thr Ser Asp Asn Vai Gin Phe Vai Thr Thr Leu Ser Asp Ala Thr Leu Asp Leu Ser Lys Pro Gin Gin Vai Asp Vai His Vai Asn Ile Asp Asn Vai Thr Ser Lys Gly Ala Ala Asp Gly Leu Gin Ala Vai Leu Gin Vai Lys Gly Pro His Asp Glu Thr Trp Lys Glu Tyr Arg Ala Ala Tyr Gin Gly Gin Asp Gly Asp Ala Asn Vai Phe Arg Ala Ala Phe Thr Pro Leu Ala Ala Gly Thr Tyr Thr Tyr Arg Tyr Ala Leu Thr Thr Asn Leu Gly Glu Glu Trp Met Tyr Thr Glu Glu Lys Gin Vai Thr Phe Ala Ala Asp Asn Ser Asp Gin Ile Ala Pro Ala Asp Ala Ile Glu Leu Arg Gin Pro Ala Vai Glu Ser Gly Gin Vai Asn Leu Ser Trp Thr Phe Vai Gly Lys Lys Asp Gly Asp Ala Tyr Leu Leu Ala Ile Glu Arg Asn Gly Asp Ile Vai His Thr Thr Thr Ser Ile Gly Asp Ser Phe Thr Asp Tyr Asp Vai Glu Asn Gly Thr Glu Tyr Thr Tyr Vai Vai Lys Leu Tyr Asp Arg Ala Gly Asn Vai Vai Ala Ser Asn Thr Vai Lys Vai Thr Pro Asp Ile Vai Met Vai Lys Vai Ile Phe Lys Vai Arg Ala Pro Asp Tyr Thr Pro Leu Asp Ala Arg Ile Thr Ile Pro Asn Ser Leu Asn Gly Trp Asn Thr Gly Ala Trp Glu Met Ser Arg Asn Gly Ala Vai Thr Pro Asp Trp Gin Phe Thr Vai Glu Vai Gin Glu Gly Glu Thr Ile Thr Tyr Lys Tyr Vai Lys Gly Gly Ser Trp Asp Gin Glu Gly Leu Ala Asp His Thr Arg Glu Asp Asp Asn Asp Asp Asp Vai Ser Tyr Tyr Gly Tyr Gly Thr Ile Gly Thr Asp Leu Lys Vai Thr Vai His Asn Glu Gly Asn Asn Thr Met Ile Vai Gin Asp Arg Ile Leu Arg Trp Ile Asp Met Pro Vai Vai Ile Glu Glu Vai Gin Lys Gin Gly Ser Gin Vai Thr Ile Lys Gly Asn Ala Ile Lys Asn Gly Vai Leu Thr Ile Asn Gly Glu Arg Vai Pro Ile Asp Gly Arg Met Ala Phe Ser Tyr Thr Phe Ala Pro Ala Ser His Gin Lys Glu Vai Leu Ile His Ile Glu Pro Ser Ala Glu Ser Lys Thr Ala Ile Phe Asn Asn Asp
    Figi 16 (cont.)
  56. 59/116
    Gly Gly Ala Ile Ala Lys Asn Thr Lys Asp Tyr Vai Leu Asn Leu Glu Thr Lys Gin Phe Lys Lys Leu Leu Glu Ser Thr Ser Arg Ala Ala Ala Gly Pro Ser Ile Phe His Pro Gly Gly Vai Pro Gly SEQ ID NO: 91 gtgctaacgtttcaccgcatcattcgaaaaggatggatgttcctgctcgcgtttttgctcactgcctcgctgttctgcccaacaggacagcccgcca aggctgccgcaccgtttaacggcaccatgatgcagtattttgaatggtacttgccggatgatggcacgttatggaccaaagtggccaatgaagc caacaacttatccagccttggcatcaccgctctttggctgccgcccgcttataaaggaacaagccgcagcgacgtagggtacggagtatacga cttgtatgacctcggcgaattcaatcaaaaagggaccgtccgcacaaaatacggaacaaaagctcaatatcttcaagccattcaagccgcccac gccgctggaatgcaagtgtacgccgatgtcgtgttcgaccataaaggcggcgccgacggcacggaatgggtggacgccgtcgaagtcaatc cgtccgaccgcaaccaagaaatctcgggcacctatcaaatccaagcatggacgaaatttgattttcccgggcggggcaacacctactccagctt taagtggcgctggtaccattttgacggcgttgattgggacgaaagccgaaaattgagccgcatttacaaattccgcggcatcggcaaagcgtgg gattgggaagtagacacggaaaacggaaactatgactacttaatgtatgccgacttggacatggaccatcctgaagtggttacggaactgaaaa actggggcaaatggtatgtcaacacaacgaacattgatgggttccggcttgatgccgtcaagcatattaagttcagtttttttcctgattggttgtcgt atgtgcgttctcagactggcaagccgctatttaccgtcggggaatattggagctatgacatcaacaagttgcacaattacattacgaaaacaaacg gaacgatgtctttgtttgatgccccgttacacaacaaattttataccgcttccaaatcagggggcgcatttgatatgcgcacgttaatgaccaatact ctcatgaaagatcaaccgacattggccgtcaccttcgttgataatcatgacaccgaacccggccaagcgctgcagtcatgggtcgacccatggt tcaaaccgttggcttacgcctttattctaactcggcaggaaggatacccgtgcgtcttttatggtgactattatggcatcccacaatataacattcctt cgctgaaaagcaaaatcgatccgctcctcatcgcgcgcagggattatgcttacggaacgcaacatgattatcttgatcactccgacatcatcggg tggacaagggaaggcgtcactgaaaaaccaggatccggactggccgcactgatcaccgatgggccgggaggaagcaaatggatgtacgtt ggcaaacaacacgccggaaaagtgttctatgaccttaccggcaaccggagtgacaccgtcaccatcaacagtgatggatggggagaattcaa agtcaatggcggttcggtttcggtttgggttcctagaaaaacgaccgtctctaccatcgcttggccgatcacaacccgaccgtggactggtgaatt cgtccgttggaccgaaccacggttggtggcatggccttga
    SEQIDNO: 92
    Vai Leu Thr Phe His Arg Ile Ile Arg Lys Gly Trp Met Phe Leu Leu Ala Phe Leu Leu Thr Ala Ser Leu Phe Cys Pro Thr Gly Gin Pro Ala Lys Ala Ala Ala Pro Phe Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr Leu Pro Asp Asp Gly Thr Leu Trp Thr Lys Vai Ala Asn Glu Ala Asn Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Arg Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Leu Gin Ala Ile Gin Ala Ala His Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asp His Lys Gly Gly Ala Asp Gly Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu Ile Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Lys Trp TyT Vai Asn Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Phe Ser Phe Phe Pro Asp Trp Leu Ser TyT Vai Arg Ser Gin Thr Gly Lys Pro Leu Phe Thr Vai Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gin Pro Thr Leu Ala Vai Thr Phe Vai Asp Asn His Asp Thr Glu Pro Gly Gin Ala Leu Gin Ser Trp Vai Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Gin Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Vai Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Gin His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ser Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Pro Arg Lys Thr Thr Vai Ser Thr Ile Ala Trp Pro Ile Thr Thr Arg Pro Trp Thr Gly Glu Phe Vai Arg Trp Thr Glu Pro Arg Leu Vai Ala Trp Pro
    Fig 16 (cont.)
  57. 60/116 ··· ··· ··· · • · · · · · • · · · · · • ··· · · · · ·
    SEQ ID NO: 93 atgaaatcgtttgcattcatgcctatccttttttatgcaaacgatttcatcagtgaaagggaaggaggaggaaaaatggggaagaatatgagaaga agattcacgtatttttcaatcttcttattgttcgttcagctgttttcatttagtgcaaccgctagcgccaatggaacggtgaacagtagtcctgtggttaa tggaaacgaagtcacgtttctatatggaggaacaggaaacgagcagtctgtgttactggcaggctcctttaatgattggcagaaagatggtgaca agaagattgcactaacaaaaggcgacaataacgtctggtctgtcacgcaaacacttcaagatgggacatatacgtataagtttgttgtagatggtc aatgggtggcggatccgcttaacccgaatcaagtagacgacggttacggcggccgtaatagtgtcgttgttgtcgggacaccggtgcaacaag aacggacagtgacgcttgttggtaacttacaagacgaattaggtcatacgagcgaatgggatccgaaagcgacagctacagtgatgaaaaagg aagggaacgggttatatacgtttacaggtacacttccagccggaacgtacgagtataaaattgcgattaatggcagctgggacgaaaactatggt gtcggcggccgcgatggcgggaatattaagctgctattaaatgaacaaacaacggttacattttattacaacgacagaacgcatgcgattgcgg attcgacttggtatgcaccaattctaaaagaaaagcagccgcggctcgttggaacgattttaccagctattggttatgaaacagacgtgaacggtt ggacgccgcaaacatcaacggcgttgttgtcagatgatgattttgattccatttatacgtttaaggcgcgtgtgccaaaagggacatatgaatataa agtagttcttgggaatgattggacatatgaaaattatccacaagataatgccaaattaaatgtgcttgaagaaacgacaattacctttttctttaacgc gaaaacgaaagtagtgtataccgattacaatccaagcggttcggatggtatcgtccaaaaagaccgtttgaagcataatacgtgggattcgttgta tcgccaaccgtttggtgcggtgaaagctgggacagaagtgacccttcgtttatcagcgaaaaaaggtgatttgacaaaagcggatgtatatgtaa aaaatacgacaaccggcacagcgaaactatattcgatgaaaaaagccggtgttcttggcgaagaagaatattgggaagcgacattcacaccgg atgtgaaaggagtatacggttataaatttattgcggtagatgctggaacgaaagcagaatacggggaagatacacaagaagggcagtgggga aaagcagtagataaaaatgcagagctgttccaattaacggtgtacgacccatcctaccaaacaccggattggatgaaagaagcagttgtatatca aattttccctgatccaaag
    SEQ ID NO: 94
    Met Lys Ser Phe Ala Phe Met Pro Ile Leu Phe Tyr Ala Asn Asp Phe Ile Ser Glu Arg Glu Gly Gly Gly Lys Met Gly Lys Asn Met Arg Arg Arg Phe Thr Tyr Phe Ser Ile Phe Leu Leu Phe Vai Gin Leu Phe Ser Phe Ser Ala Thr Ala Ser Ala Asn Gly Thr Vai Asn Ser Ser Pro Vai Vai Asn Gly Asn Glu Vai Thr Phe Leu Tyr Gly Gly Thr Gly Asn Glu Gin Ser Vai Leu Leu Ala Gly Ser Phe Asn Asp Trp Gin Lys Asp Gly Asp Lys Lys Ile Ala Leu Thr Lys Gly Asp Asn Asn Vai Trp Ser Vai Thr Gin Thr Leu Gin Asp Gly Thr Tyr Thr Tyr Lys Phe Vai Vai Asp Gly Gin Trp Vai Ala Asp Pro Leu Asn Pro Asn Gin Vai Asp Asp Gly Tyr Gly Gly Arg Asn Ser Vai Vai Vai Vai Gly Thr Pro Vai Gin Gin Glu Arg Thr Vai Thr Leu Vai Gly Asn Leu Gin Asp Glu Leu Gly His Thr Ser Glu Trp Asp Pro Lys Ala Thr Ala Thr Vai Met Lys Lys Glu Gly Asn Gly Leu Tyr Thr Phe Thr Gly Thr Leu Pro Ala Gly Thr Tyr Glu Tyr Lys Ile Ala Ile Asn Gly Ser Trp Asp Glu Asn Tyr Gly Vai Gly Gly Arg Asp Gly Gly Asn Ile Lys Leu Leu Leu Asn Glu Gin Thr Thr Vai Thr Phe Tyr Tyr Asn Asp Arg Thr His Ala Ile Ala Asp Ser Thr Trp Tyr Ala Pro Ile Leu Lys Glu Lys Gin Pro Arg Leu Vai Gly Thr Ile Leu Pto Ala Ile Gly Tyr Glu Thr Asp Vai Asn Gly Trp Thr Pro Gin Thr Ser Thr Ala Leu Leu Ser Asp Asp Asp Phe Asp Ser Ile Tyr Thr Phe Lys Ala Arg Vai Pro Lys Gly Thr Tyr Glu Tyr Lys Vai Vai Leu Gly Asn Asp Trp Thr Tyr Glu Asn Tyr Pro Gin Asp Asn Ala Lys Leu Asn Vai Leu Glu Glu Thr Thr Ile Thr Phe Phe Phe Asn Ala Lys Thr Lys Vai Vai Tyr Thr Asp Tyr Asn Pro Ser Gly Ser Asp Gly Ile Vai Gin Lys Asp Arg Leu Lys His Asn Thr Trp Asp Ser Leu Tyr Arg Gin Pro Phe Gly Ala Vai Lys Ala Gly Thr Glu Vai Thr Leu Arg Leu Ser Ala Lys Lys Gly Asp Leu Thr Lys Ala Asp Vai Tyr Vai Lys Asn Thr Thr Thr Gly Thr Ala Lys Leu Tyr Ser Met Lys Lys Ala Gly Vai Leu Gly Glu Glu Glu Tyr Trp Glu Ala Thr Phe Thr Pro Asp Vai Lys Gly Vai Tyr Gly Tyr Lys Phe Ile Ala Vai Asp Ala Gly Thr Lys Ala Glu Tyr Gly Glu Asp Thr Gin Glu Gly Gin Trp Gly Lys Ala Vai Asp Lys Asn Ala Glu Leu Phe Gin Leu Thr Vai Tyr Asp Pro Ser Tyr Gin Thr Pro Asp Trp Met Lys Glu Ala Vai Vai Tyr Gin Ile Phe Pro Asp Pro Lys
    SEQ ID NO: 95 atgtatacactattcatccgttcatattttgatactgatggtgatggtgtaggagactttagtggagttgctgaaaaggtagattatctaaaatctcttg gagtagatacagtctggtttttaccatttaataaaagtaaatcttatcatggatatgatgttgaagattactatgatgtagaaccagattatggaacact acaagatcttgataatatgataaaagttctaaatgaaaatggaataaaggtagtaatggatcttgttgttaatcatacgtcggatacacatccatggtt tcttgatgcagttgaaaatactactaattctccatattggaactattacattatgagcttggatgagcctcaaaataagaatcattggcattataaggtt aattcaaaaggacaaactgtgtggtattttggattgtttgattcatcaatgccggaccttaattacgacaaccctaaagtaatggatgaagtgaaaaa • · · *··
    Fig 16(cont.)
  58. 61/116 aataatagatttttgggcagatatgggagtagatggatttagattagatgcagcaaaacattattatggatttgactggagcgatggaattgaacag tcagcaagcgttgcaaaagagatagaagactatataaaagataaactaggggaaaatgcaatagttgtgagtgaggtttacgatggagattcaa atgttcttttaaaatttgctccaatgcctgtgtttaattttagttttatgtacaatttgagaggaaattttgaagggagagataacttaatttcagactctatt agttgggttgattcctcgttgtataatttaaatgtttttcattttccatttattgatagtcatgatcttgacagatttatttctgagcttgtagatagtaaatatc agggagatgtaatatctgccacaaaacaatatttgctagttaatgctttactactctcattaacaggcatgccaactatttactatggtgatgaaatag gacttaggggatggaagtggcattcagaaccatgggatatacctgtgcgtgagccaatgcaatggtataaggatcaaaaagggaacggtcaaa cttattggacaaaagagttttacgaaggtattactgaaggaagtgctaatgaagatggagcaatatacgatgatccagatgatggagtatctgtag aagaacaagaaaatggatattctattttaaacttttttaaagaatttatcaacttacgaaaagattatccggcacttgcttttggaagtactacgattga gagagattggaaaaacttgtatgttttgaaaaagtcgtataacttccaggatgttcttgtattaattaaccttgatccaacgtattcaaatacatacgaa gttccagaagggtataaatgggtgtggtatgcattttttgatggtgacaactatgaatttggagcaaaagatgaaatgattttacagaátacaagttg gacgataaatccaaggcaaatttatatatttgtaaagtaa
    SEQ ID NO: 96
    Met Tyr Thr Leu Phe Ile Arg Ser Tyr Phe Asp Thr Asp Gly Asp Gly Vai Gly Asp Phe Ser Gly Vai Ala Glu Lys Vai Asp Tyr Leu Lys Ser Leu Gly Vai Asp Thr Vai Trp Phe Leu Pro Phe Asn Lys Ser Lys Ser Tyr His Gly Tyr Asp Vai Glu Asp Tyr Tyr Asp Vai Glu Pro Asp Tyr Gly Thr Leu Gin Asp Leu Asp Asn Met Ile Lys Vai Leu Asn Glu Asn Gly Ile Lys Vai Vai Met Asp Leu Vai Vai Asn His Thr Ser Asp Thr His Pro Trp Phe Leu Asp Ala Vai Glu Asn Thr Thr Asn Ser Pro Tyr Trp Asn Tyr Tyr Ile Met Ser Leu Asp Glu Pro Gin Asn Lys Asn His Trp His Tyr Lys Vai Asn Ser Lys Gly Gin Thr Vai Trp Tyr Phe Gly Leu Phe Asp Ser Ser Met Pro Asp Leu Asn Tyr Asp Asn Pro Lys Vai Met Asp Glu Vai Lys Lys Ile Ile Asp Phe Trp Ala Asp Met Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Lys His Tyr Tyr Gly Phe Asp Tip Ser Asp Gly Ile Glu Gin Ser Ala Ser Vai Ala Lys Glu Ile Glu Asp Tyr Ile Lys Asp Lys Leu Gly Glu Asn Ala Ile Vai Vai Ser Glu Vai Tyr Asp Gly Asp Ser Asn Vai Leu Leu Lys Phe Ala Pro Met Pro Vai Phe Asn Phe Ser Phe Met Tyr Asn Leu Arg Gly Asn Phe Glu Gly Arg Asp Asn Leu Ile Ser Asp Ser Ile Ser Trp Vai Asp Ser Ser Leu Tyr Asn Leu Asn Vai Phe His Phe Pro Phe Ile Asp Ser His Asp Leu Asp Arg Phe Ile Ser Glu Leu Vai Asp Ser Lys Tyr Gin Gly Asp Vai Ile Ser Ala Thr Lys Gin Tyr Leu Leu Vai Asn Ala Leu Leu Leu Ser Leu Thr Gly Met Pro Thr Ile Tyr Tyr Gly Asp Glu Ile Gly Leu Arg Gly Trp Lys Trp His Ser Glu Pro Trp Asp Ile Pro Vai Arg Glu Pro Met Gin Trp Tyr Lys Asp Gin Lys Gly Asn Gly Gin Thr Tyr Trp Thr Lys Glu Phe Tyr Glu Gly lie Thr Glu Gly Ser Ala Asn Glu Asp Gly Ala Ile Tyr Asp Asp Pro Asp Asp Gly Vai Ser Vai Glu Glu Gin Glu Asn Gly Tyr Ser Ile Leu Asn Phe Phe Lys Glu Phe Ile Asn Leu Arg Lys Asp Tyr Pro Ala Leu Ala Phe Gly Ser Thr Thr Ile Glu Arg Asp Trp Lys Asn Leu Tyr Vai Leu Lys Lys Ser Tyr Asn Phe Gin Asp Vai Leu Vai Leu Ile Asn Leu Asp Pro Thr Tyr Ser Asn Thr Tyr Glu Vai Pro Glu Gly Tyr Lys Trp Vai Trp Tyr Ala Phe Phe Asp Gly Asp Asn Tyr Glu Phe Gly Ala Lys Asp Glu Met Ile Leu Gin Asn Thr Ser Trp Thr Ile Asn Pro Arg Gin Ile Tyr Ile Phe Vai Lys
    SEQ ID NO: 97 atgaggaagaagatgtcgcattcaagatttacttttcttttgatcttagcactttttattttcttctccggttgtatttcagaagttaaaagcgaaagccag ctactaaattcaaagcaaaaggtccttgtaaaagtaaatgttaatacgccatttattgagaatgctactactaatacgtggagtgtttcaaaagaatct tttattgattatcttagtaaagtgattattactgttaaggatgtaaatgatcagattgtatttactaaggaaacaacgaacaaaacaaatatttattttgaa attgaacttcttcctggaacttatacatttgaggtaaaaggatatgaggaagatttagttatattttcaggggaaaaagttaatcagatcatagatgag aaaaataatattgttaatgtcgaaactttttttgttaatggaatagttaggacaataattgaagttgacgatattatttataaaaattatgatattacatcgg caacgttgatcttcaaaaaagatacagcacaagaagattatgaagaggtacctgtaacacttacaggtacttccactttaattaataaagaattatat cctggtatgtggactgtaaaatttgaagttgatcttaaatcaaaggatgcaagtatgttaccagaaaaagttcatcttgaaaatgaatttagcataga agtgcttccagcaaagacaaaaagtttaacatttaatgtagtctttgatacagaggttaatgaaccgaaattagtagttgtatttccgcaaattgagtt gccttttgtggatcctgtaacaaatttaagtggagagataaatgaattagaagggaatctttcaatgaattgggactattcagatccaaatgcagaat tttatgtgtataaagaattagaggaacaaggagaatatttgtatgaatttgttggaaaaacacgcgagaaaagttatacaatagaaaattttaccaag caagaattcgataaatttagtggaatcgctattaatgtttatgccaacggtaaagagagtggattagttgttctaaaaaaagaaaatattaaacttata gatttagaaagtgttgacagtataagtgctacttataacgttgatacgaatgagcttaagttggattggaattataccaattcaagtgttacttttgaag
    Fig 16(cont.)
  59. 62/116 ttttgaaaaaaggtataaatagcaatgaatacgaaataatttctcaactaacacaaaattctttttcaacagaattcacaggcaggcaattttgggatc ttgagaaaattgcgattagagtagttgctaatggatttgaaagtaagattaatgagatttcaagagatgatataactataacateattgaatcttcctct tacatcgtctactatgtatacactattcatccgttcatattttgatactgatggtgatggtgtaggagactttagtggagttgctgaaaaggtagattatc taaaatctcttggagtagatacagtctggtttttaccatttaataaaagtaaatcttatcatggatatgatgttgaagattactatgatgtagaaccagat tatggaacactacaagatcttgataatatgataaaagttctaaatgaaaatggaataaaggtagtaatggatcttgttgttaatcatacgtcggatac acatccatggtttcttgatgcagttgaaaatactactaattctccatattggaactattacattatgagcttggatgagcctcaaaataagaateattgg cattataaggttaattcaaaaggacaaactgtgtggtattttggattgtttgattcatcaatgccggaccttaattacgacaaccctaaagtaatggat gaagtgaaaaaaataatagatttttgggcagatatgggagtagatggatttagattagatgcagcaaaacattattatggatttgactggagcgatg gaattgaacagtcagcaagcgttgcaaaagagatagaagactatataaaagataaactaggggaaaatgcaatagttgtgagtgaggtttacga tggagattcaaatgttcttttaaaatttgctccaatgcctgtgtttaattttagttttatgtacaatttgagaggaaattttgaagggagagataacttaatt tcagactctattagttgggttgattcctcgttgtataatttaaatgtttttcattttccatttattgatagtcatgatcttgacagatttatttctgagcttgtag atagtaaatatcagggagatgtaatatctgccacaaaacaatatttgctagttaatgctttactactctcattaacaggcatgccaactatttactatgg tgatgaaataggacttaggggatggaagtggcattcagaaccatgggatatacctgtgcgtgagccaatgcaatggtataaggatcaaaaagg gaacggtcaaacttattggacaaaagagttttacgaaggtattactgaaggaagtgctaatgaagatggagcaatatacgatgatccagatgatg gagtatctgtagaagaacaagaaaatggatattctattttaaacttttttaaagaatttatcaacttacgaaaagattatccggcacttgcttttggaagt actacgattgagagagattggaaaaacttgtatgttttgaaaaagtcgtataacttccaggatgttcttgtattaattaaccttgatecaacgtattcaa atacatacgaagttccagaagggtataaatgggtgtggtatgcattttttgatggtgacaactatgaatttggagcaaaagatgaaatgattttacag aatacaagttggacgataaatccaaggcaaatttatatatttgtaaagtaa
    SEQ ID NO: 98
    Met Arg Lys Lys Met Ser His Ser Arg Phe Thr Phe Leu Leu Ile Leu Ala Leu Phe lie Phe Phe Ser Gly Cys Ile Ser Glu Vai Lys Ser Glu Ser Gin Leu Leu Asn Ser Lys Gin Lys Vai Leu Vai Lys Vai Asn Vai Asn Thr Pro Phe Ile Glu Asn Ala Thr Thr Asn Thr Trp Ser Va, Ser Lys Glu Ser Phe Ile Asp Tyr Leu Ser Lys Vai Ile Ile Thr Vai Lys Asp Vai Asn Asp Gin Ile Vai Phe Thr Lys Glu Thr Thr Asn Lys Thr Asn Ile Tyr Phe Glu Ile Glu Leu Leu Pro Gly Thr Tyr Thr Phe Glu Vai Lys Gly Tyr Glu Glu Asp Leu Vai Ile Phe Ser Gly Glu Lys Va, Asn Gin Ile Ile Asp Glu Lys Asn Asn Ile Vai Asn Vai Glu Thr Phe Phe Vai Asn Gly Ile Vai Arg Thr Ile Ile Glu Vai Asp Asp Ile Ile Tyr Lys Asn Tyr Asp Ile Thr Ser Ala Thr Leu Ile Phe Lys Lys Asp Thr Ala Gin Glu Asp Tyr Glu Glu Vai Pro Vai Thr Leu Thr Gly Thr Ser Thr Leu Ile Asn Lys Glu Leu Tyr Pro Gly Met Trp Thr Vai Lys Phe Glu Vai Asp Leu Lys Ser Lys Asp Ala Ser Met Leu Pro Glu Lys Vai His Leu Glu Asn Glu Phe Ser Ile Glu Vai Leu Pro Ala Lys Thr Lys Ser Leu Thr Phe Asn Vai Vai Phe Asp Thr Glu Vai Asn Glu Pro Lys Leu Vai Vai Vai Phe Pro Gin Ile Glu Leu Pro Phe Vai Asp Pro Vai Thr Asn Leu Ser Gly Glu Ile Asn Glu Leu Glu Gly Asn Leu Ser Met Asn Trp Asp Tyr Ser Asp Pro Asn Ala Glu Phe Tyr Vai Tyr Lys Glu Leu Glu Glu Gln Gly Glu Tyr Leu Tyr Glu Phe Vai Gly Lys Thr Arg Glu Lys Ser Tyr Thr Ile Glu Asn Phe Thr Lys Gln Glu Phe Asp Lys Phe Ser Gly lie Ala Ile Asn Vai Tyr Ala Asn Gly Lys Glu Ser Gly Leu Vai Vai Leu Lys Lys Glu Asn Ile Lys Leu Ile Asp Leu Glu Ser Vai Asp Ser Ile Ser Ala Thr Tyr Asn Vai Asp Thr Asn Glu Leu Lys Leu Asp Trp Asn Tyr Thr Asn Ser Ser Vai Thr Phe Glu Vai Leu Lys Lys Gly Ile Asn Ser Asn Glu Tyr Glu Ile Ile Ser Gln Leu Thr Gln Asn Ser Phe Ser Thr Glu Phe Thr Gly Arg Gln Phe Trp Asp Leu Glu Lys Ile Ala Ile Arg Vai Vai Ala Asn Gly Phe Glu Ser Lys Ile Asn Glu Ile Ser Arg Asp Asp Ile Thr Ile Thr Ser Leu Asn Leu Pro Leu Thr Ser Ser Thr Met Tyr Thr Leu Phe Ile Arg Ser Tyr Phe Asp Thr Asp Gly Asp Gly Vai Gly Asp Phe Ser Gly Vai Ala Glu Lys Va, Asp Tyr Leu Lys Ser Leu Gly Vai Asp Thr Vai Trp Phe Leu Pro Phe Asn Lys Ser Lys Ser Tyr His Gly Tyr Asp Vai Glu Asp Tyr Tyr Asp Vai Glu Pro Asp Tyr Gly Thr Leu Gln Asp Leu Asp Asn Met Ile Lys Vai Leu Asn Glu Asn Gly Ile Lys Vai Vai Met Asp Leu Vai Vai Asn His Thr Ser Asp Thr His Pro Trp Phe Leu Asp Ala Vai Glu Asn Thr Thr Asn Ser Pro Tyr Trp Asn Tyr Tyr Ile Met Ser Leu Asp Glu Pro Gln Asn Lys Asn His Trp His Tyr Lys Vai Asn Ser Lys Gly Gln Thr Vai Tip Tyr Phe Gly Leu Phe Asp Ser Ser Met Pro Asp Leu Asn Tyr Asp Asn Pro Lys Vai Met Asp Glu Vai Lys Lys Ile Ile Asp Phe Trp Ala Asp Met Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Lys His Tyr Tyr Gly Phe Asp Trp Ser Asp Gly Ile Glu Gln Ser Ala Ser Vai Ala Lys Glu Ile Glu Asp Tyr Ile Lys Asp Lys Leu Gly Glu Asn Ala Ile Vai Vai Ser Glu Vai
    Figure 16 (cont.)
  60. 63/116
    Tyr Asp Gly Asp Ser Asn Vai Leu Leu Lys Phe Ala Pro Met Pro Vai Phe Asn Phe Ser Phe Met Tyr Asn Leu Arg Gly Asn Phe Glu Gly Arg Asp Asn Leu Ile Ser Asp Ser Ile Ser Trp Vai Asp Ser Ser Leu Tyr Asn Leu Asn Vai Phe His Phe Pro Phe Ile Asp Ser His Asp Leu Asp Arg Phe Ile Ser Glu Leu Vai Asp Ser Lys Tyr Gin Gly Asp Vai Ile Ser Ala Thr Lys Gin Tyr Leu Leu Vai Asn Ala Leu Leu Leu Ser Leu Thr Gly Met Pro Thr He Tyr Tyr Gly Asp Glu Ile Gly Leu Arg Gly Trp Lys Trp His Ser Glu Pro Trp Asp Ile Pro Vai Arg Glu Pro Met Gin Trp Tyr Lys Asp Gin Lys Gly Asn Gly Gin Thr Tyr Trp Thr Lys Glu Phe Tyr Glu Gly Ile Thr Glu Gly Ser Ala Asn Glu Asp Gly Ala Ile Tyr Asp Asp Pro Asp Asp Gly Vai Ser Vai Glu Glu Gin Glu Asn Gly Tyr Ser Ile Leu Asn Phe Phe Lys Glu Phe Ile Asn Leu Arg Lys Asp Tyr Pro Ala Leu Ala Phe Gly Ser Thr Thr Ile Glu Arg Asp Trp Lys Asn Leu Tyr Vai Leu Lys Lys Ser Tyr Asn Phe Gin Asp Vai Leu Vai Leu Ile Asn Leu Asp Pro Thr Tyr Ser Asn Thr Tyr Glu Vai Pro Glu Gly Tyr Lys Trp Vai Trp Tyr Ala Phe Phe Asp Gly Asp Asn Tyr Glu Phe Gly Ala Lys Asp Glu Met Ile Leu Gin Asn Thr Ser Trp Thr Ile Asn Pro Arg Gin Ile Tyr He Phe Vai Lys
    SEQ ID NO: 99 atgtacacactcttcatccgctctttttacgatacaaacaacgacggtgtaggtgactacaacggtgttgcccaaaaagtagactatctcaaaacg cttggagtggatacagtttggttcttgccgttcaacaaagcaaaatcgtaccacggttacgatgttgaagactactacgatgtagaacctgactatg gaacatacgcacaacttgaaaatatgataaagacactcaatcagaacggaattcgtgttgttatggacttggttgtgaaccacacttccgatacac actcgtggtttctggatgccgttgagaacacaacgaattcgaaatattggagctactacataatgacacttgaaaatagagacggttggaatcact ggcattggaagataaactcaaaagggcaaaaagtttactacttcggactgtttgactcatcaatgcccgatttgaatttcgacaatccacaagtgat gaacgaaatcaagagaataatcgatttctggataacagttggtgtggatggtttcagacttgatgcaccaaagcactacaaaggctgggattggg acgacggcatttcaggttcagcagcaatcgcgagggaaatagaaagttacatcaggagcaagttaggaaacgatgcgatagttgtcggggaa gtgtacgatggaaatccatcggttctttcacaatttgcaccgatgccggcgttcaacttcacattcatgtatggaataacaggcaaccatgagggg aaagataacctgctgggagaaacaatttcatgggttaatggagcgagttattatctcaacgtaaaacatttcccgttcatagacaatcacgatttga acagatggatatcgatacttatcgaccaaaagtatagtggaaacacacaagttggtacgaagcagtatattttaacaaatgcgctcttgctttcctta aacggtatgcctgttatttattatgggaatgaaataggcttgagaggatggaaatggggacaagacccgtgggatttgccggtgagagagccga tgcagtggtacgcaagtcaaagtggagctgggcagacatggtggacaaagcctgtctaccagcaaaaaggaatcacatttggaaatgcaaac gtcgatggtgcgatgtacgatgatccaaatgatggggtttcagtagaagagcagatgaatggttacacgataaataacttctttaaacaattcataa ccctgaggaagacatatccggctctatcgaaaggttcgataacgatagaacgcgactggaagaacctgtacgttatcaaacgagtctacggaa atcaggaagtgcttgtattgataaacttagacccaacttggccgaacaattacacgttaccaggtggatacaggtgggtctggtatgcgttctttaa tgggagtttgtttgaatttggcaataaaaacgaatcaccactgagccaagataccaactggacagtcaatccaaggcaagtgtatgtgtttgtgaa ggactaa
    SEQIDNO: 100
    Met Tyr Thr Leu Phe Ile Arg Ser Phe Tyr Asp Thr Asn Asn Asp Gly Vai Gly Asp Tyr Asn Gly Vai Ala Gin Lys Vai Asp Tyr Leu Lys Thr Leu Gly Vai Asp Thr Vai Trp Phe Leu Pro Phe Asn Lys Ala Lys Ser Tyr His Gly Tyr Asp Vai Glu Asp Tyr Tyr Asp Vai Glu Pro Asp Tyr Gly Thr Tyr Ala Gin Leu Glu Asn Met Ile Lys Thr Leu Asn Gin Asn Gly Ile Arg Vai Vai Met Asp Leu Vai Vai Asn His Thr Ser Asp Thr His Ser Trp Phe Leu Asp Ala Vai Glu Asn Thr Thr Asn Ser Lys Tyr Trp Ser Tyr Tyr Ile Met Thr Leu Glu Asn Arg Asp Gly Trp Asn His Trp His Trp Lys Ile Asn Ser Lys Gly Gin Lys Vai Tyr Tyr Phe Gly Leu Phe Asp Ser Ser Met Pro Asp Leu Asn Phe Asp Asn Pro Gin Vai Met Asn Glu Ile Lys Arg Ile Ile Asp Phe Trp Ile Thr Vai Gly Vai Asp Gly Phe Arg Leu Asp Ala Pro Lys His Tyr Lys Gly Trp Asp Trp Asp Asp Gly Ile Ser Gly Ser Ala Ala Ile Ala Arg Glu Ile Glu Ser Tyr Ile Arg Ser Lys Leu Gly Asn Asp Ala Ile Vai Vai Gly Glu Vai Tyr Asp Gly Asn Pro Ser Vai Leu Ser Gin Phe Ala Pro Met Pro Ala Phe Asn Phe Thr Phe Met Tyr Gly Ile Thr Gly Asn His Glu Gly Lys Asp Asn Leu Leu Gly Glu Thr Ile Ser Trp Vai Asn Gly Ala Ser Tyr Tyr Leu Asn Vai Lys His Phe Pro Phe Ile Asp Asn His Asp Leu Asn Arg Trp Ile Ser Ile Leu Ile Asp Gin Lys Tyr Ser Gly Asn Thr Gin Vai Gly Thr Lys Gin Tyr Ile Leu Thr Asn Ala Leu Leu Leu Ser Leu Asn Gly Met Pro Vai Ile Tyr Tyr Gly Asn Glu Ile Gly Leu Arg Gly Trp Lys Trp Gly Gin Asp Pro Trp Asp Leu •Pro Vai Arg Glu Pro Met Gin Trp Tyr Ala Ser Gin Ser Gly Ala Gly Gin Thr Trp Trp Thr Lys Pro <:
    • · ·
    Fig> 16(cont.)
  61. 64/116
    Vai Tyr Gin Gin Lys Gly Ile Thr Phe Gly Asn Ala Asn Vai Asp Gly Ala Met Tyr Asp Asp Pro Asn Asp Gly Vai Ser Vai Glu Glu Gin Met Asn Gly Tyr Thr Ile Asn Asn Phe Phe Lys Gin Phe Ile Thr Leu Arg Lys Thr Tyr Pro Ala Leu Ser Lys Gly Ser Ile Thr Ile Glu Arg Asp Trp Lys Asn Leu Tyr Vai Ile Lys Arg Vai Tyr Gly Asn Gin Glu Vai Leu Vai Leu Ile Asn Leu Asp Pro Thr Trp Pro Asn Asn Tyr Thr Leu Pro Gly Gly Tyr Arg Trp Vai Trp Tyr Ala Phe Phe Asn Gly Ser Leu Phe Glu Phe Gly Asn Lys Asn Glu Ser Pro Leu Ser Gin Asp Thr Asn Trp Thr Vai Asn Pro Arg Gin Vai Tyr Vai Phe Vai Lys Asp
    SEQIDNO: 101 ttgcgattctttccaaagttaatatccccttttccgcaaaacaccagagagtggcagcgaagcgcagtatcaagagacactgaacaattacaaag gaaagtaataatgatcaatttgaaaaaaaacaccattagcgccctggtcgcaggtatggtattaggctttgcatccaacgcaatggcggttcctag aaccgcttttgtacacctctttgaatggaaatgggaagatgttgcacaggagtgtgaaacatttctcggacctaaaggctttgccgcagtgcaagt ctctccgccaactaaatctcacaacacggatgcatggtggggccgttatcaacccgttagttatgcttttgaaggacgcagcggtaatcgcagcc aatttaaaaatatggtgcaacgttgtaaagctgtaggcgtcgatatatacgtagatgcagtgattaaccacatggcagcctacgacagaaatttcc ctgatgtaccctatagcagtaatgactttaactcctgtacaggagatattgactataataaccgttggcaaacacagcattgtgatttagtcggtctta atgatctaaaaacaggatctgactacgtccgccaaaaaatagcggattatatgaacgacgcaatcagtatgggtgtagctggtttccgtattgatg cagccaaacatataccagcaggtgatatagctgccattaaaggtaaattaaatggtaatccatacatcttccaagaggtaattggtgcatccggcg aacctgttcgaccgactgaatacacctttatcggtggtgtcacggaatttcaatttgctcgaaaattgggtccagccttccgcaatagtaatattgctt ggttaaaagacattggcagtcaaatggaattatccagtgctgatgccgtaacatttgtaacgaatcatgatgaagagcgtcataacccgaatggtc ctatttggcacggcgttcaaggtaatggttatgcattagcaaatattttcaccttagcttacccttacggctatccaaaaatcatgtcaggatacttctt ccacggtgactttaacgcagctccaccaagcagtggtatacacacaggaaatgcgtgtggttttgatggcggagactgggtatgcgaacacaa atggcgcggtattgctaacatggttgccttccgcaactatacagcaagcgaatggcgtatcagtaattggtggcaaaacagtaacgaccaaattg cttttggtcgcggtggtttaggttttgttgttattaataaacgtgctaatggtagcattaatcaaagttttgatacgggaatgcctgatggccaatactgt aacataatagaagctaactttgatgaaagcaccggccaatgtagtgcagctacagattccaacggtcaagccgttattaccgtcagtggtgggca agctaactttaatgtagcaggcgatcatgctgctgcaattcatgttggcgcaaaaattggtgatcaatgtagtggtgatgattgcccatgtacagga tccgattgtaataatgatcctaaacctgattttgcagtaccagcaacatcaatttgtacatcagaaaatttacctacgctatattactggggagcaca gcctacagatagcttagcgaatgcagcttggccaggtgtcgcaatgcaaacaaatggcgactttaagtgtcatgatttaggtgtcgaactaacca aaattaacgccatctttagtgacaatggtgcaaataaaacagctgatctaactgttactggtgcaggttgttataaagacgggacttggagcacctt acaaaattgtggctttgaaattaccggtgcacaaaccaatccagtcggtggcgacgaagtctggtacttccgaggtactgctaatgactggggta aagcacaattagattatgacgcaactagcggtttgtattacacaatacaaagctttaatggtgaagaagcacctgcgcgttttaaaattgataatggt agttggactgaagcttatccaacagctgattaccaagttacagataacaattcataccgcattaactttaatagcgatagcaaagcgattacagtaa acgcacaataa
    SEQIDNO: 102
    Met Arg Phe Phe Pro Lys Leu Ile Ser Pro Phe Pro Gin Asn Thr Arg Glu Trp Gin Arg Ser Ala Vai Ser Arg Asp Thr Glu Gin Leu Gin Arg Lys Vai Ile Met Ile Asn Leu Lys Lys Asn Thr Ile Ser Ala Leu Vai Ala Gly Met Vai Leu Gly Phe Ala Ser Asn Ala Met Ala Vai Pro Arg Thr Ala Phe Vai His Leu Phe Glu Trp Lys Trp Glu Asp Vai Ala Gin Glu Cys Glu Thr Phe .Leu Gly Pro Lys Gly Phe Ala Ala Vai Gin Vai Ser Pro Pro Thr Lys Ser His Asn Thr Asp Ala Trp Trp Gly Arg Tyr Gin Pro Vai Ser Tyr Ala Phe Glu Gly Arg Ser Gly Asn Arg Ser Gin Phe Lys Asn Met Vai Gin Arg Cys Lys Ala Vai Gly Vai Asp Ile Tyr Vai Asp Ala Vai Ile Asn His Met Ala Ala Tyr Asp Arg Asn Phe Pro Asp Vai Pro Tyr Ser Ser Asn Asp Phe Asn Ser Cys Thr Gly Asp Ile Asp Tyr Asn Asn Arg Trp Gin Thr Gin His Cys Asp Leu Vai Gly Leu Asn Asp Leu Lys Thr Gly Ser Asp Tyr Vai Arg Gin Lys Ile Ala Asp Tyr Met Asn Asp Ala Ile Ser Met Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys His Ile Pro Ala Gly Asp Ile Ala Ala Ile Lys Gly Lys Leu Asn Gly Asn Pro Tyr Ile Phe Gin Glu Vai Ile Gly Ala Ser Gly Glu Pro Vai Arg Pro Thr Glu Tyr Thr Phe Ile Gly Gly Vai Thr Glu Phe Gin Phe Ala Arg Lys Leu Gly Pro Ala Phe Arg Asn Ser Asn Ile Ala Trp Leu Lys Asp Ile Gly Ser Gin Met Glu Leu Ser Ser Ala Asp Ala Vai Thr Phe Vai Thr Asn His Asp Glu Glu Arg His Asn Pro Asn Gly Pro Ile Trp His Gly Vai Gin Gly Asn Gly Tyr Ala Leu Ala Asn Ile Phe Thr Leu Ala Tyr Pro Tyr Gly Tyr Pro Lys Ile Met Ser Gly Tyr Phe Phe His Gly Asp Phe Asn Ala Ala Pro Pro Ser Ser Gly Ile His Thr ι
    (····♦ ♦ ι · ·
    7f)
    Fig 16 (cont.) 03/110
    Gly Asn Ala Cys Gly Phe Asp Gly Gly Asp Trp Vai Cys Glu His Lys Tip Arg Gly He Ala Asn Met Vai Ala Phe Arg Asn Tyr Thr Ala Ser Glu Tip Arg Ile Ser Asn Trp Trp Gin Asn Ser Asn Asp Gin Ile Ala Phe Gly Arg Gly Gly Leu Gly Phe Vai Vai He Asn Lys Arg Ala Asn Gly Ser Ile Asn Gin Ser Phe Asp Thr Gly Met Pro Asp Gly Gin Tyr Cys Asn Ile Ile Glu Ala Asn Phe Asp Glu Ser Thr Gly Gin Cys Ser Ala Ala Thr Asp Ser Asn Gly Gin Ala Vai He Thr Vai Ser Gly Gly Gin Ala Asn Phe Asn Vai Ala Gly Asp His Ala Ala Ala He His Vai Gly Ala Lys Ile Gly Asp Gin Cys Ser Gly Asp Asp Cys Pro Cys Thr Gly Ser Asp Cys Asn Asn Asp Pro Lys Pro Asp Phe Ala Vai Pro Ala Thr Ser Ile Cys Thr Ser Glu Asn Leu Pro Thr Leu Tyr Tyr Trp Gly Ala Gin Pro Thr Asp Ser Leu Ala Asn Ala Ala Trp Pro Gly Vai Ala Met Gin Thr Asn Gly Asp Phe Lys Cys His Asp Leu Gly Vai Glu Leu Thr Lys Ile Asn Ala Ile Phe Ser Asp Asn Gly Ala Asn Lys Thr Ala Asp Leu Thr Vai Thr Gly Ala Gly Cys Tyr Lys Asp Gly Thr Trp Ser Thr Leu Gin Asn Cys Gly Phe Glu Ile Thr Gly Ala Gin Thr Asn Pro Vai Gly Gly Asp Glu Vai Trp Tyr Phe Arg Gly Thr Ala Asn Asp Trp Gly Lys Ala Gin Leu Asp Tyr Asp Ala Thr Ser Gly Leu Tyr Tyr Thr Ile Gin Ser Phe Asn Gly Glu Glu Ala Pro Ala Arg Phe Lys Ile Asp Asn Gly Ser Trp Thr Glu Ala TyT Pro Thr Ala Asp Tyr Gin Vai Thr Asp Asn Asn Ser TyT Arg Ile Asn Phe Asn Ser Asp Ser Lys Ala Ile Thr Vai Asn Ala Gin SEQ IDNO: 103 gtgctaacgtttcaccgcatcattcgaaaaggatggatgttcctgctcgcgtttttgctcactgcctcgctgttctgcccaacaggacagcccgcca aggctgccgcaccgtttaacggcaccatgatgcagtattttgaatggtacttgccggatgatggcacgttatggaccaaagtggccaatgaagc caacaacttatccagccttggcatcaccgctctttggctgccgcccgcttacaaaggaacaagccgcagcgacgtagggtacggagtatacga cttgtatgacctcggcgaattcaatcaaaaagggaccgtccgcacaaaatacggaacaaaagctcaatatcttcaagccattcaagccgcccac gccgctggaatgcaagtgtacgccgatgtcgtgttcgaccataaaggcggcgccgacggcacggaatgggtggacgccgtcgaagtcaatc cgtccgaccgcaaccaagaaatctcgggcacctatcaaatccaagcatggacgaaatttgattttcccgggcggggcaacacctactccagctt taagtggcgctggtaccattttgacggcgttgattgggacgaaagccgaaaattgagccgcatttacaaattccgcggcatcggcaaagcgtgg gattgggaagtagacacggaaaacggaaactatgactacttaatgtatgccgaccttgatatggatcatcccgaagtcgtgaccgagctgaaaa actggggggaatggtatgtcaacacaacgaacattgatgggttccggcttgatgccgtcaagcatattaagttcagtttttttcctgattggttgtcgt atgtgcgttctcagactggcaagccgctatttaccgtcggggaatattggagctatgacatcaacaagttgcacaattacattacgaaaacaaacg gaacgatgtctttgtttgatgccccgttacacaacaaattttataccgcttccaaatcagggggcgcatttgatatgcgcacgttaatgaccaatact ctcatgaaagatcaaccgacattggccgtcaccttcgttgataatcatgacaccgaacccggccaagcgctgcagtcatgggtcgacccatggt tcaaaccgttggcttacgcctttattctaactcggcaggaaggatacccgtgcgtcttttatggtgactattatggcattccacaatataacattccttc gctgaaaagcaaaatcgatccgctcctcatcgcgcgcagggattatgcttacggaacgcaacatgattatcttgatcactccgacatcatcgggt ggacaagggaaggggtcactgaaaaaccaggatccgggctggccgcactgatcaccgatgggccgggaggaagcaaatggatgtacgttg gcaaacaacacgctggaaaagtgttctatgaccttaccggcaaccggagtgacaccgtcaccatcaacagtgatggatggggggaattcaaa gtcaatggcggttcggtttcggtttgggttcctagaaaaacgaccgtttctaccatcgctcggccgatcacaacccgaccgtggactggtgaattc gtccgttggaccgaaccacggttggtggcatggccttga
    SEQ IDNO: 104
    Vai Leu Thr Phe His Arg Ile Ile Arg Lys Gly Trp Met Phe Leu Leu Ala Phe Leu Leu Thr Ala Ser Leu Phe Cys Pro Thr Gly Gin Pro Ala Lys Ala Ala Ala Pro Phe Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr Leu Pro Asp Asp Gly Thr Leu Trp Thr Lys Vai Ala Asn Glu Ala Asn Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Arg Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin TyT Leu Gin Ala Ile Gin Ala Ala His Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asp His Lys Gly Gly Ala Asp Gly Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu Ile Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Tip Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Glu Trp Tyr Vai Asn Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His He Lys Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Vai Arg Ser Gin Thr Gly Lys Pro Leu Phe Thr Vai Gly * · ·
    66/116
    Fig 16 (cont.)
    Glu Tyr Trp Ser Tyr Asp Ile Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gin Pro Thr Leu Ala Vai Thr Phe Vai Asp Asn His Asp Thr Glu Pro Gly Gin Ala Leu Gin Ser Trp Vai Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Gin Tyr Asn He Pro Ser Leu Lys Ser Lys Ile Asp Pro Leu Leu He Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Vai Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Gin His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr He Asn Ser Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Pro Arg Lys Thr Thr Vai Ser Thr Ile Ala Arg Pro Ile Thr Thr Arg Pro Trp Thr Gly Glu Phe Vai Arg Trp Thr Glu Pro Arg Leu Vai Ala Trp Pro
    SEQIDNO: 105 atgtccctattcaaaaaaatctttccgtggattgtatctctacttcttttgttttcgtttattgctcctttttccattcaaacagaaaaagtccgcgctggaa gtgttccagtgaatggaacgatgatgcaatatttcgaatggtaccttccagacgatggaacactatggacgaaagtagcaaataacgcccaatct ttagcgaatcttggcattactgccctttggcttccccctgcctataaaggaacaagcagcagtgacgttggatatggcgtttatgatttatatgacct aggagagtttaatcaaaaaggaactgtccgaacaaaatacggaacaaaaacacaatatatccaagcaatccaagcggcgcatacagcaggaa tgcaagtatatgcagatgtcgtctttaaccataaagccggtgcagatgggacagaactagtggatgcagtagaagtaaacccttctgaccgcaat caagaaatatcaggaacatatcaaatccaagcgtggacaaaatttgattttcctggtcgtggaaacacctattctagttttaaatggcgttggtatca tttcgatggaacggactgggatgagagtagaaaactaaatcgtatttacaaattccgcggcacgggaaaagcatgggattgggaagtagataca gaaaatgggaattatgactatctcatgtatgcagatttggatatggatcatccagaggttgtatctgaactaaaaaattggggaaagtggtatgtaa ccacaaccaatatcgacggattccgtctggatgcagtgaagcatattaaatatagctttttcccagactggctatcgtatgtacgaacccaaacac aaaagcctctttttgccgttggcgaattttggagctatgacattaacaagctacacaactatattacaaagacgaacggctctatgtccctattcgat gccccgctgcataacaatttttatatagcatcgaaatcaggtggctattttgatatgcgcacattactcaacaacacattgatgaaagatcaaccaa cactatcggtcacattagtagacaatcacgatactgagccagggcaatctttgcagtcgtgggtcgagccgtggtttaaaccgttagcttacgcat ttatcttgacccgccaagaaggttatccgtgcatcttttatggagattactatggtattccaaaatacaacattcctgcgctgaaaagcaaacttgatc cgctgttaattgctcgaagagattatgcctacggaacacagcacgactatattgacaatgcagatattatcggctggacgcgggaaggagtagct gaaaaagcaaattcgggacttgctgcactcattaccgacggacctggcggaagcaaatggatgtatgttggcaaacaacacgctggcaaaac gttttatgatctaaccggcaatcgaagtgatacagtgacaatcaacgctgatggatggggagaatttaaagtcaatggagggtctgtatccatatg ggttccaaaaacatcaaccacttcccaaatcacatttactgtaaataatgccacaaccgtttggggacaaaatgtatacgttgtcgggaatatttcg cagctgggcaac
    SEQIDNO: 106
    Met Ser Leu Phe Lys Lys Ile Phe Pro Trp Ile Vai Ser Leu Leu Leu Leu Phe Ser Phe Ile Ala Pro Phe Ser Ile Gin Thr Glu Lys Vai Arg Ala Gly Ser Vai Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr Leu Pro Asp Asp Gly Thr Leu Trp Thr Lys Vai Ala Asn Asn Ala Gin Ser Leu Ala Asn Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala TyT Lys Gly Thr Ser Ser Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Thr Gin Tyr Ile Gin Ala Ile Gin Ala Ala His Thr Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Gly Thr Glu Leu Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu Ile Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Ser Glu Leu Lys Asn Tip Gly Lys Trp Tyr Vai Thr Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Tip Leu Ser Tyr Vai Arg Thr Gin Thr Gin Lys Pro Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp Ile Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Ile Ala Ser Lys Ser Gly Gly Tyr Phe Asp Met Arg Thr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Thr Leu Ser Vai Thr Leu Vai Asp Asn His Asp Thr • «»
    Glu Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe He Leu Thr Arg Gin Glu Gly Tyr Pro Cys Ile Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Lys Tyr Asn Ile Pro Ala Leu Lys Ser Lys Leu Asp Pro Leu Leu He Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp Tyr Ile Asp Asn Ala Asp Ile Ile Gly Trp Thr Arg Glu Gly Vai Ala Glu Lys Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Gin His Ala Gly Lys Thr Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser He Trp Vai Pro Lys Thr Ser Thr Thr Ser Gin Ile Thr Phe Thr Vai Asn Asn Ala Thr Thr Vai Trp Gly Gin Asn Vai Tyr Vai Vai Gly Asn Ile Ser Gin Leu Gly Asn
    SEQ ID NO: 107 atggacagcctcgacgcgccggagcagaagccctgggtgaaggatggcaggctctccgcgtacctggatacagggacagggaccgtggtc gctcccgaggcacctgcgcccccgccgcccccggccgaggaagtccggcccgtggacaagtggaaaaacgatatcatctatttcgtcctcac cgaccgtttccaggatggcgacaagaccaacaacatggacgtggtcccgacggacatgaaaaaatatcatggcggcgacatccaggggctc atcgacaagctcgactatatcaaggagaccggttcgacggccatctggctcacgccccctatgaaggggcagacccacttcttcgagaccgac aattaccatggttactggcccattgacttctatgacacggacccccatgtgggcaccatgcagaaatttgaggagcttatcgagaaagcccatga gaaagggctgaagatcgtgctcgatattcccctgaaccacacggcctgggagcatcccttctacaaggacgacagcaagaaggactggttcc accatataggagatgtgaaggactgggaagatccctactgggctgaaaacggctccatattcggtcttcctgacctggcgcaggaaaaccctg ccgtggaaaagtacctcatcgacgtggccaagttctgggtagacaagggtattgacggcttcaggcttgacgccgtgaagaacgtgcccctca acttctgggcgaagtttgaccgggcgattcacgattatgcgggcaaggacttcctcctcgtcggggaatactttgacggaaacccggcgaaagt cgcgaactaccagagagaggacatgagctcactcttcgattacccgctctactggaccctgaaggacaccttcgccaaggacgggagcatgc gcaacctggcggcgaagcttgatgagtgcgacaggaattatcccgacccgggcctcatgtcggttttccttgataaccacgacacgccgaggtt cctcaccgaggccaacggcaacaaggataagctcaaactggccctcgccttcgcgatgaccatcaaccgcatgcctaccatttattatggcacc gaggttgccatggaaggcaactgcgatatcatgggcgccgtagataaccggagggacatgcagtgggacaaggatcctgacatgttcaaata cttcaagactctcaccactgcccgcaatgagcatgaatccctcagggaaggaaagaagctcgagatgtggcaggatgacaaagtctacgcgta cgggaggcagaccccgaaggacgagtctatcgtggtgcttaacaacggctatgatacgcaggaacgggacataccgctccgccccgagag cggcatcaagaacggcacggtgctgaaggatgtcatcaccggcgaaaccgtgacggtacagaacggaaaaatccatgcgaaatgcggcgg caaacaggcgcggatctacgtgcccgcgtag
    SEQ ID NO: 108
    Met Asp Ser Leu Asp Ala Pro Glu Gin Lys Pro Trp Vai Lys Asp Gly Arg Leu Ser Ala Tyr Leu Asp Thr Gly Thr Gly Thr Vai Vai Ala Pro Glu Ala Pro Ala Pro Pro Pro Pro Pro Ala Glu Glu Vai Arg Pro Vai Asp Lys Trp Lys Asn Asp Ile Ile Tyr Phe Vai Leu Thr Asp Arg Phe Gin Asp Gly Asp Lys Thr Asn Asn Met Asp Vai Vai Pro Thr Asp Met Lys Lys Tyr His Gly Gly Asp Ile Gin Gly Leu Ile Asp Lys Leu Asp Tyr Ile Lys Glu Thr Gly Ser Thr Ala Ile Trp Leu Thr Pro Pro Met Lys Gly Gin Thr His Phe Phe Glu Thr Asp Asn Tyr His Gly Tyr Trp Pro lie Asp Phe Tyr Asp Thr Asp Pro His Vai Gly Thr Met Gin Lys Phe Glu Glu Leu Ile Glu Lys Ala His Glu Lys Gly Leu Lys Ile Vai Leu Asp Ile Pro Leu Asn His Thr Ala Trp Glu His Pro Phe Tyr Lys Asp Asp Ser Lys Lys Asp Trp Phe His His Ile Gly Asp Vai Lys Asp Trp Glu Asp Pro Tyr Trp Ala Glu Asn Gly Ser Ile Phe Gly Leu Pro Asp Leu Ala Gin Glu Asn IYo Ala Vai Glu Lys Tyr Leu Ile Asp Vai Ala Lys Phe Trp Vai Asp Lys Gly Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys Asn Vai Pro Leu Asn Phe Trp Ala Lys Phe Asp Arg Ala Ile His Asp Tyr Ala Gly Lys Asp Phe Leu Leu Vai Gly Glu Tyr Phe Asp Gly Asn Pro Ala Lys Vai Ala Asn Tyr Gin Arg Glu Asp Met Ser Ser Leu Phe Asp Tyr Pro Leu Tyr Trp Thr Leu Lys Asp Thr Phe Ala Lys Asp Gly Ser Met Arg Asn Leu Ala Ala Lys Leu Asp Glu Cys Asp Arg Asn Tyr Pro Asp Pro Gly Leu Met Ser Vai Phe Leu Asp Asn His Asp Thr Pro Arg Phe Leu Thr Glu Ala Asn Gly Asn Lys Asp Lys Leu Lys Leu Ala Leu Ala Phe Ala Met Thr Ile Asn Arg Met Pro Thr Ile Tyr Tyr Gly Thr Glu Vai Ala Met Glu Gly Asn Cys Asp Ile Met Gly Ala Vai Asp Asn Arg Arg Asp Met Gin Trp Asp Lys Asp Pro Asp Met Phe Lys Tyr Phe Lys Thr Leu Thr Thr Ala Arg Asn Glu His Glu Ser Leu Arg Glu Gly Lys Lys Leu Glu Met Trp Gin Asp Asp Lys Vai Tyr Ala Tyr Gly Arg Gin Thr Pro Lys Asp Glu Ser Ile Vai Vai Leu Asn Asn Gly Tyr Asp Thr Gin Glu Arg Asp Ile tr
    w • « í
    f *
    1 Fig 16 (cont.)
    68/Π6
    Pro Leu Arg Pro Glu Ser Gly He Lys Asn Gly Thr Vai Leu Lys Asp Vai Ile Thr Gly Glu Thr Vai Thr Vai Gin Asn Gly Lys Ile His Ala Lys Cys Gly Gly Lys Gin Ala Arg Ile Tyr Vai Pro Ala
    SEQ IDNO: 109 atggcaagaaaaacgctggccatatttttcgtacttctagtgcttcttagtctctcggcagttccggcaaaggcagaaactctagagaatggtgga gttataatgcaggctttctattgggatgttcctggaggaggaatctggtgggacacaatagctcaaaagatacccgaatgggcaagtgcaggaat ctcagcgatatggattccaccagcgagtaagggcatgagcggtggttattccatgggctacgatccctacgatttctttgacctcggcgagtacta tcagaaggggacagttgagacgcgcttcggctcaaaggaagaactggtgaacatgataaacaccgcacactcctacggcataaaggtgatag cggacatagtcataaaccaccgcgccggtggagaccttgagtggaaccccttcgtgaacgactatacctggacagacttctcaaaagtcgcctc cggtaaatatacggccaactaccttgacttccacccaaacgagcttcactgttgtgatgaaggtacctttggaggataccctgatatatgtcacga caaaagctgggaccagtactggctctgggcgagcagcgaaagctacgctgcctacctcaggagcataggggttgacgcctggcgtttcgact acgtcaagggctacggagcatgggttgttaacgactggctcagctggtggggaggctgggccgttggagagtactgggacacgaacgttgat gcactcctcaactgggcatacagcagcggcgccaaggtctttgacttcccgctctactacaagatggacgaagccttcgacaacaccaacatcc cggcattagtggatgcactcagatacggccagacagtggtcagccgcgatcccttcaaggcggtaactttcgttgccaaccacgatacagatat aatctggaacaagtatccggcttatgcattcatccttacctatgagggacagcctgttatattctaccgcgactacgaggagtggctcaacaagga taagcttaacaacctcatctggatacacgatcaccttgctggagggagtactgacattgtttactacgacagcgacgagcttatctttgtgagaaac ggctatggcaccaaaccaggactgataacctatatcaacctcggctcaagcaaagttggaaggtgggtctacgttccaaagttcgccggttcat gcatccacgagtacaccggcaacctcggcggttggatagacaagtacgtctcctccagcggctgggtctatcttgaggccccagcccacgac ccggcgaacggctactacggctactctgtctggagctactgcggtgtgggttga
    SEQ IDNO: 110
    Met Ala Arg Lys Thr Leu Ala Ile Phe Phe Vai Leu Leu Vai Leu Leu Ser Leu Ser Ala Vai Pro Ala Lys Ala Glu Thr Leu Glu Asn Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Tip Trp Asp Thr Ile Ala Gin Lys Ile Pro Glu Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyi Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu líir Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Cys Cys Asp Glu Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Ser Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Ser Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Thr Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Ile Asp Lys Tyr Vai Ser Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly
    SEQ IDNO: 111 atgcccgcgttcaaatctaaggtgatgcacatgaagttgaagtaccttgctttagttttgttggctgtggcttcgataggcctcctctcgactccagt gggtgctgccaagtactccgaactcgaagagggcggtgttataatgcaggccttctactgggacgtccctaccggtgggatctggtgggacac cataagacagaaaatcccggagtggtacgacgctggaatctcggcgatatggattcctccagctagcaaaggtatgggtggtgcatactccatg ggttatgacccctacgatttctttgacctcggcgagtactatcagaagggaacagttgagacgcgcttcggctcaaaggaggaactggtgaaca tgataaacaccgcacactcctatggcataaaggtgatagcggacatagtcataaaccaccgcgccggcggcgacctggagtggaacccctttg taaacaactatacttggacagacttctccaaggtcgcctccggtaaatacacggccaactaccttgacttccacccaaacgaggtcaagtgctgc gatgagggtacatttggtgactttccggacatcgcccacgagaagagctgggatcagtactggctctgggcaagcaatgagagctacgccgcc
    69/116
    Fig 16 (cont.) tatctccggagcatagggatcgatgcatggcgtttcgactacgtcaaaggttacggagcgtgggttgttaacgactggctcagctggtggggag gttgggccgttggagagtactgggacaccaacgttgatgcactccttaactgggcatacaacagcggtgccaaggtctttgacttcccgctctac tacaagatggacgaagcctttgacaacaccaacatccccgctttggtttacgccctccagaacggaggaacagtcgtttcccgcgatcccttcaa ggcagtaactttcgttgccaaccacgataccgatataatctggaacaagtatccggcttatgcgttcatccttacctatgagggacagcctgttatat tctaccgcgactacgaggagtggctcaacaaggataagcttaacaaccttatctggatacacgagcaccttgccggaggaagtaccaagatcct ctactacgataacgatgagctaatattcatgagggagggctacgggagcaagccgggcctcataacctacataaacctcggaaacgactggg ccgagcgctgggtgaacgtcggctcaaagtttgccggctacacaatccatgaatacacaggcaatctcggtggctgggttgacaggtgggttc agtacgacggatgggttaaactgacggcacctcctcacgatccagccaacggatattacggctactcagtctggagctacgcaggcgtcggat ga
    SEQIDNO: 112
    Met Pro Ala Phe Lys Ser Lys Vai Met His Met Lys Leu Lys Tyr Leu Ala Leu Vai Leu Leu Ala Vai Ala Ser Ile Gly Leu Leu Ser Thr Pro Vai Gly Ala Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Thr Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asn Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Asp Phe Pro Asp He Ala His Glu Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Asn Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Tyr Ala Leu Gin Asn Gly Gly TTir Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Glu His Leu Ala Gly Gly Ser Thr Lys Ile Leu Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Met Arg Glu Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Asn Asp Trp Ala Glu Arg Trp Vai Asn Vai Gly Ser Lys Phe Ala Gly Tyr Thr Ile His Glu Tyr Tiú· Gly Asn Leu Gly Gly Trp Vai Asp Arg Trp Vai Gin Tyr Asp Gly Trp Vai Lys Leu Thr Ala Pro Pro His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Ala Gly Vai Gly
    SEQIDNO: 113 atgaaacaacaaaaacggctttacgcccgattgctgacgctgttatttgcgctcatcttcttgctgcctcattctgcagcagcggcggcaaatctta atgggacgctgatgcagtattttgaatggtacatgcccaatgacggccaacattggaagcgcttgcaaaacgactcggcatatttggctgaacac ggtattactgccgtctggattcccccggcatataagggaacgagccaagcggatgtgggctacggtgcttacgacctttatgatttaggggagttt catcaaaaagggacggttcggacaaagtacggcacaaaaggagagctgcaatctgcgatcaaaagtcttcattcccgcgacattaacgtttacg gggatgtggtcatcaaccacaaaggcggcgctgatgcgaccgaagatgtaaccgcggttgaagtcgatcccgctgaccgcaaccgcgtaatt tcaggagaacaccgaattaaagcctggacacattttcattttccggggcgcggcagcacatacagcgattttaaatggcattggtaccattttgac ggaaccgattgggacgagtcccgaaagctgaaccgcatctataagtttcaaggaaaggcttgggattgggaagtttccaatgaaaacggcaac tatgattatttgatgtatgccgacatcgattatgaccatcctgatgtcgcagcagaaattaagagatggggcacttggtatgccaatgaactgcaatt ggacggtttccgtcttgatgctgtcaaacacattaaattttcttttttgcgggattgggttaatcatgtcagggaaaaaacggggaaggaaatgttta cggtagctgaatattggcagaatgacttgggcgcgctggaaaactatttgaacaaaacaaattttaatcattcagtgtttgacgtgccgcttcattat cagttccatgctgcatcgacacagggaggcggctatgatatgaggaaattgctgaacggtacggtcgtttccaagcatccgttgaaagcggtta catttgtcgataaccatgatacacagccggggcaatcgcttgagtcgactgtccaaacatggtttaagccgcttgcttacgctttcattctcacaag ggaatctggataccctcaggttttctacggggatatgtacgggacgaaaggagactcccagcgcgaaattcctgccttgaaacacaaaattgaa ccgatcttaaaagcgagaaaacagtatgcgtacggagcacagcatgattatttcgaccaccatgacattgtcggctggacaagggaaggcgac agctcggttgcaaattcaggtttggcggcattaataacagacggacccggtggggcaaagcgaatgtatgtcggccggcaaaacgccggtga ··« *·· ···
    Fig 16 (cont.) gacatggcatgacattaccggaaaccgttcggagccggttgtcatcaattcggaaggctggggagagtttcacgtaaacggcgggtcggtttca atttatgttcaaagatag
    SEQ IDNO: 114
    Met Lys Gin Gin Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Asn Leu Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp Tyr Met Pro Asn Asp Gly Gin His Trp Lys Arg Leu Gin Asn Asp Ser Ala Tyr Leu Ala Glu His Gly Ile Thr Ala Vai Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Ala Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe His Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Gly Glu Leu Gin Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Vai Tyr Gly Asp Vai Vai Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp Vai Thr Ala Vai Glu Vai Asp Pro Ala Asp Arg Asn Arg Vai Ile Ser Gly Glu His Arg Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Gin Gly Lys Ala Trp Asp Trp Glu Vai Ser Asn Glu Asn Gly Asn TyT Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Vai Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gin Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His He Lys Phe Ser Phe Leu Arg Asp Trp Vai Asn His Vai Arg Glu Lys Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Tip Gin Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Vai Phe Asp Vai Pro Leu His Tyr Gin Phe His Ala Ala Ser Thr Gin Gly Gly Gly Tyr Asp Met Arg Lys Leu Leu Asn Gly Thr Vai Vai Ser Lys His Pro Leu Lys Ala Vai Thr Phe Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Glu Ser Thr Vai Gin Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Glu Ser Gly Tyr Pro Gin Vai Phe Tyr Gly Asp Met Tyr Gly Thr Lys Gly Asp Ser Gin Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro Ile Leu Lys Ala Arg Lys Gin Tyr Ala Tyr Gly Ala Gin His Asp Tyr Phe Asp His His Asp Ile Vai Gly Trp Thr Arg Glu Gly Asp Ser Ser Vai Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ala Lys Arg Met Tyr Vai Gly Arg Gin Asn Ala Gly Glu Thr Trp His Asp He Thr Gly Asn Arg Ser Glu Pro Vai Vai Ile Asn Ser Glu Gly Trp Gly Glu Phe His Vai Asn Gly Gly Ser Vai Ser Ile Tyr Vai Gin Arg
    SEQID NO: 115 atggcgaagtactccgagctggagcagggcggagtcataatgcaggccttctactgggacgttccggagggaggaatctggtgggacacaat acggcagaagatccctgaatggtacgatgcaggcatatccgccatctggatacccccggcgagcaagggcatgggcggggcctactcgatg ggctacgacccctacgattacttcgatctgggcgagttttaccagaagggaaccgttgagacccgcttcggctccaaggaagagctcgtcaaca tgatctccacggcccaccagtacggcatcaaggttatagcggacatagtgataaaccaccgcgcaggtggagacctcgaatggaacccatac gtcggcgactatacctggacggacttttctaaggtcgcctccgggaaatacaaggcccactacatggacttccatccaaacaactacagcacct cagacgagggaaccttcggtggcttcccagacattgatcacctcgtgcccttcaaccagtactggctgtgggcgagcaacgagagctacgccg cctacctcaggagcatagggatcgatgcgtggcgctttgactacgttaagggctacggcgcgtgggtcgtcaaggactggctgagtcagtggg gcggctgggccgtcggcgagtactgggacaccaacgtcgatgcgctcctcaactgggcctacagcagcggcgccaaggtcttcgacttccc gctctactacaagatggacgaggcctttgacaacaagaacattcccgccctcgtttacgccatccagaacggtgaaaccgtcgtcagcagggat cccttcaaggccgttaccttcgtggctaaccacgatacgaacataatctggaacaagtaccctgcctatgccttcatcctgacctacgaaggtcag cccgtcatcttctaccgcgactacgaggagtggctcaacaaggacaaactcaacaacctcatatggattcacgagcacctggcagggggaag caccaagatcctctactacgacgacgatgagctcatcttcatgagggaaggctacggcgacaggcccgggcttataacctacatcaacctcggt agcgactgggcggagagatgggtgaacgttggctcaaagttcgcgggctatacaatccacgaatacaccggaaacctcggcggctgggtcg acaggtacgtccagtacgacggctgggtcaagcttaccgctccgccacacgatccggcaaacggctattacggctactcggtctggagctacg ccggagttggaagatctcatcaccatcaccatcactaa
    SEQ IDNO: 116
    Met Ala Lys Tyr Ser Glu Leu Glu Gin Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Glu Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly He Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Phe Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met
    Fig 16 (cont.)
    71/116
    Ile Ser Thr Ala His Gin Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Tyr Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Lys Ala His Tyr Met Asp Phe His Pro Asn Asn Tyr Ser Thr Ser Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Asp His Leu Vai Pro Phe Asn Gin Tyr Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Ser Gin Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Tyr Ala Ile Gin Asn Gly Glu Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asn Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Glu His Leu Ala Gly Gly Ser Thr Lys Ile Leu Tyr Tyr Asp Asp Asp Glu Leu Ile Phe Met Arg Glu Gly Tyr Gly Asp Arg Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Asp Trp Ala Glu Arg Trp Vai Asn Vai Gly Ser Lys Phe Ala Gly Tyr Thr Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Arg Tyr Vai Gin Tyr Asp Gly Trp Vai Lys Leu Thr Ala Pro Pro His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Ala Gly Vai Gly Arg Ser His His His His His His
    SEQIDNO: 117 ttgcgagtgttcctggttgtgccaaagctgagccgcccatttcaggcagagtcacaacaacaagacagggacataacaatgaaacacacagcg ggaatgctggcgatcgcaggtatgctgatcgcccccttggcgcatgccgatgtcatactgcacgccttcaactggaaatacagtgaagtcaccg ccaaggccgatctcatcaaggctgccggctacaagcaggtgctcatctcaccgcctctgaagtcctcgggcaacgagtggtgggctcgttacc agccccaggatctgcgcctggtcgacaccccccttggcaacaagcaggatctggagcagctgatcgccgcgatgcagacccggggcattgc cgtctacgcggacgtggtgctcaaccacatggccaacgaaagctggaagcgcagcgacctcaactaccccggcagcgagctgctgcaaag ctacgccggcaatccggcctactttgaacgccagaagctctttggcgatctggggcagaacttcctcgccggccaggattttcatccggagggg tgcatcaccgactggaacaatccgggccatgtccagtactggcgactgtgcggcggggcgggtgacaaggggctgccggatctggacccca acaactgggtggtgaaccagcaacaggcttacctgcaggcgctcaaggggatggggatcaagggttttcgggtcgatgcggtcaagcacatg agcgattaccagatcaacgccgtgttcacccccgagatcaaacaggggatgcacgtctttggcgaggtgatcaccacggggggcgccggca acagcgactatgagaacttcctcaaaccctacctcgacagcagcggccagggggcctacgacttcccgctcttcgcctccctgcgtggagcgc tgggctacggcggcagcatgaacctgctggccgatcccggtgcctatggtcaggcgctgccgggtagccgcgccgtcaccttcgccatcacc cacgacatccccaccaacgacggtttccgctaccagatcctcaaccagaccgacgagagactggcctatgcctacctgctcggtcgcgatggc ggttcgcctctggtctactccgatcacggtgaaaccagggacaaggacggattgcgctggcaggactactatctgcgcaccgatctcaaaggg atgatccgcttccataacacagtgcagggtcaaccgatgcagctcatcggcagtaacgactgcttcgtgctgttcaagcgtggcaagcagggc gtggtcggcatcaacaagtgcgactacgagcaggagtactggctcgataccgccagattcgagatgaactggtatcgcaactaccgggatgtg ctcgaccagaatgccgtggtcaacgtgcagagccagtgggtaaggctgaccatcccggcccgcggcgccagaatgtggctgcaggagtga
    SEQ IDNO: 118
    Met Arg Vai Phe Leu Vai Vai Pro Lys Leu Ser Arg Pro Phe Gin Ala Glu Ser Gin Gin Gin Asp Arg Asp Ile Thr Met Lys His Thr Ala Gly Met Leu Ala Ile Ala Gly Met Leu Ile Ala Pro Leu Ala His Ala Asp Vai Ile Leu His Ala Phe Asn Trp Lys Tyr Ser Glu Vai Thr Ala Lys Ala Asp Leu Ile Lys Ala Ala Gly Tyr Lys Gin Vai Leu Ile Ser Pro Pro Leu Lys Ser Ser Gly Asn Glu Trp Trp Ala Arg Tyr Gin Pro Gin Asp Leu Arg Leu Vai Asp Thr Pro Leu Gly Asn Lys Gin Asp Leu Glu Gin Leu Ile Ala Ala Met Gin Thr Arg Gly Ile Ala Vai Tyr Ala Asp Vai Vai Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Ser Asp Leu Asn Tyr Pro Gly Ser Glu Leu Leu Gin Ser Tyr Ala Gly Asn Pro Ala Tyr Phe Glu Arg Gin Lys Leu Phe Gly Asp Leu Gly Gin Asn Phe Leu Ala Gly Gin Asp Phe His Pro Glu Gly Cys Ile Thr Asp Trp Asn Asn Pro Gly His Vai Gin Tyr Trp Arg Leu Cys Gly Gly Ala Gly Asp Lys Gly Leu Pro Asp Leu Asp Pro Asn Asn Trp Vai Vai Asn Gin Gin Gin Ala Tyr Leu Gin Ala Leu Lys Gly Met Gly Ile Lys Gly Phe Arg Vai Asp Ala Vai Lys His Met Ser Asp Tyr Gin Ile Asn Ala Vai Phe Thr Pro Glu Ile Lys Gin Gly Met His Vai Phe Gly Glu Vai Ile Thr Thr Gly Gly Ala Gly Asn Ser Asp Tyr Glu Asn Phe Leu Lys Pro Tyr Leu Asp Ser Ser Gly Gin Gly Ala Tyr Asp Phe Pro Leu Phe Ala Ser Leu Arg Gly Ala Leu Gly Tyr Gly Gly Ser Met Asn Leu Leu Ala Asp Pro
    Figi 16 (cont.)
    72/116
    Λ’
    Gly Ala Tyr Gly Gin Ala Leu Pro Gly Ser Arg Ala Vai Thr Phe Ala Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Leu Asn Gin Thr Asp Glu Arg Leu Ala Tyr Ala Tyr Leu Leu Gly Arg Asp Gly Gly Ser Pro Leu Vai Tyr Ser Asp His Gly Glu Thr Arg Asp Lys Asp Gly Leu Arg Trp Gin Asp Tyr Tyr Leu Arg Thr Asp Leu Lys Gly Met Ile Arg Phe His Asn Thr Vai Gin Gly Gin Pro Met Gin Leu Ile Gly Ser Asn Asp Cys Phe Vai Leu Phe Lys Arg Gly Lys Gin Gly Vai Vai Gly Ile Asn Lys Cys Asp Tyr Glu Gin Glu Tyr Trp Leu Asp Thr Ala Arg Phe Glu Met Asn Tip Tyr Arg Asn Tyr Arg Asp Vai Leu Asp Gin Asn Ala Vai Vai Asn Vai Gin Ser Gin Trp Vai Arg Leu Thr Ile Pro Ala Arg Gly Ala Arg Met Trp Leu Gin Glu
    SEQIDNO: 119 atgcaaacgtttgcattcttattttactcaaagaaaggatgggtgtgcatgaattatttgaaaaaagtgtggttgtattacgctatcgtcgctaccttaa tcatttcctttcttacacctttttcaacagcacaagctaatactgcacctgttaacggaacaatgatgcaatatttcgaatgggacttacctaatgatgg gacgctttggacgaaagtaaaaaatgaagctaccaâtctttcttcactaggtatcacagcactatggctccctccagcatataaaggaacgagcc aaagcgatgtcggatacggtgtttacgatttatatgaccttggggaatttaatcaaaaagggacgatccgaacgaaatacggaacaaaaacaca atatattcaagccattcaaactgcccaagccgcagggatgcaagtatatgcggatgttgtatttaatcataaggcaggggctgacagtacagaatt tgtcgatgcagttgaggtaaacccttctaatcgaaatcaagaaacatctggcacatatcaaattcaagcatggacaaaatttgattttcctggtcgtg gaaacacatactccagcttcaaatggcgctggtaccattttgatggtacggattgggacgaaagtcgtaaattaaatcgtatttacaaattccgcgg tacaggaaaagcgtgggactgggaagtcgatacagaaaacggaaactatgattatttaatgttcgctgatttagatatggatcaccctgaggttgt gacagaattaaaaaactggggaacgtggtacgtcaatactacaaatatcgatggattccgcttagatgccgtaaaacatattaaatacagctttttc cctgactggctaacatatgtacgtaatcaaacaggaaaaaatttatttgccgttggggaattttggagctatgacgtcaataagctgcataattacat tacaaaaacaaatgggtcgatgtcattatttgatgcacccttgcataacaacttttataccgcttccaaatcgagtggatattttgacatgcgttatttat tgaataatacattaatgaaagatcaaccttcactcgctgtaacacttgtcgataaccacgacacgcaaccagggcaatctttacagtcatgggtcg aaccttggtttaaacagcttgcttacgcctttattttaacaagacaagaagggtatccttgcgtattttacggtgattattatggaatccctaaatacaat atcccggggttaaaaagtaaaatcgacccgcttttaattgctcgtcgtgattacgcttatggaacacaacgtgattacattgatcatcaagacattat cggatggacacgagaaggcattgatgcaaaaccgaactctggactggcggctttaattaccgacggtcctggtggaagtaaatggatgtatgtc ggtaaaaagcatgccgggaaagtattttatgatttaactggaaatcgaagtgacacagtaacgattaatgcggatggttggggagaatttaaagta aacggaggatccgtctcaatttgggtggctaaaacgtcaaacgtcacatttacagtcaataacgccacaacaacaagcggacaaaacgtatatg ttgtcggcaacattccagagctaggcaattgtcgcacgggttaa
    SEQID NO: 120
    Met Gin Thr Phe Ala Phe Leu Phe Tyr Ser Lys Lys Gly Trp Vai Cys Met Asn Tyr Leu Lys Lys Vai Tip Leu Tyr Tyr Ala Ile Vai Ala Thr Leu Ile Ile Ser Phe Leu Thr Pro Phe Ser Thr Ala Gin Ala Asn Thr Ala Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Vai Lys Asn Glu Ala Thr Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Gin Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Thr Gin Tyr Ile Gin Ala Ile Gin Thr Ala Gin Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Ser Thr Glu Phe Vai Asp Ala Vai Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Tip Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Thr Trp Tyr Vai Asn Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr Tyr Vai Arg Asn Gin Thr Gly Lys Asn Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp Vai Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Thr Ala Ser Lys Ser Ser Gly Tyr Phe Asp Met Arg TyT Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Vai Thr Leu Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Pro Trp Phe Lys Gin Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Lys Tyr Asn Ile Pro Gly Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp Ile Ile Gly Trp Thr ·*··*· · li · · · ·
    Fig 16 (cont.)
    73/116
    Arg Glu Gly Ile Asp Ala Lys Pro Asn Ser Gly Leu Ala Ala Leu He Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Lys His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Ile Trp Vai Ala Lys Thr Ser Asn Vai Thr Phe Thr Vai Asn Asn Ala Thr Thr Tiú· Ser Gly Gin Asn Vai Tyr Vai Vai Gly Asn Ile Pro Glu Leu Gly Asn Cys Arg Thr Gly
    SEQIDNO: 121 atgctcgccctgtcgctcggcggctgcggcatcgacgcgggcccgacaggccctcgcgtcgtggagccgctgccgcagcgccccacgcttc cgcaggagtaccgcgccagcggccacgcggccgccggcgacgtgttcgtgcacctgttcgagtggaagtggccggacatcgcggaggaat gcgagaacgtgctggggccggcgggctacgaggcggtgcaggtgtcgccgccgcaggagcacctggtgcagcagggggcgccgtggtg gcagcggtaccagccggtgagctactcggtggcgctgagccgcagcggcacgggcgtggagttcagcaacatgatcagccggtgcaaggc cgccggcgtggacatctacgtggacgccgtcatcaaccacatgacggccggtgcggggacggggagcaacggcaccgcctacaccaagta caactaccccggcctgtacgcgcaggcggactttcacccgcagtgcgcggtgggcgactacaccagcgccgccaacgtgcaggactgcga actgctggggctggctgacctgaacaccggcgcggccggcgtgcagcagaagatcgcggactacctggtctcgctggcgcggctgggcgt ggcgggttttcgcatcgacgccgccaagcacatccagccggtggaactggacgocatcgtggaccgcgtgaaccagacgctggcggcgga ggggcgcccgcttccctactggttcgccgaggtgatcgacaacggcggcgagggggtgcggcgcgagcactactacggcctgggatacgg caccggcggcgccgcggacatcacggagttccgctacaagggcgtgggcgacaagttcctgggcagcggcggccagcggctggtggacc tgaagaacttctcggcggtgacgtggaacctgatgccgtcggacaaggccgtcgtctttctggagaaccacgatacgcagcgcggcggcggc atcggctaccgcgatggcacggcgttccggctggccaacgtgtggatgctggcgcagccgtacggctatccgtcggtgatgtccagctacgc ctttgaccgcacctccccctttggccgcgacgccggcccgccctccgaggacggcgcgacgaaggacgtgacgtgcgcgcccacgctgga gacggcggtgctgggcacctgggtgtgcgagcaccgcgaccccgtcattcagcggatggtgggctttcgccgcgcgatggcgggcacgga cctgaaccgctggtgggacaacggcggcaacgccattgccttttcgcgcggggaccggggcttcgtcgccatcagccgcgagccgaaggtg accatggcggccgtgcccagcggactgtcccccggcacctactgcgacgtgctgaccggcggcaaggtgggcaacgcctgcgcgggaac cagcgtgacggtcgactctcagggcgtggtgcagctgagcatcgtcgagaactcggctctggtgatccacctcggggccaagctgtaacggc gcgctggcggatgtgcggaggg
    SEQ ID NO: 122
    Met Leu Ala Leu Ser Leu Gly Gly Cys Gly He Asp Ala Gly Pro Thr Gly Pro Arg Vai Vai Glu Pro Leu Pro Gin Arg Pro Thr Leu Pro Gin Glu Tyr Arg Ala Ser Gly His Ala Ala Ala Gly Asp Vai Phe Vai His Leu Phe Glu Trp Lys Trp Pro Asp Ile Ala Glu Glu Cys Glu Asn Vai Leu Gly Pro Ala Gly Tyr Glu Ala Vai Gin Vai Ser Pro Pro Gin Glu His Leu Vai Gin Gin Gly Ala Pro Trp Tip Gin Arg Tyr Gin Pro Vai Ser Tyr Ser Vai Ala Leu Ser Arg Ser Gly Thr Gly Vai Glu Phe Ser Asn Met Ile Ser Arg Cys Lys Ala Ala Gly Vai Asp Ile Tyr Vai Asp Ala Vai Ile Asn His Met Thr Ala Gly Ala Gly Thr Gly Ser Asn Gly Thr Ala Tyr Thr Lys Tyr Asn Tyr Pro Gly Leu Tyr Ala Gin Ala Asp Phe His Pro Gin Cys Ala Vai Gly Asp Tyr Thr Ser Ala Ala Asn Vai Gin Asp Cys Glu Leu Leu Gly Leu Ala Asp Leu Asn Thr Gly Ala Ala Gly Vai Gin Gin Lys Ile Ala Asp Tyr Leu Vai Ser Leu Ala Arg Leu Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys His Ile Gin Pro Vai Glu Leu Asp Ala Ile Vai Asp Arg Vai Asn Gin Thr Leu Ala Ala Glu Gly Arg Pro Leu Pro Tyr Trp Phe Ala Glu Vai Ile Asp Asn Gly Gly Glu Gly Vai Arg Arg Glu His Tyr Tyr Gly Leu Gly Tyr Gly Thr Gly Gly Ala Ala Asp Ile Thr Glu Phe Arg Tyr Lys Gly Vai Gly Asp Lys Phe Leu Gly Ser Gly Gly Gin Arg Leu Vai Asp Leu Lys Asn Phe Ser Ala Vai Thr Tip Asn Leu Met Pro Ser Asp Lys Ala Vai Vai Phe Leu Glu Asn His Asp Thr Gin Arg Gly Gly Gly Ile Gly Tyr Arg Asp Gly Thr Ala Phe Arg Leu Ala Asn Vai Trp Met Leu Ala Gin Pro Tyr Gly Tyr Pro Ser Vai Met Ser Ser Tyr Ala Phe Asp Arg Thr Ser Pro Phe Gly Arg Asp Ala Gly Pro Pro Ser Glu Asp Gly Ala Thr Lys Asp Vai Thr Cys Ala Pro Thr Leu Glu Thr Ala Vai Leu Gly Thr Trp Vai Cys Glu His Arg Asp Pro Vai Ile Gin Arg Met Vai Gly Phe Arg Arg Ala Met Ala Gly Thr Asp Leu Asn Arg Trp Trp Asp Asn Gly Gly Asn Ala Ile Ala Phe Ser Arg Gly Asp Arg Gly Phe Vai Ala Ile Ser Arg Glu Pro Lys Vai Thr Met Ala Ala Vai Pro Ser Gly Leu Ser Pro Gly Thr Tyr Cys Asp Vai Leu Thr Gly Gly Lys Vai Gly Asn Ala Cys Ala Gly Thr Ser Vai Thr Vai Asp Ser Gin Gly Vai Vai Gin Leu Ser Ile Vai Glu Asn Ser Ala Leu Vai Ile His Leu Gly Ala Lys Leu Arg Arg Ala Gly Gly Cys Ala Glu
    1 1
    V,
    Fig 16 (cont.)
    74/116
    SEQID NO: 123 atgccccaggccattcgcactttttcacgttggacgttgttcggcttaatcggcgtttttctgcttggtctcgtcttttctgtcccaccccgggcaatcc aggcccagacaaccccggcccgtaccgttatggttcacctcttcgagtggaaatggaccgacatcgctaaagaatgcgagaatttcctcggac cgaaaggctttgccgcaatccaggtatcgccgccccaggagcatgtccaggggtcgcaatggtggacccgctatcagccggtcagctacaag atcgagagccgctccggcacccgggccgagttcgccaatatggtctcgcgctgcaaagccgtcggggtcgatatctatgtcgatgccgtgatc aaccatatgacgactgtcggctccggcactggtatggctggatcgacctacaccagctacacctatccggggctgtatcagacccaggacttcc accactgcgggcgcaatggcaacgatgatatcagcagctacggcgatcgctgggaagtacaaaactgcgaactgctcaacctagccgacctc aacaccggcgctgagtatgtccggggtaaactcgccgcctatatgaacgatctgcgcggcctgggcgtcgccggatttcggatcgatgccgcc aagcacatggataccaacgacatcaacaatatcgttggccgcctgcccaacgcgccctacatctaccaggaagtgatcgaccagggcggcga gccaattaccgccggcgaatacttccagaatggcgatgtgaccgagttcaagtacagccgcgagatctcgcgcatgttcaaaaccggccagct gacccatatgagccagttcggcactgcctggggcttcatgtccagcgacctggcagtagttttcaccgataaccacgacaaccagcgcggtca cggcggcgccggcgatgtcttgacctacaaagatggccagctgtacaccctgggcaatatcttcgagctagcctggccgtatggctacccaca ggtcatgtcgagctacacgttcagcaacggcgaccaggggccgccatcgaccaatgtgtacgcaaccacaacgcctgattgtggcaacggcc gctgggtctgtgagcaccgctggcgaggaatcgccaacatggtcgcgttccgcaactacaccgccccgaccttcagcaccagcaactggtgg agcaacggcaacaaccagatcgctttcagccgcgggaccctgggctttgtggcgatcaatcgggaaggtggcagcctgaaccgcaccttcca aaccggcctgcccgtcggcacctactgcgatgtcattcacggcgatttcaatgccagcgccggcacctgttccggcccaactatcgctgtcaac ggctccggacaggcaaccatcacggtcaacgcgatggacgcggtggcgatctacggcggagccaggctcgccactccggccagtgtcaac gtgacattcaacgaaaacgccacgaccacctgggggcagaatgtgtatatcgtcggcaacgtcgccgccctgggcagctggaacgcaggca gcgcggtcttactctcctccgctaactacccaatctggagcaagaccatcgccctgccagccaacaccgccattgagtacaagtacatcaaaaa ggatggcgcgggcaatgtggtgtgggaaagcggcgccaaccgcgtctttaccacccccggcagcggcagtgccacgcgcaacgatacctg gaaatag
    SEQ ID NO: 124
    Met Pro Gin Ala Ile Arg Thr Phe Ser Arg Trp Thr Leu Phe Gly Leu Ile Gly Vai Phe Leu Leu Gly Leu Vai Phe Ser Vai Pro Pro Arg Ala Ile Gin Ala Gin Thr Thr Pro Ala Arg Thr Vai Met Vai His Leu Phe Glu Trp Lys Trp Thr Asp Ile Ala Lys Glu Cys Glu Asn Phe Leu Gly Pro Lys Gly Phe Ala Ala Ile Gin Vai Ser Pro Pro Gin Glu His Vai Gin Gly Ser Gin Trp Trp Thr Arg Tyr Gin Pro Vai Ser Tyr Lys Ile Glu Ser Arg Ser Gly Thr Arg Ala Glu Phe Ala Asn Met Vai Ser Arg Cys Lys Ala Vai Gly Vai Asp Ile Tyr Vai Asp Ala Vai Ile Asn His Met Thr Thr Vai Gly Ser Gly Thr Gly Met Ala Gly Ser Thr Tyr Thr Ser Tyr Thr Tyr Pro Gly Leu Tyr Gin Thr Gin Asp Phe His His Cys Gly Arg Asn Gly Asn Asp Asp Ile Ser Ser Tyr Gly Asp Arg Trp Glu Vai Gin Asn Cys Glu Leu Leu Asn Leu Ala Asp Leu Asn Thr Gly Ala Glu Tyr Vai Arg Gly Lys Leu Ala Ala Tyr Met Asn Asp Leu Arg Gly Leu Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys His Met Asp Thr Asn Asp Ile Asn Asn Ile Vai Gly Arg Leu Pro Asn Ala Pro Tyr lie Tyr Gin Glu Vai Ile Asp Gin Gly Gly Glu Pro Ile Thr Ala Gly Glu Tyr Phe Gin Asn Gly Asp Vai Thr Glu Phe Lys Tyr Ser Arg Glu Ile Ser Arg Met Phe Lys Thr Gly Gin Leu Thr His Met Ser Gin Phe Gly Thr Ala Trp Gly Phe Met Ser Ser Asp Leu Ala Vai Vai Phe Thr Asp Asn His Asp Asn Gin Arg Gly His Gly Gly Ala Gly Asp Vai Leu Thr Tyr Lys Asp Gly Gin Leu Tyr Thr Leu Gly Asn Ile Phe Glu Leu Ala Trp Pro Tyr Gly Tyr Pro Gin Vai Met Ser Ser Tyr Thr Phe Ser Asn Gly Asp Gin Gly Pro Pro Ser Thr Asn Vai Tyr Ala Thr Thr Thr Pro Asp Cys Gly Asn Gly Arg Trp Vai Cys Glu His Arg Trp Arg Gly Ile Ala Asn Met Vai Ala Phe Arg Asn Tyr Thr Ala Pro Thr Phe Ser Thr Ser Asn Trp Trp Ser Asn Gly Asn Asn Gin Ile Ala Phe Ser Arg Gly Thr Leu Gly Phe Vai Ala Ile Asn Arg Glu Gly Gly Ser Leu Asn Arg Thr Phe Gin Thr Gly Leu Pro Vai Gly Thr Tyr Cys Asp Vai Ile His Gly Asp Phe Asn Ala Ser Ala Gly Thr Cys Ser Gly Pro Thr Ile Ala Vai Asn Gly Ser Gly Gin Ala Thr Ile Thr Vai Asn Ala Met Asp Ala Vai Ala Ile Tyr Gly Gly Ala Arg Leu Ala Thr Pro Ala Ser Vai Asn Vai Thr Phe Asn Glu Asn Ala Thr Thr Thr Trp Gly Gin Asn Vai Tyr Ile Vai Gly Asn Vai Ala Ala Leu Gly Ser Trp Asn Ala Gly Ser Ala Vai Leu Leu Ser Ser Ala Asn Tyr Pro Ile Trp Ser Lys Thr Ile Ala Leu Pro Ala Asn Thr Ala Ile Glu Tyr Lys Tyr Ile Lys Lys Asp Gly Ala Gly Asn Vai Vai Trp Glu Ser Gly Ala Asn Arg Vai Phe Thr Thr Pro Gly Ser Gly Ser Ala Thr Arg Asn Asp Thr Trp Lys
    Fig 16 (cont.)
    75/116 d?
    SEQID NO: 125 gtggtgcacatgaagttgaagtaccttgccttagttttgttggctgtggcttcgataggcctactctcgactccagtgggtgctgccaagtactccg aactcgaagagggcggtgttataatgcaggccttctactgggatgttcccggagggggaatctggtgggacaccataagacagaaaatcccg gagtggtacgacgctggaatctcggcgatatggattcctccagctagcaaagggatgggcggtggttattccatgggctacgatccctacgattt ctttgacctcggcgagtactatcagaagggaacagttgagacgcgcttcggctcaaaggaggaactggtgaacatgataaacaccgcacactc ctatggcataaaggtgatagcggacatagtcataaaccaccgcgccggtggagaccttgagtggaacccctttgtaaacaactatacttggaca gacttctccaaggtcgcctccggtaaatacacggccaactacctlgacttccacccaaacgaggtcaagtgctgcgatgagggtacatttggtga ctttccggacatcgcccacgagaagagctgggatcagtactggctctgggcaagcaatgagagctacgccgcatatctccggagcataggga tcgatgcatggcgtttcgactacgtcaaaggttacggagcgtgggttgttaatgactggctcagctggtggggaggctgggccgttggagagta ctgggacacgaacgttgatgcactccttaactgggcatacgacagcggtgccaaggtctttgacttcccgctctactacaagatggacgaagcc tttgacaacaccaacatccccgctttggtttacgccctccagaacggaggaacagtcgtttcccgcgatcccttcaaggcagtaactttcgttgcc aaccacgatacagatataatctggaacaagtatccggcttatgcgttcatccttacctatgagggacagcctgttatattttaccgcgactacgagg agtggctcaacaaggataagcttaacaaccttatctggatacacgagcaccttgccggaggaagtaccaagatcctctactacgataacgatga gctaatattcatgagggagggctacgggagcaagccgggcctcataacctacataaacctcggaaacgactgggccgagcgctgggtgaac gtcggctcaaagtttgccggctacacaatccatgaatacacaggcaatctcggtggctgggttgacaggtgggttcagtacgatggatgggtta aactgacggcacctcctcatgatccagccaacggatattacggctactcagtctggagctacgcaggcgtcggatga
    SEQ IDNO: 126
    Vai Vai His Met Lys Leu Lys Tyr Leu Ala Leu Vai Leu Leu Ala Vai Ala Ser Ile Gly Leu Leu Ser Thr Pro Vai Gly Ala Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly lie Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asn Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Asp Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Tip Leu Ser Trp Tip Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Asp Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Tyr Ala Leu Gin Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu lie Trp Ile His Glu His Leu Ala Gly Gly Ser Thr Lys Ile Leu Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Met Arg Glu Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Asn Asp Trp Ala Glu Arg Trp Vai Asn Vai Gly Ser Lys Phe Ala Gly Tyr Thr Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Arg Trp Vai Gin Tyr Asp Gly Trp Vai Lys Leu Thr Ala Pro Pro His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Ala Gly Vai Gly
    SEQ IDNO: 127 gtgtgcatgaattatttgaaaaaagtgtggttgtattacgctatcgtcgctaccttaatcatttactttcttacgcccttttcaactgcacaagccaacac tgcaccagtcaacggaacgatgatgcaatatttcgaatgggatttaccgaatgatggcacactttggacgaaagtaaaaaacgaagcaagcagt ctttcttctttaggtattactgcgttatggttaccacctgcatacaaaggaacgagccaaggggatgtcgggtatggcgtgtacgatttgtatgactt aggagaatttaatcaaaaagggacgattcgaacgaaatacggaacaaaaacgcaatatttacaagccattcaagcggcaaaaagcgctggcat gcaagtatacgctgatgtcgtatttaatcacaaggcgggggcagatagtacagaatgggttgacgcagtcgaagtgaatccttctaatcgaaacc aagaaacatctggcacatatcaaattcaagcatggacaaaatttgatttccctggccgtgggaacacatactcaagctttaaatggcgatggtatc attttgacggtacggattgggatgaaagccgaaaactaaatcgtatttacaaatttcgtggcacaggaaaagcatgggattgggaagtagacaca gagaacggaaactatgactacttaatgtttgctgatttagatatggatcaccctgaagtcgtgacagagctaaaaaactggggaacatggtacgtc
    Fig 16 (cont.)
    76/116 aatacgacaaatgtcgatgggtttcgcttagatgcagtaaagcatattaaatatagcttcttcccagattggttaacacatgtgcgttcacaaacacg aaaaaatctttttgcagtaggagaattttggagctacgatgtcaataaactgcataactacattacaaaaacaagtggaaccatgtcgttatttgatg cgccacttcataacaacttttacactgcttcaaaatctagcgggtattttgacatgcgctatttgttaaataatacgttgatgaaagaccagccttctet tgcggtcacactcgttgataatcatgacacgcaaccgggacaatctttacaatcatgggtagagccttggtttaagccgcttgcttatgcctttatttt gacaagacaagaaggatatccttgcgtattttacggcgactattacggcatccctaaatacaacattccgggattgaaaagtaaaatcgatccgct tctcattgcccgtagagactacgcatacggaacacaacgtgattatattgaccatcaagacattattggatggacacgggaaggaattgactcaa aaccgaactctggacttgcggctttaattactgacggccctggtggaagtaaatggatgtatgtaggtaaaaagcatgctggaaaagtgttttacg atctcactggaaatcgaagcgatacggtaacgattaatgcagacggctggggagagtttaaagtaaacggtggctccgtttccatttgggttgcc aaaacatcacaagtcacgtttaccgtcaacaatgcgacaacgataagcggacaaaatgtgtatgtcgttggtaacattccagagctcggaaattg gaacacagcaaacgcaatcaaaatgaccccatcttcttatccaacgtggaaagcaaccattgctcttccacaaggaaaagccattgaatttaaatt tattaaaaaagaccaatcgggaaatgttgtttgggaaagcattccaaaccgaacatacaccgttccatttttatcaacaggctcatatacagctagtt ggaatgtaccttaa
    SEQ IDNO: 128
    Vai Cys Met Asn Tyr Leu Lys Lys Vai Trp Leu Tyr Tyr Ala Ile Vai Ala Thr Leu Ile Ile Tyr Phe Leu Thr Pro Phe Ser Thr Ala Gin Ala Asn Thr Ala Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Vai Lys Asn Glu Ala Ser Ser Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Gin Gly Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Thr Gin Tyr Leu Gin Ala Ile Gin Ala Ala Lys Ser Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Ser Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu ITir Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Thr Trp Tyr Vai Asn Thr Thr Asn Vai Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr His Vai Arg Ser Gin Thr Arg Lys Asn Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp Vai Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Ser Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Thr Ala Ser Lys Ser Ser Gly Tyr Phe Asp Met Arg Tyr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Vai Thr Leu Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Lys Tyr Asn Ile Pro Gly Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp Ile Ile Gly Trp Thr Arg Glu Gly Ile Asp Ser Lys Pro Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Lys His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Ile Trp Vai Ala Lys Thr Ser Gin Vai Thr Phe Thr Vai Asn Asn Ala Thr Thr Ile Ser Gly Gin Asn Vai Tyr Vai Vai Gly Asn Ile Pro Glu Leu Gly Asn Trp Asn Thr Ala Asn Ala Ile Lys Met Thr Pro Ser Ser Tyr Pro Thr Trp Lys Ala Thr Ile Ala Leu Pro Gin Gly Lys Ala Ile Glu Phe Lys Phe Ile Lys Lys Asp Gin Ser Gly Asn Vai Vai Trp Glu Ser lie Pro Asn Arg Thr Tyr Thr Vai Pro Phe Leu Ser Thr Gly Ser Tyr Thr Ala Ser Trp Asn Vai Pro
    SEQIDNO: 129 ttgcgttgccgccgtggcagggacgggtgttggtgcgggcggcgtaatgcgctgccgcgacacccgcgtgaacaaaataatatgaattatttg aataggatgggggtgtcaagaatgacaaaatctcgagagttgcggtgttcatggaaagtatttgttgttgggtgcctgttgtggatggcttgggga tcttccgcgtccgccggcgtattgatgcaaggcttctactgggacgccagtaccgggaccagtgattcgtggtggacgcatttggccaagcaag ccaacggtctaaaacgggcggggttcaccgccgtatggattcctccggtgcttaaaggggcttcagggggctattccaacgggtacgatccctt tgacgactatgatatcggaagcaaggaccagaaaggtaccgtggcgacgcgatgggggacgcgagaagaactgcaacgtgccgtggccgt gatgcgcgcgaacggtctggatgtgtatgtggatctggtgctgaaccaccgcaacggggacgacgggaattggaattttcattacaaagatgc gtacggcaaagtgggttacgggcggtttcaaaaggggttttacgattttcaccccaactacaacattcaggatgccaatgttcccaacgaggattc ··· «·« ··· ****** Vi · · *
    Fig 16(cont.) cagcttcgggcgcgatttagcccatgacaatccgtatgtggccgatggactgaaggctgcaggcgattggctgaccaaagccctcgatgttca gggatatcgtctggattacgtgaaaggcatcagctacaccttcctgaaaagttatctgtcctatggggccatgaacggaaaatttgccgtcggtga gtactgggatgccaaccgggatacgttgaactggtgggcgaacacggcgatggaagggcgggcccatgtgtttgattttgcgttgcgcgagg agctgaaaaacatgtgcaatgcggacgggtactacgacatgcgtcgattggaccacgcgggtctggtcggaatcgacccgtggaaggcggt gacgtttgtcgaaaaccatgatacggatcggcacgaccccatctacaataacaagcatttggcgtatgcctacatcttgacgtcggaagggtatc cgacggtgttctggaaggattactaccaatacggaatgaagccgatcatcgacaacctcatttggatccacgaacacattgcgtacggaacgac ccaagagcgttggaaagacgaagatgtctttgtgtatgagcggaccggaggcaagcggctattggtggggcttaacgacaatcgcgccacca gcaaaacggtcaccgtacagaccggctttggtgccaacgtggccttgcacgactacaccggcaacggccccgatctccgtaccgacgcctac ggtcgggtaaccttgaccattcctgcaaacgggtacgtggcctattccgttccgggcatctccggatcctttgtgccggtcgagaaaaccgtgac gcaggagtttgccggggcgtccgacttggatàttcgtccggccgataacacgcaatttgtgcaggtcgggcggatatacgccaaggcaaacaa gccggttacagcggaattgtattgggatgccaaagactggacgacctccacgtcgattctcctagaagtgcgttcggcttcgggaacgctcatc acgacaaagaccgtgacccaattgtcgtcccagggtacccgcgtttccttcacgccttcggctaccggatggtacgtcttttccattcgaagctat aacacgccttcgacgaacccaaagccggcctactggttaaaggtaacgtatacggcgccgcaattgcttcagtaa
    SEQ ID NO: 130
    Met Arg Cys Arg Arg Gly Arg Asp Gly Cys Trp Cys Gly Arg Arg Asn Ala Leu Pro Arg His Pro Arg Glu Gin Asn Asn Met Asn Tyr Leu Asn Arg Met Gly Vai Ser Arg Met Thr Lys Ser Arg Glu Leu Arg Cys Ser Trp Lys Vai Phe Vai Vai Gly Cys Leu Leu Trp Met Ala Trp Gly Ser Ser Ala Ser Ala Gly Vai Leu Met Gin Gly Phe Tyr Trp Asp Ala Ser Thr Gly Thr Ser Asp Ser Trp Trp Thr His Leu Ala Lys Gin Ala Asn Gly Leu Lys Arg Ala Gly Phe Thr Ala Vai Trp Ile Pro Pro Vai Leu Lys Gly Ala Ser Gly Gly Tyr Ser Asn Gly Tyr Asp Pro Phe Asp Asp Tyr Asp Ile Gly Ser Lys Asp Gin Lys Gly Thr Vai Ala Thr Arg Trp Gly Thr Arg Glu Glu Leu Gin Arg Ala Vai Ala Vai Met Arg Ala Asn Gly Leu Asp Vai Tyr Vai Asp Leu Vai Leu Asn His Arg Asn Gly Asp Asp Gly Asn Trp Asn Phe His Tyr Lys Asp Ala Tyr Gly Lys Vai Gly Tyr Gly Arg Phe Gin Lys Gly Phe Tyr Asp Phe His Pro Asn Tyr Asn Ile Gin Asp Ala Asn Vai Pro Asn Glu Asp Ser Ser Phe Gly Arg Asp Leu Ala His Asp Asn Pro Tyr Vai Ala Asp Gly Leu Lys Ala Ala Gly Asp Trp Leu Thr Lys Ala Leu Asp Vai Gin Gly Tyr Arg Leu Asp Tyr Vai Lys Gly Ile Ser Tyr Thr Phe Leu Lys Ser Tyr Leu Ser Tyr Gly Ala Met Asn Gly Lys Phe Ala Vai Gly Glu Tyr Trp Asp Ala Asn Arg Asp Thr Leu Asn Trp Trp Ala Asn Thr Ala Met Glu Gly Arg Ala His Vai Phe Asp Phe Ala Leu Arg Glu Glu Leu Lys Asn Met Cys Asn Ala Asp Gly Tyr Tyr Asp Met Arg Arg Leu Asp His Ala Gly Leu Vai Gly Ile Asp Pro Trp Lys Ala Vai Thr Phe Vai Glu Asn His Asp Thr Asp Arg His Asp Pro Ile Tyr Asn Asn Lys His Leu Ala Tyr Ala Tyr Ile Leu Thr Ser Glu Gly Tyr Pro Thr Vai Phe Trp Lys Asp Tyr Tyr Gin Tyr Gly Met Lys Pro Ile Ile Asp Asn Leu Ile Trp Ile His Glu His Ile Ala Tyr Gly Thr Thr Gin Glu Arg Trp Lys Asp Glu Asp Vai Phe Vai Tyr Glu Arg Thr Gly Gly Lys Arg Leu Leu Vai Gly Leu Asn Asp Asn Arg Ala Thr Ser Lys Thr Vai Thr Vai Gin Thr Gly Phe Gly Ala Asn Vai Ala Leu His Asp Tyr Thr Gly Asn Gly Pro Asp Leu Arg Thr Asp Ala Tyr Gly Arg Vai Thr Leu Thr Ile Pro Ala Asn Gly Tyr Vai Ala Tyr Ser Vai Pro Gly Ile Ser Gly Ser Phe Vai Pro Vai Glu Lys Thr Vai Thr Gin Glu Phe Ala Gly Ala Ser Asp Leu Asp Ile Arg Pro Ala Asp Asn Thr Gin Phe Vai Gin Vai Gly Arg Ile Tyr Ala Lys Ala Asn Lys Pro Vai Thr Ala Glu Leu Tyr Trp Asp Ala Lys Asp Trp Thr Thr Ser Thr Ser Ile Leu Leu Glu Vai Arg Ser Ala Ser Gly Thr Leu Ile Thr Thr Lys Thr Vai Thr Gin Leu Ser Ser Gin Gly Thr Arg Vai Ser Phe Thr Pro Ser Ala Thr Gly Trp Tyr Vai Phe Ser Ile Arg Ser Tyr Asn Thr Pro Ser Thr Asn Pro Lys Pro Ala Tyr Trp Leu Lys Vai Thr Tyr Thr Ala Pro Gin Leu Leu Gin
    SEQIDNO: 131 atgccgcagctttacccattgccgccgcgctggcggcgcgcggcccggcagggcctggccgccttgacgctggccaccacggccctgggc atctcgacggcccaggcccagagtgcaccgcgcacggccttcgtgcatctgttcgaatggaagtggaccgacatcgcgcgcgagtgcgaga ccttcctcgggcccaagggcttcgcggcggtgcaggtgtcgcccccgaacgagcacaactgggtgaccagcggtgatggtgcaccttatccg tggtggatgcgctaccagccggtgagctacagcctggaccgcagccgcagcggcacgcgcgccgagttccaggacatggtcaaccgatgc aatgccgtgggcgtgggcatctacgtggacgccgtgatcaatcacatgtccggcggcacgggcggcacctcgagcgctgggcgcagctgg ··· ·ν· ·«» .· :
    Fig» 16(cont.) /β/“° agctatcaeaactaccctgggctctatggccccaacgacttccaccagccggtgtgcagcatcaccaactacggggatgcgaacaatgtgcag cgttgcgagctctcgggcttgcaggacctggacactgggagcgcttatgtgcgcggcaagatcgccgactatctggtggatctggtcaacatg ggggtcaagggcttccgggtggatgcggccaagcacatcagcccgaccgacctgggcgccatcatcgatgcggtcaacagccgcaccggc gcgaaccgccctttctggtttctggaggtgattggcgcggccggcgaggcagtgcagccgaaccagtacttctcgctcggcggcggccaggt caccgtgaccgagttcaactatgggaagcaaatcttcggcaagttcgccggtggcggccgtctggccgagctgcgcagcttcggtgaaacctg gggcctgatgcccagcagcaaagcgattgctttcatcgacaaccacgacaagcagcgcggtcatggcggcggtggcaactatctgacctacc accatggctcgacctacgatctggccaacatcttcatgctggcttggccttatggctacccggcgctgatgtccagctatgccttcaaccgcagc acggcctacgacacgagctttggcccgccacacgacagtggtggcgccacccgtggcccctgggatggtggcggcagccagccggcctgc ttcaaccagagcatcggtggctgggtgtgtgagcaccgctggcggggcatcgccaatatggtggccttccgcaacgccacgctgcccaactg gaccgtgaccgactggtgggacaacggcaacaaccagatcgctttcgggcggggtgacaagggcttcgtggtgatcaaccgcgaagacgc cgcgctgacgcgcaacttcaagaccagcctgccagccggccagtactgcgatgtcatctccggggacttcaacaatggtcagtgcacgggcc atgtggtgacggtcgatgccggcggctacgtgacgctgacggccgggcccaatggtgcggcggccatccacgtgggcgcccgtctggacg gcgcctctcagccgccgacgaccgcctcggtgacèttcaacgcgtcggccgataccttttggggacagaacctgttcgtcgtgggcaaccaca gcgcactgggcaactggtcgccggcggccgccaggccgatgacttggatttccggttcgggcacgcgcgggaactggcgcgcggtgctca atttgccggccaataccacctaccaatacaagttcatcaagaaggacggggctggaaacgtggtttgggagggcggtggcaatcgcgtcgtga ccacgccgtctgggggcggatcggtgagcacgggcggcaattggcagtag
    SEQ IDNO: 132
    Met Pro Gin Leu Tyr Pro Leu Pro Pro Arg Trp Arg Arg Ala Ala Arg Gin Gly Leu Ala Ala Leu Thr Leu Ala Thr Thr Ala Leu Gly Ile Ser Thr Ala Gin Ala Gin Ser Ala Pro Arg Thr Ala Phe Vai His Leu Phe Glu Trp Lys Tip Thr Asp Ile Ala Arg Glu Cys Glu Thr Phe Leu Gly Pro Lys Gly Phe Ala Ala Vai Gin Vai Ser Pro Pro Asn Glu His Asn Tip Vai Thr Ser Gly Asp Gly Ala Pro Tyr Pro Trp Trp Met Arg Tyr Gin Pro Vai Ser Tyr Ser Leu Asp Arg Ser Arg Ser Gly Thr Arg Ala Glu Phe Gin Asp Met Vai Asn Arg Cys Asn Ala Vai Gly Vai Gly Ile Tyr Vai Asp Ala Vai Ile Asn His Met Ser Gly Gly Thr Gly Gly Thr Ser Ser Ala Gly Arg Ser Trp Ser Tyr His Asn Tyr Pro Gly Leu Tyr Gly Pro Asn Asp Phe His Gin Pro Vai Cys Ser lie Thr Asn Tyr Gly Asp Ala Asn Asn Vai Gin Arg Cys Glu Leu Ser Gly Leu Gin Asp Leu Asp Thr Gly Ser Ala Tyr Vai Arg Gly Lys Ile Ala Asp Tyr Leu Vai Asp Leu Vai Asn Met Gly Vai Lys Gly Phe Arg Vai Asp Ala Ala Lys His Ile Ser Pro Thr Asp Leu Gly Ala Ile Ile Asp Ala Vai Asn Ser Arg Thr Gly Ala Asn Arg Pro Phe Trp Phe Leu Glu Vai Ile Gly Ala Ala Gly Glu Ala Vai Gin Pro Asn Gin Tyr Phe Ser Leu Gly Gly Gly Gin Vai Thr Vai Thr Glu Phe Asn TyT Gly Lys Gin Ile Phe Gly Lys Phe Ala Gly Gly Gly Arg Leu Ala Glu Leu Arg Ser Phe Gly Glu Thr Trp Gly Leu Met Pro Ser Ser Lys Ala Ile Ala Phe Ile Asp Asn His Asp Lys Gin Arg Gly His Gly Gly Gly Gly Asn Tyr Leu Thr Tyr His His Gly Ser Thr Tyr Asp Leu Ala Asn Ile Phe Met Leu Ala Trp Pro Tyr Gly Tyr Pro Ala Leu Met Ser Ser Tyr Ala Phe Asn Arg Ser Thr Ala Tyr Asp Thr Ser Phe Gly Pro Pro His Asp Ser Gly Gly Ala Thr Arg Gly Pro Trp Asp Gly Gly Gly Ser Gin Pro Ala Cys Phe Asn Gin Ser Ile Gly Gly Trp Vai Cys Glu His Arg Trp Arg Gly Ile Ala Asn Met Vai Ala Phe Arg Asn Ala Thr Leu Pro Asn Trp Thr Vai Thr Asp Trp Trp Asp Asn Gly Asn Asn Gin Ile Ala Phe Gly Arg Gly Asp Lys Gly Phe Vai Vai Ile Asn Arg Glu Asp Ala Ala Leu Thr Arg Asn Phe Lys Thr Ser Leu Pro Ala Gly Gin Tyr Cys Asp Vai Ile Ser Gly Asp Phe Asn Asn Gly Gin Cys Thr Gly His Vai Vai Thr Vai Asp Ala Gly Gly Tyr Vai Thr Leu Thr Ala Gly Pro Asn Gly Ala Ala Ala Ile His Vai Gly Ala Arg Leu Asp Gly Ala Ser Gin Pro Pro Thr Thr Ala Ser Vai Thr Phe Asn Ala Ser Ala Asp Thr Phe Trp Gly Gin Asn Leu Phe Vai Vai Gly Asn His Ser Ala Leu Gly Asn Trp Ser Pro Ala Ala Ala Arg Pro Met Thr Trp Ile Ser Gly Ser Gly Thr Arg Gly Asn Trp Arg Ala Vai Leu Asn Leu Pro Ala Asn Thr Thr Tyr Gin Tyr Lys Phe Ile Lys Lys Asp Gly Ala Gly Asn Vai Vai Trp Glu Gly Gly Gly Asn Arg Vai Vai Thr Thr Pro Ser Gly Gly Gly Ser Vai Ser Thr Gly Gly Asn Trp Gin
    SEQ IDNO: 133 atgaataatgtgaaaaaagtatggttgtattattctataattgctaccttagttatttcctttttcacacctttttcaacagcacaagctaatactgcacctg tcaacggaacaatgatgcaatatttcgaatgggatttaccgaatgatgggacgctttggacgaaagtaaaaaatgaagctaccaatctttcttcgct
    Fig 16 (cont.)
    79/116
    Kl aggtattacagcgttatggctccctccagcatataaaggaacgagccaaagcgatgtcggatatggcgtgtacgatttatatgaccttggggaatt taatcaaaaagggacgatccgaacgáaatacggaacaaaagcacaatatattcaagccatccaagctgccaaagccgcagggatgcaagtat atgcagatgttgtatttaatcataaggcgggggctgacggcacagaatttgtcgatgcagttgaggtaaacccttctaatcgaaatcaagaaacat ctggcacatatcaaattcaagcatggacaaaatttgattttcctggtcgtggaaacacatactccagcttcaaatggcgctggtatcattttgacggt accgattgggatgaaagtcgtaaattaaatcgtatttacaaattccgcggtacaggaaaagcgtgggactgggaagtcgatacagaaaacgga aactatgattatttaatgttcgctgatttagatatggatcaccctgaagttgtgacagagttaaaaaactggggaaaatggtatgtaaatacgacaaa tgtagacggatttcgtttggatgccgtaaaacatattaaatacagctttttccctgactggctaacatatgtacgtaatcaaacaggaaaaaatttattt gctgttggggaattttggagctatgacgtcaataagctgcataactacattacaaaaacaaatggatcgatgtcgttatttgatgcacctttgcataa caacttttatatcgcttccaaatcgagtggatattttgacatgcgttatttattgaataatacattaatgaaagatcaaccttcactcgctgtaacacttgt cgataaccatgatacacaaccaggtcaatctttacaatcatgggtagaagcttggtttaaaccgcttgcttacgcctttattttaacaagacaagag gggtatccttgcgtattttacggtgactattacggaatcccgaaatacaatattccgggattaaaaagtaaaattgatccgcttttaattgctcgtcgt gattatgcttatggaacacaacgtgattacattgatcatcaagacattatcggatggacacgagaaggcattgatgcaaaaccgaactctggactt gcggctttaattaccgacggccctggcggaagtaaatggatgtatgtcggtaaaaaacatgctgggaaagtgttttatgatttaactggaaatcga agtgacacagtaacgattaatgcggacggttggggagaatttaaagtaaacggcggctccgtttcgatttgggtggctaaaacatcaaacgtca catttacagtcaataacgccacaacaacaagtggacaaaacgtatatgttgttggcaacattccagagctaggcaattctttg
    SEQIDNO: 134
    Met Asn Asn Vai Lys Lys Vai Trp Leu Tyr Tyr Ser He Ile Ala Thr Leu Vai lie Ser Phe Phe Thr Pro Phe Ser Thr Ala Gin Ala Asn Thr Ala Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Vai Lys Asn Glu Ala Thr Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Gin Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu TyT Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Ile Gin Ala Ile Gin Ala Ala Lys Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Gly Thr Glu Phe Vai Asp Ala Vai Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Vai Asn Thr Thr Asn Vai Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr Tyr Vai Arg Asn Gin Thr Gly Lys Asn Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp Vai Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Ile Ala Ser Lys Ser Ser Gly Tyr Phe Asp Met Arg Tyr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Vai Thr Leu Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Ala Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Lys Tyr Asn Ile Pro Gly Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp Ile Ile Gly Trp Thr Arg Glu Gly Ile Asp Ala Lys Pro Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Lys His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Ile Trp Vai Ala Lys Thr Ser Asn Vai Thr Phe Thr Vai Asn Asn Ala Thr Thr Thr Ser Gly Gin Asn Vai Tyr Vai Vai Gly Asn Ile Pro Glu Leu Gly Asn Ser Leu
    SEQIDNO: 135 gtgacaggcaccccgtctttatacattcctccacataaaataaccatacagctttcaaatttgttgaaatgtataaaaataaaaaatagtattgtaagc gttaacatccgtcattataataacttcaaacgcgtttatgttttaatgcaaacgtttgcatcctcattttatttaaagaaaggatgtgtgtgcatgaattatt tgaaaaaagtgtggttgtattacgctatcgtcgctaccttaatcatttcctttcttacgcccttttcaactgcacaagccaacactgcaccagtcaacg gaacgatgatgcaatatttcgaatgggatttaccgaatgatggcacactttggacgaaagtaaaaaacgaagcaagcagcctttcttctttaggtat tactgcgttatggttaccacctgcatacaaaggaacgagccaaggggatgtcgggtatggcgtgtacgatttgtatgacttaggagaatttaatca aaaagggacgattcgaacgaaatacggaacaaaaacgcaatatttacaagccattcaagcggcaaaaagcgctggcatgcaagtatacgctg atgtcgtatttaatcacaaggcgggggcagatagtacagaatgggttgacgcagtcgaagtgaatccttctaatcgaaaccaagaaacatctgg • «
    Fig 16 (cont.)
    80/116 • t. 9
    9 *
    Ϊ !
    r * · f 9 9
    9 · cacatatcaaattcaagcatggacaaaatttgatttccctgaccgtgggaacacatactcaagctttaaatggcgctggtatcattttgacggtacg gattgggatgaaagtcgaaaactaaatcgcatttacaaatttcgtggcacaggaaaagcatgggattgggaagtagacacagagaacggaaac tatgactacttaatgtttgctgatttagatatggatcaccctgaagtcgtgacagagctaaaaaactggggaacatggtacgtcaatacgacaaatg tcgatgggtttcgcttagatgcagtaaagcatattaaatatagctttttcccagattggttaacatatgtgcgctcacaaacacaaaaaaatctgtttg cagtaggagaattttggagctacgatgtcaataaactgcataactacattacaaaaacaagtggaaccatgtcgttatttgatgcgccacttcataa caacttttacactgcttcaaaatctagcgggtattttgacatgcgctatttgttaaataatacgttgatgaaagaccagccttctcttgcggtcacactc gttgataatcatgacacgcaaccgggacaatctttacaatcatgggtagagccttggtttaagccgcttgcttatgcctttattttgacaagacaaga aggatatccttgcgtattttacggcgactattacggcatccctaaatacaatattccgggattgaaaagtaaaatcgatccgcttctcattgcccgta gagactacgcatacggaacacaacgtgattatattgaccatcaagacattattggatggacacgggaaggaattgactcaaaaccgaactctgg acttgcggctttaattactgacggtcctggtggaagtaaatggatgtatgtaggtaaaaagcatgctggaaaagtgttttacgatctcactggaaat cgaagcgatacggtaacgattaatgcagacggctggggagagtttaaagtaaacggtggctccgtttccatttgggttgccaaaacatcacaag tcacgtttaccgtcaacaatgcgacaacgacaagcggacaaaatgtgtatgtcgttggcaacattccagagctcggaaattggaacacagcaaa cgcaatcaaaatgaccccatcttcttatccaacgtggaaaacaaccattgctcttccacaaggaaaagcaattggcggcgtacgccatggccctt ga
    SEQ ID NO: 136
    Vai Thr Gly Thr Pro Ser Leu Tyr Ile Pro Pro His Lys lie Thr Ile Gin Leu Ser Asn Leu Leu Lys Cys Ile Lys Ile Lys Asn Ser Ile Vai Ser Vai Asn Ile Arg His Tyr Asn Asn Phe Lys Arg Vai Tyr Vai Leu Met Gin Thr Phe Ala Ser Ser Phe Tyr Leu Lys Lys Gly Cys Vai Cys Met Asn Tyr Leu Lys Lys Vai Trp Leu Tyr Tyr Ala Ile Vai Ala Thr Leu Ile Ile Ser Phe Leu Thr Pro Phe Ser Thr Ala Gin Ala Asn Thr Ala Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Tip Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Vai Lys Asn Glu Ala Ser Ser Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Gin Gly Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Thr Gin Tyr Leu Gin Ala Ile Gin Ala Ala Lys Ser Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Ser Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Asp Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Thr Trp Tyr Vai Asn Thr Thr Asn Vai Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr Tyr Vai Arg Ser Gin Thr Gin Lys Asn Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp Vai Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Ser Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Thr Ala Ser Lys Ser Ser Gly Tyr Phe Asp Met Arg Tyr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Vai Thr Leu Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Lys Tyr Asn Ile Pro Gly Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp Ile Ile Gly Trp Thr Arg Glu Gly Ile Asp Ser Lys Pro Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Lys His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr lie Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Ile Trp Vai Ala Lys Thr Ser Gin Vai Thr Phe Thr Vai Asn Asn Ala Thr Thr Thr Ser Gly Gin Asn Vai Tyr Vai Vai Gly Asn Ile Pro Glu Leu Gly Asn Trp Asn Thr Ala Asn Ala Ile Lys Met Thr Pro Ser Ser Tyr Pro Thr Trp Lys Thr Thr Ile Ala Leu Pro Gin Gly Lys Ala Ile Gly Gly Vai Arg His Gly Pro SEQIDNO: 137 gtgggacgggcaggcttggcgcatcactcgaacacttccgccaaggggacatacgggtcacctctcgaactgcgtccggatcgccccgccgt ggccggggcggtcgagcttgaagatgtccagcggggagccgccgccgaggatcaccccggcggcgtactcgcccagggcggggctcag cttgaagccgtggccggagccgcctcccaggagccagacgttggaggcccgcggatggcggtcgaggaggaggtggccgtcggggctgt tctcgtactggcagacgcgggtctcgaccagcggcgcgtccttcagggccgggaaccggcgggccacctcggcccgggccgcttccagca
    81/116
    Fig 16 (cont.) gggccggggtgatcgtccgctcgcccgccgtgggatcgatgggctcgccccgggtgtcgtccgccaccttgaagccgcggtgctcgttgcc ggggatgccgtagtagatccgctcgccgagatcgacccagaccggacagccgccctcctggaagcgcgggtcgcccggcggcgtgccga agaagaacacctcctggcgggtgttgcggaggaaccgctcaccgatcacgtccgggaacagcccggccagccagggaccgcaggcgaag acgtagaggtcggccgcgagagtggagccgtccgaaaggtgàagccgctccaagggccccgggaccatggcggcctgccggtactcccc gccctcgccctggaacagctccaccacggtccggcaggcgcgccgggcgaacagggcgccggcttcctcctcgtaccagatcgtgcggac gccgtcgaaatcgacctgggggaagcggctccgggcctccccctgagacagctcggcgaccggcagccccgcgtcctccagaaaaggaa gggagtcgcggacgtagctgtcgtcctcgccgcacatccagaggaccccggtccttttgtacagccggtaaccggactggacttcggcgtccc gccagagctcgaaggagcgggcgacccactccacgtacagacggtcgggtccgtaggcgccgcggatgatccgcgtctcgccaccggag ctggagcgggagtgccccggaccccaggcgtccaggagggtcacccgggctccgcggcggaggagatgcagggcggtccagccgccg aaggcgccggcgccgacgacggcgatatggggatgggagggcatggcgggcgtaaggttatcgcagcccgatccttcgctggcatcccat ctccgaccggagtatcctggaaaattcgaagaaggagatcgacatgcaatcgaacggaaacgtga
    SEQ IDNO: 138
    Vai Gly Arg Ala Gly Leu Ala His His Ser Asn Thr Ser Ala Lys Gly Thr Tyr Gly Ser Pro Leu Glu Leu Arg Pro Asp Arg Pro Ala Vai Ala Gly Ala Vai Glu Leu Glu Asp Vai Gin Arg Gly Ala Ala Ala Glu Asp His Pro Gly Gly Vai Leu Ala Gin Gly Gly Ala Gin Leu Glu Ala Vai Ala Gly Ala Ala Ser Gin Glu Pro Asp Vai Gly Gly Pro Arg Met Ala Vai Glu Glu Glu Vai Ala Vai Gly Ala Vai Leu Vai Leu Ala Asp Ala Gly Leu Asp Gin Arg Arg Vai Leu Gin Gly Arg Glu Pro Ala Gly His Leu Gly Pro Gly Arg Phe Gin Gin Gly Arg Gly Asp Arg Pro Leu Ala Arg Arg Gly Ile Asp Gly Leu Ala Pro Gly Vai Vai Arg His Leu Glu Ala Ala Vai Leu Vai Ala Gly Asp Ala Vai Vai Asp Pro Leu Ala Glu Ile Asp Pro Asp Arg Thr Ala Ala Leu Leu Glu Ala Arg Vai Ala Arg Arg Arg Ala Glu Glu Glu His Leu Leu Ala Gly Vai Ala Glu Glu Pro Leu Thr Asp His Vai Arg Glu Gin Pro Gly Gin Pro Gly Thr Ala Gly Glu Asp Vai Glu Vai Gly Arg Glu Ser Gly Ala Vai Arg Lys Vai Lys Pro Leu Gin Gly Pro Arg Asp His Gly Gly Leu Pro Vai Leu Pro Ala Leu Ala Leu Glu Gin Leu His His Gly Pro Ala Gly Ala Pro Gly Glu Gin Gly Ala Gly Phe Leu Leu Vai Pro Asp Arg Ala Asp Ala Vai Glu Ile Asp Leu Gly Glu Ala Ala Pro Gly Leu Pro Leu Arg Gin Leu Gly Asp Arg Gin Pro Arg Vai Leu Gin Lys Arg Lys Gly Vai Ala Asp Vai Ala Vai Vai Leu Ala Ala His Pro Glu Asp Pro Gly Pro Phe Vai Gin Pro Vai Thr Gly Leu Asp Phe Gly Vai Pro Pro Glu Leu Glu Gly Ala Gly Asp Pro Leu His Vai Gin Thr Vai Gly Ser Vai Gly Ala Ala Asp Asp Pro Arg Leu Ala Thr Gly Ala Gly Ala Gly Vai Pro Arg Thr Pro Gly Vai Gin Glu Gly His Pro Gly Ser Ala Ala Glu Glu Met Gin Gly Gly Pro Ala Ala Glu Gly Ala Gly Ala Asp Asp Gly Asp Met Gly Met Gly Gly His Gly Gly Arg Lys Vai He Ala Ala Arg Ser Phe Ala Gly Ile Pro Ser Pro Thr Gly Vai Ser Trp Lys Ile Arg Arg Arg Arg Ser Thr Cys Asn Arg Thr Glu Thr
    SEQ IDNO: 139 atgaaaacattcaaccttaaacccacacttttacctttaactttgctgctgagttcgccggtattggcggcacaaaatggaactatgatgcagtatttc cattggtatgtgccaaatgacggcgcactctggacacaagttgaaaacaatgcgccagcactatccgacaacggttttacagcgctgtggttgc caccagcatataaaggcgcaggtggtagcaacgacgttggttacggtgtttacgatatgtatgacttaggggagtttgatcaaaaaggatcggta cgaactaagtacggcaccaaagaccaatatctaaatgccatcaaagcagcacacaaaaacaatatccaaatttatggtgacgtagtgttcaacca tcgtggcggtgcagatggcaagtcgtgggtcgataccaagcgtgtggattggaataaccgcaatattgaacttggcgataaatggattgaagca tgggttgaatttagcttcccaggacgtaacgataaatactcagacttccattggacgtggtatcactttgatggcgtcgattgggatgacgcaggta aagagaaagcgatctttaaattcaaaggtgatggtaaagcatgggattgggaagtcagttctgaaaaaggcaactatgactacctcatgtacgca gacttagacatggatcacccagaagtgaagcaagagctgaaagattggggtgaatggtacttaaacatgacgggtgttgatggcttccgaatgg atgcagtgaaacacatcaaatatcagtacctacaagagtggatcgattacttgcgtaagaaaacgggcaaagagctctttaccgttggtgagtac tggaactacgacgtgaacaatctgcacaactttatgactaagacttctggcagcatgtcattgtttgatgcgcctttacatatgaacttctataacgct tcacgctctggtggcaactttgatatgcgccgaatcatggatggcaccttgatgaaagacaacccagtgaaagcagtaacactggttgagaacc atgatacgcaaccactacaggccttagagtctccggtggattggtggttcaaaccacttgcgtacgcgttcattttgcttcgtgaggaaggttatcc gtcagtcttctacgcagattactacggtgcgcaatacagcgataaagggcacgatatcaacatggtgaaagtgccttacattgagcaattggtga aagcgcgtaaagattatgcttatggtaaacaacattcttaccttgaccactgggatgtgattggttggacacgagaaggggatgcggaacatccg ······ i · · · ·
    Fig 16(cont.)
    82/116 aactctatggcggttatcatgagtgatggtcctggcggaacaaagtggatgtacacaggttcaccgagcacacgttatgtcgataaactaggtart cgtaccgaagaagtatggactaacgctagtggatgggccgaattcccagtgaacggcggatcggtttctgtttgggttggcgttaaataa SEQ ID NO: 140
    Met Lys Thr Phe Asn Leu Lys Pro Thr Leu Leu Pro Leu Thr Leu Leu Leu Ser Ser Pro Vai Leu Ala Ala Gln Asn Gly Thr Met Met Gln Tyr Phe His Trp Tyr Vai Pro Asn Asp Gly Ala Leu Trp Thr Gln Vai Glu Asn Asn Ala Pro Ala Leu Ser Asp Asn Gly Phe Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly Glu Phe Asp Gln Lys Gly Ser Vai Arg Thr Lys Tyr Gly Thr Lys Asp Gln Tyr Leu Asn Ala Ile Lys Ala Ala His Lys Asn Asn Ile Gln Ile Tyr Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asn Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp Ile Glu Ala Trp Vai Glu Phe Ser Phe Pro Gly Arg Asn Asp Lys Tyr Ser Asp Phe His Trp Thr Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Asp Ala Gly Lys Glu Lys Ala Ile Phe Lys Phe Lys Gly Asp Gly Lys Ala Trp Asp Tip Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Lys Gln Glu Leu Lys Asp Trp Gly Glu Trp Tyr Leu Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His Ile Lys Tyr Gln Tyr Leu Gln Glu Trp Ile Asp Tyr Leu Arg Lys Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu Tyr Trp Asn Tyr Asp Vai Asn Asn Leu His Asn Phe Met Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala . Ser Arg Ser Gly Gly Asn Phe Asp Met Arg Arg Ile Met Asp Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn His Asp Thr Gln Pro Leu Gln Ala Leu Glu Ser Pro Vai Asp Trp Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Asp Tyr Tyr Gly Ala Gln Tyr Ser Asp Lys Gly His Asp Ile Asn Met Vai Lys Vai Pro Tyr Ile Glu Gln Leu Vai Lys Ala Arg Lys Asp Tyr Ala Tyr Gly Lys Gln His Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai Ile Met Ser Asp Gly Pro Gly Gly Thr Lys Trp Met Tyr Thr Gly Ser Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Glu Vai Trp Thr Asn Ala Ser Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Gly Vai Lys
    SEQIDNO: 141 atgaaaccaataaataccctactcatatccgcccttgctgtttgttctttcagttccgcgacttacgccgatactattttgcacgcgttcaattggaagt attcagatgtgacggccaacgcgaatcaaattgctcaagctggttataagaaagtgcttgttgcgcctgcaatgaaatcgagtggcagccaatgg tgggctcgctatcaacctcaagatctacgcactatcgattctcctttgggcaataaacaagatttagccgcaatgattgccgcactcaaaggtgtg ggcgtcgatgtgtatgccgatgtggtactcaaccatatggcgaatgaaagctggaagcgaagtgacttgaattaccctggcacagaagtgctaa acgattatgctagccgttcaagctactatgctgaccagactctgtttggcaacctagcacaaggttatgtgtcagcgaacgactttcatccagcgg gctgtatttcagattggaacgaccctggtcatgttcagtattggcgtttgtgtggcgcagatggtgatgtaggtttacctgaccttgatccaaacaac tgggtggtttcacaacagcgtttgtatctgaaagcgctaaaagatatgggcatcaaagggttccgaattgatgcagtgaagcacatgagccaata ccaaatcgatcaggtattcacgtctgaaattactgcgaacatgcatgtgtttggtgaagtgattactagcggtggagcagggaatagcggctatg aatcgttcttagcgccttacctgaataatactaatcactctgcctacgatttcccgctgtttgcatcgattcgctcggcattttctatggggggcggttt aaatcaactgcatgatcctaaagcgtacggtcaggcacttgatgataatcgctcgatcacctttgcgatcacacatgatattccaaccaatgacgg cttccgctaccaaattatggacccacaagacgagcagcttgcttacgcgtatatccttggtaaagacggtggcacgccgctgatctacagtgatg atcttcctgattctgaagacaaggataacggtcgttggggcaatgtttggaacagttcgacaatgaaaaacatgttgagcttccataacgcgatgc aaggcaaaacaatgacgatgatttctagcgaccattgcactttgttgtttaagcgtggcaaagaaggtgttgtgggtattaacaagtgtggtgaaa cgcgtggcgtgacggttgatacctaccaacatgagtttaattggcatgttcaatacaaagacgtgttaagcagcgcaacagaaaccgtgacttct cgttaccatacgttcaatctaccaccacgcagtgcgcgtatgtttaagctgtag
    SEQ ID NO: 142
    Met Lys Pro Ile Asn Thr Leu Leu Ile Ser Ala Leu Ala Vai Cys Ser Phe Ser Ser Ala Thr Tyr Ala Asp Thr Ile Leu His Ala Phe Asn Trp Lys Tyr Ser Asp Vai Thr Ala Asn Ala Asn Gln Ile Ala Gln Ala Gly Tyr Lys Lys Vai Leu Vai Ala Pro Ala Met Lys Ser Ser Gly Ser Gln Trp Trp Ala Arg Tyr Gln Pro Gln Asp Leu Arg Thr Ile Asp Ser Pro Leu Gly Asn Lys Gln Asp Leu Ala Ala Met Ile Ala
    Fig 16 (cont.)
    83/116
    Ala Leu Lys Gly Vai Gly Vai Asp Vai Tyr Ala Asp Vai Vai Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Ser Asp Leu Asn Tyr Pro Gly Thr Glu Vai Leu Asn Asp Tyr Ala Ser Arg Ser Ser Tyr Tyr Ala Asp Gin Thr Leu Phe Gly Asn Leu Ala Gin Gly Tyr Vai Ser Ala Asn Asp Phe His Pro Ala Gly Cys Ile Ser Asp Trp Asn Asp Pro Gly His Vai Gin Tyr Trp Arg Leu Cys Gly Ala Asp Gly Asp Vai Gly Leu Pro Asp Leu Asp Pro Asn Asn Trp Vai Vai Ser Gin Gin Arg Leu Tyr Leu Lys Ala Leu Lys Asp Met Gly Ile Lys Gly Phe Arg Ile Asp Ala Vai Lys His Met Ser Gin Tyr Gin Ile Asp Gin Vai Phe Thr Ser Glu Ile Thr Ala Asn Met His Vai Phe Gly Glu Vai Ile Thr Ser Gly Gly Ala Gly Asn Ser Gly Tyr Glu Ser Phe Leu Ala Pro Tyr Leu Asn Asn Thr Asn His Ser Ala Tyr Asp Phe Pro Leu Phe Ala Ser Ile Arg Ser Ala Phe Ser Met Gly Gly Gly Leu Asn Gin Leu His Asp Pro Lys Ala Tyr Gly Gin Ala Leu Asp Asp Asn Arg Ser Ile Thr Phe Ala Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pro Gin Asp Glu Gin Leu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Thr Pro Leu Ile Tyr Ser Asp Asp Leu Pro Asp Ser Glu Asp Lys Asp Asn Gly Arg Tip Gly Asn Vai Trp Asn Ser Ser Thr Met Lys Asn Met Leu Ser Phe His Asn Ala Met Gin Gly Lys Thr Met Thr Met Ile Ser Ser Asp His Cys Thr Leu Leu Phe Lys Arg Gly Lys Glu Gly Vai Vai Gly Ile Asn Lys Cys Gly Glu Thr Arg Gly Vai Thr Vai Asp Thr Tyr Gin His Glu Phe Asn Trp His Vai Gin Tyr Lys Asp Vai Leu Ser Ser Ala Thr Glu Thr Vai Thr Ser Arg Tyr His Thr Phe Asn Leu Pro Pro Arg Ser Ala Arg Met Phe Lys Leu
    SEQIDNO: 143 atgccaaagagcacttttaccaaatccataacaaaatcacttcttgctacttccgttgttgtaagcttattgcctgcctacgcacaggccgacactat cttgcatgcctttaactggaaatacagcgacattacccgccaagcagagcaaattgcgcaagctggttataaaaaagtactgatttcaccgccgc tgaagtccacaggcccacaatggtgggcacgttaccaaccacaggacattcgagtgattgactcccctgtcggcaacaagcaagatttacaag ccctcattgcagccttaaaggcacaaggcgttgaagtatacgcagacatcgtactcaaccacatggccaacgaaagctggaaacgagacgatc tgaactacccgggaagtgatttacttacccaatacagccaaaatatggcttacatgaaccagcaaaaattgtttggagatttagagcaaaatcagtt ctctgccaatgattttcacccggctggctgcattactgattggagtaacccggggcatgttcaatactggcgcttatgtggtggtaatggtgacact gggttacctgatcttgatcctaactcgtgggtgatcgatcaacaaaaacgttatttacgtgctttgaaagacatgggaataaagggcttccgagttg atgcggtaaaacacatgagcgattaccaaatcaaccaagtgtttacgccagacatcatcgcaggcttacatgtatttggtgaagtgatcaccagtg gtggcaagggcagcaatgactaccactcttttctggaaccgtatttaaataacaccaatcacgccgcgtatgacttcccgctatttgcctctatccg aaatgcatttagttatcatggcagcttgtctcaattacatgatccacaagcttacgggcaagcacttcctaacgacagagccattactttcaccatca ctcacgacattccaaccaatgatggtttccgttaccaaatcatggatccaaccagtgaaaaactcgcgtacgcgtacattctaggcaaagatggg ggtagcccacttatctatagcgatgctttagacccaagtgaagataaagataagggccgctggcgtgatgtatggaaccaagaatacatggttaa catgatcagcttccacaacaaggtgcaaggtaaaagcatggaggtcatgtacagcgatcaatgcttgctggtctttaaacgtgaaaaacaaggct tagtcggtattaataagtgcgctgaaagccgtacctacaccatagatacccatcgttttgaatttaactggtaccaaccgtacaacgacacattaag ccagcacagcgagacctttagcagccgttatcatgctctgaccattccggcgcaaacagcacgaatgttggcgctataa
    SEQIDNO: 144
    Met Pro Lys Ser Thr Phe Thr Lys Ser Ile Thr Lys Ser Leu Leu Ala Thr Ser Vai Vai Vai Ser Leu Leu Pro Ala Tyr Ala Gin Ala Asp Thr Ile Leu His Ala Phe Asn Trp Lys Tyr Ser Asp Ile Thr Arg Gin Ala Glu Gin Ile Ala Gin Ala Gly Tyr Lys Lys Vai Leu Ile Ser Pro Pro Leu Lys Ser Thr Gly Pro Gin Trp Trp Ala Arg Tyr Gin Pro Gin Asp Ile Arg Vai Ile Asp Ser Pro Vai Gly Asn Lys Gin Asp Leu Gin Ala Leu Ile Ala Ala Leu Lys Ala Gin Gly Vai Glu Vai Tyr Ala Asp Ile Vai Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Asp Asp Leu Asn Tyr Pro Gly Ser Asp Leu Leu Thr Gin Tyr Ser Gin Asn Met Ala Tyr Met Asn Gin Gin Lys Leu Phe Gly Asp Leu Glu Gin Asn Gin Phe Ser Ala Asn Asp Phe His Pro Ala Gly Cys Ile Thr Asp Trp Ser Asn Pro Gly His Vai Gin Tyr Trp Arg Leu Cys Gly Gly Asn Gly Asp Thr Gly Leu Pro Asp Leu Asp Pro Asn Ser Trp Vai Ile Asp Gin Gin Lys Arg Tyr Leu Arg Ala Leu Lys Asp Met Gly Ile Lys Gly Phe Arg Vai Asp Ala Vai Lys His Met Ser Asp Tyr Gin Ile Asn Gin Vai Phe Thr Pro Asp Ile Ile Ala Gly Leu His Vai Phe Gly Glu Vai Ile Thr Ser Gly Gly Lys Gly Ser Asn Asp Tyr His Ser Phe Leu Glu Pro Tyr Leu Asn Asn Thr Asn His Ala Ala Tyr Asp Phe Pro Leu Phe Ala Ser Ile Arg Asn Ala Phe Ser Tyr His Gly Ser Leu Ser Gin Leu His Asp Pro Gin Ala Tyr Gly Gin Ala Leu Pro Asn Asp Arg Ala Ile Thr Phe Thr Ile Thr His Asp
    84/116
    Fig 16 (cont.)
    Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pro Thr Ser Glu Lys Leu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Ser Pro Leu Ile Tyr Ser Asp Ala Leu Asp Pro Ser Glu Asp Lys Asp Lys Gly Arg Trp Arg Asp Vai Trp Asn Gin Glu Tyr Met Vai Asn Met Ile Ser Phe His Asn Lys Vai Gin Gly Lys Ser Met Glu Vai Met Tyr Ser Asp Gin Cys Leu Leu Vai Phe Lys Arg Glu Lys Gin Gly Leu Vai Gly Ile Asn Lys Cys Ala Glu Ser Arg Thr Tyr Thr Ile Asp Thr His Arg Phe Glu Phe Asn Trp Tyr Gin Pro Tyr Asn Asp Thr-Leu Ser Gin His Ser Glu Thr Phe Ser Ser Arg Tyr His Ala Leu Thr Ile Pro Ala Gin Thr Ala Arg Met Leu Ala Leu
    SEQ ID NO: 145 atgttgaaaaggattacggtagtctgtttattatttattttgctttttcctaatatatatgggaggaataaggcggaagcagcaacgataaataatgga acattaatgcagtattttgagtggtacgctccgaatgatgggaatcattggaatcgtttgcgttatgatgctgaaagtttagctcataagggaatcac atctgtatggataccacctgcatataaagggacttcgcaaaatgatgtagggtatggggcctatgatttatacgatttaggggagttcaatcaaaaa ggaacggtgcggacgaaatatgggacaaaggcacàgttgaaatctgcaattgacgctttacataagcaaaacatcgacgtatacggtgatgta gttatgaatcataaaggtggggctgattatactgaaaccgtaacagctgttgaggtagaccgtaacaatcgaaatattgaagtatcaggtgattatg aaattagtgcgtggacgggttttaactttccagggcgcagagatgcttattctaatttcaaatggaaatggtatcattttgacggaacggattgggat gaaggaaggaaattaaaccgaatttataaatttaggggtataggtaaagcgtgggactgggaagtgtctagcgaaaatggaaattatgattatttg atgtatgcagatcttgattttgatcatccagatgttgcgaatgaaatgaaaagttggggaacgtggtatgcgaatgaattaaatttagatggatttcgt ttagatgctgttaaacatattgatcatgaatatttacgcgattgggtaaatcatgtcagacagcaaacggggaaagaaatgtttacggtggctgaat attggcaaaatgatatccagactttaaacaattatttggcgaaagtcaattataatcaatctgtatttgatgcaccgcttcattacaattttcattatgctt caacaggaaatgggaattatgatatgagaaatattttaaatggaacagtaatgaaaaatcatcctgcactcgcagttactctcgttgagaatcatga ttctcaacctgggcaatcattggaatctgtagtaagtccgtggtttaagccgctggcatatgcatttattttaactcgtgcagagggctatccttcagt tttttatggtgattactatgggacaagcggaaatagtagttatgaaattccagcgttaaaagataaaattgatccaattttgacggcacgaaaaaact ttgcatatggtacgcagcgtgattatttagaccatccagatgtgattggctggacaagagaaggagatagtgtacatgctaagtctggtttagcgg cattaatctccgatggaccaggaggatcaaagtggatggatgttggaaagaataacgctggggaagtatggtacgatattacgggtaatcaaac aaatactgtaacaattaataaagatggatcggggcaattccatgtaagtggaggctctgtttctatatatgttcaacagtaa
    SEQ ID NO: 146
    Met Leu Lys Arg Ile Thr Vai Vai Cys Leu Leu Phe Ile Leu Leu Phe Pro Asn Ile Tyr Gly Arg Asn Lys Ala Glu Ala Ala Thr Ile Asn Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp Tyr Ala Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Tyr Asp Ala Glu Ser Leu Ala His Lys Gly Ile Thr Ser Vai Tip Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Lys Ser Ala Ile Asp Ala Leu His Lys Gin Asn Ile Asp Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Thr Vai Thr Ala Vai Glu Vai Asp Arg Asn Asn Arg Asn Ile Glu Vai Ser Gly Asp Tyr Glu Ile Ser Ala Trp Thr Gly Phe Asn Phe Pro Gly Arg Arg Asp Ala Tyr Ser Asn Phe Lys Trp Lys Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Gly Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Phe Asp His Pro Asp Vai Ala Asn Glu Met Lys Ser Trp Gly Thr Trp Tyr Ala Asn Glu Leu Asn Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Asp His Glu Tyr Leu Arg Asp Trp Vai Asn His Vai Arg Gin Gin Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Gin Asn Asp Ile Gin Thr Leu Asn Asn Tyr Leu Ala Lys Vai Asn Tyr Asn Gin Ser Vai Phe Asp Ala Pro Leu His Tyr Asn Phe His Tyr Ala Ser Thr Gly Asn Gly Asn Tyr Asp Met Arg Asn Ile Leu Asn Gly Thr Vai Met Lys Asn His Pro Ala Leu Ala Vai Thr Leu Vai Glu Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Vai Vai Ser Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Ala Glu Gly Tyr Pro Ser Vai Phe Tyr Gly Asp Tyr Tyr Gly Thr Ser Gly Asn Ser Ser Tyr Glu Ile Pro Ala Leu Lys Asp Lys Ile Asp Pro lie Leu Thr Ala Arg Lys Asn Phe Ala Tyr Gly Thr Gin Arg Asp Tyr Leu Asp His Pro Asp Vai Ile Gly Τη) Thr Arg Glu Gly Asp Ser Vai His Ala Lys Ser Gly Leu Ala Ala Leu Ile Ser Asp Gly Pro Gly Gly Ser Lys Trp Met Asp Vai Gly Lys Asn Asn Ala Gly Glu Vai Trp Tyr Asp Ile Thr Gly Asn Gin Thr Asn Thr Vai Thr Ile Asn Lys Asp Gly Ser Gly Gin Phe His Vai Ser Gly Gly Ser Vai Ser Ile Tyr Vai Gin Gin
    85/116
    Fig 16 (cont.)
    SEQIDNO: 147 atgagcttaaataactttaaggtaaaactgcttagttttgctgtgtcttctgctgtattgtcactggctccaaatttagccaatgctgcaaattttgaaag tgagatggtgataatccatccgtttcagtggacatatgacaatatagcaaaagagtgtacagagtaccttggtccagccggatttgacggtgtaca gatttcccagccagcggaacataagcgggctgaaggagtatggtgggccgtatatcagccggttaattataagaattttacaaccatgaccggta acgaggagcagcttaaggcaatgatcaagacctgtaatgatgcaggtgttaaggtgttcgctgacgctgttttcaaccaaaaggctacagacgg tgtaggctggggcggttcaacttggagttataagaactaccctgacggattctccggatcagatttccatggagactgttccattgacaaaagctat actgatgcaaataatgtcagaacctgtgcactctcaggtatgccggacgttgccacagataactccgctactcaggaaaagattgcagattacct cgcttctttaatgaatatgggggtctatggtttccgtattgacgctgcaaagcacatgggatacaacgatatcaactccattctttcaaaaactgcac agaagactggaagaagacctcctgcatatctggaagtaatcggagccggtaacgaagctgccgacattcagccggacaagtatacctttattga gaatgcggttgtaactgacttcggttatgtctgggatgcaaatgagagtttcggaaagggtaattacggtaaggcactggaactcagtacctggct cggtgcaaattcagaaacattcgtaaacaatcatgatgatgaatggggcagatgctcagccggtagctgctcaatgaaaactcagaattatgctg attataatctggctcagtcctggcttgctgtatggcctgtaggtacagtaagacagatatattccggttattcattccctgtaaaagataatgatcctta tcgcgtcagtgatgcaactcatgatcagggcgggcctcttggtgccgaccgctgtgaaggtggctggttgtgtcagcaccgtgtgtccttcgttct caattccccaagatttgcgagagctaccagaggtactgctgtatcaaccaagggatttgacaatggtgctttgtggtttaacagaggaagcaaag gtttttatgcacagaatactaccaacagtcctataacccagacattctctgttgaagtacctgacggaaattactgtgatatcttaggaacatcagat cctaagagcaatccatgcggagcagacgttgtcgtaagcggcggtaaggctacctttactattcctgcaaagacagctgtggctatctgtacaga ctcagactggtgcggcaagggggttgatccttgtgaaagtgatccgaccggtgctgcctgtgtttgtaagggggaaaccaccgttaatggtgtgt gcgtcagctggtgtaatgcgcattcatcaaatgaggaatgcacctgtgtattgaatccgaatgatgccaactgtcaggctgatattgaacctacca agggtaaactctgttacgccggtacttcaaacgggtggaaacaggatcctttaacatataaccgtaaaacaggtttctggactattaatctgactctt gacggtgcaggtgataccagcggagctcagcgcttcaaggttacagacggatgttcatggaccggaacagtttacggttcttcaggtactgccg gaaagttggatgtaaatacatcatcaaccggcgatgaacctgtgtctcttgttggtgattatgttctttccattaacgataagaccatggaatatacat tcaccaaggcagatgaagtaactaatcagccaccggttgcatcatttaccgcgacagttaacggtctgaccgtttcttttgccaataattcatccga ccctgagaatgatgaattaacctacagctggaatttcggtaatggtaaaacatcatccgagaaagctcctagcataacctatgaagaatccggta agtatactgttactttaaaggttactgattcagctaataacactgatacatttactaaagatataactgtaacagcaccttctagtggcaagtacttaaa ggttgcagtcagaggttcgcatgataattacggaactgatctgttaaccaagaacggttctgattggaccggcgtctttgaattctttggatccacta gtgtcgacctgcaggcgcgcgagctc
    SEQIDNO: 148
    Met Ser Leu Asn Asn Phe Lys Vai Lys Leu Leu Ser Phe Ala Vai Ser Ser Ala Vai Leu Ser Leu Ala Pro Asn Leu Ala Asn Ala Ala Asn Phe Glu Ser Glu Met Vai Ile Ile His Pro Phe Gin Tip Thr Tyr Asp Asn Ile Ala Lys Glu Cys Thr Glu Tyr Leu Gly Pro Ala Gly Phe Asp Gly Vai Gin Ile Ser Gin Pro Ala Glu His Lys Arg Ala Glu Gly Vai Trp Trp Ala Vai Tyr Gin Pro Vai Asn Tyr Lys Asn Phe Thr Thr Met Thr Gly Asn Glu Glu Gin Leu Lys Ala Met Ile Lys Thr Cys Asn Asp Ala Gly Vai Lys Vai Phe Ala Asp Ala Vai Phe Asn Gin Lys Ala Thr Asp Gly Vai Gly Trp Gly Gly Ser Thr Trp Ser Tyr Lys Asn Tyr Pro Asp Gly Phe Ser Gly Ser Asp Phe His Gly Asp Cys Ser Ile Asp Lys Ser Tyr Thr Asp Ala Asn Asn Vai Arg Thr Cys Ala Leu Ser Gly Met Pro Asp Vai Ala Thr Asp Asn Ser Ala Thr Gin Glu Lys He Ala Asp Tyr Leu Ala Ser Leu Met Asn Met Gly Vai Tyr Gly Phe Arg He Asp Ala Ala Lys His Met Gly Tyr Asn Asp Ile Asn Ser Ile Leu Ser Lys Thr Ala Gin Lys Thr Gly Arg Arg Pro Pro Ala Tyr Leu Glu Vai Ile Gly Ala Gly Asn Glu Ala Ala Asp Ile Gin Pro Asp Lys Tyr Thr Phe Ile Glu Asn Ala Vai Vai Thr Asp Phe Gly Tyr Vai Tip Asp Ala Asn Glu Ser Phe Gly Lys Gly Asn Tyr Gly Lys Ala Leu Glu Leu Ser Thr Trp Leu Gly Ala Asn Ser Glu Thr Phe Vai Asn Asn His Asp Asp Glu Tip Gly Arg Cys Ser Ala Gly Ser Cys Ser Met Lys Thr Gin Asn Tyr Ala Asp Tyr Asn Leu Ala Gin Ser Trp Leu Ala Vai Trp Pro Vai Gly Thr Vai Arg Gin Ile Tyr Ser Gly Tyr Ser Phe Pro Vai Lys Asp Asn Asp Pro Tyr Arg Vai Ser Asp Ala Thr His Asp Gin Gly Gly Pro Leu Gly Ala Asp Arg Cys Glu Gly Gly Trp Leu Cys Gin His Arg Vai Ser Phe Vai Leu Asn Ser Pro Arg Phe Ala Arg Ala Thr Arg Gly Thr Ala Vai Ser Thr Lys Gly Phe Asp Asn Gly Ala Leu Trp Phe Asn Arg Gly Ser Lys Gly Phe Tyr Ala Gin Asn Thr Thr Asn Ser Pro Ile Thr Gin Thr Phe Ser Vai Glu Vai Pro Asp Gly Asn Tyr Cys Asp Ile Leu Gly Thr Ser Asp Pro Lys Ser Asn Pro Cys Gly Ala Asp Vai Vai Vai Ser Gly Gly Lys Ala Thr Phe Thr Ile Pro Ala Lys Thr Ala Vai Ala Ile Cys Thr Asp Ser
    86/116
    Fig 16 (cont.)
    5lo
    M
    Asp Trp Cys Gly Lys Gly Vai Asp Pro Cys Glu Ser Asp Pro Thr Gly Ala Ala Cys Vai Cys Lys Gly Glu Thr Thr Vai Asn Gly Vai Cys Vai Ser Trp Cys Asn Ala His Ser Ser Asn Glu Glu Cys Thr Cys Vai Leu Asn Pro Asn Asp Ala Asn Cys Gin Ala Asp Ile Glu Pro Thr Lys Gly Lys Leu Cys Tyr Ala Gly Thr Ser Asn Gly Trp Lys Gin Asp Pro Leu Thr Tyr Asn Arg Lys Thr Gly Phe Trp Thr Ile Asn Leu Thr Leu Asp Gly Ala Gly Asp Thr Ser Gly Ala Gin Arg Phe Lys Vai Thr Asp Gly Cys Ser Trp Thr Gly Thr Vai Tyr Gly Ser Ser Gly Thr Ala Gly Lys Leu Asp Vai Asn Thr Ser Ser Thr Gly Asp Glu Pro Vai Ser Leu Vai Gly Asp Tyr Vai Leu Ser Ile Asn Asp Lys Thr Met Glu Tyr Thr Phe Thr Lys Ala Asp Glu Vai Thr Asn Gin Pro Pro Vai Ala Ser Phe Thr Ala Thr Vai Asn Gly Leu Thr Vai Ser Phe Ala Asn Asn Ser Ser Asp Pro Glu Asn Asp Glu Leu Thr Tyr Ser Trp Asn Phe Gly Asn Gly Lys Thr Ser Ser Glu Lys Ala Pro Ser Ile Thr Tyr Glu Glu Ser Gly Lys Tyr Thr Vai Thr Leu Lys Vai Thr Asp Ser Ala Asn Asn Thr Asp Thr Phe Thr Lys Asp Ile Thr Vai Thr Ala Pro Ser Ser Gly Lys Tyr Leu Lys Vai Ala Vai Arg Gly Ser His Asp Asn Tyr Gly Thr Asp Leu Leu Thr Lys Asn Gly Ser Asp Trp Thr Gly Vai Phe Glu Phe Phe Gly Ser Thr Ser Vai Asp Leu Gin Ala Arg Glu Leu
    SEQ IDNO: 149 atgatcttaagtaattttaaggtaaaacttcttagttttgctgtgtcttctgctgtactgacactggctgcaaatgtcgccaatgccaagaattatgaaa gtgaaatggttattattcatccatttcagtggacatatgacaatatagcaaaagaatgtactgagtatctgggacctgcgggatttgacggggtgca gatttcccaggcggctgagcataaagatgccggtggtgcatggtggggtacctaccagcctgtaaacttcaagagttttactaccatggttggta atgaagaacagcttagagcaatgattaaaacctgtaacgaggcaggtgttaaggtctttgccgatgccgtgattaatcagaaagccggcgacgg tgtaggtataggtggttcaactttcggaaattataattatcctgacggatttaccagtgatgattttcatcataataactgcagtataggtaataattatt cagatgcatgggtagtaagattctgtgacctcagtggcatgccggatatagcaactgataacgacagtaccagaaataagattgctgattacttcg ccagccttatgaatatgggggtatacggattccgtattgatgctgccaagcactttagctatgatgatatagacgctattgtagagaaaacagcaa ccaaagcaggcaggagacctcctgtctatatggaggttatcggtaatccgggtcaagaggcggatgatatccagccgaacaagtatacatgga ttgataatgccgttgtaacagattttacttatgctaatagcatgcataatatttttaacggaagcggttatgccaaggctttgaacatggggctagggc atgttgatgctgaaaatgccgaagtctttataagtaatcatgataatgaatggggaagaaagtctgccggttcctgctcaataagaacccagaata atccggattaccatctggctcagtcctggctcgcagtttggcctttaggcaaggttagacagatttattctgcatatcagttcccggtctttgaagata gttgtgagcgggtcagtcagcaagcccatgatcagggcggtcctatcggggcagcccgctgtgaaggtggctggttgtgtcagcaccgtgtac cgtttgtgctcaattctcctagatttgcaagagcaaccagagggacagtcgttactactaaaggttttgatgacggagctttgtggtttaacagagg aagcaagggcttctatgcccagaatactaccggcagttctataactcatacattctcagttgaattacctgatggaaattactgtgatatccttggag caaccgatccgaagaataatcçttgcggagcggatgtcactgtaagcggaggtaaagcaacctttaccattccggcaaagaccgccgtagcta tctgtactgatgaaaagtggtgtggcaagggggttgacccttgtgaaagcgatcctaccggttccgcctgtgtatgtaagggtgaaaccacagtt aacggcgtatgtgtaagctggtgtaatgctcactcatctaatgaagaatgtgcctgtgtgctaaatcctaatgacgctgagtgtcaggccgacatt gagccgaccaagggtaaactctgctatgtaggtacctccaacaagtggactcaggaacctttaacctataatcgcaagaccggtttctggactct caacgttgaacttgacggtaagggggataccagcggggcgcagcgctttaaagttaccgacggctgttcatggcagggtactgtttacggttca tcaggagtagaaggcagacttgacgtaaatacttcagccaccggagatgaaccggtttcactgacaggtaaatatgttctttccataaatgataag accatggaatacacattcattcctgcaggcagtggaaacaagcctccggttgcgtcatttactccgactgttaaagatctgactgtatcttttgtcaa taattcatccgaccctgagaatgatgaattaacctacagctggaatttcggtaacggtaaaacctcatctgaaaagaatccgagtgttacatatgat aaagccggtaaatatactgtttcactcaaagtaaccgatactgcaaacaacactgataccaaaacactggaaatcgatttaacatctcctgttaacg gaaaatattccaaggttgcagtcagaggttcacatgataactacggaacaaatctgttaaccaggaatggttcagaatggaccggtatctttgaatt cagtaagacaaccaaattcaagcttgaagctctgcctcctgcagctgaccagtgtatcttcctcggcggtaatcgaggtgaggcattgactgcct ccggtggatttatatctcttcctgccggaaggtatactataaagtttaatgaggaaagcaaggttcttactgcaggcgatgttgactgcaccggg
    SEQ ID NO: 150
    Met Ile Leu Ser Asn Phe Lys Vai Lys Leu Leu Ser Phe Ala Vai Ser Ser Ala Vai Leu Thr Leu Ala Ala Asn Vai Ala Asn Ala Lys Asn Tyr Glu Ser Glu Met Vai Ile Ile His Pro Phe Gin Trp Thr Tyr Asp Asn Ile Ala Lys Glu Cys Thr Glu Tyr Leu Gly Pro Ala Gly Phe Asp Gly Vai Gin Ile Ser Gin Ala Ala Glu His Lys Asp Ala Gly Gly Ala Trp Trp Gly Thr Tyr Gin Pro Vai Asn Phe Lys Ser Phe Thr Thr Met Vai Gly Asn Glu Glu Gin Leu Arg Ala Met Ile Lys Thr Cys Asn Glu Ala Gly Vai Lys Vai Phe Ala Asp Ala Vai Ile Asn Gin Lys Ala Gly Asp Gly Vai Gly Ile Gly Gly Ser Thr Phe Gly Asn Tyr Asn Tyr Pro Asp Gly Phe Thr Ser Asp Asp Phe His His Asn Asn Cys Ser Ile Gly Asn Asn
    87/116
    Fig 16(cont.)
    Tyr Ser Asp Ala Trp Vai Vai Arg Phe Cys Asp Leu Ser Gly Met Pro Asp Ile Ala Thr Asp Asn Asp Ser Thr Arg Asn Lys Ile Ala Asp Tyr Phe Ala Ser Leu Met Asn Met Gly Vai Tyr Gly Phe Arg Ile Asp Ala Ala Lys His Phe Ser Tyr Asp Asp Ile Asp Ala Ile Vai Glu Lys Thr Ala Thr Lys Ala Gly Arg Arg Pro Pro Vai TyT Met Glu Vai Ile Gly Asn Pro Gly Gin Glu Ala Asp Asp Ile Gin Pro Asn Lys Tyr Thr Trp Ile Asp Asn Ala Vai Vai Thr Asp Phe Thr Tyr Ala Asn Ser Met His Asn Ile Phe Asn Gly Ser Gly Tyr Ala Lys Ala Leu Asn Met Gly Leu Gly His Vai Asp Ala Glu Asn Ala Glu Vai Phe Ile Ser Asn His Asp Asn Glu Trp Gly Arg Lys Ser Ala Gly Ser Cys Ser Ile Arg Thr Gin Asn Asn Pro Asp Tyr His Leu Ala Gin Ser Trp Leu Ala Vai Trp Pro Leu Gly Lys Vai Arg Gin Ile Tyr Ser Ala Tyr Gin Phe Pro Vai Phe Glu Asp Ser Cys Glu Arg Vai Ser Gin Gin Ala His Asp Gin Gly Gly Pro Ile Gly Ala Ala Arg Cys Glu Gly Gly Trp Leu Cys Gin His Arg Vai Pro Phe Vai Leu Asn Ser Pro Arg Phe Ala Arg Ala Thr Arg Gly Thr Vai Vai Thr Thr Lys Gly Phe Asp Asp Gly Ala Leu Trp Phe Asn Arg Gly Ser Lys Gly Phe Tyr Ala Gin Asn Thr Thr Gly Ser Ser Ile Thr His Thr Phe Ser Vai Glu Leu Pro Asp Gly Asn Tyr Cys Asp Ile Leu Gly Ala Thr Asp Pro Lys Asn Asn Pro Cys Gly Ala Asp Vai Thr Vai Ser Gly Gly Lys Ala Thr Phe Thr Ile Pro Ala Lys Thr Ala Vai Ala He Cys Thr Asp Glu Lys Trp Cys Gly Lys Gly Vai Asp Pro Cys Glu Ser Asp Pro Thr Gly Ser Ala Cys Vai Cys Lys Gly Glu Thr Thr Vai Asn Gly Vai Cys Vai Ser Tip Cys Asn Ala His Ser Ser Asn Glu Glu Cys Ala Cys Vai Leu Asn Pro Asn Asp Ala Glu Cys Gin Ala Asp Ile Glu Pro Thr Lys Gly Lys Leu Cys Tyr Vai Gly Thr Ser Asn Lys Tip Thr Gin Glu Pro Leu Thr Tyr Asn Arg Lys Thr Gly Phe Tip Thr Leu Asn Vai Glu Leu Asp Gly Lys Gly Asp Thr Ser Gly Ala Gin Arg Phe Lys Vai Thr Asp Gly Cys Ser Trp Gin Gly Thr Vai Tyr Gly Ser Ser Gly Vai Glu Gly Arg Leu Asp Vai Asn Thr Ser Ala Thr Gly Asp Glu Pro Vai Ser Leu Thr Gly Lys Tyr Vai Leu Ser Ile Asn Asp Lys Thr Met Glu Tyr Thr Phe He Pro Ala Gly Ser Gly Asn Lys Pro Pro Vai Ala Ser Phe Thr Pro Thr Vai Lys Asp Leu Thr Vai Ser Phe Vai Asn Asn Ser Ser Asp Pro Glu Asn Asp Glu Leu Thr Tyr Ser Trp Asn Phe Gly Asn Gly Lys Thr Ser Ser Glu Lys Asn Pro Ser Vai Thr Tyr Asp Lys Ala Gly Lys Tyr Thr Vai Ser Leu Lys Vai Thr Asp Thr Ala Asn Asn Thr Asp Thr Lys Thr Leu Glu Ile Asp Leu Thr Ser Pro Vai Asn Gly Lys Tyr Ser Lys Vai Ala Vai Arg Gly Ser His Asp Asn Tyr Gly Thr Asn Leu Leu Thr Arg Asn Gly Ser Glu Trp Thr Gly Ile Phe Glu Phe Ser Lys Thr Thr Lys Phe Lys Leu Glu Ala Leu Pro Pro Ala Ala Asp Gin Cys Ile Phe Leu Gly Gly Asn Arg Gly Glu Ala Leu Thr Ala Ser Gly Gly Phe Ile Ser Leu Pro Ala Gly Arg Tyr Thr Ile Lys Phe Asn Glu Glu Ser Lys Vai Leu Thr Ala Gly Asp Vai Asp Cys Thr Gly
    SEQIDNO: 151 atgaaaactattctttcaacaatcatggtgatggcggctgcggctgccaccaccgtagaggctcaaggctggccggaaaactacggcggcgtc atgttgcagggattctactgggattcctattcagccaccaagtggactaaactggaagcacaggctgacgagatctgcaactatttctcgctggta tgggtaccacagtcggcctataccggcagcagtacctccatgggctacgacccgctgtattacttcgaccagcattcatcgttcggcaccgaag agcagctacggtcgttcatcagtacctacaagcagaaaggaactggcatcatagccgatgtagttgtcaatcaccgaaagaatgtctcaaactg ggtggatttcccggccgagacctacaacggtgtaacctatcagatggtaagcaccgacatcgtttcgaacgatgacggcggaaaaacagcca cttgggcaaatcaaaacggctacagtctctcctccaatgccgacgaaggcgaaggctgggacggcatgcgcgacctggaccacaagtcgca gaacgtgcagaaatcggttcttgcctacaccaaatatctggttgacgacttaggctataccggattccgctacgatatggtaaagggatttgacgg atcgcatgtagccgactacaacaccaatgccggcgtgcagttctctgtcggcgaatattgggacggcactgcatcgaaagtttacagttggatca acagcaccaaaaagagcgatgtgccgcagtcggcagccttcgacttcgctttccgatacacctgccgcgatgccgtcaacaacaagaactgg gcgaacctgaagaacacttccggtatcagcgatgccgattacaggcgctattcggttacgtttgttgaaaatcacgatacggaataccgttcagct acggcttcccaggatcccatcaagggtgatacggttgccctcaatgcctggatgctggctatgccgggcacaccttgtgttttcctgaaacattgg accgactgcaaggaagagatcaagaatctcatcgaggcacgtcgcctggtcggtattcacaaccagagcacctatgccgaatggatgagcgg tgcagcctacatcggacgtaccgtaacaggtacgaacggcaccttacgtgttctgtgcggctcttatcagtataatgtagccgccaactacattca gattctctcaggcaaaaactataaatactacgtactcaacacgctcgaggctccctggatcgggaaaggttccggctcgtacaccgaaggtgaa accgtaacggttccgctcatcgccatatcggccgatgccaatgccaagctggtatataccaccgacggcacagaccccaccgcaacctcaaca gccgtaaccagcggaacggaactgaccatcacttcggacgccgtcctgaaggttggtctgctttccggcggcatcgtcaggaacatacagagc cgtacattcaccttccaggctgcaaacacctccgagtattacacagccaccatgcacgtatgcaaccagtccggagctctcaatccgctgtttgc ctatgtttgggcaggaccggacaacgagcagattaacggcaactggccgggcaccaagctcaccgctaccattaccgaaaacaaccttacct
    Fig 16 (cont.)
    88/116 ggtacacgcagtcgttccagattccgaagaacgtggactatgtcgtgaactttgttttcaccacaaccggcggcggtacgcagacagtggatgtt accggcatgaaggccgatgtctggtacattattaacagtaccaagagcggcaacaagtacacggtaaccgacgttacctcacagtattcttcgtt agaggccatctttgatgaagaaaactccggctccttccctgtctatgacctgcagggacgccgcgtcagcgaaattagaaacaggacaattatat cttcagaacggaaagaagatactcatcagataaacagaggttccgaaccattctcctattatgaaaatcagacacttagtaatctcagcactgctg ggtttggggggcttgtacaccatcagctgctcctcgtcggg
    SEQIDNO: 152
    Met Lys Thr Ile Leu Ser Thr Ile Met Vai Met Ala Ala Ala Ala Ala Thr Thr Vai Glu Ala Gin Gly Trp Pro Glu Asn Tyr Gly Gly Vai Met Leu Gin Gly Phe Tyr Trp Asp Ser Tyr Ser Ala Thr Lys Trp Thr Lys Leu Glu Ala Gin Ala Asp Glu Ile Cys Asn Tyr Phe Ser Leu Vai Trp Vai Pro Gin Ser Ala Tyr Thr Gly Ser Ser Thr Ser Met Gly Tyr Asp Pro Leu Tyr Tyr Phe Asp Gin His Ser Ser Phe Gly Thr Glu Glu Gin Leu Arg Ser Phe Ile Ser Thr Tyr Lys Gin Lys Gly Thr Gly Ile Ile Ala Asp Vai Vai Vai Asn His Arg Lys Asn Vai Ser Asn Trp Vai Asp Phe Pro Ala Glu Thr Tyr Asn Gly Vai Thr Tyr Gin Met Vai Ser Thr Asp Ile Vai Ser Asn Asp Asp Gly Gly Lys Thr Ala Thr Trp Ala Asn Gin Asn Gly Tyr Ser Leu Ser Ser Asn Ala Asp Glu Gly Glu Gly Trp Asp Gly Met Arg Asp Leu Asp His Lys Ser Gin Asn Vai Gin Lys Ser Vai Leu Ala Tyr Thr Lys Tyr Leu Vai Asp Asp Leu Gly Tyr Thr Gly Phe Arg Tyr Asp Met Vai Lys Gly Phe Asp Gly Ser His Vai Ala Asp Tyr Asn Thr Asn Ala Gly Vai Gin Phe Ser Vai Gly Glu Tyr Trp Asp Gly Thr Ala Ser Lys Vai Tyr Ser Tip Ile Asn Ser Thr Lys Lys Ser Asp Vai Pro Gin Ser Ala Ala Phe Asp Phe Ala Phe Arg Tyr Thr Cys Arg Asp Ala Vai Asn Asn Lys Asn Trp Ala Asn Leu Lys Asn Thr Ser Gly Ile Ser Asp Ala Asp Tyr Arg Arg Tyr Ser Vai Thr Phe Vai Glu Asn His Asp Thr Glu Tyr Arg Ser Ala Thr Ala Ser Gin Asp Pro Ile Lys Gly Asp Thr Vai Ala Leu Asn Ala Trp Met Leu Ala Met Pro Gly Thr Pro Cys Vai Phe Leu Lys His Trp Thr Asp Cys Lys Glu Glu Ile Lys Asn Leu lie Glu Ala Arg Arg Leu Vai Gly Ile His Asn Gin Ser Thr Tyr Ala Glu Trp Met Ser Gly Ala Ala Tyr Ile Gly Arg Thr Vai Thr Gly Thr Asn Gly Thr Leu Arg Vai Leu Cys Gly Ser Tyr Gin Tyr Asn Vai Ala Ala Asn Tyr Ile Gin Ile Leu Ser Gly Lys Asn Tyr Lys Tyr Tyr Vai Leu Asn Thr Leu Glu Ala Pro Trp Ile Gly Lys Gly Ser Gly Ser Tyr Thr Glu Gly Glu Thr Vai Thr Vai Pro Leu Ile Ala Ile Ser Ala Asp Ala Asn Ala Lys Leu Vai Tyr Thr Thr Asp Gly Thr Asp Pro Thr Ala Thr Ser Thr Ala Vai Thr Ser Gly Thr Glu Leu Thr Ile Thr Ser Asp Ala Vai Leu Lys Vai Gly Leu Leu Ser Gly Gly Ile Vai Arg Asn Ile Gin Ser Arg Thr Phe Thr Phe Gin Ala Ala Asn Thr Ser Glu Tyr Tyr Thr Ala Thr Met His Vai Cys Asn Gin Ser Gly Ala Leu Asn Pro Leu Phe Ala Tyr Vai Trp Ala Gly Pro Asp Asn Glu Gin Ile Asn Gly Asn Trp Pro Gly Thr Lys Leu Thr Ala Thr Ile Thr Glu Asn Asn Leu Thr Trp Tyr Thr Gin Ser Phe Gin Ile Pro Lys Asn Vai Asp Tyr Vai Vai Asn Phe Vai Phe Thr Thr Thr Gly Gly Gly Thr Gin Thr Vai Asp Vai Thr Gly Met Lys Ala Asp Vai Trp Tyr Ile Ile Asn Ser Thr Lys Ser Gly Asn Lys Tyr Thr Vai Thr Asp Vai Thr Ser Gin Tyr Ser Ser Leu Glu Ala Ile Phe Asp Glu Glu Asn Ser Gly Ser Phe Pro Vai Tyr Asp Leu Gin Gly Arg Arg Vai Ser Glu Ile Arg Asn Arg Thr Ile Ile Ser Ser Glu Arg Lys Glu Asp Thr His Gin Ile Asn Arg Gly Ser Glu Pro Phe Ser Tyr Tyr Glu Asn Gin Thr Leu Ser Asn Leu Ser Thr Ala Gly Phe Gly Gly Leu Vai His His Gin Leu Leu Leu Vai Gly
    SEQIDNO: 69 atgttgaaaaggattacggtagtctgtttattgtttattttgctttttcctaatatatatgagggaaataaggcagaagcagcaacagtgaacaatgga acattaatgcagtattttgagtggtacgctccgaatgatgggaatcattggaatcgtttgcgttccgatgctgaaagtttagctcataaaggaatcac atctgtatggataccacctgcatataaagggacttcgcaaaatgatgtagggtatggggcctatgatttatatgatttaggggagttcaatcaaaaa ggaacggtgcggacgaaatatgggacaaaagcacagttgaaatctgcaattgacgctttacataagcaaaacatcgacgtatacggtgatgtag ttatgaatcataaaggtggggctgattatactgaaaccgtaacagctgttgaggtagaccgtaacaatcgaaatattgaagtatcaggtgattatca aattagtgcatggacggggtttaattttccagggcgcggagatgcttattctaatttcaaatggaaatggtatcattttgacggaacggattgggatg aaggaaggaaattaaatcgaatttataaatttaggggtgtagataaagcgtgggattgggaagtgtctagcgaaaatggaaattatgattatttgat gtatgcagatcttgattttgatcatcctgatgttgcgaatgagatgaaaaattggggaacatggtatgcgaatgaattaaatttagatggctttcgttt ggacgctgttaaacatattgatcatgaatatttacgcgattgggtaaatcatgccagacagcaaacggggaaagaaatgtttacagtagctgaata ttggcaaaatgatgttcaggctttaaacaattatttagcgaaagtcaattataatcaatctgtgtttgatgcaccgcttcattacaattttcattatgcttc
    Fig 16 (cont.)
    89/116 aacaggaaatgggaattatgatatgagaaatattttaaatggaacagtaatgaaaaatcaccctgcactcgcagttactctcgttgagaatcatgat tctcagcctgggcagtcattggaatctgtagtaagtccgtggtttaagccgctggcatatgcatttattttaactcgtgcagagggctatccttcagtt ttctatggtgattactatgggacaagcggaaatagtagttatgaaattccagcgttaaaagataaaattgatccaattttgacggcacgaaaaaactt tgcatatggtacgcagcgtgattatttagaccatccagatgtgattggctggacaagagaaggcgatggtgtacatgctaattctggtttagcgac attactctcggacggaccaggaggatcaaagtggatggatgttggaaagaataacgctggggaagtatggtacgatattacgggtaatcaaac aaatactgtaacaattaataaggacggatgggggcagttctatgtaagtggcggctcagtttccatatatgttcagcggtaa
    SEQ ID NO: 70
    Met Leu Lys Arg Ile Thr Vai Vai Cys Leu Leu Phe Ile Leu Leu Phe Pro Asn Ile Tyr Glu Gly Asn Lys Ala Glu Ala Ala Thr Vai Asn Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp Tyr Ala Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Ser Asp Ala Glu Ser Leu Ala His Lys Gly Ile Thr Ser Vai Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Lys Ser Ala Ile Asp Ala Leu His Lys Gin Asn Ile Asp Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Thr Vai Thr Ala Vai Glu Vai Asp Arg Asn Asn Arg Asn Ile Glu Vai Ser Gly Asp Tyr Gin Ile Ser Ala Trp Thr Gly Phe Asn Phe Pro Gly Arg Gly Asp Ala Tyr Ser Asn Phe Lys Trp Lys Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Gly Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Vai Asp Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Phe Asp His Pro Asp Vai Ala Asn Glu Met Lys Asn Trp Gly Thr Trp Tyr Ala Asn Glu Leu Asn Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Asp His Glu Tyr Leu Arg Asp Trp Vai Asn His Ala Arg Gin Gin Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Gin Asn Asp Vai Gin Ala Leu Asn Asn Tyr Leu Ala Lys Vai Asn Tyr Asn Gin Ser Vai Phe Asp Ala Pro Leu His Tyr Asn Phe His Tyr Ala Ser Thr Gly Asn Gly Asn Tyr Asp Met Arg Asn Ile Leu Asn Gly Thr Vai Met Lys Asn His Pro Ala Leu Ala Vai Thr Leu Vai Glu Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Vai Vai Ser Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Ala Glu Gly Tyr Pro Ser Vai Phe Tyr Gly Asp Tyr Tyr Gly Thr Ser Gly Asn Ser Ser Tyr Glu Ile Pro Ala Leu Lys Asp Lys Ile Asp Pro Ile Leu Thr Ala Arg Lys Asn Phe Ala Tyr Gly Thr Gin Arg Asp Tyr Leu Asp His Pro Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Gly Vai His Ala Asn Ser Gly Leu Ala Thr Leu Leu Ser Asp Gly Pro Gly Gly Ser Lys Trp Met Asp Vai Gly Lys Asn Asn Ala Gly Glu Vai Trp Tyr Asp Ile Thr Gly Asn Gin Thr Asn Thr Vai Thr Ile Asn Lys Asp Gly Trp Gly Gin Phe Tyr Vai Ser Gly Gly Ser Vai Ser Ile Tyr Vai Gin Arg
    SEQIDNO: 153 ttgccttcaattaatgcaagcgattgcaaaaaaaagggagataggagtatgaagaggaaaaaatggactgcgttagcactatctttaccactagtt atgagcttatcaacaaacatacaagcagaaacattacataataataagggtcaaaaggcgcaaacaggaaataaagacggaattttttatgaact gtatgttaattctttttatgatactgatagcaatggacatggtgatttaaaaggcgtcacaaagaaacttgattatttaaatgatggaaatccaagaac aaataatgatcttcaaataaacggtatctggatgatgcctattaacacctctcctagttatcacaaatatgatgtaacagattactataatatcgatcct cagtatggaagtttacaagatttccgtgaactaacaacagaagcgcataaacgcaacgtaaaggtagtaatagatcttgttattaatcatacaagc agtgagcatccttggtttgtcgatgcattaaaaaataaaaacagtaagtatcgagattactatatttgggctgataaaaatacagacttaaatgaaaa aggcccatggggtcaacaagtatggcacaaagcgtcgaacggagagtatttctacgcaacgttctgggaagggatgccggacttaaactatga caaccctaaagtaagagaagaaatgattaaaatcgggaaattttggctcaaacaaggagctgatggctttcgtctagatgcagccatgcacatctt taaagggcaaacacctgaaggagcaaagaaaaatattgaatggtggaatgaattccgcgacgcgatgagagaaacgaatccaaatacgtatct agttggtgaaatatgggatcaaccagaagtagttgctccgtattatcaatcgttagattctacatttaacttcgacttagcatataaaatcgttaattcc gttaaaaatggtactgatcaaggggtagccgcggcagctgttgcaacggatgagttatataaaacatataatccaaataaaattgatggaacgttt ttaacgaatcatgaccaaaatcgtgtaatgagtgagttaaatggtgatgtaaacaaagcaaaatcagcagcctctattctgttgacactccctggta atccgttcatttattatggcgaagaaatcggcatgacaggccaaaaaccagatgagttgattcgtgagcctttccgttggtatgaagatgataaag aaggtcaaacgagctgggagactccagtatataacattgatcataatggtgtttcagttgaagcacaagataaacaaaaagcttctcttctaagcc attatcgtaaaatgattcgtgttcgtcagcaacacgatgaacttgtcaaaggtaatttagaacctatttctgtcaataattcacaggttgttgcctataat cgtacgtataaaaataaatcaattcaagtgtaccataatatttcagacaagccggttacattaactgtttcaaacaaaggaaaactgattttttctagt gaattaggagcaaaaaaggaaaaatcaacattagtaattccagcgaatacgacagtgctagtaaagtaa ·♦· ···
    Fig) 16 (cont.)
    90/116
    SEQ IDNO: 154
    Met Pro Ser Ile Asn Ala Ser Asp Cys Lys Lys Lys Gly Asp Arg Ser Met Lys Arg Lys Lys Trp Thr Ala Leu Ala Leu Ser Leu Pro Leu Vai Met Ser Leu Ser Thr Asn Ile Gin Ala Glu Thr Leu His Asn Asn Lys Gly Gin Lys Ala Gin Thr Gly Asn Lys Asp Gly Ile Phe Tyr Glu Leu Tyr Vai Asn Ser Phe Tyr Asp Thr Asp Ser Asn Gly His Gly Asp Leu Lys Gly Vai Thr Lys Lys Leu Asp Tyr Leu Asn Asp Gly Asn Pro Arg Thr Asn Asn Asp Leu Gin Ile Asn Gly Ile Trp Met Met Pro Ile Asn Thr Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Ser Leu Gin Asp Phe Arg Glu Leu Thr Thr Glu Ala His Lys Arg Asn Vai Lys Vai Vai Ile Asp Leu Vai Ile Asn His Thr Ser Ser Glu His Pro Trp Phe Vai Asp Ala Leu Lys Asn Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Pro Trp Gly Gin Gin Vai Trp His Lys Ala Ser Asn Gly Glu Tyr Phe Tyr Ala Thr Phe Trp Glu Gly Met Pro Asp Leu Asn TyT Asp Asn Pro Lys Vai Arg Glu Glu Met Ile Lys Ile Gly Lys Phe Trp Leu Lys Gin Gly Ala Asp Gly Phe Arg Leu Asp Ala Ala Met His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Glu Trp Trp Asn Glu Phe Arg Asp Ala Met Arg Glu Thr Asn Pro Asn Thr Tyr Leu Vai Gly Glu Ile Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Thr Phe Asn Phe Asp Leu Ala Tyr Lys Ile Vai Asn Ser Vai Lys Asn Gly Thr Asp Gin Gly Vai Ala Ala Ala Ala Vai Ala Thr Asp Glu Leu Tyr Lys Thr Tyr Asn Pro Asn Lys Ile Asp Gly Thr Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Asn Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Phe Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Gin Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Asp Asp Lys Glu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Ile Asp His Asn Gly Vai Ser Vai Glu Ala Gin Asp Lys Gin Lys Ala Ser Leu Leu Ser His Tyr Arg Lys Met Ile Arg Vai Arg Gin Gin His Asp Glu Leu Vai Lys Gly Asn Leu Glu Pro Ile Ser Vai Asn Asn Ser Gin Vai Vai Ala Tyr Asn Arg Thr Tyr Lys Asn Lys Ser Ile Gin Vai Tyr His Asn Ile Ser Asp Lys Pro Vai Thr Leu Thr Vai Ser Asn Lys Gly Lys Leu Ile Phe Ser Ser Glu Leu Gly Ala Lys Lys Glu Lys Ser Thr Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Vai Lys
    SEQ IDNO: 155 gtgtcaagaatgtttgcaaaacgattcaaaacctctttactgccgttattcgctggatttttattgctgtttcatttggttctggcaggaccaacggctg cgaatgctgaaacggctaacaaatcaaatgagcttacagcaccgtcgatcaaiagcggaaccattcttcatgcttggaattggtcgttcaatacgt taaaacacaatatgaaggatattcatgatgcaggatatacagcgattcagacgtctccgattaaccaagtcaaggaagggaaccaaggaaataa aaacatgtcgaactggtactggctctatcagccgacatcgtaccaaattggcaaccgttacttaggtactgaacaagaatttaaagaaatgtgtgc agccgctgaagaatatggcataaaggttattgttgacgcggtcatcaatcataccaccagtgactatgccgcgatttccaatgagattaagagtatt ccaaactggacacatggaaacacacaaattaaaaactggtctgatcgatgggatgtcacgcagaatgcattgctcgggctgtatgactggaata cacaaaatacacaagtacagtcctatttgaaacggttcttagaaagagcattgaatgacggggcagacggttttcgatttgatgccgccaaacata tagagcttccggatgatggcagttacggcagtcaattttggccgaatatcacaaatacatctgcagagttccaatacggagaaatcctgcaggat agtgcttcaagagatgcttcatatgcgaattatatgaatgtgacagcgtctaactatgggcattccataaggtccgctttaaagaatcgtaatctggg cgtgtcgaatatctcccactatgcatcagatgtgtctgcggacaagctagtgacatgggtagaatcgcatgatacgtatgccaatgatgatgaag agtcgacatggatgagcgatgatgatatccgtttaggctgggcggtgatagcttctcgttcaggcagtacgcctcttttcttttccagacctgaggg aggcggaaatggtgtgagattcccggggaaaagccaaataggcgatcgcgggagtgctttatttgaagatcaggctatcactgcggtcaatag atttcacaatgtgatggctggacagcctgaggaactctcgaacccaaatggaaacaaccagatatttatgaatcagcgcggctcacatggcgttg tgctggcaaatgcaggttcatcctctgtttctatcaatacgccaacaaaattgcctgatggcaggtatgataataaagctggggcaggttcatttca agtaaatgacggtaaactgacaggcacgatcaatgccaggtctgtggctgtgctttatcctgatgatattgcaaaagcgcctcatgttttccttgag aattacaaaacaggtgtaacacattctttcaatgatcaactgacgattacactgcgtgcagatgcgaatacaacaaaagccgtttatcaaatcaata atggaccagagacggcgtttaaggatggagatcaattcacaatcggaaaaggagatccatttggcaaaacatacaccatcatgttaaaaggaac gaacagtgatggtgtaacgaggaccgaggaatacagttttgttaaaagagatccagcttcggccaaaaccatcggctatcaaaatccgaatcatt ggagccaggtaaatgcttatatctataaacatgatgggggccgggca
    SEQ IDNO: 156 • « · « ·
    Fig 16 (cont.)
    91/116
    Vai Ser Arg Met Phe Ala Lys Arg Phe Lys Thr Ser Leu Leu Pto Leu Phe Ala Gly Phe Leu Leu Leu Phe His Leu Vai Leu Ala Gly Pro Thr Ala Ala Asn Ala Glu Thr Ala Asn Lys Ser Asn Glu Leu Thr Ala Pro Ser lie Lys Ser Gly Thr Ile Leu His Ala Trp Asn Trp Ser Phe Asn Thr Leu Lys His Asn Met Lys Asp Ile His Asp Ala Gly Tyr Thr Ala He Gin Thr Ser Pro Ile Asn Gin Vai Lys Glu Gly Asn Gin Gly Asn Lys Asn Met Ser Asn Tip Tyr Trp Leu Tyr Gin Pro Thr Ser Tyr Gin Ile Gly Asn Arg Tyr Leu Gly Thr Glu Gin Glu Phe Lys Glu Met Cys Ala Ala Ala Glu Glu Tyr Gly Ile Lys Vai Ile Vai Asp Ala Vai Ile Asn His Thr Thr Ser Asp Tyr Ala Ala He Ser Asn Glu Ile Lys Ser Ile Pro Asn Trp Thr His Gly Asn Thr Gin Ile Lys Asn Trp Ser Asp Arg Trp Asp Vai Thr Gin Asn Ala Leu Leu Gly Leu Tyr Asp Trp Asn Thr Gin Asn Thr Gin Vai Gin Ser Tyr Leu Lys Arg Phe Leu Glu Arg Ala Leu Asn Asp Gly Ala Asp Gly Phe Arg Phe Asp Ala Ala Lys His Ile Glu Leu Pro Asp Asp Gly Ser Tyr Gly Ser Gin Phe Trp Pro Asn Ile Thr Asn Thr Ser Ala Glu Phe Gin Tyr Gly Glu Ile Leu Gin Asp Ser Ala Ser Arg Asp Ala Ser Tyr Ala Asn Tyr Met Asn Vai Thr Ala Ser Asn Tyr Gly His Ser Ile Arg Ser Ala Leu Lys Asn Arg Asn Leu Gly Vai Ser Asn Ile Ser His Tyr Ala Ser Asp Vai Ser Ala Asp Lys Leu Vai Thr Trp Vai Glu Ser His Asp Thr Tyr Ala Asn Asp Asp Glu Glu Ser Thr Trp Met Ser Asp Asp Asp Ile Arg Leu Gly Trp Ala Vai Ile Ala Ser Arg Ser Gly Ser Thr Pro Leu Phe Phe Ser Arg Pro Glu Gly Gly Gly Asn Gly Vai Arg Phe Pro Gly Lys Ser Gin Ile Gly Asp Arg Gly Ser Ala Leu Phe Glu Asp Gin Ala Ile Thr Ala Vai Asn Arg Phe His Asn Vai Met Ala Gly Gin Pro Glu Glu Leu Ser Asn Pro Asn Gly Asn Asn Gin Ile Phe Met Asn Gin Arg Gly Ser His Gly Vai Vai Leu Ala Asn Ala Gly Ser Ser Ser Vai Ser He Asn Thr Pro Thr Lys Leu Pro Asp Gly Arg Tyr Asp Asn Lys Ala Gly Ala Gly Ser Phe Gin Vai Asn Asp Gly Lys Leu Thr Gly Thr Ile Asn Ala Arg Ser Vai Ala Vai Leu Tyr Pro Asp Asp Ile Ala Lys Ala Pro His Vai Phe Leu Glu Asn Tyr Lys Thr Gly Vai Thr His Ser Phe Asn Asp Gin Leu Thr Ile Thr Leu Arg Ala Asp Ala Asn Thr Thr Lys Ala Vai Tyr Gin Ile Asn Asn Gly Pro Glu Thr Ala Phe Lys Asp Gly Asp Gin Phe Thr Ile Gly Lys Gly Asp Pro Phe Gly Lys Thr Tyr Thr Ile Met Leu Lys Gly Thr Asn Ser Asp Gly Vai Thr Arg Thr Glu Glu Tyr Ser Phe Vai Lys Arg Asp Pro Ala Ser Ala Lys Thr Ile Gly Tyr Gin Asn Pro Asn His Trp Ser Gin Vai Asn Ala Tyr Ile Tyr Lys His Asp Gly Gly Arg Ala
    SEQ IDNO: 157 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagcattagctctaacactgccgctggctgctagcttatca acaggcgttcacgccgaaaccgtacataaaggtaaagctccaacagcagataaaaacggtgtcttttatgaggtgtatgtaaactctttttacgat gcaaataaagatggacatggtgatttaaaaggtcttacacaaaagctggattatttgaatgacggcaattctcataccaaaaatgatcttcaagtaa acggaatttggatgatgccggtaaacccttctcctagctatcataaatatgatgtaacggactattataacattgatccgcagtacggaaatctgca agattttcgcaagctgatgaaagaagcagataaacgagacgtaaaggttattatggacctcgttgtgaatcatacaagcagtgaacatccttggtt tcaagctgcattaaaagataaaaacagcaagtacagagattactatatttgggccgataaaaatactgatttaaatgaaaaaggatcttgggggca gcaagtatggcataaagctccaaacggagagtatttttatggtacgttttgggaaggaatgcctgacttaaattacgataatcccgaagtaagaaa agaaatgattaacgtcgggaaattttggctaaagcaaggcgttgacgggttccgcttagatgctgcgcttcatatttttaaaggtcaaacacctgaa ggcgctaagaaaaatatcgtgtggtggaatgagtttagagatgcaatgaaaaaagaaaaccctaacgtatatctaacgggtgaagtatgggatc aaccggaagtagtagctccttactatcaatcgcttgattctttatttaactttgatttagcaggaaagattgtaaactctgtaaaatcaggaaatgatca aggaatcgcgactgcagcagccgcaactgatgagctgttcaaatcatacaatccaaataaaattgacggcattttcttaaccaaccatgaccaaa atcgcgtcatgagtgagctaagcggcgatgtgaataaagcaaagtcagctgcctctatcttacttacgcttcctggcaacccgtatatttattacgg tgaagaaattggaatgaccggtgaaaagcctgatgagttaatccgtgaaccgttccgctggtacgaaggcaatggacttggacaaaccagctg ggaaacatccgtatacaacaaaggcggcaatggtgtgtcagtagagacacaaacaaaacaaaaggattctttgttaaatcattaccgtgaaatga ttcgcgtgcgtcagcagcatgaagagttagtaaaaggaacccttcaatctatttcagtagacagtaaagaagtcgttgcctatagccgcacgtata aaggcaaatcgattagcgtgtatcataatatttcaaatcaaccggtaaaagtatctgtaacagcgaaaggtaaattgatttttgctagtgaaaaaggt gcaaaaaaagtcaaaaatcagcttgtggttccagctaatacaacggttttaataaaataa
    SEQ IDNO: 158
    Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vaí Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His
    Fig 16 (cont.)
    92/116
    Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly He Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Tip Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Tip Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Vai Trp Tip Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Asn Ser Vai Lys Ser Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pio Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Ser Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Thr Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Thr Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Vai Pro Ala Asn Thr Thr Vai Leu Ile Lys SEQIDNO: 159 ttgcaaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatcaacaggcgttc acgccgaaaccgtacataaaggtaaatctccaacagcagataaaaacggtgtattttatgaggtgtatgtaaactctttttacgatgcaaataaaga tggacatggtgatttaaaaggtcttacacaaaagttggattatttaaatgatggcaattctcatacaaagaatgatcttcaagtaaacgggatttggat gatgccggtcaacccttctcccagctatcataaatatgatgtaacggactattataatattgatccgcagtatggaaatctgcaagattttcgcaaac tgatgaaagaagcagataaacgagatgtaaaagtcattatggacctcgttgtgaatcatacgagcagtgaacacccttggtttcaagctgcattaa aagataaaaacagcaagtacagagattactatatctgggctgataaaaataccgacttgaatgaaaaaggatcttggggacagcaagtatggca taaagctccaaacggagagtatttttacggaacgttttgggaaggaatgccggacttaaattacgataatcctgaagtaagaaaagaaatgattaa cgtaggaaagttttggctaaagcaaggagttgatgggttccgtctagatgctgcgcttcatatttttaaaggccaaacacctgaaggcgctaagaa aaatctcctgtggtggaatgaatttagagatgcaatgaaaaaggaaaaccctaacgtatatctaacgggtgaagtatgggatcaaccggaagta gtagctccttactatcaatcgcttgattctttatttaactttgatttagcaggaaagattgtaaactctgtaaaatcaggaaatgatcaaggaatcgcga ctgcagcagcggcaacggatgaactgttcaaatcatacaatccaaataaaattgacggtattttcttaaccaaccatgaccaaaatcgcgtcatga gtgagctaaacggcgatgtgaataaagcaaagtcagctgcctctatcttacttacgcttcctggcaacccgtatatttattacggtgaagaaatcgg catgaccggtgaaaagcctgatgagttaatccgtgaaccgttcccctggtacgaaggaaacggacttggacaaaccagctgggaaacacctgt atataacaaaggcggcaacggcgtgtctgtagaagcacaaacaaaacaaaaggactctttgttaaatcattaccgtgaaatgattcgcgtgcgtc agcagcacgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaagaagtcgttgcctatagccgtacgtataaaggcaaatcg attagcgtgtatcataatatttcaaatcaaccggtaaaagtatctgtagcagcaaaaggtaaattgatttttgctagtgaaaaaggtgctaagaaagt caaaaatcagcttgtgattccggcgaatacaacggttttaataaaataa
    SEQIDNO: 160
    Met Gin Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Tip His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr ·»· ··* ··· ι::
    Fig 16 (cont.)
    93/116 lá 9 * • · · • ·
    Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Asn Ser Vai Lys Ser Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Asn Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Pro Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser lie Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Ile Lys
    SEQ IDNO: 161 gtggatccaaagaattgtagtcaatttatgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaa cactgccgctggctgctagcttatcaacaggtgttcacgccgaaaccgtacataaaggtaaagctccaacagcagataaaaacggtgtcttttat gaggtatatgtaaactctttttacgatgcaaataaagatggacatggtgatttaaaaggccttacacaaaagttggactatttaaatgacggaaattc tcatacaaagaatgatcttcaagtaaacgggatttggatgatgccggtcaacccttctcctagctatcataaatatgatgtaacggactattataatat tgatccgcagtatggaaatctgcaagattttcgcaaacttatgaaagaagcagataaacgagacgtaaaagtcattatggaccttgttgtgaatcat acgagcagtgaacacccttggtttcaagctgcgttgaaagataaaaacagcaagtacagagattactatatttgggctgataaaaatactgacttg aatgaaaaaggatcttggggacaacaagtatggcataaagctccaaacggagagtatttttacggaacgttctgggaaggaatgcctgacttaa attacgataaccctgaagtaagaaaagaaatgattaacgtcggaaagttttggctaaaacaaggcgttgacggcttccgcttagatgctgcccttc atatttttaaaggtcaaacgcctgaaggcgctaagaaaaacattctatggtggaatgagtttagagatgcgatgaaaaaagaaaacccgaacgta tatctaacgggtgaagtgtgggaccagccagaagtagtagccccttactatcaatcacttgattctctatttaattttgatttagcaggaaaaattgtc agctctgtaaaagcaggaaatgatcaaggaatcgccactgcagcagcggcaactgatgagctgttcaaatcatacaatccaaataaaattgacg gcattttcttaaccaaccatgaccaaaatcgcgtcatgagtgagttaagcggcgatgtgaataaagcaaaatcagccgcctctatcttacttacgct tcctggaaatccgtatatttattacggtgaagaaattggcatgacaggtgaaaagcctgatgaattaatccgtgaaccgttccgctggtacgaagg caacggaattggacaaactagctgggaaacacctgtatataacaaaggcggtaacggcgtgtctgtagaagcacaaacaaaacaaaaggatt ccttgttaaatcattaccgtgaaatgattcgtgtgcgccagcagcacgaagagttagtaaaaggaacgcttcaatccatttcagtagacagtaaag aagtcgttgcctatagccgcacgtacaaaggcaaatcgattagcgtgtatcataatatttcaaatcaacctgtaaaagtatctgtagcagcgaaag gtaacttgatttttgctagtgaaaaaggtgctaagaaagtcaaaaatcagcttgtgattccggcgaatgcgacggttttaataaaataa
    SÉQIDNO: 162
    Vai Asp Pro Lys Asn Cys Ser Gin Phe Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His lie Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu
    Fig 16 (cont.)
    94/116
    Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Ile Gly Gin Thr. Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Ásn Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Ala Thr Vai Leu Ile Lys
    SEQIDNO: 163 atggtacgtcccgaacgacgggctgcattggaaccgactatcgaacgactcgcagcacttgaaagacattgggtgacgacggtgtggattccg ccggcgtacaaaggcacgtcacagaacgatgtcgggtatggggcgtacgatttatacgatctcggcgaattcaaccaaaaagggacgacccg gacgaagtacgggacgaaagcgcagctccagaccgccatctcgaacttgcgcggtaaagggatcggtgtgtacggcgacgtcgtcatgaat cacaagggcggggccgattataccgaatccgttcaggcgatcgaggtcaatccgtcgaaccggaaccaagaaacgtccggtgagtatggcat ctcggcctggactgggttcaacttcgcggggcgcaacaatacatactcgccgttcaaatggcgctggtaccattttgacggtaccgattgggatc agtcacgcagcttgagccgcatctataagttcaagagcacaggcaaggcgtgggacacggacgtgtcgaacgagaacggcaactatgattat cttatgtatgccgacgtcgatttcgagcatcccgaggtccgccaagagatgaagaactggggcaaatggtacgccgactcgctcgggctcgac ggtttccggttggatgcggtcaaacatatcagccactcgtacttgaaggagtgggtgacgagcgtgcgccagacgaccgggaaagagatgttc acggtcgccgagtattggaagaacgatctcggtgccatcaacgactatctgtataagacgggctacacgcactccgtcttcgatgtgccgctcc attataacttccaagcggccggtaacggcggcgggtattacgatatgcgcaacatcttgaaaggcaccgtcaccgaacagcatccgtcgctgtc cgtgacgattgtcgataaccacgactcacagccgggccagtcgctcgagtcgacggtcgccaactggttcaaaccgctcgcctacgcgacga tcatgacgcgcggtcagggttatccggccctcttctatggagactattatggcacgaaagggacgacgaaccgcgaaatcccgaacatgtcgg gcacgctccaaccgattttgaaggcacgaaaagacttcgcctacgggacgcagcatgactacctcgatcatcaggacgtcatcggctggacac gtgaaggtgtgaccgaccgtgccaaatcgggtctcgcgacgattctatcggacggtccgggcggctcgaagtggatgtacgtcggcaaacag aacgccggcgaggtatggaaagacatgacgaacaacaacgcccgtctcgtcacgatcaatgctgacggctggggtcagttcttcgtcaacgg aggctcggtctcgatttatacgcaacaataa
    SEQIDNO: 164
    Met Vai Arg Pro Glu Arg Arg Ala Ala Leu Glu Pro Thr Ile Glu Arg Leu Ala Ala Leu Glu Arg His Trp Vai Thr Thr Vai Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Thr Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Gin Thr Ala Ile Ser Asn Leu Arg Gly Lys Gly Ile Gly Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Ser Vai Gin Ala Ile Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Glu Tyr Gly Ile Ser Ala Trp Thr Gly Phe Asn Phe Ala Gly Arg Asn Asn Thr Tyr Ser Pro Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Gin Ser Arg Ser Leu Ser Arg Ile Tyr Lys Phe Lys Ser Thr Gly Lys Ala Trp Asp Thr Asp Vai Ser Asn Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Vai Asp Phe Glu His Pro Glu Vai Arg Gin Glu Met Lys Asn Trp Gly Lys Trp Tyr Ala Asp Ser Leu Gly Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Ser His Ser Tyr Leu Lys Glu Trp Vai Thr Ser Vai Arg Gin Thr Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Lys Asn Asp Leu Gly Ala Ile Asn Asp Tyr Leu Tyr Lys Thr Gly Tyr Thr His Ser Vai Phe Asp Vai Pro Leu His Tyr Asn Phe Gin Ala Ala Gly Asn Gly Gly Gly Tyr Tyr Asp Met Arg Asn Ile Leu Lys Gly Thr Vai Thr Glu Gin His Pro Ser Leu Ser Vai Thr Ile Vai Asp Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Thr Vai Ala Asn Trp Phe Lys Pro Leu Ala Tyr Ala Thr Ile Met Thr Arg Gly Gin Gly Tyr Pro Ala Leu Phe Tyr Gly Asp Tyr Tyr Gly Thr Lys Gly Thr Thr Asn Arg Glu Ile Pro Asn Met Ser Gly Thr Leu Gin Pro Ile Leu Lys Ala Arg Lys Asp Phe Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Gin Asp Vai Ile Gly Trp Thr Arg Glu Gly Vai Thr Asp Arg Ala Lys Ser Gly Leu Ala Thr Ile Leu Ser Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Gin Asn Ala Gly Glu Vai Trp Lys Asp Met Thr Asn Asn Asn Ala Arg Leu Vai Thr Ile Asn Ala Asp Gly Trp Gly Gin Phe Phe Vai Asn Gly Gly Ser Vai Ser Ile Tyr Thr Gin Gin
    Fig 16(cont.)
    95/116
    SEQIDNO: 165 atgcagtatttcgagtggtacgtgccaaatgatggggaacattggaatcgtttgcgtaatgatgctgaaaatttagctcataaaggaattacatctgt atggataccacccgtatataaaggaacttcacaaaatgatgtagggtatggagtgtatgatgtatatgatttgggagaattcaatcaaaaaggaac gatacggacaaaatatgggacaaaagcacaattaaaatctgcaattgaggctttacataatcaaaatatcgatgtatacggtgatgttgttatgaac cataaaggtggggcagattatactgaggttgtaacagccgttgaggtagaccgtaacaatcgaaatattgaaacatcgagtgattatcaaatagat gcgtggacgggatttgattttccaggacgcagggactcctattctaattttaaatggagatggtttcattttgatggaacagattgggatgagggaa ggaaattaaatagaatttataaatttaaaggcgtaggtaaagcttgggactgggaagtgtctagtgagaatggtaactatgattatttaatgtatgca gatcttgatttcgatcatcctgaagttgcaaatgaaatgaaaaactggggaacctggtatgcggacgaattaaatttagatggctttcgtttagacg cagttaaacatattgaccatgagtatcttcgtgattgggtaaatcatgttagaaagcaaacggggaaggaaatgtttacagtagctgaatattggca aaatgatattcgtactttaaacaattatttagggaaagtaaattataatcaatctgtgttcgatgcacctcttcattataattttcattatgcttcaacagg gaatggaaattatgatatgaggaatattttaaagggtacggtagtagaaagtcatcctacacttgctgttactcttgttgagaatcatgattctcagcc tggacagtcattagaatctgttgtgagtccttggtttaagccgttggcctatgcatttattttaacgcgtgcagaagggtatccttctgttttttatggag attactatggcacaaatggaaatagtagttatgaaattccaacgttaaaggataaaattgatccaattctgacggcacgaaaaaactttgcatatgg tacgcaacatgattatttagaccatccagatgtgattggctggacaagagaaggggatagtatacatgctaattctggtttagcaacattaatctctg atggaccaggaggatcaaaatggatgaatgttggaaagaacaacgcaggggaaatatggtacgatattacgggcaatcaaacaaatactgtaa cgattaataaagatggatgggggcagttccatgtaaatgggggctctgtttcaatatatgttcagaagtaa
    SEQIDNO: 166
    φ) Met Gin Tyr Phe Glu Trp Tyr Vai Pro Asn Asp Gly Glu His Trp Asn Arg Leu Arg Asn Asp Ala
    Glu Asn Leu Ala His Lys Gly Ile Thr Ser Vai Trp Ile Pro Pro Vai Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Vai Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Lys Ser Ala Ile Glu Ala Leu His Asn Gin Asn Ile Asp Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Vai Vai Thr Ala Vai Glu Vai Asp Arg Asn Asn Arg Asn Ile Glu Thr Ser Ser Asp Tyr Gin Ile Asp Ala Trp Thr Gly Phe Asp Phe Pro Gly Arg Arg Asp Ser Tyr Ser Asn Phe Lys Trp Arg Trp Phe His Phe Asp Gly Thr Asp Trp Asp Glu Gly Arg Lys Leu Asn Arg Ile Tyr Lys Phe Lys Gly Vai Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser ' Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Phe Asp His Pro Glu Vai Ala Asn
    Glu Met Lys Asn Trp Gly Thr Trp Tyr Ala Asp Glu Leu Asn Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Asp His Glu Tyr Leu Arg Asp Trp Vai Asn His Vai Arg Lys Gin Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Gin Asn Asp Ile Arg Thr Leu Asn Asn Tyr Leu Gly Lys Vai Asn Tyr Asn Gin Ser Vai Phe Asp Ala Pro Leu His Tyr Asn Phe His Tyr Ala Ser Thr Gly Asn Gly Asn Tyr Asp Met Arg Asn Ile Leu Lys Gly Thr Vai Vai Glu Ser His Pro Thr Leu Ala Vai Thr Leu Vai Glu Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Vai Vai Ser Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Ala Glu Gly Tyr Pro Ser Vai Phe Tyr Gly Asp Tyr Tyr Gly Thr Asn Gly Asn Ser Ser Tyr Glu Ile Pro Thr Leu Lys Asp Lys Ile Asp Pro Ile Leu Thr Ala Arg Lys Asn Phe Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Pro Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp a . Ser Ile His Ala Asn Ser Gly Leu Ala Thr Leu lie Ser Asp Gly Pro Gly Gly Ser Lys Trp Met Asn
    Vai Gly Lys Asn Asn Ala Gly Glu Ile Trp Tyr Asp Ile Thr Gly Asn Gin Thr Asn Thr Vai Thr Ile Asn Lys Asp Gly Trp Gly Gin Phe His Vai Asn Gly Gly Ser Vai Ser Ile Tyr Vai Gin Lys SEQIDNO: 167 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatca acaggcgttcacgccgaaaccgtacataaaggtaaatctccaacagcagataaaaacggtgtattttatgaggtgtatgtaaactctttttacgatg caaataaagatggacatggtgatttaaaaggtcttacacaaaagttggattatttaaatgatggcaattctcatacaaagaatgatcttcaagtaaac gggatttggatgatgccggtcaacccttctcccagctatcataaatatgatgtaacggactattataatattgatccgcagtatggaaatctgcaag attttcgcaaactgatgaaagaagcagataaacgagatgtaaaagtcattatggacctcgttgtgaatcatacgagcagtgaacacccttggtttc aagctgcattaaaagataaaaacagcaagtacagagattactatatctgggctgataaaaataccgacttgaatgaaaaaggatcttggggaca gcaagtatggcataaagccccaaacggagagtatttttacggaacgttttgggaaggaatgccggacttaaattacgataatcctgaagtaagaa aagaaatgattaacgtaggaaagttttggctaaagcaaggagttgacgggttccgtctagatgctgcgcttcatatttttaaaggccaaacacctg •« ·· · « · · * » 9 *
    VÍ»
    Fig 16(cont.) 96/116 aaggcgctaagaaaaatctcctgtggtggaatgaatttagagatgcaatgaaaaaggaaaaccctaacgtatatctaacgggtgaagtatggga tcaaccggaâgtagtagctccttactatcaatcgcttgattctttatttaactttgatttagcaggaaagattgtaaactctgtaaaatcaggaaatgat caaggaatcgcgactgcagcagcggcaacggatgaactgttcaaatcatacaatccaaataaaattgacggtattttcttaaccaaccatgacca aaatcgcgtcatgagtgagctaagcggcgatgtgaataaagcaaagtcagctgcctctatcttacttacgcttcctggcaacccgtatatttattac ggtgaagaaatcggcatgaccggtgaaaagcctgatgagttaatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaaccag ctgggaaacacctgtatacaacaaaggcggcaacggcgtgtctgtagaagcacaaacaaaacaaaaggactctttgttaaatcattaccgtgaa atgattcgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaagaagtcgttgcctatagccgcac gtataaaggcaaatcgattagcgtgtatcataatatttcaaatcaaccggtaaaagtatctgtagcagcaaaaggtaaattgatttttggtagtgaaa aaggtgctaagaaagtcaaaaatcagcttgtgattccggcgaatacaacggttttaataaaataa
    SEQ IDNO: 168
    Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Asn Ser Vai Lys Ser Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Gly Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Ile Lys
    SEQ ID NO: 169 atgaaaacattcaaattaaaacgcacttttttaccgctaaccttgctgctcagtgctcctgcctttgctgggcaaaatggcaccatgatgcagtatttt cattggtatgtacctaatgatggcgcattatggacgcaggttgaaagcaatgctccagcactcgctgaaaacggttttacagcgctctggctacc gccagcttacaaaggcgcgggcggcagtaatgacgtcggttatggcgtctatgatatgtacgatttaggtgagtttgatcaaaaaggctcagtac gaaccaaatacggcaccaaggctcagtacatctctgcaatcaatgccgcgcacaacaacaatatccaaatctacggcgatgttgtgtttaaccac cgaggtggtgctgatgggaagtcgtgggtcgataccaagcgcgttgattgggacaaccgtaacattgaactgggcgacaaatggattgaagct tgggttgagtttaattttcctggccgcaacgacaaatactcaaacttccattggacttggtatcactttgacggtgttgactgggatgatgccggcaa agaaaaagcgatctttaaattcaaaggcgaaggaaaagcatgggattgggaagtcagctctgaaaaaggcaattacgactacctaatgtacgc cgatttagacatggatcaccaagaagttaaacaagagctgaaagattggggtgagtggtacatcaacatgaccggcgttgatggctttagaatg gatgccgtgaagcacattaaatatcagtatctacaagagtggattgatcatttacgttggaaaacaggcaaagagcttttcaccgttggtgagtatt ggaattacgacgtaaatcaactgcataactttattactaagacctctggcagtatgtcgttgttcgatgcgccgcttcacatgaacttctacaacgcg tcaaaatctggcggcaattacgatatgcgccaaatcatgaatggcacgttgatgaaggacaacccagtcaaagctgtgactctcgtagaaaacc acgatacacagccattgcaggcgttagagtcgacagtggattggtggttcaagcctcttgcttacgcattcattttattgcgtgaagaaggttatcc atcagtgttctacgcagattactacggcgcgcagtacagcgacaaaggctacaacatcaatatggccaaagttccttacattgaagaacttgtaa : : · j
    Fig 16 (cont.)
    97/116 cactgcgtaaagagtatgcgtatggcaaacagaattcttatctcgaccactgggatgtgattggctggacccgagagggcgatgctgaacatcc aaactcaatggcggtgatcátgagtgatggaccaggtggcaaaaaatggatgtataccggtaagccaagcacgcgctatgtcgacaagctgg gtatccgaactgaagaagtttggaccgataccaatggctgggcagaatttcctgtcaatggtggttcagtctcggtttgggtgggcgttaagtaa
    SEQIDNO: 170
    Met Lys Thr Phe Lys Leu Lys Arg Thr Phe Leu Pro Leu Thr Leu Leu Leu Ser Ala Pro Ala Phe Ala Gly Gin Asn Gly Thr Met Met Gin Tyr Phe His Trp Tyr Vai Pro Asn Asp Gly Ala Leu Trp Thr Gin Vai Glu Ser Asn Ala Pro Ala Leu Ala Glu Asn Gly Phe Thr Ala Leu Tip Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly Glu Phe Asp Gin Lys Gly Ser Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Ile Ser Ala Ue Asn Ala Ala His Asn Asn Asn Ile Gin Ile Tyr Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asp Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp Ile Glu Ala Trp Vai Glu Phe Asn Phe Pro Gly Arg Asn Asp Lys Tyr Ser Asn Phe His Trp Thr Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Asp Ala Gly Lys Glu Lys Ala Ile Phe Lys Phe Lys Gly Glu Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Gin Glu Vai Lys Gin Glu Leu Lys Asp Trp Gly Glu Trp Tyr Ile Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His Ile Lys Tyr Gin Tyr Leu Gin Glu Trp Ile Asp His Leu Arg Trp Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu Tyr Trp Asn Tyr Asp Vai Asn Gin Leu His Asn Phe Ile Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala Ser Lys Ser Gly Gly Asn Tyr Asp Met Arg Gin Ile Met Asn Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn His Asp Thr Gin Pro Leu Gin Ala Leu Glu Ser Thr Vai Asp Trp Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Asp Tyr Tyr Gly Ala Gin Tyr Ser Asp Lys Gly Tyr Asn Ile Asn Met Ala Lys Vai Pro Tyr Ile Glu Glu Leu Vai Thr Leu Arg Lys Glu Tyr Ala Tyr Gly Lys Gin Asn Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai Ile Met Ser Asp Gly Pro Gly Gly Lys Lys Trp Met Tyr Thr Gly Lys Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Glu Vai Trp Thr Asp Thr Asn Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Gly Vai Lys
    SEQIDNO: 171 gtgtatgtaaactctttttacgatgcaaataaagatggacatggtgatttaaaaggtcttacacaaaagttggattatttaaatgatggcaattctcata caaagaatgatcttcaagtaaacgggatttggatgatgccggtcaacccttctcccagctatcataaatatgatgtaacggactattataatattgat ccgcagtatggaaatctgcaagattttcgcaaactgatgaaagaagcagataaacgagatgtaaaagtcattatggacctcgttgtgaatcatac gagcagtgaacacccttggtttcaagctgcattaaaagataaaaacagcaagtacagagattactatatctgggctgataaaaataccgacttga atgaaaaaggatcttggggacagcaagtatggcataaagccccaaacggagagtatttttacggaacgttttgggaaggaatgccggacttaaa ttacgataatcctgaagtaagaaaagaaatgattaacgtaggaaagttttggctaaagcaaggagttgacgggttccgtctagatgctgcgcttca tatttttaaaggccaaacacctgaaggcgctaagaaaaatctcctgtggtggaatgaatttagagatgcaatgaaaaaggaaaaccctaacgtat atctaacgggtgaagtatgggatcaaccggaagtagtagctccttactatcaatcgcttgattctttatttaactttgatttagcaggaaagattgtaa actctgtaaaatcaggaaatgatcaaggaatcgcgactgcagcagcggcaacggatgaactgttcaaatcatacaatccaaataaaattgacgg tattttcttaaccaaccatgaccaaaatcgcgtcatgagtgagctaagcggcgatgtgaataaagcaaagtcagctgcctctatcttacttacgctt cctggcaacccgtatatttattacggtgaagaaatcggcatgaccggtgaaaagcctgatgagttaatccgtgaaccgttccgctggtacgaagg aaacggacttggacaaaccagctgggaaacacctgtatacaacaaaggcggcaacggcgtgtctgtagaagcacaaacaaaacaaaaggac tctttgttaaatcattaccgtgaaatgattcgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaag aagtcgttgcctatagccgcacgtataaaggcaaatcgattagcgtgtatcataatatttcaaatcaaccggtaaaagtatctgtagcagcaaaag gtaaattgatttttggtagtgaaaaaggtgctaagaaagtcaaaaatcagcttgtgattccggcgaatacaacggttttaataaaataa
    SEQIDNO: 172
    Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro • · · ········· ·
    1 · 2··· · ···
    98/116
    Fig 16 (cont.)
    Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Ττρ Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Asn Ser Vai Lys Ser Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser lie Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser He Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Gly Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Ile Lys
    SEQIDNO: 173 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatca acaggcgttcacgcagaaactgtacataaaggtaaagctccaacagcagataaaaacggtgttttttatgaggtgtatgtaaactctttttacgatg caaataaagatggacatggtgatttaaaaggtctgacacaaaagttggattatttaaatgacggcaattctcatacaaagaatgatcttcaagtaaa cgggatttggatgatgccggtaaacccttctcctagctatcataaatatgatgtaacggactattataacattgatcctcagtacggaagtctgcaa gatttccgcaaactgatgaaagaagcagataaacgagacgtaaaagttattatggaccttgttgtgaatcatacgagcagtgaacacccttggttt caagctgcactaaaagataaaaacagcaagtacagagattactatatttgggctgataaaaataccgatttgaatgaaaaaggatcttggggaca gcaagtatggcataaagctccaaacggagagtatttttacggaacgttctgggaaggaatgcctgacttaaattacgataaccctgaagtaagaa aagaaatgattaacgtcggaaagttttggctaaagcaaggcgttgatggcttccgcttagatgctgcccttcatatctttaaaggtcaaactcctga aggcgctaagaaaaatctcctgtggtggaatgagtttagagatgcaatgaaaaaagaaaaccctaacgtatatctaacgggtgaagtatgggat cagccggaagtagtagctccttattatcaatcgcttgattccctatttaactttgatttagcaggaaaaattgtcagctctgtaaaagcaggaaatgat caaggaatcgccactgcagcagcggcaacggatgagctgttcaaatcatacaatccaaataaaattgacggcattttcttaaccaaccatgacca aaaccgcgtcatgagtgagctaagcggagatgtgaataaagcaaaatcagctgcttctatcttacttacgcttcctggaaatccgtatatttattacg gtgaagaaattggcatgaccggtgaaaagcctgatgaattaatccgtgaaccgttccgctggtacgaaggcaacggaattggacaaactagct gggaaacacctgtatataacaaaggcggcaatggtgtgtctgtagaagcacaaaccaaacaaaaggattctttgttaaatcattaccgtgaaatg attcgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcagtctatttcagtagacagtaaagaagttgtcgcttatagccgtacgtat aaaggcaactccattagtgtgtatcataatatttcaaatcaacctgtaaaagtatctgtagcggcgaaaggtaaattgatttttgctagtgaaaaagg tgctaaaaaaggcaaaaatcagcttgtgattccggcgaatgcgacggttttaataaaataa
    SEQIDNO: 174
    Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Ser Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly • ·· ··· ··· ·
    Fig 16 (cont.)
    99/116 ·· · · · ·
    Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Ile Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Gly Lys Asn Gin Leu Vai Ile Pro Ala Asn Ala Thr Vai Leu Ile Lys
    SEQ IDNO: 175 atgaaaaatataatacgactttgtgctgccagcgctatcctcacggtgtcccacgccagttacgccgacgcaattttacacgcgtttaactggcaat ataccgatgtaaccgccaatgcaaatcaaattgccgcaaatggctttaaaaaagtcctcatttcacccgcaatgaaatccagcggcagtcaatgg tgggcccgctatcaaccgcaagacttgcgtgtcattgattctccgctgggcaacaaacaagatttagtcgcgatgatcaatgcgctcaacagcgt tggggtcgacgtgtatgctgacgtggtgcttaaccatatggctaacgagtcatggaagcgcagtgacctgaactacccggggagtgaggtgct caacgactatcaatcccgcagtgcttactatcaaaggcaaacacttttcggcaatttacaggagaaccttttttccgagaatgatttccatccggca ggctgtattaccaattggaatgatcctggccacgtccagtattggcgcttgtgcggcggacagggcgatactgggctaccggatctcgatcctaa tcaatgggttgtgagtcagcagaagagttacttgaacgcactcaaatcaatgggaatcaaagggttccgtatcgatgcggtcaaacatatgagtc aatatcaaatagaccaagtgtttaccccagacattaccgctggtatgcatatattcggagaagtcattaccagtggtgggcaaggtgatagcggct atgaggcttttcttgccccttaccttaataataccgatcacgccgcttatgacttcccgctatttgcatcgattcgagccgcgttttcattctctggtgg gttaaatcagctacacaatccacaagcctatggccaagcgttacaggactcacgtgcgatcacctttacgattacccacgacattccaaccaatg acggtttccgctaccagatcatggatccaaccgatgaacagctcgcctatgcctacatcttgggcaaagatggaggaacgccacttgtctatagt gatgacctacctgacagcgaagacaaagacagtggtcgttgggccgatgtgtggcaagatccgaacatgattaacatgcttgccttccacaacg cgatgcaaggacaaagcatgactgtagtggctagcgatcaatgtaccttgctatttaagcgcggcaagcaaggcgtggtaggaatcaataaatg tggcgagagtaagtcggtgactgtcgatacttaccagcatgagtttaactggtacaccccgtaccaagacgtattgagcggcgacatcaccaca gtgagttctcgttatcaccaatttgttttgccagcgcgcagtgcaaggatgtggaaactataa
    SEQID NO: 176
    Met Lys Asn Ile Ile Arg Leu Cys Ala Ala Ser Ala Ile Leu Thr Vai Ser His Ala Ser Tyr Ala Asp Ala Ile Leu His Ala Phe Asn Trp Gin Tyr Thr Asp Vai Thr Ala Asn Ala Asn Gin Ile Ala Ala Asn Gly Phe Lys Lys Vai Leu Ile Ser Pro Ala Met Lys Ser Ser Gly Ser Gin Trp Trp Ala Arg Tyr Gin Pro Gin Asp Leu Arg Vai Ile Asp Ser Pro Leu Gly Asn Lys Gin Asp Leu Vai Ala Met Ile Asn Ala Leu Asn Ser Vai Gly Vai Asp Vai Tyr Ala Asp Vai Vai Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Ser Asp Leu Asn Tyr Pro Gly Ser Glu Vai Leu Asn Asp Tyr Gin Ser Arg Ser Ala Tyr Tyr Gin Arg Gin Thr Leu Phe Gly Asn Leu Gin Glu Asn Leu Phe Ser Glu Asn Asp Phe His Pro Ala Gly Cys Ile Thr Asn Trp Asn Asp Pro Gly His Vai Gin Tyr Trp Arg Leu Cys Gly Gly Gin Gly Asp Thr Gly Leu Pro Asp Leu Asp Pro Asn Gin Trp Vai Vai Ser Gin Gin Lys Ser Tyr Leu Asn Ala Leu Lys Ser Met Gly Ile Lys Gly Phe Arg Ile Asp Ala Vai Lys His Met Ser Gin Tyr Gin Ile Asp Gin Vai Phe Thr Pro Asp Ile Thr Ala Gly Met His Ile Phe Gly Glu Vai Ile Thr Ser Gly Gly Gin Gly Asp Ser Gly Tyr Glu Ala Phe Leu Ala Pro Tyr Leu Asn Asn Thr Asp His Ala Ala Tyr Asp Phe Pro Leu Phe Ala Ser Ile Arg Ala Ala Phe Ser Phe Ser Gly Gly Leu Asn Gin Leu His Asn Pro Gin Ala Tyr Gly Gin Ala Leu Gin Asp Ser Arg Ala Ile Thr Phe Thr Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pro Thr Asp Glu Gin Leu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Thr Pro Leu Vai Tyr Ser Asp Asp Leu Pro Asp Ser Glu Asp Lys Asp Ser Gly Arg Trp Ala Asp Vai Tip Gin Asp Pro Asn Met Ile Asn Met Leu Ala Phe His Asn Ala Met Gin Gly Gin Ser Met Thr Vai Vai Ala Ser Asp Gin Cys Thr Leu Leu Phe Lys Arg Gly Lys Gin Gly Vai Vai Gly Ile Asn Lys Cys Gly
    Fig 16 (cont.)
    100/116
    Glu Ser Lys Ser Vai ThT Vai Asp Thr Tyi Gin His Glu Phe Asn Trp Tyr Thr Pro Tyr Gin Asp Vai Leu Ser Gly Asp Ile Thr Thr Vai Ser Ser Arg Tyr His Gin Phe Vai Leu Pro Ala Arg Ser Ala Arg Met Tip Lys Leu
    SEQIDNO: 177 atgaaaacattcaaattaaaacgcacttttttaccgctgaccttgctgctcagtgctcctgcctttgctgggcaaaatggcaccatgatgcagtatttt cattggtacgtacctaatgatggcgcattatggacgcaggttgaaagcaatgctccagtactegctgaaaacggttttacagcgctctggctacc gcccgcatacaaaggcgcgggcggcagtaatgacgtcggttatggcgtctatgatatgtacgatttaggtgagtttgaccaaaaaggctcagta cgaaccaaatacggcaccaaggctcagtacatctctgcaatcaatgccgcgcacaacaacaatatccaaatttacggcgacgttgtgtttaacca ccgaggtggcgctgatgggaagtcgtgggtcgataccaagcgcgttgattgggacaaccgcaatattgaactgggcgacaaatggattgaag cttgggttgagtttaattttcctggccgcaacgacaaatactcgaacttccattggacttggtatcactttgacggtgttgactgggatgatgccggc aaagaaaaagcgatctttaaattcaaaggcgaaggaaaagcatgggattgggaagtcagctctgaaaaaggcaattacgactacctaatgtac gccgatttagacatggatcacccagaagttaaacaagagctgaaagattggggtgagtggtacatcaacatgaccggcgttgatggctttagaa tggatgccgtgaagcacattaaatatcagtatctacaagagtggattgatcatttacgttggaaaacaggcaaagagcttttcaccgttggtgagta ttggaattacgacgtaaatcaactgcacaactttattactaagacctctggcagtatgtcgttgttcgatgcgccgcttcacatgaatttctacaacgc gtcaaaatctggcggcacttacgatatgcgccaaatcatgaatggcacgttgatgaaggacaacccagtcaaagcagtgactctcgtagaaaac cacgatacgcagccattgcaggcgttagagtcgacagtagattggtggttcaagcctcttgcttacgcattcattttattgcgtgaagaaggttatc catcggtgttctacgcagattactacggcgcgcagtacagcgacaaaggttacaacattaatatggccaaagtgccttacattgaagaacttgtaa cactgcgtaaagagtatgcgtatggcaaacagaattcttatctcgaccattgggatgtgattggctggacccgagagggcgatgctgaacatcc aaactcaatggcggtgatcatgagtgatggaccgggcggcacaaaatggatgtataccggtaagccaagtacgcgctatgtcgacaagctgg gtatccgaactgaagatgtttggaccgatgccaatggctgggcagaatttcctgtcaatggtggttcagtctcggtttgggtgggcgttaagtaa
    SEQIDNO: 178
    Met Lys Thr Phe Lys Leu Lys Arg Thr Phe Leu Pro Leu Thr Leu Leu Leu Ser Ala Pro Ala Phe Ala Gly Gin Asn Gly Thr Met Met Gin Tyr Phe His Tip Tyr Vai Pro Asn Asp Gly Ala Leu Trp Thr Gin Vai Glu Ser Asn Ala Pro Vai Leu Ala Glu Asn Gly Phe Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly Glu Phe Asp Gin Lys Gly Ser Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Ile Ser Ala Ile Asn Ala A,a His Asn Asn Asn Ile Gin Ile Tyr Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asp Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp Ile Glu Ala Trp Vai Glu Phe Asn Phe Pro Gly Arg Asn Asp Lys Tyr Ser Asn Phe His Trp Thr Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Asp Ala Gly Lys Glu Lys Ala Ile Phe Lys Phe Lys Gly Glu Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Lys Gin Glu Leu Lys Asp Trp Gly Glu Trp Tyr Ile Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His lie Lys Tyr Gin Tyr Leu Gin Glu Trp Ile Asp His Leu Arg Trp Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu Tyr Trp Asn Tyr Asp Vai Asn Gin Leu His Asn Phe Ile Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala Ser Lys Ser Gly Gly Thr Tyr Asp Met Arg Gin Ile Met Asn Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn His Asp Thr Gin Pro Leu Gin Ala Leu Glu Ser Thr Vai Asp Trp Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Asp Tyr Tyr Gly Ala Gin Tyr Ser Asp Lys Gly Tyr Asn Ile Asn Met Ala Lys Vai Pro Tyr Ile Glu Glu Leu Vai Thr Leu Arg Lys Glu Tyr Ala Tyr Gly Lys Gin Asn Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai Ile Met Ser Asp Gly Pro Gly Gly Thr Lys Trp Met Tyr Thr Gly Lys Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Asp Vai Trp Thr Asp Ala Asn Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Gly Vai Lys
    SEQIDNO: 179 atgaaaacattcaaattaaaacgcacttttttaccgctaaccttgctgctcagtgctcctgcctttgccgggcaaaatggcaccatgatgcagtactt tcattggtacgtacctaatgatggcgcattatggacgcaggttgaaagcaatgctccagcactcgctgaaaacggttttacagcgctctggctacc ··« »: · t • · • ·
    Fig 16 (conr.) 101/116 gccagcttacaaaggcgcgggcggcagtaatgatgtcggttatggcgtctacgatatgtacgatttaggtgagtttgatcaaaaaggctcagtac gaaccaaatacggtaccaaggctcagtacatctctgcaatcaatgctgcgcacaacaacaatatccaaatttacggcgacgttgtgtttaaccatc gtggtggcgctgatgggaagtcgtgggtcgataccaagcgcgttgattgggacaaccgtaacattgaactgggcgacaaatggattgaagctt gggttgagtttaattttcctagccgcaacgacaaatactcgaacttccattggacttggtatcactttgacggtgttgactgggatgatgccggcaa agaaaaagcgatctttaaattcaaaggcgaaggaaaagcatgggattgggaagtcagctctgaaaaaggcaattacgactacctaatgtacgc cgatttagacatggatcacccagaagttaaacaagagctgaaagattggggtgagtggtacatcaacatgaccggcgttgatggctttagaatg gatgccgttaagcacattaaatatcagtatctacaagagtggattgatcatttacgttggaaaacaggcaaagagcttttcaccgttggtgagtattg gaattacgacgtaaatcaactgcataactttattactaagacctctggcagtatgtcgttgttcgatgcgccgcttcacatgaacttctacaacgcgt caaaatctggcggcaattacgatatgcgccaaatcatgaatggcacgttgatgaaggacaacccagtcaaagctgtgactctcgtagaaaacca cgatacgcagccattgcaggcgttagagtcgacagtggattggtggttcaagcctcttgcttacgcattcatcttgttgcgtgaagaaggttatcca tcggtgttctacgcagattactacggcgcgcagtacagcgacaaaggttacaacattaatatggccaaagtgccttacattgaagaacttgtaaca ctgcgtaaagagtatgcgtatggcaaacagaattcttatctcgaccattgggatgtgattggctggactcgagagggcgatgctgaacatccaaa ctcaatggcggtgatcatgagtgatggaccgggcggaacaaaatggatgtataccggtaatccaagcacgcgctatgtcgacaagctgggtat ccgaactgaagatgtttggaccgatgccaatggctgggcagaatttcctgtcaatggtggttcagtctcggtttgggtgggcgttaagtaa
    SEQIDNO: 180
    Met Lys Thr Phe Lys Leu Lys Arg Thr Phe Leu Pro Leu Thr Leu Leu Leu Ser Ala Pro Ala Phe Ala Gly Gln Asn Gly Thr Met Met Gln Tyr Phe His Trp Tyr Vai Pro Asn Asp Gly Ala Leu Trp Thr Gln Vai Glu Ser Asn Ala Pro Ala Leu Ala Glu Asn Gly Phe Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly Glu Phe Asp Gln Lys Gly Ser Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gln Tyr He Ser Ala Ile Asn Ala Ala His Asn Asn Asn lie Gln Ile Tyr Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asp Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp Ile Glu Ala Trp Vai Glu Phe Asn Phe Pro Ser Arg Asn Asp Lys Tyr Ser Asn Phe His Trp Thr Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Asp Ala Gly Lys Glu Lys Ala He Phe Lys Phe Lys Gly Glu Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Lys Gln Glu Leu Lys Asp Trp Gly Glu Trp Tyr He Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His Ile Lys Tyr Gln Tyr Leu Gln Glu Trp Ile Asp His Leu Arg Trp Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu Tyr Trp Asn Tyr Asp Vai Asn Gln Leu His Asn Phe Ile Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala Ser Lys Ser Gly Gly Asn Tyr Asp Met Arg Gln Ile Met Asn Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn His Asp Thr Gln Pro Leu Gln Ala Leu Glu Ser Thr Vai Asp Trp Trp Phe Lys Pro Leu Ala Tyr Ala Phe He Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Αφ Tyr Tyr Gly Ala Gln Tyr Ser Asp Lys Gly Tyr Asn Ile Asn Met Ala Lys Vai Pro Tyr Ile Glu Glu Leu Vai Thr Leu Arg Lys Glu Tyr Ala Tyr Gly Lys Gln Asn Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai Ile Met Ser Asp Gly Pro Gly Gly Thr Lys Trp Met Tyr Thr Gly Asn Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Asp Vai Trp Thr Asp Ala Asn Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Gly Vai Lys
    SEQIDNO: 181 ttgccagaggccttcggcctggccattacgccgtcacatagccggcgggggaggttggtgggcgtgtcgcgcgggggcagcctgccgatgc cggtcctccactggccggcgttcatcctcgtccggcgcttcgtcgccggtcatccgaacaagcacaagaaccggagtattgcgatgagccaca ccctgcgtgccgccgtattggcggcgatcctgctgccgttccccgccctcgctgaccaggccggcaagagcccggccggcgtgcgctacca cggcggcgacgaaatcatcctccagggcttccactggaacgtcgtccgcgaagcgcccaacgactggtacaacatccttcgccagcaggcct cgacgatcgccgcggacggcttctcggcaatctggatgccggtgccctggcgtgacttctccagctggaccgacggcggcaagtcaggcgg cggcgaaggctacttctggcacgacttcaacaagaacggccgctacggcagcgacgcccagctgcgccaggccgccggcgcactcggtgg cgccggggtgaaggtgctctacgatgtggtgcccaatcacatgaaccgcggctatccggacaaggagatcaacctgccggccggccagggc ttctggcgcaacgactgcaccgacccgggcaactaccccaacgactgcgatgacggtgaccgcttcatcggcggcaagtcggacctgaaca ccggccatccgcagatctacggcatgtttcgcgacgagcttgccaacctgcgcagcgggtacggcgccggcggcttccgcttcgacttcgttc >*»··· • < · »
    Fig 16 (cont.) 102/116 gcggctatgcgcccgaacgggtcgacagctggatgagcgacagcgccgacagcagtttctgcgttggcgagctgtggaaaagcccgtccga gtacccgagctgggactggcgcaacacggcgagctggcagcagatcatcaaggactggtccgaccgggccaagtgcccggtgttcgacttc gcgctcaaggagcgcatgcagaacggctcggtcgccgactggaagcatggcctcaatggcaacccggacccgcgctggcgcgaggtggc ggtgacctttgtcgacaaccacgacaccggctattcgcccgggcagaacggcggccagcaccactgggcgctgcaggacgggctgatccg ccaggcctacgcctacatcctcaccagcccgggcacgccggtggtgtactggtcgcacatgtacgactggggctacggcgacttcattcgcca gctgatccaggtgcggcgcaccgctggcgtgcgcgccgattcggcgatcagcttccacagcggctacagcggcctggtcgctaccgtcagc ggcagccatcagaccctggtggtggcgctcaactccgatctggccaaccccggccaggtcgccagcggcagcttcagcgaggcggtcaac gccagcaacggccaggtgcgcgtctggcgcagcggtagcggcgatggcggcggcaatgacggcggcgagggcggtctggtcaatgtgaa cttccgctgcgacaacggcgtgacgcagatgggcgacagcgtctacgcggtgggcaacgtcagccagctcggcaactggagcccggcctc cgcggtacggctgaccgacaccagcagctatccgacctggaagggcagcatcgccctgcctgacggtcagaacgtggaatggaagtgcctg atccgtaacgaggcggacgcgacgctggtgcgccagtggcaatcgggcggcaacaaccaggtccaggccgctgccggcgcgagcacca gcggctcgttctga
    SEQIDNO: 182
    Met Pro Glu Ala Phe Gly Leu Ala Ile Thr Pro Ser His Ser Arg Arg Gly Arg Leu Vai Gly Vai Ser Arg Gly Gly Ser Leu Pro Met Pro Vai Leu His Tip Pro Ala Phe Ile Leu Vai Arg Arg Phe Vai Ala Gly His Pro Asn Lys His Lys Asn Arg Ser Ile Ala Met Ser His Thr Leu Arg Ala Ala Vai Leu Ala Ala Ile Leu Leu Pro Phe Pro Ala Leu Ala Asp Gin Ala Gly Lys Ser Pro Ala Gly Vai Arg Tyr His Gly Gly Asp Glu Ile Ile Leu .Gin Gly Phe His Trp Asn Vai Vai Arg Glu Ala Pro Asn Asp Trp Tyr Asn Ile Leu Arg Gin Gin Ala Ser Thr Ile Ala Ala Asp Gly Phe Ser Ala Ile Trp Met Pro Vai Pro Tip Arg Asp Phe Ser Ser Trp Thr Asp Gly Gly Lys Ser Gly Gly Gly Glu Gly Tyr Phe Trp His Asp Phe Asn Lys Asn Gly Arg Tyr Gly Ser Asp Ala Gin Leu Arg GIn Ala Ala Gly Ala Leu Gly Gly Ala Gly Vai Lys Vai Leu Tyr Asp Vai Vai Pro Asn His Met Asn Arg Gly Tyr Pro Asp Lys Glu Ile Asn Leu Pro Ala Gly Gin Gly Phe Trp Arg Asn Asp Cys Thr Asp Pro Gly Asn Tyr Pro Asn Asp Cys Asp Asp Gly Asp Arg Phe Ile Gly Gly Lys Ser Asp Leu Asn Thr Gly His Pro Gin Ile Tyr Gly Met Phe Arg Asp Glu Leu Ala Asn Leu Arg Ser Gly Tyr Gly Ala Gly Gly Phe Arg Phe Asp Phe Vai Arg Gly Tyr Ala Pro Glu Arg Vai Asp Ser Trp Met Ser Asp Ser Ala Asp Ser Ser Phe Cys Vai Gly Glu Leu Trp Lys Ser Pro Ser Glu Tyr Pro Ser Trp Asp Tip Arg Asn Thr Ala Ser Trp Gin Gin Ile He Lys Asp Trp Ser Asp Arg Ala Lys Cys Pro Vai Phe Asp Phe Ala Leu Lys Glu Arg Met Gin Asn Gly Ser Vai Ala Asp Trp Lys His Gly Leu Asn Gly Asn Pro Asp Pro Arg Trp Arg Glu Vai Ala Vai Thr Phe Vai Asp Asn His Asp Thr Gly Tyr Ser Pro Gly Gin Asn Gly Gly Gin His His Trp Ala Leu Gin Asp Gly Leu Ile Arg Gin Ala Tyr Ala Tyr Ile Leu Thr Ser Pro Gly Thr Pro Vai Vai Tyr Trp Ser His Met Tyr Asp Trp Gly Tyr Gly Asp Phe Ile Arg Gin Leu Ile Gin Vai Arg Arg Thr Ala Gly Vai Arg Ala Asp Ser Ala Ile Ser Phe His Ser Gly Tyr Ser Gly Leu Vai Ala Thr Vai Ser Gly Ser His Gin Thr Leu Vai Vai Ala Leu Asn Ser Asp Leu Ala Asn Pro Gly Gin Vai Ala Ser Gly Ser Phe Ser Glu Ala Vai Asn Ala Ser Asn Gly Gin Vai Arg Vai Trp Arg Ser Gly Ser Gly Asp Gly Gly Gly Asn Asp Gly Gly Glu Gly Gly Leu Vai Asn Vai Asn Phe Arg Cys Asp Asn Gly Vai Thr Gin Met Gly Asp Ser Vai Tyr Ala Vai Gly Asn Vai Ser Gin Leu Gly Asn Trp Ser Pro Ala Ser Ala Vai Arg Leu Thr Asp Thr Ser Ser Tyr Pro Thr Trp Lys Gly Ser Ile Ala Leu Pro Asp Gly Gin Asn Vai Glu Trp Lys Cys Leu Ile Arg Asn Glu Ala Asp Ala Thr Leu Vai Arg Gin Trp Gin Ser Gly Gly Asn Asn Gin Vai Gin Ala Ala Ala Gly Ala Ser Thr Ser Gly Ser Phe
    SEQIDNO: 183 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatca acaggcgttcacgccgaaaccgtacataaaggtaagtctgaagcaacagataaaaacggtgtcttttatgaggtgtatgtaaactctttttacgata caaataaagatggacatggtgatttaaaaggtctgacacaaaagttggattatttaaatgacggcaattctcatacaaagaatgatcttcaagtaaa cgggatttggatgatgccagtcaacccttctcctagctatcataaatatgatgtaacggactattataacattgatcctcagtacggaaatctgcaag attttcgcaagctgatgaaagaagcagacaaacgagacgtaaaagtcattatggaccttgttgtgaatcatacgagcagcgaacacccttggttt caagctgcattaaaagataaaaacagcaagtacagagattactatatttgggctgataaaaataccgatttgaatgaaaaaggatcttgggggca gcaagtatggcataaagctccaaacggagagtatttttacggaacgttttgggaaggaatgcctgacttaaattacgataaccctgaagtaagaa í l
    Fig 16 (cont.)
    103/116 r\ tS <1 aagaaatgattaacgtcggaaagttttggctaaagcaaggcgttaatggcttccgcttagatgctgcgcttcatatttttaaaggtcaaacacctga aggcgctaagaaaaatatcctgtggtggaatgagtttagagatgcgatgaaaaaagaaaaccctaacgtatatctaacgggtgaagtatgggat cagcctgaagtggtagctccttactatcaatcgcttgattctttatttaattttgatttagcaggaaaaattgtcagctctgtaaaagcaggaaatgatc aaggaatcgccactgcagcagcggcaacagatgaactgttcaaatcatacaatccaaataaaattgacggcattttcttaaccaaccatgaccaa aatcgcgtcatgagtgagctgagcggcgatgtgaacaaagcaaaatcagctgcttctatcttacttacgcttcctggcaacccgtatatttattacg gtgaagaaattggcatgaccggtgaaaagcctgatgagttaatccgtgaaccattccgctggtacgaaggaaacggacttggacaaactagct gggaaacacctgtatataacaaaggcggcaacggcgtgtctgtagaagtacaaaccaaacaaaaggattctttgttaaatcattatcgtgaaatg attcgcgtgcgtcagcagcatgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaagaagtggttgcctatagtcgcacgtat aaaggcaactcgattagcgtgtatcataatatttcaaatcaacctgtaaaagtatctgtagcagcgaaaggtaaattgatttttgctagtgaaaaagg tgctaaaaaagtcaaaaatcagcttgtaattccggctaatacaacggttttaataaaataa ·,
    SEQ IDNO: 184
    Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Tip Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Glu Ala Thr Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Thr Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asn Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Fio Phe Arg Tip Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Vai Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Ile Lys SEQ ID NO: 185 atgaaactgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatcaacaggcgttcacgccgaaactgtac ataaaggtaaagctccaacagcagataaaaacggtgtcttttatgaggtgtatgtaaactctttttacgatgcaaataaagatggacatggtgattta aaaggtcttacacaaaagctggactatttaaatgacggaaattctcatacaaagaatgatcttcaagtaaacgggatttggatgatgccagtcaac ccttctcctagctatcataaatatgatgtaacggattattataacattgatccgcagtacggaaatctgcaagattttcgcaagctgatgaaagaagc agacaaacgagacgtaaaagtcattatggaccttgttgtgaatcatacgagcagcgaacacccttggtttcaagctgcgttaaaagataaaaaca gcaagtacagagattactatatttgggctgataaaaataccgacttgaatgaaaaaggatcttggggacagcaagtatggcataaagctccaaac ggagagtatttttacggaacgttttgggaaggaatgcctgacttaaattacgataaccctgaagtaagaaaagaaatgattaacgtcggaaagtttt ggctaaagcaaggcgttgatggcttccgcttagatgctgcgcttcatatttttaaaggtcaaacgcctgaaggcgctaagaaaaatattctgtggt ggaatgagtttagagatgcgatgaaaaaagaaaaccctaacgtatatctaacgggtgaagtatgggatcagcctgaagtggtagctccttactat caatcgcttgattccctatttaactttgatttagcagggaaaattgtcagttctgtaaaagcaggaaatgatcaaggaatcgccactgcagcagcgg caacggatgagctgttcaaatcatacaatccaaataaaattgacggcattttcttaaccaaccatgaccaaaaccgcgtcatgagtgaactgatcg gcgatgtgaacaaagcaaaatcagctgcttctatcttacttacgcttcctggcaacccgtatatttattacggtgaagaaattggcatgaccggtga aaagcctgatgagttaatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaaccagctgggaaacacctgtatataacaaagg
    Fig 16(cont.)
    104/116 • ·-· «»·· • ·*
    - J * » 4 * 9 _ H · • · · · W » · * fc r/ cggcaacggcgtgtctgtagaagcacaaaccaaacaaaaggattctttgttaaatcattaccgtgaaatgattcgcgtgcgtcagcagcatgaag agttagtaaaaggaacgcttcaatctattttagtagacagtaaagaagttgttgcctatagccgtacgtataaagacaactcgattagcgtgtatcat aatatttcaaatcaaccggtaaaagtatctgtagcagcaaaaggtaaattaatttttgctagtgaaaaaggtgctaaaaaagtcaagaatcagcttg tgattccggctaatacaacggttttaataaaataa
    SEQIDNO: 186
    Met Lys Leu Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn He Leu Trp Tip Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly He Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ile Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr He Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Leu Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Asp Asn Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Πβ Lys
    SEQIDNO: 187 ttgtatctcatccaggaggggcacatgcgttttccgcccattattcacccgcttaccggcctggccgttccggttggagctctgcgtaccgcacag agctgcggcataggggagtttgccgacttgccggttcttgccgaattctgcaaaaaagccggatttgatcttgtacagcttcttccggtcaatgac accggcacagaaagttctccatacagcgcgctttctgcctttgccctgcacccgctgtatatcaggctttccgacctgcctgaagcagcgggtttc gaaaagcagattacagatctgaaaagccggtttgaggacttgcctcgtttcagctatacggagctgcgccgtgccaaactggatatcctgcgtgc agtgtttgataaaaacaaggcaaccatcatcggcagtgccgaactggaagcctggatttcagataacccctggatcatcgaatatgcggtttttat gaaccagaaacaccgcaactttgaagccggctggaaacattgggaaaagctgcgcaaccccactcataacgaaatacaaaaaacctggcag ggtaaaacctggcaggctgaccatcaattctttgcatggctgcagatgcggctggaccagcagtttactgccgccgctacagagtgcaacgcc ctgggtgtctatcttaagggcgatatacctataatgatgaacgaggattccgcagatgcctgggcgaatccggaattcttccgtgacgatcttcgg gccggaagtccccctgacggtgaaaacccccagggacaaaactggggcttccccatttataactgggaaaaccttgcaaatgacgggtacag ctggtggaaaaaacgtctgaagcacagcgcacggtattaccatgcctaccgcattgaccatattcttgggtttttccggatatgggctataccctat ggcgaatactccggctacctgggatggcccttgccgcatgaaccggtaagtgcagcagaactggcagaacggggcttttccaaggaccgctt gcgctggcttaccgaaccccacttgcctacacgggcagccgaggaagcgaataactgggactatctgggaacacacggctatctgaatcaga tcatgaaccgtatcggtgaagaagaactatggctgttcaagcccgagatcacctgcgaggcagatatacgaaacacaaacctgccggatgccc tgaaagaggttctggtacggcagtggaaaaaccggctgctgcaggttaccggccgcgacgaaaaaggacggacaatctactatccgctgtgg cgtttccgtgacagcactgcatggcagacgcttaccgatggcgagaaacactccctggaagagctgttcgcccaaaaagcggcgcacaatga aaccctgtggcgagaacaggcggtggaacttctgggtgagctgacgcgatctacggatatgcttgcctgtgctgaagatctgggaagtattccc cacagtgtaccggaagtgctttcaaacctttcaatttacagtctgcgggttacccgctgggcccgccaatgggatgcccccggccagccctttca cagactggaggagtatccgctcatgtcggtagcgaccccatcggttcatgattcctctaccctgcgcggatggtgggaaaccgaaggcggcga ccgggcctttatggacgcatggcctccggaacaggatgcatacgcaggagcaggccgccatgagttcgaaggcgcctggggaccccgcca :
    Fig 16 (cont.)
    105/116 ggcatcctgggtactccgtaaactctgcgaagcccgttccgcgctctgtgttttccccatccaggatattttggccctgtcttcagacttttatgcaat gacagcggacgaggaacgcatcaatattccgggcagtgtatccggatttaactggacataccggttgcctgcggcaatcgaggatttatctaaa aacagccaacttataaccgcaatccagaccgcgttgcaggaccgccgggcgaggaaggcacaaggagcacagcaatga
    SEQIDNO: 188
    Met Tyr Leu Ile Gin Glu Gly His Met Arg Phe Pro Pro Ile Ile His Pro Leu Thr Gly Leu Ala Vai Pro Vai Gly Ala Leu Arg Thr Ala Gin Ser Cys Gly He Gly Glu Phe Ala Asp Leu Pro Vai Leu Ala Glu Phe Cys Lys Lys Ala Gly Phe Asp Leu Vai Gin Leu Leu Pro Vai Asn Asp Thr Gly Thr Glu Ser Ser Pro Tyr Ser Ala Leu Ser Ala Phe Ala Leu His Pro Leu Tyr Ile Arg Leu Ser Asp Leu Pro Glu Ala Ala Gly Phe Glu Lys Gin Ile Thr Asp Leu Lys Ser Arg Phe Glu Asp Leu Pro Arg Phe Ser Tyr Thr Glu Leu Arg Arg Ala Lys Leu Asp Ile Leu Arg Ala Vai Phe Asp Lys Asn Lys Ala Thr He He Gly Ser Ala Glu Leu Glu Ala Trp He Ser Asp Asn Pro Tip Ile Ile Glu Tyr Ala Vai Phe Met Asn Gin Lys His Arg Asn Phe Glu Ala Gly Trp Lys His Trp Glu Lys Leu Arg Asn Pro Thr His Asn Glu Ile Gin Lys Thr Trp Gin Gly Lys Thr Trp Gin Ala Asp His Gin Phe Phe Ala Trp Leu Gin Met Arg Leu Asp Gin Gin Phe Thr Ala Ala Ala Thr Glu Cys Asn Ala Leu Gly Vai Tyr Leu Lys Gly Asp Ile Pro Ile Met Met Asn Glu Asp Ser Ala Asp Ala Trp Ala Asn Pro Glu Phe Phe Arg Asp Asp Leu Arg Ala Gly Ser Pro Pro Asp Gly Glu Asn Pro Gin Gly Gin Asn Trp Gly Phe Pro Ile TyT Asn Trp Glu Asn Leu Ala Asn Asp Gly Tyr Ser Trp Trp Lys Lys Arg Leu Lys His Ser Ala Arg Tyr Tyr His Ala Tyr Arg He Asp His Ile Leu Gly Phe Phe Arg He Trp Ala Ile Pro Tyr Gly Glu Tyr Ser Gly Tyr Leu Gly Trp Pro Leu Pro His Glu Pro Vai Ser Ala Ala Glu Leu Ala Glu Arg Gly Phe Ser Lys Asp Arg Leu Arg Trp Leu Thr Glu Pro His Leu Pro Thr Arg Ala Ala Glu Glu Ala Asn Asn Trp Asp Tyr Leu Gly Thr His Gly Tyr Leu Asn Gin Ile Met Asn Arg He Gly Glu Glu Glu Leu Trp Leu Phe Lys Pro Glu He Thr Cys Glu Ala Asp Ile Arg Asn Thr Asn Leu Pro Asp Ala Leu Lys Glu Vai Leu Vai Arg Gin Trp Lys Asn Arg Leu Leu Gin Vai Thr Gly Arg Asp Glu Lys Gly Arg Thr Ile Tyr Tyr Pro Leu Trp Arg Phe Arg Asp Ser Thr Ala Trp Gin Thr Leu Thr Asp Gly Glu Lys His Ser Leu Glu Glu Leu Phe Ala Gin Lys Ala Ala His Asn Glu Thr Leu Trp Arg Glu Gin Ala Vai Glu Leu Leu Gly Glu Leu Thr Arg Ser Thr Asp Met Leu Ala Cys Ala Glu Asp Leu Gly Ser He Pro His Ser Vai Pro Glu Vai Leu Ser Asn Leu Ser Ile Tyr Ser Leu Arg Vai Thr Arg Trp Ala Arg Gin Trp Asp Ala Pro Gly Gin Pro Phe His Arg Leu Glu Glu Tyr Pro Leu Met Ser Vai Ala Thr Pro Ser Vai His Asp Ser Ser Thr Leu Arg Gly Trp Trp Glu Thr Glu Gly Gly Asp Arg Ala Phe Met Asp Ala Trp Pro Pro Glu Gin Asp Ala Tyr Ala Gly Ala Gly Arg His Glu Phe Glu Gly Ala Trp Gly Pro Arg Gin Ala Ser Trp Vai Leu Arg Lys Leu Cys Glu Ala Arg Ser Ala Leu Cys Vai Phe Pro Ile Gin Asp Ile Leu Ala Leu Ser Ser Asp Phe Tyr Ala Met Thr Ala Asp Glu Glu Arg Ile Asn Ile Pro Gly Ser Vai Ser Gly Phe Asn Trp Thr Tyr Arg Leu Pro Ala Ala Ile Glu Asp Leu Ser Lys Asn Ser Gin Leu Ile Thr Ala Ile Gin Thr Ala Leu Gin Asp Arg Arg Ala Arg Lys Ala Gin Gly Ala Gin Gin
    SEQIDNO: 189 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatca acaggcgttcacgccgaaaccgtacataaaggtaaatctccagctgcagataaaaacggtgtcttttatgaggtgtatgtaaactctttttacgatg caaataaagatggacatggtgatttaaaaggtcttacacaaaaactggactatttaaatgatggcaattctcatacaaagaatgatcttcaagtaaa cgggatttggatgatgccgatcaacccttctcctagctatcataaatatgatgtaacggactattataacattgattctcagtacggaaatctgcaag attttcgcaagctaatgaaagaagcagataaacgagatgtaaaagttattatggacctcgttgtgaatcatacgagcagtgaacacccttggtttca agctgcgttaaaagataaaaacagcaagtacagagattactatatttgggctgataaaaataccgatttgaatgaaaaaggatcttggggacaac aagtatggcacaaagctccaaacggagagtatttttacggaacgttctgggaaggaatgcctgacttaaattacgataaccctgaagtaagaaaa gaaatgattaacgtcggaaagttttggctaaagcaaggcgttgacggcttccgcttagatgctgcccttcatatctttaaaggtcaaacacctgaa ggcgctaagaaaaatattgtgtggtggaatgaatttagagatgcgatgaaaaaagaaaacccgaacgtatatctaacgggcgaagtatgggatc agccggaagtggtagctccttattatcagtcgcttgattccctatttaactttgatttagcaggaaaaattgtcagctctgtaaaagcaggaaatgatc aaggaatcgctactgcagcagcggcaacagatgaactgttcaaatcatacaatccaaataaaattgacggcattttcttaaccaatcatgaccaaa atcgcgtcatgagtgagttaagcggagatgtcaataaagcaaagtcagctgcctctatcttacttacgcttcctggaaatccgtatatttattacggt gaagaaatcggcatgaccggtgaaaagcctgatgaattaatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaactagttgg
    106/116
    Fig 16 (cont.) gaaacacctgtatacaataaaggcggcaacggcgtgtctgtagaagcacaaaccaaacaaaaggactctttgttaaatcattaccgtgaaatgat tcgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaagaagttgttgcttatagccgtacgtataa aggcaactccattagtgtgtatcataatatttcaaatcaacctgtaaaagtatctgtagcagcgaaaggtaaattgatttttgctagtgaaaaaggtg ctaaaaaggtcaaaaatcagcttgtgattccggcgaatacaacggttttagtaaaataa
    SEQIDNO: 190 * Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Pro Ala Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Ile Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Ser Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn He Vai Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu He Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Vai Lys SEQ IDNO: 191 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatca acaggcgttcacgccgaaaccgtacataaaggtaaatctccaacagcagataaaaacggtgtcttttatgaagtgtatgtaaactctttttacgatg caaataaagatggacatggtgacttaaaaggtcttacacaaaagttggactatttaaatgacggcaattctcatacaaaaaatgatcttcaagtaaa cgggatttggatgatgccagtcaacccttctcctagctatcataaatatgatgtaacggactattataacattgatccgcagtacggaaatctgcaa gattttcgcaagctgatgaaagaagcagacaaacgagacgtaaaagtcattatggaccttgttgtgaatcatacgagcagtgaacacccttggttt caagctgcgttaaaagataaaaacagcaagtacagagattactatatttgggctgataaaaataccgacttgaatgaaaaaggatcttggggaca acaagtatggcataaagctccaaacggagagtatttttacggaacgttctgggaaggaatgcctgacttaaattacgataaccctgaagtaagaa aagaaatgattaacgtcggaaagttttggctaaagcaaggcgttgacgggttccgcttagatgctgcgcttcatatttttaaaggtcaaacagctga aggcgctaagaaaaatatcctgtggtggaatgagtttagagatgcgatgaaaaaagaaaatccgaatgtatatctaacgggtgaagtatgggat cagcctgaagtggtagctccttattatcaatcgcttgattctttatttaattttgatttagcaggaaaaattgtcagctctgtaaaagcaggaaatgatc aaggaatcgccactgcagcagcagcaacagatgaactgttcaaatcatacaatccaaacaaaattgatggcatattcttaaccaaccatgaccaa aatcgcgtcatgagtgagctgagcggcgatgtgagcaaagcaaaatcagctgcttctatcttacttacgcttcctggcaacccgtatatttattacg gtgaagaaatcggcatgaccggtgaaaagcctgatgaattaatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaaccagtt gggaaacacctgtatacaataaaggcggaaacggtgtgtctgtagaagcacaaaccaaacaaaaggattctttgttaaatcattaccgtgaaatg attcgcgtgcgtcagcagcatgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaagaagttgttgcttatagccgtacgtata aaggcaactccattagtgtgtatcataatatttcaaatcaaccggtaaaagtatctgtagcagcgaaaggtaaattgatttttgctagtgaaaaaggt gctaagaaagtcaaaaatcagcttgtggttccggcgaatacaacggttttaatgaaataa
    SEQIDNO: 192
    107/116
    Fig 16 (cont.)
    Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Tip Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Ala Glu Gly Ala Lys Lys Asn Ile Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Ser Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pio Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Vai Pro Ala Asn Thr Thr Vai Leu Met Lys
    SEQIDNO: 193 atgaaattcaaaaagagtttatctgccgggctccttttgttcggaggtctgagcggtgtgacaccatccgtcgctgcggaggtgccacgaaccgc atttgtccatttattcgaatggagttggccggatattgccaccgaatgcgaaacctttcttggccctaaggggttctctgcggttcaggtgtctccgc cgcaaaaaagcgtcagcaatgctgcctggtgggcgcgctaccaacctgttagttactcttttgaagggcgcagtggaacccgggctcaatttgc ggatatggtccagcgttgtaaagcggtgggggtcgatatttatctggatgcggtgatcaaccatatggcagcacaagatcgctattttccagaagt accttacagcagtaatgattttcacagttgcacgggcgatatcgattattccaaccgctggtcgattcaaaattgcgatctggttgggctgaacgat ctcaaaaccgagtcagaatacgttcggcagaaaattgcagactatatgaacgatgcgctcagtctgggcgtggcggggtttcggattgatgccg ccaagcatatcccggccggcgacatcgcggcgatcaagagcaagctcaacggcagcccgtatatctatcaggaggttatcggggcggcagg ggagccggtacaaaccagcgagtacacgtatattggagacgtgacggaatttaacttcgcccggaccatcgggcctaaatttaagcaaggtaat attaaagacctgcaggggattggttcgtggagcggctggctgagcagcgacgatgcggtgacctttgtgaccaaccatgacgaagaacgcca taaccctggccaggttctcagccatcaggactttggcaatctgtatttcctcggtaacgtgtttactctggcgtatccttacggctacccaaaagtga tgtcggggtactacttcagtaattttgatgccgggccaccatcgacaggggtacattctggtaatgcgtgtggctttgatggcggtgattgggtctg cgaacacaaatggcgtggtgtagccaacatggtggcgtttcgcaaccacacagcagcccagtggcaggtcactgactggtgggacgatggtt acaatcaggtggcgtttggtcgtggcgggctgggctttgtggtgatcaatcgagatgacaataaaggcatcaatcagagtttccagacgggaat gcccgctggcgagtattgtgacatcattgccggtgatttcgacacccagagcggtcattgcagcgctacgacgatcaccgtcgacagtcaggg gtatgcacattttactgtcggtagtcatcaggccgctgcgattcacattggcgcgaaactcggctccgtgtgccaggactgtggcggcacggcc gcagagacaaaagtctgctttgacaatgcacaaaactttagccaaccgtatttgcattactggaatgtcaatgcggatcaggccgtagcgaatgc aacctggccgggcgtcgcgatgacggctgaaaatggcggttactgctacgattttggtgtcggtctcaattcacttcaggtaattttcagcgataa cggcgccagccaaaccgctgatctgaccgccagcagtccgacgttgtgttaccagaacggaacgtggcgtgacagtgacttctgtcagagta gcaatgtgggcaacgagagttggtatttccgtggaacctcaaacggttggggcgtgagcgcactcacttatgaggctgcgacaggcctgtaca ctacggtgcagagctttaacggggaggagtcgcccgcacgctttaaaattgatgatggcaactggagtgagtcgtatccaagtgctgattatcaa gtcggtgattatgccacctacacgatcacgtttgacagccagacgaaggccatcaccgtgacttcgcagtaa
    SEQID NO: 194
    Met Lys Phe Lys Lys Ser Leu Ser Ala Gly Leu Leu Leu Phe Gly Gly Leu Ser Gly Vai Thr Pro Ser Vai Ala Ala Glu Vai Pro Arg Thr Ala Phe Vai His Leu Phe Glu Trp Ser Trp Pro Asp Ile Ala Thr
    Fig 16 (cont.)
    108/116
    Glu Cys Glu Thr Phe Leu Gly Pro Lys Gly Phe Ser Ala Vai Gin Vai Ser Pro Pro Gin Lys Ser Vai Ser Asn Ala Ala Trp Tip Ala Arg Tyr Gin Pro Vai Ser Tyr Ser Phe Glu Gly Arg Ser Gly Thr Arg Ala Gin Phe Ala Asp Met Vai Gin Arg Cys Lys Ala Vai Gly Vai Asp Ile Tyr Leu Asp Ala Vai Ile Asn His Met Ala Ala Gin Asp Arg Tyr Phe Pro Glu Vai Pro Tyr Ser Ser Asn Asp Phe His Ser Cys Thr Gly Asp Ile Asp Tyr Ser Asn Arg Trp Ser Ile Gin Asn Cys Asp Leu Vai Gly Leu Asn Asp Leu Lys Thr Glu Ser Glu Tyr Vai Arg Gin Lys Ile Ala Asp Tyr Met Asn Asp Ala Leu Ser Leu Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys His Ile Pro Ala Gly Asp Ile Ala Ala Ile Lys Ser Lys Leu Asn Gly Ser Pro Tyr Ile Tyr Gin Glu Vai Ile Gly Ala Ala Gly Glu Pro Vai Gin Thr Ser Glu Tyr Thr Tyr Ile Gly Asp Vai Thr Glu Phe Asn Phe Ala Arg Thr Ile Gly Pro Lys Phe Lys Gin Gly Asn Ile Lys Asp Leu Gin Gly Ile Gly Ser Trp Ser Gly Trp Leu Ser Ser Asp Asp Ala Vai Thr Phe Vai Thr Asn His Asp Glu Glu Arg His Asn Pro Gly Gin Vai Leu Ser His Gin Asp Phe Gly Asn Leu Tyr Phe Leu Gly Asn Vai Phe Thr Leu Ala Tyr Pro Tyr Gly Tyr Pro Lys Vai Met Ser Gly Tyr Tyr Phe Ser Asn Phe Asp Ala Gly Pro Pro Ser Thr Gly Vai His Ser Gly Asn Ala Cys Gly Phe Asp Gly Gly Asp Trp Vai Cys Glu His Lys Trp Arg Gly Vai'Ala Asn Met Vai Ala Phe Arg Asn His Thr Ala Ala Gin Trp Gin Vai Thr Asp Trp Trp Asp Asp Gly Tyr Asn Gin Vai Ala Phe Gly Arg Gly Gly Leu Gly Phe Vai Vai Ile Asn Arg Asp Asp Asn Lys Gly Ile Asn Gin Ser Phe Gin Thr Gly Met Pro Ala Gly Glu Tyr Cys Asp Ile Ile Ala Gly Asp Phe Asp Thr Gin Ser Gly His Cys Ser Ala Thr Thr lie Thr Vai Asp Ser Gin Gly Tyr Ala His Phe Thr Vai Gly Ser His Gin Ala Ala Ala Ile His Ile Gly Ala Lys Leu Gly Ser Vai Cys Gin Asp Cys Gly Gly Thr Ala Ala Glu Thr Lys Vai Cys Phe Asp Asn Ala Gin Asn Phe Ser Gin Pro Tyr Lêu His Tyr Trp Asn Vai Asn Ala Asp Gin Ala Vai Ala Asn Ala Thr Tip Pro Gly Vai Ala Met Thr Ala Glu Asn Gly Gly Tyr Cys Tyr Asp Phe Gly Vai Gly Leu Asn Ser Leu Gin Vai Ile Phe Ser Asp Asn Gly Ala Ser Gin Thr Ala Asp Leu Thr Ala Ser Ser Pro Thr Leu Cys Tyr Gin Asn Gly Thr Trp Arg Asp Ser Asp Phe Cys Gin Ser Ser Asn Vai Gly Asn Glu Ser Trp Tyr Phe Arg Gly Thr Ser Asn Gly Trp Gly Vai Ser Ala Leu Thr Tyr Glu Ala Ala Thr Gly Leu Tyr Thr Thr Vai Gin Ser Phe Asn Gly Glu Glu Ser Pro Ala Arg Phe Lys Ue Asp Asp Gly Asn Trp Ser Glu Ser Tyr Pro Ser Ala Asp Tyr Gin Vai Gly Asp Tyr Ala Thr Tyr Thr Ue Thr Phe Asp Ser Gin Thr Lys Ala Ile Thr Vai Thr Ser Gin
    SEQ IDNO: 195 atgctgacagaccgtttctttgatggcgatacatcaaacaacgacccttacaaccagaactacgatgctaaaaacgaccggggaacttatcagg gcggcgattttaaaggaatcacgcaaaaattggattatctcgataagctaggcgtgaacacaatctggatcagcccgatcgtggaaaatatcaag catgatgtccgttatgacaactctgaagggcattcatactatgcttaccacggctactgggcaagcaacttcggtgcgttaaacccacacttcggt acaatggaagatttccatacactgattgacgctgcccatgaaaaaggcatcaagatcatggttgacgtagtattaaaccacactggttatggctta aaagatatcaacggagaagtttccaatcctccagccggttacccaactgacgcagaacgcagcacatatagcagcctgcttcgccagggttca aatgtcggctctgatgaggttgttggcgaattagctggcctacctgacttaaaaacagaagaccccgcagtccgccagacaatcatcgactggc aaacagactggatcacgaaagctactacagctaaaggaaacacaattgactacttccgtgtcgacactgtgaagcacgttgaagacgcaacat ggatggcattcaaaaatgacctcactgaaaaaatgccgacacacaaaatgatcggggaagcttggggagcaagtgccaataaccaacttggat accttgaaacaggtatgatggactcactgcttgacttcgacttcaaaggcattgcgcacgatttcgtgaacggcaagcttaaggcagcaaacgat gccctgactgcccgcaacggtaaaattgacaacacagctactttaggttcattccttggaagccatgacgaagatggtttcctatttaaagaagga aatgacaaaggcaagcttaaggttgctgcttccctgcaagcaacatcaaaaggccagccggtcatctattatggtgaagagcttggtcaaagtg gagcaaacaactatccgcaatacgataaccgttatgacctggcatgggacaaagttgaaaacaacgacgtccttgagcactacactaaggtcct gaacttcagaagcgctcattcagaagtgttcgctaaaggtgaacgcgcaacaattggcggttctgacgctgataaattcttactttttgctcgtaaa aatggaaacgaagctgcttacgtcggcttgaacgttgctgacacagcaaaagacgtaacactgactgtttctgcaggtgcagtcgtaactgacc actatgcagataaaacttatactgcttcagaagctggagaaatcacattgacgatcccggcaaaagctgatggcggtactgttttactaacggttg aaggcggagaaatcacagctgctaaagcggcaagcgaaggcgacggcacagttgagccagtccctgcgaaccacatccgcattcactacaa ccgtacagacaacaactatgaaaactacggtgcatggctgtggaacgatgtagcctccccttctgccaactggccgactggcgctacaatgtttg aaaaaacagacagctacggtgcatacatcgacgtaccacttaaagagggcgctaagaacatcggcttcctcgttatggatgtaacaaaaggtga tcagggtaaagacggcggcgacaaaggttttacgatctcatcacctgaaatgaacgaaatttggatcaagcaaggttctgacaaggtgtacactt acgagccagttgatcttccggcgaacactgtccgcgtccactatgtacgtgacaacgcagactacgaaaacttcggtatctggaactggggcga tgtaacagcaccttccgaaaactggcctacaggcgcagcgaaattcgatggtacagaccgttacggtgcgtatgtcgacattacgctaaaagaa
    Fig 16 (cont.)
    109/116
    633 ggcgcaaagaacattggaatgattgctcttaacactgcaaatggagagaaagacggcggagataaatccttcaaccttctggataaatataatcg catttggattaaacaaggtgatgacaatgtctacgtttctccatactgggagcaggcaacaggaatcaccaatgcagaggtaatctctgaagata cgattctattaggcttcacaatgactgacggcttaacacctgaatctttaaaaggaggtcttgtaattaaagattcaactggtgctgaagttgccatc gaaagtgctgaaatcacaagcgcaacctctgtaaaagtaaaagcaacattcgatttagaaaagcttccattatccatcacatacgcaggcagaac agtttcagcttcaactggctggagaatgcttgatgaaatgtacgcttatgatggaaacgaccttggtgcgacttacaaggacggagcagcgacg cttaaattatgggctccgaaagcgagcaaggtaaccgctaacttctttgataaaaataatgccgctgaaaaaatcggcagcgtcgagttaacgaa gggtgaaaaaggagtctggtcagctatggttgctcctggcgacctgaacgtaaccgatcttgaaggttatttttaccagtatgatgtaacaaatga cggtataactcgccaggtgttagatccttatgcaaaatcaatggcagcctttactgtgaatacagaaggcaatgctggtcctgacggggacactg ttggcaaggcggcaattcaaaaagcttctcgagagtacttctag
    SEQ IDNO: 196
    Met Leu Thr Asp Arg Phe Phe Asp Gly Asp Thr Ser Asn Asn Asp Pro Tyr Asn Gin Asn Tyr Asp Ala Lys Asn Asp Arg Gly Thr Tyr Gin Gly Gly Asp Phe Lys Gly Ile Thr Gin Lys Leu Asp Tyr Leu Asp Lys Leu Gly Vai Asn Thr Ile Trp He Ser Pro lie Vai Glu Asn Ile Lys His Asp Vai Arg Tyr Asp Asn Ser Glu Gly His Ser Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Ser Asn Phe Gly Ala Leu Asn Pro His Phe Gly Thr Met Glu Asp Phe His Thr Leu Ile Asp Ala Ala His Glu Lys Gly Ile Lys lie Met Vai Asp Vai Vai Leu Asn His Thr Gly Tyr Gly Leu Lys Asp Ile Asn Gly Glu Vai Ser Asn Pro Pro Ala Gly Tyr Pro Thr Asp Ala Glu Arg Ser Thr Tyr Ser Ser Leu Leu Arg Gin Gly Ser Asn Vai Gly Ser Asp Glu Vai Vai Gly Glu Leu Ala Gly Leu Pro Asp Leu Lys Thr Glu Asp Pro Ala Vai Arg Gin Thr Ile Ile Asp Trp Gin Thr Asp Trp Ile Thr Lys Ala Thr Thr Ala Lys Gly Asn Thr He Asp Tyr Phe Arg Vai Asp Thr Vai Lys His Vai Glu Asp Ala Thr Trp Met Ala Phe Lys Asn Asp Leu Thr Glu Lys Met Pro Thr His Lys Met Ile Gly Glu Ala Trp Gly Ala Ser Ala Asn Asn Gin Leu Gly Tyr Leu Glu Thr Gly Met Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Gly Ile Ala His Asp Phe Vai Asn Gly Lys Leu Lys Ala Ala Asn Asp Ala Leu Thr Ala Arg Asn Gly Lys Ile Asp Asn Thr Ala Thr Leu Gly Ser Phe Leu Gly Ser His Asp Glu Asp Gly Phe Leu Phe Lys Glu Gly Asn Asp Lys Gly Lys Leu Lys Vai Ala Ala Ser Leu Gin Ala Thr Ser Lys Gly Gin Pro Vai Ile Tyr Tyr Gly Glu Glu Leu Gly Gin Ser Gly Ala Asn Asn Tyr Pro Gin Tyr Asp Asn Arg Tyr Asp Leu Ala Trp Asp Lys Vai Glu Asn Asn Asp Vai Leu Glu His Tyr Thr Lys Vai Leu Asn Phe Arg Ser Ala His Ser Glu Vai Phe Ala Lys Gly Glu Arg Ala Thr Ile Gly Gly Ser Asp Ala Asp Lys Phe Leu Leu Phe Ala Arg Lys Asn Gly Asn Glu Ala Ala Tyr Vai Gly Leu Asn Vai Ala Asp Thr Ala Lys Asp Vai Thr Leu Thr Vai Ser Ala Gly Ala Vai Vai Thr Asp His Tyr Ala Asp Lys Thr Tyr Thr Ala Ser Glu Ala Gly Glu Ile Thr Leu Thr Ile Pro Ala Lys Ala Asp Gly Gly Thr Vai Leu Leu Thr Vai Glu Gly Gly Glu Ile Thr Ala Ala Lys Ala Ala Ser Glu Gly Asp Gly Thr Vai Glu Pro Vai Pro Ala Asn His He Arg Ile His Tyr Asn Arg Thr Asp Asn Asn Tyr Glu Asn Tyr Gly Ala Trp Leu Trp Asn Asp Vai Ala Ser Pro Ser Ala Asn Trp Pro Thr Gly Ala Thr Met Phe Glu Lys Thr Asp Ser Tyr Gly Ala Tyr Ile Asp Vai Pro Leu Lys Glu Gly Ala Lys Asn Ile Gly Phe Leu Vai Met Asp Vai Thr Lys Gly Asp Gin Gly Lys Asp Gly Gly Asp Lys Gly Phe Thr Ile Ser Ser Pro Glu Met Asn Glu Ile Trp Ile Lys Gin Gly Ser Asp Lys Vai Tyr Thr Tyr Glu Pro Vai Asp Leu Pro Ala Asn Thr Vai Arg Vai His Tyr Vai Arg Asp Asn Ala Asp Tyr Glu Asn Phe Gly Ile Trp Asn Trp Gly Asp Vai Thr Ala Pro Ser Glu Asn Trp Pro Thr Gly Ala Ala Lys Phe Asp Gly Thr Asp Arg Tyr Gly Ala Tyr Vai Asp Ile Thr Leu Lys Glu Gly Ala Lys Asn Ile Gly Met Ile Ala Leu Asn Thr Ala Asn Gly Glu Lys Asp Gly Gly Asp Lys Ser Phe Asn Leu Leu Asp Lys Tyr Asn Arg Ile Trp Ile Lys Gin Gly Asp Asp Asn Vai Tyr Vai Ser Pro Tyr Trp Glu Gin Ala Thr Gly Ile Thr Asn Ala Glu Vai Ile Ser Glu Asp Thr Ile Leu Leu Gly Phe Thr Met Thr Asp Gly Leu Thr Pro Glu Ser Leu Lys Gly Gly Leu Vai Ile Lys Asp Ser Thr Gly Ala Glu Vai Ala Ile Glu Ser Ala Glu Ile Thr Ser Ala Thr Ser Vai Lys Vai Lys Ala Thr Phe Asp Leu Glu Lys Leu Pro Leu Ser Ile Thr Tyr Ala Gly Arg Thr Vai Ser Ala Ser Thr Gly Trp Arg Met Leu Asp Glu Met Tyr Ala Tyr Asp Gly Asn Asp Leu Gly Ala Thr Tyr Lys Asp Gly Ala Ala Thr Leu Lys Leu Trp Ala Pro Lys Ala Ser Lys Vai Thr Ala Asn Phe Phe Asp Lys Asn Asn Ala Ala Glu Lys Ile Gly Ser Vai Glu Leu Thr Lys Gly Glu Lys Gly Vai Trp Ser Ala Met Vai Ala Pro Gly Asp Leu Asn Vai Thr Asp Leu Glu Gly Tyr Phe Tyr Gin Tyr Asp Vai Thr Asn Asp Gly Ile Thr Arg Gin Vai Leu Asp Pro Tyr Ala «·· ·♦· r t * t
    Fig 16 (cont.)
    110/116
    Lys Ser Met Ala Ala Phe Thr Vai Asn Thr Glu Gly Asn Ala Gly Pro Asp Gly Asp Thr Vai Gly Lys Ala Ala He Gin Lys Ala Ser Arg Glu Tyr Phe
    SEQIDNO: 197 atgaaaccgtcaaaattcgtttttctctctgctgccatcgcttgcagcctctccagtaccgccaatgctgacgccattttgcatgcatttaactggaag tactccgacgtcacgcaaaacgcctcgcaaatcgcggcggcgggttataaaaaagtgctgatttcgccagcactgaaatcgagtggcaatgaa tggtgggcacgttatcaaccgcaagatctgcgcgtgatcgattccccacttggcaacaaaagtgacttaaaatccatgattgatgctctgaaggc ggtcggcgttgatgtgtatgccgatgtggtgcttaaccatatggccaatgaaacatggaagcgtgaagacttaaattaccctggcagtgaagtgc tgcaacaatacgcagctaacaccagttattatgcggaccaaacgctttttggcaatttaacggaaaacctattctctggctttgacttccacccaga aggctgtattagcgattggaatgatgccggcaatgttcagtactggcgtctttgtggcggtgctggtgaccgagggctgccagacttagatccga acaactgggtggtgtcacagcaacgtttgtatttgaatgcgctaaaaggtttaggtgtgaaaggcttccgcattgatgcggttaaacacatgagcc aatatcaaatcgaccagattttcactgcagagattaccgccggaatgcacgtgtttggtgaagtgatcaccagtggtggcaaaggcgactccag ctatgagaacttcttagcgccttatctcaacgccaccaaccattcggcttacgatttcccactgtttgcctctattcgcaacgccttctcctacagcgg tggcatgaacatgcttcatgatccacaagcctatggccaagggcttgaaaacgcacgttcaattacctttaccatcacgcacgacatcccaacga acgacggtttccgttatcaaatcatggatccgaaagatgaagagctggcttacgcttatatcctcggtaaagatggcggcacacctctgatttaca gcgacaacttacctgataacgaagatcgtgataatcgccgttgggaaggtgtttggaaccgtgacctgatgaagaacatgttgcgcttccataac caaatgcaagggcaagagatgacgatgctgtacagcgaccaatgtctactgatgtttaagcgcggtaaacaaggggtggtcggcattaataaat gcggtgaagagcgttctcataccgttgacacctatcagcatgagttcaactggtatcagccttacacagatacactcactggcgtgactgaaacc gtgagttcgcgttaccacaccttccgaattccagctcgcagcgcgcgcatgtacatgctctaa
    SEQ ID NO: 198
    Met Lys Pro Ser Lys Phe Vai Phe Leu Ser Ala Ala üe Ala Cys Ser Leu Ser Ser Thr Ala Asn Ala Asp Ala Ile Leu His Ala Phe Asn Trp Lys Tyr Ser Asp Vai Thr Gin Asn Ala Ser Gin Ile Ala Ala Ala Gly Tyr Lys Lys Vai Leu Ile Ser Pro Ala Leu Lys Ser Ser Gly Asn Glu Trp Trp Ala Arg TyT Gin Pro Gin Asp Leu Arg Vai Ile Asp Ser Pro Leu Gly Asn Lys Ser Asp Leu Lys Ser Met He Asp Ala Leu Lys Ala Vai Gly Vai Asp Vai Tyr Ala Asp Vai Vai Leu Asn His Met Ala Asn Glu Thr Trp Lys Arg Glu Asp Leu Asn Tyr Pro Gly Ser Glu Vai Leu Gin Gin Tyr Ala Ala Asn Thr Ser Tyr Tyr Ala Asp Gin Thr Leu Phe Gly Asn Leu Thr Glu Asn Leu Phe Ser Gly Phe Asp Phe His Pro Glu Gly Cys lie Ser Asp Trp Asn Asp Ala Gly Asn Vai Gin Tyr Trp Arg Leu Cys Gly Gly Ala Gly Asp Arg Gly Leu Pro Asp Leu Asp Pro Asn Asn Trp Vai Vai Ser Gin Gin Arg Leu Tyr Leu Asn Ala Leu Lys Gly Leu Gly Vai Lys Gly Phe Arg Ile Asp Ala Vai Lys His Met Ser Gin Tyr Gin Ile Asp Gin Ile Phe Thr Ala Glu Ile Thr Ala Gly Met His Vai Phe Gly Glu Vai Ile Thr Ser Gly Gly Lys Gly Asp Ser Ser Tyr Glu Asn Phe Leu Ala Pro Tyr Leu Asn Ala Thr Asn His Ser Ala Tyr Asp Phe Pro Leu Phe Ala Ser Ile Arg Asn Ala Phe Ser Tyr Ser Gly Gly Met Asn Met Leu His Asp Pro Gin Ala Tyr Gly Gin Gly Leu Glu Asn Ala Arg Ser Ile Thr Phe Thr Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pro Lys Asp Glu Glu Léu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Thr Pro Leu Ile Tyr Ser Asp Asn Leu Pro Asp Asn Glu Asp Arg Asp Asn Arg Arg Trp Glu Gly Vai Trp Asn Arg Asp Leu Met Lys Asn Met Leu Arg Phe His Asn Gin Met Gin Gly Gin Glu Met Thr Met Leu Tyr Ser Asp Gin Cys Leu Leu Met Phe Lys Arg Gly Lys Gin Gly Vai Vai Gly Ile Asn Lys Cys Gly Glu Glu Arg Ser His Thr Vai Asp Thr Tyr Gin His Glu Phe Asn Trp Tyr Gin Pro Tyr Thr Asp Thr Leu Thr Gly Vai Thr Glu Thr Vai Ser Ser Arg Tyr His Thr Phe Arg Ile Pro Ala Arg Ser Ala Arg Met Tyr Met Leu
    SEQ ID NO: 199 gtgagtttgaccaaaaaggctcagtacgaaccaaatacggcaccaaggctcagtacatctctgcaatcaatgccgcgcacaacaacaatatcca aatttacggcgatgttgtgtttaaccaccgaggtggtgctgatgggaagtcgtgggtcgataccaagcgcgttgattgggacaaccgcaatattg aactgggcgacaaatggattgaagcttgggttgagtttaattttcctggccgcaacgacaaatactcgaacttccattggacttggtatcactttgac ggtgttgactgggatgacgccggcaaagaaaaagcgatctttaaattcaaaggcgaaggaaaagcatgggattgggaagtcagctctgaaaa aggcaattacgactacctaa
    Fig 16 (cont.)
    111/116
    SEQ ID NO: 200
    Vai Ser Leu Thr Lys Lys Ala Gin Tyr Glu Pro Asn Thr Ala Pro Arg Leu Ser Thr Ser Leu Gin Ser Met Pro Arg Thr Thr Thr Ile Ser Lys Phe Thr Ala Met Leu Cys Leu Thr Thr Glu Vai Vai Leu Met Gly Ser Arg Gly Ser Ile Pro Ser Ala Leu He Gly Thr Thr Ala Ile Leu Asn Trp Ala Thr Asn Gly Leu Lys Leu Gly Leu Ser Leu Ile Phe Leu Ala Ala Thr Thr Asn Thr Arg Thr Ser Ile Gly Leu Gly Ile Thr Leu Thr Vai Leu Thr Gly Met Thr Pro Ala Lys Lys Lys Arg Ser Leu Asn Ser Lys Ala Lys Glu Lys His Gly Ile Gly Lys Ser Ala Leu Lys Lys Ala Ile Thr Thr Thr
    SEQ ID NO: 201 atgacagccaaggctgatgacttacgcatttaccagatcatggtggaaagctttgtggatggcgataaacaggtcggccatggcaccggctacg gtaccagccatcacaaaggcgatctgcaagggatcattgactcgctggattacattcaatcgctgggcgtcaatgccatttggctaacgccgattt ttgaatctattccggtggagggacaagaccattgggcggacaggcttgatgctacaggctactttgccagtgactatttcaagatagaccctcgct ttggcacgttagaacaagcccgtgagctggtggaaaaggcacacgcgaaaggcttgtatgtcttctttgatggagtatttggtcaccataaaggc aatgtggtgccatcaccacaaggtagactgcctgtcggtgaaaataacccggtcagctacccagagagcctggcgttttacgaagaagtcgcc agttactgggtgaaagagttaaagattgatggctggcgtctggatcaagcctatcaagtgccgaccgatgcatggaaagcgatccgtcagagc gttgatgaagcgtcacagtccgtaacttatgtgaataacaaaggggaaaccgtccatcctttgggttacatggtggctgaaatttggaataacgaa cgttacatcacagaaaccggttacggcaaagaaggcgatccggcgttgtgctcggcttttgattttccgatgcgtttccgagtggtcgaaaccttt gcggttaacgaaagtggtgtcagccgaaaaggcggcgaatggttgaatgacggcatgtcactgcacagtcagtatccggatcatgccaagcct aatttaatgttgggcaaccatgatgtggtgcgctttggggatctgctgcaacgtggcggtattgcgtcaccagaacaaccgcaatactggcagcg tcataaagcggcgatgtctttcttagcagcgtataccggcccaattaccttgtattacggtgaagaaattggcgatcaggttgacggctttgctaaa aaaatcaaagaagattgtgccgttattggtttgtgtgatgaccacgtggcgcgcaccagtgcgaagattgatggcgtgacggcgtcactgaatg cacagcagtctgaactcaaagtatatgtctcttcattgatgacattacgtcagcaacatcctgcgttatcacaaggggaacgtactaatgtgatggc gacagagacagtatacgtagaccataaacaggcagacaatgaagccctgttgtacatggtgagtacgactgataacgcggagtcagtcacctt gaagggcaaagcgattggttcacaaggtgtgctgattgatttgttaacgaacgagcgttttatgcccaataatggggagtatgccattccattaac gggctttggcgcacgattcctcaagattgacactccgacagcggcgggtgtgatggcgcaatctgctgcctcggtatcgctagtaggtgaagg gatcatggcccaatgtgataccccaaccgttgaaggcaccggtccggtagcagaaaccttgtacgtggttggcgattttgccgatgctggttgga agcaaaagccgcagcgcgcgtatcaatacaaaggcaagcacaatggcagcaacttgtatcaagtggttgtcgatgaaaaagcgggcgcctac aagatgcaatacgccacgaaagattggagcccacagtttactgcagacggtatggcattgaagccgggtaccgcaaagtcgctcatagcgggt ggctacggtaaagacaccgccgtgacgttgccggaatccggtaagtatgtgtggagcttaacattcagtgatcttggcgagccggagcaaatc atggtgtctaagtgtcagtaa
    SEQ ID NO: 202
    Met Thr Ala Lys Ala Asp Asp Leu Arg lie Tyr Gin Ile Met Vai Glu Ser Phe Vai Asp Gly Asp Lys Gin Vai Gly His Gly Thr Gly Tyr Gly Thr Ser His His Lys Gly Asp Leu Gin Gly Ile Ile Asp Ser Leu Asp Tyr Ile Gin Ser Leu Gly Vai Asn Ala Ile Trp Leu Thr Pro Ile Phe Glu Ser lie Pro Vai Glu Gly Gin Asp His Trp Ala Asp Arg Leu Asp Ala Thr Gly Tyr Phe Ala Ser Asp Tyr Phe Lys Ile Asp Pro Arg Phe Gly Thr Leu Glu Gin Ala Arg Glu Leu Vai Glu Lys Ala His Ala Lys Gly Leu Tyr Vai Phe Phe Asp Gly Vai Phe Gly His His Lys Gly Asn Vai Vai Pro Ser Pro Gin Gly Arg Leu Pro Vai Gly Glu Asn Asn Pro Vai Ser Tyr Pro Glu Ser Leu Ala Phe Tyr Glu Glu Vai Ala Ser Tyr Trp Vai Lys Glu Leu Lys Ile Asp Gly Trp Arg Leu Asp Gin Ala Tyr Gin Vai Pro Thr Asp Ala Trp Lys Ala He Arg Gin Ser Vai Asp Glu Ala Ser Gin Ser Vai Thr Tyr Vai Asn Asn Lys Gly Glu Thr Vai His Pro Leu Gly Tyr Met Vai Ala Glu Ile Trp Asn Asn Glu Arg Tyr Ile Thr Glu Thr Gly Tyr Gly Lys Glu Gly Asp Pro Ala Leu Cys Ser Ala Phe Asp Phe Pro Met Arg Phe Arg Vai Vai Glu Thr Phe Ala Vai Asn Glu Ser Gly Vai Ser Arg Lys Gly Gly Glu Trp Leu Asn Asp Gly Met Ser Leu His Ser Gin Tyr Pro Asp His Ala Lys Pro Asn Leu Met Leu Gly Asn His Asp Vai Vai Arg Phe Gly Asp Leu Leu Gin Arg Gly Gly Ile Ala Ser Pro Glu Gin Pro Gin Tyr Trp Gin Arg His Lys Ala Ala Met Ser Phe Leu Ala Ala TyT Thr Gly Pro Ile Thr Leu Tyr Tyr Gly Glu Glu Ile Gly Asp Gin Vai Asp Gly Phe Ala Lys Lys Ile Lys Glu Asp Cys Ala Vai Ile Gly Leu Cys Asp Asp His Vai Ala Arg Thr Ser Ala Lys Ile Asp Gly Vai Thr Ala Ser Leu Asn Ala Gin Gin Ser Glu Leu Lys Vai Tyr Vai Ser Ser Leu Met Thr Leu Arg Gin Gin His Pro Ala Leu Ser Gin Gly Glu Arg Thr Asn Vai Met Ala Thr Glu r t' » : :
    Fig 16 (cont.)
    112/116
    Thr Vai Tyr Vai Asp His Lys Gin Ala Asp Asn Glu Ala Leu Leu Tyr Met Vai Ser Thr Thr Asp Asn Ala Glu Ser Vai Thr Leu Lys Gly Lys Ala Ile Gly Ser Gin Gly Vai Leu Ile Asp Leu Leu Thr Asn Glu Arg Phe Met Pro Asn Asn Gly Glu Tyr Ala He Pro Leu Thr Gly Phe Gly Ala Arg Phe Leu Lys Ile Asp Thr Pro Thr Ala Ala Gly Vai Met Ala Gin Ser Ala Ala Ser Vai Ser Leu Vai Gly Glu Gly Ile Met Ala Gin Cys Asp Thr Pro Thr Vai Glu Gly Thr Gly Pro Vai Ala Glu Thr Leu Tyr Vai Vai Gly Asp Phe Ala Asp Ala Gly Trp Lys Gin Lys Pro Gin Arg Ala Tyr Gin Tyr Lys Gly Lys His Asn Gly Ser Asn Leu Tyr Gin Vai Vai Vai Asp Glu Lys Ala Gly Ala Tyr Lys Met Gin Tyr Ala Thr Lys Asp Trp Ser Pro Gin Phe Thr Ala Asp Gly Met Ala Leu Lys Pro Gly Thr Ala Lys Ser Leu Ile Ala Gly Gly Tyr Gly Lys Asp Thr Ala Vai Thr Leu Pro Glu Ser Gly Lys Tyr Vai Trp Ser Leu Thr Phe Ser Asp Leu Gly Glu Pro Glu Gin Ile
    SEQ ID NO: 203 atgaagatgaagtcccgggcgtggttgttaggtagtgcagtggccatggcgttggcctcttcggcagccaatgccggtgtcatggttcacctgtt ccagtggaagtacaatgacatcgccaacgagtgcgaaaaggtgctcggtcccaaagggtatgaagcagtgcagatcacgccgcctgctgaa cacctgcaaggctcctcctggtgggtggtctatcagcccgtcagctacaagaacttcacttctctgggcggtaacgaggccgaactcaaaagca tgatcgcccgttgcaaggccgccggggtcaagatttacgccgatgcggtattcaaccagctggctggtggatcaggcgtcggtacaggtggta gcagctacaatgccggcagcttcagctatccccaatttggctacaacgatttccatcacgctgggagcctcaccaactatgccgaccgcaacaa tgtgcaaaacggtgccctgctggggctgccggatctggataccggctctgcctatgtgcaggatcagctggctacctatatgaagaccctgagt ggctggggtgtggcaggttttcgtcttgatgcagcaaagcatatgagcgttgccgatctctcggccatcgtcagcaaggcgggcaatccttttgt ctactccgaggtgattggtgccacgggtgaaccaatccagccgggcgaatataccggcattggtgccgtgaccgaatttaaatacggcaccga tctggcctccaacttcaaggggcagatcaagaatctcaagagcatgggcgagagctggggtctgcttgcgtcgaacaaggctgaagtctttgtg gtcaaccatgaccgtgagcggggacatggcggtggcggtatgctgacctacaaggatggtgccctctacaatctggccaacatcttcatgctg gcctggccctatggcgcctatccccaggtgatgtccggctatgatttcggcaccaataccgatattggtgggccgagcgctaccccttgttcttcc ggctctagctggaactgcgaacaccgctggagcaacatcgccaacatggtctcgttccacaatgccgcccaaggcacgtccatgaccaactg gtgggataatggtaataaccagatcgcctttggtcgcggcgccaaggcctttgtggtgatcaacaatgaatcttccactctgagcaagagcctgc agacgggtctgccagccggggagtactgcaacattctggccggtgatgccctgtgcagcggcagcaccatcaaggtggatgccagcggtat ggccaccttcaacgtggcagggatgaaggcggcagcgatccatatcaatgccaagcccgatagcaccagcagtggcagctcaggctcttcct ctggctcttcttcctctgccaccagtaacaagtttgccagcatgaatctgcggggcaccaacaatggctgggccagcaccgccatgacagtgga tgccaaccgtgtctggtcggcggatgtcacctttaccggggccgcggatgccaatggtgcccagcgcttcaagtttgatgtctatggcaactgg acagagagctatggcgatacacaagccgatggcattgccgacaaggggagcgccaaggacatctatttcaatggtgtgggcaagtatcgtgtc tcgctcaaggagagcgacatgagctacaccctgacccagctctccagcaatcaggcaccggtggcggccatcacccccaagacactctccgt caagctgggtgactcagtggtgttcgatgcctccggctccaccgatgatgtgggtgtcactggctacagctggtctaccggtggcagtgccaag accgaaactgtgctgtttgatgctctgggtaccaagaccattaccgtgacagtggccgatgccgatggcttgacctccaaggccagtgccaccg tcaccgtcaccgatggcagcgtggcttataacagcaactttgccagcctgaacttccgtggcactcccaacagttggggcgcggcagccatga cgctggtggcagacaacacctgggaggcaacggtcaacttcgatggtcaggccaatcagcgcttcaagttcgatatcaagggtgactggagc cagaactatggtgatagcaacaaggatggggtggccgaacgtaccggtgccgatatttacaccactgtgaccggtcaatataaggtgcaattta acgactccactttgaagtacaccctgaccaagctggccgatagcagcgccaccagctatagcgcgaactttgccagcctctacctgcgtggca ccccgaacagctggggcaccaccgccatgaagctggtggccaataacagctggcaggccgaggtgaccttcaccggcaagggcgatgcca ctggtgcccaacgcttcaagttcgacgtcaagggtgactggagccagaactacggtgacagcaacatggacgggactgccgaacggactgg tggcgatatcaccagtgccgtggtgggcacctatctggtgacctttaatgacagcacactgaaatacaccctgaccgccaaataa
    SEQ ID NO: 204
    Met Lys Met Lys Ser Arg Ala Trp Leu Leu Gly Ser Ala Vai Ala Met Ala Leu Ala Ser Ser Ala Ala Asn Ala Gly Vai Met Vai His Leu Phe Gin Trp Lys Tyr Asn Asp Ile Ala Asn Glu Cys Glu Lys Vai Leu Gly Pro Lys Gly Tyr Glu Ala Vai Gin Ile Thr Pro Pro Ala Glu His Leu Gin Gly Ser Ser Trp Trp Vai Vai Tyr Gin Pro Vai Ser Tyr Lys Asn Phe Thr Ser Leu Gly Gly Asn Glu Ala Glu Leu Lys Ser Met Ile Ala Arg Cys Lys Ala Ala Gly Vai Lys Ile Tyr Ala Asp Ala Vai Phe Asn Gin Leu Ala Gly Gly Ser Gly Vai Gly Thr Gly Gly Ser Ser Tyr Asn Ala Gly Ser Phe Ser Tyr Pro Gin Phe Gly Tyr Asn Asp Phe His His Ala Gly Ser Leu Thr Asn Tyr Ala Asp Arg Asn Asn Vai Gin Asn Gly Ala Leu Leu Gly Leu Pro Asp Leu Asp Thr Gly Ser Ala Tyr Vai Gin Asp Gin Leu Ala Thr TyT Met • <♦
    Fig 16 (cont.)
    113/116 • · f i • · · f ? W * J * i · r
    Lys Thr Leu Ser Gly Trp Gly Vai Ala Gly Phe Arg Leu Asp Ala Ala Lys His Met Ser Vai Ala Asp Leu Ser Ala Ile Vai Ser Lys Ala Gly Asn Pro Phe Vai Tyr Ser Glu Vai Ile Gly Ala Thr Gly Glu Pro Ile Gin Pro Gly Glu Tyr Thr Gly Ile Gly Ala Vai Thr Glu Phe Lys Tyr Gly Thr Asp Leu Ala Ser Asn Phe Lys Gly Gin Ile Lys Asn Leu Lys Ser Met Gly Glu Ser Trp Gly Leu Leu Ala Ser Asn Lys Ala Glu Vai Phe Vai Vai Asn His Asp Arg Glu Arg Gly His Gly Gly Gly Gly Met Leu Thr Tyr Lys Asp Gly Ala Leu Tyr Asn Leu Ala Asn Ile Phe Met Leu Ala Trp Pro Tyr Gly Ala Tyr Pro Gin Vai Met Ser Gly Tyr Asp Phe Gly Thr Asn Thr Asp He Gly Gly Pro Ser Ala Thr Pro Cys Ser Ser Gly Ser Ser Trp Asn Cys Glu His Arg Trp Ser Asn Ile Ala Asn Met Vai Ser Phe His Asn Ala Ala Gin Gly Thr Ser Met Thr Asn Trp Trp Asp Asn Gly Asn Asn Gin He Ala Phe Gly Arg Gly Ala Lys Ala Phe Vai Vai lie Asn Asn Glu Ser Ser Thr Leu Ser Lys Ser Leu Gin Thr Gly Leu Pro Ala Gly Glu Tyr Cys Asn lie Leu Ala Gly Asp Ala Leu Cys Ser Gly Ser Thr Ile Lys Vai Asp Ala Ser Gly Met Ala Thr Phe Asn Vai Ala Gly Met Lys Ala Ala Ala Ile His He Asn Ala Lys Pro Asp Ser Thr Ser Ser Gly Ser Ser Gly Ser Ser Ser Gly Ser Ser Ser Ser Ala Thr Ser Asn Lys Phe Ala Ser Met Asn Leu Arg Gly Thr Asn Asn Gly Trp Ala Ser Thr Ala Met Thr Vai Asp Ala Asn Arg Vai Trp Ser Ala Asp Vai Thr Phe Thr Gly Ala Ala Asp Ala Asn Gly Ala Gin Arg Phe Lys Phe Asp Vai Tyr Gly Asn Trp Thr Glu Ser Tyr Gly Asp Thr Gin Ala Asp Gly Ile Ala Asp Lys Gly Ser Ala Lys Asp Ile Tyr Phe Asn Gly Vai Gly Lys Tyr Arg Vai Ser Leu Lys Glu Ser Asp Met Ser Tyr Thr Leu Thr Gin Leu Ser Ser Asn Gin Ala Pro Vai Ala Ala Ile Thr Pro Lys Thr Leu Ser Vai Lys Leu Gly Asp Ser Vai Vai Phe Asp Ala Ser Gly Ser Thr Asp Asp Vai Gly Vai Thr Gly Tyr Ser Trp Ser Thr Gly Gly Ser Ala Lys Thr Glu Thr Vai Leu Phe Asp Ala Leu Gly Thr Lys Thr Ile Thr Vai Thr Vai Ala Asp Ala Asp Gly Leu Thr Ser Lys Ala Ser Ala Thr Vai Thr Vai Thr Asp Gly Ser Vai Ala Tyr Asn Ser Asn Phe Ala Ser Leu Asn Phe Arg Gly Thr Pro Asn Ser Trp Gly Ala Ala Ala Met Thr Leu Vai Ala Asp Asn Thr Trp Glu Ala Thr Vai Asn Phe Asp Gly Gin Ala Asn Gin Arg Phe Lys Phe Asp Ile Lys Gly Asp Trp Ser Gin Asn Tyr Gly Asp Ser Asn Lys Asp Gly Vai Ala Glu Arg Thr Gly Ala Asp Ile Tyr Thr Thr Vai Thr Gly Gin Tyr Lys Vai Gin Phe Asn Asp Ser Thr Leu Lys Tyr Thr Leu Thr Lys Leu Ala Asp Ser Ser Ala Thr Ser Tyr Ser Ala Asn Phe Ala Ser Leu Tyr Leu Arg Gly Thr Pro Asn Ser Trp Gly Thr Thr Ala Met Lys Leu Vai Ala Asn Asn Ser Trp Gin Ala Glu Vai Thr Phe Thr Gly Lys Gly Asp Ala Thr Gly Ala Gin Arg Phe Lys Phe Asp Vai Lys Gly Asp Trp Ser Gin Asn Tyr Gly Asp Ser Asn Met Asp Gly Thr Ala Glu Arg Thr Gly Gly Asp Ile Thr Ser Ala Vai Vai Gly Thr Tyr Leu Vai Thr Phe Asn Asp Ser Thr Leu Lys Tyr Thr Leu Thr Ala Lys
    SEQ ID NO: 205 atgtaccgcgtaatacctattattttgattatgagtatgattgtagcttgtgagtctccaaagaaaaaaacaaccgaaaccgctcaaccttcaacaaa tgccgaaaaaccctttgtttgggaggctgccaatgtatattttttgttaactgaccgttttaacaacggtaacccaaacaatgacatcaattttaatag gactaaagaatcaggaaaactccgcaattttatgggaggcgatatcaagggcatcacccaaaaaataaatgaggggtattttagtaaactaggc gttaatgccatctggcttaccccggttgttgaacaaatacatggcagtgttgatgaaggtaccggcaatacctatgcctttcatggctattgggcca aagattggacaaacttagacccaaattttggcacaaaagaagaccttgccgaactggtggcaactgcccatgcaaaaggcatcaggatactttta gatgtggtaataaaccacaccggcccggtaaccgaccaagacccggtttggggagaagattgggtacgtacaggcccgcagtgtacctatga taattacaccaataccaccagttgcacgctggtagccaatttacctgatatacttacagaaagtaatgaaaatgtggccttaccaacctttttgttaga taaatggaaagccgaaggcagattagagcaagaactaaaagaacttgacgattttttttcccgcacaggccacccacgcgcaccccgcttttac attattaaatggcttaccgattacatccgagaatttggggtagatgggtttagggttgataccgtaaaacataccgaagaaacggtttgggccgag ttgtatgatgaagccgtaattgcttttgccgaatataaaaaagccaacccagacaaggtattggacgataatgaattttatatggtaggcgaagtgt acaactacggtatttccggcggaaggttctatgatttcggcgataaaaaggtggactattttgaccacggatttaaaagcctcatcaattttgaaatg aaatatgatgccaattttacctacgatacactttttaggaagtacgatacccttttgcataccaaacttaaaggcagaagtgtgctcaactacctctca tctcacgacgatggaagtccatttgataaaatgcggcaaaaaccatacgagtcggctacaaaattactgctcactccgggcgcatcccaaatttat tacggtgacgaaaccgccagaagccttaacatagaaggcgcacagggagatgctacgcttcgttcgtttatgaattgggaagagctcgcagaa gaccctgccaagcaaaaaatacttcagcattggcaaaaactgggcagtttcaggaacaaccaccccgcagttggtgccggaaggcacaaaac ccttggcaaaaagccgttttacacctttagcagggtttatcaaaaaaatggttttattgacaaagttgtggtagcattagatgcccctaaaggccaaa aacaaattaccgttaatggtgtttttgatgacggtacaaaacttgtagatgcctattcaggcaaagaaacctcagttaaaaatggtatcgtttcacttt cttctgaatttgatattgttttgttagaacaaaaataa
    114/116
    Fig 16 (cont.)
    SEQ ID NO: 206
    Met Tyr Arg Vai Ile Pro Ile Ile Leu Ile Met Ser Met Ile Vai Ala Cys Glu Ser Pro Lys Lys Lys Thr Thr Glu Thr Ala Gin Pro Ser Thr Asn Ala Glu Lys Pro Phe Vai Trp Glu Ala Ala Asn Vai Tyr Phe Leu Leu Thr Asp Arg Phe Asn Asn Gly Asn Pro Asn Asn Asp Ile Asn Phe Asn Arg Thr Lys Glu Ser Gly Lys Leu Arg Asn Phe Met Gly Gly Asp Ile Lys Gly Ile Thr Gin Lys Ile Asn Glu Gly Tyr Phe Ser Lys Leu Gly Vai Asn Ala Ile Trp Leu Thr Pro Vai Vai Glu Gin Ile His Gly Ser Vai Asp Glu Gly Thr Gly Asn Thr Tyr Ala Phe His Gly Tyr Trp Ala Lys Asp Trp Thr Asn Leu Asp Pro Asn Phe Gly Thr Lys Glu Asp Leu Ala Glu Leu Vai Ala Thr Ala His Ala Lys Gly Ile Arg Ile Leu Leu Asp Vai Vai Ile Asn His Thr Gly Pro Vai Thr Asp Gin Asp Pro Vai Trp Gly Glu Asp Trp Vai Arg Thr Gly Pro Gin Cys Thr Tyr Asp Asn Tyr Thr Asn Thr Thr Ser Cys Thr Leu Vai Ala Asn Leu Pro Asp lie Leu Thr Glu Ser Asn Glu Asn Vai Ala Leu Pro Thr Phe Leu Leu Asp Lys Tip Lys Ala Glu Gly Arg Leu Glu Gin Glu Leu Lys Glu Leu Asp Asp Phe Phe Ser Arg Thr Gly His Pro Arg Ala Pro Arg Phe Tyr Ile Ile Lys Trp Leu Thr Àsp Tyr Ile Arg Glu Phe Gly Vai Asp Gly Phe Arg Vai Asp Thr Vai Lys His Thr Glu Glu Thr Vai Trp Ala Glu Leu TyT Asp Glu Ala Vai Ile Ala Phe Ala Glu Tyr Lys Lys Ala Asn Pro Asp Lys Vai Leu Asp Asp Asn Glu Phe Tyr Met Vai Gly Glu Vai Tyr Asn Tyr Gly Ile Ser Gly Gly Arg Phe Tyr Asp Phe Gly Asp Lys Lys Vai Asp Tyr Phe Asp His Gly Phe Lys Ser Leu Ile Asn Phe Glu Met Lys Tyr Asp Ala Asn Phe Thr Tyr Asp ΊΤιτ Leu Phe Arg Lys Tyr Asp Thr Leu Leu His Thr Lys Leu Lys Gly Arg Ser Vai Leu Asn Tyr Leu Ser Ser His Asp Asp Gly Ser Pro Phe Asp Lys Met Arg Gin Lys Pro Tyr Glu Ser Ala Thr Lys Leu Leu Leu Thr Pro Gly Ala Ser Gin Ue Tyr Tyr Gly Asp Glu Thr Ala Arg Ser Leu Asn Ile Glu Gly Ala Gin Gly Asp Ala Thr Leu Arg Ser Phe Met Asn Tip Glu Glu Leu Ala Glu Asp Pro Ala Lys Gin Lys Ile Leu Gin His Trp Gin Lys Leu Gly Ser Phe Arg Asn Asn His Pro Ala Vai Gly Ala Gly Arg His Lys Thr Leu Gly Lys Lys Pro Phe Tyr Thr Phe Ser Arg Vai Tyr Gin Lys Asn Gly Phe Ile Asp Lys Vai Vai Vai Ala Leu Asp Ala Pro Lys Gly Gin Lys Gin Ile Thr Vai Asn Gly Vai Phe Asp Asp Gly Thr Lys Leu Vai Asp Ala Tyr Ser Gly Lys Glu Thr Ser Vai Lys Asn Gly Ile Vai Ser Leu Ser SeT Glu Phe Asp Ile Vai Leu Leu Glu Gin Lys
    SEQ ID NO: 207 ctgtcgactgagcctttcgttttgggctcgagactgactctcagcccaccccgcagtagctccagacggagtagccgtaatagccgttggccgg gtcgtgggcaggggcctcgaggtacacccacccgcttgagtccacccacttgtccacccagccgccgaggttgccggtgtactcgtggatgc acgctcccgcgaacttcggaacgtagacccaccttccggctttgcttgaggcgaggttgatgtatgttatcagtcccggcttgcttccgtagccgt ttctcacgaatatcagctcgtcgttgtcgtagtaaacgacgtcagtgcttcctccggccaggttgtcatgtatccagatgaggttcttgagcttatcct tgttgagccactcctcgtagtcgcggtagaatattgtcggctggccctcgtaggtgaggatgaacgcgtaggctggatacttgttccagattatat cggtgtcgtggtttgcaacgaaggttacggccttaaacgggtcgcggctgacgactgtgcccccgttcttgagggcctcgacgagtgcgggaa tgttcttgttgtcaaaggccgcgtccatcttgtagtagagcgggaagtcgaagaccttggcgccgctcgagtaggcccagttgaggagtgcatc aacgttggtgtcccagtactcgccaacggcccagccgccccaccagttgagccagtccttgacgacccacgctccgtggcccttcacgtagtc aaagcgccaggcatcaacgccgatgctccttaggtaggcggcgtagctctcatcgctcgcccagagccagtgctggtcccagctcttctcgtg ggctatgtctgggaagcctccaaatgtgccctcgtcacagcacttgacctcgttggggtggaagtcgaggtagttggcagtatatttgcccgagg ccacctttgagaagtccgtccaggtgtagtccccaacgaacgggttccactcgaggtctccgcctgcgcggtggtttatgacgatgtccgctatg acctttatgccgtaggcatgggccgtgtttatcatgttcacgagctcctgcttggagccaaagcgcgtctctaccgttcccttctggtcgtactcacc gaggtcaaagaagtcgtaggggtcgtagcccatcgaataggcgccgcccatgcccttgctcgccgggggaatccaaatggcggatattcccg cctcgtaccactccggtatcttgctcctgatggtgtcccaccagattcctccacctgggacgtcccagtagaaggcctgcattataacgccgccct cttccagctcggagtacttggccataagttacctcctactagtagattaaaa
    SEQ ID NO: 208
    Leu Ser Thr Glu Pro Phe Vai Leu Gly Ser Arg Leu Thr Leu Ser Pro Pro Arg Ser Ser Ser Arg Arg Ser Ser Arg Asn Ser Arg Tip Pro Gly Arg Gly Gin Gly Pro Arg Gly Thr Pro Thr Arg Leu Ser Pro Pro Thr Cys Pro Pro Ser Arg Arg Gly Cys Arg Cys Thr Arg Gly Cys Thr Leu Pro Arg Thr Ser Glu Arg Arg Pro Thr Phe Arg Leu Cys Leu Arg Arg Gly Cys Met Leu Ser Vai Pro Ala Cys Phe Arg « · · · · · ······
    I · * · ·
    115/116
    Fig 16 (cont.)
    Ser Arg Phe Ser Arg Ile Ser Ala Arg Arg Cys Arg Ser Lys Arg Arg Gin Cys Phe Leu Arg Pro Gly Cys His Vai Ser Arg Gly Ser Ala Tyr Pro Cys Ala Thr Pro Arg Ser Arg Gly Arg He Leu Ser Ala Gly Pro Arg Arg Gly Thr Arg Arg Leu Asp Thr Cys Ser Arg Leu Tyr Arg Cys Arg Gly Leu Gin Arg Arg Leu Arg Pro Thr Gly Arg Gly Arg Leu Cys Pro Arg Ser Gly Pro Arg Arg Vai Arg Glu Cys Ser Cys Cys Gin Arg Pro Arg Pro Ser Cys Ser Arg Ala Gly Ser Arg Arg Pro Trp Arg Arg Ser Ser Arg Pro Ser Gly Vai His Gin Arg Trp Cys Pro Ser Thr Arg Gin Arg Pro Ser Arg Pro Thr Ser Ala Ser Pro Arg Pro Thr Leu Arg Gly Pro Ser Arg Ser Gin Ser Ala Arg His Gin Arg Arg Cys Ser Leu Gly Arg Arg Arg Ser Ser His Arg Ser Pro Arg Ala Ser Ala Gly Pro Ser Ser Ser Arg Gly Leu Cys Leu Gly Ser Leu Gin Met Cys Pro Arg His Ser Thr Pro Arg Trp Gly Gly Ser Arg Gly Ser Trp Gin Tyr He Cys Pro Arg Pro Pro Leu Arg Ser Pro Ser Arg Cys Ser Pro Gin Arg Thr Gly Ser Thr Arg Gly Leu Arg Leu Arg Gly Gly Leu Arg Cys Pro Leu Pro Leu Cys Arg Arg His Gly Pro Cys Leu Ser Cys Ser Arg Ala Pro Ala Trp Ser Gin Ser Ala Ser Leu Pro Phe Pro Ser Gly Arg Thr His Arg Gly Gin Arg Ser Arg Arg Gly Arg Ser Pro Ser Asn Arg Arg Arg Pro Cys Pro Cys Ser Pro Gly Glu Ser Lys Trp Arg Ile Phe Pro Pro Arg Thr Thr Pro Vai Ser Cys Ser Trp Cys Pro Thr Arg Phe Leu His Leu Gly Arg Pro Ser Arg Arg Pro Ala Leu Arg Arg Pro Leu Pro Ala Arg Ser Thr Trp Pro Vai Thr Ser Tyr Ile Lys
    SEQ ID NO: 209 atgattcagcccatgcactctcgggaacaggcctgccgtctcattccggcactgatcatgacatttgcactggcactgccgttgcaaattcgtgccg atgtcaccctgcatgctttcaactggagctatgccgatgtcgctgatcgggccgttgacatcgctgcagcagggtacagtgccgtgctggtggccc cgccacttcgatccgaaggcacggcctggtgggcgcgataccagccccaggatctccgccttatcgaccatccgctgggcaatacacatgacttc gtcaacatgatcgatgctctcgatgatgtgggtgtgggcgtgtacgccgacatcgtgctcaaccacatggccaatgaggctgcacaaaggcctga cctgaactaccctggtcaggcagtgcttgacgaatatgcttccgatcccggtcatttcgagggcttgaggctgttcggtaatctgagcttcaatttcct gtcggaacatgatttcggacccgcccagtgcattcaggattacagcgatgtgtttcaggtccagaactggcggctgtgcggaccgccgccggacc cgggcctgcccgacctggtcgccaatgactgggtgatctctcaacagcgccagtatctggaagccatcaaggcgctgggtgtggctggcatgcg catcgacgcggtcaagcatatgcccatgagccatatcaatgccgttctcacccccgagatccggtcgggcttgcatgtgtttggcgaagtcatcacc tccggtggggctggtgatacatcctacgaccgttttctggccccttacctggcacaaagcgaccatggtgcctatgactttccattgtttgaaaccatt cgccgtgctttcggcttcggtggcagcatgagtgaactggtcgatcctgctgcctacggtcaggccctgccaccggaccgcgccatcaccttcgtc atcacgcacgatattccgaacaatgacggatttcgctaccagatactcgaccccgtcgatgaatcactggcctacgcctacattctgggccgcgatg gcggtgtcccgcttctgtattccgacaacaatgaaagcggcgatggccgctggatcgatgcctggcaacgtccggatctggttgcaatggtcggct tccacaatgcagtccacggtcaggacatggccgtgctttcacatgacgactgccacctgctgtttcggcgcggcagcctcgggattgtcggcatca acaagtgcggccatgcactcagctcctgggtcaacatgaaccagagcgtactgtggtggtacgcggactacacagacgtgctcgacagcaacag cgttgtcaacatccagtcatcctggcacgagttcatccttcccgcccgccaggcacgcctgtggttgcga
    SEQ IDNO: 210
    MIQPMHSREQACRLIPALIMTFALALPLQIRADVTLHAFNWSYADVADRAVDIAAAGYSA
    VLVAPPLRSEGTAWWARYQPQDLRLIDHPLGNTHDFVNMIDALDDVGVGVYADIVLNHM
    ANEAAQRPDLNYPGQAVLDEYASDPGHFEGLRLFGNLSFNFLSEHDFGPAQCIQDYSDVF
    QVQNWRLCGPPPDPGLPDLVANDWVISQQRQYLEAIKALGVAGMRIDAVKHMPMSHINA
    VLTPEIRSGLHVFGEVITSGGAGDTSYDRFLAPYLAQSDHGAYDFPLFETIRRAFGFGGSMS
    ELVDPAAYGQALPPDRAITFV1THDIPNNDGFRYQILDPVDESLAYAYILGRDGGVPLLYSD
    NNESGDGRWIDAWQRPDLVAMVGFHNAVHGQDMAVLSHDDCHLLFRRGSLGIVGINKC
    GHALSSWVNMNQSVLWWYADYTDVLDSNSWNIQSSWHEFILPARQARLWLR
    SEQ IDNO: 211
    GTGTTTCGTTCTGACACAGTTTCGCGTACCTGCATGTATGGTGCGCTGCGTAATGCCTA
    CCAACCCGATCGGGTGTTTACTGGAGTCACGGTGCGGACATGCAACTTAAAAAAGCAT
    GCTCATCGCCAGGCGCTGTTGTTCATCGTGACGCGGTGCCTGTGCCTGAAATCCAGGC
    AGACCCATAAAAACAACAACAAACCGATAACAAACGACCCAAGCCTTCTAAGAGGAG
    AAAACGGGATGGCTTTTAAACTACGCAAAAAGGCGCTCGTTGGCCTGTTCACGGCCGG • · • ·
    Fig 16 (cont.)
    116/116
    CGCAATGGTATATGCCGGTGCAGCGGCGAGTGGTGAAATCATTCTGCAGGGCTTCCAC
    TGGCACTCCAAGTGGGGCGGCAACAATCAGGGTTGGTGGCAGGTGATGGAAGGTCAG
    GCCAACACCATCGCCAACGCCGGCTTTACGCACGTGTGGTTCCCGCCGGTCCATAACT
    CGGCCGATGCCGAGGGTTACCTACCCCGCGAGCTGAACAACCTCAACTCCAGCTATGG
    CTCCGAAGCACAGCTGCGCAGCGCCATCCAGGCACTGAACAATCGCGGCGTGCATGCG
    ATTGCCGATGTGGTCATGAACCACCGGGTGGGCTGCTCTGGCTGGGCGGATTTCTGTA
    ACCCGGACTGGCCGACCTGGTACATCGTCGCCAATGATTCCTGGCCCGGTGGCCCGAA
    AAGCCAGAACTGGGACACGGGTGAGACGTACCACGCCGCCCGTGACCTCGATCACGC
    CAATCCGCAGGTGCGCAACGATATCTCGCACTACCTGAACAGCCGCCTCAAGGACGTC
    GGCTTCTCCGGCTGGCGCTGGGACTATGCCAAGGGTTTCTGGCCCGGCTATGTCGGCG agtacaactggaacaccaacccgaacttctgtgtgggtgaggtgtgggacgatctcga
    CCCCAACAATCCCAACCCGCACCGCCAGCAACTGGTGGACTGGGTTGATGCTACCGGT
    GGCAGTTGTCACGTCTTCGACTTCACCACCAAGGGGCTGACGAACTATGCGCTGCAGC
    ATGGCCAGTACTGGCGCCTGCAGGGTGATAATGGTGGCCCGGCTGGCGGCATCGGCTG
    GTGGCCGCAACGCATGGTGACCTTCGTCGACAACCATGACACGGGCCCGAGCAATCAC
    TGTGGTGACGGCCAGAACCTCTGGCCCGTGCCCTGTGACAAGGTCATGGAGGCGTATG
    CCTACATCCTGACCCATCCGGGCGTGCCGTCGGTGTACTGGACGCACTTCTTCAACTGG
    AATCTTGGTAGCGAGATCAGCCAGTTGATGCAGATCCGCAAGAACCAGGGCGTGCACT
    CCGGTTCCGACGTCTGGATCGCCGAGGCCCGTCACGGCCTGTACGCCGCCTATATCAA
    CGGTAATGTGGCGATGAAGATGGGCTGGGATAACTGGAGCCCGGGCTGGGGCTGGTC
    GCTGGCGGCCTCCGGTAACAACTGGGCCGTCTGGACACGCTGA
    SEQIDNO: 212
    VFRSDTVSRTCMYGALRNAYQPDRVFTGVTVRTCNLKKHAHRQALLFIVTRCLCLKSRQT
    HKNNNKPITNDPSLLRGENGMAFKLRKKALVGLFTAGAMVYAGAAASGEIILQGFHWHS
    KWGGNNQGWWQVMEGQANTIANAGFTHVWFPPVHNSADAEGYLPRELNNLNSSYGSEA
    QLRSAIQALNNRGVHAIADWMNHRVGCSGWADFCNPDWPTWYIVANDSWPGGPKSQN
    WDTGETYHAARDLDHANPQVRNDISHYLNSRLKDVGFSGWRWDYAKGFWPGYVGEYN
    WNTNPNFCVGEVWDDLDPNNPNPHRQQLVDWVDATGGSCHVFDFTTKGLTNYALQHGQ
    YWRLQGDNGGPAGGIGWWPQRMVTFVDNHDTGPSNHCGDGQNLWPVPCDKVMEAYA
    YILTHPGVPSVYWTHFFNWNLGSEISQLMQIRKNQGVHSGSDVWIAEARHGLYAAYINGN
    VAMKMGWDNWSPGWGWSLAASGNNWAVWTR

Family

ID=

Similar Documents

Publication Publication Date Title
ES2637501T3 (es) Enzimas que tienen actividad de alfa amilasa y métodos de uso de las mismas
BRPI0207770B1 (pt) Enzimas tendo atividade de alfa amilase, preparação compreendendo as mesmas, polinucleotídeos codificando as referidas enzimas, vetores, células hospedeiras, métodos de produção das referidas enizimas, método de hidrolisar uma ligação de amido, produzir um xarope, liquefação do amido, tratamento de fibras lignocelulósicas, para desengomar o tecido, lavar um objeto, detergente aditivo
AU2015221461B2 (en) Enzymes having alpha amylase activity and methods of use thereof
ES2368555T3 (es) Enzimas que tienen actividad de alfa-amilasa y métodos de uso de las mismas.
BR122014028244B1 (pt) ácido nucléico codificando um polipeptídeo com atividade amilase, vetor e célula compreendendo o mesmo, o referido polipeptídeo, seu uso, bem como métodos para produzir o polipeptídeo, para hidrolisar uma ligação alfa-1,4-glicosídica, para liquefazer uma composição contendo amido, tratamento de fibras lignocelulósicas, preparação de uma composição de ração, produção de um álcool, moagem úmida de milho, de campo de petróleo, e para a produção de açúcar
AU2012238328B2 (en) Enzymes having alpha amylase activity and methods of use thereof
AU2002253986A1 (en) Enzymes having alpha amylase activity and methods of use thereof