BR122014028244B1

BR122014028244B1 - ácido nucléico codificando um polipeptídeo com atividade amilase, vetor e célula compreendendo o mesmo, o referido polipeptídeo, seu uso, bem como métodos para produzir o polipeptídeo, para hidrolisar uma ligação alfa-1,4-glicosídica, para liquefazer uma composição contendo amido, tratamento de fibras lignocelulósicas, preparação de uma composição de ração, produção de um álcool, moagem úmida de milho, de campo de petróleo, e para a produção de açúcar

Info

Publication number: BR122014028244B1
Application number: BR122014028244A
Authority: BR
Inventors: J Mathur Eric; Frey Gerhard; S Kerovuo Janne; M Short Jay; Gray Kevin; Slupska Matgorzata; Richardson Toby; Callen Walter
Original assignee: Basf Enzymes Llc; Verenium Corp
Priority date: 2001-02-21
Filing date: 2002-02-21
Publication date: 2018-09-11

Description

(54) Título: ÁCIDO NUCLÉICO CODIFICANDO UM POLIPEPTÍDEO COM ATIVIDADE AMILASE, VETOR E CÉLULA COMPREENDENDO O MESMO, O REFERIDO POLIPEPTÍDEO, SEU USO, BEM COMO MÉTODOS PARA PRODUZIR O POLIPEPTÍDEO, PARA HIDROLISAR UMA LIGAÇÃO ALFA1,4-GLICOSÍDICA, PARA LIQUEFAZER UMA COMPOSIÇÃO CONTENDO AMIDO, TRATAMENTO DE FIBRAS LIGNOCELULÓSICAS, PREPARAÇÃO DE UMA COMPOSIÇÃO DE RAÇÃO, PRODUÇÃO DE UM ÁLCOOL, MOAGEM ÚMIDA DE MILHO, DE CAMPO DE PETRÓLEO, E PARA A PRODUÇÃO DE AÇÚCAR (51) Int.CI.: C12P 21/06; C12N 9/24; C12N 1/12; C08B 30/04; C07H 21/04 (30) Prioridade Unionista: 14/05/2001 US 60/291,122, 21/02/2001 US 60/270,495, 21/02/2001 US 60/270,496 (73) Titular(es): BASF ENZYMES LLC (72) Inventor(es): WALTER CALLEN; TOBY RICHARDSON; GERHARD FREY; MATGORZATA SLUPSKA; JANNE S. KEROVUO; JAY M. SHORT; ERIC J. MATHUR; KEVIN GRAY (85) Data do Início da Fase Nacional: 13/11/2014

1/151

Relatório Descritivo da Patente de Invenção para

ÁCIDO NUCLÉICO CODIFICANDO UM POLIPEPTÍDEO COM ATIVIDADE AMILASE, VETOR E CÉLULA COMPREENDENDO O MESMO, O REFERIDO POLIPEPTÍDEO, SEU USO, BEM COMO MÉTODOS PARA PRODUZIR O POLIPEPTÍDEO, PARA HIDROLISAR UMA LIGAÇÃO ALFA-1,4-GLICOSÍDICA, PARA LIQUEFAZER UMA COMPOSIÇÃO CONTENDO AMIDO, TRATAMENTO DE FIBRAS LIGNOCELULÓSICAS, PREPARAÇÃO DE UMA COMPOSIÇÃO DE RAÇÃO, PRODUÇÃO DE UM ÁLCOOL, MOAGEM ÚMIDA DE MILHO, DE CAMPO DE PETRÓLEO, E PARA A PRODUÇÃO DE AÇÚCAR.

[001] Dividido do PI0207770-1, depositado em 21.02.2002

Dados do Pedido Relacionado [002] Este pedido reivindica prioridade do Pedido Provisório U.S. no 60/270.495, depositado em 21 de fevereiro de 2001, nova pendência; Pedido Provisório U.S. n° 60/270.496, depositado em 21 de fevereiro de 2001, nova pendência; e Pedido Provisional U.S. n° 60/291.122, depositado em 14 de maio de 2001, nova pendência, todos dos quais estão aqui incorporados por referência em sua totalidade.

Campo da Invenção [003] Esta invenção refere-se, em geral, a enzimas, polinucleotídeos codificando as enzimas, o uso de tais polinucleotídeos e polipeptídeos, e mais especificadamente a enzimas tendo atividade de alfa amilase.

Fundamento [004] O amido é um carboidrato complexo freqüentemente encontrado na dieta humana. A estrutura do amido é polímeros de glico2/151 se ligados por ligações glicosídicas de α-1,4 e α-1,6. Amilase é uma enzima que catalisa a hidrólise de amidos nos açúcares. Amilase hidrolisa ligações α-1,4 glicosídicas internas no amido, basicamente aleatoriamente, para produzir malto-dextrinas de peso molecular mais baixo. A ruptura do amido é importante no sistema digestivo e comercialmente. Amilases são de considerável valor comercial, sendo empregada nos estágios iniciais (liquefação) do processo do amido; na moagem de milho a úmido; na produção de álcool; como agentes limpadores em matrizes detergentes; na indústria têxtil para desengomar amido; em aplicações para cozedura; na indústria de bebidas; em campos petrolíferos nos processos de perfuração; na coloração de papel reciclado; e em alimentos para animais.

[005] As amilases são produzidas por uma ampla variedade de microorganismos incluindo Bacillus e Aspergillus, com a maioria das amilases comerciais sendo produzidas a partir de fontes bacterianas tal como Bacillus licheniformis, Bacillus amyloliquefaciens, Bacillus subtilis, ou Bacillus steartothermophilus. Nos últimos anos, as enzimas em uso comercial têm sido aquelas de Bacillus licheniformis por causa de seu desempenho e estabilidade ao calor, pelo menos em pHs moderadamente alcalinos e neutros.

[006] Em geral, o processamento de amido para frutose consiste de quatro etapas: liquefação do amido granular, sacarificação do amido liquidificado em dextrose, purificação, e isomerização para frutose. O objetivo de um processo de liquefação de amido é converter uma suspensão concentrada de grânulos de polímero de amido em uma solução de dextrinas de extensão de cadeia mais curta solúvel de viscosidade baixa. Esta etapa é essencial para manuseio conveniente com equipamento padrão e para conversão eficiente para glicose ou 10³ de outros açúcares. Para liquefazer o amido granular, é necessário gelatinizar os grânulos aumentando-se a temperatura do amido granu3/151 lar para acima de cerca de 72°C. O processo de aquecimento instantaneamente separa os grânulos de amido insolúveis para produzir uma solução de amido solúvel em água. A solução de amido solubilizada é então liquefeita por amilase. Um grânulo de amido é composto de 6974% de amilopectina; 26-31% de amilose; 11-14% de água; 0,2-0,4% de proteína; 0,5-0,9% de lipídeo; 0,05-0,1% de cinzas, 0,02%-0,03% de fósforo, 0,1% de pentosana. Aproximadamente 70% de um grânulo é amorfo e 30% é cristalino.

[007] Um processo de liquefação enzimática comum envolve ajustar o pH de uma pasta fluida de amido granular entre 6,0 e 6,5, o pH ótimo de alfa-amilase derivado de Bacillus licheniformis, com a adição de hidróxido de cálcio, hidróxido de sódio ou carbonato de sódio. A adição de hidróxido de cálcio tem a vantagem de também fornecer íons de cálcio que são conhecidos por estabilizar a alfa-amilase contra desativação. Na adição de alfa-amilase, a suspensão é bombeada através de um jato a vapor para instantaneamente aumentar a temperatura entre 80 graus- 115 graus C. O amido é imediatamente gelatinizado e, devido à presença de alfa-amilase, despolimerizado através de hidrólise aleatória de uma ligação glicosídica (1-4) por alfa-amilase a uma massa fluida que seja facilmente bombeada.

[008] Em uma segunda variação para o processo de liquefação, alfa-amilase é adicionada à suspensão de amido, a suspensão é mantida em uma temperatura de 80-100 graus C para parcialmente hidrolisar os grânulos de amido, e a suspensão de amido parcialmente hidrolisada é bombeada através de um jato em temperaturas em excesso de cerca de 105 graus C até completamente gelatinizar qualquer estrutura granular restante. Após o resfriamento do amido gelatinizado, uma segunda adição de alfa-amilase pode ser feita para ainda hidrolisar o amido.

[009] Uma terceira variação deste processo é chamada o proces4/151 so de moagem a seco. Na moagem a seco, todo o grão é moído e combinado com água. O germe é opcionalmente removido por separação por flutuação ou técnicas equivalentes. A mistura resultante, a qual contém amido, fibra, proteína e outros componentes do grão; é liquefeita empregando alfa-amilase. A prática geral na técnica é para experimentar liquefação enzimática em uma temperatura inferior quando empregando o processo de moagem a seco. Geralmente, a liquefação em temperatura baixa é acreditada ser menos eficiente do que a liquefação em temperatura elevada na conversão de amido para dextrinas solúveis.

[0010] Tipicamente, após a gelatinização a solução de amido é mantida em uma temperatura elevada na presença de alfa-amilase até que um DE de 10-20 seja alcançado, freqüentemente um período de 1-3 horas. O equivalente de dextrose (DE) é o padrão da indústria para medir a concentração de açúcares de redução total, calculado como D-glicose em uma base de peso seco. O amido granular não hidrolisado tem um DE de virtualmente zero, ao mesmo tempo em que o DE de D-glicose é definido como 100.

[0011] A moagem a úmido de milho é um processo que produz óleo de milho, farinha de glúten, amido e alimento de glúten. A amilase alcalina é empregada na liquefação do amido e glicoamilase é empregada na sacarificação, produzindo glicose. Milho, uma semente do qual consiste de um revestimento de semente externa (fibra), amido, uma combinação de amido e glicose e o germe interno, é submetido a um processo de quatro etapas, que resulta na produção de amido. O milho é extraído, desgerminado, desfibrado, e finalmente o glúten é separado. No processo de extração, os solúveis são reservados. O produto restante após a remoção dos solúveis é desgerminado, resultando na produção de óleo de milho e produção de massa de óleo, que é adicionada aos solúveis da etapa de extração. O produto restan5/151 te é desfibrado e os sólidos de fibra são adicionados à mistura de massa/solúveis. Esta mistura de sólidos de fibra, massa de óleo e solúveis forma um alimento de glúten. Após o desfibramento, o produto restante é submetido à separação de glúten. Esta separação resulta em um amido e farinha de glúten. O amido é então submetido à liquefação e sacarificação para produzir glicose.

[0012] O envelhecimento dos produtos cozidos (tal como pão) tem sido reconhecido como um problema que torna-se mais sério quando mais tempo existe entre o momento da preparação do produto de pão e o momento do consumo. O termo envelhecimento é empregado para descrever alterações indesejáveis pelo consumidor nas propriedades do produto de pão após ter deixado o forno, tal como um aumento da firmeza do miolo, uma diminuição da elasticidade do miolo, e alterações na crosta, que torna-se elástica e dura. A firmeza do miolo do pão aumenta ainda durante o armazenamento até um nível, que seja considerado como negativo. O aumento na firmeza do miolo, que é considerado como o aspecto mais importante do envelhecimento, é reconhecido pelo consumidor um longo tempo antes do produto de pão ter de outro modo tornado-se inadequado para o consumo.

[0013] Há uma necessidade na indústria para a identificação e otimização de amilases, úteis para vários usos, incluindo processos de liquefação de amido de milho comercial. Essa segunda geração de amilases de ácido oferecerá características de desempenho e/ou preparação melhoradas durante a industrialização de enzimas padrão de Bacillus licheniformis, por exemplo.

[0014] Há também uma necessidade da identificação e otimização de amilases tendo utilidade nos produtos de lavagem de louça automática (ADW) e detergente de lavanderia. Nos produtos de ADW, a amilase funcionará em pH 10-11 e em 45-60°C na presença de quelantes de cálcio e condições oxidativas. Para lavanderia, a atividade

6/151 em pH 9-10 e 40°C na matriz de detergente apropriad a será requerida. As amilases são também úteis no descolamento de têxteis, processos de fermentação, modificação de amido no papel e indústria de polpa e outros processos descritos na técnica.

[0015] As publicações discutidas aqui são fornecidas somente para sua divulgação antes da data de depósito do presente pedido. Nada aqui é para ser construído como uma admissão de que a invenção não é intitulada para antecipar tal divulgação por virtude da invenção anterior.

Sumário da Invenção [0016] A invenção fornece um ácido nucléico isolado tendo uma seqüência como apresentada nas SEQ ID 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41,43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93,

95,	97, 99	, 101	, 103	, 105	, 107	109	111	, 113,	115,	117,	119,	121,	123
125,	127,	129,	131,	133,	135,	137,	139,	141,	143,	145,	147,	149,	151
153,	155,	157,	159,	161,	163,	165,	167,	169,	171,	173,	175,	177,	179
181,	183,	185,	187,	189,	191,	193,	195,	197,	199,	201,	203,	205,	207
209,	211,	213,	215,	217,	219,	221,	223,	225,	227,	229,	231,	233,	235
237,	239,	241,	243,	245,	247,	249,	251,	253,	255,	257,	259,	261,	263
265,	267,	269,	271,	273,	275,	277,	279,	281,	283,	285,	287,	291,	293

295, 297, 299 e variantes destas tendo pelo menos 50% de identidade de seqüência para SEQ ID N^: 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99,

101,	103,	105,	107,	109,	111,	113,	115,	117,	119,	121,	123,	125,	127
129,	131,	133,	135,	137,	139,	141,	143,	145,	147,	149,	151,	153,	155
157,	159,	161,	163,	165,	167,	169,	171,	173,	175,	177,	179,	181,	183
185,	187,	189,	191,	193,	195,	197,	199,	201,	203,	205,	207,	209,	211
213,	215,	217,	219,	221,	223,	225,	227,	229,	231,	233,	235,	237,	239

7/151

241, 243, 245, 247, 249, 251, 253, 255, 257, 259, 261, 263, 265, 267, 269, 271, 273, 275, 277, 279, 281, 283, 285, 287, 291, 293, 295, 297, 299 e codificando polipeptídeos tendo atividade de alfa amilase.

[0017] Um aspecto da invenção é um ácido nucléico isolado tendo uma seqüência como apresentada nas SEQ ID NOs: 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89,

91,	93, 95, 97,	99,	101,	103,	105,	107,	109,	111,	113,	115,	117,	119,
121	123, 125,	127,	129,	131,	133,	135,	137,	139,	141,	143,	145,	147,
149	151, 153,	155,	157,	159,	161,	163,	165,	167,	169,	171,	173,	175,
177	179, 181,	183,	185,	187,	189,	191,	193,	195,	197,	199,	201,	203,
205	207, 209,	211,	213,	215,	217,	219,	221,	223,	225,	227,	229,	231,
233	235, 237,	239,	241,	243,	245,	247,	249,	251,	253,	255,	257,	259,
261	263, 265,	267,	269,	271,	273,	275,	277,	279,	281,	283,	285,	287,
291	293, 295,	297,	299 (a seguir referido como	seqüências de ácido

nucléico do Grupo A), seqüências substancialmente idênticas a essas, e seqüências complementares a essas.

[0018] Outro aspecto da invenção é um ácido nucléico isolado incluindo pelo menos 10 bases consecutivas de uma seqüência apresentada nas seqüências de ácido nucléico do Grupo A, seqüências substancialmente idênticas a essas, e as seqüências complementares a essas.

[0019] Em ainda outro aspecto, a invenção fornece um ácido nucléico isolado codificando um polipeptídeo tendo uma seqüência como apresentada nas SEQ ID NOs: 2, 4, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98,

100,	102,	104,	106,	108,	110,	112,	114,	116,	118,	120,	122,	124,	126
128,	130,	132,	134,	136,	138,	140,	142,	144,	146,	148,	150,	152,	154
156,	158,	160,	162,	164,	166,	168,	170,	172,	174,	176,	178,	180,	182

8/151

184,	186,	188,	190,	192,	194,	196,	198,	202,	204,	206,	208,	210,	212
214,	216,	218,	220,	222,	224,	226,	228,	230,	232,	234,	236,	238,	240
242,	244,	246,	248,	250,	252,	254,	256,	258,	260,	262,	264,	266,	268
270,	272,	274,	276,	278,	280,	282,	284,	286,	288,	290,	292,	294,	296

298 e variantes destas codificando um polipeptídeo tendo atividade de alfa amilase, e tendo pelo menos 50% de identidade de seqüência para tais seqüências.

[0020] Outro aspecto da invenção é um ácido nucléico isolado codificando um polipeptídeo ou um fragmento funcional deste tendo uma seqüência como apresentada nas SEQ ID N°s 2, 4, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236, 238, 240, 242, 244, 246, 248, 250, 252, 254, 256, 258, 260, 262, 264, 266, 268, 270, 272, 274, 276, 278, 280, 282, 284, 286, 288, 290, 292, 294, 296, 298 (a seguir referido como seqüências de aminoácido do Grupo B), e seqüências substancialmente idênticas a estas.

[0021] Outro aspecto da invenção é um ácido nucléico isolado codificando um polipeptídeo tendo pelo menos 10 aminoácidos consecutivos de uma seqüência como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. [0022] Em ainda outro aspecto, a invenção fornece um polipeptídeo purificado tendo uma seqüência como apresentada na seqüência de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.

[0023] Outro aspecto da invenção é um anticorpo purificado ou

9/151 isolado que especificadamente se aglutina a um polipeptídeo tendo uma seqüência como apresentada nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas.

[0024] Outro aspecto da invenção é um anticorpo purificado ou isolado ou fragmento de aglutinação deste, que especificadamente se aglutina a um polipeptídeo tendo pelo menos 10 aminoácidos consecutivos de um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.

[0025] Outro aspecto da invenção é um método para preparar um polipeptídeo tendo uma seqüência como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. O método inclui introduzir um ácido nucléico codificando o polipeptídeo em uma célula hospedeira, onde o ácido nucléico é operavelmente ligado a um promotor, e cultivar a célula hospedeira sob condições que permitam a expressão do ácido nucléico.

[0026] Outro aspecto da invenção é um método para preparar um polipeptídeo tendo pelo menos 10 aminoácidos de uma seqüência como apresentada nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas. O método inclui introduzir um ácido nucléico codificando o polipeptídeo em uma célula hospedeira, onde o ácido nucléico é operavelmente ligado a um promotor, e cultivar a célula hospedeira sob condições que permitam a expressão do ácido nucléico, por meio da qual produzindo o polipeptídeo.

[0027] Outro aspecto da invenção é um método para gerar uma variante incluindo obter um ácido nucléico tendo uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, seqüências substancialmente idênticas a estas, seqüências complementares às seqüências das seqüências do ácido nucléico do Grupo A, fragmentos compreendendo pelo menos 30 nucleotídeos consecutivos das seqüências anteriores, e alterar um ou mais nucleotídeos na seqüência

10/151 para outro nucleotídeo, anular um ou mais nucleotídeos na seqüência, ou adicionar um ou mais nucleotídeos à seqüência.

[0028] Outro aspecto da invenção é um meio legível por computador tendo armazenado neste uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.

[0029] Outro aspecto da invenção é um sistema de computador incluindo um processador e um dispositivo de armazenamento de dados onde o dispositivo de armazenamento de dados tem armazenado nele uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou um polipeptídeo tendo uma seqüência como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.

[0030] Outro aspecto da invenção é um método para comparar uma primeira seqüência com uma seqüência de referência onde a primeira seqüência é um ácido nucléico tendo uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou um código de polipeptídeo das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. O método inclui leitura da primeira seqüência e da seqüência de referência através do uso de um programa de computador que compara as seqüências; e determinar diferenças entre a primeira seqüência e seqüência de referência com o programa de computador.

[0031] Outro aspecto da invenção é um método para identificar uma característica em uma seqüência como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente i11/151 dênticas a estas, ou um polipeptídeo tendo uma seqüência como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, incluindo leitura da seqüência através do uso de um programa de computador que identifica características nas seqüências; e identificar as características na seqüência com o programa de computador.

[0032] Outro aspecto da invenção é um ensaio para identificar fragmentos ou variantes das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, que retêm a função enzimática dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. O ensaio inclui contatar o polipeptídeo das seqüências de aminoácido do Grupo B, seqüências substancialmente idênticas a estas, ou variante ou fragmento de polipeptídeo com uma molécula de substrato sob condições que permitam a variante ou fragmento de polipeptídeo funcionar, e detectar ou uma diminuição no nível do substrato ou um aumento no nível do produto de reação específico da reação entre o polipeptídeo e substrato por meio da qual identificando um fragmento ou variante de tais seqüências.

[0033] A invenção também fornece um processo para preparar uma massa ou um produto cozido preparado da massa que compreende adicionar uma amilase da invenção à massa em uma quantidade que seja eficaz para retardar o envelhecimento do pão. A invenção também fornece uma massa compreendendo a referida amilase e uma pré-mistura compreendendo farinha junto com a referida amilase. Finalmente, a invenção fornece um cozimento enzimático aditivo, que contém a referida amilase.

[0034] O uso da amilase de acordo com a presente invenção fornece um efeito antienvelhecimento melhorado quando medido, por exemplo, pela firmeza menor do miolo, elasticidade retida do miolo, ca12/151 pacidade de corte melhorada (por exemplo, menos miolo, miolo nãopastoso), sabor ou aroma agradável.

Breve Descrição dos Desenhos [0035] Os seguintes desenhos são ilustrativos das modalidades da invenção e não são pretendidos limitar o escopo da invenção como abrangido pelas reivindicações.

[0036] Figura 1 é um diagrama de bloco de um sistema de computador.

[0037] Figura 2 é um diagrama de fluxo ilustrando uma modalidade de um processo para comparar uma nova seqüência de proteína ou nucleotídeo com um banco de dados de seqüências a fim de determinar os níveis de homologia entre a nova seqüência e as seqüências na base dos dados.

[0038] Figura 3 é um diagrama de fluxo ilustrando uma modalidade de um processo em um computador para determinar se duas seqüências são homólogas.

[0039] Figura 4 é um diagrama de fluxo ilustrando uma modalidade de um processo identificador 300 para detectar a presença de uma característica em uma seqüência.

[0040] Figura 5 é um gráfico mostrando a atividade residual de várias amilases seguindo aquecimento a 90°C durante 1 0 minutos no Exemplo 1.

[0041] Figura 6 é um gráfico que mostra a percentagem líquida de amido removido versus concentração de enzima em teste de lavagem ADW com alvejantes e quelantes.

[0042] Figura 7 é um gráfico mostrando a atividade da amilase de origem em pH 8, 40°C na formulação de ADW em 55°C.

[0043] Figura 8 é um gráfico da leitura dos dados da tolerância de H₂O₂ das novas enzimas no Exemplo 4.

[0044] Figura 9 é um gráfico dos dados da temperatura e pH para

13/151 uma seleção das amilases caracterizada. Figura 9a mostra os dados em pH 8 e 40°C e Figura 9b mostra os dados em pH 10 e 50°C.

[0045] Figura 10 apresenta as seqüências a serem empregadas em experiências de reagrupamento com as enzimas.

[0046] Figura 11 ilustra uma amostra da Curva Padrão do ensaio do Exemplo 5.

[0047] Figura 12 ilustra o perfil da taxa de pH para SEQ ID NO: 127, que tem um pH ótimo neutro e SEQ ID NO: 211, que tem um pH ótimo ao redor de 10.

[0048] Figura 13 mostra a estabilidade de Diversas amilases vs. uma enzima comercial, como discutido no Exemplo 2.

[0049] Figura 14, mostra o alinhamento da seqüência de αamilases hipotermofílicas, como apresentado no Exemplo 8. Figura 14a mostra um alinhamento das seqüências de amilase. SEQ ID NO: 81= um clone ambiental; piro = Pyrococcus sp. (cepa: KOD1), Tachibana, Y., Mendez., L., Takagi, M. e Imanaka, T., J. Ferment. Bioeng. 82: 224-232, 1996; piro2= Pyrococcus furiosus, Appl. Environ. Microbiol. 63(9): 3569-3576, 1997; Termo- Thermococcus sp; Termo2= Thermococcus hydrothermalis, Leveque, E e outros, Patente: França 98.05655 05-Maio-1998, não publicada. Figura 14b mostra o alinhamento da seqüência de aminoácido das seqüências identificadas: SEQ ID NO: 81; piro; SEQ ID NO: 75; SEQ ID NO: 77; SEQ ID NO: 83; SEQ ID NO: 85; termo2; SEQ ID NO: 79; termo; piro2; clone A; termo 3. Figura 14c mostra o alinhamento da seqüência de ácido nucléico correspondendo à seqüência de polipeptídeo das Figuras 5 e 6. SEQ ID NO: 81; SEQ ID NO: 75.; SEQ ID NO: 77; SEQ ID NO: 83; SEQ ID NO: 85; SEQ ID NO: 79; clone A; e SEQ ID NO: 73.

[0050] Figura 15 é uma árvore de ligação próxima para Thermococcales.

[0051] Figura 16 é a seqüência da invenção.

14/151

Descrição Detalhada da Invenção [0052] A presente invenção refere-se a amilases e polinucleotídeos codificando-os. Como empregado aqui, o termo amilase abrange enzimas tendo atividade de alfa amilase, por exemplo, alfa amilases capazes de hidrolisar ligações de a-1,4-glucano internas em polissacarídeos, incluindo enzimas de amilase capazes de hidrolisar o amido para açúcares em pHs alcalinos ou em pHs acídicos. Amilases da invenção são particularmente úteis nos processos de moagem a úmido de milho, detergentes, processos de cozimento, bebidas e em campo petrolífero (combustível de etanol). As amilases são também úteis no descolamento de têxteis, processos de fermentação, modificação de amido na indústria de polpa e papel e outros processos descritos na técnica.

[0053] Os polinucleotídeos da invenção têm sido identificados como polipeptídeos de codificação tendo atividade de alfa amilase ou alcalina. As amilases alcalinas da invenção podem incluir, porém não estão limitadas a SEQ ID NO: 115, SEQ ID NO: 207, SEQ ID NO: 139, SEQ ID NO: 127, SEQ ID NO: 137, SEQ ID NO: 113, SEQ ID NO: 205, SEQ ID NO: 179, SEQ ID NO: 151, SEQ ID NO: 187, SEQ ID NO: 97, SEQ ID NO: 153, SEQ ID NO: 69, SEQ ID NO: 135, SEQ ID NO: 189, SEQ ID NO: 119, SEQ ID NO: 209 e SEQ ID NO: 211.

[0054] As alterações nas propriedades que podem ser obtidas nas variantes da invenção são alterações, por exemplo, na especificidade do substrato, aglutinação do substrato, padrão de clivagem do substrato, estabilidade térmica , perfil da atividade/pH, perfil da estabilidade/pH [tal como estabilidade aumentada em valores de pH baixos (por exemplo, pH<6, em particular pH<5) ou elevados (por exemplo, pH>9)], estabilidade direcionada à oxidação, dependência de Ca²⁺, atividade específica, e outras propriedades de interesse. Por exemplo, a alteração pode resultar em uma variante que, quando comparada

15/151 com a amilase de origem, tenha uma dependência de Ca²⁺ reduzida e/ou um perfil de atividade/pH alterado.

[0055] A presente invenção refere-se a alfa amilases e polinucleotídeos codificando-os. Como empregado aqui, o termo alfa amilase abrange enzimas tendo atividade de alfa amilase, por exemplo, enzimas capazes de hidrolisar o amido para açúcares. Ao contrário de muitas amilases conhecidas, as amilases da invenção podem não ser enzimas dependentes de cálcio.

[0056] É altamente desejável ser capaz de diminuir a dependência de Ca2+ de uma alfa amilase. Conseqüentemente, um aspecto da invenção fornece uma enzima de amilase que tem uma dependência de Ca2+ diminuída quando comparada com amilases de origem ou comerciais. A dependência de Ca2+ diminuída em geral terá a conseqüência funcional que a variante exibe uma atividade amilolítica satisfatória na presença de uma concentração mais inferior de íon de cálcio no veículo estrangeiro do que é necessário para uma enzima de origem ou comercial. Ainda freqüentemente terá a conseqüência de que a variante é menos sensível às condições de depleção de íon de cálcio tal como aquelas obtidas nos veículos contendo agentes de complexação de cálcio (tal como certos buiders detergentes).

[0057] Liquefação ou liquefazer significa um processo pelo qual o amido é convertido para dextrinas menos viscosas e de cadeia mais curta. Geralmente, este processo envolve a gelatinização do amido simultaneamente com ou seguido pela adição de alfa amilase. Em processos comerciais, é preferido que o amido granular seja derivado de uma fonte compreendendo milho, trigo, milo, sorgo, arroz ou bulgher. Entretanto, a presente invenção aplica-se a qualquer fonte de amido e grão que seja útil na liquefação, por exemplo qualquer outra fonte vegetal ou grão conhecido por produzir amido adequado para liquefação.

16/151 [0058] Amido granular ou grânulos de amido significa um componente insolúvel em água de grãos comestíveis que permanecem após a remoção das cascas, fibras, proteínas, gorduras, germe e solúveis através de infusão, craqueamento mecânico, separações, peneiramento, lavagem em contracorrente e etapas de centrifugação típicas do processo de moagem a úmido de grão. O amido granular compreende grânulos de amido intactos contendo, quase exclusivamente, moléculas de amido embaladas (isto é, amilopectina e amilose). No milho, o componente de amido granular compreende cerca de 99% de amido; o 1% restante sendo compreendido de proteína, gordura, cinzas, fibra e componentes restantes firmemente associados com os grânulos. A estrutura da embalagem do amido granular gravemente retarda a capacidade da alfa-amilase hidrolisar o amido. A gelatinização do amido é utilizada para separar os grânulos para formar uma solução de amido solúvel e facilitar a hidrólise enzimática.

[0059] Solução de Amido significa o amido gelatinizado solúvel em água que resulta do aquecimento do amido granular. Sob aquecimento dos grânulos acima de cerca de 72 graus C, o amido granular separa-se para formar uma mistura aquosa de moléculas de amido soltas. Esta mistura compreendendo, por exemplo, cerca de 75% de amilopectina e 25% de amilose em milhos de dente amarelo, forma uma solução viscosa na água. Em processos comerciais para formar glicose ou frutose, é a solução de amido que é liquefeita para formar uma solução de dextrina solúvel. Alfa amilase significa uma atividade enzimática que cliva ou hidrolisa a ligação alfa glicosídica (1-4), por exemplo, aquela nos polímeros de amido, amilopectina ou amilose. As alfa amilases adequadas são as alfa amilases de ocorrência natural bem como amilases de mutantes ou recombinantes que são úteis na liquefação do amido. As técnicas para produzir amilases variantes tendo atividade em um pH ou temperatura, por exemplo, que seja diferen17/151 te da amilase do tipo selvagem, são incluídas aqui.

[0060] A faixa de temperatura da liquefação é geralmente qualquer temperatura de liquefação que seja conhecida por ser eficaz na liquefação do amido. Preferivelmente, a temperatura do amido é entre cerca de 80 graus C a cerca de 115 graus C, mais preferivelmente de cerca de 100 graus C a cerca de 110 graus C, e mais preferivelmente de cerca de 105 graus C a cerca de 108 graus C.

[0061] Em uma modalidade, as seqüências de sinal da invenção são identificadas seguindo a identificação dos novos polipeptídeos de amilase. As passagens pelas quais as proteínas são separadas e transportadas para sua localização celular apropriada são freqüentemente referidas como as passagens de objetivação das proteínas. Um dos elementos mais importantes em todos esses sistemas de objetivação é uma seqüência de aminoácido curta na terminação de amino de um polipeptídeo recentemente sintetizado chamado de seqüência de sinal. A seqüência de sinal conduz uma proteína para sua localização apropriada na célula e é removida durante o transporte ou quando a proteína alcança seu destino final. A maioria das proteínas secretadas, de membrana ou lisossômicas tem uma seqüência de sinal aminoterminal que a marca para deslocamento no lúmen do retículo endoplásmico. Mais do que 100 seqüências de sinal para proteínas neste grupo têm sido determinadas. As seqüências variam na extensão de 13 a 36 resíduos de aminoácido. Vários métodos para reconhecer as seqüências de sinal são conhecidos por aqueles versados na técnica. Em uma modalidade, os peptídeos são identificados por um método referido como SinalP. SinalP usa uma rede neural combinada que reconhece ambos peptídeos de sinal e seus sítios de clivagem. (Nielsen, H., Engelbrecht, J. Brunalk, S., Von Heijne, G., Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites. Protein Engineering, vol. 10, n°1, p 1-6 (1 997), por meio da qual

18/151 incorporado por referência). Seria entendido que algumas das amilases da invenção possam não ter seqüências de sinal. Pode ser desejável incluir uma seqüência de ácido nucléico codificando uma seqüência de sinal de uma amilase operavelmente ligada a uma seqüência de ácido nucléico de uma amilase diferente ou, opcionalmente, uma seqüência de sinal de uma proteína de não-amilase pode ser desejada. A Tabela 3 mostra seqüências de sinal da invenção.

[0062] As frases ácido nucléico ou seqüência de ácido nucléico como empregadas aqui referem-se a um oligonucleotídeo, nucleotídeo, polinucleotídeo ou a um fragmento de qualquer desses, o DNA ou RNA de origem genômica ou sintética que pode ser de filamento único ou de filamento duplo e pode representar um filamento de sentido ou anti-sentido, a ácido nucléico de peptídeo (PNA), ou a qualquer material tipo DNA ou tipo RNA, natural ou sintético na origem.

[0063] Uma seqüência de codificação de ou uma seqüência de nucleotídeo codificando uma proteína ou polipeptídeo particular, é uma seqüência de ácido nucléico que é transcrita e traduzida em um polipeptídeo ou proteína quando colocada sob controle de seqüências reguladoras apropriadas.

[0064] O termo gene significa o segmento do DNA envolvido na produção de uma cadeia de polipeptídeo; inclui regiões precedendo e seguindo a região de codificação (leitora e trailer) bem como, onde aplicável, intervindo seqüências (íntrons) entre segmentos de codificação individuais (exons).

[0065] Aminoácido ou seqüência de aminoácido como empregado aqui refere-se a uma seqüência de proteína, oligopeptídeo, peptídeo ou polipeptídeo, ou a um fragmento, porção ou subunidade de qualquer desses, e a moléculas sintéticas ou de ocorrência natural. [0066] O termo polipeptídeo como empregado aqui, refere-se a aminoácidos unidos a cada outro por ligações de peptídeo ou ligações

19/151 de peptídeos modificados, isto é, isoésteres de peptídeo, e pode conter aminoácidos modificados exceto os 20 aminoácidos codificados por genes. Os polipeptídeos podem ser modificados ou por processos naturais, tal como processo pós-translacional, ou por técnicas de modificação química que são bem-conhecidas na técnica. As modificações podem ocorrer em qualquer lugar no polipeptídeo, incluindo a cadeia principal do peptídeo, as cadeias laterais do aminoácido e a terminação de amino ou carboxila. Será apreciado que o mesmo tipo de modificação possa estar presente no mesmo grau ou em graus variados em vários sítios em um determinado polipeptídeo. Além disso, um determinado polipeptídeo pode ter muitos tipos de modificações. As modificações incluem acetilação, acilação, ADP-ribosilação, amidação, ligação covalente de flavina, ligação covalente de uma porção de heme, ligação covalente de um derivado de nucleotídeo ou nucleotídeo, ligação covalente de um lipídeo ou derivado de lipídeo, ligação covalente de um fosfitidilinositol, ciclização por reticulação, formação de ligação de dissulfeto, desmetilação, formação de reticulação covalente, formação de cisteína, formação de piroglutamato, formilação, gamacarboxilação, glicosilação, formação de âncora GPI, hidroxilação, iodinação, metilação, miristoliação, oxidação, pergilação, processamento proteolítico, fosforilação, prenilação, racemização, selenoilação, sulfação, e adição mediada por transferência de RNA de aminoácidos para proteínas tal como arginilação (Observe Creighton, T.E., Proteins Structure and Moleculas Properties 2^a Edição. , W. H. Freeman e Company, New York (1993); Posttranslational Covalent Modification of Proteins, B. C. Johnson, Ed., Academic Press, New York, pp. 1-12 (1983)).

[0067] Como empregado aqui, o termo isolado significa que o material é removido de seu ambiente original (por exemplo, o ambiente natural se for de ocorrência natural). Por exemplo, um polipeptídeo ou

20/151 polinucleotídeo de ocorrência natural presente em um animal vivo não é isolado, porém o mesmo polipeptídeo ou polinucleotídeo, separado de alguns ou todos dos materiais co-existentes no sistema natural, é isolado. Tais polinucleotídeos podem ser parte de um vetor e/ou tais polinucleotídeos ou polipeptídeos podem ser parte de uma composição, e ainda ser isolados pelo fato de que tal vetor ou composição não é parte de seu ambiente natural.

[0068] Como empregado aqui, o termo purificado não requer pureza absoluta; mais apropriadamente, é pretendido como uma definição relativa. Os ácidos nucléicos individuais obtidos de uma biblioteca têm sido convencionalmente purificados para homogeneidade eletroforética. As seqüências obtidas desses clones não podem ser obtidas diretamente ou a partir da biblioteca ou a partir do DNA humano total. Os ácidos nucléicos purificados da invenção têm sido purificados a partir do restante do DNA genômico no organismo por pelo menos 104-106 dobras. Entretanto, o termo purificado também inclui ácidos nucléicos que tenham sido purificados a partir do restante do DNA genômico ou de outras seqüências em uma biblioteca ou outros ambientes por pelo menos uma ordem de magnitude, tipicamente duas ou três ordens, e mais tipicamente quatro ou cinco ordens de magnitude. [0069] Como empregado aqui, o termo recombinante significa que o ácido nucléico está adjacente a um ácido nucléico da cadeia principal ao qual ele não está adjacente em seu ambiente natural. Adicionalmente, para ser enriquecido os ácidos nucléicos representarão 5% ou mais dos números de ácido nucléico inserido em uma população de moléculas da cadeia principal de ácido nucléico. As moléculas da cadeia principal de acordo com a invenção incluem ácidos nucléicos tal como vetores de expressão, ácidos nucléicos de autoreplicação, vírus, ácidos nucléicos de integração, e outros vetores ou ácidos nucléicos empregados para manter ou manipular uma inserção

21/151 de ácido nucléico de interesse. Tipicamente, os ácidos nucléicos enriquecidos representam 15% ou mais do número de ácidos nucléicos inseridos na população de moléculas da cadeia principal recombinante. Mais tipicamente, os ácidos nucléicos enriquecidos representam 50% ou mais do número de ácidos nucléicos inseridos na população de moléculas da cadeia principal recombinante. Em uma modalidade, os ácidos nucléicos enriquecidos representam 90% ou mais do número de ácidos nucléicos inseridos na população de moléculas da cadeia principal recombinante.

[0070] Proteínas ou polipeptídeos recombinantes referem-se a polipeptídeos ou proteínas produzidos por técnicas de DNA recombinante; isto é, produzidos de células transformadas por um constructo de DNA exógeno codificando a proteína ou polipeptídeo desejado. As proteínas ou polipeptídeos sintéticos são aqueles preparados por síntese técnica. Os métodos de síntese de peptídeo químicos de fase sólida podem também ser empregados para sintetizar o polipeptídeo ou fragmentos da invenção. Tal método tem sido conhecido na técnica desde o início de 1960 (Merrifield, R. B., J. Am. Chem. Soc. 85: 21492154, 1963) (Observe também Stewart, J. M. e Young, J. D., Solid Phase Peptide Synthesis, 2^a Edição, Pierce Chemical Co., Rockford, I11, pp 11-12) e tem recentemente sido empregado em kits de síntese e projeto de peptídeo de laboratório comercialmente disponível (Cambridge Research Biochemicals). Tais kits de laboratório comercialmente disponíveis têm geralmente utilizados os ensinamentos de H. M. Geysen e outros, Proc. Natl. Acad. Sci., USA, 81: 3998 (1984) e prover a subsistência de peptídeos de sintetização nas extremidades de uma multidão de hastes ou pinos todos dos quais estão conectados a uma única placa. Quando um tal sistema é utilizado, uma placa de hastes ou pinos é invertida e inserida em uma segunda placa de reservatórios ou cavidades correspondentes, que contêm soluções para

22/151 ligar ou ancorar um aminoácido apropriado às extremidades dos pinos ou hastes. Repetindo-se uma tal etapa do processo, isto é, invertendo e inserindo as extremidades dos pinos e das hastes em soluções apropriadas, os aminoácidos são construídos em peptídeos desejados. Além disso, o número de sistemas de síntese de peptídeo FMOC estão disponíveis. Por exemplo, a montagem de um polipeptídeo ou fragmento pode ser realizada em um suporte sólido empregando um sintetizador de peptídeo automatizado Applied Biosystems, Inc. Model 431A . Tal equipamento fornece fácil acesso aos peptídeos da invenção, ou por síntese direta ou por síntese de uma série de fragmentos que podem ser acoplados empregando outras técnicas conhecidas. [0071] Uma seqüência promotora é operavelmente ligada a uma seqüência de codificação quando a polimerase de RNA que inicia a transcrição no promotor transcreverá a seqüência de codificação no mRNA.

[0072] Plasmídeos são designados por um caso inferior p precedido e/ou seguido por números e/ou letras maiúsculas. Os plasmídeos de partida aqui estão ou comercialmente disponíveis, publicamente disponíveis em uma base não restrita, ou podem ser construídos de plasmídeos disponíveis de acordo com os procedimentos publicados. Além disso, os plasmídeos equivalentes àqueles descritos aqui são conhecidos na técnica e serão aparentes aos técnicos ordinariamente versados.

[0073] Digestão de DNA refere-se à clivagem catalítica do DNA com uma enzima de restrição que atua somente em certas seqüências no DNA. As várias enzimas de restrição empregadas aqui são comercialmente disponíveis e suas condições de reação, co-fatores e outros requerimentos foram empregados como seria conhecido pelos ordinariamente versados na técnica. Para propósitos analíticos, tipicamente 1 pg de plasmídeo ou fragmento de DNA é empregado com cerca de 2

23/151 unidades de enzima em cerca de 20 μΙ de solução de tampão. Para o propósito de isolar os fragmentos de DNA para construção de plasmídeo, tipicamente 5 a 50 μg de DNA são digeridos com 20 a 250 unidades de enzima em um volume maior. As quantidades de substrato e tampões apropriadas para enzimas de restrição particulares são especificadas pelo fabricante. Os tempos de incubação de cerca de 1 hora em 37°C são ordinariamente empregados, porém podem variar de acordo com as instruções dos fornecedores. Após a digestão, a eletroforese de gel pode ser realizada para isolar o fragmento desejado. [0074] Oligonucleotídeo refere-se ou a um polideoxinucleotídeo de filamento único ou dois filamentos de polideoxinucleotídeo complementares que podem ser quimicamente sintetizados. Tais oligonucleotídeos sintéticos têm nenhum 5' fosfato e desse modo não se ligarão a outro oligonucleotídeo sem adicionar um fosfato com um ATP na presença de cinase. Um oligonucleotídeo sintético se ligará a um fragmento que não tenha sido desfosforilado.

[0075] A frase substancialmente idêntico no contexto de dois ácidos nucléicos ou polipeptídeos, refere-se a duas ou mais seqüências que tenham pelo menos 50%, 60%, 70%, 80%, e em alguns aspectos 90-95% de identidade de resíduo de aminoácido ou nucleotídeo, quando comparado e alinhado para correspondência máxima, quando medido empregando um dos conhecidos algoritmos de comparação da seqüência ou por inspeção visual. Tipicamente, a identidade substancial existe em uma região de pelo menos cerca de 100 resíduos, e mais comumente as seqüências são substancialmente idênticas em pelo menos cerca de 150-200 resíduos. Em algumas modalidades, as seqüências são substancialmente idênticas na extensão total das regiões de codificação.

[0076] Adicionalmente uma seqüência de aminoácido substancialmente idêntica é uma seqüência que difere de uma seqüência de

24/151 referência por uma ou mais substituições, anulações, ou inserções de aminoácidos conservativos ou não-conservativos, particularmente quando uma tal substituição ocorre em um sítio que não é o sítio ativo da molécula, e desde que o polipeptídeo essencialmente retenha suas propriedades funcionais. Uma substituição de aminoácido conservativo, por exemplo, substitui um aminoácido por outro da mesma classe (por exemplo, substituição de um aminoácido hidrofóbico, tal como isoleucina, valina, leucina, ou metionina, por outro, ou substituição de um aminoácido polar por outro, tal como substituição de arginina por lisina, ácido glutâmico por ácido aspártico ou glutamina por asparagina). Um ou mais aminoácidos podem ser anulados, por exemplo, de um polipeptídeo de alfa amilase, resultando na modificação da estrutura do polipeptídeo, sem significantemente alterar sua atividade biológica. Por exemplo, os aminoácidos amino- ou carboxil-terminais que não são requeridos para atividade biológica de alfa amilase podem ser removidos. As seqüências de polipeptídeo modificadas da invenção podem ser ensaiadas para atividade biológica de alfa amilase por qualquer quantidade de métodos, incluindo contatar a seqüência de polipeptídeo modificada com um substrato de alfa amilase e determinar se o polipeptídeo modificado diminui a quantidade de substrato específico no ensaio ou aumenta os bioprodutos da reação enzimática de um polipeptídeo de alfa amilase funcional com o substrato.

[0077] Fragmentos como empregado aqui são uma porção de uma proteína de ocorrência natural que podem existir em pelo menos duas conformações diferentes. Os fragmentos podem ter a mesma ou substancialmente a mesma seqüência de aminoácido como a proteína de ocorrência natural. Substancialmente a mesma significa que uma seqüência de aminoácido é amplamente, porém não totalmente, a mesma, porém retém pelo menos uma atividade funcional da seqüência a qual está relacionada. Em geral duas seqüências de aminoácidos

25/151 são substancialmente as mesmas ou substancialmente homólogas se elas são pelo menos cerca de 85% idênticas. Os fragmentos que têm estruturas tridimensionais diferentes, como a proteína de ocorrência natural, são também incluídos. Um exemplo deste, é uma molécula pró-forma, tal como uma pró-proteína de atividade baixa que pode ser modificada por clivagem para produzir uma enzima madura com atividade significantemente mais elevada.

[0078] Hibridização refere-se ao processo pelo qual um filamento de ácido nucléico se une com um filamento complementar através do emparelhamento da base. As reações de hibridização podem ser sensíveis e seletivas a fim de que uma seqüência particular de interesse possa ser identificada mesmo em amostras nas quais está presente em concentrações baixas. As condições adequadamente precisas podem ser definidas, por exemplo, pelas concentrações de sal e formamida nas soluções de pré-hibridização e hibridização, ou pela temperatura de hibridização, e são bem-conhecidas na técnica. Em particular, a exatidão pode ser aumentada reduzindo-se a concentração de sal, aumentando-se a concentração de formamida, ou aumentando-se a temperatura de hibridização.

[0079] Por exemplo, a hibridização sob condições de exatidão elevada pode ocorrer em cerca de 50% de formamida em cerca de 37°C a 42°C. A hibridização pode ocorrer sob condições d e exatidão reduzida em cerca de 35% a 25% de formamida em cerca de 30°C a 35°C. Em particular, a hibridização pode ocorrer sob condições de exatidão elevada em 42°C em 50% de formamida, 5 X de SSPE, 0 ,3% de SDS, e 200 n/ml de DNA de esperma de salmão desnaturado e cisalhado. A hibridização pode ocorrer sob condições de exatidão reduzida como descrito acima, porém em 35% de formamida em uma temperatura reduzida de 35°C. A faixa da temperatura correspond endo a um nível particular de exatidão pode ser ainda reduzida calculando-se a relação

26/151 da purina para pirimidina do ácido nucléico de interesse e ajustando-se a temperatura conseqüentemente. As variações nas faixas e condições acima são bem-conhecidas na técnica.

[0080] O termo variantes refere-se a polinucleotídeos ou polipeptídeos da invenção modificados em um ou mais resíduos de, pares de base, códons, íntrons, exons ou aminoácidos (respectivamente) também ainda retendo a atividade biológica de uma alfa amilase da invenção. As variantes podem ser produzidas por qualquer de vários meios, incluindo métodos tal como, por exemplo, PCR propenso a erro, mistura, mutagênese direcionada ao oligonucleotídeo, montagem de PCR, mutagênese PCR sexual, mutagênese in vivo, mutagênese cassete, mutagênese de conjunto recursivo, mutagênese de conjunto exponencial, mutagênese de sítio específico, reagrupamento de gene, GSSM e qualquer combinação destes. As técnicas para produzir amilase variante tendo atividade em um pH ou temperatura, por exemplo que seja diferente da amilase do tipo selvagem, são incluídas aqui.

[0081] As enzimas são catalisadores altamente seletivos. Sua legitimidade é a capacidade de catalisar as reações com estereo-, regio- e quimio-seletividades excelentes que são não emparelhadas na química sintética convencional. Entretanto, as enzimas são notavelmente versáteis. Elas podem ser feitas para funcionar em solventes orgânicos, operar em pHs extremos (por exemplo, pHs elevados e pHs baixos), temperaturas extremas (por exemplo, temperaturas elevadas e temperaturas baixas), níveis de salinidade extremos (por exemplo, salinidade elevada e salinidade baixa), e catalisar reações com compostos que são estruturalmente não relacionados com seus substratos fisiológicos, naturais.

[0082] As enzimas são reativas com respeito a uma ampla faixa de substratos naturais e não naturais, desse modo possibilitando a modificação de virtualmente qualquer composto de indução orgânico. En27/151 tretanto, as enzimas, catalisadores químicos tradicionais desiguais são altamente enantio-, e regiosseletivos. O grau elevado da especificidade do grupo funcional exibido pelas enzimas permite que alguém mantenha o registro de cada reação em uma seqüência sintética induzindo a um novo composto ativo. As enzimas são também capazes de catalisar muitas reações diversas não relacionadas com sua função fisiológica in nature. Por exemplo, as peroxidases catalisam a oxidação dos fenóis por peróxido de hidrogênio. As peroxidases podem também catalisar as reações de hidroxilação que não são relacionadas com a função nativa da enzima. Outros exemplos são proteases que catalisam a decomposição dos polipeptídeos. Na solução orgânica algumas proteases podem também acilar açúcares, uma função não relacionada com a função nativa dessas enzimas.

[0083] Em um aspecto, a invenção inclui um método para liquefazer uma composição contendo amido compreendendo contatar o amido com um polipeptídeo da invenção (por exemplo, um polipeptídeo purificado selecionado de polipeptídeos tendo uma seqüência de aminoácido selecionada a partir do grupo consistindo em: seqüências de aminoácido do Grupo B, variantes tendo pelo menos cerca de 50% de homologia a pelo menos uma das seqüências de aminoácido do Grupo B, em uma região de pelo menos cerca de 100 resíduos, como determinado pela análise com um algoritmo de comparação de seqüência ou por inspeção visual; seqüências complementares a qualquer uma das seqüências de aminoácido do Grupo B; e seqüências complementares a variantes tendo pelo menos cerca de 50% de homologia a qualquer uma das seqüências de aminoácido do Grupo B em uma região de pelo menos cerca de 100 resíduos, como determinado pela análise com um algoritmo de comparação de seqüência ou por inspeção visual; e polipeptídeos tendo pelo menos 10 aminoácidos consecutivos de um polipeptídeo tendo uma seqüência selecionada a partir

28/151 do grupo consistindo em seqüências de aminoácido do Grupo B). Em uma modalidade preferida, o polipeptídeo é apresentado nas seqüências de aminoácido do Grupo B. O amido pode ser de um material selecionado de arroz, arroz germinado, milho, cevada, trigo, legumes e batata doce. O xarope de glicose produzido pelo método da invenção é incluído aqui. Um tal xarope pode ser um xarope de maltose, um xarope de glicose, ou uma combinação destes. Em particular, o xarope produzido empregando a amilase da invenção tem um nível mais elevado de fração de DP2 e um nível mais elevado de DP3 (maltotriose e/ou panose) e menos do que os fragmentos DP7 maiores quando comparados com os xaropes produzidos pelas enzimas comerciais. Isto consiste com o perfil de liquefação uma vez que a minoria dos fragmentos amplos estão nos xaropes liquefeitos da invenção.

[0084] A invenção também fornece um método para remover amido contendo manchas de um material compreendendo contatar o material com um polipeptídeo da invenção. Em um aspecto, a invenção fornece um método para lavar um objeto compreendendo contatar o objeto com um polipeptídeo da invenção sob condições suficientes para lavagem. Um polipeptídeo da invenção pode ser incluído como um aditivo de detergente por exemplo. A invenção também inclui um método para descolar têxteis compreendendo contatar o têxtil com um polipeptídeo da invenção sob condições suficientes para descolar. [0085] A invenção também fornece um método para reduzir o envelhecimento de produtos cozidos compreendendo a adição de um polipeptídeo da invenção ao produto cozido, antes do cozimento.

[0086] A invenção também fornece um método para o tratamento de fibras lignocelulósicas, onde as fibras são tratadas com um polipeptídeo da invenção, em uma quantidade que seja eficiente para melhorar as propriedades das fibras. A invenção inclui um descolorante enzimático de polpa de papel reciclado, onde o polipeptídeo é aplicado

29/151 em uma quantidade que seja eficiente para o descoloramento eficaz da superfície da fibra.

[0087] Qualquer dos métodos descritos aqui inclui a possibilidade da adição de uma segunda alfa amilase ou uma beta amilase ou uma combinação destas. As amilases comerciais ou outras enzimas adequadas para uso em combinação com uma enzima da invenção são conhecidas por aqueles versados na técnica.

[0088] A invenção também inclui um método para aumentar o fluxo da produção de fluidos de uma formação subterrânea removendo-se o fluido prejudicial, contendo amido, viscoso formado durante operações de produção e encontrado na formação subterrânea que envolve uma cavidade completa perfurada compreendendo permitir a produção de fluido fluir da cavidade perfurada; reduzir o fluxo de produção dos fluidos da formação abaixo das taxas de fluxo esperadas; formular um tratamento de enzima misturando-se junto um fluido aquoso e um polipeptídeo da invenção; bombeando-se o tratamento de enzima para um local desejado na cavidade perfurada; permitindo a enzima o tratamento para degradar o fluido prejudicial contendo amido, viscoso, por meio do qual o fluido pode ser removido da formação subterrânea para a superfície da cavidade; e onde o tratamento de enzima é eficaz para atacar as ligações alfa glicosídicas no fluido contendo amido.

[0089] A presente invenção explora as únicas propriedades catalíticas das enzimas. Ao mesmo tempo em que o uso de biocatalisadores (isto é, enzimas brutas ou purificadas, células vivas ou não-vivas) em transformações químicas normalmente requer a identificação de um biocatalisador particular que reage com um composto de partida específico, a presente invenção emprega biocatalisadores selecionados e condições de reação que são específicos para grupos funcionais que estão presentes em muitos compostos de partida.

[0090] Cada biocatalisador é específico para um grupo funcional,

30/151 ou vários grupos funcionais relacionados, e pode reagir com muitos compostos de partida contendo este grupo funcional.

[0091] As reações biocatalíticas produzem uma população de derivados de um único composto de partida. Esses derivados podem ser submetidos a outra rodada de reações biocatalíticas para produzir uma segunda população de compostos derivados. Mil das variações do composto original pode ser produzido com cada iteração de derivatização biocatalítica.

[0092] As enzimas reagem em sítios específicos de um composto de partida sem afetar o restante da molécula, um processo que é muito difícil de obter empregando-se métodos químicos tradicionais. Este grau elevado de especificidade biocatalítica fornece os meios para identificar um único composto ativo na biblioteca. A biblioteca é caracterizada pelas séries de reações biocatalíticas empregadas para produzir, uma então chamada história biossintética. A avaliação da biblioteca quanto às atividades biológicas e traçado da história biossintética identifica a seqüência de reação específica produzindo o composto ativo. A seqüência de reação é repetida e a estrutura do composto sintetizado é determinada. Este modo de identificação, diferente de outras sínteses de métodos de avaliação, não requer tecnologias de imobilização, e compostos podem ser sintetizados e testados livres na solução empregando virtualmente qualquer tipo de ensaio de avaliação. É importante observar, que o grau elevado de especificidade de reações de enzima nos grupos funcionais considera o traçado das reações enzimáticas específicas que compõe a biblioteca biocataliticamente produzida.

[0093] Existem muitas vantagens na avaliação de bibliotecas de lambda fago para descobertas com base na expressão de amilase. Essas incluem detecção melhorada dos clones tóxicos; acesso melhorado aos substratos; necessidade reduzida de projetar um hospedeiro;

31/151 passagem secundária do potencial para qualquer inclinação resultante da excisão da massa da biblioteca; e desenvolvimento mais rápido das densidades baixas do clone. Adicionalmente, existem vantagens na avaliação de bibliotecas de lambda fago na fase líquida sobre a fase sólida. Essas incluem: maior flexibilidade nas condições de ensaio; flexibilidade do substrato adicional; sensibilidade mais elevada para clones fracos; e facilidade de automação.

[0094] Muitas das etapas do procedimento são realizadas empregando automação robótica possibilitando a execução de milhares de reações biocatalíticas e ensaios de avaliação por dia bem como garantindo um nível elevado de exatidão e reproducibilidade. Como um resultado, uma biblioteca de compostos derivados pode ser produzida em uma questão de semanas o que levaria anos para produzir empregando métodos químicos correntes. (Para outros ensinamentos na modificação de moléculas, incluindo pequenas moléculas, observe PCT/US94/09174, aqui incorporada por referência em sua totalidade). [0095] Em um aspecto, a presente invenção fornece um método não-estocástico chamado reagrupamento de gene sintético, que é algumas vezes relacionado com a mistura estocástica, evita que os blocos de construções de ácido nucléico não sejam misturados ou concatenados ou quimierizados aleatoriamente, porém são preferivelmente montados não-estocasticamente.

[0096] O método de reagrupamento de gene sintético não depende da presença de um nível elevado de homologia entre os polinucleotídeos a serem misturados. A invenção pode ser empregada para nãoestocasticamente gerar bibliotecas (ou grupos) de moléculas descendentes compreendidas de 10¹⁰⁰ quimeras diferentes. De modo concebível, o reagrupamento de gene sintético pode ainda ser empregado para gerar bibliotecas compreendidas de 10¹⁰⁰⁰ quimeras descendentes diferentes. Desse modo, em um aspecto, a invenção fornece um

32/151 método não-estocástico para produzir um grupo de moléculas de ácido nucléico quiméricas finalizadas tendo uma montagem total a fim de que seja escolhida pelo desenho, cujo método é compreendido das etapas de gerar pelo desenho uma pluralidade de blocos de construção de ácido nucléico específico tendo extremidades ligáveis mutuamente compatíveis úteis, e montagem desses blocos de construção de ácido nucléico, tal que a ordem de montagem total desenhada seja obtida.

[0097] As extremidades ligáveis mutualmente compatíveis dos blocos de construção de ácido nucléico a serem montadas são consideradas serem úteis por este tipo de montagem ordenada se elas permitem que os blocos de construção sejam acoplados em ordens predeterminadas. Desse modo, em um aspecto, a ordem da montagem geral na qual os blocos de construção de ácido nucléico podem ser acoplados é especificada pelo desenho das extremidades ligáveis e, se mais do que uma etapa de montagem é para ser empregada, então a ordem da montagem total na qual os blocos de construção de ácido nucléico podem ser acoplados é também especificada pela ordem seqüencial das etapas da montagem. Em uma modalidade da invenção, os pedaços de construção recozidos são tratados com uma enzima, tal como uma ligase (por exemplo, ligase de DNA T4) para obter ligação covalente dos pedaços da construção.

[0098] Em uma outra modalidade, o desenho dos blocos de construção do ácido nucléico é obtido sob análise das seqüências de um grupo de modelos de ácido nucléico progenitor que serve como uma base para produzir um grupo de progênie de moléculas de ácido nucléico quimérico finalizadas. Esses modelos de ácido nucléico progenitor desse modo servem como uma fonte de informação de seqüência que auxilia no desenho dos blocos de construção de ácido nucléico que são para ser mutagenizados, por exemplo, quimerizados ou mistu33/151 rados.

[0099] Em uma exemplificação, a invenção provê a subsistência da quimerização de uma família de genes relacionados e sua família codificada de produtos relacionados. Em uma exemplificação particular, os produtos codificados são enzimas. As amilases da presente invenção, por exemplo, alfa amilases ou amilases alcalinas, podem ser mutagenizadas de acordo com os métodos descritos aqui.

[00100] Desse modo, de acordo com um aspecto da invenção, as seqüências de uma pluralidade de modelos de ácido nucléico progenitor (por exemplo, polinucleotídeos das seqüências de ácido nucléico do Grupo A) são alinhadas a fim de selecionar um ou mais pontos de demarcação, cujos pontos de demarcação podem ser localizados em uma área de homologia. Os pontos de demarcação podem ser empregados para delinear os limites dos blocos de construção de ácido nucléico a serem gerados. Desse modo, os pontos de demarcação identificados e selecionados nas moléculas progenitoras servem como pontos de quimerização potencial na montagem das moléculas progênies. [00101] Tipicamente um ponto de demarcação útil está na área de homologia (compreendida de pelo menos uma base de nucleotídeo homóloga) dividida por pelo menos dois modelos progenitores, porém o ponto de demarcação pode ser uma área de homologia que é dividida por pelo menos metade dos modelos progenitores, pelo menos dois terços dos modelos progenitores, pelo menos três quartos dos modelos progenitores, e preferivelmente em quase todos dos modelos progenitores. Ainda mais preferivelmente um outro ponto de demarcação útil é uma área de homologia que é dividida por todos os modelos progenitores.

[00102] Em uma modalidade, o processo de reagrupamento do gene é realizado exaustivamente a fim de gerar uma biblioteca exaustiva. Em outras palavras, todas combinações possíveis ordenadas dos blo34/151 cos de construção de ácido nucléico são representadas no grupo de moléculas de ácido nucléico quimérico finalizadas. Ao mesmo tempo, a ordem da montagem (isto é, a ordem da montagem de cada bloco de construção na seqüência 5' a 3 de cada ácido nucléico quimérico finalizado) em cada combinação é pelo desenho (ou não-estocástica). Por causa da natureza não-estocástica do método, a possibilidade de produtos laterais não desejados é geralmente reduzida.

[00103] Em outra modalidade, o método provê que o processo de reagrupamento de gene seja realizado sistematicamente, por exemplo, para gerar uma biblioteca sistematicamente compartimentalizada, com compartimentos que podem ser avaliados sistematicamente, por exemplo, um por um. Em outras palavras a invenção provê que, através do uso criterioso e seletivo de blocos de construção de ácido nucléico específicos, acoplada com o uso criterioso e seletivo de reações de montagem seqüencialmente graduadas, um desenho experimental pode ser obtido onde os grupos específicos de produtos progênies são feitos em cada dos vários recipientes de reação. Isto permite que um exame sistemático e procedimento de avaliação sejam realizados. Desse modo, permite que uma quantidade potencialmente muito maior de moléculas progênies seja examinada sistematicamente em grupos menores.

[00104] Por causa de sua capacidade de realizar quimerizações de uma maneira que é altamente flexível ainda mais exaustiva e sistemática também, particularmente quando há um nível baixo de homologia entre as moléculas progenitoras, a presente invenção provê a subsistência da geração de uma biblioteca (ou grupo) compreendida de uma grande quantidade de moléculas progênies. Por causa da natureza não-estocástica do reagrupamento de gene da presente invenção, as moléculas progênies geradas preferivelmente compreendem uma biblioteca de moléculas de ácido nucléico quimérico finalizado tendo

35/151 uma ordem de montagem total que é escolhida pelo desenho. Em uma modalidade particular, uma tal biblioteca gerada é compreendida de mais do que 103 a mais do que 101000 espécies de moléculas de progênies diferentes.

[00105] Em um aspecto, um grupo de moléculas de ácido nucléico quimérico finalizado, produzido como descrito é compreendido de um polinucleotídeo codificando um polipeptídeo. De acordo com uma modalidade, este polinucleotídeo é um gene, que pode ser um gene feito pelo homem. De acordo com outra modalidade, este polinucleotídeo é uma passagem de gene, que pode ser uma passagem de gene feita pelo homem. A invenção provê que um ou mais genes feitos pelo homem gerados pela invenção possam ser incorporados em uma passagem de gene feita pelo homem, tal como passagem operável em um organismo eucariótico (incluindo uma planta).

[00106] Em outra exemplificação, a natureza sintética da etapa na qual os blocos de construção são gerados permite que o desenho e introdução dos nucleotídeos (por exemplo, um ou mais nucleotídeos, que podem ser, por exemplo, códon ou íntrons ou seqüências reguladoras) possam posteriormente ser opcionalmente removidos em um processo in vitro (por exemplo, por mutagênese) ou em um processo in vivo (por exemplo, utilizando-se a capacidade de união do gene de um organismo hospedeiro). É apreciado que em muitos exemplos a introdução desses nucleotídeos pode também ser desejada por muitas outras razões além do benefício potencial de criar um ponto de demarcação útil.

[00107] Desse modo, de acordo com outra modalidade, a invenção fornece um bloco de construção de ácido nucléico que pode ser empregado para introduzir um íntron. Desse modo, a invenção fornece íntrons funcionais que podem ser introduzidos em um gene feito pelo homem da invenção. A invenção também fornece íntrons funcionais

36/151 que podem ser introduzidos em uma passagem de gene feito pelo homem da invenção. Conseqüentemente, a invenção provê a subsistência da geração de um polinucleotídeo quimérico que é um gene feito pelo homem contendo um (ou mais) íntrons artificialmente introduzidos.

[00108] Conseqüentemente, a invenção também provê a subsistência da geração de um polinucleotídeo quimérico que é uma passagem de gene feito pelo homem contendo um (ou mais) íntron artificialmente introduzido. Preferivelmente, os íntrons artificialmente introduzidos são funcionais em uma ou mais células hospedeiras para a maioria da união de gene de modo que os íntrons de ocorrência natural sirvam funcionalmente na união do gene. A invenção fornece um processo para produzir polinucleotídeos contendo íntrons feitos pelo homem a serem introduzidos em organismos hospedeiros para a recombinação e/ou união.

[00109] Um gene feito pelo homem produzido empregando a invenção pode também servir como um substrato para a recombinação com outro ácido nucléico. De outro modo, uma passagem de gene feito pelo homem produzida empregando a invenção pode também servir como um substrato para recombinação com outro ácido nucléico. Em um exemplo preferido, a recombinação é facilitada por, ou ocorre em, áreas de homologia entre o gene contendo o íntron feito pelo homem e um ácido nucléico, que serve como um par recombinante. Em um exemplo particularmente preferido, o par recombinante pode também ser um ácido nucléico gerado pela invenção, incluindo um gene feito pelo homem ou uma passagem do gene feito pelo homem. A recombinação pode ser facilitada por ou pode ocorrer em áreas de homologia que existem em um (ou mais) íntron artificialmente introduzido no gene feito pelo homem.

[00110] O método de reagrupamento de gene sintético da invenção

37/151 utiliza uma pluralidade de blocos de construção de ácido nucléico, cada dos quais preferivelmente tem duas extremidades ligáveis. As duas extremidades ligáveis em cada bloco de construção de ácido nucléico podem ser duas extremidades ásperas (isto é, cada tendo uma projeção de zero nucleotídeo), ou preferivelmente uma extremidade áspera e uma projeção, ou mais preferivelmente ainda duas projeções.

[00111] Uma projeção útil para este propósito pode ser uma projeção 3' ou uma projeção 5'. Desse modo, um bloco de construção de ácido nucléico pode ter projeção 3' ou alternativamente uma projeção 5' ou alternativamente duas projeções 3' ou alternativamente duas projeções 5'. A ordem total na qual os blocos de construção de ácido nucléico são montados para formar uma molécula de ácido nucléico quimérica finalizada é determinada pelo desenho experimental significativo e não é aleatório.

[00112] De acordo com uma modalidade preferida, um bloco de construção de ácido nucléico é gerado por síntese química de dois ácidos nucléicos de filamento único (também referido como oligos de filamento único) e contatando-os a fim de que os permita recozer para formar um bloco de construção de ácido nucléico de filamento duplo. [00113] Um bloco de construção de ácido nucléico de filamento duplo pode ser de tamanho variável. Os tamanhos desses blocos de construção podem ser pequenos ou grandes. Os tamanhos preferidos de blocos de construção variam de um par de base (não incluindo qualquer projeção) a 100.000 pares de base (não incluindo qualquer projeção). Outras faixas de tamanhos preferidas são também fornecidas, as quais têm limites inferiores de 1 pb a 10.000 bp (incluindo todos os valores de números inteiros envolvidos), e limites superiores de 2 bp a 100.000 bp (incluindo todo o valor de número inteiro envolvido). [00114] Muitos métodos existem pelos quais um bloco de construção de ácido nucléico de filamento duplo pode ser gerado, o qual é útil

38/151 para a invenção; e esses são conhecidos na técnica e podem ser facilmente realizados por aqueles versados na técnica.

[00115] De acordo com uma modalidade, um bloco de construção de ácido nucléico de filamento duplo é gerado primeiro gerando-se dois ácidos nucléicos de filamento único e permitindo-os recozer para formar um bloco de construção de ácido nucléico de filamento duplo. Os dois filamentos de um bloco de construção de ácido nucléico de filamento duplo podem ser complementares em todo o nucleotídeo não considerando qualquer que forme uma projeção; desse modo não contendo nenhuma má combinação, não considerando qualquer projeção. De acordo com outra modalidade, os dois filamentos de um bloco de construção de ácido nucléico de filamento duplo são complementares em menos do que todos os nucleotídeos não considerando qualquer que forme uma projeção. Desse modo, de acordo com esta modalidade, um bloco de construção de ácido nucléico de filamento duplo pode ser empregado para introduzir degeneração de códon. Preferivelmente a degeneração de códon é introduzida empregando a mutagênese de saturação de sítio descrita aqui, empregando um ou mais cassetes N, N, G/T ou alternativamente empregando um ou mais cassetes N, N, N. [00116] O método de recombinação in vivo da invenção pode ser realizado cegamente em um grupo de alelos ou híbridos desconhecidos de uma seqüência ou polinucleotídeo específico. Entretanto, não é necessário conhecer a seqüência de DNA ou RNA atual do polinucleotídeo específico.

[00117] O método para usar recombinação em uma população misturada de genes pode se útil para a geração de qualquer proteína, por exemplo, interleucina 1, anticorpos, tPA e hormônios do crescimento. Este método pode ser empregado para gerar proteínas tendo a atividade ou especificidade alterada. O método pode também ser útil para a geração de seqüências híbridas de ácido nucléico, por exemplo, re39/151 giões promotoras, íntrons, exons, seqüências realçadoras, 31 regiões não traduzidas ou 51 regiões não traduzidas de genes. Desse modo este método pode ser empregado para gerar genes tendo taxas aumentadas de expressão. Este método pode também ser útil no estudo das seqüências de DNA repetitivas. Finalmente, este método pode ser útil para mudar ribozimas ou aptâmeros.

[00118] Em um aspecto, a invenção descrita aqui está direcionada ao uso de ciclos repetidos de reagrupamento redutivo, recombinação e seleção que considera a evolução molecular direcionada de seqüências lineares altamente complexas, tal como recombinação completa de proteínas, DNA ou RNA.

[00119] A mistura in vivo de moléculas é útil no fornecimento de variantes e pode ser realizada utilizando a propriedade natural de células para recombinar multímeros. Ao mesmo tempo em que a recombinação in vivo tem fornecido a rotina natural principal para diversidade molecular, a recombinação genética permanece um processo relativamente complexo que envolve (1) o reconhecimento de homologias; (2) clivagem de filamentos, invasão de filamento, e etapas metabólicas induzindo à produção de quiasmas recombinantes; e finalmente (3) a resolução de quiasmas em moléculas recombinadas discretas. A formação do quiasma requer o reconhecimento das seqüências homólogas.

[00120] Em outra modalidade, a invenção inclui um método para produzir um polinucleotídeo híbrido de pelo menos um primeiro polinucleotídeo e um segundo polinucleotídeo. A invenção pode ser empregada para produzir um polinucleotídeo híbrido introduzindo-se pelo menos um primeiro polinucleotídeo e um segundo polinucleotídeo que divide pelo menos uma região da homologia de seqüência parcial em uma célula hospedeira adequada. As regiões da homologia de seqüência parcial promovem processos que resultam na reorganização

40/151 da seqüência produzindo um polinucleotídeo híbrido. O termo polinucleotídeo híbrido, como empregado aqui, é qualquer seqüência de nucleotídeo que resulta do método da presente invenção e contém seqüência de pelo menos duas seqüências de polinucleotídeo original. Tais polinucleotídeos híbridos podem resultar de eventos de recombinação intermolecular que promovem a integração da seqüência entre as moléculas de DNA. Além disso, tais polinucleotídeos híbridos podem resultar de processos de reagrupamento redutivo intramolecular que utiliza seqüências repetidas para alterar uma seqüência de nucleotídeo em uma molécula de DNA.

[00121] A invenção fornece um meio para gerar polinucleotídeos híbridos que podem codificar polipeptídeos híbridos biologicamente ativos (por exemplo, alfa amilase híbrida). Em um aspecto, os polinucleotídeos originais codificam polipeptídeos biologicamente ativos. O método da invenção produz novos polipeptídeos híbridos utilizando-se processos celulares que integram a seqüência dos polinucleotídeos originais tal que o polinucleotídeo híbrido resultante codifique um polipeptídeo demonstrando atividades derivadas dos polipeptídeos biologicamente ativos originais. Por exemplo, os polinucleotídeos originais podem codificar uma enzima particular de diferentes microorganismos. Uma enzima codificada por um primeiro polinucleotídeo de um organismo ou variante pode, por exemplo, funcionar eficazmente sob uma condição ambiental particular, por exemplo, salinidade elevada. Uma enzima codificada por um segundo polinucleotídeo de um diferente organismo ou variante pode funcionar eficazmente sob uma condição ambiental diferente, tal como temperaturas extremamente elevadas. Uma seqüência contendo polinucleotídeo híbrido dos primeiro e segundo polinucleotídeos originais pode codificar uma enzima que exibe características de ambas enzimas codificadas pelos polinucleotídeos originais. Desse modo, a enzima codificada pelo polinucleotídeo híbri41/151 do pode funcionar eficazmente sob condições ambientais divididas por cada das enzimas codificadas pelo primeiro e segundo polinucleotídeos, por exemplo, salinidade elevada e temperaturas extremas. [00122] As enzimas codificadas pelos polinucleotídeos da invenção incluem, porém não estão limitadas a, hidrolases, tal como alfa amilases e amilases alcalinas. Um polipeptídeo híbrido resultando do método da invenção pode exibir atividade de enzima especializada não divulgada nas enzimas originais. Por exemplo seguinte a recombinação e/ou reagrupamento redutivo de polinucleotídeos codificando atividades de hidrolase, o polipeptídeo híbrido resultante codificado por um polinucleotídeo híbrido pode ser avaliado quanto à atividade de hidrolase especializada obtida de cada das enzimas originais, isto é, o tipo de ligação na qual a hidrolase atua e a temperatura na qual a hidrolase funciona. Desse modo, por exemplo, a hidrolase pode ser avaliada para determinar aquelas funcionalidades químicas que distinguem a hidrolase híbrida das hidrolases originais, tal como (a) amida (ligações de peptídeo), isto é proteases; (b) ligação de éster; isto é amilases e lipases; (c) acetais; isto é, glicosidase e, por exemplo, a temperatura, pH ou concentração de sal nos quais o polipeptídeo híbrido funciona. [00123] As fontes dos polinucleotídeos originais podem ser isoladas de organismos individuais (isolados), coleções de organismos que tenham sido desenvolvidos em veículos definidos (enriquecimento de cultura), ou, organismos não cultivados (amostras ambientais). O uso de um método independente de cultura para obter polinucleotídeos codificando novas bioatividades das amostras ambientais é mais preferível uma vez que permite que alguém acesse os recursos armazenados da biodiversidade.

[00124] Bibliotecas ambientais são geradas de amostras ambientais e representam os genomas coletivos de organismos de ocorrência natural arquivados nos vetores de clonagem que podem ser propaga42/151 dos em hospedeiros procarióticos adequados. Por causa do DNA clonado ser inicialmente extraído diretamente das amostras ambientais, as bibliotecas não são limitadas a pequenas frações de procariotas que podem ser desenvolvidos na cultura pura. Adicionalmente, uma normalização do DNA ambiental presente nessas amostras pode permitir representação mais igual do DNA de todas as espécies presentes na amostra original. Isto pode dramaticamente aumentar a eficiência dos genes de interesse da descoberta de constituintes menores da amostra que pode ser sub-representada por várias ordens de magnitude comparada as espécies dominantes.

[00125] Por exemplo, as bibliotecas de gene geradas a partir de um ou mais microorganismos não cultivados são avaliadas quanto a uma atividade de interesse. As passagens potenciais codificando as moléculas bioativas de interesse são primeiro capturadas nas células procarióticas na forma de bibliotecas de expressão de gene. Os polinucleotídeos codificando as atividades de interesse são isolados de tais bibliotecas e introduzidos em uma célula hospedeira. A célula hospedeira é desenvolvida sob condições que promovem a recombinação e/ou reagrupamento redutivo criando biomoléculas potencialmente ativas com atividades novas ou realçadas.

[00126] Os microorganismos dos quais o polinucleotídeo pode ser preparado incluem microorganismos procarióticos, tal como Eubacteria e Archaebacteria, e microorganismos eucarióticos inferiores tal como fungos, algumas algas e protozoários. Os polinucleotídeos podem ser isolados de amostras ambientais, caso no qual o ácido nucléico pode ser recuperado sem cultivo de um organismo ou recuperado de um ou mais organismos cultivados. Em um aspecto, tais microorganismos podem ser extremófilos, tal como hipertermófilos, psicrófilos, psicrotrófis, halófilos, barófilos e acidófilos. Os polinucleotídeos codificando enzimas isoladas de microorganismos extremofílicos são particularmente

43/151 preferidos. Tais enzimas podem funcionar em temperaturas acima de 1ÜÜ°C em fontes de água quente terrestre e ventos térmicos do mar profundo, em temperaturas abaixo de Ü°C em águas árticas, no ambiente de sal saturado do Mar Morto, em valores de pH próximos a Ü, em depósitos de carvão e origens ricas em enxofre geotérmicas, ou em valores de pH maiores do que 11 em sedimento de esgoto. Por exemplo, várias amilases e lipases clonadas e expressadas de organismos extremofílicos mostram atividade elevada por toda uma ampla faixa de temperaturas e pHs.

[ÜÜ127] Das novas enzimas da presente invenção, muitas foram purificadas e caracterizadas em pH 8, em ambos 4Ü°C e 5Ü°C, e pH 1Ü em ambos 4Ü°C e 5Ü°C. Das enzimas constatadas se rem purificadas e caracterizadas em pH 8 e 4Ü°C, observado ter três vezes (628 U/mg) a atividade específica de uma enzima B. lichenoformis (228 U/mg). Adicionalmente, outra enzima foi observada ter aproximadamente a atividade equivalente (25Ü U/mg) à enzima B. lichenoformis. Em um pH 1Ü e 5Ü°C, uma das enzimas tem uma atividade específica de 31 U/mg e outra tem uma atividade específica de 27,5 U/mg, ao mesmo tempo em que B. lichenoformis tem uma atividade específica de 27 U/mg.

[ÜÜ128] Os polinucleotídeos selecionados e isolados como descrito acima são introduzidos em uma célula hospedeira adequada. Uma célula hospedeira adequada é qualquer célula que é capaz de promover a recombinação e/ou reagrupamento redutivo. Os polinucleotídeos selecionados estão preferivelmente ainda em um vetor que inclui seqüências de controle apropriadas. A célula hospedeira pode ser uma célula eucariótica mais elevada, tal como uma célula de mamífero, ou uma célula eucariótica inferior, tal como célula de levedura, ou preferivelmente, a célula hospedeira pode ser uma célula procariótica, tal como uma célula bacteriana. A introdução do constructo na célula

44/151 hospedeira pode ser efetuada por transfecção de fosfato de cálcio, transfecção mediada por DEAE-Dextrano, ou eletroporação (Davis e outros, 1986).

[00129] Como exemplos representativos de hospedeiros apropriados, podem ser mencionados: células bacterianas, tal como, E. coli, streptomyces, Salmonella typhimurium; células fungais, tal como levedura; células de insetos tal como Drosofila S2 e Spodoptera Sf9; células de animais tal como CHO, COS, ou melanoma de intestinos; adenovírus; e células de planta. A seleção de um hospedeiro apropriado é considerada estar no escopo daqueles versados na técnica dos ensinamentos desta.

[00130] Com referências particulares aos vários sistemas de cultura de célula de mamífero que podem ser empregados para expressar a proteína recombinante, os exemplos de sistemas de expressão de mamífero incluem linhagens COS-7 de fibroblastos do rim do macaco, descrito em SV40-transformed simian cells support the replication of early SV40 mutants (Gluzman, 1981), e outras linhagens de células capazes de expressar um vetor compatível, por exemplo, as linhagens de células C127, 3T3, CHO, HeLa e BHK. Os vetores de expressão de mamíferos compreenderão uma origem de replicação, um realçador e promotor adequado, e também qualquer sítio de aglutinação de ribossomo necessário, sítio de poliadenilação, sítio de aceitação e doador de união, seqüência de terminação transcricional, e seqüências não transcritas de flanqueação 5'. As seqüências de DNA, derivadas da união SV40, e sítios de poliadenilação podem ser empregados para fornecer os elementos genéticos não transcritos requeridos.

[00131] As células hospedeiras contendo os polinucleotídeos de interesse podem ser cultivadas em veículos nutrientes convencionais modificados quando apropriado para promotores de ativação, selecionando os transformantes ou amplificando os genes. As condições da

45/151 cultura, tal como temperatura, pH e outros, são aqueles previamente empregados com a célula hospedeira selecionada para expressão, e será aparente aos técnicos ordinariamente versados. Os clones que são identificados como tendo a atividade de enzima especificada podem então ser seqüenciados para identificar a seqüência de polinucleotídeo codificando uma enzima tendo a atividade realçada.

[00132] Em outro aspecto, é considerado que o método da presente invenção pode ser empregado para gerar novos polinucleotídeos codificando passagens bioquímicas de um ou mais opérons ou agrupamentos de genes ou porções destes. Por exemplo, as bactérias e muitos eucariotas têm um mecanismo coordenado para regular os genes, cujos produtos estão envolvidos nos processos relacionados. Os genes são agrupados, nas estruturas referidas como agrupamento de genes, em um único cromossomo e são transcritos juntos sob o controle de uma única seqüência reguladora, incluindo um único promotor que inicia a transcrição do agrupamento total. Desse modo, o agrupamento do gene é um grupo de genes adjacentes que são ou idênticos ou relacionados, freqüentemente quanto à sua função. Um exemplo de uma passagem bioquímica codificada por agrupamento de genes são policetidas. As policetidas são moléculas que são uma fonte extremamente rica de bioatividades, incluindo antibióticos (tal como tetraciclinas e eritromicinas). Agentes anticâncer (daunomicina), imunossupressores (FK506 e rapamicina), e produtos veterinários (monensina). Muitas policetidas (produzidas por sintase de policetidas) são valiosas como agentes terapêuticos. Síntase de policetida são enzimas multifuncionais que catalisam a biossíntese de uma enorme variedade de cadeias de carbono diferindo na extensão e padrões de funcionalidade e ciclização. Os genes de sintase de policetida incluem-se nos agrupamentos de gene e pelo menos um tipo (designado tipo I) de sintase de policetida tem enzimas e genes de tamanho amplo, complicando a

46/151 manipulação genética e estudos in vitro desses genes/proteínas. [00133] O DNA de agrupamento de gene pode ser isolado de diferentes organismos e ligado nos vetores, particularmente vetores contendo seqüências reguladoras de expressão que podem controlar e regular a produção de uma proteína detectável ou atividade de disposição relacionada com proteína dos agrupamentos de gene ligados. O uso de vetores que têm uma capacidade excepcionalmente ampla para introdução de DNA exógeno é particularmente apropriado para uso com agrupamento de gene e é descrito por modo de exemplo aqui, para incluir o f-fator (ou fator de fertilidade) de E. coli. Este f-fator de E. coli é um plasmídeo que afeta a transferência de freqüência elevada de si próprio durante a conjugação e é ideal para obter e estavelmente propagar amplos fragmentos de DNA, tal como agrupamentos de gene de amostras microbiais misturadas. Uma modalidade particularmente preferida é empregar vetores de clonagem, referidos como vetores de fosmídeos ou de cromossomos artificiais bacterianos (BAC). Esses são derivados de f-fator de E. coli que é capaz de estavelmente integrar amplos segmentos de DNA genômico. Quando integrado com DNA de uma amostra ambiental não cultivada misturada, isto torna possível obter grandes fragmentos genômicos na forma de uma estável biblioteca de DNA ambiental. Outro tipo de vetor para uso na presente invenção é um vetor de cosmídeo. Os vetores de cosmídeo foram originalmente designados para clonar e propagar amplos segmentos de DNA genômico. A clonagem em vetores de cosmídeo é descrita em detalhes em Sambroak e outros, Molecular Cloning: A Laboratory Manual, 2^a edição, Cold Spring Harbor Laboratory Press (1989). Uma vez ligado em um vetor apropriado, dois ou mais vetores contendo agrupamentos de gene de sintase de policetida diferentes podem ser introduzidos em uma célula hospedeira adequada. As regiões de homologia de seqüência parcial dividida pelo agrupamento de gene pro47/151 moverão o processo que resulta na reorganização da seqüência resultando em um agrupamento de gene híbrido. O novo agrupamento de gene híbrido pode então ser avaliado quanto às atividades realçadas não encontradas nos agrupamentos de gene original.

[00134] Portanto, em uma modalidade, a invenção refere-se a um método para produzir um polipeptídeo híbrido biologicamente ativo e avaliar um tal polipeptídeo quanto à atividade realçada:

[00135] introduzindo-se pelo menos um primeiro polinucleotídeo na ligação operável e um segundo polinucleotídeo na ligação operável, referido pelo menos primeiro polinucleotídeo e segundo polinucleotídeo dividindo pelo menos uma região de homologia de seqüência parcial, em uma célula hospedeira adequada;

[00136] desenvolvendo-se a célula hospedeira sob condições que promovam a reorganização da seqüência resultando em um polinucleotídeo híbrido em ligações operáveis;

[00137] expressando-se um polipeptídeo híbrido codificado pelo polinucleotídeo híbrido;

[00138] avaliando-se o polipeptídeo híbrido sob condições que promovam a identificação da atividade biológica realçada; e [00139] isolando-se um polinucleotídeo codificando o polipeptídeo híbrido.

[00140] Os métodos para avaliação de várias atividades de enzima são conhecidos por aqueles versados na técnica e são discutidos por todo o presente relatório descritivo. Tais métodos podem ser empregados quando isolando os polipeptídeos e polinucleotídeos da invenção.

[00141] Como exemplos representativos dos vetores de expressão que podem ser empregados, podem ser mencionados partículas virais, baculovírus, fago, plasmídeos, fagomídeos, cosmídeos, fosmídeos, cromossomos artificiais bacterianos, DNA viral (por exemplo, vacina,

48/151 adenovírus, vírus de pústula de ave, pseudohidrofobia e derivados de SV40), cromossomos artificiais com base em P1, plasmídeos de levedura, cromossomos artificiais de levedura, e qualquer outro vetor específico para hospedeiros específicos de interesse (tal como bacilus, aspergilo e levedura). Desse modo, por exemplo, o DNA pode ser incluído em qualquer uma de uma variedade de vetores de expressão para expressar um polipeptídeo. Tais vetores incluem seqüências de DNA cromossômico, não cromossômico e sintético. Os grandes números de vetores adequados são conhecidos por aqueles versados na técnica, e são comercialmente disponíveis. Os seguintes vetores são fornecidos por modo de exemplo; Bacteriano: vetores pQE (Qiagen), plasmídeos pBluescript, vetores pNH, (vetores lambdaZAP)(Stratagene); ptrc99a, pKK223-3, pDR540, pRIT2T (Pharmacia); Eucariótico; pXT1, pSG5 (Stratagene), pSVK3, pBPV, pMSG, pSVLSV40 (Pharmacia). Entretanto, qualquer outro plasmídeo ou outro vetor pode ser empregado contanto que eles sejam reproduzíveis e viáveis no hospedeiro. Os vetores de número de cópia baixo ou número de cópia elevado podem ser empregados com a presente invenção. [00142] A seqüência de DNA no vetor de expressão é operativamente ligada a uma seqüência de controle de expressão apropriada (promotora) para direcionar a síntese de RNA. Os promotores bacterianos particulares nomeados incluem lacI, IacZ, T3, T7, gpt, lambda PR, PL e trp. Os promotores eucarióticos incluem CMV imediato tardio, cinase de timidina de HSV, SV40 precoce e tardia, LTRs de retrovírus, e metalotioneína-I de camundongo. A seleção do promotor e vetor apropriado está bem no nível dos versados ordinários da técnica. O vetor de expressão também contém um sítio de aglutinação de ribossomo para iniciação da translação e um terminador de transcrição. O vetor pode também incluir seqüências apropriadas para amplificar a expressão. As regiões promotoras podem ser selecionadas de qualquer

49/151 gene desejado empregando vetores de transferase de cloramfenicol (CAT) ou outros vetores com marcadores selecionáveis. Além disso, os vetores de expressão preferivelmente contêm um ou mais genes de marcadores selecionáveis para fornecer um traço fenotípico para a seleção de células hospedeiras transformadas tal como resistência à neomicina ou reductase de dihidrofolato para cultura de células eucarióticas, ou tal como resistência à ampicilina e tetraciclina em E. coli. [00143] O reagrupamento in vivo é focado em processos intermoleculares coletivamente referidos como recombinação que na bactéria, é geralmente observado como um fenômeno dependente de RecA. A invenção pode contar com processos de recombinação de uma célula hospedeira para recombinar e reagrupar seqüências, ou a capacidade das células de mediar os processos redutivos para diminuir a complexidade de seqüências quase-repetidas na célula por anulação. Este processo de reagrupamento redutivo ocorre por um processo independente de RecA intra molecular.

[00144] Portanto, em outro aspecto da invenção, novos polinucleotídeos podem ser gerados pelo processo de reagrupamento redutivo. O método envolve a geração de constructos contatando seqüências consecutivas (seqüências de codificação original), sua inserção em um vetor apropriado, e sua introdução subseqüente em uma célula hospedeira apropriada. O reagrupamento da identidade molecular individual ocorre por processos combinatórios entre as seqüências consecutivas nas regiões de posse de constructos de homologia, ou entre as unidades quase-repetidas. O processo de reagrupamento recombina e/ou reduz a complexidade e extensão das seqüências repetidas, e resulta na produção de novas espécies moleculares. Vários tratamentos podem ser aplicados para realçar a taxa de reagrupamento. Esses incluem tratamento com luz ultravioleta, ou químicos de danificação de DNA, e/ou o uso de linhagem de célula hospedeira exibindo níveis re50/151 alçados de instabilidade genética. Desse modo o processo de reagrupamento pode envolver recombinações homólogas ou a propriedade natural de seqüências quase-repetidas para direcionar sua própria evolução.

[00145] As seqüências repetidas ou quase repetidas desempenham um papel na instabilidade genética. Na presente invenção, quase-repetidas são repetições que não são restritas à sua estrutura de unidade original. As unidades quase-repetidas podem ser apresentadas como uma disposição de seqüências em um constructo; unidades consecutivas de seqüências similares. Uma vez ligada, as junções entre as seqüências consecutivas tornam-se essencialmente invisíveis e a natureza quase-repetitiva do constructo resultante é agora contínua no nível molecular. O processo de anulação das células executa para reduzir a complexidade do constructo resultante operando entre as seqüências quase repetidas. As unidades quase-repetidas fornecem um repertório praticamente ilimitado de modelos nos quais os eventos de deslizamento podem ocorrer. Os constructos contendo as quaserepetidas desse modo, eficazmente fornecem elasticidade molecular suficiente, pela qual os eventos de anulação (e potencialmente inserção) possam ocorrer virtualmente em qualquer lugar nas unidades quase-repetitivas.

[00146] Quando as seqüências quase-repetidas são todas ligadas na mesma orientação, por exemplo, do topo para cauda ou vice-versa, a célula não pode distinguir unidades individuais. Conseqüentemente, o processo redutivo pode ocorrer em toda a seqüência. Ao contrário, quando, por exemplo, as unidades estão presentes do topo para o topo, exceto do topo para a cauda, a inversão delineia os pontos finais da unidade adjacente a fim de que a formação de anulação favoreça a perda de unidades discretas. Desse modo, é preferível com o presente método que as seqüências estejam na mesma orientação. A orienta51/151 ção aleatória de seqüências quase-repetidas resultará na perda da eficiência do reagrupamento, ao mesmo tempo em que a orientação consistente das seqüências oferecerá a eficiência superior. Entretanto, ao mesmo tempo em que tendo a minoria das seqüências contíguas na mesma orientação diminui a eficiência, ela pode ainda fornecer elasticidade suficiente para a recuperação eficaz de novas moléculas. Os constructos podem ser feitos com as seqüências quase-repetidas na mesma orientação para permitir eficiência superior.

[00147] As seqüências podem ser montadas em uma orientação do topo para cauda empregando qualquer dos diversos métodos, incluindo os seguintes:

[00148] (a) Iniciadores que incluem um topo poli-A e cauda poli-T que quando fazem filamento único poderiam fornecer a orientação, podem ser utilizados. Isto é concluído tendo-se a primeira base pequena do iniciador feito de RNA e por esta razão facilmente removeu RNAseH.

[00149] (b) Iniciadores que incluem sítios de clivagem de restrição única, podem ser utilizados. Sítios múltiplos, uma bateria de seqüências únicas, e síntese repetida e etapas de ligação seriam requeridos. [00150] (c) A base pequena interna do iniciador poderia ser tiolada e uma exonuclease empregada para produzir moléculas apropriadamente com cauda.

[00151] A recuperação das seqüências reagrupadas conta com a identificação de vetores de clonagem com um índice repetitivo reduzido (RI). As seqüências de codificação reagrupadas podem então ser recuperadas por amplificação. Os produtos são novamente clonados e expressados. A recuperação dos vetores de clonagem com RI reduzido pode ser afetada:

[00152] 1) Pelo uso de vetores somente estavelmente mantidos quando o constructo é reduzido na complexidade.

52/151 [00153] 2) Pela recuperação física dos vetores encurtados por procedimentos físicos. Neste caso, o vetor de clonagem seria recuperado empregando procedimentos de isolação de plasmídeo padrão e tamanho fracionado ou em um gel de agarose, ou coluna com um corte de peso molecular baixo utilizando procedimentos padrão.

[00154] 3) Pela recuperação dos vetores contendo genes interrompidos que podem ser selecionados quando o tamanho da inserção diminui.

[00155] 4) Pelo uso de técnicas de seleção direta com um vetor de expressão e a seleção apropriada.

[00156] As seqüências de codificação (por exemplo, genes) de organismos relacionados podem demonstrar um grau elevado de homologia e codificam completamente diversos produtos de proteína. Esses tipos de seqüências são particularmente úteis na presente invenção como quase-repetições. Entretanto, ao mesmo tempo em que os exemplos ilustrados abaixo demonstram o reagrupamento das seqüências de codificação original quase idênticas (quase-repetições), este processo não é limitado a tais repetições quase idênticas.

[00157] Os seguintes exemplos demonstram um método da invenção. As seqüências de ácido nucléico de codificação (quaserepetições), derivadas de três (3) espécies únicas são descritas. Cada seqüência codifica uma proteína com um grupo distinto de propriedades. Cada das seqüências difere por um único ou poucos pares de base em uma única posição na seqüência. As seqüências quaserepetidas são separadamente ou coletivamente amplificadas e ligadas em agrupamentos aleatórios tal que todas possíveis permutações e combinações sejam disponíveis na população de moléculas ligadas. A quantidade de unidades quase-repetidas pode ser controlada pelas condições de montagem. A quantidade medida de unidades quaserepetidas em um constructo é definida como o índice repetitivo (RI).

53/151 [00158] Uma vez formados, os constructos podem, ou não podem ser fracionados por tamanho em um gel de agarose de acordo com os protocolos publicados, inseridos em um vetor de clonagem, e transfectados em uma célula hospedeira apropriada. As células são então propagadas e o reagrupamento redutivo é efetuado. A taxa do processo de reagrupamento redutivo pode ser estimulada pela introdução de detrimentos de DNA se desejado. A redução no RI é mediada pela formação de anulação entre as seqüências repetidas por um mecanismo intramolecular, ou mediada por eventos tipo recombinação através de mecanismos intermoleculares é imaterial. O resultado final é o reagrupamento das moléculas em todas combinações possíveis. [00159] Opcionalmente, o método compreende a etapa adicional de avaliar os membros da biblioteca do grupo misturado para identificar os membros da biblioteca misturados individuais tendo a capacidade de se aglutinar ou de outro modo interagir, ou catalisar uma reação particular (por exemplo, tal como domínio catalítico de uma enzima) com uma macromolécula predeterminada, tal como por exemplo um receptor de proteináceo, um oligossacarídeo, viron, ou outra estrutura ou composto predeterminado.

[00160] Os polipeptídeos que são identificados de tais bibliotecas podem ser empregados para propósitos terapêuticos, diagnóstico, pesquisas e propósitos relacionados (por exemplo, catalisadores, solutos para aumentar a osmolaridade de uma solução aquosa, e outros), e/ou podem ser submetidos a um ou mais ciclos de adição de mistura e/ou seleção.

[00161] Em outro aspecto, é considerado que antes ou durante a recombinação ou reagrupamento, os polinucleotídeos gerados pelo método da invenção podem ser submetidos a agentes ou processos que promovem a introdução de mutações nos polinucleotídeos originais. A introdução de tais mutações aumentaria a diversidade dos po54/151 lipeptídeos e polinucleotídeos híbridos resultantes codificados a partir daqui. Os agentes ou processos que promovem mutagênese podem incluir, porém não estão limitados a:(+)-CC-1065, ou um análogo sintético tal como (+)-CC-1065-(N3-Adenina (observe Sun e Hurley, (1992); uma adução de 4'-flúor-4-aminobifenila desacetilada ou N-acetilada capaz de inibir a síntese de DNA (observe, por exemplo, van de poll e outros, (1992)); ou uma adução de 4 aminobifenila desacetilada ou Nacetilada capaz de inibir a síntese de DNA (observe também, van de Poll e outros (1992), pp 751-758); cromo trivalente, um sal de cromo trivalente, uma adução de DNA de hidrocarboneto aromático policíclico (PAH) capaz de inibir a replicação de DNA, tal como 7-bromometilbenz[a]antraceno (BMA), tris(2,3-dibromopropil)fosfato (Tris-BP), 1,2-dibromo-3-cloropropano (DBCP), 2-bromoacroleína (2BA), benzo[a]pireno-7,8-diidrodiol-9-10-epóxido (BPDE), um sal de halogênio de platina (II), N-hidróxi-2-amino-3-metilimidazo[4,5-f]-quinolina (Nhidróxi-IQ), e N-hidróxi-2-amino-1-metil-6-fenilimidazo[4,5-f]-piridina (N-hidróxi-PhIP). Os meios especialmente preferidos para reduzir ou parar a amplificação por PCR consiste de luz UV (+)-CC-1065 e (+)CC-1065-(N3-Adenina). Os meios particularmente abrangidos são aduções de DNA ou polinucleotídeos compreendendo as aduções de DNA dos grupos de polinucleotídeos ou polinucleotídeos, que pode ser liberado ou removido por um processo incluindo aquecimento da solução compreendendo os polinucleotídeos antes de outro processamento.

[00162] Em outro aspecto a invenção está direcionada a um método para produzir proteínas recombinantes tendo atividade biológica tratando-se uma amostra compreendendo polinucleotídeos de modelo de filamento duplo codificando uma proteína do tipo selvagem sob condições de acordo com a invenção que provê a subsistência da produção de polinucleotídeos híbridos ou reagrupados.

55/151 [00163] A invenção também provê a subsistência do uso de iniciadores de códon proprietário (contendo uma seqüência N,N,N degenerada) para introduzir pontos de mutações em um polinucleotídeo, a fim de que gere um grupo de polipeptídeos progênies no qual uma faixa total de substituições de aminoácido único é representada em cada posição de aminoácido (mutagênese saturada de sítio de gene (GSSM)). Os oligos empregados são compreendidos contiguamente de uma primeira seqüência homóloga, uma seqüência N, N, N degenerada, e preferivelmente porém não necessariamente uma segunda seqüência homóloga. Os produtos translacionais progênies a jusante do uso de tais oligos incluem todas possíveis alterações de aminoácidos em cada sítio de aminoácido junto ao polipeptídeo, porque a degeneração da seqüência de N,N,N inclui códons para todos 20 aminoácidos.

[00164] Em um aspecto, um tal oligo degenerado (compreendido de um cassete N,N,N degenerado) é empregado para submeter cada códon original em um modelo de polinucleotídeo parental a uma faixa total de substituição de códon. Em outro aspecto, pelo menos dois cassetes N,N,N degenerados são empregados - ou no mesmo oligo ou não- para submeter pelo menos dois códons originais em um modelo de polinucleotídeo parental a uma faixa total de substituições de códons. Desse modo, mais do que uma seqüência N,N,N pode estar contida em um oligo para introduzir mutações de aminoácido em mais do que um sítio. Esta pluralidade de seqüências N,N,N pode ser diretamente contígua, ou separada por uma ou mais seqüências de nucleotídeos adicionais. Em outro aspecto, os oligos úteis para adições e anulações de introdução podem ser empregados ou sozinhos ou em combinação com os códons contendo uma seqüência de N,N,N, para introduzir qualquer combinação ou permutação de adição, anulação e/ou substituição de aminoácido.

56/151 [00165] Em uma exemplificação particular, é possível simultaneamente mutagenizar duas ou mais posições de aminoácido contíguo empregando um oligo que contém o tripleto N,N,N contíguo, isto uma seqüência (N,N,N)n degenerada.

[00166] Em outro aspecto, a presente invenção provê a subsistência do uso de cassetes degenerados tendo menos degeneração do que a seqüência N,N,N. Por exemplo, pode ser desejável em alguns exemplos empregar (por exemplo, em um oligo) uma seqüência de tripleto degenerada compreendida de somente um N, onde o referido N pode estar na primeira, segunda ou terceira posição do tripleto. Qualquer outra base incluindo qualquer combinação e permutação deste pode ser empregada nas duas posições restantes do tripleto. Alternativamente, pode ser desejável em alguns exemplos empregar (por exemplo, em um oligo) uma seqüência de tripleto N,N,N degenerada, seqüência de tripleto N,N,G/T ou uma seqüência N,N,G/C.

[00167] É apreciado entretanto, que o uso de um tripleto degenerado (tal como seqüência de tripleto N,N,G/T ou N,N,G/C) como divulgado na presente invenção seja vantajoso por várias razões. Em um aspecto, esta invenção fornece um meio para sistematicamente e regularmente facilmente gerar a substituição da faixa total de possíveis aminoácidos (para um total de 20 aminoácidos) em cada e todas as posições de aminoácido em um polipeptídeo. Desse modo, para um polipeptídeo de 100 aminoácidos, a invenção fornece um modo para sistematicamente e regularmente facilmente gerar 2000 espécies distintas (isto é, 20 possíveis aminoácidos por vezes de posições de posições de 100 aminoácidos). É apreciado que seja fornecido, através do uso de um oligo contendo uma seqüência de tripleto de N,N,G/T ou N,N,G/C degenerada, 32 seqüências individuais que codificam para 20 possíveis aminoácidos. Desse modo, em um recipiente de reação no qual uma seqüência de polinucleotídeo parental é submetida à muta57/151 gênese por saturação empregando um tal oligo, existem 32 polinucleotídeos progênies distintos gerados codificando 20 polipeptídeos distintos. Ao contrário, o uso de um oligo não-degenerado na mutagênese direcionada ao sítio induz a somente um produto de polipeptídeo progênie por recipiente de reação.

[00168] Esta invenção também provê a subsistência do uso de oligos não-degenerados, que podem opcionalmente ser empregados em combinação com os iniciadores degenerados divulgados. É apreciado que em algumas situações, seja vantajoso empregar oligos nãodegenerados para gerar mutações de ponto específico em um polinucleotídeo de trabalho. Isto fornece um meio para gerar mutações de ponto notável específico, mutações de ponto induzindo a alterações de aminoácido correspondentes, e mutações de ponto que causam a geração de códons de interrupção e a expressão correspondente de fragmentos de polipeptídeo.

[00169] Desse modo, em uma modalidade preferida desta invenção, cada recipiente de reação de mutagênese por saturação contém polinucleotídeos codificando 20 moléculas de polipeptídeo progênies tal que todos os 20 aminoácidos sejam representados na posição de um aminoácido específico correspondendo à posição do códon mutagenizado no polinucleotídeo parental. Os polipeptídeos progênies degenerados de 32 dobras gerados de cada recipiente de reação de mutagênese por saturação podem ser submetidos à amplificação clonal (por exemplo, clonado em um hospedeiro E. coli adequado empregando um vetor de expressão) e submetido à avaliação da expressão. Quando um polipeptídeo de progênie individual é identificado por avaliação quanto à exposição de uma alteração favorável na propriedade (quando comparado com o polipeptídeo parental), ele pode ser seqüenciado para identificar a substituição de aminoácido correspondentemente favorável contida aqui.

58/151 [00170] É apreciado que sob mutagenização de cada e de todas as posições de aminoácido em um polipeptídeo parental empregando mutagênese por saturação como divulgado aqui, alterações de aminoácido favoráveis possam ser identificadas em mais do que uma posição de aminoácido. Uma ou mais novas moléculas progênies pode ser gerada a qual contenha uma combinação de todas ou parte dessas substituições de aminoácido favoráveis. Por exemplo, se 2 alterações de aminoácido favoráveis específicas são identificadas em cada das 3 posições de aminoácido em um polipeptídeo, as permutações incluem 3 possibilidades em cada posição (nenhuma alteração do aminoácido original, e cada de duas alterações favoráveis) e 3 posições. Desse modo, existem 3 x 3 x 3 ou 27 possibilidades totais, incluindo 7 que foram previamente examinadas- 6 mutações de ponto único (isto é, 2 em cada das três posições) e nenhuma alteração em qualquer posição.

[00171] Em ainda outro aspecto, a mutagênese por saturação de sítio pode ser empregada junto com mistura, quimerização, recombinação e outros processos de mutagenização, junto com a avaliação. Esta invenção provê a subsistência do uso de qualquer processo de mutagênese, incluindo mutagênese por saturação, de uma maneira iterativa. Em uma exemplificação, o uso interativo de qualquer processo de mutagenização é empregado em combinação com a avaliação. [00172] Desse modo em uma exemplificação não-limitante, esta invenção provê a subsistência do uso da mutagênese por saturação em combinação com processos de mutagenização adicionais, tal como processo onde dois ou mais polinucleotídeos relacionados são introduzidos em uma célula hospedeira adequada tal que um polinucleotídeo híbrido seja gerado por recombinação e reagrupamento redutivo. [00173] Além de realizar a mutagênese junto com a seqüência inteira de um gene, a presente invenção fornece mutagênese que pode ser

59/151 empregada para substituir cada de qualquer quantidade de bases em uma seqüência de polinucleotídeo, onde a quantidade de bases a ser mutagenizada é preferivelmente todos os números inteiros de 15 a 100.000. Desse modo, ao invés de todas as posições de mutagênese junto com uma molécula, uma pode submeter todos ou vários números discretos de bases (preferivelmente uma subsérie totalizando de 15 a 100.000) para mutagênese. Preferivelmente, um nucleotídeo separado é empregado para mutagenização de cada posição ou grupo de posições junto com uma seqüência de polinucleotídeo. Um grupo de 3 posições para ser mutagenizado pode ser um códon. As mutações são preferivelmente introduzidas empregando um iniciador mutagênico, contendo um cassete heterólogo, também refere-se como um cassete mutagênico. Os cassetes preferidos podem ter de 1 a 500 bases. Cada posição de nucleotídeo em tais cassetes heterólogos, serão N, A, C, G, T, A/C, A/G, A/T, C/G, C/T, G/T, C/G/T, A/G/T, A/C/T, A/C/G, OU E, onde E é qualquer base que não seja A, C, G, ou T (E pode ser referida como um projeto de oligo).

[00174] Em um sentido geral, a mutagênese de saturação é compreendida da mutagenização de uma série completa de cassetes mutagênicos (onde cada cassete é preferivelmente cerca de 1-500 bases em extensão) em seqüência de polinucleotídeo definida ser mutagenizado (onde a seqüência para ser mutagenizado é preferivelmente de cerca de 15 a 100.000 bases em extensão). Desse modo, um grupo de mutações (variando de 1 a 100 mutações) é introduzido em cada cassete para ser mutagenizado. Um agrupamento de mutações para serem introduzidas em um cassete pode ser diferente ou o mesmo de um segundo agrupamento de mutações para serem introduzidas em um segundo cassete durante a aplicação de um ciclo de mutagênese de saturação. Tais agrupamentos são exemplificados serem anulações, adições, agrupamentos de códons particulares, e agrupamentos

60/151 de cassetes de nucleotídeos particulares.

[00175] As seqüências definidas para serem mutagenizadas incluem um gene inteiro, passagem, cDNA, uma estrutura de leitura aberta inteira (ORF), e promotor inteiro, realçadores, repressores/transativadores, origem de replicação, íntron, operador, ou qualquer grupo funcional de polinucleotídeo. Geralmente, uma seqüência definida para este propósito pode ser qualquer polinucleotídeo que uma seqüência de polinucleotídeo de 15 bases, e seqüências de polinucleotídeos de extensão entre 15 bases e 15.0000 bases (esta invenção especificadamente nomeia todos os números inteiros envolvidos). As considerações em agrupamentos escolhidos de códons incluem tipos de aminoácidos codificados por um cassete mutagênico degenerado.

[00176] Em uma exemplificação particularmente preferida um agrupamento de mutações que podem ser introduzidas em um cassete mutagênico, esta invenção especificamente fornece durante substituições de códons degenerados (empregando oligos degenerados) que codificam para 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, e 20 aminoácidos em cada posição, e uma biblioteca de polipeptídeos codifica desse modo.

[00177] Um aspecto da invenção é um ácido nucléico isolado compreendendo uma das seqüências das seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, as seqüências complementares a estas, ou um fragmento compreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50 ,75, 100, 150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências de uma seqüência de ácido nucléico de Grupo A (ou as seqüências complementares a estas). Os ácidos nucléicos isolados, podem compreender DNA, incluindo cDNA, DNA genômico, e DNA sintético. O DNA pode ser de duplo filamento ou único filamento, e se o filamento é único pode ser codifi61/151 cado o filamento ou não codificado o filamento (anti-sentido). Alternativamente, os ácidos nucléicos isolados podem compreender RNA. [00178] Como discutido em mais detalhes abaixo, os ácidos nucléicos isolados de uma seqüência de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas estas, podem ser empregados para preparar um dos polipeptídeos de uma seqüência de aminoácidos do grupo B, e as seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos de um dos polipeptideos de seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas.

[00179] Conseqüentemente, outro aspecto da invenção é um ácido nucléico isolado que codifica uma das seqüências de aminoácidos do Grupo B de polipeptídeos, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos de um dos polipeptídeos das seqüências de aminoácidos do Grupo B. As seqüências codificadas desses ácidos nucléicos podem ser idênticas para uma das seqüências codificadas de um dos ácidos nucléicos das seqüências de ácidos nucléicos do Grupo A, ou um fragmento destas ou podem ser seqüências codificadas diferentes que codificam um dos polipeptídeos das seqüências de aminoácidos do Grupo B, seqüências substancialmente idênticas a estas, e fragmentos tendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100 ou 150 aminoácidos consecutivos de um dos polipeptídeos das seqüências de aminoácidos de Grupo B, como um resultado da redundância ou degeneração do código genético. O código genético será conhecido por alguém versado na técnica e pode ser obtido, por exemplo, na página 214 de B. Lewin, Genes VI, Oxford University Press, 1997, a divulgação da qual está incorporada aqui por referência.

62/151 [00180] O ácido nucléico isolado que codifica um dos polipeptídeos das seqüências de aminoácidos do grupo B, e seqüências substancialmente idênticas a estas, pode incluir, porém não está limitado a: somente a seqüência codificada de uma das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, e seqüências de codificação adicional, tal como seqüências indutoras ou seqüências de pró-proteínas e seqüências não-codificadas, tal como íntrons ou seqüências não-codificadas 5' e/ou 3' das seqüências codificadas. Desse modo, como empregado aqui, o termo polinucleotídeo codificando um polipeptídeo abrangem um polinucleotídeo que inclui somente a seqüência codificada para o polipeptídeo bem como um polinucleotídeo que inclui seqüência não-codificada e/ou codificada adicional.

[00181] Alternativamente, as seqüências de ácidos nucléicos das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, podem ser mutagenizadas empregando técnicas convencionais, tal como mutagênese de sítio direcionado, ou outras técnicas familiares para aqueles versados na técnica, para introduzir alterações silenciosas nos polinucleotídeos de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas. Como empregado aqui alterações silenciosas incluem, por exemplo, alterações que não alteram a seqüência de aminoácido codificada pelo polinucleotídeo. Tais alterações podem ser desejáveis a fim de aumentar o nível do polipeptídeo produzido pelas células hospedeiras contendo um vetor codificando o polipeptídeo introduzindo-se os códons ou pares de códons que ocorre freqüentemente em organismos hospedeiros.

[00182] A invenção também refere-se a polinucleotídeos que têm alterações de nucleotídeos que resultam em substituições de aminoácidos, adições, anulações, fusões e truncações nos polipeptídeos das

63/151 seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas. Tais alterações de nucleotídeo podem ser introduzidas empregando técnicas tal como mutagênese de sítio direcionado, mutagênese química aleatória, anulação de exonuclease III, e outras técnicas de DNA recombinante. Alternativamente, tais alterações de nucleotídeo podem ser variantes alélicos ocorrendo naturalmente que são isoladas identificando-se os ácidos nucléicos que especificadamente hidridizam as sondas compreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas das seqüências de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas (ou as seqüências complementares a estas) sob condições de altamente precisas, moderadas ou baixas como fornecidas aqui.

[00183] Os ácidos nucléicos isolados das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, as seqüências complementares a estas, ou fragmentos compreendendo pelo menos 10 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências complementares a estas podem também ser empregados como sondas para determinar quer uma amostra biológica, tal como uma amostra de solo, contém um organismo tendo uma seqüência de ácido nucléico da invenção ou um organismo dos quais o ácido nucléico foi obtido. Em tais procedimentos, uma amostra biológica potencialmente abrigando o organismo dos quais o ácido nucléico foi isolado é obtida e ácidos nucléicos são obtidos da amostra. Os ácidos nucléicos são contatados com as sondas sob condições que permitam a sonda hibridizar especificamente qualquer seqüência complementar das quais estão presentes aqui.

[00184] Onde necessário, condições que permitem a sonda hibridi64/151 zar especificadamente às seqüências complementares podem ser determinadas colocando-se a sonda em contato com as seqüências complementares das amostras conhecidas para conter a seqüência complementar bem como seqüências de controle que não podem conter a seqüência complementar. As condições de hibridização, tal como a concentração de sal do tampão de hibridização, a concentração de formamida do tampão de hibridização, ou a temperatura de hibridização, podem ser variadas para identificar as condições que permitem a sonda hibridizar especificadamente aos ácidos nucléicos complementares.

[00185] Se a amostra contém o organismo dos quais o ácido nucléico foi isolado, a hibridização específica da sonda é então detectada. A hibridização pode ser detectada rotulando-se a sonda com um agente detectável tal como um isótopo radioativo, um corante fluorescente ou uma enzima capaz de catalisar a formação de um produto detectável.

[00186] Muitos métodos para uso de sondas rotuladas para detectar a presença de ácidos nucléicos suplementares em uma amostra são familiares àqueles versados na técnica. Esses incluem Southern Blots Northern Blots, procedimentos de hibridização de colônia, e pontos de manchas. Os protocolos para cada desses procedimentos são fornecidos em Ausubel e outros. Protocolos correntes em Molecular Biology, John Wiley 503 Sons, Inc. (1997) e Sambrook e outros, Molecular Cloning: A Laboratory manual 2^a edição, Cold Spring Harbor Laboratory Press (1989), as divulgações completas das quais estão incorporadas aqui por referência.

[00187] Alternativamente, mais do que uma sonda (pelo menos uma das quais é capaz de especificadamente hidridizar quaisquer seqüências complementares que estão presentes na amostra de ácido nucléico), pode ser empregada em uma reação de amplificação para

65/151 determinar se a amostra contém um organismo contendo uma seqüência de ácido nucléico da invenção (por exemplo, um organismo dos quais o ácido nucléico foi isolado). Tipicamente, as sondas compreendem oligonucleotídeos. Em uma modalidade, a reação de amplificação pode compreender uma reação por PCR. Os protocolos PCR são descritos em Ausubel e Sambrook, supra. Alternativamente, a amplificação pode compreender uma reação de cadeia de ligase, 3SR, ou reação de deslocamento de filamento. (Observe Barany, F., The Ligase Chain Reaction in a PCR World, PCR Methods and Applications 1:5-16,1991; E. Fahy e outros, Self-sustained Sequence Replication (3SR): An Isothermal Transcription-based Amplification System Alternative to PCR, PCR Methods and Applications 1:25-33, 1991; and Walker G.T. et al., Strand Displacement Amplification-an Isothermal in vitro DNA Amplification Technique, Nucleic Acid Research 20:16911696, 1992, as divulgações das quais estão incorporadas aqui por referência em sua totalidade). Em tais procedimentos, os ácidos nucléicos na amostra são contatados com as sondas, a reação de amplificação é realizada, e qualquer produto de amplificação resultante é detectado. O produto de amplificação pode ser detectado realizando-se eletroforese de gel nos produtos de reação e manchando o gel com um interlocutor tal como brometo de etídio. Alternativamente, uma ou mais das sondas podem ser rotuladas com um isótopo radioativo e a presença de um,produto de amplificação radioativo pode ser detectada por auto-radiografia após eletroforese em gel.

[00188] As sondas derivadas das seqüências próximas das extremidades das seqüências de seqüências de ácidos nucléicos do grupo A, e seqüências substancialmente idênticas a estas, podem também ser empregadas em procedimentos de comportamento do cromossomo para identificar clones contendo seqüência genômica localizada adjacente às seqüências das seqüências de ácidos nucléicos do Gru66/151 po A, e seqüências substancialmente idênticas a estas. Tais métodos permitem o isolamento de genes que codificam proteínas adicionais do organismo hospedeiro.

[00189] Os ácidos nucléicos isolados de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, as seqüências complementares a estas, ou um fragmento compreendendo pelo menos 10 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas de uma das seqüências de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências complementares a estas podem ser empregados como sondas para identificar e isolar ácidos nucléicos relacionados. Em algumas modalidades, os ácidos nucléicos relacionados, podem ser cDNAs ou DNAs genômicos dos organismos a não ser que um dos quais dos ácidos nucléicos estivesse isolado. Por exemplo, os outros organismos podem ser organismos relacionados. Em tais procedimentos, uma amostra de ácido nucléico é contatada com uma sonda sob condições que permitem a sonda hibridizar especificadamente às seqüências relacionadas. A hibridização da sonda aos ácidos nucléicos do organismo relacionado é então detectada empregando qualquer dos métodos descritos acima.

[00190] Em reações de hibridização de ácido nucléico, as condições empregadas para alcançar um nível particular de precisão variarão, dependendo da natureza dos ácidos nucléicos sendo hibridizados. Por exemplo, a extensão, grau de complementaridade, composição de seqüência de nucleotídeo (por exemplo, GC v. conteúdo AT), e tipo de ácido nucléico (por exemplo, RNA v. DNA) das regiões de hibridização dos ácidos nucléicos podem ser consideradas em condições de hibridização selecionadas. Uma consideração adicional é se um dos ácidos nucléicos é imobilizado, por exemplo, em um filtro.

[00191] A hibridização pode ser realizada sob condições precisas

67/151 baixas, precisas moderadas ou altamente precisas. Como um exemplo de hibridização de ácido nucléico, uma membrana de polímero contendo ácidos nucléicos desnaturados imobilizados é primeiro préhibridizada durante 30 minutos em 45°C em uma solução consistindo de 0,9 M de NaCl, 50mM de NaH₂PO₄, pH 7,0; 5,0 mM de Na2EDTA, 0,5% de SDS, 10x Denhardt's, e 0,5 mg/ml de ácido polirriboadenílico. Aproximadamente 2 x 107 cpm (atividade específica 4-9 x 108 cpm/qg) de ³²P de sonda de oligonucleotídeo de extremidade rotulada são então adicionados à solução. Após 12-16 horas de incubação, a membrana é lavada durante 30 minutos em temperatura ambiente em 1 x SET (150mM de NaCl, 20mM de Tris cloridrato, pH 7,8, 1mM de Na2EDTA) contendo 0,5% de SDS, seguido por uma lavagem de 30 minutos em 1x SET fresco em Tm-10°C para a sonda de oligonucleotídeo. A membrana é então exposta para película auto-radiográfica para detecção de sinais de hibridização.

[00192] Variando-se a precisão das condições de hibridização empregadas para identificar ácidos nucléicos, tal como cDNAs ou DNAs genômicos, que hibridizam a sonda detectável, ácidos nucléicos tendo níveis diferentes de homologia a sonda podem ser identificados e isolados. A precisão pode ser variada conduzindo-se a hibridização em temperaturas variadas abaixo das temperaturas de fundição das sondas. A temperatura de fundição, Tm, é a temperatura sob resistência iônica definida e pH) na qual 50% das seqüências alvo hibridizam para uma sonda perfeitamente complementar. As condições altamente precisas são selecionadas para serem iguais ou cerca de 5°C abaixo do que Tm durante uma sonda particular. A temperatura de fundição da sonda pode ser calculada empregando as seguintes fórmulas:

[00193] Para as sondas entre 14 e 70 nucleotídeos em extensão a temperatura de fundição (Tm) é calculada empregando a fórmula: Tm= 81,5+16,6(log[Na+J)+0,41 (fração G+C)-(600/N) onde N é a extensão

68/151 da sonda.

[00194] Se a hibridização é realizada em uma solução contendo formamida, a temperatura de fundição pode ser calculada empregando a equação: Tm=81,5 +16,6(log[Na+])+0,41(fração G+C)-(0,63% de formamida)-(600/N) onde N é a extensão da sonda.

[00195] A pré-hibridização pode ser realizada em 6x SSC, 5X reagente de Denhardt, 0,5% de SDS, 100 pg de DNA de esperma de salmão fragmentado desnaturado ou 6X SSC, 5x reagente de Denhardt, 0,5% de SDS. 100 pg de DNA de esperma de salmão fragmentado desnaturado, 50% de formamida. As fórmulas para SSC e soluções de Denhardt estão listadas em Sambrook e outros, supra.

[00196] A hibridização é conduzida adicionado-se a sonda detectável a soluções de pré-hibridização listadas acima. Onde a sonda compreende DNA de filamento duplo, é desnaturada antes da adição da solução de hibridização. O filtro é contatado com a solução de hibridização durante um período suficiente de tempo para permitir a sonda hibridizar os cDNas ou DNAs genômicos contendo seqüências complementares a isto ou homólogos destes. Para sondas sobre 200 nucleotídeos em extensão, a hibridização pode ser realizada em 15-25°C abaixo da Tm. Para sondas curtas, tal como sondas de oligonucleotídeos, a hibridização pode ser conduzida em 5-10°c a baixo de Tm. Tipicamente, para hibridizações em 6X SSC, a hibridização é conduzida em aproximadamente 68°C. Freqüentemente, durante hi bridizações em 50% de formamida contendo soluções, a hibridização é conduzida em aproximadamente 42°C.

[00197] Todas as hibridizações precedentes serão consideradas serem sob condições altamente precisas.

[00198] Seguinte a hibridização, o filtro é lavado para remover qualquer sonda detectável de ligação não-específica. A precisão empregada para lavar os filtros pode também ser variada dependendo da natu69/151 reza dos ácidos nucléicos sendo hibridizados, a extensão dos ácidos nucléicos sendo hibridizados, o grau de complementaridade, a composição de seqüência do nucleotídeo (por exemplo, GC v. conteúdo AT), e o tipo de ácido nucléico (por exemplo, RNA v. DNA). Os exemplos das condições de lavagem precisas progressivamente altamente elevadas são como segue: 2xSSC, 0,1% de SDS em temperatura ambiente durante 15 minutos (precisão baixa); 0,1X SSC, 0,5% de SDS em temperatura ambiente durante 30 minutos a 1 hora (precisão moderada); 0,1 x SSC, 0,5% de SDS durante 15 a 30 minutos entre a temperatura de hibridização e 68°C (precisão elevada); e 0,15M de NaCl durante 15 minutos em 72°C (precisão muito elevada). Uma lavagem de precisão baixa final pode ser conduzida em 0,1X SSC em temperatura ambiente. Os exemplos acima são meramente ilustrativos de uma série de condições que podem ser empregadas para filtros de lavagens. Alguém versado na técnica conhecerá que existem numerosas receitas durante lavagem precisas diferentes. Alguns outros exemplos são determinados abaixo.

[00199] Os ácidos nucléicos que tenham hibridizado a sonda são identificados por auto-radiografia ou outras técnicas convencionais. [00200] O procedimento acima pode ser modificado para identificar ácidos nucléicos tendo níveis de redução de homologia à seqüência da sonda. Por exemplo, para obter ácidos nucléicos de homologia reduzida à sonda detectável, condições menos precisas podem sere empregadas. Por exemplo, a temperatura de hibridização pode ser reduzida em incrementos de 5°C de 68°C a 42°C em um t ampão de hibridização tendo uma concentração de Na+ de aproximadamente 1M. Seguinte a hibridização, o filtro pode ser lavado com 2x SSC, 0,5% de SDS na temperatura de hibridização. Essas condições são consideradas serem condições moderadas acima de 50°C e condições baixas abaixo de 50°C. Um exemplo específico de condi ções de hibridi70/151 zação moderadas é quando a hibridização acima é conduzida em 55°C. Um exemplo específico de condições de hibridi zação de precisão baixa é quando a hibridização acima é conduzida em 45°C.

[00201] Alternativamente, a hibridização pode ser realizada em tampões, tal como 6xSSC, contendo formamida em uma temperatura de 42°C. Neste caso, a concentração da formamida no tampão de hibridização pode ser reduzida em 5% de incrementos de 50% a 0% para identificar clones tendo níveis de redução de homologia à sonda. Seguinte a hibridização, o filtro pode ser lavado com 6X SSC, 0,5% de SDS em 50°C. Essas condições são consideradas serem condições moderadas acima de 25% de formamida e condições baixas abaixo de 25% de formamida. Um exemplo específico de condições de hibridização moderadas é quando a hibridização acima é conduzida em 30% de formamida. Um exemplo especifico de condições de hibridização de precisão baixa é quando a hibridização acima é conduzida em 10% de formamida.

[00202] Por exemplo, os métodos precedentes podem ser empregados para ácidos nucléicos isolados tendo uma seqüência com pelo menos cerca de 97%, pelo menos 95%, pelo menos 90%, pelo menos 85%, pelo menos 80%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelo menos 55%, ou pelo menos 50% de homologia para uma seqüência de ácido nucléico selecionado a partir do grupo consistindo em uma das seqüências de seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos cerca de 10,15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400, ou 500 bases consecutivas destes, e a seqüências complementares destas. A homologia pode ser medida empregando o algoritmo de alinhamento. Por exemplo, os polinucleotídeos homólogos podem ter uma seqüência de codificação que é uma variante alélica de ocorrência natural de uma das seqüên71/151 cias de codificação descritas aqui. Tais variantes alélicas podem ter uma substituição, anulação ou adição de um ou mais nucleotídeos quando comparadas aos ácidos nucléicos das seqüências de ácidos nucléicos do Grupo A ou as seqüências complementares a estas. [00203] Adicionalmente, os procedimentos acima podem ser empregados para ácidos nucléicos isolados que codificam polipeptídeos tendo pelo menos cerca de 99%, 95%, pelo menos 90%, pelo menos 80%, pelo menos 80%, pelo menos 75%, pelo menos 70%, pelo menos 65%, pelo menos 60%, pelo menos 55%, ou pelo menos 50% de homologia para um polipeptídeo tendo a seqüência de uma das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35 ,40, 50, 75, 100, ou 150 aminoácidos consecutivos destes como determinado empregando um algoritmo de allinhamento de seqüência (por exemplo, tal como o algoritmo 3,0t78 da versão FASTA com os parâmetros característicos).

[00204] Outro aspecto da invenção é um polipeptídeo purificado ou isolado compreendendo a seqüência de uma das seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. Uma discussão acima, tais polipeptídeos podem ser obtidos por inserção de um ácido nucléico codificando o polipeptídeo em um vetor tal que a seqüência de codificação é operavelmente ligada a uma seqüência capaz de conduzir a expressão do polipeptídeo codificado em uma célula hospedeira adequada. Por exemplo, o vetor de expressão pode compreender um promotor, um sítio de aglutinação de ribossomo para iniciação da translação e um terminador de transcrição. O vetor pode também incluir seqüências apropriadas durante expressão de amplificação.

72/151 [00205] Os promotores adequados para expressar o polipeptídeo ou fragmentos destes em bactéria incluem os promotores E. coli lac ou trp, o promotor lacI, o promotor lacZ, o promotor 73, o promotor 77, o promotor gpt, o promotor lambda P_R, o promotor lambda P_L, promotores de óperons codificando enzimas glicolíticas tal como cinase de 3fosfoglicerato (PGK), e o promotor de fosfatase ácida. Os promotores de fungos incluem promotor de fator V. Os promotores eucarióticos incluem o promotor de CMV imediato precoce, promotor de cinase de timidina HSV, promotores de choque térmico, o promotor SV40 tardio e próximo, retrovírus de LTRs, e promotor de metalotioneina-I de camundongo. Outros promotores conhecidos para expressão de controle de genes em células procarióticas ou eucarióticas ou seus vírus podem também ser empregados.

[00206] Os vetores de expressão de mamíferos podem também compreender uma origem de replicação, qualquer sítio de aglutinação de ribossomo necessário, um sítio de poliadenilação, doador de emenda e sítio aceptor, seqüências de terminação transcricional, e seqüências não transcritas de flanqueação 5'. Em algumas modalidades, as seqüências de DNA derivadas de emendas SV40 e sítios de poliadenilação podem ser empregados para fornecer os elementos genéticos não transcritos requeridos.

[00207] Os vetores para expressão de polipeptídeo ou fragmentos destes em células eucarióticas podem também conter realçadores para aumentar os níveis de expressão. Os realçadores são elementos atuandtes-cis de DNA, freqüentemente de cerca de 10 a cerca de 300 bp em extensão que atua em um promotor para aumentar sua transcrição. Os exemplos incluem o realçador SV40 no último lado da origem de replicação bp 100 a 270, o realçador do promotor citomegalovírus próximo, o realçador de polioma no último lado da origem de replicação, e os realçadores de adenovírus.

73/151 [00208] Além disso, os vetores de expressão tipicamente contêm um ou mais genes de marcadores selecionados para permitir seleção de células hospedeiras contendo o vetor. Tais marcadores selecionados incluem genes codificando dihidrofolato reductase ou resistência da neomicina à conferência de genes para cultura de células eucarióticas, tetraciclina de conferencia de genes ou resistência à ampicilina em E. coli , e o gene TRP1 S. cerevisiae.

[00209] Em algumas modalidades, o ácido nucléico codifica um dos polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes são agrupados na fase apropriada com uma seqüência líder capaz de secreção direta do polipeptídeo translado ou fragmento destes. Opcionalmente, o ácido nucléico pode codificar um polipeptídeo de fusão em que um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes é fundido a peptídeos heterológos ou polipeptídeos, tal como peptídeos de identificação N-terminal que confere características desejadas, tal como estabilidade aumentada ou purificação simplificada.

[00210] A seqüência de DNA apropriada pode ser inserida no vetor por uma variedade de procedimentos. Em geral, a seqüência de DNA está ligada à posição desejada no vetor seguindo digestão do inserto e o vetor com endonucleases de restrição apropriadas. Alternativamente, as extremidades cegas em tanto no inserto como no vetor podem ser ligadas. Uma variedade de técnicas de clonagem são divulgadas em Ausubel e outros, Current Protocols in Molecular Biology, John Wiley 503 Sons, Inc. 1997 e Sambrook e outros, Molecular Cloning: A

74/151

Laboratory Manual segunda edição Ed., Cold Spring harbor Laboratory Press (1989), as divulgações completas das quais estão incorporadas aqui por referência. Tais procedimentos e outros são julgados estarem no escopo da invenção por aqueles versados na técnica.

[00211] O vetor pode ser, por exemplo, na forma de um plasmídeo, uma partícula viral, ou um fago. Outros vetores incluem seqüências cromossômica, não cromossômica e DNA sintético, derivados de SV40; plasmídeos bactericidas, DNA fago, baculovírus, plasmídeos de levedura, vetores derivados de combinações de plasmídeos e DNA fago, DNA viral, tal como vacina, adenovírus, vírus de pústula de ave, e pseudohidrofobia. Uma variedade de vetores de expressão e clonagem para uso com hospedeiros eucarióticos e procarióticos são descritos por Sambrook, e outros, Molecular Cloning: A Laboratory Manual, segunda edição, Cold Spring Harbor, N. Y.; (1989), a divulgação das quais é aqui incorporada por referência.

[00212] Os vetores de bactérias particulares que podem também ser empregados incluem os plamídeos comercialmente disponíveis compreendendo elementos genéticos das cavidades de vetores de clonagem conhecidos pBR322 (ATCC 37017), pKK223-3 (Pharmacia Fine Chemicals, Uppsala, Sweden), GEM1 (Promega Biotec, Madison, WI, USA) pQE70, pQE60, pQE-9 (Quiagen), pD10, psiX174 pBluescript II KS, pNH8A, pNH16a, pNH18A, pNH46A (Stratagene), ptrc99a, pKK223-3, pKK233-3, pDR540, pRIT5 (Pharmacia), pKK232-8 e pCM7. Os vetores eucarióticos particulares incluem pSV2CAT, pOG44, pXT1, pSG (Stratagene) pSVK3, pBPV, pMSG, e pSVL (Pharmacia). Entretanto, qualquer outro vetor pode ser empregado enquanto é reproduzível e viável na célula hospedeira.

[00213] A célula hospedeira pode ser qualquer das células hospedeiras familiares para aqueles versados na técnica, incluindo células procarióticas, células eucarióticas, células de mamíferos, células de

75/151 insetos, ou células de plantas. Como exemplos representativos de hospedeiros apropriados, podem ser mencionados: células bactericidas, tal como E. coli, Streptomyces, Bacillus subtilis, Salmonella typhimurium e várias espécies com Pseudomonas genera, Streptomyces, e Staphylococcus, células fúngicas, tal como levedura, células de insetos tal como Drosophila S2 e Spodoptera Sf9, células de animais tal como CHO, COS ou melanoma de intestinos, e adenovírus. A seleção de um hospedeiro apropriado está dentro da capacidade daqueles versados na técnica.

[00214] O vetor pode ser introduzido nas células hospedeiras empregando qualquer uma das variedades de técnicas, incluindo transformação, transfecção, transdução, infecção viral, pistolas de gene, ou transferência de gene mediada por Ti. Os métodos particulares incluem transfecção de fosfato de cálcio, transfecção mediada por Dextrano-DEAE, lipofecção ou eletroporação (Davis, L., Dibner. M., Battey, I., Basic Methods in Molecular Biology, 1986)).

[00215] Onde apropriado, as células hospedeiras engenheiradas podem ser cultivadas em veículo de nutriente convencional modificado como apropriado para promotores de ativação, transformantes de seleção ou amplificação de genes da invenção. Seguindo a transformação de uma cepa hospedeira adequada e crescimento das cepas hospedeiras para uma densidade de célula apropriada, o promotor selecionado pode ser induzido por modos apropriados (por exemplo, mudanças de temperatura ou indução química) e as células podem ser cultivadas durante um período adicional para permiti-los produzir o polipeptídeos desejado ou fragmento deste.

[00216] As células são colhidas tipicamente por centrifugação, quebradas por modos químicos ou físicos, e o extrato bruto resultante é retido durante ainda a purificação. As células microbiais empregadas para expressão de proteínas podem ser quebradas por qualquer mé76/151 todo conveniente, incluindo ciclo de congelamento-descongelamento, sonicação, quebra mecânica ou uso de agente de lise de células. Tais métodos são bem-conhecidos por aqueles versados na técnica. O polipeptídeo expressado ou fragmento deste pode ser recuperado e purificado de culturas de células recombinantes por métodos incluindo sulfato de amônio ou precipitação em etanol, extração de ácido, cromatografia de permuta de cátion ou ânion, cromatografía de fosfocelulose, cromatografía de interação hidrofóbica, cromatografia por afinidade, cromatografia por hidroxilapatita, e cromatografia por lecitina. As etapas de redobramento de proteínas podem ser empregadas, quando necessárias, completando-se a configuração do polipeptídeo. Se desejado, a cromatografia líquida de alto desempenho (HPLC) pode ser empregada durante as etapas de purificação final.

[00217] Vários sistemas de cultura de células de mamíferos podem também ser empregados para expressar proteína recombinante. Os exemplos de sistemas de expressão de mamíferos incluem a linhagem de COS-7 de fibroblastos de rim de macacos (descritos por Gluzman, Cell, 23:175, 1981), e outras linhagens de células capazes de expressar proteínas de um vetor compatível, tal como as linhagens de células C127, 3T3, CHO, HeLa e BHK.

[00218] Os constructos em células hospedeiras podem ser empregados de uma maneira convencional para produzir o produto de gene codificado pela seqüência recombinante. Dependendo do hospedeiro empregado em um procedimento de produção recombinante, os polipeptideos produzidos pelas células hospedeiras contendo o vetor podem ser glicosilados ou podem ser não-glicosilados. Os polipeptídeos da invenção podem ou não pode também incluir um resíduo de aminoácido de metionina inicial.

[00219] Alternativamente, os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idêntica a estas,

77/151 ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser produzidos sinteticamente por síntese de peptídeo convencional. Em outras modalidades, os fragmentos ou porções dos polipeptídeos podem ser empregados para produzir o polipeptídeo de extensão total correspondente por síntese de peptídeo; destes, os fragmentos podem ser empregados como intermediários para produção de polipeptídeos de extensão total.

[00220] Os sistemas de translação livre de células podem ser empregados para produzir um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes empregando mRNAs transcritos de um constructo de DNA compreendendo um promotor operavelmente ligado a um ácido nucléico codificando o polipeptídeo ou fragmentos destes. Em algumas modalidades, o constructo de DNA pode ser linearizado antes de conduzir uma reação de transcrição in vitro. O mRNA transcrito é então incubado com um extrato de translação livre de célula apropriado, tal como um extrato reticulócito de coelho, para produzir o polipeptídeo desejado ou fragmento deste.

[00221] A invenção também refere-se a variantes dos polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. O termo variante inclui derivados ou análogos desses polipeptídeos. Em particular, as variantes podem diferir na seqüência de aminoácidos de poliepptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, por uma ou mais substituições, adições, anulações, fusões e trunca78/151 ções, que podem estar presentes em qualquer combinação.

[00222] As variantes pode ser de ocorrência natural ou criadas in vitro. Em particular, tais variantes podem ser criadas empregando técnicas de engenharia genética tal como mutagênese direcionada por sítio, mutagênese de química aleatória, procedimentos de anulação de Exonuclease III, e técnicas de clonagem padrão. Altemativamente, tais variantes, fragmentos, análogos, ou derivados podem ser criados empregando síntese química ou procedimentos de modificação.

[00223] Outros métodos de preparação de variantes são também familiares para aqueles versados na técnica. Esses procedimentos incluem nos quais as seqüências de ácidos nucléicos obtidos de isolados naturais são modificadas para gerar ácidos nucléicos que codificam polipeptídeos tendo características que realçam seu valor em aplicações de laboratório e industriais. Em tais procedimentos, um número amplo de seqüência de variantes tendo um ou mais nucleotídeos diferentes com respeito à seqüência obtida dos isolados naturais são gerados e caracterizados. Tipicamente, esses nucleotídeos diferentes resultam em mudanças de aminoácidos com respeito a polipeptídeos codificados pelos ácidos nucléicos do isolados naturais.

[00224] Por exemplo, as variantes podem ser criadas empregando PCR propensa a erros. Em PCR propensa a erros, a PCR é desempenhada sob condições onde a fidelidade da cópia da polimerase de DNA é curta, tal que uma taxa elevada de ponto de mutação é obtida junto com a extensão completa do produto PCR. PCR propensa a erro é descrita em Leung, D.W. e outros, Technique, 1: 11-15, (1989) e Caldwell, R.C. & Joyce G.F., PCR Methods Applic., 2:28-33, 1992, a divulgação dos quais está incorporada aqui por referência em sua totalidade. Brevemente, em tais procedimentos, os ácidos nucléicos para serem mutagenizados são misturados com iniciadores PCR, tampão de reação, MgCl2, MnCl2, polimerase Taq e uma concentração apro79/151 priada de dNTPs para alcançar uma taxa elevada no ponto de mutação junto com a extensão completa do produto PCR. Por exemplo, a reação pode ser realizada empregando 20 moles de ácido nucléico para serem mutageinizados, 30pmol de cada iniciador PCR, um tampão de reação compreendendo 50mM de KCl, 10mM de Tris de HCl (pH8,3) e 0,01% de gelatina, 7mM de MgCl2, 0,5mM de MnCl2, 5 unidades de polimerase Taq, 0,2mM de dGTP, 0,2mM de dATP, 1mM de dCTP, e 1mM de dTTP. PCR pode ser realizada durante 30 ciclos de 94°C durante 1 minuto, 45°C durante 1 minuto, 72°C durante 1 minuto. Entretanto, será apreciado que esses parâmetros podem ser variados como apropriados. Os ácidos nucléicos mutagenizados são clonados em um vetor apropriados e as atividades dos polipeptídeos codificados pelos ácidos nucléicos mutagenizados são avaliadas.

[00225] As variantes podem também ser criadas empregando mutagênese direcionada a oligo nucleotídeos para gerar mutações de sítio específicas em qualquer DNA clonado de interesse. A mutagênese de oligonucleotídeos é descrita em Reidhaar-olson, J.F. O Sauer, R. T. e outros, Science, 241-53-57, 1988, a divulgação dos quais está incorporada aqui por referência em sua totalidade. Brevemente, em tais procedimentos uma pluralidade dos oligonucleotídeos de filamentos duplos portando uma ou mais mutações para serem introduzidas no DNA clonado são sintetizados e inseridos no DNA clonado para serem mutagenizado. Os clones contendo o DNA mutagenizados são recuperados e as atividades dos polipeptídeos de sua codificação são avaliadas.

[00226] Outro método para gerar variantes é agrupamento PCR. O agrupamento PCR envolve o agrupamento de um produto PCR de uma mistura de pequenos fragmentos de DNA. Um número amplo de reações PCR diferentes ocorre em paralelo no mesmo frasco, com os produtos de uma reação afetando os produtos de outra reação. O a80/151 grupamento PCR é descrito em Patente dos U.S. N°S 5.965.408, depositada em 9 de julho de 1996, intitulada, Method of DNA Reassembly by Interrupting Synthesis, a divulgação da qual está incorporada aqui por referência em sua totalidade.

[00227] Ainda outro método de gerar variantes é mutagênese PCR sexual. Em mutagênese PCR sexual, a recombinação homológa forçada ocorre entre moléculas de DNA de diferentes porém seqüências de DNA altamente relacionadas in vitro, como um resultado da fragmentação aleatória da molécula de DNA com base na seqüência homóloga, seguida pela fixação da passagem da extensão do iniciador em uma reação PCR. A mutagênese PCR sexual é descrita em Stemmer, W. P. PNAS, USA, 91:10747-10751, 1994, a divulgação do qual está incorporada aqui por referência. Brevemente, em tais procedimentos uma pluralidade de ácidos nucléicos serem recombinados são digeridos com DNAse para gerar fragmentos tendo um tamanho médio de 50-200 nucleotídeos. Os fragmentos do tamanho médio desejado são purificados e re-suspensos em uma mistura PCR. PCR é conduzida sob condições que facilitam a recombinação entre os fragmentos de ácido nucléico. Por exemplo, PCR pode ser realizada por re-suspensão dos fragmentos purificados em uma concentração de 10-30ng/:1 em uma solução de 0,2mM de cada dNTP, 2,2mM de MgCl₂, 50mM de KCl, 10mM de Tris HCl, pH 9,0, e 0,1% de Triton X-100.

2,5 unidades de polimerase Taq por 100:1 de mistura de reação são adicionadas e PCR é realizada empregando o seguinte regime: 94°C durante 60 segundos, 94°C durante 30 segundos, 50-5 5°C durante 30 segundos, 72°C durante 30 segundos (30-45 vezes) e 72°C durante 5 minutos. Entretanto, será apreciado que esses parâmetros possam ser variados quando apropriado. Em algumas modalidades, os oligonucleotídeos podem ser incluídos nas reações PCR. Em outras modalidades, o fragmento Klenow de polimerase DNA I pode ser empregado

81/151 em uma primeira série de reações PCR e polimerase Taq pode ser empregada em uma série subseqüente de reações PCR. As seqüências recombinantes são isoladas e as atividades dos polipeptídeos de sua codificação são avaliadas.

[00228] As variantes podem também ser criadas por mutagênese in vivo. Em algumas modalidades, mutações aleatórias em uma seqüência de interesse são geradas propagando-se a seqüência de interesse em uma cepa de bactéria, tal como uma cepa de E.coli, que carrega as mutações em uma ou mais das passagens de reparo de DNA. Tais cepas mutadoras têm uma mutação aleatória mais elevada do que aquelas de um parente do tipo selvagem. Propagar o DNA em uma dessas cepas eventualmente gerará mutações aleatórias no DNA. As cepas mutadoras adequadas para uso durante mutagênese in vivo são descritas em publicação PCT N° WO 91/16427, publicada em 31 de outubro de 1991, intitulada Methods for Phenotype Creation from Multiple Gene Populations a divulgação das qual está incorporada aqui por referência em sua totalidade.

[00229] As variantes podem também ser geradas empregando mutagênese cassete. Na mutagênese cassete uma pequena região de uma molécula de DNA de filamento duplo é substituída com um cassete de oligonucleotídeo sintético que difere da seqüência nativa. O oligonucleotídeo freqüentemente contém seqüência nativa aleatória completamente e/ou parcialmente.

[00230] A mutagênese do conjunto recursivo pode também ser empregada para gerar variantes. A mutagênese de conjunto recursivo é um algoritmo para projetar proteínas (mutagênese de proteína) desenvolvido para produzir populações diversas de mutantes fenotipicamente relacionados àqueles membros que diferem na seqüência de aminoácidos. Este método usa um mecanismo de realimentação para cargas sucessivas de controle de mutagênese cassete combinatória. A

82/151 mutagênese de conjunto recursivo é descrita em Arkin, A.P. e Youvan, D. C., PNAS, USA, 89:7811-7815, 1992, a divulgação dos quais está incorporada aqui por referência em sua totalidade.

[00231] Em algumas modalidades, as variantes são criadas empregando mutagênese de conjunto exponencial. A mutagênese de conjunto exponencial é um processo para gerar bibliotecas combinatórias com um percentual elevado de mutantes funcionais e únicos, onde pequenos grupos de resíduos são colocados aleatoriamente em paralelo para identificar, em cada posição alterada, aminoácidos que induzem à proteínas funcionais. A mutagênese de conjunto exponencial é descrita em Delegrave, S., e Youvan, D. C. Biotechnology Research, 11:1548-1552, 1993, a divulgação dos quais está incorporada aqui por referência em sua totalidade. Mutagênese de sítio direcionado e aleatória são descritas em Arnold, F. H., Current Opinion in Biotechnology, 4:450-455, 1993, a divulgação do qual está incorporada aqui por referência em sua totalidade.

[00232] Em algumas modalidades, as variantes são criadas empregando procedimentos de mistura onde as porções de uma pluralidade de ácidos nucléicos que codificam polipeptídeos distintos são fundidas juntas para produzir seqüências de ácidos nucléicos quiméricos que codificam polipeptídeos quiméricos como descrito em Patente U.S. N° 5.965.408, depositada em 9 de julho de 1996, intitulada, Method of DNA Reassembly by Interrupting Synthesis, e Patente U.S. N° 5.939.250, depositada em 22 de maio de 1996, intitulada, Production of Enzymes Having Desired Activities by Mutagenesis, ambas das quais estão incorporadas aqui por referência.

[00233] As variantes dos polipeptídeos das seqüências de aminoácidos do Grupo B podem ser variantes nas quais um ou mais resíduos de aminoácidos dos polipeptídeos das seqüências de aminoácido de Grupo B são substituídos com um resíduo de aminoácido conservado

83/151 ou não-conservado (preferivelmente um resíduo de aminoácido conservado) e tais resíduos de aminoácidos substituídos podem ou não podem ser um codificado pelo código genético.

[00234] As substituições conservativas são aquelas que substituem um determinado aminoácido em um polipeptídeo por outro aminoácido de outras características. Tipicamente vistas como substituições conservativas são as seguintes substituições: substituições de um aminoácido alifático tal como alanina, valina, leucina, e isoleucina por outro aminoácido alifático; substituição de uma serina por uma treonina ou vice-versa; substituição de um resíduo acídico tal como ácido aspártico e ácido glutâmico por outro resíduo acídido, substituição de um resíduo portando um grupo amida, tal como asparagina e glutamina, por outro resíduo portanto um grupo amida; permuta de um resíduo básico tal como lisina e arginina por outro resíduo básico; e substituição de um resíduo aromático tal como fenilalanina, tirosina, por outro resíduo aromático.

[00235] Outras variantes são aquelas em que um ou mais dos resíduos de aminoácidos dos polipeptídeos das seqüências de aminoácidos do Grupo B incluem um grupo substituinte.

[00236] Ainda outras variantes são aquelas em que o polipeptídeo é associado com outro composto, tal como um composto para aumentar a meia-vida do polipeptídeo (por exemplo, polietileno glicol).

[00237] As variantes adicionais são aquelas em que os aminoácidos adicionais são fundidos ao polipeptídeo, tal como seqüência líder, uma seqüência secretora, uma seqüência de pró-proteína ou uma seqüência que facilita a purificação, enriquecimento, ou estabilização do polipeptídeo.

[00238] Em algumas modalidades, os fragmentos, derivados e análogos retêm as mesmas funções biológicas ou atividades como os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências

84/151 substancialmente idênticas destes. Em outras modalidades, o fragmento, derivado, ou análogos incluem uma pró-proteína, tal que o fragmento, derivado, ou análogo possa ser ativado por clivagem da porção de pró-proteína para produzir um polipeptídeo ativo.

[00239] Outro aspecto da invenção são polipeptídeos ou fragmentos destes que têm pelo menos cerca de 50%, pelo menos cerca de 55%, pelo menos cerca de 60%, pelo menos cerca de 65%, pelo menos cerca de 70%, pelo menos cerca de 75%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, ou mais do que cerca de 95% de homologia para um dos polipeptídeos das seqüências de aminoácidos do grupo B, e seqüências substancialmente idênticas destes, ou um fragmento compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. A homologia pode ser determinada empregando qualquer dos programas descritos acima que alinhe os polipeptídeos ou fragmentos sendo comparados e determina a extensão da identidade do aminoácido ou similaridade entre eles. Será apreciado que a homologia do aminoácido inclui substituições de aminoácidos conservativos tal como aqueles descritos acima.

[00240] Os polipeptídeos ou fragmentos tendo homologia de um dos polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, ou um fragmento compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser obtidos isolando-se os ácidos nucléicos codificando-os empregando as técnicas descritas acima.

[00241] Alternativamente, os fragmentos ou polipeptídeos homólogos podem ser obtidos através de enriquecimento bioquímico ou procedimentos de purificação. A seqüência dos polipeptídeos potencialmente homólogos ou fragmentos pode ser determinada por digestão

85/151 proteolítica , eletroforese por gel e/ou microssequenciamento. A seqüência dos fragmentos ou polipeptídeos homólogos prospectivos pode ser comparada a um dos polipeptídeos das seqüências do aminoácido do Grupo B, e seqüências substancialmente idênticas destes, ou um fragmento compreendendo pelo menos cerca de 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes empregando quaisquer dos programas descritos acima.

[00242] Outro aspecto da invenção é um ensaio para identificar fragmentos ou variantes das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, que retêm a função enzimática dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas destes. Por exemplo, os fragmentos ou variantes dos referidos polipeptídeos, podem ser empregados para catalisar reações bioquímicas que indicam que os fragmentos ou variantes retêm a atividade enzimática dos polipeptídeos nas seqüências de aminoácidos do Grupo B.

[00243] O ensaio para determinar se os fragmentos de variantes retêm a atividade enzimática dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas destes incluem as etapas de: contatar o fragmento de polipeptídeo ou variante com uma molécula de substrato sob condições que permitem o fragmento de polipeptídeo ou variante funcionar, e detectar ou aumento no nível do substrato ou uma redução no nível do produto de reação específico da reação entre o polipeptídeo e substrato.

[00244] Os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser empregados em uma variedade de aplicações. Por exemplo, os polipeptídeos ou fragmentos destes podem ser empregados para catalisar reações bioquí86/151 micas. De acordo com um aspecto da invenção, existe um processo para utilizar os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou polinucleotídeos codificando tais polipeptídeos para ligações glicosídicas hidrolisadas. Em tais procedimentos, uma substância contendo uma ligação glicosídica (por exemplo, amido) é contatada com um dos polipeptídeos das seqüências de aminoácido do Grupo B, ou seqüências substancialmente idênticas destes sob condições que facilitam a hidrólise da ligação glicosídica.

[00245] Os polipeptídeos de seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes, podem também ser empregados na liquefação e sacarificação do amido. Empregando os polipeptídeos ou fragmentos destes desta invenção, a liquefação pode ser realizada em um pH menor do que com prévias enzimas. Em uma modalidade, a liquefação é realizada em um pH de 4,5. Adicionalmente, os polipeptídeos ou fragmentos destes desta invenção são cálcio menos dependente do que enzimas previamente empregadas nesses processos. Na liquefação as amilases são empregadas para hidrolisar o amido. Em uma modalidade preferida, os polipeptídeos ou fragmentos destes desta invenção são termoestáveis em 90-95°C.

[00246] Os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes, podem também ser empregados para gerar anticorpos que aglutinam especificadamente aos polipeptídeos ou fragmentos. Os anticorpos resultantes podem ser empregados em procedimentos de cromatografia de imunoafinidade para isolar ou purificar o polipeptídeo ou para determinar se o polipeptídeo

87/151 está presente em uma amostra biológica. Em tais procedimentos, uma preparação de proteína, tal como um extrato, ou uma amostra biológica é contatada com um anticorpo capaz de aglutinar especificadamente a um dos polipeptídeos das seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas destes, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes.

[00247] Em procedimentos de imunoafinidade, o anticorpo está ligado a um suporte sólido, tal como uma conta ou outra matriz de coluna. A preparação da proteína é colocada em contato com o anticorpo sob as condições em que o anticorpo aglutina especificadamente a um dos polipeptídeos de seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, ou fragmentos destes. Após a lavagem para remover proteínas de ligação nãoespecificadamente, os polipeptídeos especificadamente ligados são eluídos.

[00248] A capacidade das proteínas em uma amostra biológica aglutinar ao anticorpo pode ser determinada empregando qualquer de uma variedade dos procedimentos familiares para aqueles versados na técnica. Por exemplo, a aglutinação pode ser determinada rotulando-se o anticorpo com um rótulo detectável tal como um agente fluorescente, um rótulo enzimático, ou um radioisótopo. Alternativamente, a aglutinação do anticorpo na amostra pode ser detectada empregando um anticorpo secundário tendo um tal rótulo detectável. Ensaios particulares incluem ensaios ELISA, ensaios sanduíche, radioimunoensaios, e Western Blots.

[00249] Os anticorpos policlonais gerados contra os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destes, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos conse88/151 cutivos destes podem ser obtidos por injeção direta dos polipeptídeos em um animal ou administrando-se os polipeptídeos a um animal, por exemplo, um não-humano. O anticorpo desse modo obtido então aglutinará o polipeptídeo propriamente dito. Desta maneira, ainda uma seqüência codificando somente um fragmento do polipeptídeo pode ser empregada para gerar anticorpos que podem aglutinar para aqueles polipeptídeos nativos inteiros. Tais anticorpos podem então ser empregados para isolar o polipeptídeo a partir de polipeptídeos que expressam células.

[00250] Para preparação de anticorpos monoclonais, qualquer técnica que fornece anticorpos produzidos por cultura de linhagem de células contínua pode ser empregada. Os exemplos incluem a técnica da hibridoma (Kohler e Milstein, Nature, 256:495-497, 1975, a divulgação da qual é incorporada aqui por referência), a técnica de trioma, a técnica de hibridoma de célula B humana (Kozbor e outros, Immunology Today 4:72, 1983, a divulgação da qual está incorporada aqui por referência), e a técnica de hibridoma EBV (cole e outros, 1985, em Monoclonal Antibodies and Cancer Therapy, Alan R. Liss. Inc., pp.77-96, a divulgação da qual está incorporada aqui por referência).

[00251] As técnicas descritas para a produção de anticorpos de cadeia única (Patente U.S. N° 4.946.778, a divulgação da qual está incorporada aqui por referência) podem ser adaptadas para produzir anticorpos de cadeia única para os polipeptídeos das seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes. Alternativamente, os camundongos transgênicos podem ser empregados para expressar anticorpos humanizados para esses polipeptídeos ou fragmentos destes.

[00252] Anticorpos gerados contra os polipeptídeos das seqüências

89/151 de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estas, ou fragmentos compreendendo pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos destes podem ser empregados na peneiração para polipeptídeos similares de outros organismos e amostras. Em tais técnicas, os polipeptídeos do organismo são contactados com o anticorpo e aqueles polipeptídeos que especificadamente aglutinam o anticorpo são detectados. Qualquer dos procedimentos descritos acima pode ser empregado para detectar a aglutinação do anticorpo. Um tal ensaio de peneiração é descrito em Methods for Measuring Cellulase Activities, Methods in Enzymology, Volume 160, pp. 87-116, que está aqui incorporado por referência.

[00253] Como empregado aqui o termo seqüência de ácido nucléico como apresentada em SEQ ID N°s 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97,

99,	101,	103,	105,	107,	109,	111,	113,	115,	117,	119,	121,	123,	125
127,	129,	131,	133,	135,	137,	139,	141,	143,	145,	147,	149,	151,	153
155,	157,	159,	161,	163,	165,	167,	169,	171,	173,	175,	177,	179,	181
183,	185,	187,	189,	191,	193,	195,	197,	199,	201,	203,	205,	207,	209
211,	213,	215,	217,	219,	221,	223,	225,	227,	229,	231,	233,	235,	237
239,	241,	243,	245,	247,	249,	251,	253,	255,	257,	259,	261,	263,	265
267,	269,	271,	273,	275,	277,	279,	281,	283,	285,	287,	289,	291,	293

295, 297, 299 abrange as seqüências de nucleotídeo de seqüências de ácido nucléico do Grupo A, e as seqüências substancialmente idênticas a estas, bem como as seqüências homólogas para seqüências de ácido nucléico do Grupo A, e fragmentos destas e seqüências complementares para todas as seqüências precedentes. Os fragmentos incluem porções de SEQ ID N°s 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59,

90/151

61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81,83, 85, 87, 89, 91, 93, 95, 97,

99,	101,	103,	105,	107,	109,	111,	113,	115,	117,	119,	121,	123,	125
127,	, 129,	131,	133,	135,	137,	139,	141,	143,	145,	147,	149,	151,	153
155,	157,	159,	161,	163,	165,	167,	169,	171,	173,	175,	177,	179,	181
183,	185,	187,	189,	191,	193,	195,	197,	199,	201,	203,	205,	207,	209
211,	213,	215,	217,	219,	221,	223,	225,	227,	229,	231,	233,	235,	237
239,	241,	243,	245,	247,	249,	251,	253,	255,	257,	259,	261,	263,	265
267,	269,	271,	273,	275,	277,	279,	281,	283,	285,	287,	289,	291,	293

295, 297 e 299, compreendendo pelo menos 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 150, 200, 300, 400 ou 500 nucleotídeos consecutivos das seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas destas. A seqüência homóloga e fragmentos das seqüências do ácido nucléico do Grupo A, e seqüências substancialmente idênticas destas, referem-se a uma seqüência tendo pelo menos 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55%, ou 50% homólogos dessas seqüências. A homologia pode ser determinada empregando qualquer dos programas de computador e parâmetros descritos aqui, incluindo 3,0t78 de versão FASTA com os parâmetros característicos. A seqüência homóloga pode incluir seqüências de RNA em que as uridinas substituiem as timinas nas seqüências de ácido nucléico como apresentadas nas seqüências de ácidos nucléicos do Grupo A. A seqüência homóloga pode ser obtida empregando qualquer dos procedimentos descritos aqui ou pode resultar da correção de erro de seqüência. Será apreciado que a seqüência de ácido nucléico como apresentada na seqüência de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, pode ser representada no formato de caráter único tradicional (Observe o revestimento dianteiro interno de Stryer, Lubert. Biochemistry, 3^aedição, W. H. Freeman & Co., New York) ou em qualquer outro formato que registre a identidade do nucleotídeo em uma seqüência.

91/151 [00254] Como empregado aqui o termo uma seqüência de polipeptídeo como apresentada em SEQ ID N°S 2, 4, 6, 10, 12, 14, 16, 18, 20,

22,	24, 26	, 28,	30, 32, 34	, 36,	38, 4	0, 42	44,	46, 4	8, 50,	52,	54, 56	, 58
60,	62, 64	, 66,	68, 70, 72	, 74,	76, 7	8, 80	82,	84, 8	6, 88,	90,	92, 94	, 96
98,	100, 1	02,	104,	106,	108,	110,	112,	114,	116,	118,	120,	122,	124
126	, 128,	130,	132,	134,	136,	138,	140,	142	144,	146,	148	150,	152
154	, 156,	158,	160,	162,	164,	166,	168,	170	172,	174,	176	178,	180
182	, 184,	186,	188,	190,	192,	194,	196,	198	202,	204,	206	208,	210
212	, 214,	216,	218,	220,	222,	224,	226,	228	230,	232,	234	236,	238
240	, 242,	244,	246,	248,	250,	252,	254,	256	258,	260,	262	264,	266
268	, 270,	272,	274,	276,	278,	280,	282,	284	286,	288,	290	292,	294

296, 298 abrange a seqüência de polipeptídeo das seqüências de aminoácidos do Grupo B, e as seqüências substancialmente idênticas a estas, que são codificadas por uma seqüência como apresentada em SEQ ID N°S: 2, 4, 6, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74,

76,	78, 80	, 82,	84,	86, 88, 90,	92,	94, 96, 98,	100,	102,	104,	106,	108,
110,	112,	114,	116,	118,	120,	122,	124,	126,	128,	130,	132,	134,	136,
138,	140,	142,	144,	146,	148,	150,	152,	154,	156,	158,	160,	162,	164,
166,	168,	170,	172,	174,	176,	178,	180,	182,	184,	186,	188,	190,	192,
194,	196,	198,	202,	204,	206,	208,	210,	212,	214,	216,	218,	220,	222,
224,	226,	228,	230,	232,	234,	236,	238,	240,	242,	244,	246,	248,	250,
252,	254,	256,	258,	260,	262,	264,	266,	268,	270,	272,	274,	276,	278,
280,	282,	284,	286	288,	290,	292	294,	296,	298,	seqüências de	poli-

peptídeo homólogas aos polipeptídeos da seqüência de aminoácido do Grupo B, e as seqüências substancialmente idênticas a estas, ou fragmentos de qualquer das seqüências precedentes. As seqüências de polipeptídeos homólogas referem-se a uma seqüência de polipeptídeo tendo pelo menos 99%, 98%, 97%, 96%, 95%, 90%, 85%, 80%, 75%, 70%, 65%, 60%, 55% ou 50% homólogo para uma das seqüên92/151 cias de polipeptídeos da seqüência de aminoácidos do Grupo B. A homologia pode ser determinada empregando qualquer dos programas de computadores e parâmetros descritos aqui, incluindo 3,0t78 de versão FASTA com os parâmetros característicos ou com qualquer parâmetro modificado. A seqüência homóloga pode ser obtida empregando qualquer dos procedimentos descritos aqui ou qualquer resultado da correção de erro de seqüência. Os fragmentos de polipeptídeos compreendem pelo menos 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, ou 150 aminoácidos consecutivos dos polipeptídeos da seqüência de aminoácidos do Grupo B, e as seqüências substancialmente idênticas destes. Será apreciado que os polipeptídeos codificados como apresentados na seqüência de aminoácidos do Grupo B, e seqüências substancialmente idênticas a estes, podem ser representados no formato de caráter único tradicional ou formato de três letras (Observe o revestimento dianteiro interno de Stryer, Lubert, Biochemistry, 3^a Edição, W. H. Freeman & Co., New York) ou em qualquer outro formato que refere-se à identidade dos polipeptídeos em uma seqüência. [00255] Será apreciado para aqueles versados na técnica que uma seqüência de ácido nucléico como apresentada em SEQ ID N°s 1, 3, 5, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81,

83,	85, 87, 89,	91,	93, 9	5, 97	99,	101,	103,	105,	107,	109,	111,	113,
115,	117,	119,	121,	123,	125,	127,	129,	131,	133,	135,	137,	139,	141,
143,	145,	147,	149,	151,	153,	155,	157,	159,	161,	163,	165,	167,	169,
171,	173,	175,	177,	179,	181,	183,	185,	187,	189,	191,	193,	195,	197,
199,	201,	203,	205,	207,	209,	211,	213,	215,	217,	219,	221,	223,	225,
227,	229,	231,	233,	235,	237,	239,	241,	243,	245,	247,	249,	251,	253,
255,	257,	259,	261,	263,	265,	267,	269,	271,	273,	275,	277,	279,	281,
283,	285,	287,	289,	291,	293,	295,	297,	299	e um	a seqüênc	ia de	poli-

peptídeo como apresentada em SEQ ID N°s 2, 4, 6, 10, 12, 14, 16, 18,

93/151

20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 80, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 12, 124,

126,	128,	130,	132,	134,	136,	138,	140,	142,	144,	146	148,	150,	152,
154,	156,	158,	160,	162,	164,	166,	168,	170,	172,	174	176,	178,	180,
182,	184,	186,	188,	190,	192,	194,	196,	198,	202,	204	206,	208,	210,
212,	214,	216,	218,	220,	222,	224,	226,	228,	230,	232	234,	236,	238,
240,	242,	244,	246,	248,	250,	252,	254,	256,	258,	260	262,	264,	266,
268,	270,	272,	274,	276,	278,	280,	282,	284,	286,	288	290,	292,	294,
296,	298	podem ser armazenadas, registradas,	e	preparadas	por

qualquer meio que pode ser lido e acessado por um computador. Como empregado aqui, as palavras registrado e armazenado refere-se a um processo para informação de armazenagem em um meio de computador. Um técnico versado pode adotar facilmente qualquer dos métodos atualmente conhecidos para registrar a informação em um meio legível por computador para gerar preparações compreendendo uma ou mais seqüências de ácidos nucléicos como apresentadas em seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas a estas, uma ou mais seqüências de polipeptídeos como apresentadas nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destas. Outro aspecto da invenção é um meio legível por computador tendo registrado neste pelo menos 2, 5, 10, 15, ou 20 seqüências de ácidos nucléicos como apresentadas nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas.

[00256] Outro aspecto da invenção é um meio legível por computador tendo registrado nele uma ou mais das seqüências de ácido nucléico como apresentadas nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas. Outro aspecto da invenção é um meio legível por computador tendo registrado

94/151 neste uma ou mais das seqüências de polipeptídeos como apresentadas nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas nestas. Outro aspecto da invenção é um meio legível por computador tendo registrado nestes pelo menos 2, 5, 10, 15, ou 20 das seqüências como apresentadas acima.

[00257] O meio legível por computador inclui meio legível magneticamente, meio de leitura óptica, meio de leitura eletrônica e meio magnético óptico. Por exemplo, o meio legível por computador pode ser um disco rígido, um disco mole, uma fita magnética, CD-ROM, Disco Versátil Digital (DVD), Memória de Acesso Aleatória (RAM), ou Memória Somente para Leitura (ROM) bem como outros tipos de meios conhecidos para aqueles versados na técnica.

[00258] As modalidades da invenção incluem sistemas (por exemplo sistemas com base na internet), particularmente sistemas de computador que armazenam e manipulam a seqüência de informação descrita aqui. Um exemplo de um sistema de computador 100 é ilustrado na forma de diagramas de blocos na Figura 1. Como empregado aqui, um sistema de computador refere-se aos componentes hardware, componentes software, e componentes de armazenamento de dados empregados para analisar uma seqüência de nucleotídeo de uma seqüência de ácido nucléico como apresentada nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas nestas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácidos do Grupo B. O sistema de computador 100 tipicamente inclui um processador para processar, acessar e manipular a seqüência de dados. O processador 105 pode ser qualquer tipo bem-conhecido de unidade de processamento central, tal como, por exemplo, o Pentium III da Intel Corporation, ou processador similar do Sun, Motorola, Compaq, AMD ou International Business Machines. [00259] Tipicamente o sistema de computador 100 é um sistema de

95/151 propósito geral que compreende o processador 105 e um ou mais componentes de armazenamento de dados internos 110 para armazenamento de dados, e um ou mais dispositivos de correção de dados para corrigir os dados armazenados nos componentes de armazenamento de dados. Um técnico versado na técnica pode facilmente apreciar que qualquer um dos sistemas de computadores correntemente disponíveis é adequado.

[00260] Em uma modalidade particular, o sistema de computador 100 inclui um processador 105 conectado a um barramento que está conectado a uma memória principal 115 (preferivelmente implementado como RAM) e um ou mais dispositivos de armazenamento de dados internos 110, tal como um disco rígido e/ou outro meio legível por computador tendo registrado os dados nestes. Em algumas modalidades, o sistema de computador 100 ainda inclui um ou mais dispositivos de correção de dados 118 para ler os dados armazenados nos dispositivos de armazenamento de dados internos 110.

[00261] O dispositivo de correção de dados 118 pode representar, por exemplo, um drive de disco mole, um drive de disco compacto, um drive de fita magnética, ou um modem capaz da conexão de um sistema de armazenamento de dados à distância (por exemplo através da internet)etc. Em algumas modalidades, o dispositivo de armazenamento de dados internos 110 é um meio legível por computador removível tal como um disco macio, um disco compacto, uma fita magnética, etc contendo a lógica de controle e/ou os dados registrados destes. O sistema de computador 100 pode vantajosamente incluir ou ser programado pelo software apropriado para ler a lógica do controle e/ou os dados dos componentes de armazenamento de dados uma vez inseridos no dispositivo de correção de dados.

[00262] O sistema de computador 100 inclui um monitor 120 que é empregado para exibir o rendimento para um usuário do computador.

96/151

Deveria também ser notado que o sistema de computador 100 pode ser ligado a outros sistemas de computador 125a-c em uma rede ou rede de área ampla para fornecer acesso centralizado ao sistema de computador 100.

[00263] Software para acessar e processar as seqüências de nucleotídeo de uma seqüência de ácidos nucléicos como apresentadas nas seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de amino ácidos do Grupo B, e seqüências substancialmente idênticas nestas, (tal como ferramentas de busca, ferramentas de comparação, e ferramentas de modelação, etc) pode residir na execução durante a memória principal 115.

[00264] Em algumas modalidades, o sistema de computador 100 pode ainda compreender um algoritmo de comparação de seqüência para comparar uma seqüência de ácido nucléico como apresentada em seqüências de ácidos nucléicos do Grupo A, e seqüências substancialmente idênticas destas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácidos do Grupo B, e seqüências substancialmente idênticas destas, armazenados em um meio legível por computador para uma seqüência de nucleotídeo ou polinucleotídeo armazenadas em um meio legível por computador. Um algoritmo de comparação de seqüência refere-se a um ou mais programas que são implementados (localmente ou remotamente) no sistema de computador 100 para comparar uma seqüência de nucleotídeo com outras seqüências de nucleotídeos e/ou compostos armazenados em um dispositivo de armazenamento de dados. Por exemplo, o algoritmo de comparação de seqüência pode comparar as seqüências de nucleotídeos de uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas destas, ou uma seqüência de polipeptídeo co97/151 mo apresentada nas seqüências de aminoácidos no Grupo B, e seqüências substancialmente idênticas nestas, armazenadas em meio legível por computador para armazenar as seqüências de referências de um meio legível por computador para identificar homologias ou motivos estruturais. Vários programas de comparação de seqüência identificados em outro lugar neste relatório descritivo de patente são particularmente contemplados para uso neste aspecto da invenção. As homologias de seqüência de ácido nucléico e/ou proteína podem ser avaliadas empregando qualquer das variedades de algoritmo de comparação de seqüência e programas conhecidos na técnica. Tais algoritmos e programas incluem, porém não estão limitados a TBLASTN, BLASTP, FASTA, TFASTA, e CLUSTALW (Pearson e Lipman, Proc. Natl. Acad. Sci. USA 85(8):2444-2448, 1988; Altschul e outros J. Mol. Biol. 215(3): 403-410, 1990; Thompson e outros, Nucleic Acids Res. 22(2): 4673-4680, 1994; Higgins e outros, Methods Enzymol. 266:383402, 1996, Altschul e outros, J. Mol. Biol 215(3):403-410, 1990; Altschul e outros, Nature Genetics 3:266-272, 1993).

[00265] A homologia ou identidade é freqüentemente medida empregando o software de análise de seqüência (por exemplo, Sequence Analysis Software Package of the Genetics Computer Group, University of Wisconsin Biotechnology Center, 1710 University Avenue, Madison, WI 53705). Tais seqüências similares de software semelhantes designando-se graus de homologia para várias anulações, substituições e outras modificações. Os termos homologia e identidade no contexto de dois ou mais ácidos nucléicos ou seqüências de polipeptídeos, referem-se a duas ou mais seqüências ou sub-seqüências que são as mesmas ou têm um percentual especificado de resíduos de aminoácidos ou nucleotídeos que são os mesmos quando comparados e alinhados para correspondência máxima durante uma janela de comparação ou região designada como medida empregando qualquer

98/151 número de algoritmos de comparação de seqüência ou por alinhamento manual e inspeção visual.

[00266] Para comparação de seqüência, tipicamente uma seqüência atua como uma seqüência de referência, àquela seqüência teste quando comparado. Quando empregando um algoritmo de comparação de seqüência, seqüências de referência e teste são registradas em um computador, coordenadas subseqüentes são designadas, se necessário e parâmetros de programa de algoritmo de seqüência são designados. Os parâmetros de programa característicos podem ser empregados, ou parâmetros alternativos podem ser designados. O algoritmo de comparação de seqüência em seguida calcular o percentual das identidades de seqüência durante as seqüências testes relativas à seqüência de referência, com base nos parâmetros do programa. [00267] Uma janela de comparação, como empregado aqui, inclui referência para um segmento de qualquer um dos números de posições contíguas selecionadas a partir do grupo consistindo em 20 a 600, freqüentemente cerca de 50 a cerca de 200, mais freqüentemente cerca de 100 a cerca de 150 na qual uma seqüência pode ser comparada a uma seqüência de referência do mesmo número de posições contíguas após as duas seqüências serem otimamente alinhadas. Os métodos de alinhamento da seqüência para comparação são bemconhecidos na técnica. O alinhamento ótimo das seqüências para comparação pode ser conduzido, por exemplo, pelo algoritmo de homologia local de Smith & Waterman, Adv. Appl. Math. 2:482, 1981, pelo algoritmo de alinhamento da homologia de Needleman & Wunsch, J. Mol. Biol 48:443, 1970; pela pesquisa da similaridade do método de person & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444, 1988, por implementações computadorizadas desses algoritmos (GAP, BESTFIT, FASTA, e TFASTA na Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI), ou por alinha99/151 mento manual e inspeção visual. Outros algoritmos para determinar a homologia ou a identidade incluem, por exemplo, além de um programa BLAST (Basic Local Alignment Search Tool at the National Center for Biological Information), ALIGN, AMAS (Analysis of Multiply Aligned Sequences), AMPS (Protein Multiple Sequence Alignmemt), ASSET (Aligned Segment Statistical Evaluation Tool), BANDS, BESTSCOR, BIOSCAN (Biological Sequence Comparative Analysis Node), BLIMPS (Blocks IMProved Searcher), FASTA, Intervals & Points, BMB, CLUSTAL V, CLUSTAL W, CONSENSUS, LCONSENSUS, WCONSENSUS, Smith-Waterman algorithm, DARWIN, Las Vegas algorithm, FNAT (Forced Nucleotide Alignment Tool), Framealign, Framesearch, DYNAMIC, FILTER, FSAP (Fristensky Sequence Analysis Package), GAP (Global Alignment Construction Q Analysis Workbench), MAP (Multiple Alignment Program), GENAL, GIBBS, GenQuest, ISSC (Sensitive Sequence Comparison), LALIGN (Local Sequence Alignment), LCP (Local Content Program), MACAW (Multiple Alignment Program), MBLKP, MBLKN, ΡΙΜΑ, (Pattern-lnduced Multisequence Alignment), SAGA (Sequence Alignment by Genetic Algorithm) e WHAT-IF. Tais programas de alinhamento podem ser empregados para rede de banco de dados de genoma para identificar seqüências de polinucleotídeos tendo seqüências substancialmente idênticas. Vários bancos de dados de genoma são disponíveis, por exemplo, uma porção substancial para o genoma humano é disponível como parte do Projeto de seqüenciamento do Genoma Humano(J.Roach, http://weber.u.Washinqton.edu/~roach/human qenome proqress 2.html) (Gibbs, 1995). Pelo menos vinte e um outros genomas têm anteriormente sido seqüenciados, incluindo por exemplo, M. genitalium (Fraser e outros, 1995), M. jannaschii (Bult e outros, 1996), H. influenzae (Fleischmann e outros, 1995), E. coli (Blattner e outros, 1997), e levedura (S. cerevisiae) (Mewes e outros, 1997), e D.melanogaster (Adams e outros, 2000). O

100/151

Progresso significante tem também sido feito no seqüenciamento de genomas de organismo de modelo, tal como camundongos, C. elegans, e Arabadopsis sp. Vários bancos de dados contendo informação genômica anotada com algumas informações funcionais são mantidos por diferentes organizações, e são acessíveis através da internet, por exemplo, http://wwwtiqr.org/tdb: http://www.qenetics.wisc.edu.:

http://genome-www.stanford.edu/~ball:_http://hiv-web.lanl.gov:

http://www.ncbi.nlm.nih.gov:_http://www.ebi.ac.uk;

http://Pasteur.fr/other/bioloqy: and http://www.qenome.wi.mit.edu.

[00268] Um exemplo de um algoritmo útil são algoritmo BLAST e BLAST 2.0, que são descritos em Altschul e outros, Nuc. Acids Res.25:3389-3402, 1977, e Altschull e outros, J. Mol. Biol. 215:403410, 1990 respectivamente. Software para desempenhar análise BLAST é publicamente disponível através do National Center for Biotechnology Information (http://www.ncbi.nlm.nih.gov/). Este algoritmo envolve primeiro identificar os pares de seqüência de marca elevada (HSPs) identificando-se palavras pequenas de W extensão na seqüência da pergunta, que ou iguala ou satisfaz alguns valores positivos com algumas marcas T quando alinhadas com uma palavra da mesma extensão em uma seqüência de banco de dados. T é referido como o princípio da marca da palavra adjacente (Altschul e outros, supra). Essas pequenas expressões contíguas iniciais atuam como sementes para pesquisas de iniciação HSPs por mais tempo encontrada contendo-as. As comparações das expressões contíguas iniciais são estendidas em ambas direções junto com cada seqüência durante até que a marca de alinhamento cumulativa possa ser aumentada. As marcas cumulativas são calculadas, empregando, para seqüências de nucleotídeos, os parâmetros M (marca prêmio para um par de resíduos semelhantes; sempre >0). Para as seqüências de aminoãcidos, uma matriz de marca é empregada para calcular a marca cumulativa.

101/151

A extensão das expressões contíguas em cada direção é detida quando: a queda da marca de alinhamento cumulativo pela quantidade X de seu valor máximo alcançado, a marca cumulativa parte de zero ou abaixo, devido à acumulação de um ou mais alinhamentos de resíduos de marcas negativas; ou o fim ou a seqüência é reagida. Os parâmetros de algoritmo BLAST W, T, e X determinam a sensibilidade e velocidade do alinhamento. O programa BLASTN (para seqüência de nucleotídeos) emprega como características uma longa extensão (W) de 11, uma expectativa (E) de 10, M= 5, N= -4 e uma comparação de ambos filamentos. Para seqüências de aminoácidos, o programa BLASTP usa como característica uma longa extensão de 3, e expectativa (E) de 10, e a matriz de marcação BLOSUM62 (observe Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89:10915, 1989) alinhamentos (B) de 50, expectativa (E) de 10, M= 5, N -4, e uma comparação de ambos filamentos.

[00269] O algoritmo BLAST também realiza uma análise estatística da similaridade entre duas seqüências (observe, por exemplo Karlin & Altschul, Proc. Natl. Acad. Sci. USA 90:5873, 1993). Uma medida da similaridade fornecida por algoritmo BLAST é a probabilidade da soma ser menor (P(N)), que fornece uma indicação da probabilidade pela qual uma conbinação entre dois nucleotídeos ou seqüência de aminoácidos ocorreria por alteração. Por exemplo, um ácido nucléico é considerado similar a uma seqüência de referência se a probabilidade de soma menor em uma comparação do ácido nucléico teste com o ácido nucléico de referência é menos do que cerca de 0,2, mais preferivelmente menos do que cerca de 0,01, e mais preferivelmente menos do que cerca de 0,001.

[00270] Em uma modalidade, as homologias da seqüência de ácido nucléico e proteína são avaliadas empregando Basic Local Alignment Search Tool (BLAST). Em particular, cinco programas BLAST especí102/151 ficos são empregados para realizar o seguinte teste:

[00271] (1) BLASTP e BLAST3 comparam uma seqüência examinada de aminoacido contra um banco de dados da seqüência de proteína;

[00272] (2) BLASTN compara uma seqüência examinada de nucleotídeo contra um banco de dados da seqüência de nucleotídeo; [00273] (3) BLASTX compara os produtos de translação conceituais de seis estruturas de uma seqüência de nucleotídeo examinada (ambos filamentos) contra um banco de dados da seqüência da proteína; [00274] (4) TBLASTN compara uma seqüência de proteína examinada contra um banco de dados da seqüência de nucleotídeo traduzida em todas as seis estruturas de leitura (ambos filamentos); e [00275] (5) TBLASTX compara as translações das seis estruturas de uma seqüência examinada de nucleotídeo contra as translações de seis estruturas de um banco de dados da seqüência de nucleotídeo. [00276] O programa BLAST identifica seqüências homólogas por identificação de segmentos similares, que são referidos aqui como pares de segmento de marca elevada, entre uma seqüência de ácido nucléico ou aminoácido examinada e uma seqüência teste que é preferivelmente obtida de um banco de dados da seqüência de ácido nucléico de proteína. Os pares do segmento de marca elevada são preferivelmente identificados (isto é, alinhados) através de uma matriz de marcação, muitos dos quais são conhecidos na técnica. Preferivelmente, a matriz de marcação empregada é a matrix BLOSUM62 (Gonnet e outros, Science 256: 1443-1445, 1992; Henikoff e Henikoff, Proteins, 17:49-61 1993), Menos preferivelmente, as matrizes PAM ou PAM250 podem também ser empregadas (observe, por exemplo, Schwartz e Dayhoff, eds. 1978, Matrices for Detecting Distance Relationships: Atlas of Protein Sequence and Structure, Washington: National Biomedical Research Foundation). Os programas BLAST são acessíveis a103/151 través da Biblioteca Nacional de Medicina U.S., por exemplo, em www.ncbi.nlm.nih.gov.

[00277] Os parâmetros empregados com os algoritmos acima podem ser adaptados dependendo da extensão da seqüência e grau da homologia estudada. Em algumas modalidades, os parâmetros podem ser os parâmetros de omissão empregados pelos algoritmos na ausência de instruções do usuário.

[00278] A Figura 2 é um diagrama de fluxo ilustrando uma modalidade de um processo 200 para comparar uma nova seqüência de proteína ou nucleotídeo com um banco de dados das seqüências a fim de determinar os níveis de homologia entre a nova seqüência e as seqüências no banco de dados. O banco de dados das seqüências pode ser um banco de dados privado armazenado em um sistema de computador 100, ou um banco de dados público tal como GENBANK que está disponível na Internet.

[00279] O processo 200 inicia em um estado inicial 201 e então move-se para um estado 202 onde a nova seqüência a ser comparada é armazenada em uma memória em um sistema de computador 100. Como discutido acima, a memória pode ser qualquer tipo de memória, incluindo RAM ou um dispositivo de armazenamento interno.

[00280] O processo 200 então se move para o estado 204 onde o banco de dados das seqüências é aberto para análise e comparação. O processo 200 então se move para um estado 206 onde a primeira seqüência armazenada no banco de dados é lida em uma memória no computador. Uma comparação é então realizada em um estado 210 para determinar se a primeira seqüência é a mesma como a segunda seqüência. É importante observar que esta etapa não está limitada a realizar uma comparação exata entre a nova seqüência e a primeira seqüência no banco de dados. Os métodos bem-conhecidos são conhecidos por aqueles de experiência na técnica para comparar duas

104/151 seqüências de proteína ou nucleotídeo, mesmo se elas não são idênticas. Por exemplo, as aberturas podem ser introduzidas em uma seqüência a fim de aumentar o nível de homologia entre as duas seqüências testadas. Os parâmetros que controlam ou as aberturas ou outras características que são introduzidas em uma seqüência durante a comparação são normalmente introduzidos pelo usuário do sistema do computador.

[00281] Uma vez que uma comparação das duas seqüências tenha sido realizada no estado 210, uma determinação é feita em um estado de decisão 210 se as duas seqüências são as mesmas. Certamente, o termo mesma não está limitado a seqüências que são absolutamente idênticas. As seqüências que estão nos parâmetros de homologia introduzidos pelo usuário serão marcadas como mesmas no processo 200.

[00282] Se uma determinação é feita que as duas seqüências são a mesma, o processo 200 se move para um estado 214 onde o nome da seqüência do banco de dados é exibido pelo usuário. Este estado notifica o usuário que a seqüência com o nome exibido executou as restrições de homologia que foram introduzidas. Uma vez que o nome da seqüência armazenada é exibido pelo usuário, o processo 200 se move para um estado de decisão 218 onde uma determinação é feita se a maioria das seqüências existe no banco de dados. Se as seqüências não mais existem no banco de dados, então o processo 200 termina em um estado final 220. Entretanto, se a maioria das seqüências existem no banco de dados, então o processo 200 se move para um estado 224 onde um indicador é movido para a próxima seqüência no banco de dados a fim de que ele possa ser comparado com a nova seqüência. Desse modo, a nova seqüência é alinhada e comparada com todas as seqüências do banco de dados.

[00283] Seria observado que se uma determinação foi feita no es105/151 tado de decisão 212 no qual as seqüências não foram homólogas, então o processo 220 se moveria imediatamente para o estado de decisão 218 a fim de determinar se qualquer outra seqüência estava disponível no banco de dados para comparação.

[00284] Conseqüentemente, um aspecto da invenção é um sistema de computador compreendendo um processador, um dispositivo de armazenamento de dados tendo armazenado neste uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, um dispositivo de armazenamento de dados tendo recuperavelmente armazenado neste seqüências de nucleotídeo de referência ou seqüências de polipeptídeo a serem comparadas com uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, e um comparador de seqüência para conduzir a comparação. O comparador de seqüência pode indicar um nível de homologia entre as seqüências comparadas ou identifica os motivos estruturais no código de ácido nucléico descrito acima das seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do grupo B, e seqüências substancialmente idênticas a esta, ou pode identificar motivos estruturais nas seqüências que são comparados com esses códigos de ácido nucléico e códigos de polipeptídeo. Em algumas modalidades, o dispositivo de armazenamento de dados pode ter armazenado nele as seqüências de pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácido nucléico como a106/151 presentadas nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências de polipeptídeo como apresentadas nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.

[00285] Outro aspecto da invenção é um método para determinar o nível de homologia entre uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, e uma seqüência de nucleotídeo de referência. O método inclui ler o código de ácido nucléico ou o código de polipeptídeo e a seqüência de polipeptídeo ou nucleotídeo de referência através do uso de um programa de computador que determina os níveis de homologia e determinar a homologia entre o código de ácido nucléico ou código de polipeptídeo e a seqüência de polipeptídeo ou nucleotídeo de referência com o programa do computador. O programa do computador pode ser qualquer de vários programas de computador para determinar os níveis de homologia, incluindo aqueles especificadamente enumerados aqui, (por exemplo, BLAST2N com o parâmetro de omissão ou com qualquer parâmetro modificado). O método pode ser implementado empregando os sistemas de computador descritos acima. O método pode também ser realizado lendo-se pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácido nucléico descritas acima como apresentadas nas seqüências de ácido nucléico do Grupo A, ou as seqüências de polipeptídeo como apresentadas nas seqüências de aminoácido do Grupo B através do uso do programa de computador e determinar a homologia entre os códigos de ácido nucléico ou códigos de polipeptídeo e seqüências de nucleotídeo de referência e seqüências de polipeptídeo.

107/151 [00286] Figura 3 é um diagrama de fluxo ilustrando uma modalidade de um processo 250 em um computador para determinar se duas seqüências são homólogas. O processo 250 inicia em um estado inicial 252 e então se move para um estado 254 onde a primeira seqüência a ser comparada é armazenada em uma memória. A segunda seqüência a ser comparada é então armazenada em uma memória em um estado 256. O processo 250 então se move para um estado 260 onde a primeira posição na primeira seqüência é lida e em seguida para um estado 262 onde a primeira posição da segunda seqüência é lida. Deveria ser entendido que se a seqüência é uma seqüência de nucleotídeo, então a posição normalmente seria ou A, T, C, G ou U. Se a seqüência é uma seqüência de proteína, então está preferivelmente no código de aminoácido de letra minúscula a fim de que as primeira e segunda seqüências possam ser facilmente comparadas.

[00287] Uma determinação é então feita em um estado de decisão 264 se as duas posições são as mesmas. Se elas são as mesmas então o processo 250 se move para um estado 268 onde as posições próximas nas primeira e segunda seqüências são lidas. Uma determinação é então feita se as posições próximas são as mesmas. Se elas são, então o processo 250 contínua este loop até que as duas posições não sejam mais as mesmas. Se uma determinação é feita de que as duas posições próximas não são as mesmas, o processo 250 se move para um estado de decisão 274 para determinar se existem mais posições ou seqüências a serem lidas.

[00288] Se não existe mais posição a ser lida, então o processo 250 se move para um estado 276 onde o nível de homologia entre as primeira e segunda seqüências é exibido pelo usuário. O nível de homologia é determinado calculando-se a proporção de posições entre as seqüências que foram as mesmas da quantidade total de seqüências na primeira seqüência. Desse modo, se todas as posições em uma

108/151 primeira seqüência de 100 nucleotídeos alinhada com uma das posições em uma segunda seqüência, o nível de homologia seria de 100%.

[00289] Alternativamente, o programa de computador pode ser um programa de computador que compara as seqüências de nucleotídeo de uma seqüência de ácido nucléico como apresentadas na invenção, com uma ou mais seqüências de nucleotídeo de referência a fim de determinar se o código do ácido nucléico das seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, difere de uma seqüência de ácido nucléico de referência em uma ou mais posições. Opcionalmente um tal programa registra a extensão e identidade dos nucleotídeos inseridos, anulados ou substituídos com respeito à seqüência ou do polinucleotídeo de referência ou de uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta. Em uma modalidade, o programa de computador pode ser um programa que determina se uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, contêm um único polimorfismo de nucleotídeo (SNP) com respeito a uma seqüência de nucleotídeo de referência.

[00290] Conseqüentemente, outro aspecto da invenção é um método para determinar se uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, diferem em um ou mais nucleotídeos de uma seqüência de nucleotídeo de referência compreendendo as etapas de leitura do código de ácido nucléico e as seqüências de nucleotídeo de referência através do uso de um programa de computador que identifica as diferenças entre as seqüências de ácido nucléico e identificar as diferenças entre o código de ácido nucléico e a se109/151 qüência de nucleotídeo de referência com o programa de computador. Em algumas modalidades, o programa de computador é um programa que identifica polimorfismos de nucleotídeo únicos. O método pode ser implementado pelos sistemas de computador descritos acima e o método ilustrado na Figura 3. O método pode também ser realizado lendo-se pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 ou mais das seqüências de ácido nucléico como apresentadas nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, e as seqüências de nucleotídeo de referência através do uso do programa de computador e identificar as diferenças entre os códigos de ácido nucléico e as seqüências de nucleotídeo de referência com o programa de computador.

[00291] Em outras modalidades o sistema com base no computador pode ainda compreender um identificador para identificar características em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta.

[00292] Um identificador refere-se a um ou mais programas que identifica certas características em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta. Em uma modalidade, o identificador pode compreender um programa que identifica uma estrutura de leitura aberta em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta.

[00293] A figura 5 é um diagrama de fluxo ilustrando uma modalidade de um processo do identificador 300 para detectar a presença de

110/151 uma característica em uma seqüência. O processo 300 inicia em um estado inicial 302 e então se move para um estado 304 onde a primeira seqüência que será verificada quanto às características está armazenada em uma memória 115 no sistema de computador 100. O processo 300 então se move para um estado 306 onde um banco de dados das características de seqüência é aberto. Um tal banco de dados incluiria uma lista de cada dos atributos da característica junto com o nome da característica. Por exemplo, um nome da característica podería ser Códon de Iniciação e o atributo seria ATG. Outro exemplo seria o nome da característica Caixa TAATAA e o atributo da característica seria TAATAA. Um exemplo de um tal banco de dados é produzido pela Universidade de Wisconsin Genetics Computer Group (www.qcq.com). Alternativamente, as características podem ser motivos de polipeptídeos estruturais tal como alfa hélices, beta folhas, ou motivos de polipeptídeo funcional tal como sítios ativos enzimáticos, motivos de hélice-giro-hélice ou outros motivos conhecidos por aqueles versados na técnica.

[00294] Uma vez que o banco de dados das características é aberto no estado 306, o processo 300 se move para um estado 308 onde a primeira característica é lida no banco de dados. Uma comparação do atributo da primeira característica com a primeira seqüência é então feita em um estado 310. Uma determinação é então feita em um estado de decisão 316 se o atributo da característica foi constatado na primeira seqüência. Se o atributo foi constatado, então o processo 300 se move para um estado 318 onde o nome da característica constatada é exibido pelo usuário.

[00295] O processo 300 então se move para um estado de decisão 320 onde uma determinação é feita se as características em movimento existem no banco de dados. Se as características não mais existem, então o processo 300 termina em um estado final 324. Entretanto, se

111/151 mais características existem no banco de dados, então o processo 300 lê as características próximas da seqüência em um estado 326 e loops voltam para o estado 310 onde o atributo da próxima característica é comparado com a primeira seqüência.

[00296] Seria observado, que se os atributos de características não são constatados na primeira seqüência no estado de decisão 316, o processo 300 se move diretamente para o estado de decisão 320 a fim de determinar se mais características existem no banco de dados. [00297] Conseqüentemente, outro aspecto da invenção é um método para identificar uma característica em uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a esta, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, compreendendo ler os códigos de ácido nucléico ou códigos de polipeptídeo através do uso de um programa de computador que identifica as características nesta e identificar as características nos códigos de ácido nucléico com o programa de computador. Em uma modalidade, o programa de computador compreende um programa de computador que identifica estruturas de leitura aberta. O método pode ser realizado por leitura de uma única seqüência ou pelo menos 2, 5, 10, 15, 20, 25, 30 ou 40 das seqüências de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências de polipeptídeo como apresentadas nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, através do uso do programa de computador e identificar as características nos códigos de ácido nucléico ou códigos de polipeptídeo com o programa de computador.

[00298] Uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancial112/151 mente idênticas a esta ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a esta, podem ser armazenadas e manipuladas em diversos programas de processador de dados em uma variedade de formatos. Por exemplo, uma seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas, podem ser armazenadas como um texto em um campo de processamento de palavras, tal como MicrosoftWORD ou WORDPERFECT ou como um campo ASCII em uma variedade de famílias de programas de banco de dados àqueles versados na técnica, tal como DB2, SYBASE, ou ORACLE. Além disso, muitos bancos de dados e programas de computador podem ser empregados como algoritmos de comparação de seqüência, identificadores, ou fontes de seqüências de nucleotídeo de referência ou seqüências de lipeptídeo a serem comparadas com a seqüência de ácido nucléico como apresentada nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou uma seqüência de polipeptídeo como apresentada nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas. A seguinte lista é pretendida não limitar a invenção porém fornece orientação para programas e bancos de dados que são úteis com as seqüências de ácido nucléico como apresentadas nas seqüências de ácido nucléico do Grupo A, e seqüências substancialmente idênticas a estas, ou as seqüências de polipeptídeos como apresentadas nas seqüências de aminoácido do Grupo B, e seqüências substancialmente idênticas a estas.

[00299] Os programas e bancos de dados que podem ser empregados incluem, porém não estão limitados a: MacPattern (EMBL), Dis113/151 coveryBase (Molecular Applications Group), GeneMine (Molecular Applications Group), Look (Molecular Applications Group), MacLook (Molecular Applications Group), BLAST e BLAST2 (NCBI), BLASTN e BLASTX (Altschul e outros, J. Mol. Biol, 215: 403, 1990), FASTA (Pearson e Lipman, Proc. Natl. Acad. Sci. USA, 85: 2444, 1988), FASTDB (Brutlag e outros Comp. App. Biosci 6:237-245, 1990), Catalyst (Molecular Simulations Inc.), Catalyst/SHAPE (Molecular Simulations Inc.), Cerius 2.DBAaccess (Molecular Simulations Inc.), HypoGen (Molecular Simulations Inc.), Insight II, (Molecular Simulations Inc), Discover (Molecular Simulations Inc.), CHARMm (Molecular Simulations Inc.), Felix (Molecular Simulations Inc.), DelPhi, (Molecular Simulations Inc.), QuanteMM, (Molecular Simulations Inc.), Homology (Molecular Simulations Inc.), Modeler (Molecular Simulation Inc.), ISIS (Molecular Simulations Inc.), Quanta/Protein Design (Molecular Simulations Inc.), Weblab (Molecular Simulations Inc.), WebLab Diversity Explorer ((Molecular Simulations Inc.), Gene Explorer (Molecular Simulations Inc.), SeqFold (Molecular Simulation Inc.), o banco de dados MDL de Available Chemicals Directory, o banco de dados MDL de Drug Data Report, o banco de dados de Comprehensive Medicinal Chemistry, banco de dados Derwent's World Drug Index, o banco de dados BioByteMasterFile, o banco de dados Genbank, e o banco de dados Genseqn. Muitos outros programas e banco de dados seriam aparentes àqueles versados na técnica determinada na presente invenção.

[00300] Os motivos que podem ser detectados empregando os programas acima incluem zíperes de leucina de codificação de seqüência, motivos de hélice-giro-hélice, sítios de glicosilação, sítios de ubiquitinação, alfa hélices, e beta folhas, peptídeos de sinal codificando seqüência de sinal que conduz a secreção das proteínas codificadas, seqüências implicadas na regulação da transcrição tal como homeoboxes, extensões acídicas, sítios ativos enzimáticos, sítios de agluti114/151 nação de substrato, e sítios de clivagem enzimática.

[00301] A presente invenção explora a única propriedade catalítica das enzimas. Ao mesmo tempo em que o uso de biocatalisadores (isto é, enzimas brutas ou purificadas, células vivas e não-vivas) em transformações químicas normalmente requer a identificação de um biocatalisador que particular reage com um composto de partida específico, a presente invenção usa condições de reação e biocatalisadores selecionados que são específicos de grupos funcionais que estão presentes em muitos compostos de partida, tal como pequenas moléculas. Cada biocatalisador é específico para um grupo funcional, ou vários grupos funcionais relacionados, e pode reagir com muitos compostos de partida contendo este grupo funcional.

[00302] As reações biocatalíticas produzem uma população de derivados de um único composto de partida. Esses derivados podem ser submetidos a outra rodada de reações biocatalíticas para produzir uma segunda população de compostos derivados. Milhares de variações do composto ou pequena molécula original pode ser produzida com cada iteração de derivatização biocatalítica.

[00303] As enzimas reagem em sítios específicos de um composto de partida sem afetar o resto da molécula, um processo que é muito difícil de obter empregando métodos químicos tradicionais. Este grau elevado de especificidade biocatalítica fornece os meios para identificar um único composto ativo na biblioteca. A biblioteca é caracterizada pelas séries de reações biocatalíticas empregadas para produzir, uma então chamada história biossintética. A avaliação da biblioteca quanto às atividades biológicas e traçado da história biossintética identifica a seqüência de reação específica produzindo o composto ativo. A seqüência de reação é repetida e a estrutura do composto sintetizado é determinada. Este modo de identificação, diferente de outras sínteses e métodos de avaliação, não requer tecnologias de imobilização, e

115/151 compostos podem ser sintetizados e testados livres na solução empregando virtualmente qualquer tipo de ensaio de avaliação. É importante observar, que o grau elevado de especificidade de reações de enzima nos grupos funcionais considera o traçado das reações enzimáticas específicas que compõe a biblioteca biocataliticamente produzida.

[00304] Muitas das etapas do procedimento são realizadas empregando automação robótica possibilitando a execução de milhares de reações biocatalíticas e ensaios de avaliação por dia bem como garantindo um nível elevado de exatidão e reproducibilidade. Como um resultado, uma biblioteca de compostos derivados pode ser produzida em uma questão de semanas o que levaria anos para produzir empregando métodos químicos correntes.

[00305] Em uma modalidade particular, a invenção fornece um método para modificar pequenas moléculas, compreendendo contatar um polipeptídeo codificado com um polinucleotídeo ou fragmentos enzimaticamente ativos descrito aqui destes com uma pequena molécula para produzir uma molécula pequena modificada. Uma biblioteca de pequenas moléculas modificadas é testada para determinar se uma molécula pequena modificada está presente na biblioteca que exibe uma atividade desejada. Uma reação biocatalítica específica que produz a pequena molécula modificada da atividade desejada é identificada sistematicamente eliminando-se cada das reações biocatalíticas empregadas para produzir uma porção da biblioteca, e então testar as pequenas moléculas produzidas na porção da biblioteca quanto à presença ou ausência das pequenas moléculas modificadas com a atividade desejada. As reações biocatalíticas específicas que produzem a pequena molécula modificada da atividade desejada são opcionalmente repetidas. As reações biocatalíticas são conduzidas com um grupo de biocatalisadores que reage com as porções estruturais distintas encontra116/151 das na estrutura de uma pequena molécula, cada biocatalisador é específico para uma porção estrutural ou um grupo de porções estruturais relacionadas; e cada biocatalisador reage com muitas pequenas moléculas diferentes que contêm a porção estrutural distinta.

[00306] Em outra modalidade, as novas amilases alcalinas da invenção foram identificadas avaliando-se igualmente atividade em pH elevado e identificação de amilases com estabilidade em uma formulação de lavagem de louça automática (ADW). As comparações foram feitas com a amilase derivada de Bacillus lichenformis. Um estudo da dependência da hidrólise no pH mostrou que a maioria das amilases alcalinas da invenção tiveram um pH ótimo de 7 ou menos, a exceção é o clone B com um pH ótimo de aproximadamente 8. A amilase alcalina da invenção retém a atividade nas formulações de ADW, embora o clone B seja sensível a temperaturas elevadas. Preferivelmente, quando empregada em produtos de ADW, a amilase alcalina da invenção funcionará em um pH 10-11 e em 45-60°C.

[00307] A invenção será ainda descrita com referência aos seguintes exemplos; entretanto, é para ser entendido que a invenção não é limitada a tais exemplos.

Exemplos

Exemplo 1

Identificação e Caracterização da α-Amilase Termoestável [00308] O presente exemplo mostra a identificação de novas amilases de ácido. O programa de avaliação foi realizado sob condições de pH baixo ou neutro. As bibliotecas de DNA geradas de amostras de pH baixo foram objetivadas pela descoberta. Este esforço permitiu a descoberta de centenas de clones tendo a capacidade de degradar o amido. A seqüência de DNA e análise de bioinformática classificou muitos desses genes quando a amilase previamente não identificou.

Estudos Bioquímicos

117/151 [00309] A análise bioquímica dos clones genômicos de amilase mostrou que muitos tiveram pH ótimos menores do que pH 6. Os lisatos desses clones genômicos foram testados quanto à tolerância térmica por incubação em 70°C, 80°C, 90°C ou 100°C dur ante 10 minutos e medição da atividade residual em pH 4,5. Esses clones retendo >50% da atividade após o tratamento a quente em 80°C foram escolhidos para outra análise. Esses clones foram incubados em 90°C durante 10 minutos em pH 6,0 e 4,5 e testados quanto à atividade residual em pH 4,5 (Figura 1). Uma quantidade de clones reteve >40% de sua atividade seguindo este tratamento. Para propósito comparativo, a atividade residual de uma amilase envolvida, clone c, foi equivalente ao melhor das enzimas de segunda geração; a atividade específica do clone c foi maior.

[00310] A atividade térmica dos clones com atividade residual após o tratamento a quente em 90°C em pH 4,5 foi medida em temperatura ambiente, 70°C e 90°C em pH 4,5. A Tabela 1 mostra que a taxa de hidrólise de SEQ ID NO: 87 (amilase de B. stearothermophilus) e SEQ ID NO: 113 (amilase de B. licheniformis) diminui em temperaturas mais elevadas, ao mesmo tempo em que a taxa para SEQ ID NO: 125 contínua a aumentar quando a temperatura é aumentada para 70°C e somente reduz por volta de 50% em 90°C.

Avaliação do Candidato [00311] Com base na atividade residual em pH 4,5 após um tratamento a quente de 90°C, a atividade específica e ta xa de hidrólise de amido em 90°C quando comparada com amilase B. licheniformis, SEQ ID NO: 125 são comparadas com o clone c de amilase envolvido em um ensaio de liquefação de amido.

Tabela 1. Taxas de hidrólise de amido rotulado de tinta (relativo às unidades de fluorescência/s) de três clones genômicos em pH 4,5 e 3 diferentes temperaturas. ''amilase B. stearothermofilus, ² amilase B.

118/151 licheniformis.

	Temperatura ambiente	70°C	90°C
SEQ ID NO.: 87¹	1,25	1,43	0,33
SEQ ID NO.: 113²	3,3	1,9	0,39
SEQ ID NO.: 125	1,9	47	19

Exemplo 2

Amilase Termoestável Ativa em pH Alcalino [00312] O foco inicial deste exemplo foi a avaliação de um painel existente de amilase em uma formulação de lavagem de louça automática comercial (ADW). Este esforço identificou dois candidatos: um com atividade em pH elevado (SEQ ID NO: 115) e outro com estabilidade na formulação de ADW (SEQ ID NO: 207). Os estudos também incluem a identificação de amilase de pH elevado. Este esforço permitiu a descoberta de milhares de clones tendo a capacidade de degradar o amido. A seqüência de DNA e análise bioinformática classificaram muitos desses genes como amilase previamente não identificada. As estruturas de leitura aberta restantes foram neopululanase, amilopululanase e amilomaltase. Os estudos de aplicações e bioquímicos extensivos mostraram que 3 candidatos:(clone B, SEQ ID NO: 147 e SEQ ID NO: 139) tiveram atividade específica elevada em pH 10, porém infelizmente perderam a estabilidade na formulação de ADW. Em resumo, um painel de novas amilases cada tendo fenótipos desejáveis para a aplicação de ADW tem sido identificado.

Estudos Bioquímicos [00313] A análise bioquímica dos clones genômicos de amilase mostrou que muitos deles hidrolisaram o amido em pH 10 e 50°C. Para produzir quantidades suficientes de enzima para outro teste de aplicação e bioquímico, a estrutura de leitura aberta de amilase dos 40 clones genômicos mais ativos foi subclonada nos vetores de expressão. Este esforço inclui preparar 2 constructos para aqueles clones contendo uma seqüência de sinal putativo e estabelecer as condições

119/151 de desenvolvimento e indução para cada sub-clone (mais e menos o peptídeo de sinal de amilase).

[00314] A proteína ativa solúvel foi prosperamente purificada para homogeneidade de 34 subclones e atividade específica (unidades/mg, onde 1 unidade= pmol de açúcares de redução/min) foi medida em pH 8 e pH 10 (40°C e 50°C) empregando 2% de amido no t ampão. A amilase de Bacillus licheniformis (SEQ ID NO: 113) foi escolhida como a marca de referência para esses estudos. A atividade específica foi determinada removendo-se as amostras em vários pontos de tempo durante uma reação de 30 minutos e analisando quanto aos açúcares de redução. A taxa inicial foi determinada ajustando-se as curvas de progresso com uma equação linear. Uma comparação do candidato topo é mostrada na Tabela 2.

[00315] Um estudo para determinar a dependência da taxa de hidrólise em pH mostrou que somente o clone B é uma amilase alcalina com um pH ótimo de aproximadamente 8; todos os outros tiveram pH ótimo de 7 ou menos. Entretanto, é claro que o painel de comparações incluiu várias amilases de chumbo com atividade apreciável em pH 10 e 50°C.

Tabela 2: Atividades Específicas (U/mg de Enzima Pura) de Amilase

Enzima	Atividade Específica pH 8, 40°C	Atividade Específica pH 10, 50°C
Clone B	682	20
SEQ ID NO.: 139	430	33
SEQ ID NO.: 127	250	47
SEQ ID NO.: 137	230	3
SEQ ID NO.: 113 (B. licheniformis)	228	27
SEQ ID NO.: 205	163	4
Resíduo	<40

Estabilidade [00316] A estabilidade na presença da formulação de ADW foi me120/151 dida para cada dos 3 candidatos topo identificados através da análise bioquímica. O ponto de referência desses estudos foi uma enzima comercial na matriz de formulação. A figura 13 ilustra a atividade residual (medida em pH 8 e 50°C) após uma incubação de 30 mi nutos em 50°C na presença de vários componentes da formulação de ADW; pH 8, pH10.8, solução de ADW (com alvejamento) e solução de ADW (sem alvejamento). A atividade medida após a incubação é expressada como um percentual da atividade original. Os dados mostram que o clone B foi muito sensível à temperatura elevada, enquanto as outras amilases foram menos afetadas. Quando as enzimas foram incubadas em pH e temperatura elevados a enzima comercial SEQ ID NO: 139 tornou-se menos estável; entretanto, SEQ IDNO:127 reteve atividade total. O comportamento aparentemente anormal de SEQ ID NO: 127 após pH 10 de incubação versus pH 8 foi observado em experiências repetidas.

[00317] Quando a atividade da amilase do amido rotulado a seco é medida na matriz de ADW em 50°C, a amilase comercia l exibiu aproximadamente 5% de sua atividade em pH 8. No mesmo ensaio, clone B, SEQ ID NO: 139 e SEQ ID NO: 127 exibiram < 2% de sua atividade original medida em pH 8.

Testes de Lavagem [00318] Os testes de lavagem empregando slides revestidos por amido foram realizados para calibrar o desempenho de cada das enzimas purificadas em comparação à amilase comercial. Os slides revestidos por amido espaguete foram preparados de acordo com o protocolo. Dois slides revestidos por amido pré-pesados foram colocados no verso para reforçar em um tubo cônico de 50 ml e 25 ml da solução de ADW, ± enzima foram adicionados por tubo. Os tubos foram incubados durante 20 minutos em 50°C com rotação suave em um carrossel vertical. Seguindo o período de incubação, os slides foram imedia121/151 tamente enxaguados em água e novamente secados durante a noite. Todas experiências foram fundidas em duplicatas e a enzima comercial foi fundida como um controle positivo. Os resultados (Figura 6) dessas experiências são expressados como % líquido de amido removido, por exemplo % de amido removido em ADW com enzima, menos o % do amido removido em ADW sozinho.

Exemplo 3

Otimização de Gene [00319] As propriedades das enzimas podem ser melhoradas por várias estratégias de evolução, incluindo Gene Site Saturation Mutagenesis (GSSM^®) e Gene Reassembly^®, (Diversa Corporation, San Diego, CA). Tais técnicas serão aplicadas aos genes de amilase divulgados a fim de gerar um grupo de variantes que podem ser peneiradas para melhorar o desempenho.

[00320] As moléculas parenterais durante evolução serão uma ou todas das seguintes: SEQ ID NO: 113, SEQ ID NO: 139, SEQ ID NO: 115 e SEQ ID NO: 127 (uma forma truncada de SEQ ID NO: 127). [00321] Uma peneira de passagem elevada tem sido desenvolvida para taxar o desempenho das enzimas na presença de desempenho de ADW. O desenvolvimento de um HTS é de suprema importância em qualquer programa de evolução. O HTS é automatizado e tem mostrado resultados consistentes para a amilase parenteral (Figura 7). As amilases parenterais têm atividades mensuráveis na formulação de ADW, entretanto altamente reduzido relativo à atividade de pH 8. Mutantes de SEQ ID NO: 81 Gerados por GSSM ou por Mutação Aleatória [00322] GSSM [00323] Hospedeiro: E.coli, XL1-blue MRF' [00324] Vetor: pSE420 [00325] Origem: SEQ ID NO: 81

122/151 [00326] Os resíduos mutados incluídos #2 a #93, #118-159, #389 e #433.

Listas de Clones de Amilases Ativas Elevadas que têm sido Seqüenci-

ados
Nome	Alteração	Dados em E.coli
SEQ ID NO: 81/4L	Y4V, TAT para GTG	2x Aumentada em Atividade
SEQ ID NO: 81/4A	Y4A, TAT para GCG	2x Aumentada em Atividade
SEQ ID NO: 81/30V	T30V, ACC para GTT	2,5x Aumentada em Atividade
SEQ ID NO: 81/31Q	I31Q, ATC para TAG	1,5x Aumentada em Atividade
SEQ ID NO: 81-4V-30V	4V + 30V	3x Aumentada em Atividade
SEQ ID NO: 81-2C	C154A & C155A	1,2x Aumentada em Atividade
SEQ ID NO: 81-4C	C154A, C155A &	2x Aumentada em Atividade

C389A, C433A

Nota:

- Para SEQ ID NO: 81/31Q, o códon TAG deve codificar durante um códon parado, porém codificar para Gln em XL1-blue MRF' células por causa da mutação supE do hospedeiro.

Mutação Aleatório [00327] As mutações aleatórias foram introduzidas à SEQ ID NO: 81 por PCR propensa a erro como segue:

[00328] - Uso de dATP, dCTP, dGTP, ou dTTP não equilibrado na reação para introduzir mutações;

[00329] - Uso de concentração diferente de MnCl₂ na reação para introduzir mutações;

[00330] - Uso de combinação de dois métodos acima.

Confirmação de Novos Clones Ativos

123/151 [00331] - desenvolver os mutantes superiores da peneiração primária em tubos de Falcon de 15 mL e induzir com IPTG de 1mM;

[00332] - Re-Ensaio empregando amido RBB como substrato;

[00333] - Seqüência do Clone para confirmar a mutação.

Lista de Clones de Amilase Ativa Elevada que têm sido Seqüenciados

Nome Dados do Frasco Dados no de Mistura Fermentador

SEQ ID NO:	1,3-2x Aumentada	mesmo como
81-4C-UM1	em Atividade	SEQ ID NO: 81-4C
SEQ ID NO:	2x Aumentada	mesmo como
81-4C-UM2	em Atividade	SEQ ID NO: 81-4C

Exemplo 4

Caracterização de α-Amilases tendo Atividade em pH Alcalino [00334] As amilases da invenção tendo atividade de pH alcalino foram ainda caracterizadas. Os cinéticos em 2% de amido de pH 8 e 10 (40°C e 50°C) foram realizados.

Tabela 4:

Clones, Atividades Específicas	pH 8, 40°C	pH 10, 50°C
SEQ ID NO: 113 (B. Lichenoformis)	228 unidades/mg	27 unidades/mg
Clone B	682 unidades/mg	31 unidades/mg
SEQ ID NO: 139	430 unidades/mg	33 unidades/mg
SEQ ID NO: 127	540 unidades/mg	50 unidades/mg
Controle 0GLS (E.coli)	1,8 unidades/mg	0 unidades/mg

unidade de atividade é definida como liberação de 1 gmol reduzindo açucares por minuto.

Exemplo 5

Ensaio de Atividade de Amilase: BCA Reduzindo Ensaios Finais [00335] A atividade de amilase de clones de interesse foi determinada empregando a seguinte metodologia.

124/151 [00336] 1. Preparar 2 soluções de substratos, como segue:

[00337] a) 2% de amido solúvel (batata) solução de pH 8 dissolvendo-se 2gm de amido de batata em 100 ml de 100 mM de fosfato de sódio pH 8).

[00338] b) 2% de amido solúvel (batata) solução de pH 10 dissolvendo-se 2 gm de amido de batata em 100 ml de 100 mM de carbonato de sódio.

[00339] Aquecer ambas soluções em um banho de água em ebulição, ao mesmo tempo em que misturando, durante 30-40 minutos até que dissolva o amido.

[00340] 2. Preparar a solução A de 64 mg/ml de monohidrato de carbonato de sódio, 24 mg/ml de bicarbonato de sódio e 19,5 mg/ml de BCA (sal de dissódio de 4,4'-dicarbóxi-2,2'-biquinolina (Sigma Chemical cat # D-8284). Adicionado acima para dH2O.

[00341] 3. Preparar solução B combinando-se 1,24 mg/ml de pentahidrato de sulfato cúprico e 1,26 mg/ml de L-serina. Adicionar a mistura para dH2O.

[00342] 4. Preparar um reagente trabalhando de uma relação 1:1 de soluções A e B.

[00343] 5. Preparar uma solução padrão de maltose de 10 mM de

Maltose em dH2O, onde os 10mM de maltose são combinados em 2% de amido solúvel em pH desejado para uma concentração final de 0, 100, 200, 300, 400, 600 qM. A curva padrão será gerada para cada série de tempo exato. Desde que a curva é determinada adicionandose 10 pl dos padrões do reagente trabalhados trabalham até 0, 1, 2, 3, 4, 6 nmol de maltose.

[00344] 6. Adicionar alíquota de 1 ml de solução de substrato nos tubos microcentrifugados, equilibrar a temperatura desejada (5 minutos) em bloco aquecido ou banho de água aquecida. Adicionar 50 μ l de solução de enzima para dentro da tampa do tubo.

125/151 [00345] 7. Ao mesmo tempo em que a solução é misturada equilibrando 5 ml de ambas solução A & B. Adicionar alíquota de 100 ml para placa PCR de 96 cavidades. Placa de série no gelo.

[00346] 8. Após 5 minutos de equilíbrio de temperatura, fechar com as tampas nos tubos, inverter e vórtice 3 vezes. Adicionar imediatamente alíquota de 10ql na placa como t = 0 (zero tempo exato). Permitir a mistura de enzima no bloco aquecido e adicionar alíquota de 10ql em cada tempo exato desejado (por exemplo, 0, 5, 10, 15, 20, 30 minutos).

[00347] 9. Garantir que 12 cavidades sejam deixadas esvaziar (somente trabalhando reagente com alíquota) para a adição de 10ql de padrões, para a curva padrão.

[00348] 10. Quando todos os tempos exatos são coletados e padrões são adicionados, a placa coberta e aquecida a 80°C durante 35 minutos. Resfriar a placa no gelo durante 10 minutos. Adicionar 100 pl de H₂O para todas as cavidades. Misturar e adicionar alíquota de 10 pl na placa de 96 cavidades de fundo chato e ler a absorção em 560 nm. [00349] 11. Zerar cada tempo exato da amostra contra seu próprio t =0 (subtrair a média t = 0 valor A560 de outro valor A560 médio). Converter o A560 (experimental) para umole (Dividir A560(experimental) pelo declive da curva padrão (A560/umole). Gerar um declive de tempo exato e o umole (em umole/minuto), multiplicar por 100 (como o valor umole calcular somente para os 10ql empregados no ensaio, nenhuma quantidade feita no rxn de 1 ml). Para obter a atividade específica dividir o declive (em umole/minuto) pelo mg da proteína. Todos os pontos mostram ser feitos em um mínimo em duplicatas com os três melhores testes. Um exemplo de curva padrão é apresentado na Figura 11.

126/151

Tabela 5: Dados da Amostra

Clo- ne	Dilui- ção	Mi- nu- tos	A560-1	A560-2	A 560 Médio	Zeroed A 560	(A560 exp/std declive) umole
ENZ	50	0	0,1711	0,1736	0,17235	0	0,0000
		5	0,2104	0,2165	0,21345	0,0411	0,0005
		10	0,2492	0,2481	0,24865	0,0763	0,0009
		15	0,2984	0,2882	0,2933	0,12095	0,0014
		20	0,3355	0,3409	0,3382	0,16585	0,0020
		30	0,3942	0,3805	0,38735	0,215	0,0026
		40	0,4501	0,4412	0,44565	0,2733	0,0033

Atividade = 0,008646 umole/minuto

Concentração da Proteína Dividida (mg/ml) por qualquer diluição para obter mg empregado no ensaio.

Dividir o declive acima por mg empregado no ensaio para obter a atividade específica.

Atividade Específica = 24,93 umole/minuto/mg (Observe por exemplo, Dominic W.S. Wong. Sarah B. Batt, e George H. Robertson (2000). O microensaio de peneiramento rápido de atividade alfa amilase. J. Agric. Foood Chem. 48,4540-4543 e Jeffrey D. Fox e John F. Robyt, (1991). Miniaturização de três análises de carboidratos empregando um leitor de placa de microamostra. Anal. Biochem. 195, 93-96, aqui incorporadas por referência).

Exemplo 6

Peneiramento para Atividade de α-amilase [00350] A atividade de amilase de clones pode ser ensaiada por vários métodos conhecidos na técnica. O seguinte é a metodologia geral que foi empregada na presente invenção. As várias placas peneiradas, por placa, mostraram ser aproximadamente 10.000 pfu's. Para cada biblioteca de DNA: pelo menos 50.000 placas por biblioteca isolada e 200.000 placas por biblioteca não-isolada mostram ser peneira127/151 das dependendo do título pfu para o lisado amplificado de Expresso Zap λ.

Determinação do Título da Biblioteca Lambda [00351] 1) pL da biblioteca amplificada de Expresso Zap lambda armazenada adicionado a 6OOqL de células E.coli MRF' (OD₆₀o= 1,0). Para diluir tronco MRF', 10mM de MgSO₄ são empregados.

[00352] 2) Incubar em 37°C durante 15 minutos.

[00353] 3) Transferir suspensão de 5-6 ml de ágar de topo NZY em

50°C e suavemente misturar.

[00354] 4) Derramar imediatamente a solução de ágar em placa de veículo NZY (150 mm) amplo.

[00355] 5) Permitir ágar de topo para solidificar completamente (aproximadamente 30 minutos), em seguida inverter placas.

[00356] 6) Incubar a placa em 39°C durante 8-12 horas.

[00357] 7) Número de placas é aproximado. Título fago determinado para produzir 10.000 pfu/placa. Diluir uma alíquota de fago de Biblioteca com tampão SM se necessário.

Peneiramento de Substrato [00358] 1) Expresso Zap Lambda (50.000 pfu) de biblioteca amplificada adicionado a 600 pL de células MRF de E.coli (OD6OO = 1,0). Para bibliotecas não-desenvolvidas, preparar 4 tubos (5O.OOO pfu por tubo).

[OO359] 2) Incubar em 37°C durante 15 minutos.

[OO36O] 3) Ao mesmo tempo em que fago/suspensão de célula são incubados, 1,O mL de substrato de amido vermelho (1,2% peso/volume) é adicionado para 6,O mL de ágar de topo NZY em 5O°C e cuidadosamente misturado. Manter a solução em 5O°C até que necessite.

[OO361] 4) Transferir 1/5 (1O.OOO pfu) da suspensão de célula para substrato/solução de ágar de topo e misturar suavemente.

128/151 [00362] 5) Solução é imediatamente derramada em placas de veículo NZY (150 mm) amplo.

[00363] 6) Permitir o ágar de topo solidificar completamente (aproximadamente 30 minutos), em seguida inverter a placa.

[00364] 7) Repetir os procedimentos 4-64 vezes para o resto da suspensão de célula (1/5 de cada tempo de suspensão).

[00365] 8) Incubar as placas em 39°C durante 8-12 h oras.

[00366] 9) Placas observadas para zonas de clareamento (halos) em volta das placas.

[00367] 10) Placas com halos são nucleadas de ágar e transferidas para um microtubo estéril. Um furo amplo de 200qL de extremidade da pipeta bem trabalhado para remover (núcleo) o tampão de ágar contendo a placa desejada.

[00368] 11) Fagos são re-suspensos em 500qL de tampão SM. 20 ml de clorofórmio são adicionados para inibir qualquer outro desenvolvimento de célula.

[00369] 12) Suspensão de fago puro é incubada em temperatura ambiente durante 4 horas ou durante a noite antes da próxima etapa. Isolação de Clones Puros [00370] 1) 10qL da suspensão de fago re-suspensa são adicionados à 500qL de células MRF's de E.coli (OD600=1,0).

[00371] 2) Incubar em 37°C durante 15 minutos.

[00372] 3) Ao mesmo tempo em que fago/suspensão de célula está incubando, 1mL do substrato de amido vermelho (1,2% peso/volume) é adicionado a 6,0 mL de ágar de topo de NZY em 50°C e vagarosamente misturado. Manter a solução em 50°C se necess ário.

[00373] 4) Suspensão de célula é transferida ao substrato/ágar de topo e gentilmente misturada.

[00374] 5) Solução é imediatamente derramada em placa de veículo NZY (150 mm) amplo.

129/151 [00375] 6) Permitir o ágar de topo solidificar completamente (aproximadamente 30 minutos), em seguida inverter placa.

[00376] 7) Placa incubada em 39°C durante 8-12 hora s.

[00377] 8) Placa observada durante a zona de clareamento (halo) em cerca de uma placa única (clone puro). Se uma placa única não pode ser isolada, ajustar o título e a suspensão de fago chapeada novamente.

[00378] 9) Placa única com halo é nucleada de ágar e transferida a um microtubo estéril. Uma extremidade de pipeta de 200pL de furo grande bem trabalhado para remover (núcleo) o tampão ágar contendo a placa desejada. Para amplificar o título, o núcleo 5 de placas ativas únicas em um microtubo.

[00379] 10) Fagos são re-suspensos em 500pL de tampão SM.

20pL de clorofórmio são adicionados para inibir qualquer outro desenvolvimento de célula.

[00380] 11) Suspensão de fago puro é incubada em temperatura ambiente durante 4 horas ou durante a noite antes da próxima etapa. A suspensão de fago puro é depositada em -80°C adicionando-se DMSO na suspensão de fago (7% de volume/volume).

Excisão de Clone Puro [00381] 1) 100pL de suspensão de fago puro são adicionados a

200pL de células MRF, de E.coli (OD600 = 1,0). Para isto, 1,0pL de fago de auxiliar de ExAssist (>1 x 106 pfu/mL; Stratagene) é adicionado. Uso de tubo Falcon 2059 durante excisão.

[00382] 2) Suspensão é incubada em 37°C durante 15 minutos.

[00383] 3) 3,0 mL de 2x veículo YT são adicionados para suspensão de célula.

[00384] 4) Incubado em 30°C durante pelo menos 6 ho ras ou durante a noite ao mesmo tempo em que sacudindo.

[00385] 5) Tubo transferido em 70°C durante 20 minu tos. A suspen130/151 são de fagomídeo pode ser armazenada em 4°C durante 1 a 2 meses. [00386] 6) 100 pL de suspensão de fagomídeo transferidos para um microtubo contendo 200 pL de células Exp 505 de E.coli (OD600=1,0). [00387] 7) Suspensão incubada em 37°C durante 15 mi nutos.

[00388] 8) 300 pL de SOB são adicionados na suspensão.

[00389] 9) Suspensão é incubada em 37°C durante 30 a 45 minutos.

[00390] 10) 100pL de suspensão são transferidos a uma placa de veículo LB (90 mm) pequeno contendo Kanamicina (veículo LB com Kanamicina 50pg/mL) para bibliotecas de DNA de Expresso Zap ou Ampicilina (veículo LB com Kanamicina 100 pg/ml) para bibliotecas de DNA II Zap.

[00391] 11) O resto da suspensão é transferido para outra placa de veículo LB pequeno.

[00392] 12) Uso de contas de vidro estéril para distribuir uniformemente a suspensão na placa.

[00393] 13) Placas são incubadas em 30°C durante 12 a 24 horas.

[00394] 14) Placa observada durante colônias.

[00395] 15) Colônia única inoculada em veículo líquido LB contendo antibiótico adequado e incubada em 30°C durante 12 a 24 horas. [00396] 16) Estoque de glicerol pode ser preparado adicionando-se

80% de glicerol na cultura de líquido (15% em volume/volume) e armazenado em -80°C.

Verificação da Atividade [00397] 1) 50pL de cultura de líquido são transferidos para um microtubo. Adicionar 500 pL de 8% de pH 7 de Azul Amilopectina no mesmo tubo. Preparar 2 tubos para cada clone.

[00398] 2) Atividade é testada em 50°C durante 3 ho ras e durante a noite. Uso de tampão de pH 7 como controle.

[00399] 3) Resfriar o espécime teste em banho de água gelada du131/151 rante 5 minutos.

[00400] 4) Adicionar 750qL de Etanol e misturar vagarosamente.

[00401] 5) Centrifugar em 13000 rpm (16000 g's ) durante 5 minutos.

[00402] 6) Medir OD do sobrenadante em 595 nm.

Análise RFLP [00403] 1) 1,0 mL de cultura de líquido é transferido para um microtubo estéril.

[00404] 2) Centrifugar em 13200 rpm (16000 g's) durante 1 minuto.

[00405] 3) Descartar o sobrenadante. Adicionar outro 1,0 mL de cultura de líquido no mesmo microtubo estéril.

[00406] 4) Centrifugar em 13200 rpm (16000 g's) durante 1 minuto.

[00407] 5) Descartar o sobrenadante.

[00408] 6) Seguir o protocolo de mini kit de execução QIAprep para isolação do plasmídeo.

[00409] 7) Checar a concentração de DNA empregando BioFotômetro.

[00410] 8) Usar Sac I e Kpn I durante primeira dupla digestão. Incubado em 37°C durante 1 hora.

[00411] 9) Empregar Pst I e XhoI durante segunda dupla digestão.

Incubado em 37°C durante 1 hora.

[00412] 10) Adicionar carregamento seco na amostra digerida.

[00413] 11) Fundir a amostra digerida em um gel de agarose de

1,0% durante 1-1,5 hora em 120 volts.

[00414] 12) Visão do gel com formador de imagem do gel. Todos os clones com um padrão de digestão diferente serão enviados para análise de seqüência.

Exemplo 7

Ensaio para Amilase

Preparação de Culturas de Hospedeiro

132/151 [00415] 1. Iniciar durante a noite a cultura de células hospedeiras

MRF, de XL1-Azul. Empregar uma colônia única de uma placa de listas para inocular 10 mL de LB suplementado com 20 pg/mL de tetraciclina. Desenvolver durante a noite a cultura agitando em 37°C durante pelo menos 16 horas.

[00416] 2. Utilizar técnica asséptica, inocular uma cultura de dia LB_Tet de 100 ml fresco com hospedeiro MRF, de XL1-Azul da cultura LB_Tetdurante a noite.

[00417] 3. Desenvolver em um misturador 37°C até qu e OD alcance

0,75-1,0.

[00418] 4. Células hospedeiras péletes em 1000 x g durante 10 minutos e gentilmente ressuspensas em 10mM de MgSO4 em OD5. [00419] 5. Diluir uma pequena quantidade de células hospedeiras para OD1 para uso em titulação e replicação de culturas em placas. [00420] 6. Preparações de hospedeiro podem ser empregadas durante até 1 semana quando armazenado no gelo ou em 4°C. Observações [00421] - Para o tempo de desenvolvimento curto durante o dia da cultura, usar X na concentração Tet usual em LB (¹/2 X = 10 pg/mL), ou omitir o antibiótico totalmente.

[00422] - Não usar NZY quando selecionando com Tetraciclina. A concentração do Mg++ elevado no veículo NZY rende Tet inativo. Bibliotecas de Lambda de Titulação [00423] 7. Colocar três tubos de microfuga estéril em uma prateleira.

[00424] 8. Adicionar uma alíquota de 995 pL de células hospedeiras preparadas em um tubo e 45 pL em células hospedeiras OD1 preparadas em cada dos dois tubos restantes.

[00425] 9. Adicionar 5 pL de biblioteca lambda ao tubo contendo células hospedeiras de 995 pL e misturar por vórtice. Isto resulta em

133/151 um fator de diluição de 200.

[00426] 10. Preparar 1/2.000 e 1/20.000 diluições adicionando-se consecutivamente 5 μL de prévia diluição aos dois tubos restantes contendo 45 μL de células hospedeiras preparadas. A mistura por vórtice após cada diluição foi feita.

[00427] 11. Permitir fago para absorver o hospedeiro por incubação em 37°C durante 15 minutos.

[00428] 12. Por enquanto, a pipeta de 100 μL de células hospedeiras OD1 preparadas para cada dos três tubos 2059 Falcon.

[00429] 13. Adicionar 5μL de cada diluição para um tubo 2059 separado contendo células hospedeiras.

[00430] 14. Cada placa adicionando-se 3 mL de ágar de topo a cada tubo e derramar rapidamente sobre placas NZY de 90 mm. Garantir uma distribuição ainda macia antes de endurecer o ágar de topo. [00431] 15. Inverter as placas e incubar em 37°C du rante a noite.

[00432] 16. Placas de contagem e calcular o título do estoque da biblioteca (as placas formando unidades (pfu) por μL).

Peneiramento de Microtítulo Lambda para Amilase

Preparação [00433] 1. Preparar uma quantidade suficiente de cultura de hospedeiro MRF, de Azul-XL1, como descrito acima, para a quantidade da peneiração planejada. Uma cultura de 100 mL é freqüentemente suficiente para biblioteca de 2-3 de peneiração.

[00434] 2. Várias garrafas de autoclave compatíveis com o dispensor QFill2. Essas são as garrafas Corning de boca larga, 250 mL contendo um anel de selo em volta da borda.

[00435] 3. Verificar se são as quantidades suficientes de placas, ágar de topo, amido BODIPY, solução de amido vermelho, etc. disponível para a peneira.

[00436] 4. Tabela da Execução do robô do dia 2 com um represen134/151 tativo de automação.

Dia 1 [00437] 1. Rotular as placas de 1536 cavidades (preta) com peneira de biblioteca e número de placa. Engrossadores de tubo Tough-Tags®, intervindo no modo de meia largura, são ideais para placas de 1536 cavidades rotuladas.

[00438] 2. Calcular volumes de biblioteca, células hospedeiras e veículo NZY necessários para a peneiração. Isto é feito facilmente com uma extensão da folha Excel.

[00439] 3. Combinar os volumes calculados da biblioteca lambda e células hospedeiras OD5 na garrafa Corning de boca larga de 250 mL estéril (contendo um anel de seleção).

[00440] 4. Permitir absorção para ocorrer em 37°C d urante 15 minutos.

[00441] 5. Adicionar o volume calculado do veículo NZY e misturar bem. Isto é referido como a suspensão de veículo de fago de célula. [00442] 6. Desempenhar um título concomitante combinando-se 50 pL de suspensão de veículo de fago de célula com 250pL de células hospedeiras OD1 em um tubo 2059 Falcon, em seguida revestindo com 9mL de ágar de topo sob uma placa NZY de 150 mm. A placa título concomitante incubada em 37°C durante a noite.

[00443] 7. Carregar o dispensor com o restante da suspensão e disposição de cada placa de 1536 cavidades rotuladas em 4 pL por cavidade. Se o dispensor permite bolhas de ar em algumas cavidades, elas podem ser removidas centrifugando-se as placas em 200 x g durante 1 minuto.

[00444] 8. Adicionar 0,5 pL de fago de controle positivo para cavidade de posição AD46 de pelo menos duas das placas de ensaio. Uso de um clone de lambda de amilase positiva forte para este propósito. As versões lambda de SEQ ID NO: 113 ou SEQ ID NO: 199 são boas

135/151 escolhas de controles positivos.

[00445] 9. Placas de ensaio incubadas em 37°C durante a noite em um incubador umidificado (> 95%).

Dia 2 [00446] 1. Contar o pfu na placa título concomitante e determinar a densidade da semente média por cavidade (em pfu por cavidade). [00447] 2. Replicar culturas em placas de pelo menos 2 placas de cada peneira de biblioteca (preferivelmente os controles positivos contendo 2) como segue:

[00448] a) Preparar placas de gramado de hospedeiro 2 para atuar como uma superfície em que a cultura foi replicada:

[00449] combinar 250 μL de células hospedeiras OD1 com 2 ml de 2% de amido vermelho e placas com 9 ml de ágar de topo com placas NZY de 150 mm. O controle de cada placa de tanto nível quanto possível como o ágar de topo solidifica a fim de produzir uma coloração uniforme vermelha através das placas.

[00450] b) empregar uma replicação de culturas em placas de 1536 posições esterilizada por chama duas vezes, reproduzir pelo menos 2 das placas de peneiramento nas placas de gramado do hospedeiro. [00451] c) Colocar as placas de recipiente com culturas replicadas em uma tampa de fluxo laminar com as tampas durante cerca de 1530 minutos (para abertura de excesso de umidade).

[00452] d) Substituir as tampas e incubado invertido em 37°C durante a noite.

[00453] 3. Preparar o tampão de substrato de amido 2x BODIPY como segue:

[00454] a) Calcular o volume total de 2x o substrato da solução tampão necessários para todas as placas de peneiração em 4μL por cavidade (incluindo qualquer volume de espaço morto extra requerido pelo dispensador) e medir esta quantidade de 100 mM de CAPS de pH

136/151

10,4 em um veículo apropriado para o dispensador empregado.

[00455] b) Corrigir o bastante 0,5 mg de tubos de amido BODIPY para produzir o volume requerido de 2x o substrato tampão (calculado na etapa a) acima em uma concentração final de 20-30 qg/mL.

[00456] c) Dissolver cada 0,5mg de tubo em 50qL de DMSO em temperatura ambiente, protegido da luz, com vórtice freqüente. Isto torna maior do que 15 minutos; alguns grupos de produção de amido BODIPY dissolvem melhor do que outros.

[00457] d) Adicionar 50qL de tampão CAPS de 100mM pH 10,4 a cada tubo e misturar por vórtice.

[00458] e) Agrupar os conteúdos de todos os tubos e remover qualquer agregado não dissolvido centrifugando-se durante 1 minuto em velocidade máxima em uma microfuga.

[00459] f) Adicionar o sobrenadante do resto do tampão CAPS de 100mM medido na etapa a) acima.

[00460] g) Proteger o 2x tampão de substrato da luz embrulhando-se em lâmina.

[00461] 4. Tomar as placas e tampão de substrato no ambiente de automatização e programar o robô com os seguintes parâmetros: [00462] a) dispensar 4qL do tampão de substrato por cavidade. [00463] b) primeira leitura em 1 hora pós-substrato, segunda leitura em 9 horas, e terceira leitura em 17 horas; com 37°C de incubação entre as leituras.

[00464] c) filtro de excitação: 485 nm; filtro de emissão: 535 nm. [00465] d) série de ganho Spectrafluor em 70, ou o ganho ótimo para a batelada de 2x o tampão de substrato preparado.

[00466] e) garantir que o incubador empregado protegerá as placas de ensaio da luz.

Dia 3 [00467] 1. Checar as placas com culturas replicadas para clareado137/151 res na grama de bactéria em todas as posições correspondendo às cavidades na placa de ensaio apropriada. Checar também para clareadores no amido vermelho em qualquer das posições fixas. Se as placas contendo controles positivos fossem empregadas para replicação de culturas em placa, deveria ser capaz de observar uma zona de clareamento ampla no fundamento do vermelho. Ser cuidadoso dos contaminantes que também forma zonas de clareamento no amido vermelho (observe observação Contaminants That Form Clearing Zones in Red Starch, no final do Exemplo 7).

[00468] 2. Identificar a observação putativa do registro dos dados produzidos pelo computador robô. O programa KANAL produzido por Engenheiros simplifica a análise de dados. Como uma norma de manuseio, uma observação putativa é caracterizada como uma cavidade tendo intensidade de sinal enxaguando pelo menos 1,5 dobra durante o fundamento.

[00469] 3. Para cada putativo, remover 2μL da cavidade e adicionar a um tubo contendo 500μL de tampão SM e 50μL de CHCl₃. O vórtice para misturar e depósito em 4°C. Esta solução será referida mais adiante como o tronco 4e-3. As placas de peneiração original devem ser depositadas em 4°C, protegidas da luz, pelo menos até que as fugas sejam concluídas.

[00470] Isto é o método recomendado de quebra da observação putativa. É um ensaio de fase líquida que alivia na confirmação da atividade do amido BODIPY. Alternativamente, comparação putativa pode ser colocada diretamente nas placas de fase sólida contendo amido vermelho tal que 2.000-3.000 pfu por comparação são examinados para zonas de clareamento. Entretanto, a incapacidade de observar as zonas de clareamento no amido vermelho não é necessariamente uma indicação que uma comparação putativa foi um positivo falso. Então necessitará ser ensaiado empregando o formato em que foi original138/151 mente identificado (isto é, fase líquida empregando amido BODIPY como substrato). Além disso, muitos positivos fracos são mais facilmente identificados empregando o método detalhado abaixo.

Dia 1 [00471] 1. Em um tubo cônico de 50 ml, estéril combinar 0,5 mL de células hospedeiras OD5 com 45,5 ml de NZY. Isto será referido a uma suspensão de veículo de hospedeiro.

[00472] 2. Para cada comparação putativa ser analisada, alíquota de 1 mL de suspensão de veículo de hospedeiro em cada dos três tubos de microfuga estéril.

[00473] 3. Série de pipetman de 12 canais no modo de multidispensa com um tamanho de alíquota de 20 pL e um número de alíquota de 2x. Monta-se o pipetman com uma série clara de extremidades estéreis.

[00474] 4. Derramar cerca de 1 ml de suspensão de veículo de hospedeiro em uma nova bacia de solução estéril e carregar o pipetman de multicanal.

[00475] 5. Dispensar 20gL por cavidade na última fila (fila P) de uma placa de 384 cavidades pretas (12 canais x2 = 24 cavidades). Esta fila será empregada para o controle.

[00476] 6. Expelir o líquido restante das extremidades comovendose as extremidades contra a superfície da bacia e pressionando o botão RESET no pipetman. Derrubar o pipetman para baixo de um modo para prevenir a contaminação das extremidades. Não existe necessidade de mudar as extremidades neste ponto.

[00477] 7. Derramar o restante do fluido na bacia em um recipiente de refugo (tipo um becher) tomando cuidado para evitar a contaminação de borrifos para trás.

[00478] 8. Para a primeira putativa ser analisada, tomar 111gL de tronco 4e-3 (observe dia 2 em Lambda Microtiter Screening for Amyla139/151 ses) e adicionar ao primeiro em uma série de três tubos contendo 1mL de suspensão de veículo de hospedeiro (etapa 2). Vórtex para misturar. Isto é diluição A.

[00479] 9. Tomar 111 pL de Diluição A e adicionar ao próximo tubo da série. Vórtex para misturar. Isto é diluição B.

[00480] 10. Tomar 111 pL de Diluição B e adicionar ao último tubo da série. Vórtex para misturar. Isto é diluição C. Você deve agora ter três diluições de fago, onde as concentrações de cada difere por um fator de 10.

[00481] 11. Derramar os conteúdos de Diluição C (o mais diluído das 3 amostras) na solução da bacia e carregar o pipetman de multicanal.

[00482] 12. Dispensar 20 pL por cavidade na primeira fila da placa de 384 cavidades (12 canais x 2 = 24 cavidades).

[00483] 13. Expelir o líquido restante nas extremidades comovendose as extremidades contra a superfície da bacia e pressionando-se o botão RESET no pipetman. Derrubar o pipetman para baixo de um modo para prevenir a contaminação das extremidades. Não existe a necessidade de mudar as extremidades neste ponto.

[00484] 14. Esvaziar a bacia como descrito acima.

[00485] 15. Derramar os conteúdos da Diluição B na mesma bacia e carregar o pipetman de multicanal.

[00486] 16. Dispensar 20qL por cavidade na segunda fila das placas de 384 cavidades.

[00487] 17. Realizar as etapas 13-16 similarmente para dispensar a

Diluição A na terceira fila da placa.

[00488] 18. Após todas três diluições terem sido revestidas nas terceiras 3 filas das placas, descartar todas as extremidades e a bacia de solução no recipiente de refugo bioperigoso.

[00489] 19. Montar o pipetman com uma série clara de extremida140/151 des estéreis e aberta uma nova bacia de solução estéril.

[00490] 20. Repetir as etapas 8-19 para cada comparação putativa restante, empregando filas restantes sobre a placa aciona para fila O. Cinco comparações putativas podem ser analisadas em uma placa de 384 cavidades, com a última fileira (fila P) exceto para os controles. [00491] 21. Adicionar 0,5 pL de cada controle para uma cavidade separada. Empregar pelo menos 2-3 controles separados, preferivelmente revestindo uma faixa de atividade.

[00492] 22. Placas de ensaio incubadas em 37°C durante a noite em um incubador umidificado (> 95%).

Dia 2 [00493] 1. Replicar culturas de todas as placas breakouf (placas nas quais uma única colônia é retirada de uma placa contendo multiplas colônias e colocada em uma nova placa) em um gramado de hospedeiro com amido vermelho empregando o mesmo método descrito para Dia 2 em Lambda Microtiter Screening for Amylases, exceto que uma replicação de culturas em placas de posição 384 é empregada.

[00494] 2. Preparar o tampão de substrato de amido 2x BODIPY como segue:

[00495] a) Calcular o volume total de 2x de solução de tampão de substrato necessários para todas as placas breakout em 20qL por cavidade (incluindo qualquer volume de espaço morto extra requerido pelo dispensador) e medindo esta quantidade de 100mM de CAPS pH

10,4 em um recipiente apropriado para o dispensador empregado. [00496] b) Corrigir o suficiente 0,5 mg de tubos de amido BODIPY para produzir o volume requerido de 2x o tampão de substrato [calculado na etapa a) acima] em uma concentração final de 20-30 qg/ml. [00497] c) Dissolver cada 0,5mg de tubo em 50qL de DMSO em temperatura ambiente, protegido da luz, com vórtice freqüente. Isto

141/151 toma mais do que 15 minutos; alguns grupos de produção de amido BODIPY dissolvem melhor do que outros.

[00498] d) Adicionar 50qL de tampão de 100 mM de CAPS pH

10,4 a cada tubo e misturar por vórtice.

[00499] e) Derramar os conteúdos de todos os tubos e remover qualquer agregado não dissolvido centrifugando-se durante 1 minuto em velocidade máxima em um microfugo.

[00500] f) Adicionar o sobrenadante do resto do tampão CAPS de 100mM medido na etapa a) acima.

[00501] g) Proteger o tampão de substrato 2x da luz embrulhandose na lâmina.

[00502] 3. Dispensar 20qL por cavidade em todas as placas de breakour.

[00503] 4. Embrulhar todas as placas em lâmina de alumínio e incubado em temperatura ambiente durante 2-6 horas.

[00504] 5. Ler cada placa no Espectrafluor com as seguintes montagens:

[00505] a) leitura fluorescente (filtro de excitação: 485 nm, filtro de emissão: 535 nm) [00506] b) definição da placa: 384 cavidades pretas [00507] c) leitura do topo [00508] d) ganho ótimo [00509] e) número de flashes:3 [00510] 6. Na extensão da folha Excel resultante, charT cada 3 filas putativa S' em um gráfico separado e checar durante atividade. Garantir que os controles positivos produzam sinais durante o fundamento.

[00511] 7. Para cada putativa que aparece tem um sinal real entre as cavidades, colhetar uma amostra de uma cavidade positiva como segue:

142/151 [00512] a) Selecionar uma cavidade positiva de uma fila representante da diluição inicial mais elevada.

[00513] b) Transferir 2qL daquela cavidade em um tubo contendo 500qL de SM e 50qL de CHCl₃. Isto é referido como um tronco breakout'.

[00514] c) Depósito em 4°C.

[00515] 8. Empregar métodos previamente descritos, placas cerca de 10qL de cada tronco breakout' em placas de NZY de 150 mm empregando amido vermelho. O objetivo é obter várias placas de cavidades separadas (pelo menos 20) das quais os núcleos isolados.

Dia 3 [00516] 1. Checar as placas com culturas replicadas para uma incidência aceitável de clareadores no gramado de bactérias correspondendo às cavidades na placa de ensaio associada. Também checar durante clareamento no amido vermelho nos controles positivos e em qualquer putativa testada. Ser cuidadoso de contaminantes que também forma zonas de clareamento em amido vermelho (observe abaixo).

[00517] 2. Das placas de fase sólida contendo diluições de troncos breakout¹, vários núcleos de placas isoladas, cada com 500qL de SM com 50qL de CHCl₃. Isto refere-se como o tronco isolado.

[00518] 3. Os troncos isolados podem então ser individualmente testados no amido BODIPY empregando métodos descritos acima. Esta etapa pode ser omitida se a placa que foi nucleada na etapa 2 produziu uma zona de clareamento no fundamento do amido vermelho. Os troncos isolados foram então individualmente testados no amido BODIPY empregando métodos descritos acima. Entretanto, esta etapa pode ser omitida se a placa que foi nucleada na etapa 2 produziu uma zona de clareamento no fundamento do amido vermelho. Excisão

143/151

Dia 1 [00519] 1. Em um tubo Falcon 2059, misturar 200 pL de hospedeiro MRF' de XL1-Azul OD1, 100qL de tronco isolado Lambda e 1pL de tronco de fago de ExAssist.

[00520] 2. Incubar em 37°C o sacudidor durante 15 m inutos.

3. Adicionar 3 mL do veículo NZY.

4. Incubar em 30°C o misturador durante a n oite.

[00521] [00522] Dia 2 [00523] 1. Aquecer o tubo de excisão a 70°C durante 20 minutos.

[00524] 2. Centrifugar 1000 x g durante 10 minutos.

[00525] 3. Em um tubo Falcon 2059, combinar o sobrenadante de

50qL com 200qL de hospedeiro EXP505 OD1.

[00526] 4. Incubar em misturador a 37°C durante 15 minutos.

[00527] 5. Adicionar 300qL de veículo SOB.

[00528] 6. Incubar em misturador a 37°C durante 30- 45 minutos.

[00529] 7. Placas de 50qL na placa de LB_kan50 amplo empregando contas de vidro estéril. Se as placas são secas, veículo SOB extra pode ser adicionado para desembolsar auxílio às células.

[00530] 8. Placa incubada em 30°C durante pelo meno s 24 horas.

[00531] 9. Cultivar um isolado para seqüência e/ou RFLP.

[00532] Desenvolver em 30°C de número de cópias de plasmídeo reduzido e é empregado para atenuar a toxicidade aparente de alguns clones de amilase.

Contaminantes que Formam Zonas de Clareamento em Amido Vermelho [00533] Quando empregando amido vermelho no veículo sólido para fago de ensaio para atividade de amilase, é comum observar unidades de formação de colônia (cfu) contaminantes que formam zonas de clareamento no amido vermelho. Para placas com culturas replicadas, é importante distinguir clones de fago de amilase positiva desses

144/151 contaminantes quando eles alinham com uma posição de cavidade particular. A fonte dos micróbios contaminantes é presumivelmente os 2% de solução de tronco de amido vermelho, que não pode ser esterilizado por autoclavagem ou por filtração após preparação. É pensamento que eles são organismos oportunistas que sobrevivem metabolizando-se o amido vermelho. A fim de reduzir esses contaminantes, as técnicas úteis estéreis quando fazendo 2% de soluções de amido vermelho e depósito ou em 4°C ou no gelo.

Exemplo 8

Análise Bioinformática [00534] Uma análise de bioinformática inicial foi feita com as seqüências de α-amilase hipertermofílica conhecidas. A figura 14a mostra um alinhamento de algumas seqüências das quais tem sido depositadas no banco de dados NCBI. Esta análise revelou o potencial para iniciadores degenerados designados à PCR o gene menos inteiro sua seqüência de sinal (observe Figura 14a), produzindo potencialmente nova alfa-amilase de extensão total de uma biblioteca.

[00535] As seguintes bibliotecas foram peneiradas por PCR de DNA genômico:

Tabela 6:

Biblioteca N°	Nome	Positivo PCR	Subclonado
5	A.lithotropicus	Não
13	Pyrodictium occultum	Não
17	Pyrodictium TAG11	Não	Sim
113	Deep sea inrichment	Sim	Sim
170	Deep sea enrichment	Sim	Sim
198	Archaeglobus	Não
206	Acidianus sp	Não
453	Mixed iceland enrich	Não
455	Mixed iceland enrich	Sim	Sim
[00536] A	Figura 14b mostra um alinhamento da seqüência identifi-

145/151 cada e a tabela abaixo lista suas identidades de percentuais relativas. Tabela 7: % da Identidade da Seqüência do Nucleotídeo

	SEQ ID NO.: 81	Piro	Piro 2	Ther me	Ther me 2	SEQ ID NO.: 75	SEQ ID NO.: 77	SEQ ID NO.: 83	SEQ ID NO.: 85	SEQ ID NO.: 79
SEQ ID NO.: 81	100	91,7	75,1	82,1	80,1	82,5	82,6	82,1	82,6	83
Piro		100	74,8	82,5	80,5	82	82,2	82,9	82,8	84
Piro 2			100	71,5	71,1	74	74,2	77	77,1	73
Therme				100	81,7	83,5	83,8	82,8	83,2	83,8
Therme 2					100	88,9	88,8	84,1	84,7	84
SEQ ID NO.: 75						100	98,3	84,6	85,2	85,5
SEQ ID NO.: 77							100	84,8	84,9	85,4
SEQ ID NO.: 83								100	96	83,3
SEQ ID NO.: 85									100	83
SEQ ID NO.: 79										100
Clone A
[00537] A id	entidade de aminoácido varia de cerca de 85-9!	3% de

identidade. Conseqüentemente, essas seqüências são úteis na mistura de genes como descrito aqui.

[00538] A figura 14c mostra o alinhamento do ácido nucléico das seqüências de polipeptídeo correspondentes acima. A expressão dessas amilases no pSE420 do vetor de expressor e XL1-Azul de linhagem de células hospedeiras mostra 1703 e 1706 tendo atividade de amilase.

Exemplo 9

Caracterização da Biblioteca de alfa-Amilase GP-1 63 de pH ótimo e

Determinação de Atividade Específica [00539] Em experiências iniciais, a SEQ ID NO: 81 de Thermococcus mostrou que foi eficaz em ambas liquefação de amido para moagem a úmido de milho e descolando para tecidos. Esta enzima tem um

146/151 pH ótimo de 4,5 a 5,0. Neste pH inferior, é possível usar pouco ou nenhum cálcio que diminui todos os custos de operação e menos formação de subproduto. Além disso, neste pH inferior, existe química reduzida usada e íon de permuta de carga. O padrão de indústria de amilase B.licheniformis é subótimo em ambos termoestabilidade e pH ótimo. A amilase 63GP-1 tem uma atividade específica de aplicação mais elevada comparada à amilase B.licheniformis e portanto muito menos enzima é requerida para hidrolisar uma tonelada de amido (tanto como enzima de menos 20 dobras pode ser empregada).

[00540] O pH ótimo para a hidrólise de amido foi determinado reagindo-se 50qL do GP-1, 0,35 U/ml, com uns 100 ml de 1% de solução de amido solúvel (0,0175 U/g de amido) durante 30 minutos em 95°C. As extremidades de redução geradas na solução de amido liquefeito foram medidas pelo ensaio de neocupronina, descrito aqui. O percentual de hidrólise de amido de milho foi determinado medindo-se várias extremidades de redução de açucares produzidas com o ensaio de neocupronina. Setenta gramas de solução tampão (pH4-7) foram pesados e 100ppm de cálcio foram adicionadas. Trinta gramas de amido de milho foram misturados na solução tampão para formar uma pasta fluida de amido. A enzima foi adicionada e os recipientes selados e incubados em 95°C durante 30 minutos com uma taxa d e aquecimento inicial de seis graus C por minuto. Uma amostra de 1ml foi extraída de becheres de reação e analisadas por ensaio de neocupronina. O ótimo para GP-1 foi entre pH 4,5 e 5, ao mesmo tempo que a amilase comercial B.licheniformis realizou otimamente em cerca de pH 6,0. Exemplo 10

Reagrupamento da Ligação de Amilase [00541] Nove fragmentos (cada cerca de 150 bp) foram amplificados de cada dos clones de origem SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79, revestindo a estrutura de leitura aberta total. Os inici147/151 adores são fornecidos na Tabela 8. Tabela 8

GAACACTAGTAGGAGGTAACTTATGGCAAAGTATTCCGAGCTCGAAG

GAACGGTCTCATTCCGCCAGCCAGCAAGGGGATGAGCGG

GAACCGTCTCAAAACACGGCCCATGCCTACGGC

GAACGTCTCACCTCGACTTCCACCCCAACGAGGTCAAG

GAACGTCTCAGGCGCTTTGACTACGTGAAGGGC

GAACGGTCTCAACAAGATGGATGAGGCCTTTG

GAACCGTCTCACGATATAATCTGGAACAAGTACCTTGC

GAACCGTCTCAGAAGCACGAGCATAGTTTACTACG

GAACCGTCTCAAAGGTGGGTTTATGTGCCG

GAACGTCTCAGGAATCCAAATGGCGGATATTCCCGC

GAACGGTCTCAGTTTATCATATTGATGAGCTCC

GAACCGTCTCAGAGGTAGTTGGCAGTATATTTG

GAACGTCTCACGCCAGGCATCAACGCCGATG

GAACGTCTCATTGTAGTAGAGCGGGAAGTC

GAACGGTCTCAATCGGTGTCGTGGTTTGCTAC

GAACCGTCTCACTTCCACCTGCGAGGTGGTC

GAACCGTCTCACCTTCCAACCTTGCTCGAGC

TCGAGACTGACTCTCACCCAACACCGCAATAGC

GAACACTAGTAGGAGGTAACTTATGGCCAAGTACCTGGAGCTCGAAG

AGG

GAACGGTCTCATTCCCCCGGCGAGCAAGGGC

GAACCGTCTCAAAACACCGCCCACGCCTACGG

GAACGTCTCACCTCGACTTCCACCCCAAC

GAACGTCTCAGGCGCTTCGACTACGTCAAGG

GAACGGTCTCAACAAGATGGACGCGGCCTTTGAC

GAACCGTCTCACGATATAATTTGGAACAAGTACCC

GAACCGTCTCAGAAGCACCGACATAGTCTAC

GAACCGTCTCAAAGGTGGGTCTACGTTCCG

GAACGTCTCAGGAATCCATATTGCGGAGATTCCGGC

GAACGGTCTCAGTTTATCATGTTCACGAGCTC

GAACCGTCTCAGAGGTAGTTGGCCGTGTACTTG

GAACGTCTCAGCCATGCGTCAACGCCGATG

GAACGTCTCATTGTAGTAGAGCGGGAAGTCG

GAACGGTCTCAATCGGTGTCGTGGTTTGCAACG

GAACCGTCTCACTTCCACCGGCGAGGTGGTCGTG

GAACCGTCTCACCTTCCGGCCTTGCTCGAGCC

TCGAGACTGACTCTCAGCCCACCCCGCAGTAGCTC

GAACACTAGTAGGAGGTAACTTATGGCCAAGTACTCCGAGCTGGAAG

AGG

GAACGGTCTCATTCCTCCCGCGAGCAAGGG

GAACCGTCTCAAAACACCGCCCACGCCTATG

GAACGTCTCACCTCGACTTCCACCCGAACGAGC

GAACGTCTCAGGCGCTTCGACTACGTCAAGG

GAACGGTCTCAACAAGATGGACGAGGCCTTCG

SEQ ID NO:

258 Spel

259 Bsal

260 BsmBI

261 BsmAI

262 BsmAI

263 Bsal

264 BsmBI

265 BsmBI

266 BsmBI

267 BsmAI

268 Bsal

269 BsmBI

270 BsmAI

271 BsmAI

272 Bsal

273 BsmBI

274 BsmBI

275

276 Spel

277 Bsal

278 BsmBI

279 BsmAI

280 BsmAI

281 Bsal

282 BsmBI

283 BsmBI

284 BsmBI

285 BsmAI

286 Bsal

287 BsmBI

288 BsmAI

289 BsmAI

290 Bsal

291 BsmBI

292 BsmBI

293

294 Spel

295 Bsal

296 BsmBI

297 BsmAI

298 BsmAI

299 Bsal

148/151

GAACCGTCTCAAAACACCGCCCACGCCTATG

GAACGTCTCACCTCGACTTCCACCCGAACGAGC

GAACGTCTCAGGCGCTTCGACTACGTCAAGG

GAACGGTCTCAACAAGATGGACGAGGCCTTCG

GAACCGTCTCACGATATAATCTGGAACAAG

GAACCGTCTCAGAAGCACTGACATCGTTTACTACG

GAACCGTCTCAAAGGTGGGTTTACGTTCCG

GAACGTCTCAGGAATCCATATCGCCGAAAT

GAACGGTCTCAGTTTATCATGTTTATGAGC

GAACCGTCTCAGAGGTAGTTGGCCGTGTATTTAC

GAACGTCTCACGCCAGGCATCGATGCCGAT

GAACGTCTCATTGTAGTAGAGGGCGAAGTCAAAG

GAACGGTCTCAATCGGTATCGTGGTTGGCTACAAAC

GAACCGTCTCACTTCCTCCGGCGAGGTTGTCATG gaaccgtctcaccttccggctttgcttgaggc

TCGAGACTGACTCTCACCCAACACCGCAGTAGCTCC

CACACAGCAGCAACCAACCTCGAGACTGACTCTCASCC

296

297

298

299

300

301

302

303

304

305

306

307

308

309

310

311

312

BsmBI

BsmAI

Bsal

BsmBI

BsmAI

Bsal

BsmBI

BsmAI

Bsal

BsmBI

Bbvl [00542] As condições empregadas para PCR foram como segue: 3 minutos 94°C, (30 segundos 94°C; 30 segundos 55°C, 30 segundos 68°C) x 30 ciclos, seguidos por 10 minutos em 68°C. Os produtos PCR correspondendo a regiões homólogas das três origens foram agrupados (1:1:1), cortados com a enzima de restrição apropriada (observe Tabela 8), e purificados por gel. Quantidades iguais de agregados de fragmentos foram combinadas e ligadas (16°C; durante a noite). Os produtos de ligação de 450bp resultante foram purificados por gel e ligados para produzir genes de amilase de extensão total. Os produtos de extensão total resultante foram purificados por gel e amplificados por PCR empregando uma mistura de iniciadores F1 SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79 e iniciador (SEQ ID NO: 312). As condições empregadas para PCR foram como segue: 3 minutos 94°C, (30 segundos 94°C; 30 segundos 50°C, 60 segundos 68°C) x 30 ciclos, seguidos por 10 minutos em 68°C. Os produtos PCR resultante (~1,4 kbp) foram purificados, cortados com Spel e Bbvl, purificados por gel, ligados por pMYC(vetor de Mycogen, cortado com SpeI/XhoI), e transformados em E.coli de Topo 10. O DNA de plasmídeo de um agregado de ~21000 colônias foi isolado e transformado nos Pseudomonas. Peneiramento de α-amilase Reagrupada

149/151 [00543] O Pseudomonas fluorescens transformado (MB214) contendo pMYC derivado dos clones de origem SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79 foi classificado como placas de 96 ou 384 cavidades por FACS e tratado com uréia 6M. A peneiração primária empregando amido RBB e/ou amido FITC como substratos foi realizada como descrito mais totalmente abaixo. Os clones ativos elevados foram peneirados empregando amido RBB como substrato empregando culturas induzidas e por ensaio de liquefação. Os troncos e clones ativos elevados de novas seqüências com base nos dados de liquefação foram realizados.

[00544] A biblioteca de amilase reagrupada transformada (MB214)Pf), foi coletada e classificada em placas de 96 cavidades (ou placas de 384 cavidades) em 1 célula/cavidade em 50ql de LB + Tet. As placas foram incubadas durante 24 horas em 30°C. As placas replicadas foram feitas correspondendo a cada das cavidades durante armazenagem. Quarenta e cinco (45) pL de 12M de uréia foram adicionados a cada cavidade e as placas foram sacudidas durante 10 minutos. As placas manteram temperatura ambiente durante pelo menos 1 hora e o lisado armazenado em 4°C.

Ensaio Empregando Amido RBB [00545] 75ql de substrato de amido RBB (1% de amido de milho isolúvel RBB em 50mM de tampão NaAc, pH= 4,5) foram adiconados em cada cavidade de uma nova placa de 96 cavidades (fundo V). Cinco micro-litros de lisado de enzima foram transferidos em cada cavidade com substrato empregando Biomek ou Zymark. As placas foram seladas com fita de seleção de alumínio e brevemente sacudidas no misturador. As placas foram incubadas em 90°C duran te 30 minutos, seguidas por resfriamento em temperatura ambiente durante cerca de 5 a 10 minutos. Cem microlitros de 100% de etanol foram adicionados para cada cavidade, as placas seladas e brevemente sacudidas no

150/151 misturador. As placas foram então centrifugadas em 400rpm durante 20 minutos empregando centrífuga de topo de bancada. 100pl de sobrenadante foram transferidos em uma nova placa de 96 cavidades (fundo uniforme) por Biomek e leitura de OD₅₉₅. Controles: SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79.

Ensaio Empregando Amido FITC [00546] Adicionar 50pl de substrato (0,01% de amido FITC em 100mM de tampão NaAc, pH = 4,5) em cada cavidade de uma nova placa de 384 cavidades. Transferidos 5pl de lisado de enzima em cada cavidade com substrato e incubadas as placas em temperatura ambiente durante a noite. A mudança da polarização do substrato, excitação em 485 nm, emissão em 535nm, foi lida durante cada cavidade. Controles: SEQ ID NO: 81, SEQ ID NO: 77, SEQ ID NO: 79. Preferivelmente as placas de 96 cavidades são empregadas para todos os ensaios.

Confirmação de Novos Clones Ativos [00547] Cada clone positivo de peneiração foi desenvolvido e induzido empregando um protocolo padrão. Cada clone foi examinado para desenvolver (isto é, com o passar do tempo a densidade da célula), atividade no nível por célula (ensaio de amido RBB e ensaio de liquefação), expressão (gel de proteína) e solubilidade da proteína (por análise de microscópio). Os clones elevados novos confirmados foram transferidos durante fermentação.

[00548] Embora a invenção tenha sido descrita em detalhes com referência a certas modalidades preferidas desta, será entendido que as modificações e variações estão dentro do espírito e escopo daquilo que é descrito e reivindicado.

151/151

Tabela 3 SEQ ID NO.

Seqüência de Sinal

SEQ ID NO: 87 SEQ ID NO: 91 SEQ IDNO: 93 SEQ IDNO: 97 SEQ IDNO: 99 SEQ IDNO: 103 SEQ IDNO: 105 SEQ ID NO: 109 SEQ IDNO: 111 SEQ IDNO: 113

SEQ IDNO: 117 SEQ IDNO: 119 SEQ IDNO: 123 SEQ ID NO: 125 SEQ ID NO: 127 SEQ IDNO: 131 SEQ IDNO: 133 SEQ ID NO: 137 SEQ ID NO: 139 SEQ ID NO: 141 SEQ ID NO: 143 SEQ ID NO: 145 SEQ ID NO: 147 SEQ ID NO: 149 SEQ ID NO: 69 SEQ IDNO: 153 SEQ ID NO: 155 SEQ ID NO: 157 SEQ ID NO: 159 SEQ ID NO: 161 SEQ ID NO: 167 SEQ ID NO: 169 SEQ ID NO: 173 SEQ ID NO: 175 SEQ ID NO: 177 SEQ ID NO: 179 SEQ ID NO: 185 SEQ ID NO: 189 SEQ ID NO: 191 SEQ ID NO: 193 SEQ ID NO: 197 SEQ ID NO: 199 SEQ ID NO: 201 SEQ ID NO: 203 SEQ ID NO: 205 SEQ ID NO.:73 SEQ ID NO.: 79

AAV23(SEO IDNO:213) AA1-23 (SEQ ID NO: 214) AA1-33 (SEQ ID NO: 215) AA.1-31 (SEQ 10 NO: 210) AA1-30 (SEQ ID NO: 217) AA1-22 (SEQ ID NO: 218) AA1-33 (SEQ |D HO: 219) AA1 -25 (SEQ ID NO: 220) AA1-35 (SEQ IDNO: 221) AA1-28 (SEQ JD NO: 222) AA1-21 (SEQ ID NQ: 223) AA1-3O(SEQ IDNO: 224) AA.1-35 (SEQ IDNO: 225] AA1-28 (SEQ IDNO: 226)

AA1-30 (SEQ ID NO: 227) AA1-30 (SEQ ID NO; 228) AA1-30 (SEQ ID NO: 229) AA1-28 (SEQ ID NO: 230) AA1-23 (SEQ ID NO: 231) AA1-23 (SEQ ID NO: 232) AA1-30 (SEQ ID NO: 233) AA1-27 (SEQ ID NO: 234) AA1-29 (SEQ ID NO: 235) AA1-28 (SEQ ID NO: 236) AA1-27 (SEQ ID NO: 237) AA1-26 (SEQ ID NO: 238) AA1-33 (SEQ ID NO: 239) AA1-25 (SEQ ID NO: 240) AA1-25 (SEQ ID NO: 241) AA1-36 (SEQ ID NO: 242) AA1-36 (SEQ ID NO: 243) AA1-23 (SEQ ID NO: 244) AA1-25 (SEQ ID NO: 245) AA1-22 (SEQ ID NO: 246) AA1-23 (SEQ ID NO: 247) AA1-23 (SEQ ID NO: 248) AA1-25 (SEQ ID NO: 249) AA1-36 (SEQ ID NO: 250) AA1-25 (SEQ ID NO: 251) AA1-25 (SEQ ID NO: 252) AA1-23 (SEQ ID NO: 253) AA1-23 (SEQ ID NO: 254) AA1-30 (SEQ ID NO: 255) AA1-25 (SEQ ID NO: 256) AA1-16 (SEQ ID NO: 257) AA1-16 (SEQ ID NO: 7) AA1-26 (SEQ ID NO: 8)

1/6

Claims

REIVINDICAÇÕES

1. Polipeptídeo isolado, sintético ou recombinante possuindo uma atividade de alfa amilase, caracterizado pelo fato de que compreende:

(a) uma sequência de aminoácidos de SEQ ID NO:78, ou (b) (i) a sequência de aminoácido de (a), em que o polipeptídeo compreende ainda uma sequência de aminoácidos heteróloga;

(ii) a sequência de (i), em que a sequência de aminoácidos heteróloga compreende uma sequência sinal;

(iii) a sequência de (ii), em que a sequência sinal heteróloga compreende uma sequência sinal de amilase;

ou (c) a sequência de aminoácidos de (a) ou (b), em que o polipeptídeo compreende uma ou mais modificações da sequência de aminoácidos de SEQ ID NO: 78, e em que a modificação compreende acetilação, acilação, ADP-ribosilação, amidação, ligação covalente de flavina, ligação covalente de uma porção de heme, ligação covalente de um derivado de nucleotídeo ou nucleotídeo, ligação covalente de um lipídeo ou derivado de lipídeo, ligação covalente de um fosfitidilinositol, ciclização por reticulação, formação de ligação de dissulfeto, desmetilação, formação de reticulação covalente, formação de cisteína, formação de piroglutamato, formilação, gamacarboxilação, glicosilação, formação de âncora GPI, hidroxilação, iodinação, metilação, miristoliação, oxidação, pegilação, processamento proteolítico, fosforilação, prenilação, racemização, selenoilação ou sulfação.
2. Método de hidrolisar uma ligação a-1,4-glicosídica, caracterizado pelo fato de que compreende (A) contatar uma composição contendo uma ligação a-1,4Petição 870180003404, de 15/01/2018, pág. 13/18

2/6 glicosídica com um polipeptídeo capaz de hidrolisar a ligação α-1,4glicosídica, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1, sob condições que facilitem a hidrólise da ligação α-1,4-glicosídica;

(B) o método de (A), em que a composição compreende amido, em que o amido é opcionalmente derivado de arroz, arroz germinado, milho, cevada, trigo, legumes, batata doce, “milo”, sorgo, centeio, bulger ou uma combinação dos mesmos; ou (C) o método de (A) ou (B), compreendendo ainda adição de uma segunda amilase, uma alfa amilase, uma beta amilase, outra enzima ou uma combinação das mesmas.
3. Método para liquefazer uma composição contendo amido (liquefação de amido), caracterizado pelo fato de que compreende (A) contatar uma composição contendo amido com um polipeptídeo possuindo atividade alfa amilase sob condições que facilitem a liquefação do amido para gerar um hidrolisado solúvel de amido, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1;

(B) o método de (A), em que o amido é derivado de arroz, arroz germinado, milho, cevada, trigo, legumes, batata doce, “milo”, sorgo, centeio, bulger ou uma combinação dos mesmos;

(C) método de (A) ou (B), compreendendo ainda a adição de uma segunda amilase, uma alfa amilase, uma beta amilase, outra enzima ou uma combinação das mesmas;

(D) método de (A), (B) ou (C), compreendendo ainda sacarificar o hidrolisado de amido solúvel.
4. Método de tratamento de fibras lignocelulósicas, caracterizado pelo fato de que compreende (A) contatar as fibras lignocelulósicas com um polipeptídeo

Petição 870180003404, de 15/01/2018, pág. 14/18

3/6 possuindo atividade alfa amilase em uma quantidade suficiente para modificar uma propriedade da fibra, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1; ou (B) método de (A), em que o método compreende ainda a adição de uma segunda amilase, uma alfa amilase, uma beta amilase, outra enzima ou uma combinação das mesmas.
5. Uso de um polipeptídeo como definido na reivindicação 1, caracterizado pelo fato de que é em ou para um processo selecionado do grupo consistindo em produção de etanol combustível, processo de moagem úmida de milho, processo de panificação ou um processo para fazer um pão ou produto cozido ou um processo para prevenir o envelhecimento de um pão, processo de perfuração, processo de fermentação, descoloração de papel ou de polpa, lavagem de um objeto, processamento têxtil ou para desengomar, processamento de papel ou polpa, e produção de uma bebida.
6. Composição, caracterizada pelo fato de que compreende (A) um polipeptídeo possuindo atividade alfa amilase, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1;

(B) a composição de (A) compreendendo ainda um segundo polipeptídeo compreendendo uma segunda amilase, uma alfa amilase ou uma beta amilase, outra enzima, ou uma combinação das mesmas;

(C) a composição de (A) ou (B), em que a composição é uma composição de ração, um papel, uma polpa ou um papel reciclado, um tecido, um detergente ou um aditivo de detergente, uma pré-mitura de panificação, um aditivo de panificação, uma farinha, ou uma massa; ou (D) a composição de ração de (C), em que a composição

Petição 870180003404, de 15/01/2018, pág. 15/18

4/6 de ração compreende arroz, arroz germinado, milho, cevada, trigo, legumes, batata doce, “milo”, sorgo, centeio, bulger ou uma combinação dos mesmos.
7. Método de preparação de uma composição de ração, caracterizado pelo fato de que compreende (A) contatar uma ração com um polipeptídeo possuindo atividade alfa amilase, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1; ou (B) método de (A), em que o método compreende ainda o uso de um segundo polipeptídeo compreendendo uma segunda amilase, uma alfa amilase ou uma beta amilase, outra enzima ou uma combinação das mesmas.
8. Método de produção de um álcool, caracterizado pelo fato de que compreende (A) contatar uma composição contendo uma ligação α-1,4glicosídica com um polipeptídeo capaz de hidrolisar a ligação α-1,4glicosídica, em que o polipeptídeo compreende (a) uma sequência de aminoácidos codificada pela sequência de ácido nucleico como definida na reivindicação 1, ou, (b) uma sequência de aminoácidos como definida na reivindicação 5, sob condições que facilitem a hidrólise da ligação α-1,4-glicosídica;

(B) o método de (A), compreendendo ainda a adição de uma segunda amilase, uma alfa amilase, uma beta amilase, outra enzima ou uma combinação das mesmas; ou (C) o método de (A) ou (B), em que o álcool compreende um etanol combustível.
9. Processo de moagem úmida de milho, caracterizado pelo fato de que compreende (A) uso de um polipeptídeo possuindo atividade alfaamilase, em que o polipeptídeo uma sequência de aminoácidos como

Petição 870180003404, de 15/01/2018, pág. 16/18

5/6 definida na reivindicação 1, ou;

(B) o método de (A), em que o processo compreende ainda o uso de um segundo polipeptídeo compreendendo uma segunda amilase, uma alfa amilase ou uma beta amilase, outra enzima ou uma combinação das mesmas.
10. Processo de campo de petróleo, caracterizado pelo fato de que compreende (A) uso de um polipeptídeo possuindo atividade alfaamilase, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1;

(B) o método de (A), em que o processo de campo de petróleo compreende ainda o uso de um segundo polipeptídeo compreendendo uma segunda amilase, uma alfa amilase ou uma beta amilase, outra enzima ou uma combinação das mesmas;

(C) o método de (A) ou (B), em que o processo de campo de petróleo é perfuração; ou (D) o método de (A) ou (B), em que o método compreende aumentar o fluxo de fluidos de produção a partir de uma formação subterrânea removendo-se um fluido viscoso contendo amido, formado durante operações de produção e encontrado na formação subterrânea que rodeia uma perfuração de poço completada, compreendendo (a) permitir que fluidos de produção fluam a partir da perfuração de poço;

(b) reduzir o fluxo de fluidos de produção a partir da formação a taxas de fluxo abaixo das esperadas;

(c) fornecer um polipeptídeo possuindo atividade alfa amilase, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1;

(d) bombear o polipeptídeo para uma localização desejada

Petição 870180003404, de 15/01/2018, pág. 17/18

6/6 na perfuração de poço; e (e) permitir que o polipeptídeo degrade o fluido viscoso contendo amido, em que opcionalmente o fluido é removido da formação subterrânea para a superfície do poço.

11. Método para a produção de açúcar, caracterizado pelo fato de que compreende (A) contatar uma composição contendo uma ligação α-1,4glicosídica com um polipeptídeo possuindo atividade alfa amilase, em que o polipeptídeo compreende uma sequência de aminoácidos como definida na reivindicação 1; ou (B) o método de (A), em que o processamento de papel ou polpa compreende ainda o uso de um segundo polipeptídeo compreendendo uma segunda amilase, uma alfa amilase ou uma beta amilase, outra enzima ou uma combinação das mesmas.

Petição 870180003404, de 15/01/2018, pág. 18/18

1/116

FIG 1

2/116

201

Não 220 C. Fim

FIG 2

3/116

252

FIG 3

4/116

302

Não

I 32 C Fim Y

FIG 4

5/116

100 TO 3 90 g K 60 d> 70 d) Ό 60 TO 50 > 40 TO ω 30 T3 20 θ' 10

Ο

Dito 10 WO: «I □ ilQ 10 HO: ΙΟ itO 10 MO. 1*1 SEQIDHO:!·) ΐΕφΙ0Ν0;·Ο Qhqidnú: »< gXEQIDHQJI) D»0 ID HO; Ui pH6 pH 4.5

FIG 5

6/116

Comercial SEQIDNO: 113 SEQIDNO: 139 SEQ [D NO: 127

Concentração de enzima(mg/l)

FIG 6

7/116

SEQIDNO: 125 ADW

FIG 7

8/116

Tolerância H_ao_a ^•sajioNa in —*-EBQU>NO: OI aeQM>wo;i<»

FIG 8

9/116

FIG 9a —

Atividade específica (pH 8.40 C) (Com atividade >4U/mg)

FIG 9b

Atividade específica @ pH 10, 50C

10/116

SBQ ID NO. illl (1) SEQ ID NO. s!27 (11 sbq ID ND. ;11S (1) , SEQ ID HO. :HJ (7€i SEQ ID NO. :137 (79) SEQ ID NO. illS (611 EEQ ID HO. íll3 (ISO SEQ ID NO, il37 (15») SEQ ID NO. ais (ISO) SEQ ID NO. :113 (230 SBQ ID HO. :i27 (239) SEQ ID NO. :115 (2QQ) SBQ 10 NO. 1113. (312) SBQ ID HO. il27 1317) SEQ 10 HO. £115 12721 SBQ ID NO- : 113 (390) SBQ ID NO- :127 (392) SBQ ID NO. ; 115 (331) SEQ ID NO. illJ («81 EEQ ID NO. :127 (4701 SBQ ID NO, .115 (410) SBQ XD NO. illJ (485 SBQ ID NO. 1127 (541 SEQ XD NO. :H5 (437

551

-QJWTftfVH!

ICO

1C1 'CDVTfcVrVDPWewBvisSEffilICAlOUFKFPCRCCTYSDFK jTEHVOftV£VHP59RlÕCTsSTxãlOAHTKFOrPCRCNTTS8FK ÍÜMNrYVt£l7uÕPS£VASQKlglUfVHDfHfN-----------

401

ITCNCtrtDYUfYJiD|Ptt>Hrgvj HTOTllflXOLEHDHtCWTI «BS----------------- --130 tflFjMSTQGGOrauUCLUtt;- rnjçmscxfimmrijjÍg - ykmoeBtwjknipa|vxaB§ce <00

50- -bbxfaSkhkiefQl

ITGIFKTN-----IfÃ«mDP LL

BBW1MKD--------KUrfHg---2

HIH

481

JSVMtSGUUffllTDÇPOCAltfiMUrgBQNACElgHC I HRnQGUuElTÜGFGCEKmYVgKltHAClCv£|C,

Ct){PGL-5Tl£HL65DW^^^HVfiSKFAGYTltf'l

480 (RS—tPWItgM «RS—gTVTXNÃoü iHLCÜWVDHgg&rDC

550

VgxreQVTrrVIlNATTlSQQtrVYVVQl 1PSLCNWHTAKA I KKTPS SYPTWKATIALP [agvc....................-................................

<05

FIG 10

11/116

FIG 11

12/116

Efeito do pH

-»axi tDNO.ll) ^trfjinbn iji pH

FIG 12
13/116

FIG 13
14/116

FIG 14a:

SEQ IDN0:81 Piro

Piro 2 Termo

Termo 2 Con-senso _________________MKX FVALFITMFF WSMAW.....AQPASAAK _________________MKK FVALLITHFF WSMAAV.....AQPASAAK _______________VN1KK LTPLLTLLLF FT . - ,VL. . . - - ASPVSAAK

SESQCTATCT HRWYWSAKK LLALLTVLAV LVGVAVIPAR VGIAPVSAGA __________________________--HA RKVLVALLVF LWLSVSAVP _______________________-......................SA- SEQIDNO: 81 Piro

Piro 2 Termo

Termo 2 Con-senso

SEQIDNO: 8) Piro

Piro 2 Termo

Termo 2 Con-senso

SEQ IDNO:8I Piro

Piro 2 Termo

Termo 2 Con-senso

SEQIDNO: 81 Piro

Piro 2 Termo

Termo 2 Con-senso

SEQ ID NO: 81

Piro Piro 2 Termo

Termo 2 Con-senso

SEQ IDN0-.81

Piro Piro 2 Termo

Termo 2 Con-senso

Indicador de:

SI

YS. .ELEEGG YS- .ELEEGG YL-.ELEEGG TSRPSLEEGG AXAETLENGG -----ΙΛ-CC

101

SKGMSGGYSM SKGMGQAYSW SKGMSGGYSM SKGMSGAYSK SKGMSGGYSM SKGM- C-YSM

1S1

IKVIADIVIN

IKVIADIVIN

IKVIADWIN

IKVIADIVIN

MKVIADIVIN

-KVIAD-VIN

201

VKCCDEGTFG

VKCCDEGTPG

LHCCDECTPG

VKCCDEGTFG

LHAGD5GTFG

----D-GTPG

251

KGYGANWKD KCYGAWWKD KCYGAWVVRD KGYGAHWKD KGYAPWWKN KOY--WW-301

MDEAFDNKNI

HDEAFDNTNI

MDEAFDNNNI

MDEAFDNKNI

MDEAFDNNNI

MDEAFDN-NI

VIHQAFYHDV

VIHQAFYHDV

VIHQAFYHDV

VIMQAFYWDV

VIMQAFYWDV

VIHQAFYHDV

GYDPYDFFDL

OYDPYDFFDL

GYDPYDYFDL

OYDPYDFFDL

OYDPYDFFDL

OYDPYD-FDL

HRAGGDLEHN

HRAGGDLEWN

HRAGGDLEWN

HRAGGDLEWN

HRAGGDLEWN

HRAGGDLEHN

GFPDIAHEKS

GFPDIAHEKE

GFPDICHKKE

GFPDIAHEKS

GYPDICHDKS

G-PDI-H-KHLNHHCGWAV HLNHHGGHAV HLNHHGGHAV HLKHW. ALAV HLNRHGGHAV WL--W---AV

PALVSALQNG

PALVDALQNG

PALVYALQNC

PALVSALQNG

PALVDALKNG

PALV-AL-NG

PGGGIHWDTI paggihhdti

PGGGIWHDHI

PAGGIWWDTI

PGGGIHWDTI

P-GGIWWD-I

GEYNQKGTIE

GEYNQKGTVE

CEYYQKGTVE

GEYYQKGTVE

GEYYQKGSVB

GEY-QKG--E

PFVGDYTHTD

PFVGDYTHTD

PFVGDYTHTD

PFTNSYTWTD

PFTNSYTWTD

PF---YTWTD

HDQHWLHASD

HDQHWLHASD

HDQYHLWKSN

HDQYHLHASQ

HDQHHLHASN

WDQ-WLW-SGEYHDTNVDA

GEYVDTNVDA

GEYHDTNVDA

GEYHDTNVDA

GEYHDTNVDA

GEYHDTNVDA

QTWSRD PFK GTWSRD PFK QTWSRD PFK QTWSRD PFK GTWSRD PFK -TWSRDPFK

RSKIPEHY EA RSKIPEHYKA RSKIPEHY EA RSKIPDHASA AQKIPDHA5A --KIP-W- -A

TRFGSKQELI

TRFGSKQELI

TRFGSKEELV

TRFGSKQELI

TRFGSKEELV

TRFGSK-ELFSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

BS YAAYLR SI ESYAAYLRSI ESYAAYLRSI KSYAAYLRSI ESYAAYLRSI -S YAAYLR SI

LLNHAYSSGA

LLNHAYSSGA

LLSHAYESGA

LLNHAYSSGA

LLSHAYDSGA

LL-WAY-SGA

AVTFVANHDT

AVTFVANHDT

AVTFVANHDT

AVTFVANHDT

AVTFVANHDT

AVTFVANHDT

100

GISAIHIPPA

GISAIHIPPA

GISAIWLPPP

GISAIHIPPA

GISAIHIPPA

GISAJW-PP15 0

NMINTAHAYG NMINTAHAYG RLIQTAHAYG NMINTAHSYG NMINTAHAHN --I-TAH--200

ANYLDFHPNE

ANYLDFHPNE

ANYLDFHPNE

ANYLDFHPNE

ANYLDFHPNE

ANYLDFHPNE

25 0

GVDAWRFDYV

GVDAWRFDYV

GFDGHRFDYV

GIDAWRPDYV

GIDAHRFDYV

G-D-HRFDYV

300

KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYY K

35 0

DIIWNKYLAY

DIIHNKYPAY

DIIHNKYPAY

DIIHNKYPAY

NIIHNKTPAY

-IIHNKY-AY

15/116

FIG 143(cont.)

SEQ ID HO: 81 351 afiltyegqp VIFYRDYEEW Piro afiltyegqp VIFYRDYEEW Piro 2 afiltyegqp VIFYRDFEEW Termo afiltyegqp vifyhdybew Termo 2 AFILTYEGQP AIFYRDYEEW Con-senso AFILTYEGQP -IFYRD-EEH SEQ ©NO: 81 401 HIFVRNGYGS KPGLITYINL Piro LIFVRNGDSK RPGLITYINL Piro 2 LIFVRNGDSR RPGLITYINL Termo LIFVRNGYGN KPGLITYINL Termo 2 lifvrngygd KPGLITYINL Con-senso -IFVRNG- — -PGLITYINL SEQ ID NO; 81 451 DKYVYSSGWV YFEAPAYDPA Piro DKYVESSGWV YLEAPAYPPA Piro 2 DKRVDSSGWV yleapphdpa Termo DKYVGGHGHV YLEAPAHDPA Termo 2 DKWVDSSGRV YLEAPAHDPA Con-senso DX-V-S-G-V Y-EAP- -DPA

400

LNKDRLNNLI WIHDHLAGGS TSIVYYQSDE UIXDKLHHI.I HIHDHLAQG3 TSIVYYDSOE LNKDíCLINLI HIHDHLAGGS TTIVYYDNDE LNKDRLXNLI HIHNKLAGGS TSTVYYDNDE LNKDRLRNLI WIHDKIAGGS TDIIYYOSDE LNKD-L-NLI WIH--LAGGS T-I-YYD-DE

45 0

GSSKVGRHVY VPKFAGACIH EYTGNLGGWV QSSKVGRWVY VPKFAGACIH EYTGNLQGWV SFNWVGRWVY VPKFAGACIH EYTGNLQGWV G5SKVGRWVY VPKFAGSCIH EYTGNLQGWV GSSXAGRWVY VPKFAGSCIH EYTGNLGGWI -----GRHVY VPKFAG-CIH EYTGNLGGW486

NGQYGYSVWS YCGVG*

SGQYGYTVWS YCGVG*

NGYYGYSVHS YCGVG*

KGQYGYSVMS YCGVG*

NGQYGYSVWS YCGVG*

-g-ygy-vws Tcava·

Indicador de anti-senso

16/116

FIG 14b

SEQ1DNOB1

Piro

SEQ ID NO: 73 Termo 2

SEQIDNO: 75 SEQ ID NO: π SEQIDNO: 83 SEQIDNO: 85

SEQIDNO: 79 Termo Piro 2

CLONE A Con-senso ________________________MKKFVA LFITMFFVVS MAWAQPASA __________________—----MKKFVA LLITMFFVVS MAAVAQPASA

--------KA RKVLVALLVF LWLSVSAVP

____________________ MKPAKL LVFVLWSIL AGLYAQPAGA

SBSQCTATCT WRWYMSAKK LLALLFVLAV LVGVAVIPAR VGIAPVSAGA

-----------------------VNIKK LTPLLTLLLF FIVLASPVSA __________ MRRSARV LVLIIAFFLL AGIYYPSTSA

SEQIDNO: BI

Piro

SEQIDNO: 73 Termo 2

SEQIDNO: 75 SEQIDNO: 77 SEQIDNO: 83

SEQIDNO: 85 SEQ 10 NO: 79

Termo Piro 2

CLONEA

Con-senso

SEQIDNO: 81 Piro

SEQIDNO: 73 Tenmo 2

SEQIDNO: 75 SEQIDNO: 77 SEQ JDNO:83 SEQIDNO: 85 SEQIDNO: 79

Termo Piro 2

CLONEA Con-senso

SEQIDNO: 81 Piro

SEQIDNO: 73 Termo 2

SEQIDNO: 75 SEQIDNO: 77 SEQ 1DNO:83 SEQIDNO: 85 SEQIDNO: 79

Termo Piro 2

CLÓNEA

Con-senso

Sl akyseleegg AKYSELEEGG ~~-MALEEGG AXAETLENGG

---MALEEGG

---MALEEGG

---MALEEGG

---MALEEGG AKYLELEEGG TSRPSLEEGG AKYLELEEGG AKYSELEQGG --------gg

101

SKGMSGGYSM SKGMGGAYSM SKGMSGGY5M SKGMSGGYSM SKGMSGGYSM SKGMSGGYSM SKGMSGGYSM SKGMSGGYSM SKGMGGAYSM SKGMSGAYSM SKGMSGGYSM SKGMGGAYSM SKGM-G-YSM

151 ikviadivin

IKVIADIVIN

HKVIADIVIN

HKVIADIVIN

HKVIADIVIN

MKVIADIVIN

IKVIADIVIN

IKVIADIVIN

IKVIADIVIN

IKVIADrVIN

IKVIADWIN

IKVIADIVIN

-KVIAD-VIN

VIMQAFYWDV

VIMQAFYWDV

LIMQAFYWDV

VIMQAFYWDV

LIMQAFYWDV

LIMQAFYWDV

LIMQAFYWDV

LIMQAFYWDV

VIMQAFYWDV

VIMQAFYWDV

VIMQAFYWDV

VIMQAFYWDV

-IMQAFYWDV

GYDPYDFFDL GYDPYDFFDL GYDPYDFFDL GYDPYD FFDL GYDPYDYFDL GYDPYDYFDL GYDPYDFFDL GYDPYDFFDL GYDPYDFFDL GYDPYDFFDL GYDPYDYFDL GYDPYDYFDL GYDPYD - FDL

HRAGGDLEWN HRAGGDLEWN HRAGGD LEWN HRAGGDLEWN KRAGGDLEWN KRAGGDLEWN HRAGGDLEWN HRAGGGLEHN KRAGGDLEWN HRAGGDLEWN HRAGGDLEWN HRAGGDLEWN HRAGG- LEHN

PGGGIWWDTI

PAGGIWWDTI

PGGGIWWDTI

PGGGiwwrrri

PMGGIWWDTI

PMGGIWWDTI

PGGGIWWDTI

PGGGIWWDTI

PSGGIWWDTI

PAGGIKWDTI

PGGGIWWDHI

PEGGIWWDTI

P-GGIWWD-I

GEYNQKGTIE

GEYNQRGTVE

GEYYQRGSVE

GEYYQRGSVE

GEYYQKGTVE

GEYYQKGTVE

GEYYQKGTVE

GEYYQKGTVE

GEYDQRGTVE

GEYYQKGTVE

GEYYQKGTVE

GEFYQKGTVE

GE--QKG--E

PFVGDYTWTD PFVGDYTWTD PFTNSYTWTD PFTNSYTKTD PFVNDYTWTD PFVNDYTWTD PFVNDYTWTD PFVNDYTWTD PFVNDYTWTD PFTNSYTWTD PFVGDYTWTD PYVGDYTWTD P----YTWTD

RSKIPEWYEA RSKIPEWYEA AQKIPDHASA AQKIPDHASA AQKIPDHASA AQKIPDHASA AQKIPEWASA AQKIPEWASA RQKIPEWYDA RSKIPDWASA RSKIPEWYEA RQKIPEWYDA --KIP-W--A

TRFGSKQELI TRFGSKQELI TRFGSKEELV TRFGSKEELV TRFGSKQELI TRFGSKQELI TRFGSKEELV TRFGSKEELV TRFGSKQE LV TRFGSKQELI TRFGSKEELV TRFGSKEELV TRFGSK-ELFSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYT

FSKVASGKYK

FSKVASGKY10 0

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWIPPA

GISAIWLPPP

GISAIWIPPA

GISAIW-PP15 0

NMINTAHAYG NMINTAHAYG NMINTAHAHN NMINTAHAHN NMINTAHAYG NMINTAHAYG NMINTAHSYG NMINTAHSYG NMINTAHAYG NMINTAHSYG RLIQTAHAYC NMISTAHQYG --I-TAH-- 300

ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE ANYLDFHPNE AHYMDFHPNN A-Y-DFHPN

17/116

FIG 14b(cont.)

SEQ ID NO: 81 201 VKCCDEGTFG Piro VKCCDEGTFG SEQ ID NO: 73 LHAGDSGTFG Termo 2 mAi«u SGTFG SEQ ID NO: 75 LHAGDSGTFG SEQ ID NO: 77 LHAGDSGTFG SEQIDNO: 83 LHCCDEGTFG SEQ ID NO: 85 LHCCDBGTFG SEQ ID NO: 79 VKCCDEGTFG Termo VKCCDEGTFG Piro 2 LHCCDEGTFG CLONEA YSTSDEGTFG Con-senso ----D-GTFG SEQ IDNO: 81 251 KGYGAWWKD Piro KGYGAWWKD SEQIDNO: 73 KGYAPWWXN Termo 2 KGYAPWWXN SEQ ID NO: 75 KGYAPWWRD SEQIDNO: 77 KGYAPWWKD SEQIDNO: 83 KGYGAWWND SEQ ID}40:£5 KGYGAWWND SEQIDNO: 79 KGYGAWWKD Termo KGYGAKWXD Piro 2 KGYGAWWRD CLONEA KGYGAWWKD Con-senso KGY--WW-- SEQ ID NO. El 301 MDEAFDNKNI Piro MDEAFDNTNI SEQ IDNO: 73. MDEAFDNKNI Termo 2 MDEAFDNNNI SEQ tDNO:75 HDEAFDNNNI SEQIDNO: 77 HDEAFDNNNI SEQ IDNO: 83 mdeafdntni SEQ IDNO: 85 MDEAFDNTNI SEQIDNO: 79 MDAAFDNKNI Termo MDEAFDNKNI Piro 2 HDEAFDNNNI CLONEA MDEAFDNKNI Con-senso MD-AFDN-NI SEQIDNO: 8l 351 AFILTYEGQP Piro afiltyegqp SEQIDNO: 73 AFILTYEGQP Termo 2 AFILTYEGQP SEQ IDNO: 75 AFILTYEGQP SEQ ID NO: 77 AFILTYEGQP SEQ ID NO 83 AFILTYEGQP SEQIDNO: 85 AFILTYEGQP SEQ IDNO: 79 afiltyegqp Termo AFILTYEGQP Piro 2 AFILTYEGQP CLONEA AFILTYEGQP Con-senso AFILTYEGQP

GFPDIAHEKS

GFPD1AHBKE

GYPDICHDKS

GFPDIAHEKS

GFPDICHHKE

GFPDIDHLVP

G-PDI-H--WLNWWGGWAV WLNWWGGWAV WLNRWGCHAV WLNRWGGMAV WLNWWGGWAV WLNWWGGWAV WL5WHQGWAV WLSWWGGWAV WLDWWGGWAV WLKWH. ALAV WLNWWGGWAV WLSQWGGWAV WL--W---AV

PALVSALQNO

PALVDALQNG

PALVDALKNG

PALVDALRYG

PALVYALKNO

PALVEALKNG

PALVSALQNG

PALVYALQNG

PALVYAIQNG

PALV-A---G

VIFYRDYEEH

AIFYRDYEEW

TIFYRDYEEH

VIFYRDYEEH

TIFYRDYEEH

VIFYRDYEEH

VIFYRDFEEH

VIFYRDYEEH

-IFYRD-EEW

LNKDRLNNLI

LNKDKLNNLI

LNKDRLRNLI

LNKDKLKNLI

LNXDKLKNLI

LNKDKLNNLI

LNKDRLKNLI

LNKDKLINLI

LNKDKLNNLI

LNKD-L-NLI

WDQHWLWASD

WDQHWLWASN

WDQYWLWASQ

WDQYWLWASS

HDQYWLWASN

WDQYWLWASQ

WDQYWLWKSN

FNQYWLWASN

--Q-WLW-S*

GEYWDTNVDA

GEYWDTNVDA geywdtnvda

GEYWDTNVDA

GEYHDTNVDA

QTWSRDPFK GTWSRDPFK GTWSRD PFK GTWSRDPFK QTWSRDPFK QTWSRDPFK QTWSRDPFK GTWSRDPFK GTWSRDPFK QTWSRD PFK QTWSRDPFK ETWSRDPFK -TWSRDPFK

ESYAAYLRSl ESYAAYLRSl ESYAAYLRSl ESYAAYLR SI ESYAAYLR SI ESYAAYLRSl ESYAAYLRSl ESYAAYLRSl ESYAAYLRSl KSYAAYLRSI ESYAAYLR SI ESYAAYLRSl -SYAAYLRSI

LLNHAYSSGA

LLSHAYDtSGA

LLSHAYDSGA

VLNWAYSSGA

VLNHAYSSGA

LLNHAYSSGA

LLNHAYNSGA

LUWAYSSDA

LLNHAYSSGA

LLSHAYESGA

LLNHAYSSGA

-L-WAY-S-A

AVTFVANHDT

HIHDHLAGGS hihdhlaggs HIHDHLAGGS HIHDHLAGGS HIHDHLAGGS WIHDNLAGGS HIHDHLAGGS WIHDHIA5GS HIHDHLAGGS HIHNNLAGGS hihdhlaggs HIHEHLAG GS WIH--1ÃGGS

25 0

GVDAWRFDYV

GIDAWRFDYV

GVDAWRFDYV

GVDAHCFDYV

GVDAWRFDYV

GIDAWRFDYV

GFDGHRFDYV

GIDAWRFDYV

G-D-W-FDYV

300

KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFALYY K KVFDFALYYK KVFDFPLYY K KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDFPLYYK KVFDF-LYYK

35 0

DIIWÍKYLAY

DIIWNKYPAY

NIIWNKYPAY

DIIWNKYPAY

DIIHNKYPAY

NIIWNKYPAY

-IIWNKY-AY

400

TSIVYYDSDE TSIVYYDSD E TDIIYYDSDE TDIIYYDSDE TDIVYYDNDB TDIVYYDND E TDIVYYDSDE TDIVYYDSDE TDIVYYDNDE TSIVYYDNDB TTIVYYDNDE TKILYYDDDE T-I-YYD-DE

18/116

FIG 14b(cont.)

SEQ ID NO: 81 401 HIFVRNGYG5 Piro LIFVRNGDSX SEOIDNO:73 LIFVRNGYGD Termo 2 LIFVRNGYGD SEQ ID NO: 73 LIFVRNGYGS SEQ ID NO; 77 LIFVRNGYGS SEQ ID NO: 83 LIFVRNGYGT SEQ ID NO: 83 LIFVRNGYGT SEQIDNO: 79 LIFVRNGYGD Termo LIFVRNGYGN Piro 2 LIFVRNGDSR CLONE A LIFMREGXGD Con-senso -IF-R-G---

SEQ ID NO: 81 451 VDKYVYSSGW Piro VDKYVESSGW SEQ ID NO: 73 IDKWVD5SGR Termo 2 IDKWVDSSGR SEQIDNO: 73 VDKWV DSSGW SEQ IDNO:T7 VDKWV DSSGW SEQ ID NO: 83 IDKYVSSSGW SEQ ID NO: 85 IDKYVSSSGW SEQIDNO: 79 VDKWVDSSGW Termo VDKYVGSNGH Piro 2 VDKRV DSSGW CLONEA VDRYVQYDGW Con-senso -D--V---G-

KPGLITYINL GSSKVGRHVY RPGLITYINL GSSKVGRHVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL ASSKAGRWVY KPGLITYINL GSSKVGRHVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKAGRWVY KPGLITYINL GSSKVGRHVY RPGLITYINL SPNWVGRWVY RPGLITYINL GStiMAERWVN -PGLITYINL......RWVVYFBAPAYDP ANGQYGYSVW VYLEAPAYDP ASGQYGYTVH VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGQYGYSVW VYLEAPAHDP ANGYYGYSVW VYLBAPAHDP ANGQYGYSVW VYLEAPAHDP ANGYYGYSVW VYLEAPAHDP AKGQYGY5VW VYLEAPPHDP ANGYYGYSVW VKLTAPPHDP ANGYYGYSVW V---AP--DP A-G-YGY-VW

45 0

V.PKFAGACI HEYTGNLGGW V.PKFAGACI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGSCI HEYTGSLGGW V.PKFAGACI HEYTGNLGGW V.PKFAGSCI HEYTGNLGGW V.PKFAGACI HEYTGNLGGW VGSKFAGYTI HEYTGNLGGW V--KFAG--I HEYTG-LGGW

407

SYCGVG*

SYCGVG *

SYCGVG*

SYAGVG*

SY-GVG*

19/116

FIG 14c:

SEQIDNO» SEQ O NO 15 SEQ ID NO 75 SEQIDNO; Π SEQIDNO 73 SEQIDNO 79 SEQIDNO. II

CLONE A Con-senso

---ATGAAGC CTGCGAAACT CCTCGTCTTT GTGCTCGTAG TCTCTATCCT

---ATGAAGA AGTTTCTCGC CCTGTTCATA ACCATGTTTT TCGTAGTGAG

ATGAGGAGAT CCGCAAGGGT TTTGGTTCTG ATTATAGCQT TTTTCCTCCT

SEQIDNO: «3 SEQ JD NO 15 SEQIDNO 75 SEQIDNO: π SEQIDNO 73 SEQIDNO 79 SEQIDNO II

CLONEA Con-senso

51 100 ___________-____________________________ATGGCTCTGG —____________________________________— ATGGCTCTGG

-------- ATGGCTCTGG

------------------------ ATGGCTCTGG

-----------—-----------------------ATGGCTCTGG

CGCGGGGCTC TACGCCCAGC CCGCGGGGGC GGCCAAGTAC CTGGAGCTCG CATGGCAGTC GTTGCACAGC CAGCTAGCGC CGCAAAQTAT TCCGAGCTCG GGCGGGGATT TACTACCCCT CCACOAGTGC CGCGAAGTAC TCCGAGCTGG

SEQIDNO 13 SEQIDNO 15 SEQIDNO 75 SEQIDNO 77 SEQIDNO 73 SEQ ID NO 79 SEQ1DNO.1I

CLONEA Con-senso

SEQIDNO 13 SEQIDNO» SEQIDNO 75 SEQIDNO 77 SEQIDNO 73 SEQIDNO 79 SEQIDNO II

CLONEÀ Con-senso

SEQIDNO:» SEQIDNO W SEQIDNO 75 SEQIDNO: 77 SEQIDNO 73 SEQIDNO 79 SEQIDNO»

CLONEA Con-senso

101

AAGAGGGCGG AAGAGGGCGG AAGAGGGCGG AAGAGGGCGG TAGAGGGCGG AAGAGGGCGG AAGAAGGCGG AGCAGGGCGG -----GGCGG

151

GGAATCTGGT

QGAATATGGT

GGAATCTGGT

GGAAT-TGGT

301

AGGAATCTCA

CGGCATTTCG

CGGGATTTCG

CGGAATCTCC

GGGAATATCC

AGGCATATCC

-GG-AT-TCGCTCATAATG

GCTTATAATG

GCTCATAATG

GCTTATAATG

CGTCATAATG

CCTTATAATG

AGTCATAATG

--T-ATAATG

GGGACACAAT

GGGACACCAT

GGGACACGAT

GGCACACGAT

GGGACACCAT

GGGACACAAT

GGGACACCAT

GGGACACAAT

GGGACAC-AT

GCGATATGGA

GCAATATOGA

GCCATTTGGA

GCCATCTGGA

GC-AT-TCGA

CAGGCCTTCT

CAGGCATTCT

CAGGCCTTCT

CAGGCOTTCT

CAGGCCTTCT

CAGGC-TTCT

AGCTCAAAAG AGCCCAGAAG AGCCCAGAAG AGCCCAGAAG AGCCCAGAAG ACGGCAGAAG CAGGAGCAAG ACGGCAGAAG ......-AAG

TTCCACCAGC

TTCCCCCCGC

TCCCTCCCGC

TTCCTCCCGC

TTCCCCCGGC

TTCCGCCAGC

TACCCCCGGC

T-CC-CC-GC

ACTGGGATGT

ATTGGGACGT

ACTGGGACOT

ACTGGGACGT

A-TGGGA-GT

ATACCCGAAT

ATACCCGACT

ATACCGGAGT

ATCCCTGAAT

AT-CC-GA-T

GAGTAAGGGC

GAGTAAGGGA

GAGCAAGGGT

GAGTAAGGGC

GAGCAAGGGC

CAGCAAGGGG

GAGCAAGGGC

-AG-AAGGG150

TCCTGGAGGA CCCAGGTGGA CCCCATGGGA CCCCATGGGA CCCAGGTGGA GCCTTCAGGA CCCAGGTGGA TCCGGAGGGA -CC----GGA

200

GGGCAAGTGC GGGCAAGTGC GQGCAAGCGC GGGCAAGOGC GGGCGA0CGC GGTACGATGC GGTAOGAGGC GGTACGATGC GG------GC

250

ATGAGCGCTC

ATGAGCGGTG

ATGAGCGGCG

ATGGGCGGCG

ATGAGCGGCG

ATGGGCGGGG

ATG-GCGG-G

21/116

FIG 14C(cont.)

SEQIDNO: 13 501 GGCCAACTAC SEQIDNO: S5 AGCCAACTAC SEQ ID NO; 75 GGCCAACTAC SEQ (D NO: 73 GGCCAACTAC SEQ 1DNO73 GGCCAACTAC SEQIDNO: 79 GGCCAACTAC SEQ IDN0-.8I TGCCAACTAC CLONE Λ GGCCCACTAC Con-senso -GCC-ACTAC SEQIDNO: 13 551 GTACCTTTGG SEQIDNO 55 GTACCTTTGG SEQ IDNO75 GAACATTTGG SEQIDNO: 77 GAACATTTGG SEQIDNO: 73 GAACATTTGG SEQIDNO: 7} GCACCTTTGG SEQIDNO: 11 GCACATTTGG CLONE A GAACCTTCGG Con-senso G-AC-TT-GG 601 SEQIDNO: 13 TACTGGCTCT SEQIDNO: 53 TACTGGCTCT SEQIDNO: 73 TACTGGCTCT SEQIDNO: 77 TACTGGCTCT SEQIDNO: 73 CACTGGCTCT SEQIDNO: 79 TACTGGCTCT SEQIDNO: 11 CACTGGCTCT CLONEA TACTGGCTCT Con-senso -ACTGGCT-T SEQIDNO: 51 651 AGGGGTTGAC SEQIDNO: U AGGGGTTGAC SEQIDNO: 75 CGGCATCGAC SEQIDNO: 77 CGGCATCGAT SEQIDNO: 73 CGGCATCGAC SEQIDNO. 79 CGGCGTTGAC SEQIDNO: 11 CGGCGTTGAT CLONEA AGGGATCGAT Con-senso -GG--T-GA- SEQIDNO: 13 701 TTGTTAACGA SEQ ID NO: U TTGTTAACGA SEQIDNO: 73 TCGTCAGGGA SEQIDNO: 71 TCGTCAAGGA SEQIDNO 73 TCGTTAAGAA SEQ 10 NO: 79 TCGTCAAGGA SEQIDNO: II TCGTCAAGGA CLONE A TCGTCAAGGA Con-senso T-GT-A---A

CTTGACTTCC ACCCAAACGA CTTGACTTCC ACCCAAACGA CTCGACTTCC ACCCGAACGA CTCGACTTCC ACCCGAACGA CTCGACTTCC ACCCGAACGA CTCGACTTCC ACCCGAACGA CTCGACTTCC ACCCGAACGA ATGGACTTCC ATCCAAACAA -T-GACTTCC A-CC-AAC-A

AGGKTACCCT GATATATGTC AGGATACCCT GATATATGTC AGGCTATCCC GACATATGCC AGGCTATCCC GACATATGCC AGGCTATCCC GACATATGCC AGGGTTCCCG GACATAGCCC AGGCTTCCCA GACATAGCCC TGGCTTCCCA GACATTOATC -GG-T--CC- GA-AT----C

GGGCGAGCAG CGAAAGCTAC GGGOGAGCAG CGAAAGCTAC GGGCCAGCCA GGAGAGCTAC GGGCCACCCA GGAGAGCTAC GGGÒCAGCAA CGAAAGCTAC GGGCGAGCAA CGAGAGCTAC GGGCGAGCGA TGAGACCTAC GGGCGAGCAA CGAGAGCTAC GGGC-ACC-- -GA-AGCTAC

GCCTGGCGTT TCGACTACGT GCCTGGTGTT TCGACTACGT GCCTGGCGCT TCGACTACGT GCCTGGCGCT TCGACTACGT GCCTGGCGCT TCGACTACGT GCATGGCGCT TCGACTACGT GCCTGGCGCT TTGACTACGT GCCTGGCGCT TTGACTACGT GC-TGG-G-T T-GACTACGT

CTGGCTCAGC TGOTGGGGAG CTGGCTCAGC TGGTGGGGAG CTGGCTGAAC TGGTGGGGAG CTGGCTGAAC TGGTGGGGAG CTGGCTGAAC CGGTGGGOCG CTGGCTGGAC TGGTGGGGAG CTGGCTCAAC TGGTGGGGCG CTGGCIGAGT CAOTGGGGCG CTGGCT.....-GTGOGG- G

550 gcttcactgt tgtgatgaac OCTTCACTGT TGTGATGAAC GCTCCACGCG GGCGATTCCG GCTCCATGCG GGCGATTCCG GCTTCACGCC GGCGATTCCG GGTCAAGTGC tgcgacgagg GGTCAAGTGC TGTGACOAGG CTACAGCACC TCAGACGAGG .............GA----G

600

ACGACAAAAG CTGGGACCAG ACGACAAAAG CTGGGACCAG ACGACAAGAG CTGGGACCAG ACGACAAGAG CTGGGACCAG ACGACAAGAG CTGGGACCAG ACGAGAAGAG CTGGGACCAG ACGACAAGAG CTGGGACCAG ACCTCGTGCC CTTCAACCAG AC........ CT---ACCAG

650

GCTGCCTACC TCAGGAGCAT GCTGCCTACC TCAGGAGCAT GCGGCCTATC TCAGGAGCAT GCGGCATATC TCAGGAGCAT GCCGCCTACC TCCGGAGCAT GCCGCCTACC TCAGGAGCAT GCCGCCTACC TAAGGAGCAT GCCGCCTACC TCAGGAGCAT GC-GC-TA-C T--GGAGCAT

700

CAAGGGCTAC GGAGCATGGG CAAGGGCTAC GGAGCCTGGG CAAGGCCTAT CCTCCCTGGG CAAGGGCTAT GCTCCCTGGG CAAGGGCTAC GCTCCCTGGG CAAGGGCTAC GGAGCGTGGG GAAGGGCTAC GGAGCGTGGG TAAGGGCTAC GGCGCCTGGG - AAGGGCTA- G---C - TGGG

750

GCTGGGCCGT TGGAGAGTAC GCTGCGCCCT TGGAGAGTAC GCTGGGCAGT TGGAGAGTAC CCTGGGCGGT TGGAGAGTAC GCTGGGOGGT TGGAGAGTAC GCTGGGCCGT CGGGGAGTAC GCTGGGCCGT TGGCGAOTAC GCTGGGCCGT CGGCGACTAC GCTGGGC-GT -GG-GACTAC

20/116

FIG 14C(cont.)

SEQIDNOEJ 251 GTTATTCCAT SEQIDNO 15 GTTATTCCAT SEQIDNO 75 GCTATTCGAT SEQ IDNO: 7? GCTATTCGAT SEQ U> NO 73 GCTATTCGAT SEQ ID NO. 79 CCTATTCGAT SEQ IDNO 11 GTTACTC GAT CLONEA CCTACTCGAT Con-senso --TA-TC-AT SEQIDNO:!) 301 TATCAGAAGG SEQ ID NO; ti TATCAGAAGG SEQ ©NO: 75 TACCAGAAGG SEQ ID NO 77 TACCAGAAGG SEQ ID NO 73 TACCAGAAGG SEQ ID NO. 79 GAOCAGAAGG SEQ IO NO 11 AACCAGAAGG CLONEA TACCAGAAGG Con-senso -A-CAGAAGG SEQIDNO» 351 GAACATGATA SEQ ID NO«5 GAACATGATA SEQIDNO: 71 AAACATGATA SEQIDNO: 77 AAACATGATA SEQIDNO: 73 GAACATGATA SEQIDNO. 79 GAACATGATA SEQIDNO: 11 CAATATGATA CLONEA CAACATGATC Con-senso -AA-ATGAT- SEQIDNO:!) 401 TAGTCATAAA SEQIDNO. ti TAGTCATAAA SEQIDNO7Í TAGTCATCAA SEQIDNO. 77 TAGTCATCAA SEQIDNO π TAGTCATCAA SEQIDNO. 79 TAGTAATCAA SEQlDNOc.tl TCGTCATAAA CLONE Λ TAGTGATAAA Consenso T-GT-AT - AA SEQIDNO 15 451 AACGACTATA SEQlDNOtU AACGACTATA SEQIDNO: 75 AACGACTATA SEQIDNO 77 AACGACTATA SEQIDNO·. 75 AACAGCTACA SEQIDNO-7? AATGACTACA SEQIDNOll GGGGACTACA CLONEA GGCGACTATA Con-senso -----CTA-A

GGGCTACGAT CCCTACGATT GGGCTACGAT CCCTACGATT GGGCTACGAC CCCTACGATT GGGCTACGAC CCCTACGATT GGGCTACGAC CCCTACGATT GGGCTACGAC CCCTACGACT GGGCTACGAT CCCTACGATT GGGCTACGAC CCCTACGATT GGGCIACGA- CCC1ACGA-T

GGACAGTTGA GACGOGCTTC GGACAGTTGA GACGCGCTTC GAACGGTGGA AACAAGATTC GAACGGTGGA AACGAGGTTC GAAGCGTTGA GACCCGCTTC GAACGGTAGA GACGCGCTTT GAACCATCGA AACGCGCTTT GAACCGTTGA GACCCGCTTC G-A---T-GA -AC—G-TTAACACCGCAC ACTCCTACGG AACACCGCAC ACTCCTACGG AACACCGCCC ACGCCTATGG AACACCGCCC ACGCCTATGG AACACCGCCC ATGCTCACAA AACACCGCCC ACGCCTACGO AACACCGCCC ATCCCTACGG TCCACGGCCC ACCAGTACGG --CAC-GC-C A-----A--CCACCGCGCC GGTGGAGACC CCACCGCGCC GGTGGAGGCC CCACCGCGCC GGCGGCGATC CCACCGCGCC GGCGGTGACC CCACCGCGCC GGCGGCGACC CCACCGCGCC GGAGGAGACC CCACCGCGCA GGCGGAGACC CCACCGCGCA GGTGGAGACC CCACCGCGC- GG-GG-O--C

CCTGGACAGA CTTCTCAAAA CCTGGACAGA CTTCTCAAAA CCTGGACCGA CTTCTCGAAG CCTGGACCGA CTTCTCAAAG CCTGGACCGA TTTCTCGAAG CCTGGACGGA CTTCTCGAAG CCTGGACGGA CTTCTCAAAG CCTGGACGGA CTTTTCTAAQ CCTGGAC-GA -TT-TC-AA300

TCTTTGACCT CGGCGAGTAC TCTTTGACCT CGGCGAGTAC ATTTTGACCT CGGTGAGTAC ATTTTGACCT CGGTGAGTAC TCTTCGACCT CGGTGAGTAC TCTTTGACCT CGGTGAGTAC TCTTTGACCT CGGCGAGTAC ACTTCGATCT GGGCGAGTTT --TT-GA-CT -GG-GAGT-350

GGCTCAAAGG AAGAACTGGT GGCTCAAAGG AAGAACTGGT GGCTCAAAGC AGGAGCTCAT GGCTCAAAGC AGGAGCTCAT GGATCAAAAG AGGAGCTTGT GGCTCCAAGC AGGAGCTCGT GGCTCTAAAC AGGAGCTCAT GGCTCCAAGG AAGAGCTCGT GG-TC-AA-- A-GA-CT--T

400

CATAAAGGTG ATAGCAGACA CATAAAGGTG ATAGCGGACA CATGAAGGTA ATAGCCGATA CATGAAGOTA ATAGCCGATA CATGAAGGTC ATAGCGGACA CATCAAGGTC ATCGCAGACA CATAAAGGTG ATAGCGGACA CKTCAAGGTT ATAGCGGACA CAT-AAGGT- AT-GC-GA-A

450

TTGAGTGGAA CCCCTTCGTG TCGAGTGGAA CCCCTTCGTG TGGAGTGGAA CCCCTTCGTG TGGAGTGGAA CCCCTTCGTG TGGAGTGGAA TCCTTTCACC TTGAGTGGAA CCCCTTCGTC TCGAGTGGAA CCCGTTCGTT TCGAATGGAA CCCATACGTC T-GA-TGGAA -OC-T-C--500

CTCGCCTCCG GTAAATATAC GTOGCCTCCG GTAAATATAC GTCGCOTCGG GTAAATACAC GTCGCGTCGG GTAAATACAC GÍCGCGTCGQ OCAAGTACAC GTCGCTTCCG CCAAGTACAC CTGGCCTCGG GCAAATATAC CTCGCCTCCG GGAAATACAA CT-GC-TC-G G-AA-TA-A22/116

FIG 14C(cont.)

SEQ IO NO: O 751 TGGGACACGA SEQIDNaU TGGGACACTA SEQ ID Na 71 TGGGACACCA SEQ ID Na 77 TGGGACACCA SEQ ID Na 71 TGGGACACCA SEQ ID Nft W TGGGACACAA SEQ ID Nail TGGGACACCA CLONEΛ TGGGACACCA Con-senso TGGGACAC-A SEQ ID Nfttí 801 CAAGGTCTTT SEQ ID NOU CAAGGTCTTT SEQ ID NO 71 CAAGGTCTTT SEQ ID NA 77 CAAGGTCTTT SEQ IDNO 73 TAAAGTCTTC SEQ ID Na 79 AAAAGTCTTC seqia na ii CAAGGTCITC CLONEA CAAGGTCTTC Con-senso -AA-GTCTT- SEQ ID Nau esi ACACCAACAT SEQlDNaU ATACCAACAT SEQ IDNO 7 J ACAACAACAT SEQ IDNO. 77 ACAACAACAT SEQ ID Na 73 ACAACAACAT SEQ 1D Na 79 ACAACAACAT SEQ ID Na 11 ACAAAAACAT CLONEA ACAAGAACAT Con-senso A-A--AACAT SEQ IDNOiU 901 GTCAGCCGCG SEQ IDNO lí GTCAGCCGCG SEQ IDNO; 7J GTCAGCCGCG SEQ ID Na 77 GTCAGCCGCG SEQ ID NO 71 GTCAGCCGCG SEQ ID NO-79 GTCAGCCGCG SEQ ίο καιι GTCTCCCCCG CLONE A GTCAGCAGGG Con-senso GTC--C- G-G SEQ ID Na lí 951 AGATATAATC SEQ ID Na U AGATATAATC SEQ ID »a 71 CGACATAATC 5EQ ID NO 71 CGACATAATC SEQ ID Na 73 CAACATAATC SEQ ID Na 79 GGACATAATT SEQ !D NOU CGATATAATC CLONEA GAACATAATC Con-senso --A-ATA AT-

acgttgatgc actcctcaac ACGTTGATGC ACTCCTCAAC ACGTCGACGC TGTTCTCAAC ACGTCGACGC TGTTCTCAAC ACGTCGATGC ACTCCTGAGC ACGTTGATGC ACTGCTCAAC ACGTTGATGC ACTCCTCAAC ACGTCGÃTGC gctcctcaac ACGT-GA-GC --T-CT-A-C

GACTTCCCGC TCTACTACAA GACTTCCCGC TCTACTACAA GACTTCGCCt TCTACTACAA GACTTCGCCC TCTACTACAA GACTTCCCGC TCTACTACAA GACTTCCCGC TCTACTACAA GACTTCCCGC TCTACTACAA GACTTCCCGC TCTACTACAA GACTTC-C-C TCTACTACAA

CCCGGCATTA GTOOATGCAC CCCCGCTTTG GTTTACGCCC TCCCGCCCTG GTGGACGCCC TCCCGCCCTG GTGGACGCCC CCCCGCCCTC GTGGACGCCC TCCCGCACTC GTCOAGGCCC TCCAGCGCTC GTCTCTGCCC TCCCGCCCTC GTTTACGCCA -CC-GC--T- GT----GC- ATCCCITCAA GGCGGTAACT ACCCATTCAA GGCGGTAACT ACCCGTTCAA GGCTGTGACG ACCCGTTCAA GGCTGTGACG ACCCGTTCAA AGCCGTGACC ACCCGTTTAA GGCCGTAACC ACCCGTTCAA GGCCGTAACC ATCCCTTCAA GGCCGTTACC A-CC-TT-AA -GC-GT-ACTGGAACAAGT ATCCGGCTTA TGGAACAAGT ATCCGGCTTA TGGAACAAGT ATCCAGCCTA TGGAACAAGT ATCCAGCCTA TGGAACAAGT ATCCGGCCTA TGGAACAAGT ACCCGGCCTA TGGAACAAGT ACCTTGCTTA TGGAACAAGT ACCCTGCCTA TGGAACAAGT A-C--GC-TA

800

TGGGCATACA GCAGCGGCGC TGGGCATACA ACKGCGGCGC TGGGCATACT CGAGCOGTGC TGGGCATACT CGAGCGGTGC TGGGCCTACG ACAGCGGTGC TGGGCCTACT CGAGOGATGC TGGGCCTACT CGAGCGGCGC TGGGCCTACA GCAGCGGCGC TGGGC-TAC- --AGOG--GC

850

GATGGACGAA GCCTTCGACA GATGGACGAA GCCTTCGACA GATGGACGAG GCCTTCGATA GATGGACGAG GCCTTCGATA GATGGACGAG GCCTTCGATA GATGGACQCG GCCTTTGACA GATGGATGAG GCCTTTGACA GATGGACGAG GCCTTTGACA GATGGA-G-- GCCTT-GA-A

900

TCAGATACGG CCACACAGTG TCAAGAATGG CGGGACAGTG TCAGATACGG CCAGACAGTG TCAGATACGG TCAGACAGTG TCAAGAACGG AGGCACGGTC TCAAGAACGG GGGCACAGTC TTCAGAACGG CCAGACTGTT TCCAGAACGG TGAAACCGTC T.....A-GG ----AC-GT950

TTCGTTGCCA ACCACGATAC TTCGTTGCCA ACCACGATAC TTTGTAGCCA ACCACGATAC TTTGTAGCCA ACCACGATAC TTCGTTGCCA ACCACGATAC TTCGTTGCAA ACCACGACAC TTTGTAQCAA ACCACGACAC TTCGTGGCTA ACCACGATAC TT-GT-GC-A ACCACGA-AC

1000

TGCATTCATC CTTACCTATG TGCATTCATC CTTACCTATG OGCOTTCATC CTCACCTACG CGCGTTCATC CTCACCTACG CGCCTTCATC CTCACCTATG CGCCTTCATC CTCACCTACG TGCTTTCATC CTCACCTACG TGCCTTCATC CTCACCTACG -GC-TTCATC CT-ACCTA-G

23/116

FIG 14C(cont.)

SEQID NO: U 1001 AGGGACAGCC SEQID NO: 15 AGGGACAGCC SEQ 1D NO: 75 AGGGCCAGCC SEQ ID NO: 77 AGGGCCAGCC SEQIDNCfctt AGGGACAGCC SEQID NO: 79 AGGGCCAGCC SEQID NO:«( AAGGCCAGCC CLONE A AAGGTCAGCC Con-senso A-GG-CAGCC SEQID NO: 13 1051 GATAAGCTTA SEQ ID NO 15 GATAAGCTTA SEQ ID NO: 7J GACAAGCTCA SEQ ID NO: 77 GATAAGCTCA SEQID NO 73 GACAGGCTCA SEQ ID NO*. 79 GACAGGCTCA SEQ ID NO: 11 GACAGGTTGA CLONE A GACAAACTCA Con-senso GA-A---T-A SEQ IDNCh 13 1101 TACTGACATT SEQ ID NO: 15 TACTGACATT SEQ J D NO: 75 CACTGACATC SEQ ID NO 77 CACTGACATC SEQ ID NO. 73 CACAGACATC SEQ ID NO: 79 CACCGACATA SEQIDNOrH CACGAGCATA CLONEΛ CACCAAGATC Con-senso -AC----AT- SEQ ID NO 13 1151 GCTATGGCAC SEQID NO IS . GCTATGGCAC SEQ ID NO: 71 GCTACGGAAG SEQIDNO-77 GCTACGGAAG SEQ ID NO: 73 GCTACGCGGA SEQ 1DNO:79 GCTACGGGGA SEQIDNO: 1( GCTATGGAAG CLONE A GCTACGGCGA Con-senso GCTA-GG--- SEQID NO:» 1201 AAAGTTGGAA SEQID NO. U AAAGCTGGAA SEQID NO 75 AAACCCGGAA SEQ ID NO 77 AAACCCGGAA SEQID NO: 73 AAGGCCOGAA SEQID NOe 79 AAGGCCGGGA SEQID NO: 11 AAGGTTGGAA CLONEA TGGGCGGAGA Con-senso ---G--G--A

TGTTATATTC TACCGCGACT TGTTATATTC TACCGCGACT GACAATATTC TACCGCGACT GACAATATTC TACCGCGACT GCCAATATTC TACCGCGACT GACGATATTC TACCGCGACT CGTCATATTT TACCGCGACT CGTCATCTTC TACCGCGACT — -AT-TT- TACCGCGACT

ACAACCTCAT CTGGATACAC ACAACCTCAT CTGGATACAC AGAACCTCAT CTGGATACAT AGAACCTCAT CTGGATACAT GGAACCTCAT CTGGATACAC AGAACCTCAT CTGGATACAC ACAACCTCAT ATGGATACAC ACAACCTCAT ATGGATTCAC --AACCTCAT -TGGAT-CAGTTTACTACG ACAGCGACGA GTTTACTACG ACAGCGACGA GTTTACTACG ACAACGACGA GTTTACTACG ACAACGACGA ATCTACTACG ACAGCGACGA GTCTACTACG ATAACGATGA GTTTACTACG ACAGCGACGA GTCTACTACG ACGACGATGA -T-TACTACG A---CGA-GA

CAAACCAGGA CTGATAACCT CAAACCAGGA CTGATAACCT CAAGCCGGGA CTGATAACAT CAAGCCGGGA CTGATAACAT CAAGCCGGGA CTGATAACCT CAAGCCGGGG CTTATAACCT CAAGCCTGGC CTTATAACTT CAGGCCCGGG CTTATAACCT CA--CC-GG- CT-ATAAC-T

GGTGGGTCTA CGTT. - .CCA GGTGGGTCTA CGTT. . .CCA GGTGGGTTTA CGTT. . .CCG GGTGGGTTTA CGTT. . .CCG GGTGGGTCTA CGTT, . .CCG GGTGGGTCTA CGTT. . .CCG GGTGGGTTTA TGTG. .. CC G GATGGGTGAA CGTTGGCTCA G-TGGGT- -A -GT-----C1050

ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG ACGAGGAGTG GCTCAACAAG

1100

GATCACCTTG CTGGAGGGAG GATCACCTTG CTGGAGGGAG GACAACCTCG CCGGAGGGAG GACAACCTCG CCGGAGGGAG GACCACCTCG CGGGAGGAAG GACCACCTCG CCGGTGGAAG GACCACCTCG CAGGTGGAAG GAGCACCTGG CAGGGGGAAG GA--ACCT-G C-GG-GG-AG

1150

GCTTATCTTT GTGAGAAACG GCTTATCTTT GTGAGAAACG GCTGATATTC GTGAGAAACG GCTGATATTC GTGAGAAACG GCTTATCTTC GTGAGAAACG ACTCATCTTC GTCAGGAACO GATGATTTTC GTGAGGAACG GCTCATCTTC ATGAGGGAAG --T-AT-TT- -T-AG--A-G

1200

ATATCAACCT CGGCTCAAGC ATATCAACCT CGGCTCAAGC ACATCAACCT CGGCTCAAGC ACATCAACCT CGCCTCAAGC ACATCAACCT CGGCTCAAGC ACATCAACCT AGGCTCGAGC ACATCAACCT CGGCTCCAGC ACATCAACCT CGGTAGCGAC A-ATCAACCT -G.......C

1250

AAGTTCGCCG GTTCATGCAT AAGTTCGCCG GTTCATGCAT aagttcgcag gctcgtgcat AAGTTCGCAG GCTCGTGCAT AAGTTCGCAO GCTCGTGCAT AAGTTCGCCG GAGCGTGCAT AAGTTCGCGG OCGCGTGCAT AAGTTCGCCG GCTATACAAT AAGTTCGC-G G.......AT

24/116

FIG 14C(cont)

SEQ ID NO:» 1251 CCACGAGTAC SEQIDNO:» CCACGAGTAC SEQ IDNO 7' ACACGAGTAC SEQ IDNO:77 ACACGAGTAC SEQIDNO: 73 ACACGAGTAC SEQ IDNO: 79 CCACGAGTAC SEQIDNO:» CCACGAGTAT CLONE A CCACGAATAC Con-senso -CAOGA- TA- SEQIDNO:» 1301 CCAGCGGCTG SEQIDNO:» CCAGCGGCTG SEQ IDNO: 7i CAAGCGGCTG SEQ IDNO: 77 CAAGCGGCTG SEQ ID Ntt 73 CAAGCGGTCG SEQ IDNO; 79 CAAGCGGGTG SEQ IDNO: 11 CAAGCGGCTG CLONEA ACGACGGCTQ Can-senso ----CGG--G SEQIDNO;» 1351 TACTACGGCT SEQIDNO;» CAGTATGGCT SEQIDNO: 7J CAGTACGGCT SEQ IDNO: π CACTACGGCT SEQ IDNO: 73 CACTACGGCT SEQ 1D Na 79 TATTACGGCT SEQ IDNO II CAGTATGGCT CLONE A TATTACGGCT Con-senso -A-TA-GGCT

ACCGGCAACC TCGGOGGTTG ACCGGCAGCC TQGGCGGTTG ACCGGCAACC TCGGCGGCTG ACCGGCAATC TCGGCGGCTG ACCGGCAACC TCGGCGGCTG ACCGGCAACC TCGGCGGCTG ACTGGTAACC TCGGAGGCTG ACCGGAAACC TCGGCGGCTG AC-GG-A- -C TCGG-GG-TG

GGTCTATCTT GAGGCCCCAG GGTCTACCTT GAGGCCCCGG GGTTTACCTC GAGGCTCCTG GGTCTACCTC GAGGCTCCTG GGTCTACCTT. GAGGOCCCCG GGTCTACCTC GAGGCCCCTG GGTCTATTTC GAAGCTCCAG GGTCAAGCTT ACCGCTCCGC GGT--A- - T -GC-CC- ACTCCGTATG GAGCTACTGC ACTCCGTCTG GAGCTATTGC ACTCCGTTTG GAGCTATTGC ACTCCGTCTG GAGCTACTGC ACTCCGTATG GAGCTACTGC ACTCCGTCTG GAGCTACTGC ACTCCGTGTG GAGCTATTGC ACTCCGTCTG GAGCTACGCC ACTC-GT-TG GAGCTA---C

1300

GATAGACAAG TACGTCTCCT GATAGACAAG TACGTCTCCT GGTGGACAAG TGGGTGGACT GGTGGACAAG TGGGTGGACT GATTGACAAG TGOGTTGACT GGTGGACAAG TGGGTGGACT GGTAGACAAG TACGTCTACT GGTCGACAGG TACGTCCACT G-T-GACA-G T--GT----T

1350

CCCACGACCC GGCGAACGGC CCCACGACCC GGCCAATGGC CCCACGACCC GGCCAACGGC CCCACGACCC GGCCAACGGC CCCACGACCC GGCCAACGGC CCCACGACCC GGCCAACGGC CTTACGACCC TGCCAACGGG CACACGATCC GGCAAACGGC C--ACGA-CC -GC-AA-GG-

GGGGTTGGGT 1393 GA- GGGGTTGGGT GA- GGTGTTGGGT GA- GGTGTTGGGT GA- GGTGTTGGGT GA- GGGGTGGGCT GA- GGTGTTGGGT GA- GOAGTTGGAT GA- GG-GT-GG-T GA-

25/116

FIG 15

100

CRI

OR4 GR3 —T. profundo pT. bAnKMÍ T.Oikx

Ί>.~φ.ΚΩ1>]

T. pepftwjphíbj

T.’»p. SM-2

T. xtetteri •T. hydrxilicmiitís rl % de diferença de sequência

CRI T. «ter J 2% ORÍ P.furcMU 7J% T. ccfcr P. nino» 4.9£

T racxirahs o,. |_j—T- íumicobot ” »· T. üioralit —T. tmrúpbilus iP. horíkoshiijsq lp. tbfikauxcq p-P. abvMt L— P. füriwjw

-7--7-M. fcmdu

M. iincui ₄ „ .

—-—7-M. thumnltlh.

A. rulgufau

Valores tirados por 100 replicados

Suramil A fcron. Οος>-5ο Βαοπΰ Pt II. ir jwvk
26/116

FIG 16

SEQ ID NO.: 1 atggcaaagtattccgagctcgaagagggcgggctcataatgcaggccttctactgggacgtecccatgggaggaatctggtgggacacgat agcccagaagataeccgactgggeaagcgccgggatttcggcgaiatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggáacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgacUucctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcateggcatcgatgcctggcgcttcgactacgteaagggctacggagcgtgggtegtcaaggactggctggactg gtegggaggctgggccgtcggggagtactgggacacaaacgttgatgcac^ctcaactgggcxtactcgagcgatgcaaaagtcttcgactt cccgctctactacaagatggacgcggcctttgacaacaagaaeattcccgcactcgtcgaggcccteaagaacgggggcacagtcgtcagcc gcgacccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgag ggccagccgacaatattcuccgcgactacgaggagtggctcaacaaggaíaagctcaagaacctcatctggatacatgacaacclcgccgg aggaagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataaçatacatcaa cctcgccícaagcaaagccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggt ggacaagtgggiggactcaagcggctgggtetacctcgaggctcctgeccacgacccggccaacggccagtacggctactccgtctggagc tactgcggtgttgggtga

SEQ Π) NO.: 2

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Tip Asp Vai Pro Met Gly Gly 11c Trp Trp Asp Thr Ile Ala Gin Lys He Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala lie Tip De Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai De Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp De Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser De Gly De Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Alo Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr íle Phe Tyr Arg Asp Tyr Glu Glu Tip Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp De His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu De Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr De Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys De His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gtn Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 3 atggccaagtacctggagctcgaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagataçccgactgggcaagcgccgggatttcggcgata tggattc ccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgaUaacaccgcccacgccUcggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaacccct tcgtcaatgactacacctggacggacttctcgaaggtcgcttccggcaagtacacggccaaitacctcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaaetggt ggggaggctgggeggttggagagiaetgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgac ccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcciacgcgttcatcctcacctacgagggcc
27/116

Fig 16(cont.) age cgacaatattc taccgcgactac gaggagtggctcaacaaggataagctcaagaac ctc atctggatac atgacaac ctcgcc ggag ga agcaclgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctc gcctcaagcgaagccggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtgg acaagtggglggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctartacggctactccgtctggagctatt gcggtgttgggtga

SEQ ID NO.: 4

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Tip Asp Vai Pro Met Gly Gly Ile Trp Tip Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp lie Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser He Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Tip Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr He Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Tip Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp He Vai Tyr Tyr Asp Asn Asp Glu Leu He Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr TyT Ile Asn Leu Ala Ser Ser Glu Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 5 a tggccaa gtactcc gagctgga agagggcggc gtta taatgca ggc ette tactgggacgtcccaggtgga ggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcaagcaagggeatgggcggcgcctattcgatg ggctacgacccctacgacrtctttgacctcggtgagtacgacçagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgactatacclggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacclcgacttccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagjactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgalgcctggcgcttcgaclacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtac tggga c acc aacgtcgac gctgttctcaactgggcatactcgagcggtgcca aggtctttgac ttcg cccrctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttglctcccgcgac ccgttcaaggccglaacctttgtagcaaaccacgacaccgatataatctggaacaagtaccttgcttatgctttcatcctcacctacgaaggccag cccgtcatattctaccgcgaccacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaag caccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggc tcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagacaB gtacgtctactcaagcggctgggtctatctcga agctc c agcttac gac cc tgccaacgggcagta tggctactccgtgtggagcta ctgcggg gtgEÊdga

SEQID NO.: 6

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Va] Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Va] Ile Ala Asp He Vai He Asn His Arg Ala Gly Gly
28/116

Fig I6(cont.)

Asp Leu Glu Tip Asn Pro Phe Vai Asn Asp Tyr Thr Tip Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Tip Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp His Glu Glu Tip Leu Asn Lys Asp Arg Leu Asn Asn Leu He Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr lie Asn Leu Gly Ser Ser Lys Ala Gly Arg Tip Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 9 atggccaagtactccgagctggaagagggcgggctcalaatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagaegcgctttggctccaagçaggagctcgtgaa catgátaaac acggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccac cgcgcaggcggagac ctc gagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactaccicgactlccacccgaacgagctccatg cgggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggc atcgatgcctggcgcttcgactacgtcaagggctatgc tccctgggtc glcaa gga ctggctgaa ctggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgactícg ccctctac tacaagatggac gaggocttcgataacaacaacattcccgccctggtggac gccctca gatac ggtcagacagtggtcagccgcg acccgttcaaggctgtgacgtttgtagcçaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggc cagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacotcgccggagg aagcactga ca tcgtttactacgacaac gacgagc tgatattcgcgagaaacggctacggaa gcaagc cgggact gata aca taca tcaacct cgcctcaagcaaagccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtgg acaagtgggtggactcaagcggctgggtetacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctac tgcggtgttgggtga

SEQ IDNO.: 10

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Tip Tip Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Tip Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai He Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Va] Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyi Tip Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Tip Gly Gly Tip Ala Vai Gly Glu Tyr Tip Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Tip Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Ala Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ue Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu
29/116

Fig 16 (cont.)

Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pm Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 11 atggccaagtacctggagctçgaggagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggartcccccggcgagcaagggcatgggcggcgcctottcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagaegcgctttggctccaagcaggagctcglgaa _Catgataaacaccgeccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaaíacacggccaactacctogacttccacccgaacgagctccatgc gggcgattccggaa catttggaggc tatcccgacatatgccacgac aagagctgggaccagtactggctctgggccagccaggaga gctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggacgaggccttcgataacaacaacatícccgccctggtggacgccctcagatacggtcagacagtggtcagccgcg a cccgttcaaggctgtgac gtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcaccta cgagggc cagccgacaatattctaccgcgactacgaggagtggctcaacaaggatacgctcaagaacctcatctggatacatgacaacctcgccggagg aagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctaíggaagcaagcctggccttataacttacatcaacctc ggctcgagcaaggttggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtgg acaagtgg gtggac tcaagcgggtgggtgtacctcgaggcccctgcccacgaccc ggccaac ggctattacggcUctccgtctggagctac tgcggtgttggctga

SEQ ID NO.: 12

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Tip Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met lie Asn Thr Ala Hís Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala TyT Leu Arg Ser He Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu TyT TyT Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala TyT Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr lie Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Thr Leu Lys Asn Leu Ile Tip Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Giy Vai Gly SEQIDNO.: 13 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggiacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtatgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaac atgataaacacggcacatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgtt

CÊ^ttÊÊÊ6^actaCacctgg^acggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagtg ctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagcigggaccagcactggctctgggcgagcgatgagagctac gccgcctacctaaggagcatcggcgttgalgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg

EtÊÊgK^gctgggccglcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgactt
30/116

Fig 16(cont.) cccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacacc gatataalc iggaacaagtatcca gcc tacgcgttcatcctcacctacgaggg ccagccgacaatattc tac c gcgactac gaggagtggctcaacaagg ataagctcaagaacc tcatctgga lacatgacaacctcgcc ggag gaagcactgacatagtctactacgataacgatgaactcattttcgtcaggaacggctacggggacaagccggggcttaTaaccucatcaacct aggctcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtauctggtaacctcggaggctgggtag acaagtacgtctactcaagcggcigggtctatclcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactg cggtgttggcíga

SEQ ED NO.: 14

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr He Arg Gin Lys He Pro Glu Trp Tyr Asp Ala Gly lie Ser Ala He Trp Ile Pro Pro Ala Ser Lys Gly Mel Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu TyT Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala TyT Gly He Lys Vai Ile AlaAsp Ile Vai De Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala SerGly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp lie Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp TyT Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn Hís Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr TyT Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu lie Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys He His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ IDNO.: 15 atggceaagtactccgagctggaagagggcgggçtcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagaiacccgactgggcaagcgccgggalttcggcgatatggattcccccggcgagcaagggcatgggcggcgectattcgatg ggciacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacalcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttcteaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatg cgggcgattc cggaacatttggaggctatcçc ga cata tgccacgacaaga gctgggaccagtactggctc tgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgalgcctggcgctícgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg gtggggaggctggficcgtcggggagtactgggacacaaacgttgatgcactgcicaactgggcctactcgagcgatgcaaaagtcttcgactt cecgctctactacaagatggatgaggcctttgacaaca aaaacattceagcgctcgtc 1 ctgcc cttcagaac gg ccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatttggaacaagtacccggcctacgccttcatcctcacctacgaggg ccagccgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcalctggatacacgaccaccttgccggtg gaagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacc tcgcctcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggclgggtag acaagtacgtctactcaagcggctgggtetatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgc ggtgttgggtga

SEQ IDNO.: 16

Met Ala Lys TyT Ser Glu Leu Glu Glu Gly Gly Leu lie Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp
31/116

Fig 16(cont,)

Leu Gly Glu Tyr Asp Gin LysGly Thr Vai Glu Thr Aig Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai He Ala Asp He Vai lie Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp De Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr He Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr He Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQEDNO-: 17 atggcc aagtactcc gagctggaagggggc gggc tc ataatgcaggçcttc tactgggac gtcçc catgggaggaatctggtgggacacga t agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgaettctttgacetcggtgagtacgaccaggagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccalgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacecg ttcgttggggactacacctggacggacttctcaaaggtggcctc gggcaaatatactgcca a c ta cctc ga cttcca ccccaac gaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggac c agca ctggctctgggcgagcgatgagagc ta cgccgcciacctaaggagcatcggcgttgatgcctggegcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggact g gtggggaggctgggc cgtcggggagUctgggacacaaac gttgaigcacígclcaactgggcctartcgagc gatgeaaaa gtcttcgac ttccc gctctactacaaga tggacgcggcctttgacaacaagaacattcccgcact cgtcgaggccctca aga a cgggggcaeagtcgtcagc cgcgacccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacga gggccagccgacaatattetaccgcgaciacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccg gaggaagcac gagcata gtttactacgacagcgacgaga tgatcttc gtgaggaa cggct atggaagc aagcc tggccttataac ttac ate aa cctcggctcgagcaaggttggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggclgggt ggacaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggciactccgtctggagc tactgcggtgttgggtga

SEQ ID NO.: 18

Met Ala Lys Tyr Ser Glu Leu Glu Gly Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly lie Trp Trp Asp Thr He Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala lie Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Glu Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys SeT Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp lie His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai
32/116

Fig 16 (cont.)

Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Tip Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQIDNO.: 19 atggccaagtacctggagctcgaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatttcggcgatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctacgattattttgaccttggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagaccrcgagtggaacccgttc gttggggactacacctggacggacttctaaaaggtggcctcgggcaaatatactgccaactacctegacttccacccgaacgagctccatgcg ggcgattc cggaacatttggag gctateccgacatatgccacgacaagagctgggaccagtactggctctgggccagccagga gagcUcgc ggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtgg ggggEctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgcc ctctacta caagatggatgaggcctttgacaacaaaaaCattccagcgctcgtctdgc ccttcâgaacggccagactgttgtctcccgcgac c c gttcaaggcc gtaacctttgtagcaaaccacgacaccgatataattíggaac aagtaçccggcctac gccttcatcctcacctac gagggccag ccgac gatattctacc gcgacta cgaggagtggctcaac aaggacaggctcaagaacctcatctggat acacga ccacc tcgcc ggtggaag cactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctegc ctcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgfgcatccacgagcatactggtaacclcggaggctgggtagaca agtac gtetactcaagcggctgggtc tatctcgaa gctccagcttacgaccctgccaacgggcagtatg gctactcc gtgtggagc tactgcgg tgttggctga

SEQ ID NO.: 20

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp lie Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu His Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Tip Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 21 atggccaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattccteccgggagcaagggtatgagcggcggctattcgatgg

Ê^ctacgacccctacgatgatttggacctgggtgagtactaccagaagggaacggtggaaacgaggttcggcícaaagcaggagctcataaac atgataaacacggcccatgccucggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgtt ^cÊ^ttEÊÊg^acíacacctgg^acggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagclccatgc gg£cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac
33/116

Fig 16 (cont) gcggtatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactg gtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgçaaaagtcttcgactt cccgctctactacaagaíggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtclcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgalataatttggaacaagtacceggcctacgccttcatcctcacctacgaggg ccagccgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacclcatctggatacacgacUcctcgccggtg gaagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacc tcgcctcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtag acaagtacgtctac tcaagc ggctgggtctatctcgaagctccagcttacgaccc tgccaacgggcagtatggctactccgtgtggagcta ttgc ggtgttggctga

SEQ ID NO.: 22

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pm Gly Gly Gly He Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Gly Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Asp Leu Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met He Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Re Ala Asp Ile Val Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Vai Tyr Leu Arg Ser Re Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn He Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vad Ala Asn His Asp Thr Asp Ile lie Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Re Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Re His Asp Tyr Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Re Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu He Thr Tyr Re Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 23 atggccaagtactccgagctggaagagggcggcgttatagtgcaggccttciactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagetcgtgaa c atgataaacacggcccatgcctacggca taaaggtcata gcgga calcgtcataaaccaccgcgcaggcggagacctcgagtggaa cccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttceacccgaacgagctccatg cgggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggclggactg gígggga&ÊCtgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgactt cccgctctactacàagatggatgaggcctttgacaacaaaaacattccagcgclcgtctctgccctteagaacggccagaclgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccaçgacaccgatataatctggaacaagtatccagcctacgcgttcatccicacctacgaggg ccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacclcgccggag gaagcatgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttalaacttacatcaacctc ggctcgagcaaggttggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtgg acaagtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctaclccgtctggagctatt gcggtgttggctga

SEQ ID NO.; 24
34/116

Fig ι 16 (cont.)

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Vai Gin Ala Phc Tyr Tip Asp Vai Pro Gly Gly Gly He Trp Tip Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala SeT Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys G1 n Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp lie Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn TyT Leu Asp Phe His Pro Asn Glu Leu H is Ala Gly A sp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Tip Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe VaLAla Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe He Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe.Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu He Trp He His Asp Asn Leu Ala Gly Gly Ser Met Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Tip Vai Asp Lys Τη) Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 25 atggccaagtacctggagctcgaagagggcgggctcataatgcaggccttctactgggacgtccccatgggaggaatctggtgggacacgat agcccagaagatacccgactgggcaagcgccgggatitcggcgatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctocgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaaccccttcgt gaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaa ata cacggcca actacctcgacttccacccgaac gagctccatgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcgg catatctcaggagcatcggca tcgatgcctggcgcttc gactac gtcaagggc tatgc tccctgggtcgtcaaggactggctgaactggtgggg aggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctc tactacaagatggacgaggccttcgataacaacaacattcccgccctggtgggcgccctcagatacggtcagacagtggtcagccgcgaccc gttcaaggctgtgacgtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccagc cgacaatattctaccgcgactacgaggagtggclcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaagc accgacatagtctactacgataacgatgaactcatcttcgtcaggçacggctacggggacaagccggggcttataacçtacatcaacciaggct cgagcaaggccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaa gt gggtggac teaagcggc tgggtctacctc gaggctcctgc ccacga ccc ggccaa c ggcc agtacggctac tccgtctggagctattgcg gtgttgggtga

SEQ 1D NO.: 26

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Met Gly Gly Ile Τη) Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala SeT Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly TyT Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Τη> Asn Pro Phe VaJ Asn Asp Tyr Thr Τη) Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys TyT Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Τη> Asp Gin Tyr Τη> Leu Τη) Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Τη) Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Τη) Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr SeT Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr TyT Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Gly Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp

Fig 16(cont)
35/1)6

Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ue Ue Tip Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai TyT Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg His Gly Tyr Gly Asp Lys Pro Gly Leu lie Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Τηρ Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin TyT Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO-: 27 atggcaaagtattccgagctcgaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccatc aggagcaagataccggagtggtacgaggcgggaa tatee gccatttggattcctcccgcgagcaagggtatgagcggcggctatlcgaíggg ctacgacccctac gattattttga cctc ggtgagtactaccagaagggaac ggtggaaacg aggttc ggctcaaagcagga gctcataaacatg ataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgc aggc ggagacctcgagtggaaccc gttcgt tggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcgg catalctcaggagcatcggcategatgccíggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtgggg aggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccclc tactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagccgcgaco cgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccag ccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaag cactgacatcgtttactacgacaac gacgagctgatattegt gagaa acggctacggaa gcaagccgggactgataacatacalcaacctcgc gtcaagcaaagccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggclgggtggaca agtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctactgc ggtgttgggtga

SEQ ID NO.; 28

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai He Met Gin Ala Phe TyT Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ue Arg Ser Lys Ue Pro Glu Trp Tyr Glu Ala Gly 11 e Ser Ala Ue Trp Ue Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met lie Asn Thr Ala His Ala Tyr Gly Ile Lys Vai He Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu AlaLeu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ue Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ue Phe TyT Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ue Vai Tyr Tyr Asp Asn Asp Glu Leu He Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ue Asn Leu Ala Sct Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ue His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin TyT Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQID NO.: 29 atggccaagtacctggagctcgaagagggcgggctcataatgcaggccrtctactgggacgtccccatgggaggaatctggtgggacacggt agcccagaaga tacccga ctgggcaagcgccgggatttcggcgatatggattcecccggcga gcaagggca tgggcggc gccta tregatg ggctacgacccctacgacttcrttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagclcgtgaa
36/116

Fig 16 (cont.)

Catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtgglctcgggcaaautactgccaactacctcgacttccacccgaacgagctccalgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaaciggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg cccictac tacaagatggatgaggccrttgacaacaaaaa cattccagcgc tcgtctctgcccttcagaacggccagac tgttgtc tccc gc gac ccgtteaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtaccttgcttatgcctlcatcctcacctacgaaggccag cccgtcatattctaccgcgactacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcagggggaag caccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacgg£gacaagccggggcttataacctacatcaacctaggc tcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagacaa gtacgtetactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctactgcggt gttgggtga

SEQIDNO.: 30

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Tip Asp Vai Pro Met Gly Gly Ile Trp Ττρ Asp Thr Vai Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Be Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai He Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Vai Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu TyrTrp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Be His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Va] Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr TyT Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 31 atggcaaagtactccgagclggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaggataccggagtggtacgaggcgggaatatccgccatttggatlcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacaicgtcataaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttclcaaaggtggcctcgggcaaatatactgccaactacclcgacttccacccgaacgagctccatg cgggcgattccggaacarttggaggclatcccg acata tgccacgacaagagctgggaccagtaclggctctgggccagccaggagagctac gcggcatatctcaggagcatcggcatcgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactgg tgÊgÊCggctgggccgttggcgagtactgggacaccaacgttgatgcacicctcaactgggcctactcgagcggcgccaaggtcttcgacttc ccgctetactacaagatggacgaggccttcgataacaacaacattcccgccctggtggacgecctcagatacggtcagacagtggtcagccgc gaçccgttcaaggctgtgacgtttgtagccaaccacgataccgatauatctggaacaagtatccagcctacgcgttcalcctcacctacgaggg ccagccgacaatattetaccgcgactaegaggagtggctcaacaaggaiaagctcaagaacctcatctggatacatgacaacctggccggag gaagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaccggctatggaagcaagcctggccttataacttacatcaacct cggctcgagcaaggttggaaggtgggtttatgtgccgaagttegcgggcgcgtgcatccacgagtâtactggtaacclcggaggctgggtaga caagtacgtctactcaagcggctgggtctatctcgaagctccagcttaçgaccctgccaacgggcagtatggctactccgtgtggagctattgcg gtgtlggctga
37/116

Fig 16 (cont)

SEQ ID NO.: 32

Met Ala Lys Tyr Ser GIu Leu Glu Glu Gly Gly Vai IIe Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Ttp Trp Asp Thr Ile Arg Ser Arg lie Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala He Trp lie Pto Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met He Asn Thr Ala His Ala Tyr Gly He Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser He Gly lie Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Tip Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr SeT He Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Thr Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQIDNO-: 33 âtggccaagtactccgagctggaagagggcggggtcataaigcaggcgttctoctgggacgtgccttcaggaggaalatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcc cgc gagcaagggtatgagcggcggc tattc gatgg gctacgacccctac gattattttgacctcggtga gtactac cagaagggaacggtggaaac gaggttc g gctcaaa gcaggagctcataaacat gataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttc gttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaaegagctccatgcg ggc gattccggaac atttgg aggctatcccgac ata tgc cacgacaagagctgggaecagtactggctctgggccagccaggagagctacgc ggcatatctcaggagcatcggcatcgatgcctggcgctttgactacgtgaagggctacggagegtgggtcgtcaaggactggctcaactggtg gggcggctgggccgrtggcgagtactgggacaccaacgrtgatgcactcctcaactgggcctaetcgagcggcgccaaggtcttcgactttcc gctctactacaagatggacgcggccrttgacaacaagaacattcccgcactcgtcgaggccetcaagaacgggggcacagtcglcagccgeg acccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaccaagtaccttgcttatgctttcatcctcacctacgaaggcca gcccgtcatattctaccgcgactacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaag caccgacatagtetactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacctaggc togagcaaggccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaa glÊÊgtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctactgcg gtgrtggctga

SEQID NO.: 34

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala lie Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly ThT Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met He Asn Thr Ala His Ala Tyr Gly Ile Lys Vai lie Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Ήιτ Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Va] Asp Ala

Fig ló(cont.)
38/116

Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Thr Lys Tyr Leu Ala Tyr Ala Phe lie Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Ttp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 35 atggccaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagataccggagtggtacgaggcgggaatatccgccatttggattcecccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccc tacgactíctttgacctcggtgagtaegacc agaagggaacggtagaga cgc gctttggc tc caagcaggagctcgtgaa catgataaacaccgcccacgcctâcggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaacccct tcgtcaatgactacacctggacggacttctcgaaggtcgcttccggcaagtacacggccaactacctcgacttccaccccaacgaggtcaagtg ctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctac gccgcctacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggt ggggaggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcg ccctctactacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcgaggccctcaagaacgggggcacagtcgtcagccgc gacccgtttaaggccgtaacc ttcgttgcaaaccacgaca c cga tataatctggaa caagtatccagcctacgc gttc atcc tcac ctacgaggg ccagccgacaatattctaccgcgactâcgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacgtcgccggag gaagcaccgacatagtctactacgataacgatgaactcatcttcgteaggaacggctacggggacaagccggggcttataacctacatcaacct aggctcgagcaaggccggaaggtgggtttacgttecgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtgg acaagtgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccaglacggctactccgtctggagctac tgcggtgttgggtga

SEQ ID NO.: 36

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai He Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala lie Trp Ile Pro Pro Ala SeT Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu lie Trp Ile His Asp Asn Vai Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tip Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 71 atggcc aagtacctggagc tcgaagagg gcgg ggtcalaatgcaggcgttctactgggac gtgcc ttcaggaggaatatggtgggac acaat

Fig 16 (cont.)
39/116 acggcagaagataccggagtggtacgatgccggaatctccgcaatatggatícccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgacccctacgacttcttlgacctcggtgagtacgaccagaagggaacggtagagacgcgctttggctccaagcaggagctcgtgaa ca tga taaacac ggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccac cgcgcaggcgga gacctc gagtggaacccg ttcgrtggggactacacctggacggacttctcaaaggtagcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatg cgggcgartccggaacatttggaggctatççcgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagclac gc ggçatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaa gggcta tgctccctgggtcgtcaaggac tg gctgaac tggt ggEgaÊgctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtcttt gac ttcg ccctetactacaagatgga tgaggcctttgacaacaaaaaca ttccagcgctcgtctc tgcccttcagaacggccagactgtt gtctcccgcgac ccgttcaaggccgtaacctttgugcaaaccacgacaccgatataalctggaacaagtatccagcctacgcgttcatcctcaccracgagggcc agccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgcc£gagga agcactgacatcgttíactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacalacatcaacctc gcctcaagcaa age c ggaa ggtgggtttatgtgccgaagttcgcgggcgcgtgc atccacgagtaiaclggtaacctcggaggçtgggtaga caagtacgtctactcaagcggctgggictatctcgaagctccagcttacgaccctgccaacgggcagtatggcUctccgtgtggagctactgc

Êgggtgggctga

SEQID NO.: 72

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly He Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ata Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai He Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe Hís Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly He Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ata Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr He Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu He Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu He Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu lie Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn G ly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 49 gtggtttatgacgatgtccgctatgacctttatgccgtaggcatg ggccgtgtttatcatgtt c aegage tcctgcttggagcca aa gc gc gtctct accgttcccttctggtcgtactcaccgaggtcaaagaagtcgtaggggtcgtagcccalcgaataggcgccgcccatgcccttgctcgccggg ggaatccatatcgccgaaatcccggcgcttgcccagtcgggtatcttctgggctatcgtgtcccaccagattccicccatggggacgtcccagta gaaggcctgcattatgagcccgccctcttcgagcccggaatactttgccataagttacctcciactagUgattaaaattctgtttcctgtgtgaaatt

SEQ ID NO.; 50

Vai Vai Tyr Asp Asp Vai Arg Tyr Asp Leu Tyr Ala Vai Gly Met Gly Arg Vai Tyr His Vai His Glu Leu Leu Leu Gly Ala Lys Ala Arg Leu Tyr Arg Ser Leu Leu Vai Vai Leu Thr Glu Vai Lys Glu Vai Vai Gly Vai Vai Ala His Arg Ile Gly Ala Ala His Ala Leu Ala Arg Arg Gly Asn Pro Tyr Arg Arg Asn Pro Gly Ala Cys Pro Vai Gly Tyr Leu Leu Gly Tyr Arg Vai Pro Pro Asp Ser Ser His Gly Asp Vai Pro Vai Glu Gly Leu His Tyr Glu Pro Ala Leu Phe Glu Pro Gly Ile Leu Cys His Lys Leu Pro Pro Thr Ser Arg Leu Lys Phe Cys Phe Leu Cys Glu Ile Vai

Fig l6(coní)
40/1J6

SEQ ID NO.: 51 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactggg acgtgccttcaggaggaatatggtgggacacaatacggcagaagataccggagtggt acgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgc ctattcgatgggctacgacccctacgacttctttgacctcggtgagtacgaccagaag ggaacggtagagacgcgctitggctccaagcaggagctcgtgaacatgataaacacc gcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcg gtgacctggagtggaaccccttcgtgaacgactatacctggaccgacttctcaaaggt cgcgtcgggtaaatacacggccaactacctcgacttccaccccaacgaggtcaagtgc tgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggac cagcactggctctgggcgagcgatgagagctacgccgcctacctaaggagcatcggcg ttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactg gctcaactggtggggcggctgggccgttggcgagtactgggacaccaacgitgatgca ctcctcaactgggcctactcgagcggcgccaaggtcttcgacitcccgctctactacaa gatggatgaggccittgacaacaaaaacattccagcgctcgtctctgcccttcagaac ggccagactgttgtctcccgcgacccgttcaaggccgtaacctttgtagcaaaccacg acaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattcjaccgcgactacgaggagtggctcaacaaggataagctcaag aacctcatctggatacatgacaacctcgccggaggaagcactgacatcgtttactacg acaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataa catacatcaacctcgcctcaagcaaagccggaaggtgggtttacgttccgaagttcgc aggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaagtgggtg gactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagt acggctactccgtctggagctattgcggtgttggctga

SEQ ID NO.: 52

MAKYLELEEGGVIMQAFYWDVPSGGIWWDTIRQKIPEWYDAGISAIWIPPASKGMGGAYS

MGYDPYDFFDLGEYDQKGTVETRFGSKQELVNMINTAHAYGMKV1ADIVINHRAGGDLE wnpfvndytwtofskvasgkytanyldfhpnevkccdegtfggfpdiahekswdqhwl wasdesyaaylrsigvdawrfdyvkgygawwkdwlnwwggwavgeywdtnvdal lnwayssgakvfdfplyykmdeafdnknipalvsalqngqtwsrdpfkavtfvanhdt diiwnkypayafiltyegqptifyrdyeewlnkdklknliwihdnlaggstdivyydndeli fvrngygskpglityinlasskagrwvyvpkfagsciheytgnlggwvdkwvdssgwvy leapahdpangqygysvwsycgvg

SEQ ID NO.: 37 atggccaagtacclggagctcgaagagggcggggtcataaigcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcalgggcggcgcctattcgatg ggctacgacccctacgacttctttgacctcggígagtacgaccagaagggaacggtagagacgcgctnggctccaagcaggagctcgtgaa catgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacdggagtggaacccctt cgtgaacgactaiacctggaccgacttctcaaagglcgcgtcgggtaaatacacggccaactacctcgacltccacccgaacgagctccatgc gggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtaciggctctgggccagccaggagagctac gcggcatatctcaggagcafcggcatcgatgcctggcgctttgactacgtgaagggctacggagcgcgggtcgtcaaggactggctcaacig gtggÊgcggctgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgactt cccgctctactacaagatggatgaggccmgacaacaaaaacattccagcgclcgtctctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatattciatcgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggagg aagcactgacatcgtttactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacçt cgcclcaagcaaagccggaaggtgggtttacgttccgaagttcgcaggctcgtgcaiacacgagtacaccggcaatctcggcggctgggtgg
41/116

Fig l6(cont.) acaagtgggtggactcaagcggctgggtctacctogaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctac tgcggggtggÊgtg³

SEQ ID NO.: 38

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai He Mel Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Iíe Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly He Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai He Ala Asp Ile Va] Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly He Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Arg Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp He His Asp Asn Leu Ala Gly Gly Ser Thr Asp lie Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 39 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagiggtacgatgccggaatctccgcaatatggattcctcccgcgagcaggggtatgagcggcggctattcgatgg gctacgacccçtacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacaccgcccacgcctatggcatgaaggtaatagccgatatagteatcaaccaccgc gccggcggtgacctggagt ggaac cccttcgt gaacgac tatacc tg gaccgacttctcaaaggtcgcgtegggtaaatacacggc caactacctcgacttccaccc gaacga gctcc atgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgcgg catatctcaggagcatcggtatcgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactggtggg geggctgggccgttggcgagtactgggaccccaacgttgatgccctcctcccctgggcctactcgagcggcgccaaggtcttcgacttcccgc tctactaeaagatggatgaggcc tttgacaacaa aaacattccagcgc tcgtctctgc ccttcag aacggcc agactgttgtc tcccgcgacccg ttcaaggccgtaacctttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccagcc gacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaagca ccgaca ta gtctacta c gataa cgatgaactcatcttcgtca ggaac ggctacggggacaagccggggcttata acctacatc aacctaggc tc gagcaaggccggaaggtgggtctacgttocgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtggacaa gtSKgtgE^tcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctacíccgtctggagctactgcg ggglgggctga

SEQ ID NO.: 40

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Tip Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly lie Ser Ala Ile Trp Ile Pro Pro Ala Ser Arg Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Mel Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn Hís Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Τη) Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala
42/116

Fig 16 (cont.)

Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Pro Asn Vai Asp Ala Leu Leu Pro Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp lie Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu He Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Τη) Ser Tyr Cys Gly Vai Gly

SEQIDNO.: 41 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctac gattatttt gacctcggtgagtactaccagaagggaac ggtggaaacgaggttcggctcaaagcaggagc Ic ataaacat gataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttc gttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccacccgaacgagctccatgcg ggcgattccggaacaatggaggctatcccgacatatgccacgacaagagctgggaccagtactggctctgggccagccaggagagctacgc ggcatatctcaggagcatcggcatcgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactggtg gggcggctgggccgttggcgagtactRRgacaccaacKttEatRcactcctcaactRgEcctactcRaEcgEcgccaagEtcttcgacttccc gctctac tacaagatggacgcggcctttgacaacaagaacattcccgcactcgtcga ggcc ctcaagaacgggggcacagtcgtca gccgcg acccgtttaaggccgtaaccttc gttgcaaacc acga caccgatataatctggaacaagtatc cagcctacgcgttcatcctcacc tacgagggc cagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggagg aagcacgagcatag^ttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttecalcaacctc ggctc gagcaaggttggaaggtgggtttatgtgcc gaa gttcgcgggcgcgtgcatccacgagta tac tggtaacctcggaggctgg gta gac aagtacgtctactca a gcggctgggtctatctcgaagctcca gcttacgaccctgecaacgggcagtatggcta c tccgtglggagctactgcg gtgttgggtga

SEQIDNO.: 42

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala lie Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai He Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Τφ Gly Gly Τφ Ala Vai Gly Glu Tyr Τφ Asp Thr Asn Vai Asp Ala Leu Leu Asn Τφ Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Τφ Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Τφ Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Τφ Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Τφ Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Τφ Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Τφ Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Τφ Ser Tyr Cys Gly Vai Gly
43/116

Fig 16 (cont.)

SEQ ID NO.: 43 atggccaagtactccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggac accat caggagcaagataccggagtggtacgaggcgggaaUtccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgaccectacgacttctttga cctcggtgagtacgaccagaaggg&acggtagagacgcgctttggctccaagcaggagctcgtgaa catgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcaíaaaccaccgcgcaggcggagacctcgagtggaacccg ttcgttggggactacacctggacggacttctcaaagglggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagcta cgccgcctacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggact ggtggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgac ttcc c gctctactacaagatggatgaggc ctttgac aacaaaaacattccagc gc tc gtctc tgccc ttcagaac ggccaga ctgttgtctcccgc gacccgttcaaggccguacctttgtagcaaaccacgacaccgautaatctggaacaagtatccagcctacgcgttcatcctcacctacgagg gccagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggatacaígacaacçtcgtcggag gaagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacct cggctcgagcaaggttggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtgg acaagtgggtggactcaagcggctgggtctacctcgaggctectgeccacgacccggccaacggccagtacggctactccgtctggagctac tgcggtgttggctga

SEQ ID NO.: 44

Met Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala He Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyi Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met He Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp He Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Mel Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Vai Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Mel IU Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr He Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ IDNO.: 45 atggccaa gtactccgacc tggaagagggcggc gttataatgcaggccttctactgggacgtcccaggtggagga atctggtgggac accat caggagcaagataccggagtgglacgaggcgggaatatccgccatttggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctacgaccectacgacttctttga cctcggtgagta cgacc agaagggaacggtagagacgcgc ttt gg ctce aagcaggagctcgtgaa calgataaacacggcccatgcctacggcataaaggtcatagcggacatcgtcauaaccaccgcgcaggcggagacclcgagtggaacccg ttcgttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagcta cgccgcctacctaaggagcatcggcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactg gtgggg^cgg^ctggg^cc gtt ggcga gtactgggac ac caac gttga tgca ctc ctcaactgggcc tactc g age ggcgc caaggtc ttcg actt cecgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtclctgcccttcagaacggccagactgttgtctcccgcg acccgttcaaggccgtaacctttgtagcaaaccacgacaccgatalaatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg c ca gc cgac aatattctacc gcgactac gaggagtggctcaacaaggataagctcaagaacctcatctgga tac atgacaacctc gcc ggag
44/116

Fig 16 (cont.) gaagcaccgacatagtctactacgataacgatgaactcatcttcgtcaggaacggctacggggacaagccggggcttataacctacatcaacct aggctcgagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggclgggtag acaagtacgtctactcaagcggctgggtetatcicgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgc ggtgttgggtEa

SEQ ID NO,: 46

Mel Ala Lys Tyr Ser Asp Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp lie Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met He Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai He Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp He Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser He Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile He Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys He His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 47 atggccaagtaeaccgagctggaagagggcggcgttataatgcaggccttctactgggacgtcccaggtggaggaatctggtgggacaccat caggagcaagatacc ggagtggta cgaggcgggaalatccgccatttggattcccccggcgagcaagggcatgggcggc gcc tattegatg ggctacgacccctacgacttctttgacctcggtgagtacgaccagaagggaacggiagagacgcgctttggctccaagcaggagctcgtgaa çatgataaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggtgacctggagtggaacccctt cgtgaacgaclatacctggaccgacttc tcaaaggtcgc gtc gggtaaatacacggccaactacctcgac ttc caccccaa c gaggtcaagtg ctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctac gccgcctacctaaggagcatcggcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggaclggctcaactgg tgggÊ^c6g^tlgggcc gttggcgagtactgggacaccaa cgtt gatgcactc ctcaactgggc ctactcgagcggcgc c aaggtcttcgacttc ccgctctactacaagatggatgaggcctttgacaacaaaaacattccagcgctcgtclctgcccttcagaacggccagactgttgtctcccgcga cccgttcaaggccgtaacctttgtagcaaaccacgacaccgatataatctggaacaagtaccttgcttaigcttlcatccícacctacgaaggcca gcccgtcatattctaccgcgactacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaag cacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttalaacttacatcaacctcggct cgagcaaggttggaaggtgggtttacgttccgaagttcgcaggcccgtgcatacacgagtacaccggcaatctcggcggcigggtggacaag tgggtggactcaagcggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagclactgcgg tgttgggtag

SEQ ID NO.: 48

Met Ala Lys Tyr Thr Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr lie Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys

Fig 16 (cont.)
45/1¼

Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Tip Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser He Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai'Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Mel Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Pro Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tip Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQIDNO.; 53

ATGGCCAAGTACTCCGAGCTGGAAGAGGGCGGCGTTATAATGCAGGCCTTCTACTGGG

ACGTCCCAGGTGGAGGAATCTGGTGGGACACCATCAGGAGCAAGATACCGGAGTGGT

ACGAGGCGGGAATATCCGCCATTTGGATTCCCCCGGCGAGCAAGGGCATGGGCGGCG

CCTATTCGATGGGCTACGACCCCTACGACTTCTTTGACCTCGGTGAGTACGACCAGAA

GGGAACGGTAGAGACGCGCTTTGGCTCCAAGCAGGAGCTCGTGAACATGATAAACAC

GGCCCATGCCTACGGCATAAAGGTCATAGCGGACATCGTCATAAACCACCGCACAGGC

GGAGACCTCGAGTGGAACCCGTTCGTTGGGGACTACACCTGGACGGACTTCTCAAAGG

TGGCCTCGGGCAAATATACTGCCAACTACCTCGACTTCCACCCCAACGAGGTCAAGTG

CTGTGACGAGGGCACATTTGGAGGCTTCCCAGACATAGCCCACGAGAAGAGCTGGGA

CCAGCACTGGCTCTGGGCGAGCGATGAGAGCTACGCCGCCTACCTAAGGAGCATCGGC

GTTGATGCCTGGCGCTTCGACTACGTCAAGGGCTACGGAGCGTGGGTCGTCAAGGACT

GGCTGGACTGGTGGGGAGGCTGGGCCGTCGGGGAGTACTGGGACACAAACGTTGATG

CACTGCTCAACTGGGCCTACTCGAGCGATGCAAAAGTCTTCGACTTCCCGCTCTACTAC

AAGATGGATGAGGCCTTTGACAACAAAAACATTCCAGCGCTCGTCTCTGCCCTTCAGA

ACGGCCAGACTGTTGTCTCCCGCGACCCGTTCAAGGCCGTAACCTTTGTAGCAAACCA

CGACACCGATATAATCTGGAACAAGTATCCAGCCTACGCGTTCATCCTCACCTACGAG

GGCCAGCCGACAATATTCTACCGCGACTACGAGGAGTGGCTCAACAAGGATAAGCTCA

AGAACCTCATCTGGATACATGACAACCTCGCCGGAGGAAGCACTGACATCGTTTACTA

CGACAACGACGAGCTGATATTCGTGAGAAACGGCTACGGAAGCAAGCCGGGACTGAT

AACATACATCAACCTCGCCTCAAGCAAAGCCGGAAGGTGGGTCTACGTTCCGAAGTTC

GCGGGAGCGTGCATCCACGAGTACACCGGCAACCTCGGCGGCTGGGTGGACAAGTGG

GTGGACTCAAGCGGGTGGGTGTACCTCGAGGCCCCTGCCCACGACCCGGCCAACGGCT

ATTACGGCTACTCCGTCTGGAGCTACTGCGGTGTTGGCTGA

SEQ ID NO/. 54

MAKYSELEEGGVIMQAEYWDVPGGGIWWDTIRSKIPEWYEAG1SA1WIPPASKGMGGAYS

MGYDPYDFFDLGEYDQKGTVETRFGSKQELVNMINTAHAYGIKVIADIVJNHRTGGDLEW

NPFVGDYTWTDFSKVASGKYTANYLDFHPNEVKCCDEGTFGGFPD1AHEKSWDQHWLW

ASDESYAAYLRS1GVDAWRFDYVKGYGAWWKDWLDWWGGWAVGEYWDTNVDALL

NWAYSSDAKVFDFPLYYKMDEAFDNKNIPALVSALQNGQTVVSRDPFKAVTFVANHDTD

IIWNKYPAYAnLTYEGQPTIFYRDYEEWLNKDKLKNLIWIHDNLAGGSTDIVYYDNDELIF

VRNGYGSKPGLITYINLASSKAGRWVYVPKFAGACIHEYTGNLGGWVDKWVDSSGWVY

LEAPAHDPANGYYGYSVWSYCGVG

SEQ ID NO/ 55
46/116

Fig 16 (cont.) atggccaagtacctggagctcgaggagggcggggtcataatgcaggcgttctactggg acgtgccttcaggaggaatatggtgggacacaatacggcagaagataccggagtggt acgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgc ctattcgatgggctacgacccctacgacttctttgacctcggtgagtacgaccagaag ggaacggtagagacgcgctttggctccaagcaggagctcgtgaacatgataaacacc gcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcg gtgacctggagtggaaccccttcgtgaacgactatacctggaccgacttctcaaaggt cgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgcg ggcgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggacc agtactggctctgggccagccaggagagctacgcggcatatctcaggagcatcggcat cgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactgg ctcaactggtggggcggctgggccgttggcgagtactgggacaccaacgttgatgcac tcctcaactgggcctactcgagcggcgccaaggtcttcgacttcccgctctactacaag atggatgaggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacg

GCCAGACTGTTGTCTCCCGCGACCCGTTCAAGGCCGTAACCTTTGTAGCAAACCACGA

CACCGATATAATCTGGAACAAGTACCTTGCTTATGCTTTCATCCTCACCTACGAAGGCC

AGCCCGTCATATTCTACCGCGACTACGAGGAGTGGCTCAACAAGGACAGGTTGAACAA

CCTCATATGGATACACGACCACCTCGCAGGTGGAAGCACGAGCATAGTTTACTACGAC

AGCGACGAGATGATCTTCGTGAGGAACGGCTATGGAAGCAAGCCTGGCCTTATAACTT

ACATCAACCTCGGCTCGAGCAAGGTTGGAAGGTGGGTTTACGTTCCGAAGTTCGCAGG

CTCGTGCATACACGAGTACACCGGCAATCTCGGCGGCTGGGTGGACAAGTGGGTGGAC

TCAAGCGGCTGGGTCTACCTCGAGGCTCCTGCCCACGACCCGGCCAACGGCCAGTACG

GCTACTCCGTCTGG AG CTATTGCGGTGTTGGCTG A

SEQ IDNO.: 56

MAKYLELEEGG VTMQ APYWDVPSGGIWWDTIRQKIPEWYD AGIS AIWIPPASKGMG GAYS

MGYDPYDFFDLGEYDQKGTVETRFGSKQELVNMTNTAHAYGMKVIADIVINHRAGGDLE

WNPFVNDYTWTDFSKVASGKYTANYLDFHPNELHAGDSGTFGGYPDICHDKSWDQYWL

WASQESYAAYLRSIGIDAWRFDYVKGYGAWWKDWLNWWGGWAVGEYWDTNVDALL

NWAYSSGAKVFDFPLYYKMDEAFDNKNIPALVSALQNGQTWSRDPFKAVTFVANHDTD

I1WNKYLAYAFILTYEGQPVIFYKDYEEWLNKDRLNNLIWIHDHLAGGSTSIVYYDSDEMIF

VRNGYGSKPGLITYINLGSSKVGRWVYVPKFAGSCIHEYTGNLGGWVDKWVDSSGWVYL

EAPAHDPANGQYGYSVWSYCGVG

SEQ ID NO.: 57

ATGGCCAAGTACCTGGAGCTCGAAGAGAGCGGGGTCATAATGCAGGCGTTCTACTGGG

ACGTGCCTTCAGGAGGAATATGGTGGGACACAATACGGCAGAAGATACCGGAGTGGT

ACGATGCCGGAATCTCCGCAATATGGATTCCTCCCGCGAGCAAGGGTATGAGCGGCGG

CTATTCGATGGGCTACGACCCCTACGATTATTTTGACCTCGGTGAGTACTACCAGAAGG

GAACGGTGGAAACGAGGTTCGGCTCAAAGCAGGAGCTCATAAACATGATAAACACCG

CCCACGCCTACGGCATCAAGGTCATCGCAGACATAGTAATCAACCACCGCGCCGGAGG

AGACCTTGAGTGGAACCCCTTCGTCAATGACTACACCTGGACGGACTTCTCGAAGGTC

GCTTCCGGCAAGTACACGGCCAACTACCTCGACTTCCACCCCAACGAGGTCAAGTGCT gtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggacc

AGCACTGGCTCTGGGCGAGCGATGAGAGCTACGCCGCCTACCTAAGGAGCATCGGCGT

TGATGCCTGGCGCTTTGACTACGTGAAGGGCTACGGAGCGTGGGTCGTCAAGGACTGG

CTC AACTG G TGGGGTG GCTGGGCCGTCGGGGAGTACTGGG AC A CAA ACGTTGATGC AC

TGCTCAACTGGGCCTACTCGAGCGATGCAAAAGTCTTCGACTTCCCGCTCTACTACAAG

ATGGACGAGGCCTTCGATAACAACAACATTCCCGCCCTGGTGGACGCCCTCAGATACG

GTCAGACAGTGGTCAGCCGCGACCCGTTCAAGGCTGTGACGTTTGTAGCCAACCACGA
47/116

Fig 16 (cont) taccgatataatctggaacaagtaccttgcttatgctttcatcctcacctacgaaggcc

AGCCCGTCATATTCTACCGCGACTACGAGGAGTGGCTCAACAAGGACAGGTTGAACAA

CCTCATATGGATACACGACCACCTCGCAGGTGGAAGCACTGACATCGTTTACTACGAC

AACGACGAGCTGATATTCGTGAGAAACGGCTACGGAAGCAAGCCGGGACTGATAACA

TACATCAACCTCGCCTCAAGCAAAGCCGGAAGGTGGGTCTACGTTCCGAAGTTCGCGG

GAGCGTGCATCCACGAGTACACCGGCAACCTCGGCGGCTGGGTGGACAAGTGGGTGG

ACTCAAGCGGGTGGGTGTACCTCGAGGCCCCTGCCCACGACCCGGCCAACGGCTATTA

CGGCTACTCCGTCTGGAGCTATTGCGGTGTTGGCTGA

SEQ ID NO.: 58

MAKYLELEESGVIMQAFYWDVPSGGIWWDriRQKIPEWYDAGISAJWIPPASKGMSGGYS

MGYDPYDYFDLGEYYQKGTVETRFGSKQEUNMINTAHAYGIKVIADIVINHRAGGDLEW npfvndytwtdfskvasgkytanyldfhpnevkccdegtfggfpdlahekswdqhwlw

ASDESYAAYLRSIGVDAWRFDYVKGYGAWWKDWLNWWGGWAVGEYWDTNVDALL nwayssdakvfdfplyykmdeafdnnnipalvdalrygqtwsrdpfkavtfvanhdtd nWNKYLAYAFILTYEGQPVIFYRDYEEWLNKDRLNNLIWIHDHLAGGSTDIVYYDNDELIF

VRNGYGSKPGLITYINLASSKAGRWVYVPKFAGACIHEYTGNLGGWVDKWVDSSGWVY

LEAPAHDPANGYYGYSVWSYCGVG

SEQ ID NO.: 59 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcctcccgcgagcaagggtatgagcggcggctattcgatgg gctacgacccctocgattattttgaccteggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gataaacacc gcccacgcctac ggcatc aaggtcategcagacatagtaatcaaccacçgcgc cggaggagaccttga gtggaacccc ttcg tcaatgactacacctggacggacttctcgaaggtcgettccggçaagtacacggccaactacctcgacttccacccgaacgagctccatgcgg gegattccgg aacatttggaggcta tcccgac atatgccacgacaagagctgggaccagtactggctctgggc ca gcca ggagagc tacgcg gcatatctcaggagc atcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaa ggactggc tgaactggtggg gaggc tgggc ggttggagagtactgggacaccaa cgtc gacgctgttctcaactgggca tactcgagcggtgc caagglc tttgac ttcgccct ctactacaagatgga cgaggccttcgataacaacaac attcccgccctggtggacgc cctcagat acggtcaga cagtggtc agccgcgac c cgrtcaaggctgtgacgtttgtagccaaccacgataccgatataamggaacaagtacccggcctacgccttcatcctcacctacgagggccag ccgacgatattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatctggatacacgaccacctcgccggtggaag cactgacatcgttiactacgacaacgacgagctgatattcgtgagaaacggctacggaagcaagccgggactgataacatacatcaacctcgc gtcaagcaaagccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagaca agtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgcggt gttgggtga

SEQ ID NO.: 60

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai He Met Gin Ala Phe Tyr Trp Asp Vai Pro Scr Gly Gly Be Trp Trp Asp Thr Ile Aig Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Be Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Pbe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Be Lys Vai Ile Ala Asp lie Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Τη) Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Τη) Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr
48/116

Fig 16 (cont.)

Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr lie Asn Leu Ala Ser Ser Lys Ala Gly Arg Tip Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Va] Tip SeT Tyr Cys Gly Vai Gly SEQIDNO.: 61 atggccaagtactccgagctgaaaaagggcggggtcataatgcaggcgttetactgggacgtgccttcaggaggaatatggtgggacacaal acggcagaagataccggagtggtacgaggcgggaatatccgccatttggattcctcccgcgagcaagggtaTgagcggcggctattcgatgg gctacgaccectacgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacat gat aaaca ccgcccacgcc tacggcatcaaggtcatc gcagaca tagtaatcaaccacc gegccg gaggagaccttgagtggaaccc cttcg tcaatgac tacacctg gacggacttctcgaaggtcgcttccggcaagtacacggccaactacctcaacttccacccgaa cga gctccatgcgg gc gattccggaacatttggaggctatcccgac atatgc c acgacaagagctgggacca gtactggctctgggccagc cagga gagctacgcg gcatatctcaggagcatcggcatcgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactggtg gggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgacttccc gctctactacaagatggatgaggcctttgacaacaaaaacattc;cagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgacc cgttcaaggccgtaacctttgtagc aaaccatgacacc gatataatctggaacaagtatccagccta cgcgttc atcctcac ctacgagg gc cag ccgacaatattctaccgcgactacgsggagtggctcaacaaggataagctcaagaacctcatctggatacatgacaacctcgccggaggaag cacc gacatagtclaclacg ataacgatgaactcatc ttcgtc ag gaacggctac ggggacaagccggggcttataacctacatcaa cctaggc tcgagcaaggccggaaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtggaca ^agígÊg^t6g^actcaag^cEgg^tggg^tÊ^tacctcB^agÊ^cccctÊ^cccacE^acccgg^ccaacgE^ctattacgg^ctactccg^tctgg^agctactgc ggggtgggctga

SEQ IDNO.: 62

Met Ala Lys Tyr Ser Glu Leu Lys Lys Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Àla His Ala Tyr Gly lie Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser G ly Lys Tyr Thr Ala Asn Tyr Leu Asn Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Be Gly He Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Tip Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe He Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp lie Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ ID NO.: 63 atggccaagtacctggagctcgaagagggcgggglcataatgcaggcgttctactgggacgtgccttcaggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatg ggctac gacccc tac gacttctttgacctcggtgagtacgaccagaagggaacggta gagacgcgc tttggct ccaagcaggagc tcgt gaa catgalaaacacggcccatgcctacggcataaaggccatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccg
49/116

Fig 16 (cont.) ttcgtlggggactacacctggacggacttctcaaaggtggcctcgggcaflatatactgccaactacctcgacttccaccccaacgaggtcaagt gctgtgacgagggcacatttggaggcttcccagacatagcccacgagaagagctgggaccagcactggctcígggcgagcgatgagagcta cgccgcctacctaaggagcatcggcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactg gtggggcggctgggccgttggcgagtactgggacaccaacgttgatgcactcctcaactgggcctactcgagcggcgccaaggtcttcgactt cccgctctactacaagatggacgc ggcc tttgacaâcaagaacattcccgcactcgtcgaggccctÇBagaacgggggcacagtcgtca gcc gcgacccgtttaaggccgtaaccttcgttgcaaaccacgacaccgatataatctggaacaagtaiccagcctacgcgttcatcctcacctacgag ggcçagccgacaatattctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctggaucatgacaacctcgccgg aggaagcaccgacatagtctactacgataacgatgaactcatettcgtcaggaacggctacggggacaagccggggcttataacctacatcaa cctaggctggagcaaggccggaaggtgggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctggg tagacaagtacgtctactcaagcggctgggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagcta ctgcggggtggggtga

SEQIDNO.: 64

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai lie Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Tip Trp Asp Thr He Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met He Asn Thr Ala His Ala Tyr Gly Ile Lys Ala Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Tip Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Tip Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Al a Leu Leu Asn Tip Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr TyT Lys Met Asp Ala Ala Phe Asp Asn Lys Asn lie Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys TyT Pro Ala TyT Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr He Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Trp Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQIDNO.: 65 atggccaagtactccgagctggaagaaggcggcgttauatgcaggccttctactgggacgtcccaggtggaggaatctggtggggcaccat caggagcaagalaccggagtggtacgaggcgggaa tatee gcc atttggattcctcccgcgagcaagggtatgagcggcggctartcgatgg gctacgacccctacga ttattttgacc tcggt gagtactaccagaagggaac ggtggaa ac ga ggttcggc tcaaagcaggagc tcata aac at galaaacaccgcccacgcctatggcatgaaggtaatagccgatatagtcatcaaccaccgçgccggcggtgacctggagtggaaccccttcgt gaacgactatacctggaccgacttctcaaaggtcgcgtcgggtaaatacacggccaactacctcgacttccacccgaacgagctccatgcggg cgattccggaacatttggaggctatcccgacatatgccacgacaagagctgggaccagtaçtggctctgggccagccaggagagctocgcgg catatctc aggagc atcggcatcgatgcctggcgc ttcgacta cgtc aagggctatgctccctgggt cgtcaaggactggctgaac tggtgggg aggctgggcggttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgac«cgcccic tactacaagatggac gaggc cttcgataacaacaacattcccgccctggtggac gcc ctcagatac ggtcagaca gtggtca gccgcgaccc gttcaaggctgtga cgtttgtagccaaccacgata ccgatataatttggaac aa gtacccggcctac gccttcatcctcacctacgagggccagc cgacgalattctaccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatctggatacacgaccacctcgccggtggaagc ac ga gcatagtttacta cgacagc gacgagatgatcttc gtga ggaacggc tatggaa gcaagcctggcctta taacttacatc aacc tcggctc gagcaaggttggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaagl gfig^t6E^actcflaÊ^cggctgggtctacctcgaggctcctgcccacgacccggccaacggccagtacggctactccgtctggagctartgcggt gttggctga
50/116

Fig l6(cont.)

SEQIDNO.: 66

Met Ala Lys Tyr Ser Glu Leu GIu Glu Gly Gly Vai lie Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Gly Thr Ile Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly He Ser Ala Ile Trp He Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu He Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai Ue Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Tip Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu-Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn He Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile He Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Tip Leu Asn Lys Asp Arg Leu Lys Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met He Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr TyT Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Sei Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly

SEQ ID NO.: 67 atggccaagtacctggagctcgaagagggcggggtcataatgcaggcgttctactgggacgtgccttcgggaggaatatggtgggacacaat acggcagaagataccggagtggtacgatgccggaatctccgcaatatggattccíççcgcgagcaagggiatgagcggcggctattcgatgg gctacgacccctacgattattttgacctcggtgagtactaccagaagggaacggtggaaac^ggttcggctcaaagcaggagctcataaacat gataaacacggcccâtgcctacggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttc gttggggactacacctggacggacttctcaaaggtggcctcgggcaaatatactgccaaclacctegacttccaccccaacgaggtcaagtgct gtgacgagggcacatrtggaggc ttccc agacatagcccacgagaaga gctgggac cagc actggc tctgggcgagcgatgagagctacg ccgccíacctaaggagcatcggcgttgatgcctggcgcttcgactacgtcaagggctacggagcgtgggtcgtcaaggactggctggactggt ggggaggctgggccgtcggggagtactgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgacttc ccgctc tactacaagatggac gaggccttcgataacaacaacattcccgc c ctggtggacgc c ctca gatacggtcaga cagtggtcagccgc gaçccgttcaaggctgtgacgtttgtagccaaccacgataccgatataatctggaacaagtatccagcctacgcgttcatcctcacctacgaggg ccagccgacaatanctaccgcgactacgaggagtggctcaacaaggataagctcaagaacctcatctÊgatacatgacaacctcgccggag gaagcacgagcatagtttactacgacagcgacgagatgatcttcgtgaggaacggctatggaagcaagcctggccttataacttacatcaacct cggctcgagcaaggttggaaggtgggtctacgttocgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtg gaçaagtgggtggactcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagcta ctgcgtggtgggctga

SEQ ID NO.: 68

Met Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Tip Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Tip Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Tip Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala TyT Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu
51/116

Fig 16 (cont.)

Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Vai Vai Gly SEQ ID NO.: 73 atggctctggaagagggcgggcttaiaatgcaggccttctactgggacgtcccaggtggaggaatotggtgggacaccatagcccagaagat acccgactgggcgagcgccgggatttcggcaatatggattcctcccgcgagtaagggcatgagcggcggctattcgatgggctacgacccct acgatttcttcgacctoggtgagtactaccagaagggaagcgttgagacccgcttcggatcaaaagaggagcttgtgaacatgataaacaccgc ccatgctcacaacatgaaggteatagcggacatagtcatcaaccaccgcgccggcggcgacctggagtggaatcctttcaccaacagctaçac ctggaccgatttctcgaaggtcgcgtcgggcaagtacacggccaactacctcgacttccacccgaacgagcttcacgcgggcgattccggaa catttgga g gctatcccgacatatgccacgacaagagctgggaccagcactggctctg ggccagcaacgaaagctacgccgcctacc tccgg agcatcggcatcgacgcctggcgcttcgactacgtcaagggctacgctccctgggtcgttaagaactggctgaaccggtggggcggctgggc ggttggagagtactgggacaccaacgtcgatgcactcctgagctgggcctacgacagcggtgctaaagtcttcgactteccgctctactacaag atggacgaggccttcgataacaacaacatccccgccctcgtggacgccctcaagaacggaggcacggtcgtcagccgcgacccgttcaaag ccgtgaccttcgttgccaaccacgataccaacataatctggaacaagtatccggcctacgccttcatcctcacctatgagggacagccggcaat attcta ccgcgactacgaggagtggctcaacaagg acaggctca ggaacctcatctggatacacgaccac ctc gcgggaggaagcacagac atcatctactacgacagcgacgagc ttatettc gtga gaaacggcta c ggggacaagccgggactga taaúcta catcaacctcggctc aagc aaggcc ggaaggtgggtctacgttccgaagttcgcaggctcgtgca tacacgagtacaccggcaacc tcggcg gciggattgac aagtgggt tgactcaagcggtcgggtctacçttgaggcccccgcccacgacccggccaacggccagtacggctactçcgtatggagctactgcggtgttg

Êgtga

SEQIDNO : 74

Met Ala Leu Glu Glu Gly Gly Leu He Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly lie Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Ser Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met He Asn Thr Ala His Ala His Asn Met Lys Vai Ile Ala Asp Ile Vai He Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Thr Asn Ser Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile AspAla Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asn Trp Leu Asn Arg Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Ser Trp Ala Tyr Asp Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asn Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Ala He Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Arg Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp He Ile Tyr Tyr Asp Ser Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Ile Asp Lys Trp Vai Asp Ser Ser Gly Arg Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly

SEQ IDNO75 atggctctggaagagggcgggcttataatgcaggcattcta c tgggacgtccccatggga g gaatctggtgggacacgata gcccagaagat acccgactgggcaagcgccgggatttcggcgatalggattccccccgcgagcaagggtatgagcggcggctattcgatgggctacgacccct
52/116

Fig¹ 16 (cont) acgattattttgacctcggtgagtactacc agaagggaacggtggaaacaa gattcggctcaaagcaggagctcataaacatgataaac a ccg cccac gcctatggcatgaaggtaatagccgatatagtcatcaaccaccgcgccggcggcgatctggagtggaaccccttegtgaacgactata cc tggacc ga cttctcgaaggtagcgtcgggtaaataca cggccaaçtacctcgacttccacccgaacgagctccacgcgggcgattccgga acatttggaggctatc cega cata tgccacgacaagagctgggaccagtactggctctgggccagccaggagagc tocgcggcctatctca g gagcatcggcatcgacgcctggcgcttcgactacgteaagggctotgctccctgggtcgtcagggactggctgaactggtggggaggctggg cagttggagagtactgggacaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctctactacaag atggacgaggccttcgatoacaacaacattcccgccctggtggacgccctcagatacggccagacagtggtcagccgcgacccgttcaaggc tgtgacgrttgtogccaaccacgataccgacatoatctggaacaagtotccagcctacgcgttcatcctcacctacgagggccagccgacaatot tctaccgcgactacgaggagtggctcaacaaggacaagctcaagaacctcatctggatacatgacaacctcgccggagggagcactgacatc gtttoctocgacaacgacgagctgatottcgtgagaaacggctacggaagcaagccgggactgatoacatacatcaacctcggctcaagcaaa gccggaaggtgggtttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaacctcggcggctgggtggacaagtgggtgga ctcaagcggctgggtttacc tcgaggctcc tgcccacgacccggccaacggcc agtacggc toctccgtttggagc tattgcggtgttgggtga SEQIDNO.: 76

Met Ala Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Tip Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys He Pro Asp Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp lie Pro Pro Ala Ser Lys Gly Met SeT Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala Hís Ala Tyr Gly Met Lys Vai Ile Ala Asp He Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Tip TTir Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Arg Asp Trp Leu Asn Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leü Asn Lys Asp Lys Leu Lys Asn Leu He Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp He Vai Tyr Tyr Asp Asn Asp Glu Leu lie Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu He Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Hís Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly

SEQIDNO.: 77 atggctctggaagagggcgggctcatoatgcaggccttctoctgggacgtccccatgggaggaatctggtgggacacgatagcccagaagat acccgactgggcaagcgccgggatttcggcgatatggatccctcccgcgagcaagggtotgagcggcggctattcgatgggctacgacccct acgattattttgacctcggtgagtactaccagaagggaacggtggaaacgaggttcggctcaaagcaggagctcataaacatgataaacaccg cccac gcctatggcatga a ggtaalagcc gata togtcatcaaccaccgcgccggcggtgacctgga gtgga accccttcgtgaacga ctata cctggaccgacttctcaaaggtcgcgtc gggtaaalacacggccaactacc tcgacttccacccgaacgagc tccatgcgggc gatte cggaa catttgga ggc tate ccgacatatgccacgacaaga gctgggaccagtac tggctc tgggccagccaggagagctacgcggcatatc teagg agcatcggcatcgatgcctggcgcttcgactacgtcaagggctatgctccctgggtcgtcaaggactggctgaactggtggggaggctgggc eS^tt8S^ag^ag^tactÊgg^acaccaacgtcgacgctgttctcaactgggcatactcgagcggtgccaaggtctttgacttcgccctctactacaaga tggacgaggccttcgataacaacaacattcccgccctggtggacgccctcagatacggtcagacagtggtcagccgcgacccgttcaaggct gtgacgtttgtagccaaccacgataccgacataatctggaacaagtatccagcctacgcgttcatcctcacctacgagggccagccgacaatatt ctaccgcgactocgaggagtggctcaacaaggatoagctcaagaecctcatctggatocatgacaacctcgccggagggagcactgacatcg tttactacgacaac ga cgagctgata ttcgtgaga aacggcta cggaagca ageeg gga ctgataacata c atcaacc tcgcctcaa gcaaag ccggaaggtgggrttacgttccgaagttcgcaggctcgtgcatacacgagtacaccggcaatctcggcggctgggtggacaagtgggtggac tcaagcggctgggtctacctagaggctcctgcccacgacccggccaacggccagtocggctactccgtctggagctactgcggtgttgggtga
53/116

Fig 16{cont.)

SEQ ID NO.: 78

Met Ala Leu Glu Glu Gly Gly Leu Ile Met Gin Ala Phe Tyr Tip Asp Vai Pro Met Gly Gly Ile Trp Trp Asp Thr lie Ala Gin Lys Ile Pro Asp Trp Ala Ser Ala Gly Ée Ser Ala He Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Tyr Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu He Asn Met Ile Asn Thr Ala His Ala Tyr Gly Met Lys Vai He Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys TyT Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Ala Gly Asp Ser Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Tip Ala Ser Gin Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Ala Pro Trp Vai Vai Lys Asp Trp Leu Asn Trp Trp Gly Gly Trp Ata Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Vai Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Ala Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Asn Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He He Trp Asn Lys Tyr Pro Ala Tyr Ala Phe He Leu Thr Tyr Glu Gly Gin Pro Thr Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Lys Asn Leu Ile Trp Ile His Asp Asn Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu He Thr Tyr Ile Asn Leu Ala Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Tip Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly

SEQ ID NO : 79 atgaagcctgcgaaactcctcgtcttlgtgctcgtagtctctatcctcgcggggctctacgcccagcccgcgggggcggccaagtacctggagc tc gaaga gggcggc gtca taatgca ggcgttc ta ctgggacgtgccttcaggaggaatatggtgggacacaatacggca gaagataccgga gtggtacgatgccggaatctccgcaatatggattcccccggcgagcaagggcatgggcggcgcctattcgatgggctacgacccctacgactt ctttgacc tcggtgagtacgaccagaagggaacggta gaga cgc gctttggctccaagcaggagctcgtgaacalgataaacaccgcccacg cctacggcatcaaggtcatcgcagacatagtaatcaaccaccgcgccggaggagaccttgagtggaaccccttcgtcaatgactacacctgga cggac ttcte gaaggtcgcttccggcaagtacac ggccaactacctcgacttccacccc aacgaggtc aagtgctgcgacgagggcacctttg gagggttcc cggaca ta gcccacgagaaga gctgggaccagtactggctctgggc gagc aac ga gagctacgccgcctacctca ggagca icggcgttgacgcatggcgcticgactacgtcaagggctâcggagcgtgggtcgtcaaggactggctggactggtggggaggctgggccgt cggggagtaclgggacacaaacgttgatgcactgctcaactgggcctactcgagcgatgcaaaagtcttcgacttcccgctctactacaagatg gacgcggcctttgacaaçaagaacattccc gcactcgtcgaggccctcaagaacgggggcaca gtcgtcagccgcgac cc gtttaaggcc gt aaccttcgttgcaaaccacgacaeggacataatttggaacaagtacccggcctacgccttcatcctcacctacgagggccagccgacgatattc taccgcgactacgaggagtggctcaacaaggacaggctcaagaacctcatciggatacacgaccacctcgccggtggaagcaccgacatag Ictac tacgataacgatgaactcatcttcgtcaggaacggctac gggga caagcc ggggcttataacc tacatcaacctaggctc gagcaa gg ccgggaggtgggtctacgttccgaagttcgcgggagcgtgcatccacgagtacaccggcaacctcggcggctgggtggacaagtgggtgga ctcaagcgggtgggtgtacctcgaggcccctgcccacgacccggccaacggctattacggctactccgtctggagctactgcggggtgggct ga

SEQ ID NO.: 80

Met Lys Pro Ala Lys Leu Leu Vai Phe Vai Leu Vai Vai Ser Ile Leu Ala Gly Leu Tyr Ala Gin Pro Ala Gly Ala Ala Lys Tyr Leu Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe Tyr Trp Asp Vai Pro Ser Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys Ile Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asp Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Vai Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala

Fig . ló(cont.)
54/1)6

Trp Vai Vai Lys Asp Trp Leu Asp Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Tip Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Asp Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Ala Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Glu Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Tip Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr TyT Glu Gly Gin Pro Thr Ue Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Arg Leu Lys Asn Leu Ue Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ue Vai Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Vai Aig Asn Gly Tyr Gly Asp Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ue His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Trp Vai Asp Ser Ser Gly Trp Vai TyT Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly SEQ IDNO.: 81 atgaagaagtttgtcgccctgttcataaccatgtttttcgtagtgagcatggcagtcgttgcacagccagctagcgccgcaaagtattccgagctc gaagaaggc ggcgttataatgcaggccttctactgggacgtcceaggtggaggaatctggtgggacacc atcaggagc aagatac cggagt ggtacgaggcgggaa tatee gccatttggattccgccagcca gcaaggggatgagcggc ggttactcgatgggc tac gatccctac gatttctt tgaectcggcgagtacaaccagaagggaaccatcgaaacgcgctttggctctaaacaggagctcatcaatatgalaaacacggcccatgccta eggcataaaggtcatagcggacatcgtcataaaccaccgcgcaggcggagacctcgagtggaacccgttcgttggggactacacctggacg gacttctcaaaggtggcctcgggcaaatatactgccaactacctcgacttccaccccaacgaggtcaagtgctgtgacgagggcacatttggag gcttcccagacatagcccacgagaagagctgggaccagcactggctctgggcgagcgatgagagctacgccgcctacctaaggagcatcg gcgttgatgcctggcgctttgactacgtgaagggctacggagcgtgggtcgtcaaggactggctcaactggtggggcggctgggccgttggc gagtactgggacaccaacgttgatgcactcotcaactgggcctactcgagcggcgccaaggtettcgacttcccgctctactacaagatggatg aggcctttgacaacaaaaacattccagcgctcgtctctgcccttcagaacggccagactgttgtctcccgcgacccgttcaaggccgtaaccttt gtagcaaaccacgacaccgatataatctggaacaagtaccttgcttatgctttcatcctcacctacgaaggccagcccgtcatattctaccgcgac tacgaggagtggctcaacaaggacaggttgaacaacctcatatggatacacgaccacctcgcaggtggaagcacgagcatagtctactacga cagcgacgagatgatc ttcgtgaggaacggc tatggaagcaagcctggccttataacttacatcaaccteggctcgagc aa ggttggaaggtg ggtttatgtgccgaagttcgcgggcgcgtgcatccacgagtatactggtaacctcggaggctgggtagacaagtacgtctactcaagcggctg ggtctatctcgaagctccagcttacgaccctgccaacgggcagtatggctactccgtgtggagctattgcggtgttgggtga

SEQ ID NO.: 82

Met Lys Lys Phe Vai Ala Leu Phe Ue Thr Met Phe Phe Vai Vai Ser Met Ala Vai Vai Ala Gin Pro Ala Ser Ala Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ue Met Gin Ala Phe TyT Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ue Arg Ser Lys Ile Pro Glu Trp Tyr Glu Ala Gly Ile Ser Ala He Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly TyT Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Asn Gin Lys Gly Thr Ile Glu Thr Arg Phe Gly Ser Lys Gin Glu Leu Ile Asn Met Ile Asn Thr Ala His Ala Tyr Gly Ile Lys Vai Ue Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Va! Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ue Ala His Glu Lys Ser Trp Asp Gin His Trp Leu Trp Ala Ser Asp Glu Ser Tyr Ala Ala Tyr Leu Arg Ser He Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Lys Asp Trp Leu Asn Tip Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala TyT Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asnlle Pro Ala Leu Vai Ser Ala Leu Gin Asn Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Leu Ala Tyr Ala Phe Ue Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp TyT Glu Glu Trp Leu Asn Lys Asp Arg Leu Asn Asn Leu Ile Trp Ue His Asp His Leu Ala Gly Gly Ser Thr Ser Ile Vai Tyr Tyr Asp Ser Asp Glu Met Ue Phe Vai Arg Asn Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr He Asn Leu Gly Ser Ser Lys Vai Gly Arg Tip Vai Tyr Vai Pro Lys Phe Ala Gly Ala Cys Ue His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Lys Tyr Vai Tyr Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala Tyr Asp Pro Ala Asn Gly Gin Tyr Gly TyT Ser Vai Trp Ser Tyr Cys Gly Vai Gly

Fig 16 (cont.)
55/116

SEQID NO.: 83 atggctclggaagacggcgggcteataatgcaggccttctactgggatgttcctggaggaggaatctggtgggacacaatagctcaaaagata ccc gaatgggcaa gtgcaggaa tctcagcgatatgga ttccaccagcgagfcagggcatgagcggtggttattccatgggc tacgatccctac gatttctttgacctcggcgagtactatcagaaggggacagttgagacgcgcttcggctcaaaggaagaactggtgaacatgataaacaccgca cactccUcggcataaaggtgaugcagacatagtcataaaccaccgcgccggtggagaccttgagtggaaccccttogtgaacgactatacct ggacagacttctcaaaagtcgcctcc ggtaaatatacggccaac taccttgacttccacccaaacgagcttcac tgttgtga tgaaggtacctttg gaggataccc tgala tatgtcacgac aaaagctgggacca gtactggctctgggc gagcagcgaaa gc tac gctgcctacctcagga gcata gggg ttga cgcc tggc gtttcgactacglcaagggc tac ggagc a tgggtt gttaacgac tggc tcagctggtggggaggc tgggcc gttgga gagUctgggacac gaac gttgatgcactcctcaactgggcatacagca gcggcgccaaggtctttgacttcccgctctac tacaagatggacg aagccttcgacaacaccaacatcccggcattagtggatgcactcagatacggccagacagtggtcagccgcgatcccttcaaggcggtaacttt _Cgttgccaaccacgatacagatataatctggaacaagtatccggcttatgcattcatccttacctatgagggacagcctgttatattctaccgcgaç tacgaggagtggctcaacaaggataagcttaacaaccteatctggatacacgatcaccttgctggagggagtactgacattgtttactacgacag c gacgagcttatctttgtg agaaacggctatggcaccaaa ccaggactgataacctatatcaacctcggctcaa gc aaagttggaag gtgggtc tac gttccaaagttcgccggttcatgc atccacgagtacaccggc aacctc ggcggttggatagacaagtac gtctcctccagcggctgggtct atcttgaggccccagcccacgacccggcgaacggciactacggctacíccgtatggagctactgcggggttgggtga

SEQ ID NO/. 84

Met Ala Leu Glu Asp Gly Gly Leu lie Met Gin Ala Phe TyT Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Glu Tip AJa Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ata Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Aig Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys Vai He Ala Asp He Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Cys Cys Asp Glu Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Ser Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Πε Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu TyT Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Va] Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp SeT Asp Glu Leu Ile Phe Vai Arg Asn Gly TyT Gly Thr Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Ile Asp Lys TyT Vai Ser Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly

SEQID NO.: 85 atggctctggaagagggcgggcttataatgcaggcattctattgggacgtcccaggtggaggaatctggtgggacaccatagcccagaagata cccgaatgggcaagtgcaggaatctcagcgatatggattccaccagcgagtaagggaatgagcggtggttattccatgggctacgatccctoc gatttctttgacctcggcgagtactalcagaaggggacagttgagacgcgcttcggctcaaaggaagaactggtgaacatgataaacaccgca cactcctacggcataaaggtgatagcggacatagtcataaaccaccgcgccggtggaggcctcgagtggaaccccttcglgaacgactatacc tggacagacttctcaaaagtc gcc tccggtaaatataca gc caac taccttgacttccaccc aaac ga gc ttcac t gttgtga tgaaggta cc tttg gaggatacectgatatatgtcacgacaaaagctgggaccagiactggctctgggcgagcagcgaaagctacgctgcctacctcaggagcata ÊÊggh gac gcctggtgtttcgactacgtcaagggct acggagcctgggtt gttaacgac tggc tca gctggtgg ggaggc tgggcc gttgga gagtactgggacactaacgttgatgcactcctcaacigggcatacaacagcggcgccaaggtctttgacttcccgctctactacaagatggacg aagccttcgacaataccaacaiccccgctttggtttacgccctcaagaatggcgggacagtggtcagccgcgacccattcaaggcggtaacttt c gttgccaacc ac gatac agatataatc tggaac aagtatccggc ttatgcattcatccttacctatgagggacagcc tgtta tattc taccgcgac tacgaggagtggctcaacaaggataagcttaacaacctcatctggatacacgatcaccttgctggagggagtactgacattgtttactacgacag cgacga gc ttalctttglgagaaacggc latggcaccaa a ccaggactgataacctatalcaacc tcggctcaa gcaaagctggaaggtgggtc
56/116

Fig 16 (com.) tacgttccaaagttcgccggttcatgcatccacgagtacaccggcagcctcggcggttggatagacaagtacgtctcctccagcggctgggtct accttgaggccccggcccacgacccggccaatggccagtaíggctactccgtctggagctattgcggggttgggíga

SEQ ID NO.: 86

Met Ala Leu Glu Glu Gly Gly Leu He Met Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly He Trp Trp Asp Thr Ile Ala Gin Lys Ile Pro Glu Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr TyT Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met lie Asn Thr Ala His Ser Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Gly Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Cys Cys Asp Glu Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Ser Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Cys Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala TyT Asn Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Tyr Ala Leu Lys Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp He Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe He Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr Tyr Asp Ser Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Thr Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Ala Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Ser Leu Gly Gly Trp Ile Asp Lys Tyr Vai Ser Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Gin Tyr Gly Tyr Ser Vai Trp Ser Tyr Cys Gly Vai Gly

SEQ ED NO: 87 atgttcctgctcgcgtttttgctcactgcc tcgctgttctgcccaacaggacagccc gcc aaggctgcc g cacc gtttaacg geac catgatgca gtattttgaatggtacttgccggatgatggcacgttatggaccaaagtggccaatgaagccaacaacttatccagccttggcatcaccgctctttg gctgccgcccgcttacaaaggaacaagccgcagcgacgtagggtacggaglatacgacttgtatgacctcggcgaattcaatcaaaaaggga ccgtccgcacaaaatacggaacaaaagctcaatatcttcaagccattcaagccgcccacgccgctggaatgcaagtgtacgccgatgtcgtgtt cgaccataaaggcggcgctgacggcacggaatgggtggacgccgtcgaagtcaatccgtccgaccgcaaccaagaaatctcgggcacctat c aaatccaa gcatggacgaaatttgattttcc cgggc ggggcaacacctactccagc tttaa gtggcgctggUccattttgacggcgttgattgg gacgaaagccgaaaattgagccgcatttaçaaattccgcggcatcggcaaagcgtgggattgggaagtagacacggaaaacggaaactatg actâcttaatgtatgccgaccttgatatggatcatcccgaagtcgtgaccgagclgaaaaactgggggaaatggtatgtcaacacaacgaacatt gatgggttceggcttgatgcc gtca agcatattaagttcagtttttttcctg attggttgtc gtatgtgc gttctca gac tggcaagccgctatttaccg tcggggaatartggagctatgacatcaecaagttgcacaattacattacgaaaacagacggaacgatgtctttgtttgatgccccgtíacacaaca aattttataccgcttccaaatcagggggcgcamgatatgcgcacgttaatgaccaatactctcatgaaagatcaaccgacattggccgtcacctt cgttgataatcatgacaccgaacccggccaagcgctgcagtcatgggtcgacccatggttcaaaccgttggcttacgcctttattctaactcggc aggaaggatacccgtgcgtcttttatggtgactattatggcatlecacaatataacattccttcgctgaaaagcaaaatcgatccgctcctcatcgc gcgcagggattatgcttacggaacgcaacatgattatcttgatcactccgacatcatcggglggacaagggaaggggtcactgaaaaaccagg atccgggctggccgcactgatcaccgatgggccgggaggaagcaaatggatgtactgttggcaaaeaacacgctggaaaaglgttctatga

SEQ ID NO: 88

Met Phe Leu Leu Ala Phe Leu Leu Thr Ala Ser Leu Phe Cys Pro Thr Gly Gin Pro Ala Lys Ala Ala Ala Pro Phe Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr Leu Pro Asp Asp Gly Thr Leu Tip Thr Lys Vai Ala Asn Glu Ala Asn Asn Leu Ser Ser Leu Gly He Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Arg Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Aig Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Leu Gin Ala Ile Gin Ala Ala His Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asp His Lys Gly Gly Ala Asp Gly Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu Ile Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp
57/116

Fig 16 (cont.)

Gly Vai Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg He Tyr Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Vat Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Vai Asn Thr Thr Asn He Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Vai Arg Ser Gin Thr Gly Lys Pro Leu Phe Thr Vai Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asp Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gin Pro Thr Leu Ala Vai Thr Phe Vai Asp Asn His Asp Thr Glu Pro Gly Gin Ala Leu Gin Ser Trp Vai Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Gin Tyr Asn He Pro Ser Leu Lys Ser Lys Ile Asp Pro Leu Leu He Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Vai Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Cys Trp Gin Thr Thr Arg Trp Lys Ser Vai Leu

SEQ ID NO: 89 atgaaagaagcggttgtgtatcaaattttcccggatcggttctttaatggcaacccttcaaatgataacagcaagcagcaggcacgcggggcgc agccgattgagcatcgcgattggtcggatttgcccgataatccgcgcctgaaagggacgagcggctacgatggcgacggtgaatggtcgaat gactttttcggcggagacatcgccggaattgaacaaaagttggattatttgcagtcgcttggagtgaacacgatttacttaaatccgatcgccaatg cgcc atcgaaccataa atatgatgc gagcaattacaaagaattggatcc gatgttcggttccccggaagaattccaatcgtttgtgcaggcgcttg

Cgaaccgggggatgcatctcatcttagacggggtgttcaaccacgtatccgacgattcgattlactttgaccgctaccaccgctatccgaccgtc ggtgcgtatgaatattgggaagcggtttacgatttgatgaatgaaaaaggattgagcgaggaagaagcgcggaaacaagtggaagagaagttc aaacaagagggacagacgttcagcccgtatgggtttcatctttggttcaatattgaaaacaaaaaagtcaatggccattatcaatflccaatcatggt ggggctatgacagtctgccggagtttaagtcggtgacgggggaaaaagtgccgcatccgagtgaattgaacaacgatgcgctcgcgaattac attttccgtgaatcggattcggtggcgaaaa gctggattgccctcggc gcctc cggctggcggttggatgtggccaatgaggtggatccggcgt tttggcgcgagtttcgccaagaattgcttcaagggtcgtacggccgcggtccgacgttaaaagagggggagcagccgctcattrtaggggaaa ittgggatgac gcatcgaaatattttcta ggcgaccagtacgatlccgtgatga acta ccggttecgcggggc ggt gcttgactttttgaaaaacg gaaatgcagaagaggcggacaagcggctgacggccataagggaagactacccaagtgaagcgttttatgcgctgâtgaacttaatcggttcg catgacacggcgcgggcggtctttc tgcttgggaacggaacggattca tccgagcg ggcgga gc ttgatccgaattataa tgaggaacttggg aaaaagcggctcaagctggcggtgattttgcagatgggatacccgggagcgccgacgatttattacggcgatgaagcgggagtaacaggctc aaaaga ccca gac aac cgc cgcacgtatccgtggggcaaagaagatc aaaatctgttgtcccattatcagaaagtggggcacattcgccagc accatcaatcgttgttggccc atggcgac atcaagacggtgtatgcg caagggga tgtatacgtatttgcccgccaatacgggcgtgaa gcgg cgctcattgccate aaccgcggc aatgaggacaagacggtggcgcttgac gtcgcttcgttgcltcc gaacggc a ccgtgcttacggatgagtt gcatgatggcggggaagctacggtcgctggpggaacgttgacggtcacgattccggccctggatggacggatgatgtttgggacggtgacg gcggaaatgccggcagcagtcagcaatttgcaggcgagcgcttcggatggctgcgtgacgttaacgtgggaaggaaatgcatcgagatacc gaatttacga gtccac gttaaa aggtgccggttaiacgatggtgcaagagacggaaacaac ttcggc cacgatc ggttcgttgacgaacggaa c agcctattactttgccgttgcggcggtc gatgaaaacgggaatgaatca cc gaaggtc ga aacgaatcgcgtcgttcctca ttacc cgctgac gagcgacaatgtccagttcgtgacaacgttaagcgatgccacactggatttgtcaaagccgcagcaagtggatgtccatgtcaacatcgacaat gtgacaagcaaaggagcagctgatgggttgcaagcggtgttgcaagtgaaaggcccgcatgacgaaacatggaaagaatacagagcggctt accaaggacaagacggcgacgccaacglgttccgagctgccttcactccgctcgccgcagggacgtatacgtatcgttatgcgctgacgacc aaccttggcgaggagtggatgtatacagaagagaagcaagtgacgtttgcggcagacaacagcgaccaaatagcgccagcagacgccatcg agctgcggcagcctgcggttgaatcgggacaagtgaatttatcatggacgtttgttgggaaaaaagatggggatgcttâtttgttagccatcgag cgcaacggtgatatcgtgcatacaaccacttcgatcggcgattcatttacagactacgatgtcgaaaacggcaccgagtacacgtatgttgtcaa gttgta tgaccgCgccggcaatgttgtggcgtcaaacacggtcaaggtgacgcc ggacattgtgatggt gaaagtga tttttaaagtgagagcg ccggattacacaccgttggatgcccgaattacgattccgaacagcttgaacggctggaacacaggggcctgggagatgtcgcgcaacggtgc ggtgacgcccgattggcaatttaccgtcgaggtgcaggaâggggaa acga tcacctataa gta tgtgaaa ggcgga tcgtgggatcaagagg ggttggccgaccatacgcgtgaggacgacaacgatgatgacgtgagctactacggcUtgggacgattggcaccgacttgaaagtgacggtc cacaatgaaggaaa caata cgatgattgtgcaaga ccgcatrttgcgctggatcga tatgccggtcgt catcgaagaggtgca aaaacaagga agtcaagtgacgatcaagggcaatgccattaaaaacggtgttttgacgatcaatggcgagcgggtgccgattgatggccggatggcattctcgt acacgtttgcgccggccagccatcaaaaagaagtgttgatccatatcgaaccatcggccgaaagcaaaacagccattttcaacaacgacggcg
58/116

Fig lfi(cont-) gagcgattgcgaaaaacacaaaagattacgtgctgaatttagaaacgaagcaattcaaaaagçttctcg3gagtacrtctagagcggccgcgg gcccatcgattttccacccggglggggtaccaggta

SEQ ID NO: 90

Met Lys Glu Ala Vai Vai TyT Gin Ile Phe Pro Asp Arg Phe Phe Asn Gly Asn Pro Ser Asn Asp Asn Ser Lys Gin Gin Ala Arg Gly Ala Gin Pro Ile Glu His Arg Asp Trp Ser Asp Leu Pro Asp Asn Pro Arg Leu Lys Gly Thr Ser Gly Tyr Asp Gly Asp Gly Glu Trp Ser Asn Asp Phe Phe Gly Gly Asp Ile Ala Gly Ile Glu Gin Lys Leu Asp Tyr Leu Gin Ser Leu Gly Vai Asn Thr Ile Tyr Leu Asn Pro Ile Ala Asn Ala Pro Ser Asn His Lys Tyr Asp Ala Ser Asn Tyr Lys Glu Leu Asp Pro Met Phe Gly Ser Pro Glu Glu Phe Gin Ser Phe Vai Gin Ala Leu Ala Asn Arg Gly Met His Leu Ile Leu Asp Gly Vai Phe Asn Hís Vai Ser Asp Asp Ser Ile Tyr Phe Asp Arg Tyr His Arg Tyr Pro Thr Vai Gly Ala Tyr Glu Tyr Trp Glu Ala Vai Tyr Asp Leu Met Asn Glu Lys Gly Leu Ser Glu Glu Glu Ala Arg Lys Gin Vai Glu Glu Lys Phe Lys Gin Glu Gly Gin Thr Phe Ser Pro Tyr Gly Phe His Leu Trp Phe Asn Ile Glu Asn Lys Lys Vai Asn Gly His Tyr Gin Tyr Gin Ser Trp Trp Gly Tyr Asp Ser Leu Pro Glu Phe Lys Ser Vai Thr Gly Glu Lys Vai Pro His Pro Ser Glu Leu Asn Asn Asp Ala Leu Ala Asn Tyr Ile Phe Arg Glu Ser Asp Ser Vai Ala Lys Ser Trp Ile Ala Leu Gly Ala Ser Gly Trp Arg Leu Asp Vai Ala Asn Glu Vai Asp Pro Ala Phe Trp Arg Glu Phe Arg Gin Glu Leu Leu Gin Gly Ser Tyr Gly Arg Gly Pro Thr Leu Lys Glu Gly Glu Gin Pro Leu Ile Leu Gly Glu Ile Trp Asp Asp Ala Ser Lys Tyr Phe Leu Gly Asp Gin Tyr Asp Ser Vai Met Asn Tyr Arg Phe Arg Gly Ala Vai Leu Asp Phe Leu Lys Asn Gly Asn Ala Glu Glu Ala Asp Lys Arg Leu Thr Ala Ile Arg Glu Asp Tyr Pro Ser Glu Ala Phe Tyr Ala Leu Met Asn Leu He Gly Ser His Asp Thr Ala Arg Ala Vai Phe Leu Leu Gly Asn Gly Thr Asp Ser Ser Glu Arg Ala Glu Leu Asp Pro Asn Tyr Asn Glu Glu Leu Gly Lys Lys Arg Leu Lys Leu Ala Vai Ile Leu Gin Met Gly Tyr Pro Gly Ala Pro Thr Ile Tyr Tyr Gly Asp Glu Ala Gly Vai Thr Gly Ser Lys Asp Pro Asp Asn Arg Arg Thr Tyr Pro Trp Gly Lys Glu Asp G1 n Asn Leu Leu Ser His Tyr Gin Lys Vai Gly His Ile Arg Gin His Hís Gin Ser Leu Leu Ala His Gly Asp Ile Lys Thr Vai Tyr Ala Gin Gly Asp Vai Tyr Vai Phe Ala Arg Gin Tyr Gly ATg Glu Ala Ala Leu Ile Ala Ile Asn Arg Gly Asn Glu Asp Lys Thr Vai Ala Leu Asp Vai Ala Ser Leu Leu Pro Asn Gly Thr Vai Leu Thr Asp Glu Leu His Asp Gly Gly Glu Ala Thr Vai Ala Gly Gly Thr Leu Thr Vai Thr Ile Pro Ala Leu Asp Gly Arg Met Met Phe Gly Thr Vai Thr Ala Glu Met Pro Ala Ala Vai Ser Asn Leu Gin Ala Ser Ala Ser Asp Gly Cys Vai Thr Leu Thr Trp Glu Gly Asn Ala Ser Arg Tyr Arg Ile Tyr Glu Ser Thr Leu Lys Gly Ala Gly Tyr Thr Met Vai Gin Gin Thr Glu Thr Thr Ser Ala Thr Ile Gly Ser Leu Thr Asn Gly Thr Ala Tyr Tyr Phe Ala Vai Ala Ala Vai Asp Glu Asn Gly Asn Glu Ser Pro Lys Vai Glu Thr Asn Arg Vai Vai Pro His Tyr Pro Leu Thr Ser Asp Asn Vai Gin Phe Vai Thr Thr Leu Ser Asp Ala Thr Leu Asp Leu Ser Lys Pro Gin Gin Vai Asp Vai His Vai Asn Ile Asp Asn Vai Thr Ser Lys Gly Ala Ala Asp Gly Leu Gin Ala Vai Leu Gin Vai Lys Gly Pro His Asp Glu Thr Trp Lys Glu Tyr Arg Ala Ala Tyr Gin Gly Gin Asp Gly Asp Ala Asn Vai Phe Arg Ala Ala Phe Thr Pro Leu Ala Ala Gly Thr Tyr Thr Tyr Arg Tyr Ala Leu Thr Thr Asn Leu Gly Glu Glu Trp Met Tyr Thr Glu Glu Lys Gin Vai Thr Phe Ala Ala Asp Asn Ser Asp Gin Ile Ala Pro Ala Asp Ala Ile Glu Leu Arg Gin Pro Ala Vai Glu Ser Gly Gin Vai Asn Leu Ser Trp Thr Phe Vai Gly Lys Lys Asp Gly Asp Ala Tyr Leu Leu Ala Ile Glu Arg Asn Gly Asp Ile Vai His Thr Thr Thr Ser Ile Gly Asp Ser Phe Thr Asp Tyr Asp Vai Glu Asn Gly Thr Glu Tyr Thr Tyr Vai Vai Lys Leu Tyr Asp Arg Ala Gly Asn Vai Vai Ala Ser Asn Thr Vai Lys Vai Thr Pro Asp Ile Vai Met Vai Lys Vai Ile Phe Lys Vai Arg Ala Pro Asp Tyr Thr Pro Leu Asp Ala Arg Ile Thr Ile Pro Asn Ser Leu Asn Gly Trp Asn Thr Gly Ala Trp Glu Met Ser Arg Asn Gly Ala Vai Thr Pro Asp Trp Gin Phe Thr Vai Glu Vai Gin Glu Gly Glu Thr Ile Thr Tyr Lys Tyr Vai Lys Gly Gly Ser Trp Asp Gin Glu Gly Leu Ala Asp His Thr Arg Glu Asp Asp Asn Asp Asp Asp Vai Ser Tyr Tyr Gly Tyr Gly Thr Ile Gly Thr Asp Leu Lys Vai Thr Vai His Asn Glu Gly Asn Asn Thr Met He Vai Gin Asp Arg Ile Leu Arg Trp Ile Asp Met Pro Vai Vai Ile Glu Glu Vai Gin Lys Gin Gly Ser Gin Vai Thr Ile Lys Gly Asn Ala Ile Lys Asn Gly Vai Leu Thr Ile Asn Gly Glu Arg Vai Pro Ile Asp Gly Arg Met Ala Phe Ser Tyr Thr Phe Ala Pro Ala Ser Hís Gin Lys Glu Vai Leu Ile His Ile Glu Pro Ser Ala Glu Ser Lys Thr Ala Ile Phe Asn Asn Asp

Fig¹ 16 (cont.)
59/116

Gly Gly Ala Ile Ala Lys Asn Thr Lys Asp Tyr Vai Leu Asn Leu Glu Thr Lys Gin Phe Lys Lys Leu Leu Glu Ser Thr Ser Arg Ala Ala Ala Gly Pro Ser Ile Phe His Pro Gly Gly Vai Pro Gly SEQ CD NO: 91 gtgctaacgtttcaccgcatcattcgaaaaggatggatgttcctgctcgcgtttttgctcactgcctcgctgttctgcccaacaggacagcccgcca aggctgc cgca ccgtttaacggcaccatgatgcagtattttgaatggtacttgccggatgatggcacgttatgg accaaagtggccaatgaa gc caacaacttatccagccttggcatcaccgctctttggclgccgcccgcttataaaggaacaagccgcagcgacgtagggtacggagtatacga cttgtatgacetcggc gaa ttcaatcaaaaagggaccgtccgcacaaaatac ggaacaaaagct caatatcttca agccattcaagccgcc cac gecgctggaatgcaagtgtacgccgatgtcgtgttegaccataaaggcggcgccgacggcacggaatgggtggacgccgicgaagtcaatc cgtccgaccgcaaccaagaaaíctcgggcacctat£aaatccaagcatggacgaaatttgattttcccgggcggggcaacacctactccagctt taagtggcgctggiaccattttgacggcgttgattgggacgaaagccgaaaattgagccgcatttacaaattccgcggcatcggcaaagcgtgg gattgggaagtagacacggaaaacggaaactatgactacttaatgtatgccgacttggacaiggaccatcctgaagtggttacggaactgaaaa actggggcaaatggtatgtcaacacaacgaacattgatgggttccggcttgatgccgtcaagcatattaagttcagtttttttcctgattggttgtcgt atgtgcgttctcagactggcaagccgciatttaccgtcggggaatattggagctatgacatcaacaagttgcacaattacattacgaaaacaaacg gaacgatgtctttgtttgalgccccgttacacaacaaattttataccgcttccaaatcagggggcgcatttgatatgcgcacgttaatgaccaatact ctcatgaaagatcaaccgacattggccgteaccttcgttgataatcatgacaccgaacccggccaagcgctgcagtcatgggtcgacccatggt tcaaaccgttggcttacgc ctttattctaactcggcaggaaggataccc gtgcgtcttttatggtgac tattatggca iccc acaatataacattcctt cgctgaaaagcaaaatcgatccgctccteatcgcgcgcagggattatgcttacggaacgcaacatgattatcttgatcactccgacatcatcggg tggacaagggaaggcgtcactgaaaaaccaggatccggactggccgcaclgatcaccgatgggccgggaggaagcaaatggatgtacgtt ggca aacaacacgccggaaaagtgttctatgacc ttaccggcaaccggagtgacaccgtcacc atcaacagtgatggatggggagaattcaa agtcaatggcggttcggtttcggtttgggttcctagaaaaacgaccgtctctaccatcgcttggccgatcacaacccgaccgtggactggtgaatt cgtcc gttggaccgaacca cggttggtggcatggxttga

SEQ ID NO: 92

Vai Leu Thr Phe His Arg Ile Ile Arg Lys Gly Trp Met Phe Leu Leu Ala Phe Leu Leu Thr Ala Ser Leu Phe Cys Pro Thr Gly Gin Pro Ala Lys Ala Ala Ala Pro Phe Asn Gly Thr Met Mel Gin Tyr Phe Glu Trp TyT Leu Pro Asp Asp Gly Thr Leu Trp Thr Lys Vai Ala Asn Glu Ala Asn Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Arg Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Leu Gin Ala Ile Gin Ala Ala His Ala Ala Gly Met Gin Va) Tyr Ala Asp Vai Vai Phe Asp His Lys Gly Gly Ala Asp Gly Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu Ile Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp TyT Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Vai Asn Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Vai Arg Ser Gin Thr Gly Lys Pro Leu Phe Thr Vai Gly Glu TyT Trp Ser Tyr Asp He Asn Lys Leu His Asn TyT Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gin Pro Thr Leu Ala Vai Thr Phe Vai Asp Asn His Asp Thr Glu Pro Gly Gin Ala Leu Gin Ser Trp Vai Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp TyT Tyr Gly Ile Pro Gin Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Vai Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met TyT Vai Gly Lys Gin His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Va) Thr Ile Asn Ser Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Pro Arg Lys Thr Thr Vai Ser Thr Ile Ala Trp Pro Ile Thr Thr Arg Pro Trp Thr Gly Glu Phe Va) Arg Trp Thr Glu Pro Arg Leu Vai Ala Tip Pro
60/116

Fig 16 (cont.)

SEQ ID NO: 93 algaaatc gtttgcattcatgcc tatee ttttttatgcaaacgatttcatcagtg aaaggga aggaggag gaaaaatggggaagaatatgagaaga agattcac gtatttttcaatcttcttattgttc gttcagclgttttcatttagtgcaacc gctagcgcca atggaacggt gaacagtagtcctgtggttaa tggaaacgaagtcacgtttctatatggaggaacaggflaacg3gcagtctgtgttac(ggcaggctcctttaatgattggcagaaagatggtgaca agaagattgcactaacaaaaggcgacaataacgtctggtctgtcacgcaaacacttcaagatgggacatatacgtataagtttgttgtagatggtc aatgggtggcggatccgcttaacccgaatcaagtagacgacggttacggcggccgtaatagtgtcgttgttgtcgggacaccggtgcaacaag aacggacagtgacgcttgttggtaacttacaagacgaattaggtcatacgagcgaatgggatccgaaagcgacagctacagtgatgaaaaagg aagggaacgggttatatacgtítacaggtacacttccagccggaacgtacgagtataaaattgcgattaatggcagctgggaçgaaaactatggt gtcggcggccgcgatggcgggaatattaagctgct2ttaaatgaac2.aacaacggttacattttattacaacgacagaacgcatgcgattgcgg attcgacttggtatgcaccaattctaaaagaaaagcagccgcggctcgttggaacgattttaccagctattggttatgaaacagacgtgaacggtt ggacgccgcaaacatcaacggcgttgttgtcagatgatgattttgattccatttatacgtttaaggcgcgtgtgccaaaagggacatatgaatataa agtagttcttgggaatgattggaca tatg aaaattatccacaa gataatgccaaattaaatgtgcttgaagaaacgaca attacctttttctttaacgc gaaaacgaa agtagtgtatacc gattacaatcc aagcggttcggatggtatcgtccaaaaa gaccgtttgaagcataatacgtggg attcgttgla tcgccaaccgtttggtgcggtgaaagctgggacagaagtgacccttcgtttatcagcgaaaaaaggtgatttgacaaaagcggatgtatatgtaa aaaat acgacaaccggcac agcgaaactatattcgatgaaaaaa gc cggtgttcttggcgaaga agaatattgggaag cgacattcacac cgg atgtgaaaggagtaiacggttataaatttattgcggtagatgctggaacgaaagcagaatacggggaagatacacaagaagggcagtgggga aaagcagtagataaaaatgcagagctgttc caattaacggtgtac gacccatccta ccaaacaccggattggatgaaagaa gçagttgta tatea aattttccctgatccaaag

SEQ ID NO: 94

Met Lys Ser Phe Ala Phe Met Pro Ile Leu Phe Tyr Ala Asn Asp Phe Ile Ser Glu Arg Glu Gly Gly Gly Lys Met Gly Lys Asn Mel Arg Arg Arg Phe Thr Tyr Phe Ser He Phe Leu Leu Phe Vai Gin Leu Phe Ser Phe Ser Ala Thr Ala Ser Ala Asn Gly Thr Vai Asn Ser Ser Pro Vai Vai Asn Gly Asn Glu Vai Thr Phe Leu Tyr Gly Gly Thr Gly Asn Glu Gin Ser Vai Leu Leu Ala Gly Ser Phe Asn Asp Trp Gin Lys Asp Gly Asp Lys Lys Ile Ala Leu Thr Lys Gly Asp Asn Asn Vai Trp Ser Vai Thr Gin Thr Leu Gin Asp Gly Thr Tyr Thr Tyr Lys Phe Vai Vai Asp Gly Gin Trp Vai Ala Asp Pro Leu Asn Pro Asn Gin Vai Asp Asp Gly Tyr Gly Gly Arg Asn Ser Vai Vai Vai Vai Gly Thr Pro Vai Gin Gin Glu Arg Thr Vai Thr Leu Vai Gly Asn Leu Gin Asp Glu Leu Gly His Thr Ser Glu Trp Asp Pro Lys Ala Thr Ala Thr Vai Met Lys Lys Glu Gly Asn Gly Leu Tyr Thr Phe Thr Gly Thr Leu Pro Ala Gly Thr Tyr Glu Tyr Lys Ile Ala Ile Asn Gly Ser Trp Asp Glu Asn Tyr Gly Vai Gly Gly Arg Asp Gly Gly Asn Ile Lys Leu Leu Leu Asn Glu Gin Thr Thr Vai Thr Phe Tyr Tyr Asn Asp Arg Thr His Ala Ile Ala Asp Ser Thr Trp Tyr Ala Pro Ile Leu Lys Glu Lys Gin Pro Arg Leu Vai Gly Thr Ile Leu Pro Ala Ile Gly Tyr Glu Thr Asp Vai Asn Gly Trp Thr Pro Gin Thr Ser Thr Ala Leu Leu Ser Asp Asp Asp Phe Asp Ser Ile Tyr Thr Phe Lys Ala Arg Vai Pro Lys Gly Thr Tyr Glu Tyr Lys Vai Vai Leu Gly Asn Asp Trp Thr Tyr Glu Asn Tyr Pro Gin Asp Asn Ala Lys Leu Asn Vai Leu Glu Glu Thr Thr Ile Thr Phe Phe Phe Asn Ala Lys Thr Lys Vai Va] Tyr Thr Asp Tyr Asn Pro SeT Gly Ser Asp Gly Ile Vai Gin Lys Asp Arg Leu Lys His Asn Thr Trp Asp Ser Leu Tyr Arg Gin Pro Phe Gly Ala Va] Lys Ala Gly Thr Glu Vai Thr Leu Arg Leu Ser Ala Lys Lys Gly Asp Leu Thr Lys Ala Asp Vai Tyr Vai Lys Asn Thr Thr Thr Gly Thr Ala Lys Leu Tyr Ser Met Lys Lys Ala Gly Vai Leu Gly Glu Glu Glu Tyr Trp Glu Ala Thr Phe Thr Pro Asp Vai Lys Gly Vai Tyr Gly Tyr Lys Phe Ile Ala Vai Asp Ala Gly Thr Lys Ala Glu Tyr Gly Glu Asp Thr Gin Glu Gly Gin Trp Gly Lys Ala Vai Asp Lys Asn Ala Glu Leu Phe Gin Leu Thr Vai Tyr Asp Pro Ser Tyr Gin Thr Pro Asp Trp Met Lys Glu Ala Vai Vai TyrGln Ile Phe Pro Asp Pro Lys

SEQ ID NO: 95 atgtatacactartcatccgttcatattttgatactgatggtgatggtgtaggagactttagtggagttgctgaaaaggtagattaictaaaatctcttg gagtaga taca gtctggtttttaccatttaataaa a gtaaatc tia teatg gata tgatgttgaaga ttactatgatgtagaac caga ttatggaacact acaagâtcttgataatatgata aaagttc taaargaaaatggaataa aggtagt aatggatc ttgttgttaa tc atacgtcggataca ç atccatggtt tcttga tgcagtt gaaaa tac tac taa rtetee atattggaactattacattatga gcttggatgagcclcaaaata agaatcanggca ttataa ggtt aattcaaaaggacaa actgtgtggtattttgga ttgtttgattca tcaatgc c ggacc ttaattac gaca accctaaagtaatgga Igaagt ga aaa a

Fig 16 (cont.)
61/116 aataata ga tttttgggcagatatgggagtagatggatttagatta gatgca gcaaaacatta ttatggatttgactggagcgatggaattga acag tc agcaagc gttgcaaaa gagatagaagactata taaaaga taaacta ggggaaaatgcaatagttgtgagtgaggtttacgatggagattcaa atgttcrtttaaaatttgctccaatgcctgtgtttaattttagttttatgtacaatttgagaggaaattttgaagggagagataacttaatttcagactctatt a gttggg ttga ttcctc gttgtataatttaaatgtttttcattrtccatttattgatagtcatgatc ttga caga ttta tttctgagcttgtagatagtaaa tate agggagatgtaatatctgccacaaaacaatatttgctagttaatgctttaclactctcattaacaggcatgccaactatttactatggtgatgaaatog gacttaggggatggaagtggcattcagaaccatgggatalacctgtgcgtgagccaatgcaatggtataaggatcaaaaagggaacggtcaaa cttattgga caaaagagtttta cgaaggtattactgaaggaa gtgctaatgaagatgga gcaatatacgatgatc cagatgatggagtatctgtag aagaaca aga aaatggatattclattttaaacttttttaaagaa tttatcaacttacgaaaagattatccggca cttgcttttggaagtactacgattga gagagattggaa aaacttgtatgttttgaaaaagtcgta taac ttccaggalgttcttgtattaattaaccttga tccaacgtattcaaâ tacatacgaa gttcca gaaggglataaatgggtgtggtatgc attttttgatggtgaca acta tgaatttggagcaaaagatgaaatgattttacaga átacaagttg gac gataaatccaaggcaaatttatatatttgtaaagtaa

SEQ ID NO: 96

Met Tyr Thr Leu Phe Ile Arg Ser Tyr Phe Asp Thr Asp Gly Asp Gly Vai Gly Asp Phe Ser Gly Vai Ala Glu Lys Vai Asp Tyr Leu Lys Ser Leu Gly Vai Asp Thr Vai Trp Phe Leu Pro Phe Asn Lys Ser Lys Ser Tyr His Gly Tyr Asp Vai Glu Asp Tyr Tyr Asp Vai Glu Pro Asp Tyr Gly Thr Leu Gin Asp Leu Asp Asn Met Ile Lys VaL Leu Asn Glu Asn Gly Ile Lys Vai Vai Met Asp Leu Vai Vai Asn His Thr Ser Asp Thr His Pro Trp Phe Leu Asp Ala Vai Glu Asn Thr Thr Asn Ser Pro Tyr Trp Asn Tyr Tyr Ile Met Ser Leu Asp Glu Pro Gin Asn Lys Asn His Trp His Tyr Lys Vai Asn Ser Lys Gly Gin Thr Vai Trp Tyr Phe Gly Leu Phe Asp Ser Ser Met Pro Asp Leu Asn Tyr Asp Asn Pro Lys Vai Met Asp Glu Vai Lys Lys Ile Ile Asp Phe Trp Ala Asp Met Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Lys His Tyr Tyr Gly Phe Asp Trp Ser Asp Gly Ile Glu Gin Ser Ala Ser Vai Ala Lys Glu Ile Glu Asp Tyr Ile Lys Asp Lys Leu Gly Glu Asn Ala Ile Vai Vai Ser Glu Vai Tyr Asp Gly Asp Ser Asn Vai Leu Leu Lys Phe Ala Pro Met Pro Vai Phe Asn Phe Ser Phe Met Tyr Asn Leu Arg Gly Asn Phe Glu Gly Arg Asp Asn Leu Ile Ser Asp Ser Ile Ser Trp Vai Asp Ser Ser Leu Tyr Asn Leu Asn Vai Phe His Phe Pro Phe Ile Asp Ser His Asp Leu Asp Arg Phe Ile Ser Glu Leu Vai Asp Ser Lys Τγτ Gtn Gly Asp Vai Ile Ser Ala Thr Lys Gin Tyr Leu Leu Vai Asn Ala Leu Leu Leu Ser Leu Thr Gly Met Pro Thr Ile Tyr Tyr Gly Asp Glu Ile Gly Leu Arg Gly Trp Lys Trp His Ser Glu Pro Trp Asp Ile Pro Vai Arg Glu Pro Met Gin Trp Tyr Lys Asp Gin Lys Gly Asn Gly Gin Thr Tyr Trp Thr Lys Glu Phe Tyr Glu Gly Ile Thr Gin Gly Ser Ala Asn Glu Asp Gly Ala Ile Tyr Asp Asp Pro Asp Asp Gly Vai Ser Vai Glu Glu Gin Glu Asn Gly Tyr Ser Ile Leu Asn Phe Phe Lys Glu Phe Ile Asn Leu Arg Lys Asp Tyr Pro Ala Leu Ala Phe Gly Ser Thr Thr Ile Glu Arg Asp Trp Lys Asn Leu Tyr Vai Leu Lys Lys Ser Tyr Asn Phe Gin Asp Vai Leu Vai Leu Ile Asn Leu Asp Pro Thr Tyr Ser Asn Thr Tyr Glu Vai Pro Glu Gly Tyr Lys Trp Vai Trp Tyr Ala Phe Phe Asp Gly Asp Asn Tyr Glu Phe Gly Ala Lys Asp Glu Met Ile Leu Gin Asn Thr Ser Trp Thr He Asn Pro Arg Gin Ile Tyr lie Phe Vai Lys

SEQ ID NO: 97 atgaggaagaagalgtcgcattcaagatttacttttcttttgatcttagcactttttattttcttclccggttgtatttcagaagttaaaagcgaaagccag ctactaaattcaaagcaaaaggtccttgtaaaagtaaatgttaatacgccatttattgagaatgctactactaatâcgtggagtgtttcaaaagaatct ttta ttga ttat cttagtaaagtga ttattactgttaaggatgtaaalgatcagattgtatttactaaggaaac aacgaacaaaacaaa ta ttta ttttgaa attgaacttcttcctggaacttatacatttgaggtaaaaggatatga ggaagatttagttatattttca gggga aaaagttaatc agatcata ga tgag aaaaataatattgttaatgtcgaaactttttttgttaatggaatagttaggacaataattgaagttgacgalanatttataaaaanatgatattacaicgg caacgttgalc ttc aaaaaagatacagcacaa gaagattatgaaga ggtacctgtaacac ttacaggta c ttccactttaattaata aagaattatat cctggtatgtggactgtaaaatttgaagttgatcttaaatcaaaggatgcaagtalgttaccagaaaaagttcatcttgaaaatgaatttagcataga a gtgcttccagcaaa gacaaaaa gttta ac a tttaatgtagtctttgatacagaggttaa tgaaccgaaattogtagtt gtatttccgcaaattgagtt gccttttgtggatcctgtaacaaatt1aagtggagagataaatgaattagaaggÊaatcrttcaatgaattgggactattcagatccaaatgcagaat tttatgtgtataaagaa ttagaggaac aaggagaatatttgtatgaatttgttgg aaaaacacgcgagaaa agttatac aa tagaaaa ttttacc aa g c aagaattcga íaaa ttta gtggaatcgc tattaatgtttatgccaacggtaaagagagtggatta gttgttctaaaa aaagaaaala ttaaa c ttata gatttagaaagtgttgacagtataagtgctacttataacgttgatacgaatgagcttaagttggattggaatlalaccaattcaagtgttacttttgaag

Fig 16 (cont.)
62/316 ttttgaaaaaaggiataaatagcaargaatacgaaataatttctcaactaacacaaaattctrtttcaacagaattcacaggcaggcaaTtttgggatc ttgagaaaattgcgattagagtagtrgctaatggatttgaaagtaagattaatgagatttcaagagatgatataactataacatcattgaatcttcctct tacatc gtctac tatgtatacactattcatccgrtcatattttgata ctgatggtgatggtgta ggagac tttagtggagttgctgaaaaggtagattatc taaaatctcttggagtagatacagictggtttttaccatttaataaaagtaâatcttatcatggatatgatgttgaagattactatgatgtagaaccagat ta tggaacactacaagatcttgataatatga taaaagttc taaatgaaaatggaataaaggtagtaatggatcttgttgttaatcatacgtc ggatac acatccatggtttcttgatgcagttgaaaatactactaattctccatattggaactattacattatgagcttggatgagcctcaaaataagaatcattgg catta taaggttaattcaa aaggacaaactgtgtggtattttggattgtttgattcatcaatgccggaccttaattacgacaaccctaaa gtaatgga t gaagtgaaaaaaataatagatrtrtgÊgcagatatgggagtagatggattUgattagatgcagcaaaacattattatggatttgactggagcgatg gaattgaacagtcagcaagcgttgcaaaagagatagaagactatataaaagataaactaggggaaaatgcaatagttgtgagtgaggtttacga tggagattcaaatgttcttttaaaatttgctceaatgcctgtgttta attttagttttat gtacaatttgagaggaaattttgaa gggaga gata actta att tcagactctattagttgggttgattcctcgttgtataatttaaatgtttttcattttccatttattgatagtcatgatcttgacagatttatttctgagcttgtag atagtaaatatcagggagatgtaatãtctgccacaaaacaatatttgctagttaatgctttactactctcatta.acaggcatgccaactatttactatgg tgatgaaataggacttaggggatggaagtggcattcagaaccatgggatatacctgtgcgtgagccaatgcaatggtataaggatcaaaaagg gaacggtcaaacttattggacaaaagagttttacgaaggtattactgaaggaa gtgctaatgaagatgga gcaatatacgatga tcc agatgatg gagtatclgtagaagaacaagaaaatggatattctattttaaacttttttaaagaatttatcaacttacgaaaagattatccggcacttgcttttggaagt actacgattgaga gagattggaaaa ac ttgtatgttttgaaaaagtcgtataacttccaggatgttc ttgtattaattaaccttgatccaacgtattcaa atacatacgaagttccagaagggtataaatgggtgtggtatgcattttttgatggtgacaactatgaatttggagcaaaagatgaaatgattttacag aatacaagttggacgata aatccaaggcaaa tttatatatttgtaaagtaa

SEQ ID NO: 98

Met Arg Lys Lys Met Ser Hís Ser Arg Phe Thr Phe Leu Leu Ile Leu Ala Leu Phe Ile Phe Phe Ser Gly Cys He Ser Glu Val Lys Ser Glu Ser Gin Leu Leu Asn Ser Lys Gin Lys Vai Leu Vai Lys Vai Asn Val Asn Thr Pro Phe Ile Glu Asn Ala Thr Thr Asn Thr Trp Ser Val Ser Lys Glu Ser Phe Ile Asp Tyr Leu Ser Lys Val Ile Ile Thr Val Lys Asp Val Asn Asp Gin lie Val Phe Thr Lys Glu Thr Thr Asn Lys Thr Asn Ile Tyr Phe Glu Ile Glu Leu Leu Pro Gly Thr Tyr Thr Phe Glu Val Lys Gly Tyr Glu Glu Asp Leu Val lie Phe Ser Gly Glu Lys Val Asn Gin lie Ile Asp Glu Lys Asn Asn Ile Val Asn Val Glu Thr Phe Phe Val Asn Gly Ile Val Arg Thr He Ile Glu Val Asp Asp Ile Ile Tyr Lys Asn Tyr Asp Ile Thr Ser Ala Thr Leu Ile Phe Lys Lys Asp Thr Ala Gin Glu Asp Tyr Glu Glu Val Pro Val Thr Leu Thr Gly Thr Ser Thr Leu Ile Asn Lys Glu Leu Tyr Pro Gly Met Trp Thr Val Lys Phe Glu Val Asp Leu Lys Ser Lys Asp Ala Ser Met Leu Pro Glu Lys Val His Leu Glu Asn Glu Phe Ser Ile Glu Val Leu Pro Ala Lys Thr Lys Ser Leu Thr Phe Asn Val Val Phe Asp Thr Glu Val Asn Glu Pro Lys Leu Val Val Val Phe Pro Gin Ile Glu Leu Pro Phe Val Asp Pro Val Thr Asn Leu Ser Gly Glu Ile Asn Glu Leu Glu Gly Asn Leu Ser Met Asn Trp Asp Tyr Ser Asp Pro Asn Ala Glu Phe Tyr Val Tyr Lys Glu Leu Glu Glu Gin Gly Glu Tyr Leu Tyr Glu Phe Val Gly Lys Thr Arg Glu Lys Ser Tyr Thr Ile Glu Asn Phe Thr Lys Gin Glu Phe Asp Lys Phe Ser Gly Ile Ala Ile Asn Val Tyr Ala Asn Gly Lys Glu Ser Gly Leu Val Val Leu Lys Lys Glu Asn Ile Lys Leu Ile Asp Leu Glu Ser Val Asp Ser Ile Ser Ala Thr Tyr Asn Val Asp Thr Asn Glu Leu Lys Leu Asp Trp Asn Tyr Thr Asn Ser Ser Val Thr Phe Glu Val Leu Lys Lys Gly Ile Asn Ser Asn Glu Tyr Glu He Ile Ser Gin Leu Thr Gin Asn Ser Phe Ser Thr Glu Phe Thr Gly Arg Gin Phe Trp Asp Leu Glu Lys Ile Ala Ile Arg Val Val Ala Asn Gly Phe Glu Ser Lys lie Asn Glu Ile Ser Arg Asp Asp Ile Thr Ile Thr Ser Leu Asn Leu Pro Leu Thr Ser Ser Thr Met Tyr Thr Leu Phe Ile Arg Ser Tyr Phe Asp Thr Asp Gly Asp Gly Val Gly Asp Phe Ser Gly Val Ala Glu Lys Val Asp Tyr Leu Lys Ser Leu Gly Val Asp Thr Val Trp Phe Leu Pro Phe Asn Lys Ser Lys Ser Tyr His Gly Tyr Asp Val Glu Asp Tyr Tyr Asp Val Glu Pro Asp Tyr Gly Thr Leu Gin Asp Leu Asp Asn Met He Lys Val Leu Asn Gin Asn Gly Ile Lys Val Val Met Asp Leu Val Val Asn His Thr Ser Asp Thr His Pro Trp Phe Leu Asp Ala Val Glu Asn Thr Thr Asn Ser Pro TyrTrp Asn Tyr Tyr Ile Met Ser Leu Asp Glu Pro Gin Asn Lys Asn His Trp His Tyr Lys Val Asn Ser Lys Gly Gin Thr Val Trp Tyr Phe Gly Leu Phe Asp Ser Ser Met Pro Asp Leu Asn Tyr Asp Asn Pro Lys Val Met Asp Glu Val Lys Lys Ile Ile Asp Phe Trp Ala Asp Met Gly Val Asp Gly Phe Arg Leu Asp Ala Ala Lys His Tyr Tyr Gly Phe Asp Trp Ser Asp Gly He Glu Gin Ser Ala Ser Val Ala Lys Glu Ile Glu Asp Tyr Ile Lys Asp Lys Leu Gly Glu Asn Ala Ile Val Val Ser Glu Val
63/116

Figure 16 (cont.)

Tyr Asp Gly Asp Ser Asn Vai Leu Leu Lys Phe Ala Pro Met Pro Vai Phe Asn Phe Ser Phe Met Tyr Asn Leu Arg Gly Asn Phe Glu Gly Arg Asp Asn Leu Ile Ser Asp Ser Ile Ser Trp Vai Asp Ser Ser Leu Tyr Asn Leu Asn Vai Phe His Phe Pro Phe Ile Asp Ser His Asp Leu Asp Arg Phe Ile Ser Glu Leu Vai Asp Ser Lys Tyr Gin Gly Asp Vai lie Ser Ala Thr Lys Gin Tyr Len Leu Vai Asn Ala Leu Leu Leu Ser Leu Thr Gly Met Pro Thr He Τγτ Tyr Gly Asp Glu He Gly Leu Arg Gly Trp Lys Trp His Ser Glu Pro Trp Asp Ile Pro Vai Arg Glu Pro Met Gin Trp Tyr Lys Asp Gin Lys Gly Asn Gly Gin Thr Tyr Trp Thr Lys Glu Phe Tyr Glu Gly Ile Thr Glu Gly Ser Ala Asn Glu Asp Gly Ala Ile Tyr Asp Asp Pro Asp Asp Gly Vai Ser Vai Glu Glu Gin Glu Asn Gly Tyr Ser Ile Leu Asn Phe Phe Lys Glu Phe Ile Asn Leu Arg Lys Asp Tyr Pro Ala Leu Ala Phe Gly Ser Thr Thr Ile Glu Arg Asp Trp Lys Asn Leu Tyr Vai Leu Lys Lys Ser Tyr Asn Phe Gin Asp Vai Leu Vai Leu He Asn Leu Asp Pro Thr Tyr Ser Asn Thr Tyr Glu Vai Pro Glu Gly Tyr Lys Trp Vai Trp Tyr Ala Phe Phe Asp Gly Asp Asn Tyr Glu Phe Gly Ala Lys Asp Glu Met Ile Leu Gin Asn Thr Ser Trp Thr Ile Asn Pro Arg Gin Ile Tyr He Phe Vai Lys

SEQ ID NO: 99 atgtac acactcttca tccgctctttttacgatacaaacaacgacggtgtaggtgac tacaacggtgttgc cc aaaaagtagactatctcaaa acg cttggagtggatacagtttggttcttgccgttcaacaaagcaaaatcgtaccacggttacgatgttgaagactactacgatgtagaacctgactatg gaacatacgcacaacttgaaaatatgataaagacactcaatcagaacggaattcgtgttgttatggacttggttgtgaaccacacttccgatacac actcgtggtttctggatgccgttgagaacacaacgaattc gaaatattggagc tactacataatgacac ttgaaa a tagagacggttggaatcact ggcattggaagataaactcaaaagggcaaaaagtttactacttcggactgtttgactcatcaatgcccgatttgaatttcgacaatccacaagtgat gaacgaaatcaagagaalaatcgatttctggataacagttggtgtggatggtttcagacttgatgcaccaaagcactacaaaggctgggattggg acgacggcatttcaggttcagcagcaatcgcgagggaaatagaaagttacatcaggagcaagttaggaaacgatgcgaUgttgtcggggaa gtgtacgatgga aa tccatcggtlctttcacaatttgcaccgatgccggcgttcaacttc a cattcatgta tggaata acaggcaaccatgagggg aaagataacctgctgggagaaa caatttcatgggttaa tggagc gagftattatctcaacgtaaaacatttcccgttcatagacaatcacgatttg a aca gatggatatcgatacttatc gaccaaaagtatagtggaaacacacaagttggtacgaagcagtatattttaac aaatgc gctcttgctttcctta aacggtatgcctgttatttattatgg gaatgaaa taggcttgagaggatggaaatggggacaagaccc gtgggatttgcc ggtgagagagccga tgcagtggtacgcaagtcaaagtggagctgggcagacatggtggacaaagcctgtctaccagcaaaaaggaatcacatttggaaatgcaa&c gtcgatggtgcgatgtacgatgatccaaatgatggggtttcagtagaagagcagatgaatggttacacgataaataacttctttaaacaattcataa ccctgaggaagacatatccggctctatcgaaaggttcgataacgatagaacgcgactggaagaacctgtacgttatcaaacgagtctacggaa a tcaggaagtgcttgtattgataaactta gacccaa c ttggcc gaacaattacac gttaccaggtggatacaggtg ggtctggtatgc gttctttaa tgggagtttgtttgaatttggcaataaaaac gaatcaccactgagccaagatacc aactggacagtc aatc caa ggcaa gtgtatgtgtttg tgaa ggactaa

SEQ IDNO: 100

Met Tyr Thr Leu Phe Ile Arg Ser Phe Tyr Asp Thr Asn Asn Asp Gly Vai Gly Asp Tyr Asn Gly Vai Ala Gin Lys Vai Asp TyT Leu Lys Thr Leu Gly Vai Asp Thr Vai Trp Phe Leu Pro Phe Asn Lys Ala Lys Ser Tyr His Gly Tyr Asp Vai Glu Asp Tyr Tyr Asp Vai Glu Pro Asp Tyr Gly Thr Tyr Ala Gin Leu Glu Asn Met Ile Lys Thr Leu Asn Gin Asn Gly Ile Arg Vai Vai Met Asp Leu Vai Vai Asn His Thr Ser Asp Thr His Ser Trp Phe Leu Asp Ala Vai Glu Asn Thr Thr Asn Ser Lys Tyr Trp Ser Tyr Tyr Ile Met Thr Leu Glu Asn Arg Asp Gly Trp Asn His Trp His Trp Lys He Asn Ser Lys Gly Gin Lys Vai Tyr Tyr Phe Gly Leu Phe Asp Ser Ser Met Pro Asp Leu Asn Phe Asp Asn Pro Gin Vai Met Asn Glu Ile Lys Arg Ile Ile Asp Phe Trp Ile Thr Vai Gly Vai Asp Gly Phe Arg Leu Asp Ala Pro Lys His Tyr Lys Gly Trp Asp Trp Asp Asp Gly He Ser Gly Ser Ala Ala Ile Ala Arg Glu Ile Glu Ser Tyr Ile Arg Ser Lys Leu Gly Asn Asp Ala Ile Vai Vai Gly Glu Vai Tyr Asp Gly Asn Pro Ser Vai Leu Ser Gin Phe Ala Pro Met Pro Ala Phe Asn Phe Thr Phe Met Tyr Gly Ile Thr Gly Asn His Glu Gly Lys Asp Asn Leu Leu Gly Glu Thr Ile Ser Trp Vai Asn Gly Ala Ser Tyr Tyr Leu Asn Vai Lys His Phe Pro Phe Ue Asp Asn His Asp Leu Asn Arg Trp Ile Ser Ue Leu Ile Asp Gin Lys Tyr Ser Gly Asn Thr Gin Vai Gly Thr Lys Gin Tyr Ile Leu Thr Asn Ala Leu Leu Leu Ser Leu Asn Gly Met Pro Vai Ile TyT Tyr Gly Asn Glu Ile Gly Leu Arg Gly Trp Lys Trp Gly Gin Asp Pro Trp Asp Leu Pro Vai Arg Glu Pro Met Gin Trp Tyr Ala Ser Gin Ser Gly Ala Gly Gin Thr Trp Trp Thr Lys Pro
64/116

Fig: 16(cont.)

Vai Tyr Gin Gin Lys Gly Ile Thr Phe Gly Asn Ala Asn Vai Asp Gly Ala Met Tyr Asp Asp Pro Asn Asp Gly Vai Sér Vai Glu Glu Gin Met Asn Gly Tyr Thr He Asn Asn Phe Phe Lys Gin Phe Ile Thr Leu Arg Lys Thr Tyr Pro Ala Leu Ser Lys Gly Ser He Thr Ile Glu Arg Asp Trp Lys Asn Leu Tyr Vai Ile Lys Arg Vai Tyr Gly Asn Gin Glu Vai Leu Vai Leu He Asn Leu Asp Pro Thr Trp Pro Asn Asn Tyr Thr Leu Pro Gly Gly Tyr Arg Trp Vai Trp Tyr Ala Phe Phe Asn Gly Ser Leu Phe Glu Phe Gly Asn Lys Asn Glu Ser Pro Leu Ser Gin Asp Thr Asn Trp Thr Vai Asn Pro Arg Gin Vai Tyr Vai Phe Vai Lys Asp

SEQ ID NO: 101 ttgc gattc tttccaaagttaatatccccttrtcc gcaaaacaccagagagtggcagcgaagcgcagtatcaagagacactgaacaattacaaag gaaagtaalaatgatcaatttgaaaaaaaacaccattagcgpcctggtcgcaggtatggtattaggctttgcatccaacgcaatggcggttcctag aaccgcttttgtacacctctttgaatggaaatgggaagatgttgcacaggagtgtgaaacatttctcggacctaaaggctttgccgcagtgcaagt etc tccgccaactaaatctcacaacacgg atgc atggtggggccgttatcaacccgttagrtatgcttttgaaggac gcagc ggtaatc gcagcc aatttaaaaatatggtgcaacgttgtaaagctgtaggcgtcgatatatac gtagatgcagtgattaaccacat ggcagcctac gacaga aatttcc c tgatgtaccctatagc agtaatgactttaactcctgtacaggagatattgactataataaccgrtggcaaacacagcattgtgattta gt cggtctta atgatctaaaaacaggatctgactacgtccgccaaaaaatagcggattatatgaacgacgcaatcagtatgggtgtagctggtttccgtattgatg cagccaaacatataccagcaggtgatatagctgccattaaaggtaaattaaatggtaatccatacatcttccaagaggtaatrggtgcatccggcg aacctgttcgaccgactgaata cac ctttatcggtggtgtcacggaatttcaatttgctcgaaaattgggtcc agee ttccgcaatagta atattgctt ggttaaaagacattggcagtc aaatggaa ttatccagtgctgatgccgtaacatttgtaa cgaatcatgatgaagagcgtcataacccgaa tggtc cta tttggcacggcgttcaaggtaatggttatgcattagcaaatattttca ccttagcttacccttac ggctatcca aaaatcatgtcaggatac ttc tt ccacggtgactttaacgcagctccaccaagcagtggtatacacacaggaaatgcgtgtggttttgatggcggagactgggtatgcgaacacaa atggc gcggtattgcta acatggttgccttccgcaactatacagcaagc gaatggcgtatcagtaa ttggtgg caa aacagtaacgaccaaattg cttttggtcgc ggtggttta ggttttgttgttattaataaa cgtgctaatggtagcattaatcaaa gttttgatacgggaatgcctgatggccaatac tgt aacataatagaagctaactttgatgaaagcaccggccaatgtagtgcagctacagattccaacggtcaagccgttattaccgtcagtggtgggca agctaactttaatgtagcaggcgatoatgctgctgca attcatgttg gcgcaaaaattggtgatcaatgtagtggtgatgattgcc ca tgtacagga tccgattgtaataatgatcctaaacctgattttgcagtaccagcaacatcaatttgtacatcagaaaatttacctacgctatattactggggagcaca gc ctacagatagc ttagcgaatgcagcttggc caggtgtcgcaatgcaaacaaatggcga ctt taagtgtca tgatttaggtgtc gaactaacca a aattaacgccatcttta gtgacaatggtgca aataaaacagctgatotaactgttactggtgcaggttgttataaagacgggac ttgga gcacctt acaaaattgfggctttgaaattaccggtgcacaaaccaatccagtcggtggcgacgaagtctggíacttccgaggtactgctaatgactggggta aagcacaattagattatgacgcaactagc ggtttgtattacacaata caaagctttaa tggtgaagaa gea cctgcgcgttttaaaattgataatggt agttggactgaagcttatccaacagctgattaccaagttacagataacaattcataccgcatíaactttaatagcgatagcaaagcgattacagtaa acgcacaataa

SEQIDNO: 102

Met Arg Phe Phe Pro Lys Leu Ile Ser Pro Phe Pro Gin Asn Ihr Arg Glu Trp Gin Arg Ser Ala Vai Ser Arg Asp Thr Glu Gin Leu Gin Arg Lys Vai Ile Met lie Asn Leu Lys Lys Asn Thr Ile Ser Ala Leu Vai Ala Gly Met Vai Leu Gly Phe Ala Ser Asn Ala Met Ala Vai Pro Arg Thr Ala Phe Vai His Leu Phe Glu Trp Lys Trp Glu Asp Vai Ala Gin Glu Cys Glu Thr Phe^eu Gly Pro Lys Gly Phe Ala Ala Vai Gin Vai Ser Pro Pro Thr Lys Ser His Asn Thr Asp Ala Trp Trp G ly Arg Tyr Gin Pro Vai Ser Tyr Ala Phe Glu Gly Arg Ser Gly Asn Arg Ser Gin Phe Lys Asn Met Vai Gin Arg Cys Lys Ala Vai Gly Vai Asp Ile Tyr Vai Asp Ala Vai Ile Asn His Met Ala Ala Tyr Asp Arg Asn Phe Pro Asp Vai Pro Tyr Ser Ser Asn Asp Phe Asn Ser Cys Thr Gly Asp Ile Asp Tyr Asn Asn Arg Trp Gin Thr Gin His Cys Asp Leu Vai Gly Leu Asn Asp Leu Lys Thr Gly Ser Asp Tyr Vai Arg Gin Lys Ile Ala Asp Tyr Met Asn Asp Ala Ile Ser Met Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys His lie Pro Ala Gly Asp He Ala Ala Ile Lys Gly Lys Leu Asn Gly Asn Pro Tyr Ile Phe Gin Glu Vai Ile Gly Ala Ser Gly Glu Pro Vai Arg Pro Thr Glu Tyr Thr Phe Ile Gly Gly Vai Thr Glu Phe Gin Phe Ala Arg Lys Leu Gly Pro Ala Phe Arg Asn Ser Asn Ile Ala Trp Leu Lys Asp Ile Gly Ser Gin Met Glu Leu Ser Ser Ala Asp Ala Vai Thr Phe Vai Ihr Asn His Asp Glu Glu Arg His Asn Pro Asn Gly Pro Ile Trp His Gly Vai Gin Gly Asn Gly Tyr Ala Leu Ala Asn Ile Phe Ihr Leu Ala Tyr Pro Tyr Gly Tyr Pro Lys Ile Met Ser Gly Tyr Phe Phe His Gly Asp Phe Asn Ala Ala Pro Pro Ser Ser Gly Ile His Thr
65/116

Fig 16 (cont.)

Gly Asn Ala Cys Gly Phe Asp Gly Gly Asp Tip Vai Cys Glu His Lys Trp Arg Gly He Ala Asn Met Vai Ala Phe Arg Asn TyT Thr Ala Ser Glu Trp Arg Ile Ser Asn Trp Trp Gin Asn Ser Asn Asp GJn Ile Ala Phe Gly Arg Gly Gly Leu Gly Phe Vai V al Ile Asn Lys Arg Ala Asn Gly Ser He Asn Gin Ser Phe Asp Thr Gly Met Pro Asp Gly Gin Tyr Cys Asn Ile He Glu Ala Asn Phe Asp Glu Ser Thr Gly Gin Cys Ser Ala Ala Thr Asp Ser Asn Gly Gin Ala Vai He Thr Vai Ser Gly Gly Gin Ala Asn Phe Asn Vai Ala Gly Asp His Ala Ala Ala Ile His Vai Gly Ala Lys Ile Gly Asp Gin Cys Ser Gly Asp Asp Cys Pro Cys Thr Gly Ser Asp Cys Asn Asn Asp Pro Lys Pro Asp Phe Ala Vai Pro Ala Thr Ser Ile Cys Thr Ser Glu Asn Leu Pro Thr Leu Tyr Tyr Trp Gly Ala Gin Pro Thr Asp Ser Leu Ala Asn Ala Ala Trp Pro Gly Vai Ala Met Gin Thr Asn Gly Asp Phe Lys Cys His Asp Leu Gly Vai Glu Leu Thr Lys Ile Asn Ala Ile Phe Ser Asp Asn Gly Ala Asn Lys Thr Ala Asp Leu Thr Vai Thr Gly Ala Gly Cys Tyr Lys Asp Gly Thr Trp Ser Thr Leu GIn Asn Cys Gly Phe Glu He Thr Gly Ala Gin Thr Asn Pro Vai Gly Gly Asp Glu Vai Trp Tyr Phe Arg Gly Thr Ala Asn Asp Trp Gly Lys Ala Gin Leu Asp Tyr Asp Ala Thr Ser Gly Leu Tyr Tyr Thr Ile Gin Ser Phe Asn Gly Glu Glu Ala Pro Ala Arg Phe Lys Ile Asp Asn Gly Ser Trp Thr Glu Ala Tyr Pro Thr Ala Asp Tyr Gin Vai Thr Asp Asn Asn Ser Tyr Arg Ile Asn Phe Asn Ser Asp Ser Lys Ala Ile Thr Vai Asn Ala Gin SEQIDNO: 103 gtgc taacgtttcaccgcatcattcgaaaagga tggatgttcctgctcgcgtttttgctcactgc ctcgclgttctgc c caacaggacagcccgcca aggctgccgcaccgtttaacggcaccatgatgcagtattttgaatggtacttgccggatgatggcacgttatggaccaaagtggccaatgaagc caacaacttatccagccttggcatcaccgctctttggctgccgcccgcttacaaaggaacaagccgcagcgacgtagggtacggagtatacga cttgtatgacctcggcgaattcaatcaâaaagggaccgtccgcacaaaatacggaacaaaagctcaatatcttcaagccattcaagccgcccac gccgctggaatgcaagtgtacgccgatgtcgtgttcgaccataaaggcggcgccgacggcacggaatgggtggacgccgtcgaagtcaatc cgtecgaccgcaaccaagaaatctcgggcacctatcaaatccaagcatggacgaaatttgattttcccgggcggggcaacacctactccagctt taagtggcgctggtaccattttgacggcgttgattgggacgaaagccgaaaattgagccgcatttacaaattccgcggcatcggcaaagcgtgg gattgggaagtagacacggaaaacggaaactatgactacttaatgtatgccgaccttgatatggatcatcccgaagtcgtgaccgagctgaaaa actggggggaatggtatgtcaacacaacgaacattgatgggttccggcttgatgccgtcaagcatattaâgttcagtttttttcctgattggttgtcgt atgtgcgttctcagactggc aagccgctatttaccgtcggggaatattggagctatgac atcaacaagttgc acaattacattacgaaaacaaac g gaacgatgtctttgtttgatgccccgttaçacaacaaattttataccgcttccaaatcagggggcgcatttgatatgcgcacgttaatgaccaatact ctcatgaaagatcaaccgacattggccgtcaccttc gttgataatcatga cacc gaacccggccaagcgc tgcagtcatgggtcgacccatggt tcaaaccgttggcttacgcctttattctaactcggcaggaaggatacccgtgcgtcttttatggtgactattatggcattccacaatataacattccttc gctgaaaageaaaatcgatc cgctcctcatcgcgcgc aggg attatgcttac ggaacgcaacatgattatcttgatc actccgacatcatcgggt ggacaagggaaggggtcactgaaaaaccaggatccgggctggccgcactgatcaccgatgggccgggaggaagcaaatggatgtacgttg gcaaacaacacgctggaaaagtgttctatgaccttaccggcaaccggagtgacaccgtcaccatcaacagtgatggatggggggaattc3aa gtcaatggcggttcggtttcggtttgggncctagaaaaacgaccgtttctaccategctcggccgatcacaacccgaccgtggactggtgaattc gtccgttggaccgaaccacggttggtggcatggccttga

SEQIDNO: 104

Vai Leu Thr Phe His Arg Ile Ile Arg Lys Gly Tip Met Phe Leu Leu Ala Phe Leu Leu Thr Ala Ser Leu Phe Cys Pro Thr Gly Gin Pro Ala Lys Ala Ala Ala Pro Phe Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Tyr Leu Pro Asp Asp Gly Thr Leu Trp Thr Lys Vai Ala Asn Glu Ala Asn Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Arg Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Leu Gin Ala 11c Gin Ala Ala His Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asp His Lys Gly Gly Ala Asp Gly Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu lie Ser Gly Thr TyT Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile TyT Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Tip Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pm Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Glu Trp TyT Vai Asn Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Vai Arg Ser GIn Thr Gly Lys Pro Leu Phe Thr Vai Gly
66/116

Fig 16 (cont.)

Glu Tyr Trp Ser Tyr Asp Ile Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp Ala Pro Leu Hís Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gin Pio Thr Leu Ala Vai Thr Phe Vai Asp Asn His Asp Thr Glu Pro Gly Gin Ala Leu Gin Ser Trp Vai Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Gin Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile Asp Pro Leu Leu De Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Ser Asp Ke He Gly Trp Thr Arg Glu Gly Vai Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Gin His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr He Asn Ser Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Vai Tip Vai Pro Aig Lys Thr Thr Vai Ser Thr Ile Ala Arg Pro Ile Thr Thr Arg Pro Trp Thr Gly Glu Phe Vai Arg Trp Tiú Glu Pro Arg Leu Val Ala Trp Pró

SEQIDNO: 105 atgtccctattcaaaaaaatctttccgtggattgtatctctacttcttttgttttcgtttattgctcctttttccattcaaacagaaaaagtccgcgctggaa gtgttccagtgaatggaacgatgatgcaatatttcgaatggtaccttccagacgatggaacactatggacgaaagtagcaaataacgcccaatct ttagcgaatcttggc attactgccctttggcttccccctgc c tataaaggaacaa gcageagtgacgttggatatggcgtttatgatttatatgacct aggagagtttaatcaaaaaggaactgtccgaacaaaatacggaacaaaaacacaatatatccaagcaatccaagcggcgcatacagcaggaa tgcaagtatatgcagatgtcgtctttaáccataaagccggtgcagatgggacagaactagtggatgcagtagaagtaaacccttctgaçcgcaat caagaaatatcaggaacatatcaaatccaagcgtggacaaaatttgattttcctggtcgtggaaacacctattctagttttaaatggcgttggtatca tttcgatggaacggactgggatgagagtagaaaactaaatcgtatttacaaattccgcggcacgggaaaagcatgggattgggaagtagataca gaaaatgggaattatgactatctcatgtatgcagatttggatatggatcatecagaggttgtatctgaactaaaaaattggggaaagtggtatgtaa ccacaaccaatatcgac ggattcc gtctggatgcagtgaagcatattaaatatagctttttcccaga ctggctatc gtatgtacgaac c caaacac aaaagcctcrttttgccgttggegaattttggagctatgacattaacaagctacacaactatattacaaagacgaacggctctat6tccctattcgat gc cccgctgcâtaacaattmatata gcatcgaaatcaggtggctattttgatatgcgc ac attactcaacaacaca ttgatgaaa ga tcaaccaa cactatcggtcacattagtagacaatcacgatactgagccagggcaatctttgcagtcgtgggtcgagccgtggtttaaaccgttagcttacgcat ttatcttgacccgccaagaaggttatccgtgcatcttttatggagattactatggtattccaaaatacaacattcctgcgctgaaaagcaaacttgatc cgctgttaattgctcgaagagattatgc ctac ggaacacagcac gactata ttgacaatgc agatattatcggclggacgcgggaaggagta gel gaaaaagcaaattcgggacttgctgcacteattaccgacggacctggcggaagcaaatggatglatgttggcaaacaacacgctggcaaaac gttttatgatctaaccggcaa tcgaagtgata cagtgaca atcaacgc tgatggatgggga ga atttaa agtca atggagggtctgtatccatatg ggttccaaaaacalcaaccacttcccaaatcacatttactgtaaataatgccacaaccgtttggggacaaaatgtatacgttgtcgggaatatttcg cagcigggcaac

SEQIDNO; 106

Met Ser Leu Phe Lys Lys Ile Phe Pro Trp Ile Vai Ser Leu Leu Leu Leu Phe Ser Phe lie Ala Pro Phe Ser Ile Gin Thr Glu Lys Vai Arg Ala Gly Ser Vai Pro Vai Asn Gly Thr Mel Met Gin Tyr Phe Glu Trp Tyr Leu Pro Asp Asp Gly Thr Leu Trp Thr Lys Vai Ala Asn Asn Ala Gin Ser Leu Ala Asn Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala TyT Lys Gly Thr Ser Ser Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Thr Gin Tyr Ile Gin Ala Ile Gin Ala Ala His Thr Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Gly Thr Glu Leu Vai Asp Ala Vai Glu Vai Asn Pro Ser Asp Arg Asn Gin Glu lie Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Ser Glu Leu Lys Asn Trp Gly Lys Trp Tyr Vai Thr Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys TyT Ser Phe Phe Pro Asp Trp Leu Scr Tyr Vai Arg Thr Gin Thr Gin Lys Pro Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp lie Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Ser Met Ser Leu Phe Asp Ala Pró Leu His Asn Asn Phe Tyr Ile Ala Ser Lys Ser Gly Gly Tyr Phe Asp Met Arg Thr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Thr Leu Ser Vai Thr Leu Vai Asp Asn His Asp Thr
67/116

Fig 16 (cont.)

Glu Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe He Leu Thr Arg Gin Glu Gly Tyr Pro Cys Ile Phe Tyr Gly Asp Tyr TyT Gly Ile Pro Lys Tyr Asn Ile Pro Ala Leu Lys Ser Lys Leu Asp Pro Leu Leu lie Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin His Asp TyT lie Asp Asn Ala Asp Ile Ile Gly Trp Thr Arg Glu Gly Vai Ala Glu Lys Al a Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Gin His Ala Gly Lys Thr Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser He Trp Vai Pro Lys Thr Ser Thr Thr Ser Gin He Thr Phe Thr Vai Asn Asn Ala Thr Thr Vai Trp Gly Gin Asn Vai TyT Vai Val Gly Asn Ile Ser Gin Leu Gly Asn

SEQIDNO; 107 atggacagcctcgacgcgccggagca gaagccc tgggtgaaggatggcaggctctccgcgtacc tggatacagggac agggaccgtggtc gctcccgaggcacctgcgcccccgccgcccccggccgaggaagtccggcccgtggacaagtggaaaaacgatatcatctatttcgtcctcac cgaccgtttccaggatggcgacaagaceaacaacatggacgtggtcccgacggacalgaaaaaatatcatggcggcgacatccaggggctc atcgacaagctcgactatatcaaggagaccggtlcgacggccatctggctcacgccccctatgaaggggcagacccacttcttcgagaccgac aattaccatggttactggcccattgacttctatgaeacggacccccatgtgggcaccatgcagaaatttgaggagcttatcgagaaagcccatga gaaa gggctgaaga tcgtgctcgatattcc cctgaaccacacggcctgggagca tcccttctacaaggacgacagcaagaaggactggttcc accatataggagatgtgaaggactgggaagatccctactgggctgaaaacggctccatattcggtcttcctgacctggcgcaggaaaaccctg ccgtggaaaagtacc tcatcgacgtggcc aagttclgggta gacaagggtattgacggcttca ggcttgacgcc gtgaagaacgtgcccctca ac ttctgggcgaa gtttgaccgggcgattcacgattatgcgggcaaggacttcctcctcgtegggga atactttgacggaaaccc ggc gaa agt cgcgaactaccagagagaggacatgagctcactcttcgattacccgctctactggaccctgaaggacaccttcgccaaggacgggagcatgc gcaacctggcggcgaagcttgatgagtgcgacaggaattatcccgacccgggcctcatgtcggttttccttgataaccacgacacgccgaggtt cclcaccgaggccaacggcaacaagga taagctcaaac tggccctcgc cttcgc gatgaccatcaa cc gcatgc ctacc atttatta tggcacc gaggttgccatggaaggcaactgcgatatcatgggcgccgtagataaccggagggacatgcagtgggacaaggatcctgacaigttcaaaU çttcaag actctcaccac tgcccgcaatgagcatgaatc cc tcagggaaggaaagaa gctcgagatgtggcaggatgac aaagtc tacgcgta cgggaggpagaccccgaaggacgagtctatcgtggtgcttaacaacggctatgatacgcaggaacgggacataccgctccgccccgagag cggcatcaagaacggcacggtgctgaaggatgtcatcaccggcgaaaccgtgacggtacagaacggaaaaatccatgcgaaatgcggcgg caaacaggcgcggatctacgtgcccgcgtag

SEQ ID NO; 108

Met Asp Ser Leu Asp Ala Pro Glu Gin Lys Pro Trp Vai Lys Asp Gly Arg Leu Ser Ala TyT Leu Asp Thr Gly Thr Gly Thr Vai Vai Ala Pro Glu Ala Pro Ala Pro Pro Pro Pro Pro Ala Glu Glu Vai Arg Pro Vai Asp Lys Trp Lys Asn Asp Πβ Ile Tyr Phe Vai Leu Thr Asp Arg Phe Gin Asp Gly Asp Lys Thr Asn Asn Met Asp Vai Vai Pro Thr Asp Met Lys Lys Tyr His Gly Gly Asp Ile Gin Gly Leu Ile Asp Lys Leu Asp TyT Ile Lys Glu Thr Gly Ser Thr Ala Ile Trp Leu Thr Pro Pro Met Lys Gly Gin Thr His Phe Phe Glu Thr Asp Asn Tyr His Gly TyT Trp Pro Ile Asp Phe Tyr Asp Thr Asp Pro His Vai Gly Thr Met Gin Lys Phe Glu Glu Leu Ile Glu Lys Ala His Glu Lys Gly Leu Lys Ile Vai Leu Asp Πε Pra Leu Asn His Thr Ala Trp Glu His Pro Phe TyT Lys Asp Asp Ser Lys Lys Asp Trp Phe His His He Gly Asp Vai Lys Asp Trp Glu Asp Pro TyT Trp Ala Glu Asn Gly Ser Ile Phe Gly Leu Pro Asp Leu Ala Gin Glu Asn Pro Ala Vai Glu Lys Tyr Leu Ile Asp Vai Ala Lys Phe Trp Vai Asp Lys Gly Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys Asn Vai Pro Leu Asn Phe Trp Ala Lys Phe Asp Arg Ala Ile His Asp TyT Ala Gly Lys Asp Phe Leu Leu Vai Gly Glu TyT Phe Asp Gly Asn Pro Ala Lys Vai Ala Asn Tyr Gin Arg Glu Asp Met Ser Ser Leu Phe Asp Tyr Pro Leu TyT Trp Thr Leu Lys Asp Thr Phe Ala Lys Asp Gly Ser Met Arg Asn Leu Ala Ala Lys Leu Asp Glu Cys Asp Arg Asn Tyr Pro Asp Pro Gly Leu Met Ser Vai Phe Leu Asp Asn His Asp Thr Pro Arg Phe Leu Thr Glu Ala Asn Gly Asn Lys Asp Lys Leu Lys Leu Ala Leu Ala Phe Ala Met Thr He Asn Arg Met Pro Thr Ile TyT Tyr Gly Thr Glu Vai Ala Met Glu Gly Asn Cys Asp Ile Met Gly Ala Vai Asp Asn Arg Arg Asp Met Gin Trp Asp Lys Asp Pro Asp Met Phe Lys TyT Phe Lys Thr Leu Thr Thr Ala Arg Asn Glu His Glu Ser Leu Arg Glu Gly Lys Lys Leu Glu Met Trp Gin Asp Asp Lys Vai Tyr Ala Tyr Gly Arg Gin Thr Pro Lys Asp Glu Ser Ile Vai Vai Leu Asn Asn Gly Tyr Asp Thr Gin Glu Arg Asp Ile

Fig 16 (cont.)
68/Π6

Pro Leu Arg Pro Glu Ser Gly He Lys Asn Gly Thr Vai Leu Lys Asp Vai Ile Thr Gly Glu Thr Vai Thr Vai Gin Asn Gly Lys Ile His Ala Lys Cys Gly Gly Lys Gin Ala Arg lie Tyr Vai Pro Ala SEQ IDNO: 109 aiggcaagaaaaacgctggccatatttttcgtacttctagtgcttcttagtctctcggcagttccggcaaaggcagaaactctagagaatggtgga gttataatgçaggctttctattgggatgttcctggaggaggaatctggtgggacacaatagctcaaaagatacccgaatgggcaagtgcaggaal ctcagcga tatggattccaccagc gagta agggcatgagcggtggttattccatgggctacgatccctacgatttc tttgac ctcggcgagtacta tc agaa ggggacagttgagacgc gcttcggctcaaaggaagaac tggt^acatgataaaca ccgcacac tcctacggc ataaaggtgatag cggacatagtcataaaccaccgcgccggtggagaccttgagtggaac cccttc gtgaacgactatacctggacagacttc tcaaaa gtc gcctc c ggtaaatatacggcc aaciaccttgacttccacccaaacgagcttcac tgttgtgatgaaggtacctttggaggataccctgatatatgtc acga caaaagctgggacc agtactggctctgggcgagcagcgaaagctac gctgcctacctcaggagcatagg ggtt gacgc ctggc gtttcgact acgtcaagggctacggagcatgggttgttaacgactggctcagctggtggggaggctgggccgttggagagtactgggacacgaacgttgat gcactccteaactgggcatacagcagcggcgccaaggtctttgacttcccgctctactacaagatggacgaagccttcgacaacaccaacatcc cggcatta gtggatgcaetcagatacggccagacagtggtcagccgcgatcccttcaaggc ggtaactttcgtt gccaac c acgatacagata t aatctggaacaagtatccggcttatgcattcatccttacctatgagggacagcctgttatattctaccgcgactacgaggagtggctcaacaagga taagcttaacaacctcatctggatacacgatcaccttgctggagggagtactgacattgtttactacgac agcgacgagc tta tctttgtgagaaa c ggcta íggc accaaaccaggactgataacc tata tcaacctcggctcaagcaaagttggaaggtggg tctacgttccaaagttcgc cggttc at gca tccac gagtacaccggc aacctc ggcggttggatagaca agtacgtctcctcc age ggctgggtc tatcttga ggee cca gcc c acga c ccggcgaacggcuctacggctactctgtctggagctactgcggtgtgggttga

SEQ IDNO: 110

Met Ala Arg Lys Thr Leu Ala Ile Phe Phe Vai Leu Leu Vai Leu Leu Ser Leu Ser Ala Vai Pro Ala Lys Ala Glu Thr Leu Glu Asn Gly Gly Vai Ile Mel Gin Ala Phe Tyr Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr Ile Ala Gin Lys He Pro Glu Trp Ala Ser Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Ser Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile Asn Thr Ala His Ser Tyr Gly Ile Lys Vai lie Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Leu His Cys Cys Asp Glu Gly Thr Phe Gly Gly Tyr Pro Asp Ile Cys His Asp Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Scr Ser Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Vai Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Ásn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Asp Ala Leu Arg Tyr Gly Gin Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr TyT Glu Gly Gin Pro Vai Ile Phe TyT Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Asp His Leu Ala Gly Gly Ser Thr Asp Ile Vai Tyr TyT Asp Ser Asp Glu Leu Ile Phe Vai Arg Asn Gly Tyr Gly Thr Lys Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Ser Lys Vai Gly Arg Trp Vai Tyr Vai Pro Lys Phe Ala Gly Ser Cys Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp He Asp Lys Tyr Vai Ser Ser Ser Gly Trp Vai Tyr Leu Glu Ala Pro Ala His Asp Pro Ala Asn Gly Tyr Tyr Gly TyT Ser Vai Trp Ser Tyr Cys Gly Vai Gly

SEQ ID NO: 111 algcccgcgttcaaatctaaggtgatgcacatgaagttgaagtaccttgctttagtrttgttggctgtggcttcgataggcctcctctcgactccagt

ÊEgtgctgccaaglactccgaactcgaagagggcggtgttataatgcaggccttctactgggacgtccctaccggtgggatctggtgggacac ca taagacagaaaatcccggagtggtacgacgctggaatctc ggcga tatggattcctccagctagcaaaggtatgggtggtgcatactccatg ggttatgacccctacgatttctttgacctc ggcga gtactatcagaagggaacagttgagacgcgcttcggctcaaaggaggaactggtgaaca tgataaacaccgcacactcctatggcataaaggtgatagcggacatagtcataaaccaccgcgccggcggcgacctggagtggaacccctttg taaacaactatacttggacagacrtctccaaggtcgcctccggtaaatacacggccaactaccttgacttccacccaaacgagglcaagtgctgc gstgagggtacatttggtgactttccggacatcgcccacgagaagagctgggatcagtactggctctgggcaagcaatgagagctacgccgcc

Fig 16 (cont.)
69/Π6 tatctcc gga gca ta gggatcgatgc atggcgtttc gac tac gtcaaaggttac ggagcgtgggttgttaacgactggctcagc tggtggggag gtlgggccgttggagagtactgggacaccaacgttgatgcactccttaactgggcatacaacagcggtgccaaggtctttgacttcccgctctac tacaagatggacgaaÊCCtttgacaacaccaacatccccgcrttggtttacgccctccagaacggaggaacagtcgtttcccgcgatcccttcaa ggcagtaactttegttgccaaccacgataccgatataatctggaacaagtatccggcttatgcgttcatccttacctatgagggacagcctgttatal tc taccgcgactacgaggagtggctc aacaaggataa gcttaacaaccttatctggataça cgagca ccttgcc ggaggaagtacca agatcct ctactacgataacgatgagctaatattcatgagggagggctacgggagcaagccgggcctcataacctacataaacctcggaaacgactggg ccgagcgctgggtgaacgtcggctcaaagtttgccggctacacaatccatgaatacacaggcaatctcggtggctgggttgacaggtgggttc agtacgacggatgggttaaactgacggcacctcctcacgatccagccaacggatattacggctactcagtctggagctacgcaggcgtcggat ga

SEQID NO: 112

Met Pro Ala Phe Lys Ser Lys Vai Met His Met Lys Leu Lys Tyr Leu Ala Leu Vai Leu Leu Ala Vai Ala Ser lie Gly Leu Leu Ser Thr Pro Vai Gly Ala Ala Lys Tyr Ser Glu Leu GIu Glu Gly Gly Vai íle Met Gin Ala Phe Tyr Trp Asp Vai Pro Thr Gly Gly Ile Trp Trp Asp Thr lie Arg Gin Lys lie Pro Glu Trp TyT Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met Ile AsnThr Ala His Ser Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asn Tyr Thr Tip Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn Tyr Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Asp Phe Pro Asp De Ala His Glu Lys Ser Trp Asp Gin Tyr Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Asn Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Tyr Ala Leu Gin Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asp Ile Ile Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp Ile His Glu His Leu Ala Gly Gly Ser Thr Lys Ile Leu Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Met Arg Glu Gly Tyr Gly Ser Lys Pro Gly Leu He Thr Tyr Ile Asn Leu Gly Asn Asp Trp Ala Glu Arg Trp Vâl Asn Vai Gly Ser Lys Phe Ala Gly Tyr Thr Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Arg Trp Vai Gin Tyr Asp Gly Trp Vai Lys Leu Thr Ala Pro Pro His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Ala Gly Vai Gly

SEQ DD NO: 113 atgaaaca acaaaaacggctttacgc cega rtgctgacgc igttatttgcgctcaicttc ttgctgcctcattctgca gcagc ggcggcaaa tctta atgggacgctgatgcagtatttígaatggtacatgcccaatgacggccaacattggaagcgcttgcaaaacgactcggcatatttggctgaacac ggtattactgccgtctggattcccccggcatataagggaacgagccaagcggatgtgggctacggtgcnacgacctttatgatttaggggagttt catcaaaaagggacggttcggacaaagtacggcacaaaaggagagctgcaatctgcgatcaaaagtcttcattcccgcgacattaacgtttacg gggatgtggtcatcaaccacaaaggcggcgctgatgcgaccgaagatgtaaccgcggttgaagtcgatcccgctgaccgcaaccgcgtaatt tcagga gaac accgaa ttaa agcc (ggacacattttcattttccggggcgc ggcagcacatacagcga ttttaaatggcattggtaccattttgac ggaaccgattgggacgagtcccgaaagctgaaccgcatctataagtttcaaggaaaggcttgggattgggaagttíccaatgaaaacggcaac tatgattatttgatgtatgccgacatcgartatgaccatcctgatgtcgcagcagaaattaagagatggggcacttggtatgccaatgaactgcaatt ggacggtttccgtcttgatgctgtcaaacacattaaattttcttrtttgcgggattgggttaatcatgicagggaaaaaacggggaaggaaatgttta cggtagctgaatattggcagaatgacttgggcgcgctggaaaactatttgaacaaaacaaattttaatcattcagtgtttgacgtgccgcttcattat cagttccatgctgcatcgacacagggaggcggc(atgatatgaggaaattgctgaacggtacggtcgtttccaagcatccgttgaaagcggtta catttgtcgataaccatgatacacagccggggcaatcgcttgagtcgactgtccaaacatggtttaagccgcttgcttacgctttcattctcacaag ggaatctggataccctcaggttttctacggggatatgtacgggacgaaaggagactcccagcgcgaaattcctgccttgaaacacaaaattgaa c cgatcttaaaagc ga gaaaac agtatgc gtacggagcac agcatgattatttcgaccaccalgacattgtcggc tggac a a gggaaggcgac agctcggttgcaaattcaggtttggcggcattaataacagacggacccggtggggcaaagcgaatgtatgtcggccggcaaaacgccggtga

Fig 16 (cont,)
70/116 gacatggcatgacattaccggaaaccgttcggagccggttgtcatcaattcggaaggctggggagagtttcacgtaaacggcgggtcggtttca atttatgttcaaagatag

SEQ ID NO: 114

Met Lys Gin Gin Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Asn Leu Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp Tyr Met Pro Asn Asp Gly Gin His Trp Lys Arg Leu Gin Asn Asp Ser Ala Tyr Leu Ala Glu His Gly Ile Thr Ala Vai Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Ala Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe His Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Gly Glu Leu Gin Ser Ala Ile Lys Ser Leu His Ser Arg Asp Ile Asn Vai Tyr Gly Asp Vai Vai Ile Asn His Lys Gly Gly Ala Asp Ala Thr Glu Asp Vai Thr Ala Vai Glu Vai Asp Pro Ala Asp Arg Asn Arg Vai Ile Ser Gly Glu His Arg Ile Lys Ala Trp Thr His Phe His Phe Pro Gly Arg Gly Ser Thr Tyr Ser Asp Phe Lys Trp His Trp Tyr His Phe Asp Gly Thr Ásp Trp Asp Glu Ser Arg Lys Leu Asn Arg He Tyr Lys Phe Gin Gly Lys Ala Trp Asp Trp Glu Vai Ser Asn Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Ile Asp Tyr Asp His Pro Asp Vai Ala Ala Glu Ile Lys Arg Trp Gly Thr Trp Tyr Ala Asn Glu Leu Gin Leu Asp Gly Phe Arg Leu Asp Ala Va] Lys His He Lys Phe Ser Phe Leu Arg Asp Trp Vai Asn His Vai Arg Glu Lys Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Gin Asn Asp Leu Gly Ala Leu Glu Asn Tyr Leu Asn Lys Thr Asn Phe Asn His Ser Vai Phe Asp Vai Pro Leu His Tyr Gin Phe His Ala Ala Ser Thr Gin Gly Gly Gly Tyr Asp Met Arg Lys Leu Leu Asn Gly Thr Vai Vai Ser Lys His Pro Leu Lys Ala Vai Thr Phe Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Glu Ser Thr Vai Gin Thr Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Glu Ser Gly Tyr Pro Gin Vai Phe Tyr Gly Asp Met Tyr Gly Thr Lys Gly Asp Ser Gin Arg Glu Ile Pro Ala Leu Lys His Lys Ile Glu Pro Ile Leu Lys Ala Arg Lys Gin Tyr Ala Tyr Gly Ala Gin His Asp Tyr Phe Asp His His Asp Ile Vai Gly Trp Thr Arg Glu Gly Asp Ser Ser Vai Ala Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ala Lys Arg Met Tyr Vai Gly Arg Gin Asn Ala Gly Glu Thr Trp His Asp He Thr Gly Asn Arg Ser Glu Pro Vai Vai Ile Asn Ser Glu Gly Trp Gly Glu Phe His Va] Asn Gly Gly Ser Vai Ser Ile TyT Vál Gin Arg

SEQ IDNO: 115 atggcgaaglactecgagctggagcagggcggagtcaíaatgcaggccttctactgggacgttccggagggaggaatctggtgggacacaat acggcagaagatccctgaatggtacgatgcaggca tatee gccatctggatacccccggcgagcaagggcatgggcggggcctactcgatg ggctacgacccc tacgattac ttcgatctgggcgagttttacc agaagggaaccgttga gacçcgcttcggc tccaa ggaagagctc gtcaaca tgatctccacggcccaccagtacggcatcaaggttatagcggacatagtgataaaccaccgcgcaggtggagacctcgaatggaacccatac gtcggcgaclatacctggacggacttttctaaggtcgcctccgggaaatacaaggcccactacatggacttccatccaaacaactacagcacct cagacgagggaaccttcggtggcttcccagacattgatcacctcgtgcccttcaaccagtaçtggctgtgggcgagcaacgagagclacgccg cctacctcaggagcatagggatcgatgcgtggcgctttgaclacgttaagggctacggcgcgtgggtcgtcaaggactggctgagtcagtggg gcggctgggccgtcggcgagtactgggacaccaacgtcgatgcgctcctcaactgggcctacagcagcggcgccaaggtcttcgacttccc gctctactacaagatggacgaggcctttgacaacaagaacattcccgccctcgtttacgccatccagaacggtgaaaccgtcgtcagcagggat cccttcaaggccgttaccttcgtggctaaccacgatacgaacataatctggaacaagtaccclgcctatgccttcatcctgacctacgaaggtcag cccgtcatcttclaccgcgactacgaggagtggctcaacaaggacaaactcaacaacctcatatggattcacgagcacctggcagggggaag caccaagatcctctactacgacgacgatgagctcatcttcatgagggaaggctacggcgacaggcccgggcttataacctacatcaacctcggt agcgactgggcggagagatgggtgaacgttggclcaaagttcgcgggctatacaatccacgaatacaccggaaacctcggcggclgggtcg acaggtacgtccagtacgacggctgggtcaagcttaccgctccgccacacgatccggcaaacggctattacggcUctcggtcíggagctacg cc ggagttggaaga teteate accatcaccatcacta a

SEQIDNO: 116

Met Ala Lys Tyr Ser Glu Leu Glu Gin Gly Gly Vai He Met Gin Ala Phe Tyr Trp Asp Vai Pro Glu Gly Gly Ile Trp Trp Asp Thr Ile Arg Gin Lys lie Pro Glu Trp Tyr Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Ala Tyr Ser Met Gly Tyr Asp Pro TyT Asp TyT Phe Asp Leu Gly Glu Phe Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met
71/116

Fig 16 (cont.)

Ile Ser Thr Ala His Gin Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai lie Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Tyr Vai Gly Asp Tyr Thr Trp Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys TyT Lys Ala His Tyr Met Asp Phe His Pro Asn Asn Tyr Ser Thr Ser Asp Glu Gly Thr Phe Gly Gly Phe Pro Asp Ile Asp His Leu Vai Pro Phe Asn Gin Tyr Trp Leu Trp Ala Ser Asn Glu Ser Tyr Ala Ala Tyr Leu Arg Ser Ile Gly Ile Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Tip Vai Vai Lys Asp Trp Leu Ser Gin Trp Gly Gly Trp Ala Vai Gly Glu Tyr Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala Tyr Ser Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Lys Asn Ile Pro Ala Leu Vai Tyr Ala Ile Gin Asn Gly Glu Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn His Asp Thr Asn Ile He Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Asp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp He His Glu His Leu Ala Gly Gly Ser Thr Lys Ile Leu Tyr Tyr Asp Asp Asp Glu Leu He Phe Met Arg Glu Gly Tyr Gly Asp Arg Pro Gly Leu Ile Thr Tyr Ile Asn Leu Gly Ser Asp Trp Ala Glu Arg Trp Vai Asn Vai Gly Ser Lys Phe Ala Gly Tyr Thr Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Arg Tyr Vai Gin Tyr Asp Gly Trp Vai Lys Leu Thr Ala Pro Pro His Asp Pro Ala Asn Gly Tyr Tyr Gly TyT Ser Vai Trp Ser Tyr Ala Gly Vai Gly Arg Ser His His His His His His

SEQ ID NO: 117 ttgcga gtgttcctggttgtgccaaagctgagccgcc catttcaggcagagtcac aacaa caaga c agggacataacaatgaaacacacagcg gga a tgctggc gatcgcaggtatgctga tegcccccttggc gcatgc cgatgTc atactgcacgccttcaactggaaatacagtgaagtcac cg ccaaggccgatctcatcaaggctgccggctacaagcaggtgctcatctcaccgcctctgaagtcctcgggcaacgagtggtgggetcgttacc agccccaggatctgcgcctggtcgacaccccccttggcaacaagcaggatctggagcagctgatcgccgcgatgcagacccggggcattgc cgtctacgcggacgtggtgctcaaccacatggccaacgaaagctggaagcgcagcgacctcaactaccccggcagcgagctgctgçaaag ctacgccggcaatccggcctactttgaacgccagaagctctttggcgatctggggcagaacttcctcgccggccaggattttcatccggagggg tgcateaccgactggaacaatccgggccatgtccagtactggcgactgtgcggcggggcgggtgacaaggggctgccggatctggacccca acaactgggtggtgaa ccagcaacaggcttacctgcaggcgctcaaggggatggggatc aagggttttc gggtc gatgcggteaagcacatg agcgattaccagateaacgccgtgttcacccccgagatcaaacaggggatgcacgtctttggcgaggtgatcaccacggggggcgccggca acagcgactatgagaacttcctcaaaccctacctcgacagcagcggccagggggcctacgacttcccgctcttcgcctocctgcgtggagcgc ^tgEÊ^ctacgg^cSg^caÊ^catS^aacclg^ctgg^cc6^atcccgÊ^tg^cctatgÊ^tcaÊB^cg^ctg^ccggg^tag^ccÊ^cg^ccÊ^lca^ccrtcg^ccatcacc cacgacatccccaccaacgacggtttccgctaccagatcctcaaccagaccgacgagagactggcctatgcctacctgctcggtcgcgatggc ggttcgcctctggtctactccgatcacggtgaaaccagggacaaggacggattgcgctggcaggactactatctgcgcaccgatctcaaaggg atgalccgcttccataacacagtgcagggtcaaccgatgcagcicatcggcagtaacgactgcttcgtgctgttcaagcgtggcaagcagggc gtggtcggcatcaacaagtgcgactacgagcaggagtactggctcgataccgccagattcgagatgaactggtatcgcaactaccgggatgtg ctc gaccagaa tgccgtggtcaacgtgcagageca gtgggta aggctgaccatcccggcccgc ggc gccaga a tgtggctgcaggagtga

SEQIDNO: 118

Met Arg Vai Phe Leu Vai Vai Pro Lys Leu Ser Arg Pro Phe Gin Ala Glu Ser Gin Gin Gin Asp Arg Asp Ile Thr Met Lys His Thr Ala Gly Mel Leu Ala Ile Ala Gly Met Leu Ile Ala Pro Leu Ala His Ala Asp Vai Ile Leu His Ala Phe Asn Trp Lys Tyr Ser Glu Vai Thr Ala Lys Ala Asp Leu Ile Lys Ala Ala Gly Tyr Lys Gin Vai Leu Ile Ser Pro Pro Leu Lys Ser Ser Gly Asn Glu Trp Trp Ala Arg Tyr Gin Pro Gin Asp Leu Arg Leu Vai Asp Thr Pro Leu Gly Asn Lys Gin Asp Leu Glu Gin Leu Ile Ala Ala Met Gin Thr Arg Gly Re Ala Vai TyT Ala Asp Vai Vai Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Ser Asp Leu Asn Tyr Pro Gly Ser Glu Leu Leu Gin Ser Tyr Ala Gly Asn Pro Ala Tyr Phe Glu Arg Gin Lys Leu Phe Gly Asp Leu Gly Gin Asn Phe Leu Ala Gly Gin Asp Phe His Pro Glu Gly Cys He Thr Asp Trp Asn Asn Pro Gly His Vai Gin Tyr Trp Arg Leu Cys Gly Gly Ala Gly Asp Lys Gly Leu Pro Asp Leu Asp Pro Asn Asn Trp Vai Vai Asn Gin Gin Gin Ala Tyr Leu Gin Ala Leu Lys Gly Met Gly Ile Lys Gly Phe Arg Vai Asp Ala Vai Lys His Met Ser Asp Tyr Gin Ile Asn Ala Vai Phe Thr Pro Glu Ile Lys Gin Gly Met His Vai Phe Gly Glu Vai Ile Thr Thr Gly Gly Ala Gly Asn Ser Asp Tyr Glu Asn Phe Leu Lys Pro Tyr Leu Asp Ser Ser Gly Gin Gly Ala Tyr Asp Phe Pro Leu Phe Ala Ser Leu Arg Gly Ala Leu Gly Tyr Gly Gly Ser Met Asn Leu Leu Ala Asp Pro

Fig, 16 (cont.)
72/116

Gly Ala Tyr Gly Gin Ala Leu Pro Gly Ser Aig Ala Vai Thr Phe Ala Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin lie Leu Asn Gin Thr Asp Glu Arg Leu Ala Tyr Ala Tyr Leu Leu Gly Arg Asp Gly Gly Ser Pro Leu Vai TyT Ser Asp His Gly Glu Thr Arg Asp Lys Asp Gly Leu Arg Trp Gin Asp Tyr Tyr Leu Arg Thr Asp Leu Lys Gly Met Ile Arg Phe His Asn Thr Vai Gin Gly Gin Pro Met Gin Leu Ile Gly Ser Asn Asp Cys Phe Vai Leu Phe Lys Arg Gly Lys Gin Gly Vai Vai Gly He Asn Lys Cys Asp Tyr Glu Gin Glu TyT Trp Leu Asp Thr Ala Arg Phe Glu Met Asn Trp Tyr Arg Asn Tyr Arg Asp Vai Leu Asp Gin Asn Ala Vai Vai Asn Vai Gin Ser Gin Trp Vai Arg Leu Thr Ile Pro Ala Arg Gly Ala Arg Met Trp Leu Gin Glu

SEQ DD NO: 119 atgcaa acgtttgcattctta ttltac tcaaagaaaggatgggtgtgcatgaattatttgaaaaaagtgtggttgtattacgctatc gtcgcta ccttaa tcatttcctttc tta caccrttttcaaca gcacaagctaatactgcacctgttaacggaaca atgatgcaata tttcgaatgggacttacctaatgatgg gacgc ittggacgaaa gjaaaa aatgaagctaccaâtc tttcttcactaggta tc acagcactatggctccctccagcatata aaggaacgagc c aaagcgatgtcggatacggtgttlacgatttatatgaccttggggaatttaatoaaaaagggacgatccgaacgaaatacggaacaaaaacaca a tatattcaagcc attcaaactgccc aagccgc agggatgcaagtatatgcggatgttgtatttaatcataaggcaggggctgaca gtacagaatt tgtcgatgc agttgaggtaaacc ettctaatc gaaatcaagaaacatetggcac atatcaaatteaagcstggacaaaatttgattttcctggtcgtg gaaacacatactccagcttcaaatggcgctggtaccattttgatggtacggattgggacgaaagtcgtaaattaaatcgtatttacaaattccgcgg tacaggaaaagc gtgggac tgggaa gtcgatacagaaaacggaaactatgattatttaatgttcgctgatttaga tatggatcaccctgaggttgt gacaga attaaaaaactgggga acgtggtacgtc aatacta caaatatcgatggattecgcttagatgccgtaaa acatattaaataca gctttttc cctgactggc taacatatgtacgtaatcaaacaggaaaaaatttatttgccgttggggaattttggagctatgac gtcaata agctgc ataattacat tacaaaaacaaatgggtcgatgtcatta tttgatgc acccttgcataacaacttttata ccgcttccaaatcgagtggatatlttg acatgc gttatttat tgaataatacattaatgaaagatcaacctíeactcgctgtaacacttgtcgataaccacgacacgcaaccagggcaaictnacagtcatgggtcg aacc ttggtttaaacagcttgcttacgcctttattttaacaagacaagaagggtatccttgcgtattttacggtga tta ttatggaatccctaaatacaat atcccggggttaaaaagtaaaatcgac ccgcttttaattgctcgtc gtgattac gcttatggaaca caa c gtgattacaüga tcatcaagacattat cggatggacacgagaaggcattgatgcaaaaccgaactetggactggcggctttaattaccgacggtcctggtggaagtaaatggatgtatgtc ggtaaaa agca tgcc ggga aagtattttatgatttaactggaaatcgaagtgaca cagtaacgattaatgcggatggttg gggaga artta aa gta aacggaggatccgtctcaatttgggtggctaaaacgtcaaacgtcacatttacagtcaataacgccacaacaacaagcggacaaaacgtatatg ttgtcggcaacattccaEagctaggcaattgtcgcacgggttaa

SEQ ID NO: 120

Met Gin Thr Phe Ala Phe Leu Phe Tyr Ser Lys Lys Gly Trp Vai Cys Met Asn Tyr Leu Lys Lys Vai Trp Leu Tyr Tyr Ala He Vai Ala Thr Leu Ile Ile Ser Phe Leu Thr Pro Phe Ser Thr Ala GIri Ala Asn Thr Ala Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Vai Lys Asn Glu Ala Thr Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala TyT Lys Gly Thr Ser Gin Ser Asp Vai Gly TyT Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Thr Gin Tyr Ile Gin Ala Ile Gin Thr Ala Gin Ala Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Ser Thr Glu Phe Vai Asp Ala Vai Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn TyT Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Thr Trp Tyr Vai Asn Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr Tyr Vai Arg Asn Gin Thr Gly Lys Asn Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp Vaí Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Thr Ala Ser Lys Ser Ser Gly TyT Phe Asp Met Arg Tyr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Vai Thr Leu Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Pro Trp Phe Lys Gin Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe TyT Gly Asp Tyr Tyr Gly Ile Pro Lys Tyr Asn He Pro Gly Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp Ile Ile Gly Trp Thr

Fig 16 (cont.)

Arg Glu Gly Ile Asp Ala Lys Pro Asn Ser Gly Leu Ala Ala Leu He Thr Asp Gly Pro Gly Gly Ser Lys Trp Mel Tyr Vai Gly Lys Lys His Ala Gly Lys Vai Phe TyT Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Ile Trp Vai Ala Lys Thr Ser Asn Vai Thr Phe Thr Vai Asn Asn Ala Thr Thr Thr Ser Gly Gin Asn Vai TyT Vai Vai Gly Asn Ile Pro Glu Leu Gly Asn Cys Arg Thr Gly

SEQIDNO.Í2I atgctcgccctgtcgctcggcggctgc ggcatc gacgcgggcccgacaggccctcgcgtcgtggagccgctgccgcagcgccccacgcltc cgc a gga gtaccgcgccagcggccac gcggccgccggcgacgtgttcgtgcacctgttcgagtggaagtggccggacatcgcggaggaat gcgagaacgtgctggggccggcgggctacgaggcggtgcaggtgtcgccgccgcaggagcacctggtgcagcagggggcgccgtggtg gcagcggtaccagccgglgagctactcggtggcgctgagccgcagcggcacgggcgtggagttcagcaacatgatcagccggtgcaaggc cgccggcgtggacatctacgtggacgccgtcatcaaccacatgacggccggtgcggggacggggagcaacggcaccgcctacaccaagta caactaccccggcctgtacgcgcaggcggactttcacccgcagtgcgcggtgggcgactacacca gcgccgccaacgtgca ggactgc ga actgctggggctggctgacc tgaacaccggcgcggccggcgtgoagc agaagatcgcggactaccíggtctcgctg gcgc ggctgggcgt ggcgggttttcgcatcgac gccgccaagcacatccagccggtggaactggacgccatcgtggaccgc gtgaac cagacgctggc ggcgga ggggc gccc gcttccctac tggttcgccgaggtgatcgacaacggcggcgagggggtgcggcgc gagcactac tacggcctgggatacgg caccggcggcgccgcggacatcacggagttccgctacaagggcgtgggcgacaagttcctgggcagcggcggccagcggctggtggacc tgaagaacttctcggcggtgacgtggaacctgatgccgtcggacaaggccgtcgtctttctggagaaccacgatacgcagcgcggcggcggc atcggc taccgcga tggcacggcgttcc ggctggccaacgtgtggatgc tggcgca gccgtac ggctatccgtcggtgat gtccagc tacgc ctttgaccgcacctccccctttggccgcgacgccggcccgccctccgaggacggcgpgacgaaggacgtgacgígcgcgcccacgctgga gacggcggtgctgggcacctgggtgtgcgagcaccgcgaccccgtcattcagcggatggtgggctttcgccgcgcgatggcgggcacgga cctgaaccgctggtgggacaacggcggcaacgccattgccttttcgcgcggggaccggggcttcgtcgccatcagccgcgagccgaaggtg accatggcggccgtgcccagcggactgtcccccggcacctactgcgacgtgctgaccggcggcaaggtgggcaacgcctgcgcgggaac cagcgtga cggtcgactctc agggcgtggtgcagctgagc atcgtcgagaactc ggctctggtgatccacctcggggc caagctgtaacggc gcgctggcggatgtgcggaggg

SEQ DD NO: 122

Met Leu Ala Leu Ser Leu Gly Gly Cys Gly Ile Asp Ala Gly Pro Thr Gly Pro Arg Vai Vai Glu Pro Leu Pro Gin Arg Pro Thr Leu Pro Gin Glu Tyr Arg Ala Ser Gly His Ala Ala Ala Gly Asp Vai Phe Vai His Leu Phe Glu Trp Lys Trp Pro Asp Ile Ala Glu Glu Cys Glu Asn Vai Leu Gly Pro Ala Gly Tyr Glu Ala Vai Gin Vaí Ser Pro Pro Gin Glu His Leu Vai Gin Gin Gly Ala Pro Trp Trp Gin Arg Tyr Gin Pro Vai Ser Tyr Ser Vai Ala Leu Ser Arg Ser Gly Thr Gly Vai Glu Phe Ser Asn Met Ile Ser Arg Cys Lys Ala Ala Gly Vai Asp Ile Tyr Vai Asp Ala Vai Ile Asn His Met Thr Ala Gly Ala Gly Thr Gly Ser Asn Gly Thr Ala Tyr Thr Lys Tyr Asn Tyr Pro Gly Leu Tyr Ala Gin Ala Asp Phe His Pro Gin Cys Ala Vai Gly Asp Tyr Thr Ser Ala Ala Asn Vai Gin Asp Cys Glu Leu Leu Gly Leu Ala Asp Leu Asn Thr Gly Ala Ala Gly Vai Gin Gin Lys He Ala Asp Tyr Leu Vai Ser Leu Ala Arg Leu Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys His Ile Gin Pro Vai Glu Leu Asp Ala Ile Vai Asp Arg Vai Asn Gin Thr Leu Ala Ala Glu Gly Arg Pro Leu Pro TyT Trp Phe Ala Glu Vai Ile Asp Asn Gly Gly Glu Gly Vai Arg Arg Glu His TyT Tyr Gly Leu Gly Tyr Gly Thr Gly Gly Ala Ala Asp Ile Thr Glu Phe Arg Tyr Lys Gly Vai Gly Asp Lys Phe Leu Gly Ser Gly Gly Gin Arg Leu Vai Asp Leu Lys Asn Phe Ser Ala Vai Thr Trp Asn Leu Met Pro Ser Asp Lys Ala Vai Vai Phe Leu Glu Asn His Asp Thr Gin Arg Gly Gly Gly Ile Gly Tyr Arg Asp Gly Thr Ala Phe Arg Leu Ala Asn Vai Trp Met Leu Ala Gin Pro Tyr Gly Tyr Pro Ser Vai Met Ser Ser Tyr Ala Phe Asp Arg Thr Ser Pro Phe Gly Arg Asp Ala Gly Pro Pro Ser Glu Asp Gly Ala Thr Lys Asp Vai Thr Cys Ala Pro Thr Leu Glu Thr Ala Vai Leu Gly Thr Trp Vai Cys Glu His Arg Asp Pro Vai Ile Gin Arg Met Vai Gly Phe Arg Arg Ala Met Ala Gly Thr Asp Leu Asn Arg Trp Trp Asp Asn Gly Gly Asn Ala Ile Ala Phe Ser Arg Gly Asp Arg Gly Phe Vai Ala Ile Ser Arg Glu Pro Lys Vai Thr Met Ala Ala Vai Pro Ser Gly Leu Ser Pro Gly Thr Tyr Cys Asp Vai Leu Thr Gly Gly Lys Vai Gly Asn Ala Cys Ala Gly Thr Ser Vai Thr Vai Asp Ser Gin Gly Vai Vai Gin Leu Ser Ile Vai Glu Asn Ser Ala Leu Vai Ile His Leu Gly Ala Lys Leu Arg Arg Ala Gly Gly Cys Ala Glu

74/116

Fig 16 (cont.)

SEQID NO: 123 atgcccca ggccattogc acttttícac gttggacgttgttcggcttaatc ggc gtttttctgcttggtctcgtcttttctgtcccaccccgggcaatcc aggcccagacaaccccggcccgtaccgttalggttcacctcttcgagtggaaatggaccgacatcgçtaaagaatgcgagaatttcctcggac cgaaaggctttgccgcaatccaggiatcgccgccccaggagcatgtccaggggtcgcaatggtggacccgctatcagccggtcagctacaag ate gaga gccgctccggcacccgggccgagttcgccaatatggtctcgcgctgcaaagccgtcggggtc gata tctatgtcgatgccgtgatc aaccaUtgacgactgtcggdccggcactggtatggclggatcgacctacaccagctacacctatccggggctgtatcagacccaggacttcc accaclgcgggcgçaatggcaacgatgatatcagcagctacggcgatcgctgggaagtacaaaactgcgaactgctcaacctagccgacctc aacaccggcgctgagtatgtceggggtaaactcgccgcctatalgaacgatctgcgcggcctgggcgtcgccggatttcggatcgatgccgcc aagcacatggataccaacgacatcaacaatatcgttggccgcctgcccaacgcgccctacatictaccaggaagtgatcgaccagggcggcga gccaatta ccgcc ggcgaatacttccagaatggcgatgtgacc gagttc aagtacagccgcgagatctcgcgcatgttcaaaaccgg ccagct gacccata tgagccagttcggc actgcctggggcttcatgtccagcgacctggcagtagttttc accgataaccac gacaaccagcgcggtca cggcggcgccggcgatgtcttgacctacaaagatggccagctgtacaccctgggcaatatcttcgagclagcctggccgtatggctacccaca ggtcatgtcga getacacgttcagcaacggcgaccaggggc cgccatcgaccaatgtgta cgcaa ccacaac gcctgattgtggc aacggcc gctgggtctgtgagcaccgctggcgaggaatcgccaacatggtcgcgttccgcaactacaccgccccgaccttcagcaccagcaactggtgg agcaacggcaacaaccagatcgctttcagccgcgggaccctgggctttgtggcgatcaatcgggaaggtggcagcctgaaccgcaccttcca aaccggcctgcccgtcggcacctactgcgatgtcattcacggcgatttcaatgccagcgccggcacctgttccggcccaactatcgctgtcaac ggctccggacaggcaaccatcacggtcaacgcgatggacgcggtggcgatctacggcggagccaggctcgccactccggccagtgtcaac gtgacattcaacgaaaacgccac gac cacçtgggggcagaa tgtgta tate gtcggcaacgtcgccgecctgggcagctggaa cgca ggca gcgcggtcttactctcctccgctaacíacccaatctggagcaagaccatcgccctgccagccaacaccgccattgagtacaagtacatcaaaaa ggatggcgcgggcaatgtggtgtgggaaagcggcgccaaccgcgtctttaccacccccggcagcggcaglgccacgcgcaacgatacctg gaaatag

SEQID NO: 124

Met Pro Gin Ala Ile Arg Thr Phe Ser Arg Trp Thr Leu Phe Gly Leu Ile Gly Vai Phe Leu Leu Gly Leu Vai Phe Ser Vai Pro Pro Arg Ala Ile Gin Ala Gin Thr Thr Pro Ala Arg Thr Vai Met Vai His Leu Phe Glu Trp Lys Trp Thr Asp He Ala Lys Glu Cys Glu Asn Phe Leu Gly Pro Lys Gly Phe Ala Ala Ile Gin Vai Ser Pro Pro Gin Glu His Vai Gin Gly Ser Gin Tip Trp Thr Arg Tyr Gin Pro Vai Ser Tyr Lys Ile Glu Ser Arg Ser Gly Thr Arg Ala Glu Phe Ala Asn Met Vai Ser Arg Cys Lys Ala Vai Gly Vai Asp Ile Tyr Vai Asp Ala Vai Ile Asn His Met Thr Thr Vai Gly Ser Gly Thr Gly Met Ala Gly Ser Thr Tyr Thr Ser Tyr Thr TyT Pro Gly Leu Tyr Gin Thr Gin Asp Phe His His Cys Gly Arg Asn Gly Asn Asp Asp Ile Ser Ser TyT Gly Asp Arg Trp Glu Vai Gin Asn Cys Glu Leu Leu Asn Leü Ala Asp Leu Asn Thr Gly Ala Glu Tyr Vai Arg Gly Lys Leu Ala Ala Tyr Met Asn Asp Leu Arg Gly Leu Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys His Met Asp Thr Asn Asp He Asn Asn Ile Vai Gly Arg Leu Pro Asn Ala Pro Tyr lie Tyr Gin Glu Vai Ile Asp Gin Gly Gly Glu Pro Ile Thr Ala Gly Glu Tyr Phe Gin Asn Gly Asp Vai Thr Glu Phe Lys Tyr Ser Arg Glu Ile Ser Arg Met Phe Lys Thr Gly Gin Leu Thr His Met Ser Gin Phe Gly Thr Ala Trp Gly Phe Met Ser Ser Asp Leu Ala Vai Vai Phe Thr Asp Asn His Asp Asn Gin Arg Gly His Gly Gly Ala Gly Asp Vai Leu Thr Tyr Lys Asp Gly Gin Leu Tyr Thr Leu Gly Asn Ile Phe Glu Leu Ala Trp Pro Tyr Gly Tyr Pro Gin Vai Met Ser Ser Tyr Thr Phe Ser Asn Gly Asp Gin Gly Pro Pro Ser Thr Asn Vai Tyr Ala Thr Thr Thr Pro Asp Cys Gly Asn Gly Arg Trp Vai Cys Glu His Arg Trp Arg Gly Ile Ala Asn Met Vai Ala Phe Arg Asn Tyr Thr Ala Pro Thr Phe Ser Thr Ser Asn Trp Trp Ser Asn Gly Asn Asn Gin He Ala Phe Ser Arg Gly Thr Leu Gly Phe Vai Ala Ile Asn Arg Glu Gly Gly Ser Leu Asn Arg Thr Phe Gin Thr Gly Leu Pro Vai Gly Thr Tyr Cys Asp Vai Ile His Gly Asp Phe Asn Ala Ser Ala Gly Thr Cys Ser Gly Pro Thr He Ala Vai Asn Gly Ser Gly Gin Ala Thr Ile Thr Vai Asn Ala Met Asp Ala Vai Ala He Tyr Gly Gly Ala Arg Leu Ala Thr Pro Ala Ser Vai Asn Vai Thr Phe Asn Glu Asn Ala Thr Thr Thr Trp Gly Gin Asn Vai TyT He Vai Gly Asn Vai Ala Ala Leu Gly Ser Trp Asn Ala Gly Ser Ala Vai Leu Leu Ser Ser Ala Asn TyT Pro Ile Trp Ser Lys Thr Ile Ala Leu Pro Ala Asn Thr Ala Ile Glu Tyr Lys Tyr Ile Lys Lys Asp Gly Ala Gly Asn Vai Vai Trp Glu Ser Gly Ala Asn Arg Vai Phe Thr Thr Pro Gly Ser Gly Ser Ala Thr Arg Asn Asp Thr Trp Lys

Fig 16 (cont.)

75/116

SEQIDNO: 125 gtggtgcacatgaagttgaagtaccttgccttagttttgttggctgtggcttcgataggcctactctcgaciccagtgggtgctgccaagtactccg aac tc gaa gagggcggtgttataatgcaggccttctactgggatgttcccggagggggaatctggtgggacaccataagacagaaaatcccg gagtggtacgacgctggaatctcggcgatatggattcctccagctagcaaagggatgggcggtggttattccatgggctacgatccctacgattt ctttgacctcg gcgagtac tatcagaa gggaaca gttgagacgcgcttcggc tcaaaggaggaac tggtgaac atgataa acaccgc acactc ctatggcataaaggtga tagc gga catagtcataaaccaccgcgccggtggagaccttgagtggaacccctttgtaaacaacta tacttggaca gac ttc tccaaggtcgcctccggtaaatacacggccaactaccttgacttccacccaaacgaggtc aagtgctgcgatga gggta catttggtga c tttccggacatcgccca cgagaa gàgctgggatcagtoctggctctgggcaagcaatgagagctacgccgcatatetcc ggagcata ggga tcgatgcatggcgtttcgactacgtcaaaggttacggagcgtgggttgttaatgactggctcagctggtggggaggctgggecgttggagagta ctgggacacgaacgrtgatgcactccttaactgggcatacgacagcggtgccaaggtctttgacttcccgctctactacaagatggacgaagcc tttgacaacaccaacatccccgctttggtttacgccctccagaacggaggaacagtcgtttcccgcgalcccttcaaggcagtaaçtttcgttgcc aa ccacgatacagatataatctggaacaa gtatccggcttatgcgttca tcctta cctatgagggacagcctgttatattttaccgcgactacgagg agtggctcaacaaggataagcttaacaaccttatctggatacaegagcaccttgccggaggaagtaccaagatcctctactacgataacgatga gctaatattcatgagggagggctacgggagcaagccgggcctcataacctacataaacctcggaaacgactgggccgagcgclgggtgaac gtcggctcaaagtttgccggctacacaatccatgaatacacaggcaatctcggtggctgggttgacaggtgggttcagtacgatggatgggtta aactgacggc acctcctcatgatccagccaa c ggatattacggctactcagtctgga gctacgca ggc gtcgga tga

SEQIDNO: 126

Vai Vai His Met Lys Leu Lys Tyr Leu Ala Leu Vai Leu Leu Ala Vai Ala Ser lie Gly Leu Leu Ser Thr Pro Vai Gly Ala Ala Lys Tyr Ser Glu Leu Glu Glu Gly Gly Vai Ile Met Gin Ala Phe TyT Trp Asp Vai Pro Gly Gly Gly Ile Trp Trp Asp Thr He Arg Gin Lys He Pro Glu Ττρ TyT Asp Ala Gly Ile Ser Ala Ile Trp Ile Pro Pro Ala Ser Lys Gly Met Gly Gly Gly Tyr Ser Met Gly Tyr Asp Pro Tyr Asp Phe Phe Asp Leu Gly Glu Tyr Tyr Gin Lys Gly Thr Vai Glu Thr Arg Phe Gly Ser Lys Glu Glu Leu Vai Asn Met He Asn Thr Ala His Ser Tyr Gly Ile Lys Vai Ile Ala Asp Ile Vai Ile Asn His Arg Ala Gly Gly Asp Leu Glu Trp Asn Pro Phe Vai Asn Asn Tyr Thr Tip Thr Asp Phe Ser Lys Vai Ala Ser Gly Lys Tyr Thr Ala Asn TyT Leu Asp Phe His Pro Asn Glu Vai Lys Cys Cys Asp Glu Gly Thr Phe Gly Asp Phe Pro Asp Ile Ala His Glu Lys Ser Trp Asp Gin Tyr Tip Leu Trp Ala Ser Asn Glu Ser TyT Ala Ala Tyr Leu Arg Ser Ile Gly He Asp Ala Trp Arg Phe Asp Tyr Vai Lys Gly Tyr Gly Ala Trp Vai Vai Asn Asp Trp Leu Ser Trp Trp Gly Gly Trp Ala Vai Gly Glu TyT Trp Asp Thr Asn Vai Asp Ala Leu Leu Asn Trp Ala TyT Asp Ser Gly Ala Lys Vai Phe Asp Phe Pro Leu Tyr Tyr Lys Met Asp Glu Ala Phe Asp Asn Thr Asn Ile Pro Ala Leu Vai Tyr Ala Leu Gin Asn Gly Gly Thr Vai Vai Ser Arg Asp Pro Phe Lys Ala Vai Thr Phe Vai Ala Asn Hís Asp Thr Asp Ile He Trp Asn Lys Tyr Pro Ala Tyr Ala Phe Ile Leu Thr Tyr Glu Gly Gin Pro Vai Ile Phe Tyr Arg Àsp Tyr Glu Glu Trp Leu Asn Lys Asp Lys Leu Asn Asn Leu Ile Trp He His Glu His Leu Ala Gly Gly Ser Thr Lys Ile Leu Tyr Tyr Asp Asn Asp Glu Leu Ile Phe Met Arg Glu Gly Tyr Gly Ser Lys Pro Gly Leu Ile Thr Tyr He Asn Leu Gly Asn Asp Trp Ala Glu Arg Trp Vai Asn Vai Gly Ser Lys Phe Ala Gly Tyr Thr Ile His Glu Tyr Thr Gly Asn Leu Gly Gly Trp Vai Asp Arg Trp Vai Gin Tyr Asp Gly Trp Vai Lys Leu Thr Ala Pro Pro His Asp Pro Ala Asn Gly Tyr Tyr Gly Tyr Ser Vai Trp Ser Tyr Ala Gly Vai Gly

SEQIDNO: 127 gtgtgcatgaattatttgaaaaaagtgtggtlgtattacgciatcglcgctaccttaatcatttactttcttacgcccttttcaactgcacaagccaacac tgcacc agtca acggaa c galgatgc aatatttcga atggga tttaccgaatgatggcacactttggacgaaagtaaaaa ac gaagcaagcagt ctttcttctttaggtattactgcgttatggtta ccacctgca tacaaagga a cgagcca aggggatgtcgggtatggcgtgta cgatttgtatgactt aggagaatttaatcaaaaagggacgattcgaacgaaatacggaacaaaaacgcaatatttacaagccattcaagcggcaaaaagcgctggcat gcaagtatacgctgatgtcgutttaatcacaaggcgggggcagatagtacagaatgggttgacgcagtcgaagtgaatccttctaatcgaaacc aagaaacatctggcacatatcaaattcaagcatggacaaaatttgatttccctggccgtgggaacacatactcaagctttaaatggcgatggtatc attttgacggtacggattgggatgaaagccgaaaactaaatcgtatttacaaatttcgtggcacaggaaaagcatgggattgggaagtagacaca gagaacggaaactatgactacttaatgtttgctgatttagatatggatcaccctgaagtcgtgacagagctaaaaaactggggaacatggtacgtc

76/116

Fig 16 (cont.) aatacgacaaatgtcgatgggtttcgcttagatgcagtaaagcatattaaatatagcttcttcccagatlggttaacacatgtgcgttcacaaacacg aaaaaatctttttgcagtaggagaRttttggagctacgatgtcaataaactgcataactacattacaaaaacaagtggaaccatgtcgttatttg3tg cgccacttca taacaacttttacactgc ttca aaatctagcgggtattttgacatgcgctatttgttaaataatacgttgatgaaa gaccagcc ttctct tgcggtcacactcgttga laatca tgacacgcaaccgggacaa tctttacaatcatgggta gagccttggtttaagccgcttgcttatgcctttatttt gacaagacaagaaggatatccttgcgtattttacggcgactattacggcatccctaaatacaâcattccgggattgaaaagtaaaaicgatccgct ictcattgcccgtagagactacgcaucggaacacaacgtgattatattgaccatcaagacattattggatggacacgggaaggaattgactcaa aaccgaactctggacttgcggctttaattactgacggccctggtggaagtaaatggatgtatgtaggtaaaaagcatgctggaaaagtgttttacg atctcactggaaatcgaagcgatacggtaacgattaatgcagacggctggggagagtttaaagtaaacggtggctccgtttccatttgggttgcc aaaacatcacaagtcacgtttaccgtcaacaatgcgacaacgataagc ggacaaaatgtgta tgtcgttggtaacattcc agagc tcggaaattg gaacacagcaaacgcaatcaaaatgaccccalcttcrtatccaacgtggaaagcaaccattgctcttccacaaggaaaagccattgaatttaaatt tatta aaaaagaccaatcggga aatgttg tttgggaaagcattccaaaccgaa catacaccgttcca tttttatcaac aggc tcata tacagctagtt ggaatgtaccttaa

SEQ IDNO: 128

Val Cys Met Asn Tyr Leu Lys Lys Val Trp Leu Tyr Tyr Ala Ile Val Ala Thr .Leu Ile Ile Tyr Phe Leu Thr Pro Phe Ser Thr Ala Gin Ala Asn Thr Ala Pro Val Asn Gly Thr Met Met Glu Tyr Phe Glu Trp Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Val Lys Asn Glu Ala Ser Ser Leu Ser Ser Leu Gly He Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Gin Gly Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Thr Gln Tyr Leu Gin Ala Ile Gin Ala Ala Lys Ser Ala Gly Met Gin Val Tyr Ala Asp Val Val Phe Asn His Lys Ala Gly Ala Asp Ser Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Thr Trp Tyr Val Asn Thr Thr Asn Val Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr His Val Arg Ser Gin Thr Arg Lys Asn Leu Phe Ala Val Gly Glu Phe Trp Ser Tyr Asp Val Asn Lys Leu Hís Asn Tyr Ile Thr Lys Thr Ser Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Thr Ala Ser Lys Ser Ser Gly Tyr Phe Asp Met Arg Tyr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Val Thr Leu Val Asp Asn Hís Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Val Glu Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp Tyr Tyr Gly lie Pro Lys Tyr Asn lie Pro Gly Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp Ile Ile Gly Trp Thr Arg Glu Gly He Asp Ser Lys Pro Asn Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Lys His Ala Gly Lys Val Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Ile Tip Val Ala Lys Thr Ser Gin Val Thr Phe Thr Val Asn Asn Ala Thr Thr Ile Ser Gly Gin Asn Val Tyr Val Val Gly Asn Ile Pro Glu Leu Gly Asn Trp Asn Thr Ala Asn Ala Ile Lys Met Thr Pro Ser Ser Tyr Pro Thr Trp Lys Ala Thr Ile Ala Leu Pro Gin Gly Lys Ala Ile Glu Phe Lys Phe Ile Lys Lys Asp Gin Ser Gly Asn Val Val Trp Glu Ser 11 e Pro Asn Arg Thr Tyr Thr Val Pro Phe Leu Ser Thr Gly Ser Tyr Thr Ala Ser Trp Asn Val Pro

SEQ IDNO: 129 ttgcgttgccgccgtggcagggacgggigttggtgcgggcggcgtaatgcgctgccgcgacacccgcgtgaacaaaatâatatgaattatttg aataggatgggggtgtcaagaatgacaaaatctcgagagttgcggtgttcatggaaagtatttgttgttgggtgcctgttgtggatggcttgggga tcttccgcgtccgccggcgtattgatgcaaggcttctactgggacgccagtaccgggaccagtgattcgtggtggacgcatttggccaagcaag ccaacggtctaaaacgggcggggttcaccgccg(atggattcclccggtgcttaaaggggcttcagggggctattccaacgggtacgatccctt tgacgactatgatatcggaagcaaggaccagaaaggtaccgtggcgacgcgatgggggacgcgagaagaactgcaacgtgccgtggccgt gatgcgcgcgaacggtciggatgtgtatgtggatctggtgctgaaccaccgcaacggggacgacgggaattggaatmcattacaaagatgc gtacggcaaagtgggttacgggcggtttcaaaaggggttttacgattttcaccccaactacaacattcaggatgccaatgttcccaacgaggattc

77/116

Fig 16 (cont.) cagcttcgggcgcgatttagcccatgacaatccgtatglggccgatggactgaaggctgcaggcgattggctgaccaaagccclcgatgttca gggalatcgtctggattacgtgaaaggcatcagctacaccttcclgaaaagttalctgtcctatggggccatgaacggaaaatttgccgtcggtga gtactgggatgccaaccgggatacgttgaactggtgggcgaacacggcgatggaagggcgggcccatgtgtttgattttgçgttgcgcgagg agctgaaaaacatgtgcaatgc ggacgggtactacgacatgcgtcgattggaccacgegggtctggtc ggaatcgacccgtggaa ggcggt gacgtttgtcgaaaaccatgatacggatcggcacgaccccatctacaataacaagcatttggcgtatgcctacatcttgacgtcggaagggtatc cgacggtgttctggaaggattactaccaatacggaatgaagccgatcatcgacaacctcatttggatecacgaacacattgcgtacggaacgac ccaagagcgttggaaagacgaagatgtctttgtgtatgagcggaccggaggcaagcggctattggtggggcttaacgacaalcgcgccacca gcaaaacgglcaccgtacagaccggctttggtgccaacgtggccttgcacgactacaccggcaacggccccgatetccgtacçgacgcctac ggtcgggtaaccttgaccattcctgcaaac gggtacgtggcctattccgttccgggca tctccggatcctttgtgccggtc ga gaaa accgtgac gcaggagtttgccggggc gtccgacttggatà ttcgtccggccgalaacacgcaatttgtgca ggtcgggcggatatacgcc aaggcaaacaa gcc ggttaca gcggaattgtattgggatgccaaagactggacgacctccacgtcgatlctccta gaagtgcgttcggc ttcgggaacgctcatc acgacaaagaccgtgacccaattgtcgtcccagggtacccgcgtttccttcacgccttcggctaccggatggtacgtcttttccattcgaagctat aacacgccttcgacgaacccaaagccggcctactggttaaaggtaacgtatacggcgccgcaattgcttcagtaa

SEQIDNO: 130

Met Arg Cys Arg Arg Gly Arg Asp Gly Cys Trp Cys Gly Arg Arg Asn Ala Leu Pro Arg His Pro Arg Glu GIn Asn Asn Met Asn Tyr Leu Asn Arg Met Gly Vai Ser Arg Met Thr Lys Ser Arg Glu Leu Arg Cys Ser Trp Lys Vai Phe Vai Vai Gly Cys Leu Leu Trp Met Ala Trp Gly Ser Ser Ala Ser Ala Gly Vai Leu Met Gin Gly Phe Tyr Trp Asp Ala Ser Thr Gly Thr Ser Asp Ser Trp Trp Thr His Leu Ala Lys Gin Ala Asn Gly Leu Lys Arg Ala Gly Phe Thr Ala Vai Trp Ile Pro Pro Vai Leu Lys Gly Ala Ser Gly Gly Tyr Ser Asn Gly Tyr Asp Pro Phe Asp Asp Tyr Asp Ile Gly Ser Lys Asp Gin Lys Gly Thr Vai Ala Thr Arg Trp Gly Thr Arg Glu Glu Leu Gin Arg Ala Vai Ala Val Met Arg Ala Asn Gly Leu Asp Vai Tyr Vai Asp Leu Vai Leu Asn His Arg Asn Gly Asp Asp Gly Asn Trp Asn Phe His Tyr Lys Asp Ala Tyr Gly Lys Vai Gly TyT Gly Arg Phe Gin Lys Gly Phe Tyr Asp Phe His Pro Asn Tyr Asn Ile GIn Asp Ala Asn Vai Pro Asn Glu Asp SeT Ser Phe Gly Arg Asp Leu Ala His Asp Asn Pro Tyr Vai Ala Asp Gly Leu Lys Ala Ala Gly Asp Trp Leu Thr Lys Ala Leu Asp Vai Gin Gly Tyr Arg Leu Asp Tyr Vai Lys Gly Ile Ser Tyr Thr Phe Leu Lys Ser Tyr Leu Ser Tyr Gly Ala Met Asn Gly Lys Phe Ala Vai Gly Glu Tyr Trp Asp Ala Asn Arg Asp Thr Leu Asn Trp Trp Ala Asn Thr Ala Met Glu Gly Arg Ala His Vai Phe Asp Phe Ala Leu Arg G lu Glu Leu Lys Asn Met Cys Asn Ala Asp Gly Tyr Tyr Asp Met Arg Arg Leu Asp His Ala Gly Leu Vai Gly Ile Asp Pro Trp Lys Ala Vai Thr Phe Vai Glu Asn His Asp Thr Asp Arg His Asp Pro Ile Tyr Asn Asn Lys His Leu Ala Tyr Ala Tyr Ile Leu Thr Ser Glu Gly Tyr Pro Thr Vai Phe Trp Lys Asp Tyr Tyr Gin Tyr Gly Met Lys Pro Ile Ile Asp Asn Leu Ile Trp He His Glu His Ile Ala Tyr Gly Thr Thr Gin Glu Arg Trp Lys Asp Glu Asp Vai Phe Vai Tyr Glu Arg Thr Gly Gly Lys Arg Leu Leu Vai Gly Leu Asn Asp Asn Arg Ala Thr Ser Lys Thr Vai Thr Vai Gin Thr Gly Phe Gly Ala Asn Vai Ala Leu His Asp Tyr Thr Gly Asn Gly Pro Asp Leu Arg Thr Asp Ala TyT Gly Arg Vai Thr Leu Thr Ile Pro Ala Asn Gly Tyr Va] Ala Tyr Ser Vai Pro Gly Ile Ser Gly Ser Phe Vai Pro Vai Glu Lys Thr Vai Thr Gin Glu Phe Ala Gly Ala Ser Asp Leu Asp Ue Arg Pro Ala Asp Asn Thr Gin Phe Vai GIn Vai Gly ATg Ile Tyr Ala Lys Ala Asn Lys Pro Vai Thr Ala Glu Leu TyT Trp Asp Ala Lys Asp Trp Thr Thr Ser Thr Ser Ile Leu Leu Glu Vai Arg Ser Ala Ser Gly Thr Leu Ile Thr Thr Lys Thr Vai Thr Gin Leu Ser Ser Gin Gly Thr Arg Vai Ser Phe Thr Pro Ser Ala Thr Gly Trp Tyr Vai Phe Ser Ile Arg Ser TyT Asn Thr Pro Ser Thr Asn Pro Lys Pro Ala Tyr Trp Leu Lys Vai Thr Tyr Thr Ala Pro GIn Leu Leu Gin

SEQIDNO: 131 atgccgcagctttacccattgccgccgcgctggcggcgcgcggcccggcagggcctggccgccttgacgctggccaccacggccctgggc atctcgacggcccaggcccagagtgcaccgcgcacggccttcgtgcatctgttcgaatggaagtggaccgacatcgcgcgcgagtgcgaga ccttcctcgggcccaagggcttcgcggcggtgcaggtgtcgcccccgaacgagcacaactgggtgaccagcggtgatggtgcaccttatccg tggtggatgcgcuccagccggtgagctacagcctggaccgcagccgcagcggcacgcgcgccgagttccaggacatggtcaaccgatgc aatgccgtggÊCgtgggcatctacgtggacgccgtgatcaatcacatgtccggcggcacgggcggcacctcgagcgctgggcgcagctgg

78/116

Figi 16 (cont.) agctatcacaactaccctgggctctatggccccaacgacttccaccagccggtgtgcagcatcaccaactacggggatgcgaacaatgtgcag cgttgcgagctctcgggcttgcaggacc tggacactgggagc gcttatgtgcgcggc aagatc gccgactatctggtggatctggtcaacatg ggggtcaagggcttccgggtggatgcggc caagcaca tcagcccgaccgacctgggcgcc atcatc gatgc ggtcaac agccgcaccggc gcgaaccgccctttctggtttctggaggtgattggcgcggccggcgaggcagtgçagccgaaccagtacttctcgctcggcggcggccaggt caccgtgaccgagttcaactatgggaagcaaatcttcggcaagttcgccggtggcggccgtctggccgagctgcgcagcttcggtgaaacctg gggcctgatgcccagcagcaaagcgattgctttcatcgacaaccacgacaagcagcgcggtcatggcggcggtggcaactatctgaccUcc accatggctcgacctacgatctggccaac alc ttca tgctggcttggccttalggctacccggcgctgatgtcca gctatgccttc aac cgcagc acggcclacgacacgagctttggcccgccacacgacagtggtggcgccacccgtggcccctgggatggtggcggcagccagccggcctgc ttcaaccagagcatcggtggctgggtgtgtgagcaccgctggcggggcatcgccaatatggtggccttccgcaacgccacgctgcccaactg gaccgtgaccgactggtgggacaacggcaacaaccagatcgctttcgggcggggtgacaagggcttcgtggtgatcaaccgcgaagacgc cgcgctgacgcgcaa cttcaa gaccagcctgccagccggcca gtactgcgatglcatctccggggacttcaaca atggtcagtgcacgggcc a tgtggtgacggtcgatgccggcggctacgtgacgctgacggccgggcccaatggtgcggcggccatccac gtgggcgcccgtc tgga cg gcgcctcfcagccgccgacgaccgcctcggtgac£ttcaacgcgtcggccgataccttttggggacagaacctgttcgtcgtgggcaaccaca gcgcac tgggcaactgglcgccggcggccgccaggccgatgac ttggatttccggttcgggcac gcgc gggaactggcgcgcggtgc tca atttgccggccaataccacctaccaatacaagttcatcaagaaggacggggctggaaacgtggtttgggagggcggtggcaatcgcgtcgtga ccacgccgtctgggggcggatcggtgagcacgggcggcaattggcagtag

SEQIDNO: 132

Met Pro Gin Leu Tyr Pro Leu Pro Pro ATg Trp Arg Arg Ala Ala Arg Gin Gly Leu Ala Ala Leu Thr Leu Ala Thr Thr Ala Leu Gly llc Ser Thr Ala Gin Ala Gin Ser Ala Pro Arg Thr Ala Phe Vai His Leu Phe Glu Trp Lys Trp Thr Asp Ile Ala Arg Glu Cys Glu Thr Phe Leu Gly Pro Lys Gly Phe Ala Ala Vai Gin Vai Ser Pro Pro Asn Glu His Asn Trp Vai Thr Ser Gly Asp Gly Ala Pro Tyr Pro Trp Trp Met Arg Tyr Gin Pro Vai Ser Tyr Ser Leu Asp Arg Ser Arg Ser Gly Thr Arg Ala Glu Phe Gin Asp Met Vai Asn Arg Cys Asn Ala Vai Gly Vai Gly Ile Tyr Vai Asp Ala Vai Ile Asn His Met Ser Gly Gly Thr Gly Gly Thr Ser Ser Ala Gly Arg Ser Trp Ser Tyr His Asn Tyr Pro Gly Leu Tyr Gly Pro Asn Asp Phe His Gin Pro Vai Cys Ser lie Thr Asn Tyr Gly Asp Ala Asn Asn Vai Gin Arg Cys Glu Leu Ser Gly Leu Gin Asp Leu Asp Thr Gly Ser Ala Tyr Vai Arg Gly Lys Ile Ala Asp Tyr Leu Vai Asp Leu Vai Asn Met Gly Vai Lys Gly Phe Aig Vai Asp Ala Ala Lys His Ile Ser Pro Thr Asp Leu Gly Ala He Ile Asp Ala Vai Asn Ser Arg Thr Gly Ala Asn Arg Pro Phe Trp Phe Leu Glu Vai Ile Gly Ala Àla Gly Glu Ala Vai Gin Pro Asn Gin TyT Phe Ser Leu Gly Gly Gly Gin Vai Thr Vai Thr Glu Phe Asn Tyr Gly Lys Gin Ile Phe Gly Lys Phe Ala Gly Gly Gly Arg Leu Ala Glu Leu Arg Ser Phe Gly Glu Thr Trp Gly Leu Met Pro Ser Ser Lys Ala Ile Ala Phe Ile Asp Asn His Asp Lys Gin Arg Gly His Gly Gly Gly Gly Asn Tyr Leu Thr Tyr His His Gly Ser Thr Tyr Asp Leu Ala Asn Ile Phe Met Leu Ala Trp Pro Tyr Gly Tyr Pro Ala Leu Met Ser Ser Tyr Ala Phe Asn Arg Ser Thr Ala Tyr Asp Thr Ser Phe Gly Pro Pro His Asp Ser Gly Gly Ala Thr Arg Gly Pro Trp Asp Gly Gly Gly Ser Gin Pro Ala Cys Phe Asn Gin Ser Ile Gly Gly Trp Va] Cys Glu His Arg Trp Arg Gly Ile Ala Asn Met Vai Ala Phe Arg Asn Ala Thr Leu Pro Asn Trp Thr Vai Thr Asp Trp Trp Asp Asn Gly Asn Asn Gin Ile Ala Phe Gly Arg Gly Asp Lys Gly Phe Vai Vai Ile Asn Arg Glu Asp Ala Ala Leu Thr Arg Asn Phe Lys Thr Ser Leu Pro Ala Gly Gin Tyr Cys Asp Vai Ile Ser Gly Asp Phe Asn Asn Gly Gin Cys Thr Gly His Vai Vai Thr Vai Asp Ala Gly Gly Tyr Va] Thr Leu Thr Ala Gly Pro Asn Gly Ala Ala Ala Ile His Vai Gly Ala Arg Leu Asp Gly Ala Ser Gin Pro Pro Thr Thr Ala Ser Vai Thr Phe Asn Ala Ser Ala Asp Thr Phe Trp Gly Gin Asn Leu Phe Vai Vai Gly Asn His Ser Ala Leu Gly Asn Trp Ser Pro Ala Ala Ala Arg Pro Met Thr Trp Ile Ser Gly Ser Gly Thr Arg Gly Asn Trp Arg Ala Vai Leu Asn Leu Pro Ala Asn Thr Thr Tyr Gin Tyr Lys Phe Ile Lys Lys Asp Gly Ala Gly Asn Va] Vai Tip Glu Gly Gly Gly Asn Arg Vai Vai Thr Thr Pro Ser Gly Gly Gly Ser Vai Ser Thr Gly Gly Asn Trp Gin

SEQIDNO: 133 atgaataatgtgaaaaaagtatggttgt3tlattctataattgçlaccttagttatttcctttttcacacctttttcaacagcacaagclaatactgcacclg tcaacggaacaatgatgcaatatttcgaatgggatttacçgaatgatgggacgcttlggacgaaagtaaaaaatgaagctaccaatctttcttcgcl

79/116

Fig 16 (cont) aggtattacagcgttatggctccctccagcatataaaggaacgagccaaagcgatgtcggatatggcgtgtacgatttatatgaccttggggaatt taatcaaaaagggacgatcc gaacgáaatacggaa caaaa gcacaatatattcaagccatec aagctgccaaagccgcagggatgc a agtat atgcagatgttgtatttaatcataaggcgggggctgacggcacagaatttgtcgatgcagttgaggtaaacccttctaatcgaaatcaagaaaca£ ctggcacatatcaaatlcaagcatggacaaaatttgattttcctggtcgtggaaacacaUctccagcttcaaatggcgctgg tatea ttttgacggl acc gattgggatga aa gtcgtaaattaaatcgtótttacaaattccgcggtacaggaaaagcgtgggactgggaagtcgatacagaaaa cgga aactatgattatrtaatgttcgctgatttagatatggatcaccctgaagttgtgacagagrtaaaaaactggggaaaatg£tBtgtaaatacgacaaâ tgtagac ggatttcgtttggatgccgtaaaacata ttaaatacagctttttccctgactggctaacatatgtacgtaatcaaa caggaa aaaatttattt gctgttggggaattttggagctatgacgtcaataagctgcataactacattacaaaaacaaatggatcgatgtcgttatttgatgcacctttgcataa caacttttatatcgcttc caaatc gagtggatattttgacatgcgttatttattgaa taa tacattaatgaaagatcaaccttcactegctgtaacacttgt cga taacc atgata caca acc aggtcaatctttacaatcatgggtagaagcttggtttaaaccgctígcttaçgcctttattttaacaagacaagag ggglatccttgcgtattttacggtgactattacggaatcccgaaatacaatattccgggattaaaaagtaaaattgatccgcttttaattgctcgtcgt gattatgcttatggaacacaacgtgattacattgatcatcaagacattatcggatggacacgagaaggcattgatgcaaaaccgaactctggactt gcggctttaattaccgacggccctggcggaagtaaatggatgtatgtcggtaaaaaacatgctgggaaaglgttttatgatttaactggaaatcga a gtgac aca gtaacgattaatgcggacggttggggagaatttaaagtaaacggcggctccgtttcgatttgggtggctaaaac atcaaacgtc a c atttacagtc aataacgccac aacaacaagtggaçaaaacgtalatgttgttg gcaa cattccagagcta ggcaattetttg

SEQ IDNO: 134

Met Asn Asn Vai Lys Lys Vai Trp Leu Tyr Tyr Ser Ue Ue Ala Thr Leu Vai Ue Ser Phe Phe Thr Pro Phe Ser Thr Ala Gin Ala Asn Thr Ala Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Vai Lys Asn Glu Ala Thr Asn Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Gin Ser Asp Vai Gly Tyr Gly Vai Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ue Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Ile Gin Ala Ile Gin Ala Ala Lys Ala Ala Gly Met Gin Va] Tyr Ala Asp Vai Vai Phe Asn His Lys Ala Gly Ala Asp Gly Thr Glu Phe Vai Asp Ala Vai Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Thr Tyr Gin Ue Gin Ala Trp Thr Lys Phe Asp Phe Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Vai Asn Thr Thr Asn Vai Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr Tyr Vai Arg Asn Gin Thr Gly Lys Asn Leu Phe Ala Vai Gly Glu Phe Τη) Ser Tyr Asp Vai Asn Lys Leu His Asn Tyr lie Thr Lys Thr Asn Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Ile Ala Ser Lys Ser SeT Gly Tyr Phe Asp Met Arg Tyr Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Vai Thr Leu Vai Asp Asn His Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Ala Trp Phe Lys Pro Leu Ala Tyr Ata Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ue Pro Lys Tyr Asn Ile Pro Gly Leu Lys Ser Lys Ue Asp Pro Leu Leu Ue Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp Ile Ue Gly Trp Thr Arg Glu Gly Ue Asp Ala Lys Pro Asn Ser Gly Leu Ala Ala Leu He Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Lys His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser Ile Τη) Vai Ala Lys Thr Ser Asn Va] Thr Phe Thr Vai Asn Asn Ala Thr Thr Thr Ser Gly Gin Asn Vai Tyr Vai Vai Gly Asn Ile Pro Glu Leu Gly Asn Ser Leu

SEQ IDNO: 135 gtgacaggcaccccgtctttatacattcctccacataaaataaccatacagctttcaaatttgttgaaatgtataaaaataaaaaataglattgtaagc gttaacatccgtcattataataacttcaaacgcgtttatgttttaatgcaaacgtttgcatcctcattttatttaaagaaaggatgtgtgtgcatgaattatt tgaaaa aa gtgt ggttgtattac getate gtcgctaccttaa teatttee tttctta cgcccttttcaactgcacaagccaacactgcacca gtcaacg gaacgatgatgcaatatncgaatgggatttaccgaatgatggcacaclttggacgaaagtaaaaaacgaagcaagcagcctttcttctttaggtat tactgc gttatggttaccacctgcaUcaaa ggaacgagccaaggggatgtc gggta tggcgtgtacgattt gtatgactta ggagaatttaatca aaaagggacgattcgaacgaaatacggaacaaaaacgcaatatttacaagccattcaagcggcaaaaagcgctggcatgcaagutacgctg atgtcgtatttaatcacaaggcgggggcagatagtacagaatgggttgacgcagtcgaagtgaatccttctaatcgaaaccaagaaacatctgg ·

Fig 16 (cont)

80/Π6 cacatatcaaattcaagcalggacaaaatttgatttccctgaccgtgggaacacatactcaagctttaaatggcgctggtatcattttgacggtacg gattgggatgaaagtcgaaaactaaatcgcatttacaaátttcgtggcacaggaaaagcatgggattgggaagtagacacagagaacggâaac tatgactacttaa tgtttgctgatttagatat ggatc ac cctga agtcgtgacagagctaaaaaactggggaacatggtacgtcaatacgacaaatg tcgatgggtttcgcttagatgca gtaaagcatattaaatatagctttttccc a gattggttaacatatgtgcgctcaca aacac aaaaaaatctgtttg cagtaggagaattttggagctacgatgtcaataaactgcataactacatUcaaaaacaagtggaaccatgtcgttattlgatgcgccacttcataa caacttttacactgcttcaaaatctagcgg gtattttga c atgcgctatttgttaaa taatacgttgatgaaagaccagc c ttctcttgcggtcacactc gttgataatcatgaçacgcaaccgggacaatctttacaatcatgggugagccttggtttaagccgcttgcttatgcctttattttgacaagacaaga agg ata tccttgcgtatttta cggc gactattacggc ate cctaaatacaatattccgggattgaaaagtaaaatcgatcc gcrtc tca ttgcccgta gagaclacgcatacggaacacaacgtgattatattgaccatcaagacattattggatggacacgggaaggaattgactcaaaaccgaactctgg acttgcggctttaattactgacggtcctggtggaagtaaatggatgtatgtaggtaaaaagcatgctggaaaagtgttttacgatctcactggaaat cgaagcgatacggtaacgattaatgcagacggctggggagagtftaaagtaaacggtggctccgtttccatttgggttgccaaaacatcacaag tcacgtttaccgtc aacaatgcga caac gac aagcggacaaaatgtgtatgtcgttggcaacattccagEigctcggaaattggaacacagcaaa cgcaa tcaaaa tgac cccatcttcttatc caacgtggaaaacaaccattgctc ttccacaa ggaaaagcaattggcggcgta cgccatggccc tt ga

SEQID NO: 136

Vai Thr Gly Thr Pro Ser Leu Tyr Ile Pro Pro His Lys Ile Thr Ile Gin Leu Ser Asn Leu Leu Lys Cys Ile Lys Ile Lys Asn Ser Ile Vai Ser Vai Asn Ile Arg Hís Tyr Asn Asn Phe Lys Arg Vai Tyr Vai Leu Met Gin Thr Phe Ala Ser Ser Phe Tyr Leu Lys Lys Gly Cys Vai Cys Met Asn Tyr Leu Lys Lys Vai Trp Leu Tyr Tyr Ala Ile Vai Ala Thr Leu Ile Ile Ser Phe Leu Thr Pro Phe Ser Thr Ala Gin Ala Asn Thr Ala Pro Vai Asn Gly Thr Met Met Gin Tyr Phe Glu Trp Asp Leu Pro Asn Asp Gly Thr Leu Trp Thr Lys Vai Lys Asn Glu Ala Ser Ser Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Thr Ser Gin Gly Asp Vai Gly Tyr Gly Vai Tyr Asp Leu TyT Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Ile Arg Thr Lys Tyr Gly Thr Lys Thr Gin Tyr Leu Gin Ala Ile Gin Ala Ala Lys Ser Ala Gly Met Gin Vai Tyr Ala Asp Vai Vai Phe Asn Hís Lys Ala Gly Ala Asp Ser Thr Glu Trp Vai Asp Ala Vai Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Thr Tyr Gin Ile Gin Ala Trp Thr Lys Phe Asp Phe Pro Asp Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr Hís Phe Asp Gly Thr Asp Trp Asp Glu Ser Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Thr Gly Lys Ala Trp Asp Trp Glu Vai Asp Thr Glu Asn Gly Asn Tyr Asp Tyr Leu Met Phe Ala Asp Leu Asp Met Asp His Pro Glu Vai Vai Thr Glu Leu Lys Asn Trp Gly Thr Trp Tyr Vai Asn Thr Thr Asn Vai Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Lys Tyr Ser Phe Phe Pro Asp Trp Leu Thr Tyr Vai Arg Ser Gin Thr Gin Lys Asn Leu Phe Ala Vai Gly Glu Phe Trp Ser Tyr Asp Vai Asn Lys Leu His Asn Tyr Ile Thr Lys Thr Ser Gly Thr Met Ser Leu Phe Asp Ala Pro Leu His Asn Asn Phe Tyr Thr Ala Ser Lys Ser Ser Gly Tyr Phe Asp Met Arg TyT Leu Leu Asn Asn Thr Leu Met Lys Asp Gin Pro Ser Leu Ala Vai Thr Leu Vai Asp Asn Hís Asp Thr Gin Pro Gly Gin Ser Leu Gin Ser Trp Vai Glu Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Gin Glu Gly Tyr Pro Cys Vai Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Lys Tyr Asn Ile Pro Gly Leu Lys Ser Lys Ile Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gin Arg Asp Tyr Ile Asp His Gin Asp He He Gly Trp Thr Arg Glu Gly Ile Asp Ser Lys Pro Asn Ser Gly Leu Ala Ala Leu He Thr Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Lys His Ala Gly Lys Vai Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Vai Thr Ile Asn Ala Asp Gly Trp Gly Glu Phe Lys Vai Asn Gly Gly Ser Vai Ser He Trp Vai Ala Lys Thr Ser Gin Vai Thr Phe Thr Vai Asn Asn Ala Thr Thr Thr Ser Gly Gin Asn Vai Tyr Vai Vai Gly Asn Ile Pro Glu Leu Gly Asn Trp Asn Thr Ala Asn Ala Ile Lys Met Thr Pro Ser Ser Tyr Pro Thr Trp Lys Thr Thr Ile Ala Leu Pro Gin Gly Lys Ala Ile Gly Gly Vai Arg Hís Gly Pro SEQID NO: 137 gtgggacgggcaggcttggcgçatcactcgaacacttccgccaaggggaçatacgggtcacctctcgaâctgcgtccggatcgccccgccgt ggecggggcggtcgagcttgaagatgtccagcggggagccgccgccgaggatcaccccggcggcgtactcgcccagggcggggctcag cttgaagccgtggccggagccgcctcccaggagccagacgttggaggcccgcggatggcggtcgaggaggaggtggccgtcggggctgt tctcgtactggcagacgcgggtctcgaccagcggcgcgtccttcagggccgggaaccggcgggccacctcggcccgggccgcttccagca

81/116

Fig 16 (cont.) gggccggggtgatcgtccgclcgcccgccgtgggatcgatgggctcgccccgggtgtcgtccgccaccttgaagccgcggtgctcgttgcc ggggatgccgtagtagatccgctcgccgagatcgacccagaccggacagccgccctcctggaagcgcgggtcgcccggcggcgtgccga agaagaacacctcctggcgggtgítgcggaggaaccgctcaccgatcacgtccgggaacagcccggccagccagggaccgcaggcgaag acglagaggtcggccgcgagagtggagccgtccgaaaggtgàagccgctccaagggccccgggaccatggcggcctgccggtactcecc gccctcgccctggaacagctccaccacggtccggcaggcgcgccgggcgaacagggcgccggctlcctcctcgtaccagatcgtgcggac gccgtcgaaatcgacctgggggaagcggctccgggcctccccctgagacagctcggcgaccggcagccccgcgtcctccagaaaaggaa gggagtcgcggacgtagctgtcgtcctcgccgcacatccagaggaccccggtecttttgtacagccggtaaccggactggacttcggcgtccc gccagagctcgaaggagcgggcgacccactccacgtacagacggtcgggtccgtaggcgccgcggatgatccgcgtctcgccaccggag ctggagcgggagtgccccggaccccaggcgtccaggagggtcacccgggctccgcggcggaggagatgcagggcggtccagccgccg aaggcgccggcgccgacgacggcgatatggggatgggagggcatggcgggcgtaaggttatcgcagcccgatccttcgctggcatcccat ctccgacc ggagta tcctggaaaa ttc gaa ga aggagatcgaca Igcaatcga acggaaacgtga

SEQIDNO: 138

Vai Gly Arg Ala Gly Leu Ala His His Ser Asn Thr Ser Ala Lys Gly Thr Tyr Gly Ser Pro Leu Glu Leu Arg Pro Asp Arg Pro Ala Vai Ala Gly Ala Vai Glu Leu Glu Asp Vai Gin Arg Gly Ala Ala Ala Glu Asp His Pro Gly Gly Vai Leu Ala Gin Gly Gly Ala Gin Leu Glu Ala Vai Ala Gly Ala Ala Ser Gin Glu Pro Asp Vai Gly Gly Pro Arg Met Ala Vai Glu Glu Glu Vai Ala Vai Gly Ala Vai Leu Vai Leu Ala Asp Ala Gly Leu Asp Gin Arg Arg Vai Leu Gin Gly Arg Glu Pro Ala Gly His Leu Gly Pro Gly Arg Phe Gin Gin Gly Arg Gly Asp Arg Pro Leu Ala Arg Arg Gly Ile Asp Gly Leu Ala Pro Gly Vai Vai Arg His Leu Glu Ala Ala Vai Leu Vai Ala Gly Asp Ala Vai Vai Asp Pro Leu Ala Glu Ile Asp Pro Asp Arg Thr Ala Ala Leu Leu Glu Ala Arg Vai Ala Arg Arg Arg Ala Glu Glu Glu His Leu Leu Ala Gly Vai Ala Glu Glu Pro Leu Thr Asp His Vai Arg Glu Gin Pro Gly Gin Pro Gly Thr Ala Gly Glu Asp Vai Glu Vai Gly Arg Glu Ser Gly Ala Vai Arg Lys Vai Lys Pro Leu Gin Gly Pro Arg Asp His Gly Gly Leu Pro Vai Leu Pro Ala Leu Ala Leu Glu Gin Leu His His Gly Pro Ala Gly Ala Pro Gly Glu Gin Gly Ala Gly Phe Leu Leu Vai Pro Asp Arg Ala Asp Ala Vai Glu Ile Asp Leu Gly Glu Ala Ala Pro Gly Leu Pro Leu Arg Gin Leu Gly Asp Arg Gin Pro Arg Vai Leu Gin Lys Arg Lys Gly Vai Ala Asp Vai Ala Vai Vai Leu Ala Ala His Pro Glu Asp Pro Gly Pro Phe Vai Gin Pro Vai Thr Gly Leu Asp Phe Gly Vai Pro Pro Glu Leu Glu Gly Ala Gly Asp Pro Leu His Vai Gin Thr Vai Gly Ser Vai Gly Ala Ala Asp Asp Pro Arg Leu Ala Thr Gly Ala Gly Ala Gly Vai Pro Arg Thr Pro Gly Vai Gin Glu Gly His Pro Gly Ser Ala Ala Glu Glu Met Gin Gly Gly Pro Ala Ala Glu Gly Ala Gly Ala Asp Asp Gly Asp Met Gly Met Gly Gly His Gly Gly Arg Lys Vai Ile Ala Ala Arg Ser Phe Ala Gly Ile Pro Ser Pro Thr Gly Vai Ser Trp Lys Ile Arg Arg Arg Arg Ser Thr Cys Asn Arg Thr Glu Thr

SEQ ID NO: 139 alga aaacattcaaccttaaacccacacttttacctttaactttgctgctgagttcgccggtattggcggca caaaa tggaac ta tgatgcagtatttc cartggtatgtgccaaatgacggcgcactctggacacaagttgaaaacaalgcgccagcactatccgacaacggttttacagcgctgtggttgc caccagc atataa aggc gcaggtggtagcaacgacgttggttacggtgttta cgatatgtatgactlaggggagtttga Icaaaaaggal cggta cgaactaaglacggcaccaaagaccaatatçtaaatgccatcaaagcagcacacaaaaacaatatccaaatttatggtgacgtagtgttcaacca tcgtggc ggtgcaga tggcaagtcgtgggtc gataccaagcgtgtgga ttggaataaccgcaa tattgaacttggc ga taaa tggattgaa gca tgggttgaatttagcttcccaggacgtaacgataaatactcagacttçcattggacgtggtatcactttgatggcgtcgattgggatgacgcaggta aagagaaagcgatctttaaattcaaaggtgatggtaaagcatgggattgggaagtcagLtctgaaaaaggcaactatgactacctcatgtacgpa gacttagacatggatcacccagaagtgaagcaagagctgaaagattggggtgaatggtacttaaacatgacgggtgttgatggcttccgaalgg atgca gt ga aacacatcaaatatc agtacc taca agagtggatcgattacttgcglaa gaaaa cgggcaaagagc tctttacc gttggtgagta c tggaactacgacgtgaacaaictgcacaacttlatgactaagacttcrggcagcatgtcattgtttgatgcgcctttacatatgaacttctataacgct tcacgctctggtggcaactttgatatgcgccgaaicatggatggcaccttgatgaaagacaacccagtgaaagcagtaacactggttgagaacc atgatacgcaaccactacaggccttagagtctccggtggattggtggttcaaaccacttgcgtacgcgttcattttgcttcgtgaggaaggttatcc g1cagtcttctacgcagattactacggtgcgcaatacagcgataaagggcacgatâtcaacatggtgaaagtgccttacattgagcaattggtga aagcgcgtaaagattatgcttalggtaaacaacattcttaccttgaccactgggatgtgattggttggaCacgagaaggggatgcggaacatccg

Fig 16 (cont.)

82/116 aactctatggcggttatcatgagtgatggtcctggcggaacaaagtggatgtacacaggttcaccgagcacacgttatgtcgataaactaggtatt cgtaccgaagaagta tggac taac gcta gtggatgggccgaa ttcccagtgaacggcggatcggtttctgtítgggttggc gttaaa taa

SEQIDNO: 140

Met Lys Thr Phe Asn Leu Lys Pro Thr Leu Leu Pro Leu Thr Leu Leu Leu Ser Ser Pro Vai Leu Ala Ala Gin Asn Gly ThrMet Met Gin Tyr Phe His Trp Tyr Vai Pro Asn Asp Gly Ala Leu Trp Thr Gin Vai Glu Asn Asn Ala Pro Ala Leu Ser Asp Asn Gly Phe Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly Glu Phe Asp Gin Lys Gly Ser Vai Arg Thr Lys Tyr Gly Thr Lys Asp Gin TyT Leu Asn Ala Ile Lys Ala Ala Hís Lys Asn Asn Ile Gin Ile Tyr Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asn Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp Ile Glu Ala Trp Vai Glu Phe Ser Phe Pro Gly Arg Asn Asp Lys Tyr Ser Asp Phe His Trp Thr Trp Tyr His Phe Asp Gly Vai Asp Tip Asp Asp Ala Gly Lys Glu Lys Ala Ile Phe Lys Phe Lys Gly Asp Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Lys Gin Glu Leu Lys Asp Trp Gly Glu Trp Tyr Leu Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His Ile Lys Tyr Gin Tyr Leu Gin Glu Trp Ile Asp TyT Leu Arg Lys Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu Tyr Trp Asn Tyr Asp Vai Asn Asn Leu His Asn Phe MeJ Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala Ser Arg Ser Gly Gly Asn Phe Asp Met Arg Aig Ile Met Asp Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn His Asp Thr Gin Pro Leu Gin Ala Leu Glu Ser Pro Vai Asp Trp Tip Phe Lys Pro Leu Ala Tyr Ala Phe He Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Asp Tyr TyT Gly Ala Gin Tyr Ser Asp Lys Gly His Asp Ile Asn Met Vai Lys Vai Pro Tyr Ile Glu Gin Leu Va] Lys Ala Arg Lys Asp Tyr Ala Tyr Gly Lys Gin His Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai Ile Met Ser Asp Gly Pro Gly Gly Thr Lys Trp Met Tyr Thr Gly Ser Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Glu Vai Trp Thr Asn Ala Ser Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Gly Vai Lys

SEQIDNO: 141 atgaaaccaataaataccctactcatatccgcccttgctgtttgttctttcagttccgcgacttacgccgatactattttgcacgcgttcaattggaagt attcagatgtgacggccaacgcgaatcaaattgctcaagctggttataagaaagtgcttgttgcgcctgcaatgaaatcgagtggcagccaalgg tgggctcgctatcaacctcaagatctacgcactatcgattctcctttgggcaataaacaagatttagccgcaatgattgccgcactcaaaggtgtg g gcgtcgatgtgta tgccgatgtggtactca accatatggcgaatgaaagctggaa gcgaagtgac ttgaattaccctggca cagaagtgcta a acgattatgctagccgttcaagctactatgctgaccagactctgtttggcaacctagcacaaggttatgtgtcagcgaacgactttcatccagcgg gctgUtttcagattggaacgaccctggtcatgttcagtattggcgtttgtgtggcgcagatggtgatgtaggtttacctgaccrtgatccaaacaac tggglÊgtttcacaacagcgrttgtatctgaaagcgctaaaagatatgggcatcaaagggttccgaatlgatgcagtgaagcacatgagccaata ccaaatcgatcaggtattcacgtctgaaattactgcgaacatgcatgtgtttggtgaagigattactagcggtggagcagggaatagcggctatg aa tcgttcttagcgccttacctgaa taata ctaatcactctgcctacga tttcccgc tgtttgca tcgattcgc tcggc attttctat ggggggc ggttt aaatcaactgcatgatccttaagcgíacggtcaggcacttgatgataatcgctcgatcacctttgcgatcacacatgatattccaaçcaatgacgg cttccgctaccaaattatggacccacaagacgagcagcttgcttacgcgtatatccttggtaaagacggtggcacgccgctgatctacagtgatg atcttcctgattctgaagacaaggataacggtcgttggggcaatgtttggaacagttcgacaatgaaaaacatgttgagcttccataacgcgatgc aaggc aaa acaatgacgatgatttc tagcgacca ttgcactttgttgtttaa gcgtggc aaagaaggt gttgtgggtattaacaa gtgtggtgaaa cgcgtggcgtgacggttgatacctaccaacatgagtttaattggcatgttcaatacaâagacgtgttaagcagcgcaacagaaaccgtgacttct cgttaccatacgttcaatctaccaccacgcagtgcgcgtatgtttaagctgtag

SEQ ID NO: 142

Met Lys Pro Ile Asn Thr Leu Leu Ile Ser Ala Leu Ala Vai Cys Ser Phe Ser Ser Ala Thr Tyr Ala Asp Thr Ile Leu His Ala Phe Asn Trp Lys Tyr Ser Asp Vai Thr Ala Asn Ala Asn Gin He Ala Gin Ala Gly Tyr Lys Lys Vai Leu Vai Ala Pro Ala Met Lys Ser Ser Gly Ser Gin Trp Trp Ala Arg TyT Gin Pro Gin Asp Leu Arg Thr He Asp Ser Pro Leu Gly Asn Lys Gin Asp Leu Ala Ala Met Ile Ala

-3- 1

Fig 16 (cont.) ^OJ'^1JO

Ala Leu Lys Gly Vai Gly Vai Asp Vai Tyr Ala Asp Vai Vai Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Ser Asp Leu Asn Tyr Pro Gly Thr Glu Vai Leu Asn Asp Tyr Ala Ser Arg Ser Ser Tyr Tyr Ala Asp Gin Thr Leu Phe Gly Asn Leu Ala Gin Gly Tyr Vai Ser Ala Asn Asp Phe His Pro Ala Gly Cys lie Ser Asp Trp Asn Asp Pro Gly His Vai Gin Tyr Trp Arg Leu Cys Gly Ala Asp Gly Asp Vai Gly Leu Pro Asp Leu Asp Pro Asn Asn Trp Vai Vai Ser Gin Gin Arg Leu Tyr Leu Lys Ala Leu Lys Asp Met Gly Ile Lys Gly Phe Arg Ile Asp Ala Vai Lys His Met Ser Gin Tyr Gin Ile Asp Gin Vai Phe Thr Ser Glu Ile Thr Ala Asn Met His Vai Phe Gly Glu Vai Ile Thr Ser Gly Gly Ala Gly Asn Ser Gly Tyr Glu Ser Phe Leu Ala Pro TyT Leu Asn Asn Thr Asn His Ser Ala Tyr Asp Phe Pro Leu Phe Ala Ser Ile Arg Ser Ala Phe Ser Met Gly Gly Gly Leu Asn Gin Leu His Asp Pro Lys Ala Tyr Gly Gin Ala Leu Asp Asp Asn Arg Ser Ile Thr Phe Ala Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pro Gin Asp Glu Gin Leu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Thr Pro Leu Ile Tyr Ser Asp Asp Leu Pro Asp Ser Glu Asp Lys Asp Asn Gly Arg Trp Gly Asn Vai Trp Asn Ser Ser Thr Met Lys Asn Met Leu Ser Phe His Asn Ala Met Gin Gly Lys Thr Met Thr Met De Ser Ser Asp His Cys Thr Leu Leu Phe Lys Arg Gly Lys Glu Gly Vai Vai Gly Ile Asn Lys Cys Gly Glu Thr Arg Gly Vai Thr Vai Asp Thr Tyr Gin His Glu Phe Asn Tip His Vai Gin Tyr Lys Asp Vai Leu Ser Ser Ala Thr Glu Thr Vai Thr Ser Arg Tyr His Thr Phe Asn Leu Pro Pro Arg Ser Ala Arg Met Phe Lys Leu

SEQIDNO: 143 atgccaaagagcacttttaccaaatecata acaaa atcacttcttgctacttccgttgttgtaagcttattgcctgcctacgcacaggccgac ac tat cttgcatgcctttaactggaaatacagcgacattacccgccaagcagagcaaattgcgcaagctggttataaaaaagtactgatttcaccgccgc tga agtcca caggcccacaatggtgggcacgttaccaa ccacaggacattcgagtgattgactcccctgtc ggcaacaagca agatttac aag cçctcattgcagccttaaaggcacaaggcgttgaagtatacgcagacatcgtactcaaccacatggccaacgaaagctggaaacgagacgatc tgaactacccgggaagtga tttacttacccaatacagcca aaatatggcttacatgaaccagcaaaaattgtttggagattta gagc aaaatcagtt ctctgccaatgattttcacccggctggctgcattactgattggagtaacccggggcatgttcaatactggcgcttatgt ggtggtaatggt gacac t gggttacctgatcttgatcctaactegtgggtgatcgatcaacaaaaacgttatttacgtgctrtgaaagacatgggaataaagggcttccgagttg a tgc ggtaaaacacatgagc gattacc aaatcaacca agtgtttac gc cagacatcatcgcaggcttacatgtatttggtgaa gtgatcaccagtg gtggcaagggcagcaatgactaccactçttttctggaaccgtatttaaataacaccaatcacgccgcgtatgacttcccgctatttgcctctatccg aaatgcattiagttatcatggcagcttgtctcaatiacatgatccacaagcttacgggcaagcacttcctaacgacagagccattactttcaccatca ctcacgacattccaaccaatgatggtttccgttaccaaalcatggatccaaccagtgaaaaactcgcgtacgcgtacattctaggcaaagatggg ggta gcccacttatetatagcgalgc tttagacccaa gtgaagataaagataagggccgctggcgtga tgtatggaac caagaatacatggttaa ca tgatcagcttcc acaacaaggtgcaaggtaaaa gcatg gaggtcalgtacagcgatcaatgcttgc tggtctttaaac gtgaaa aaca aggct tagtcggtattaataagtgc gctgaaagccgtacctacaccatagatacccatcgttttgaatttaactggtaccaac cglacaac gacacatlaa g ccagcacagcgagacctttagcagccgttatcalgctctgaccatfccggcgcaaacagcacgaatgttggcgctataa

SEQ ID NO: 144

Met Pro Lys Ser Thr Phe Thr Lys Ser Ile Thr Lys Ser Leu Leu Ala Thr Ser Vai Vai Vai Ser Leu Leu Pro Ala Tyr Ala Gin Ala Asp Thr Ile Leu His Ala Phe Asn Trp Lys Tyr Ser Asp lie Thr Arg Gin Ala Glu Gin Ile Ala Gin Ala Gly Tyr Lys Lys Vai Leu Ile Ser Pro Pro Leu Lys Ser Thr Gly Pro Gin Trp Trp Ala Arg Tyr Gin Pro Gin Asp Ile Arg Vai íle Asp Ser Pro Vai Gly Asn Lys Gin Asp Leu Gin Ala Leu Ile Ala Ala Leu Lys Ala Gin Gly Vai Glu Vai Tyr Ala Asp He Vai Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Asp Asp Leu Asn Tyr Pro Gly Ser Asp Leu Leu Thr Gin Tyr Ser Gin Asn Met Ala Tyr Met Asn Gin Gin Lys Leu Phe Gly Asp Leu Glu Gin Asn Gin Phe Ser Ala Asn Asp Phe His Pro Ala Gly Cys He Thr Asp Trp Ser Asn Pro Gly His Vai Gin Tyr Trp Arg Leu Cys Gly Gly Asn Gly Asp Thr Gly Leu Pro Asp Leu Asp Pro Asn Ser Trp Vai Ile Asp Gin Gin Lys Arg Tyr Leu Arg Ala Leu Lys Asp Met Gly Ile Lys Gly Phe Arg Vai Asp Ala Vai Lys His Met Ser Asp Tyr Gin Ile Asn Gin Vai Phe Thr Pro Asp Ile Ile Ala Gly Leu His Vai Phe Gly Glu Vai Ile Thr Ser Gly Gly Lys Gly Ser Asn Asp TyT His Ser Phe Leu Glu Pro Tyr Leu Asn Asn Thr Asn His Ala Ala TyT Asp Phe Pro Leu Phe Ala Ser Ile Arg Asn Ala Phe Ser TyT His Gly Ser Leu Ser Gin Leu .His Asp Pro Gin Ala Tyr Gly Gin Ala Leu Pro Asn Asp Arg Ala Ile Thr Phe Thr Ile Thr His Asp

84/116

Fig 16 (cont.)

Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pro Thr Ser Glu Lys Leu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Ser Pro Leu Ile Tyr Ser Asp Ala Leu Asp Pro Ser Glu Asp Lys Asp Lys Gly Arg Trp Arg Asp Vai Trp Asn Gin Glu Tyr Mel Vai Asn Met lie Ser Phe His Asn Lys Vai Gin Gly Lys Ser Met Glu Vai Met Tyr Ser AspGln Cys Leu Leu Vai Phe Lys Arg Glu Lys Gin Gly Leu Vai Gly Ile Asn Lys Cys Ala Glu Ser Arg Thr Tyr Thr lie Asp Thr His Arg Phe Glu Phe Asn Trp Tyr Gin Pro Tyr Asn Asp Thr Leu Ser Gin His Ser Glu Thr Phe Ser Ser Arg Tyr His Ala Leu Thr Ile Pro Ala Gin Thr Ala Arg Met Leu Ala Leu

SEQ IDNO: 145 atgttgaaaaggattacggtagtctgtttattatttattttgctttttcctaatatatatgggaggaa taaggcggaagcagcaac gata aata atgg a acattaatgcagtattttgagtggtacgctccgaalgatgggaatcattggaatcgtttgcgttatgatgclgaaagtttagctcataagggaatcac a tctgtatggataccacctgcatataaa gggacttcgcaaaatgatgtagggtatggggcctalgatttatacgatttaggggagttc aatc aaaaa ggaacggtgcggacgaaatatgggacaaaggcacàgttgaaatctgcaattgacgctttacataagcaaaacatcgacgtatacggtgatgta gttatgaatca taaaggtggggc tga ttatactgaaaccgtaacagctgttg aggtagacc gtaacaatcgaaatattgaagtatcaggtgattatg aaattagtgcgtggacgggttttaactttccagggcgcagagatgcttattctaatttcaaatggaaatggtatcattttgacggaacggattgggat gaaggaaggaaattaaaccgaatttataaatttaggggtataggtaaagcgtgggactgggaagtgtctagcgaaaatggaaattatgattatttg atgtatgcagatcttgattttgatcatccagatgttgcgaatgaaatgaaaagttggggaacgtggtatgcgaatgaattaaatttagatggatttcgt ttagatgctgttaaacatattgatcatgaatatttacgcgattgggtaaatcatgtca ga ca gc aa ac ggggaaagaaatgtttac ggtggc tgaat attggcaaaatgatatccagactttaaacaattatttggcgaaagtcaattataatcaatetgtatttgatgcaccgcttcattacaattttcattatgctt caacaggaaatgggaattatgatatgagaaatattttaaa tggaacagtaatgaaaaatea tcctgcactcgcagttac tctcgttgaga atcatga ttctcaacctgggc aatcattggaatctgtagtaagtccgtggtttaagcc gc tggcatatgcatttattttaactcgtgcagagggctatcc ttcagt tttttatggtga ttactatgggacaagcggaaatagtagttatgaaattccagcgttaaaa gataaaattgatccaattttgacggca cgaaa aaact ttgcatatggtacgca gcgtgattatttagaccatccagatgtgattggctggacaagagaaggagatagtgtacatgc taagtctggttt agcgg ca ttaatctcc gatggaccaggaggatcaaagtggalggatgttggaaagaataacgctgggga agtatggtacgatattacgggta at caaac aaatac tglaacaa ttaataaagatgga tcg gggcaattccalgtaagtggaggctctgtttclatatalgttcaa cagta a

SEQIDNO: 146

Met Leu Lys Arg Ile Thr Vai Vai Cys Leu Leu Phe Ile Leu Leu Phe Pro Asn Ile TyT Gly Arg Asn Lys Ala Glu Ala Ala Thr Ile Asn Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp Tyr Ala Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg TyT Asp Ala Glu Ser Leu Ala His LysGly Ile Thr Ser Vai Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Lys Ser Ala Ile Asp Ala Leu His Lys Gin Asn Ile Asp Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Thr Vai Thr Ala Vai Glu Vai Asp Arg Asn Asn Arg Asn Ile Glu Vai Ser Gly Asp Tyr Glu Ile Ser Ala Trp Thr Gly Phe Asn Phe Pro Gly Arg Arg Asp Ala Tyr Ser Asn Phe Lys Trp Lys Trp TyT His Phe Asp Gly Thr Asp Trp Asp Glu Gly Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Asn Gly Asn TyT Asp Tyr Leu Met Tyr Ala Asp Leu Asp Phe Asp His Pro Asp Vai Ala Asn Glu Met Lys Ser Trp Gly Thr Trp Tyr Ala Asn Glu Leu Asn Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Asp His Glu Tyr Leu Arg Asp Trp Vai Asn His Vai Arg Gin Gin Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Gin Asn Asp Ile Gin Thr Leu Asn Asn Tyr Leu Ala Lys Vai Asn Tyr Asn Gin Ser Vai Phe Asp Ala Pro Leu His Tyr Asn Phe His Tyr Ala Ser Thr Gly Asn Gly Asn Tyr Asp Met Arg Asn Ile Leu Asn Gly Thr Vai Met Lys Asn His Pro Ala Leu Ala Vai Thr Leu Vai Glu Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Vai Vai Ser Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe lie Leu Thr Arg Ala Glu Gly Tyr Pro SeT Vai Phe Tyr Gly Asp Tyr Tyr Gly Thr Ser Gly Asn Ser Ser Tyr Glu Ile Pro Ala Leu Lys Asp Lys Ile Asp Pro Ile Leu Thr Ala Arg Lys Asn Phe Ala TyT Gly Thr Gin Arg Asp Tyr Leu Asp His Pro Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ser Vai His Ala Lys Ser Gly Leu Ala Ala Leu Ile Ser Asp Gly Pro Gly Gly Ser Lys Trp Met Asp Vai Gly Lys Asn Asn Ala Gly Glu Vai Trp TyT Asp Ile Thr Gly Asn Gin Thr Asn Thr Vai Thr Ile Asn Lys Asp Gly Ser Gly Gin Phe His Vai Ser Gly Gly Ser Vai Ser Ile Tyr Vai Gin Gin

85/116

Fig 16 (cont.)

SEQ IDNO: 147 atgagcttaaataactttaaggtaaaactgcttagttttgctgtgtettctgctgtattgtcactggctccaaatttagccaatgctgcaaattttgaaag tgaga tggtgataatccatccgntca gtggacatatgacaata ta gcaaaagagtgtacag agtaccttggtccagccggatttg acggtgtaca gatttcccagccagcggaa cataa gc gggctgaaggagUtggtgggc cgtatatcagccggttaattataagaattttacaaccatgaccggta acga gga gcagcttaaggca atgatcaagacctgtaatgatgcaggtgttaaggtgttcgclga cgctgttttcaaccaaaaggc tacagacgg tgtaggctggggcggttcaacttggagttalaagaactaccctgacggattctccggatcagatttccatggagactgttçcattgacaaaagcUt actgatgcaaataatgtcagaacctgtgcactcteaggtatgccggacgttgccacagataactccgctactcaggaaaagattgeagattacct cgcttetttaatgaatatgggggtctalggtttccgtattgacgctgcaaagcacatgggatacaacgaUtcaactccattctttcaaaaactgcac agaagactggaagaagacctcctgc&tatctggaagtaatcggagccggtaacgaagctgccgacattcagccggacaagtatacctttattga gaatgcggttgtaactgacttcggttatgtctgggatgcaaatgagagtttcggaaagggtaattacggtaaggcactggaactcagtacctggct cggtgcaaattca gaaacattc gtaaacaa tcatgatgatgaatggggcagatgctcagccggtagc tgc tc aatga aaactca ga attatgctg attaiaatctggctcagtcctggcttgctgtatggcctgtaggtacagtaagacagatatattccggttattcattccctgtaaaagataatgatcctta tcgcgtcagtgaigcaactcatgatcagggcgggcctcttggtgccgaccgctgtgaaggtggctggttgtgtcagcaccgtgtgtccttcgttct caattecccaaga tttgcga gagctaccagaggta c tgc tgtatcaac caaggg atttgacaatggtgc tttgtggtttaacagag gaagc aaag gtttttatgcacaga atactaccaacagttxtataacccag acattctctgttgaagtacc tgacggaaattactgtgata tc ttaggaacalca gat cctaagagcaatccatgcggagcagacgttgtcgtaagcggcggtaaggctacctttactattcctgcaaagacagctgtggctatctgtacaga ctcagac tggtgc ggcaagggggttgatccttgtgaaagtgatccgaccggtgctgc ctgtgtttgtaagg gggaaaccaccgttaa tggtgtgt gcgtcagctggtgtaatgcgcattcatcaaatgaggaatgcacctgjgtattgaatccgaatgatgccaactgtcaggctgatattgaacctacca agggtaaactctgttacgccggtacttcaaac gggtggaaacaggatcctttâac at ataacc gtaaaacaggtttctggac tattaatctgactctt gac ggtgcaggtgataccagc ggagctc agcgc ttca aggttac agacggatgtteatggaccggaac agtttacggttcttcaggUctgccg gaaa gttggatgta aa tacatcatcaaccggcgatga acctgtgtctcttgttggtgattatgttctttecattaacgaUagacca tggaatata cat tc accaaggcagatgaagta actaatcagccacc ggttgcatcatttaccgcgacagtta acggtc tgaccgtttcttttgccaataattcatccga ccc tgagaa tga tgaattaacc tac agctggaatttcggtaa tggtaa aac atcatccgagaaagctcctagcataacctatgaagaatccggta agta tâctgttactttaaaggtta ctgattcagctaataacactgatacatttactaa agatataactgtaa cagcacc ttctagtggca agtacttaa a ggttgcagtcagaggttcgcatgataattacggaactgatctgttaaccaagaacggttctgattggaccggcgtctttgaattcttlggatccacU gtgtcgacctgcaggcgcgcgagctc

SEQ IDNO: 148

Met Ser Leu Asn Asn Phe Lys Vai Lys Leu Leu Ser Phe Ala Vai Ser Ser Ala Vai Leu Ser Leu Ala Pro Asn Leu Ala Asn Ala Ala Asn Pbe Glu Ser Glu Met Vai Ile Ile His Pro Phe Gin Trp Thr Tyr Asp Asn Ile Ala Lys Glu Cys Thr Glu Tyr Leu Gly Pro Ala Gly Phe Asp Gly Vai Gin Ile Ser Gin Pro Ala Glu His Lys Arg Ala Glu Gly Vai Trp Trp Ala Vai Tyr Gin Pro Vai Asn Tyr Lys Asn Phe Thr Thr Met Thr Gly Asn Glu Glu Gin Leu Lys Ala Met Ile Lys Thr Cys Asn Asp Ala Gly Vai Lys Vai Phe Ala Asp Ala Vai Phe Asn Gin Lys Ala Thr Asp Gly Vai Gly Trp Gly Gly Ser Thr Trp Ser Tyr Lys Asn Tyr Pro Asp Gly Phe Ser Gly Ser Asp Phe His Gly Asp Cys Ser Ile Asp Lys Ser Tyr Thr Asp Ala Asn Asn Vai Arg Thr Cys Ala Leu Ser Gly Met Pro Asp Vai Ala Thr Asp Asn Ser Ala Thr Gin Glu Lys He Ala Asp Tyr Leu Ala Ser Leu Met Asn Met Gly Vai Tyr Gly Phe Arg Ile Asp Ala Ala Lys His Met Gly Tyr Asn Asp Ile Asn Ser Ile Leu Ser Lys Thr Ala Gin Lys Thr Gly Arg Arg Pro Pro Ala Tyr Leu Glu Vai Ile Gly Ala Gly Asn Glu Ala Ala Asp Ile Gin Pro Asp Lys Tyr Thr Phe Ile Glu Asn Ala Vai Vai Thr Asp Phe Gly Tyr Vai Trp Asp Ala Asn Glu Ser Phe Gly Lys Gly Asn Tyr Gly Lys Ala Leu Glu Leu Ser Thr Trp Leu Gly Ala Asn Ser Glu Thr Phe Vai Asn Asn His Asp Asp Glu Trp Gly Arg Cys Ser Ala Gly Ser Cys Ser Met Lys Thr Gin Asn Tyr Ala Asp Tyr Asn Leu Ala Gin Ser Trp Leu Ala Vai Trp Pro Vai Gly Thr Vai Arg Gin Ile Tyr Ser Gly Tyr Ser Phe Pro Vai Lys Asp Asn Asp Pro Tyr Arg Vai Ser Asp Ala Thr His Asp Gin Gly Gly Pro Leu Gly Ala Asp Arg Cys Glu Gly Gly Trp Leu Cys Gin His Arg Vai Ser Phe Vai Leu Asn Ser Pro Arg Phe Ala Arg Ala Thr Arg Gly Thr Ala Vai Ser Thr Lys Gly Phe Asp Asn Gly Ala Leu Trp Phe Asn Arg Gly Ser Lys Gly Phe Tyr Ala Gin Asn Thr Thr Asn Ser Pro Ile Thr Gin Thr Phe Ser Vai Glu Vai Pro Asp Gly Asn Tyr Cys Asp Ile Leu Gly Thr Ser Asp Pro Lys Ser Asn Pro Cys Gly Ala Asp Vai Vai Vai Ser Gly Gly Lys Ala Thr Phe Thr Ile Pro Ala Lys Thr Ala Vai Ala Ile Cys Thr Asp Ser

86/116

Fig 16 (cont.)

Asp Trp Cys Gly Lys Gly Vai Asp Pro Cys Glu Ser Asp Pro Thr Gly Ala Ala Cys Vai Cys Lys Gly Glu Thr Thr Vai Asn Gly Vai Cys Vai Ser Trp Cys Asn Ala His Ser Ser Asn Glu Glu Cys Thr Cys Vai Leu Asn Pro Asn Asp Ala Asn Cys Gin Ala Asp Ile Glu Pro Thr Lys Gly Lys Leu Cys Tyr Ala Gly Thr Ser Asn Gly Ττρ Lys Gin Asp Pro Leu Thr Tyr Asn Arg Lys Thr Gly Phe Trp Thr He Asn Leu Thr Leu Asp Gly Ala Gly Asp Thr Ser Gly Ala Gin Arg Phe Lys Vai Thr Asp Gly Cys Ser Trp Thr Gly Thr Vai Tyr Gly Ser Ser Gly Thr Ala Gly Lys Leu Asp Vai Asn Thr Ser Ser Thr Gly Asp Glu Pro Vai Ser Leu Vai Gly Asp Tyr Vai Leu Ser He Asn Asp Lys Thr Met Glu Tyr Thr Phe Thr Lys Ala Asp Glu Vai Thr Asn Gin Pro Pro Vai Ala Ser Phe Thr Ala Thr Vai Asn Gly Leu Thr Vai Ser Phe Ala Asn Asn Ser Ser Asp Pro Glu Asn Asp Glu Leu Thr Tyr Ser Trp Asn Phe Gly Asn Gly Lys Thr Ser Ser Glu Lys Ala Pro Ser Ile Thr Tyr Glu Glu Ser Gly Lys Tyr Thr Vai Thr Leu Lys Vai Thr Asp Ser Ala Asn Asn Thr Asp Thr Phe Thr Lys Asp Ile Thr Vai Thr Ala Pro Ser Ser Gly Lys Tyr Leu Lys Vai Ala Vai Arg Gly Ser His Asp Asn Tyr Gly Thr Asp Leu Leu Thr Lys Asn Gly Ser Asp Trp Thr Gly Vai Phe Glu Phe Phe Gly Ser Thr Ser Vai Asp Leu Gin Ala Arg Glu Leu SEQID NO: 149 atgatcttaagtaattttaaggtaaaacttcttagttttgctgtgtcttetgctgtactgacactggctgcaaatgtcgccaatgccaagaattatgaaa gtgaaatggttattattcatccatttcagtggacatatgacaatatagcaaaagaatgtactgagtatctgggacctgcgggatttgacggggtgca gatttcccaggcggctgagcataaagatgccggtggtgcatggtggggtocctaccagcctgtaaacttcaagagttttactaccatggttggta atgaagaac age tta gagcaatgattaaaacc tgtaacgaggcaggtgttaaggte tttgccgatgcçgtgartaatcagaaagccggcgacgg tgtaggtatagglggttcaactttcggaaattataattatcctgacggatttaccagtgatgattttcatcataataactgcagtataggtaataattatt cagatgcatgggtagtaagattctgtgacctcagtggcatgccggatatagcaactgataacgacagtaccagaaataagattgctgattacttcg ccagccttatgaatatgggggtatacggattccgtattgatgctgccaagcactttagctatgatgatatagacgctattgtagagaaaacagcaa ccaaagcaggcaggagacctcctgtctatatggaggttatcggtaatccgggtçaagaggcggatgatatccagccgaacaagtatacatgga ttgataatgccgttgtaacag attttacttatgctaatagcatgc ataa tatttttaac ggaagcggttatgccaaggctttgaac atggggctagggc atgttgatgctgaaaatgçcgaagtctttataagtaatcatgataatgaatggggaagaaagtctgccggttcctgctcaataagaBcccagaata atccggattaccatctggctcagtccíggctcgcagtttggcctttaggcaaggttagacagatttattctgcatatcagttcccggtctttgaagata gttgtgagcgggtcagtcagcaagcccatgatcagggcggtcctatcggggcagcccgctgtgaaggtggctggttgtgtcagcaccgtgtac cgtttgtgctcaattctcctagatttgcaaga gcaaccagagggac agtcgttacta ctaaaggttttga tga cggagctttgtggtttaac agagg aagcaagggcttcta tgccca gaatactaccggcagttcta taactcatacattctcagttgaattacctga tggaaa ttactgtgata tccttggag caaccgatccgaagaataatccttgcggagcggatgtçactgtaagcggaggtaaagcaacctttaccattccggcaaagaccgccgtagcta tctgtactgatgaaaagtggtgtggcaagggggttgacccttgtgaaagcgatcciaccggttccgcctgtgtatgtaagggtgaaaccacagtt aacggcgtatgtgtflagctggtgtaatgctcactcatctaatgaagaatgtgccigtgtgctaaatcctaatgacgctgagtgtcaggccgacatt gagccgaccaagggtaaactctgctatgtagglacctccaacaagtggactcaggaacctttaacctataatcgcaagaccggtttctggactct caacgttgaacttgacggtaa gggggataccagc ggggc gcagcgctttaaagttaccgacggctgttcatggcagggtactgtttacggttca tcaggagtagaaggcagacttgacgtaaatacttcagccaccggagatgaaccggtltcactgacagglaaatatgttctttccataaatgataag accatggaatacaca ttcattcctgcaggcagtggaaacaagcc tec ggttgcgtcatttac tec gac tgttaaagatctgactgta tcttttgtcaa taattcatccgaccctgagaatgatgaartaacctacagciggaatttcggtaacggtaaaacctcatctgaaaagaatccgagtgttacatatgat aaagccggtaaatatactgtttcactcaaagtaaccgatactgcaaacaacactgataccaaaacactggaaatcgattt3acatetcctgttaacg gaaaatattccaaggttgcagtcagaggttcacatgataactacggaacaaatctgttaaccaggaatggttcagaatggaccggtatctttgaatt caguagacaaccaaattcaagcttgaagctctgcctcctgcagclgaccagtgtatcttcctcggcggtúatcgaggtgaggcattgactgcct ccggtggatttalalctcttcctgccggaagglatactataaagtttaatgaggaaagcaaggttcttactgcaggcgalgttgactgcaccggg

SEQ IDNO: 150

Met He Leu Ser Asn Phe Lys Vai Lys Leu Leu Ser Phe Ala Vai Ser Ser Ala Vai Leu Thr Leu Ala Ala Asn Vai Ala Asn Ala Lys Asn Tyr Glu Ser Glu Met Vai He Ile His Pro Phe Gin Trp Thr Tyr Asp Asn Ile Ala Lys Glu Cys Thr Glu Tyr Leu Gly Pro Ala Gly Phe Asp Gly Vai Gin Ile Ser Gin Ala Ala Glu His Lys Asp Ala Gly Gly Ala Trp Trp Gly Thr Tyr Gin Pro Vai Asn Phe Lys Ser Phe Thr Thr Met Vai Gly Asn Glu Glu Gin Leu Arg Ala Met Ile Lys Thr Cys Asn Glu Ala Gly Vai Lys Vai Phe Ala Asp Ala Vai Ile Asn Gin Lys Ala Gly Asp Gly Vai Gly Ile Gly Gly Ser Thr Phe Gly Asn Tyr Asn Tyr Pro Asp Gly Phe Thr Ser Asp Asp Phe His His Asn Asn Cys Ser Ile Gly Asn Asn

87/116

Fig 16 (cont.)

Tyr Ser Asp Ala Trp Vai Vai Arg Phe Cys Asp Leu Ser Gly Met Pro Asp Ile Ala Thr Asp Asn Asp Ser Thr Arg Asn Lys Ile Ala Asp TyT Phe Ala Ser Leu Met Asn Met Gly Vai Tyr Gly Phe Arg He Asp Ala Ala Lys His Phe Ser Tyr Asp Asp Ile Asp Ala lie Vai Glu Lys Thr Ala Thr Lys Ala Gly Arg Arg Pro Pro Vai Tyr Met Glu Vai He Gly Asn Pro Gly Gin Glu Ala Asp Asp Ile Gin Pro Asn Lys Tyr Thr Trp Ile Asp Asn Ala Vai Vai Thr Asp Phe Thr Tyr Ala Asn Ser Met His Asn Ile Phe Asn Gly Ser Gly Tyr Ala Lys Ala Leu Asn Met Gly Leu Gly His Vai Asp Ala Glu Asn Ala Glu Vai Phe He Ser Asn His Asp Asn Glu Trp Gly Arg Lys Ser Ala Gly Ser Cys Ser Ile Arg Thr Gin Asn Asn Pro Asp Tyr His Leu Ala Gin Ser Tip Leu Ala Vai Trp Pro Leu Gly Lys Vai Arg Gin lie Tyr Ser Ala Tyr Gin Phe Pro Vai Phe Glu Asp Ser Cys Glu Arg Vai Ser Gin Gin Ala His Asp Gin Gly Gly Pro Ile Gly Ala Ala Arg Cys Glu Gly Gly Trp Leu Cys Gin His Arg Vai Pro Phe Vai Leu Asn Ser Pro Arg Phe Ala Arg Ala Thr Arg Gly Thr Vai Vai Thr Thr Lys Gly Phe Asp Asp Gly Ala Leu Trp Phe Asn Arg Gly Ser Lys Gly Phe Tyr Ala Gin Asn Thr Thr Gly Ser Ser Ile Thr His Thr Phe Ser Vat Glu Leu Pro Asp Gly Asn Tyr Cys Asp Ile Leu Gly Ala Thr Asp Pro Lys Asn Asn Pro Cys Gly Ala Asp Vai Thr Vai Ser Gly Gly Lys Ala Thr Phe Thr Ile Pro Ala Lys Thr Ala Vai Ala He Cys Thr Asp Glu Lys Trp Cys Gly Lys Gly Vai Asp Pro Cys Glu Ser Asp Pro Thr Gly Ser Ala Cys Vai Cys Lys Gly Glu Thr Thr Vai Asn Gly Vai Cys Vai Ser Trp Cys Asn Ala His Ser Ser Asn Glu Glu Cys Ala Cys Vai Leu Asn Pro Asn Asp Ala Glu Cys Gin Ala Asp Ile Glu Pro Thr Lys Gly Lys Leu Cys Tyr Vai Gly Thr Ser Asn Lys Tip Thr Gin Glu Pro Leu Thr Tyr Asn Arg Lys Thr Gly Phe Trp Thr Leu Asn Vai Glu Leu Asp Gly Lys Gly Asp Thr Ser Gly Ala Glu Arg Phe Lys Vai Thr Asp Gly Cys Ser Trp Gin Gly Thr Vai Tyr Gly Ser Ser Gly Vai Glu Gly Arg Leu Asp Vai Asn Thr Ser Ala Thr Gly Asp Glu Pro Vai Ser Leu Thr Gly Lys Tyr Val Leu Ser Ile Asn Asp Lys Thr Met Glu TyT Thr Phe Ile Pro Ala Gly Ser Gly Asn Lys Pro Pro Vai Ala Ser Phe Thr Pro Thr Vai Lys Asp Leu Thr Vai Ser Phe Vai Asn Asn Ser Ser Asp Pro Glu Asn Asp Glu Leu Thr Tyr Ser Trp Asn Phe Gly Asn Gly Lys Thr Ser Ser Glu Lys Asn Pro Ser Vai Thr Tyr Asp Lys Ala Gly Lys Tyr Thr Vai Ser Leu Lys Vai Thr Asp Thr Ala Asn Asn Thr Asp Thr Lys Thr Leu Glu Ile Asp Leu Thr Ser Pro Vai Asn Gly Lys Tyr Ser Lys Vai Ala Vai Arg Gly Ser His Asp Asn Tyr Gly Thr Asn Leu Leu Thr Arg Asn Gly Ser Glu Trp Thr Gly Ile Phe Glu Phe Ser Lys Thr Thr Lys Phe Lys Leu Glu Ala Leu Pro Pro Ala Ala Asp Gin Cys Πβ Phe Leu Gly Gly Asn Arg Gly Glu Ala Leu Thr Ala Ser Gly Gly Phe He Ser Leu Pro Ala Gly Arg Tyr Thr Πβ Lys Phe Asn Glu Glu Ser Lys Vai Leu Thr Ala Gly Asp Va] Asp Cys Thr Gly

SEQIDNO: 151 atgaaaaclattctttcaaçaatcatggtgatggcggctgcggctgceaccaccglagaggctcaaggctggccggaaaactacggçggcgtc atgttgcagggattctactgggatlcctattcagccaccaagtggactaaactggaagcacaggctgacgagatctgcaactatttctcgctggta tgggta'ccacagtcggcciataccggcagcagtacctccatgggctacgacccgctgtattacttcgaccagcattcatcgttcggcacegaag agca gctac ggtcgttcatcagtacctacaagcagaaaggaactggcatcatagccgatgtagttgtcaatcaccgaaagaatgtctcaa ac tg ggtggatttcccggccgagacctacaacggtgtaaectatcagatggtaagcaccgacatcgtttcgaacgatgacggcggaaaaacagcca cttgggcaaatcaaaacggctacagtctctcctccaatgccgacgaaggcgaaggctgggacggcatgcgcgacctggaccacaagtcgca gaacgtgc agaaa tcggttcttgcctacaccaaatatctggttgacgacttaggc ta taccggattcc gctac gatatggtaa agggatttga cgg atcgcatgiagccgactacaacacc&atgccggcgtgcagttctctgtcggcgaatattgggacggcactgcatcgaaagtttacagttggatca acagcaccaaaaagagcgutgtgcegcagtcggcagccttcgacttcgctuccgatacacctgccgcgatgccgtcaacaacaagaactgg gcgaacctgaagaacacttccggtatcagcgatgccgattacaggcgctattcggttacgtttgttgaaaatcacgatacggaataccgttcagct acggcttcccaggatcccatcaagggtgatacggttgccctcaatgcctggatgctggctatgccgggcacaccttgtgttttcctgaaacattgg accgactgcaaggaagagatcaagaatctcatcgaggcacgtcgcctggtcggtattcacaaccagagcacctatgccgaatggatgagcgg tgcagcctacatcggacgtaccgtaacaggtacgaacggcaccttacgtgttctgtgcggctcttatcagtataatgtagccgccaactacattca gattctctcaggcaaaaactataaatactacgtactcaacacgctcgaggctccctggatcgggaaaggttccggctcgtacaccgaaggtgaa accgtaacggttccgctcatcgccatatcggccgatgccaatgccaagctggtatataccaccgacggcacagaccccaccgcaacctcaaca gccgtaaccagcggaacggaactgaccatcacttcggacgccgtcctgaaggttggtctgctttccggcggcatcgtcaggaacatacagagc cgtacattcaccttccaggctgcaaacacctccgagtattacacagccaccatgcacgtatgcaaccagtccggagctctcaatccgctgtttgc ctatgtttgggcaggaccggacaacgagcagattaacggcaactggccgggcaccaagctcaccgciaccattaccgaaaacaaccttacct

88/116

Fig ló(cont) ggtacacgcagtcgttccagattccgaagaacgtggactatgtcgtgaactttgttttcaccacaaccggcggcggtacgcagacagtggatgtl accggcatga aggc cgatgtctggtacattattaacagtaccaagagcggcaac3agtacacggtaac cgac grtacc tcacagtancttc gtt agaggccatctttgatgaagaaaactccggctccttccclgíctatgacctgcagggacgccgcgtcagcgaaatiagaaacaggacaattatat cttcagaacggaaagaagatactcatcagataaacagaggttccgaaccattctcctattatgaaaatcagacacttagtaatctcagcactgctg ggtttggggggcttgtacaccatcagctgctcctcgtcggg

SEQIDNO: 152

Met Lys Thr Ile Leu Ser Thr Ile Met Vai Mel Ala Ala Ala Ala Ala Thr Thr Vai Glu Ala Gín Gly Trp Pro Glu Asn Tyr Gly Gly Vai Met Leu Gin Gly Phe Tyr Trp Asp Ser Tyr Ser Ala Thr Lys Trp Thr Lys Leu Glu Ala Gin Ala Asp Glu He Cys Asn Tyr Phe Ser Leu Vai Trp Vai Pro Gin Ser Ala Tyr Thr Gly Ser Ser Thr Ser Met Gly Tyr Asp Pro Leu Tyr Tyr Phe Asp Gin His Ser Ser Phe Gly Thr Glu Glu Gin Leu Arg Ser Phe Ile Ser Thr Tyr Lys Gin Lys Gly Thr Gly Ile Ile Ala Asp Vai Vai Vai Asn His Arg Lys Asn Vai Ser Asn Trp Vai Asp Phe Pro Ala Glu Thr TyT Asn Gly Vai Thr Tyr Gin Met Vai Ser Thr Asp Ile Vai Ser Asn Asp Asp Gly Gly Lys Thr Ala Thr Trp Ala Asn Gin Asn Gly Tyr Ser Leu Ser Ser Asn Ala Asp Glu Gly Glu Gly Trp Asp Gly Met Arg Asp Leu Asp His Lys Ser Gin Asn Vai Gin Lys Ser Vai Leu Ala Tyr Thr Lys Tyr Leu Vai Asp Asp Leu Gly Tyr Thr Gly Phe Arg Tyr Asp Met Vai Lys Gly Phe Asp Gly Ser His Vai Ala Asp Tyr Asn Thr Asn Ala Gly Vai Gin Phe Ser Vai Gly Glu Tyr Trp Asp Gly Thr Ala Ser Lys Vai Tyr Ser Tip Ile Asn Ser Thr Lys Lys Ser Asp Vai Pro Gin Ser Ala Ala Phe Asp Phe Ala Phe Arg Tyr Thr Cys Arg Asp Ala Vai Asn Asn Lys Asn Trp Ala Asn Leu Lys Asn Thr Ser Gly Ile Ser Asp Ala Asp Tyr Arg Arg Tyr Ser Vai Thr Phe Vai Glu Asn Hís Asp Thr Glu Tyr Arg Ser Ala Thr Ala Ser Gin Asp Pro Ile Lys Gly Asp Thr Vai Ala Leu Asn Ala Trp Met Leu Ala Met Pro Gly Thr Pro Cys Vai Phe Leu Lys His Trp Thr Asp Cys Lys Glu Glu Ile Lys Asn Leu lie Glu Ala Arg Arg Leu Vai Gfy lie His Asn Gin Ser Thr Tyr Ala Glu Trp Met Ser Gly Ala Ala Tyr Ile Gly Arg Thr Vai Thr Gly Thr Asn Gly Thr Leu Arg Vai Leu Cys Gly Ser Tyr Gin Tyr Asn Vai Ala Ala Asn Tyr lie Gin Ile Leu Ser Gly Lys Asn Tyr Lys Tyr Tyr Vai Leu Asn Thr Leu Glu Ala Pro Trp Ile Gly Lys Gly Ser Gly Ser Tyr Thr Glu Gly Glu Thr Vai Thr Vai Pro Leu Ile Ala He Ser Ala Asp Ala Asn Ala Lys Leu Vai Tyr Thr Thr Asp Gly Thr Asp Pro Thr Ala Thr Ser Thr Ala Vai Thr Ser Gly Thr Glu Leu Thr lie Thr Ser Asp Ala Vai Leu Lys Vai Gly Leu Leu Ser Gly Gly Ile Vai Arg Asn Ile Gin Ser Arg Thr Phe Thr Phe Gin Ala Ala Asn Thr SeT Glu TyT Tyr Thr Ala Thr Met His Vai Cys Asn Gin Ser Gly Ala Leu Asn Pro Leu Phe Ala Tyr Vai Trp Ala Gly Pro Asp Asn Glu Gin He Asn Gly Asn Trp Pro Gly Thr Lys Leu Thr Ala Thr Ile Thr Glu Asn Asn Leu Thr Trp Tyr Thr Gin Ser Phe Gin lie Pro Lys Asn Vai Asp Tyr Vai Vai Asn Phe Vai Phe Thr Thr Thr Gly Gly Gly Thr Gin Thr Vai Asp Vai Thr Gly Met Lys Ala Asp Vai Trp Tyr Ile Ile Asn Ser Thr Lys Ser Gly Asn Lys Tyr Thr Vai Thr Asp Vai Thr Ser Gin Tyr Ser Ser Leu Glu Ala Ile Phe Asp Glu Glu Asn Ser Gly Ser Phe Pro Vai Tyr Asp Leu Gin Gly Arg Arg Vai Ser Glu Ile Arg Asn Arg Thr Ile Ile Ser Ser Glu Arg Lys Glu Asp Thr His Gin Ile Asn Arg Gly Ser Glu Pro Phe Ser Tyr Tyr Glu Asn Gin Thr Leu Ser Asn Leu Ser Thr Ala Gly Phe Gly Gly Leu Vai His His Gin Leu Leu Leu Vai Gly

SEQ ID NO: 69 atgttgaa a aggattacggtagtctgtttattgtttattttgctttttcctaatatatalgagggaaalaaggcagaagc a gcaacagtgaacaatgga acattaatgcagtatttlgagtggtacgciccgaatgatgggaatcattggaatcgtttgcgttccgatgctgaaagtttagcicauaaggaatcac atctgtatggalaccacctgcatataaagggac ttcgcaaa atgatgtagggta tggggc c tatgatrta latgattta ggggagtic aa tcaaaaa ggaacggtgcggacgaaatatgggacaaaagcacagrtgaaatctgcaattgacgctttacataagcaaaacatcgacgiatacggtgatgtag ttatgaaicataaaggtggggctgattatactgaaaccgtaacagctgttgaggtagaccgtaacaatcgaaatattgaagtatcaggtgattatca aattagtgcatggac ggggtttaattttccagggcgc gga ga tgctta ttc taatttcaaatgga aa tggta tcattttgacggaac ggattgggatg aaggaaggaaattaaatcgaatrtataaarttaggggtgtagataaagcgtgggattgggaagtgtctagcgaaaatggaaartatgattatttgat gtatgcagatcttgattttgatca tc ctgatgttgc ga atgagatgaaa aattgggga acatggtalgc ga atga attaaattta gat ggctttc gttt ggacgclgttaaacatattgatcatgaatatttacgcgatigggtaaatcalgccagacagcaaacggggaaagaaatgtttacagtagctgaata ttggca aaa tgatgrtc aggctttaaacaa ttatttagcgaaagtca attataatc aatc tgtgtttgatgc a ccgcttca ttacaattttcattatgcttc

89/116

Fig 16 (cont.) aacaggaaatgggaattatgatatgagaaatattttaaatggaacagtaatgaaaaatcaccctgcactcgcagttacietcgttgagaatcatgat tctcagcctgggcagtcattggaatctgtagtaagtccgtggtttaagccgctggcatatgcatttattttaactcgtgcagagggctatccttcagtt ttctatggtgattactatgggacaagcggaaatagtagttatgaaattccagcgttaaaagataaaattgatccaattrtgacggcacgaaaaaactt tgcatatggtacgcagcgtgaüatttagaccatccagatgtgattggctgg3Caagagaaggcgatggtgtacatgctaattctggtttagcgac attactctcggacggaccaggaggatcaaagtggatggatgttggaaagaataacgctggggaagtatggtacgatattacgggtaatcaaac aaa tac tgtaacaa ttaataaggacggatgggggcagttctatgtaagtggcggc tca gtttccatatatgttca gcggtaa

SEQ ID NO: 70

Met Leu Lys Arg He Thr Vai Vai Cys Leu Leu Phe Ile Leu Leu Phe Pro Asn He Tyr Glu Gly Asn Lys Ala Glu Ala Ala Thr Vai Asn Asn Gly Thr Leu Met Gin Tyr Phe Glu Trp Tyr Ala Pro Asn Asp Gly Asn His Trp Asn Arg Leu Arg Ser Asp Ala Glu Ser Leu Ala His Lys Gly Ile Thr Ser Vai Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Lys Ser Ala Ile Asp Ala Leu His Lys Gin Asn Ile Asp Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Thr Vai Thr Ala Vai Glu Vai Asp Arg Asn Asn Arg Asn Ile Glu Vai Ser Gly Asp Tyr Gin ile Ser Ala Trp Thr Gly Phe Asn Phe Pro Gly Arg Gly Asp Ala Tyr Ser Asn Phe Lys Trp Lys Trp Tyr His Phe Asp Gly Thr Asp Trp Asp Glu Gly Arg Lys Leu Asn Arg Ile Tyr Lys Phe Arg Gly Vai Asp Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Phe Asp His Pro Asp Vai Ala Asn Glu Met Lys Asn Trp Gly Thr Trp Tyr Ala Asn Glu Leu Asn Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Asp His Glu Tyr Leu Arg Asp Trp Vai Asn His Ala Arg Gin Gin Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Gin Asn Asp Vai Gin Ala Leu Asn Asn Tyr Leu Ala Lys Vai Asn Tyr Asn Gin Ser Vai Phe Asp Ala Pro Leu His Tyr Asn Phe His Tyr Ala Ser Thr Gly Asn Gly Asn Tyr Asp Met Arg Asn Ile Leu Asn Gly Thr Vai Met Lys Asn His Pro Ala Leu Ala Vai Thr Leu Vai Glu Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Vai Vai Ser Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Thr Arg Ala Glu Gly Tyr Pro Ser Vai Phe Tyr Gly Asp Tyr Tyr Gly Thr Ser Gly Asn Ser Ser Tyr Glu Ile Pro Ala Leu Lys Asp Lys Ile Asp Pro Ile Leu Thr Ala Arg Lys Asn Phe Ala Tyr Gly Thr Gin Arg Asp Tyr Leu Asp Hís Pro Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Gly Vai His Ala Asn Ser Gly Leu Ala Thr Leu Leu Ser Asp Gly Pro Gly Gly Ser Lys Tip Met Asp Vai Gly Lys Asn Asn Ala Gly Glu Vai Tip Tyr Asp Ile Thr Gly Asn Gin Thr Asn Thr Vai Thr Ile Asn Lys Asp Gly Trp Gly Gin Phe Tyr Vai Ser Gly Gly Ser Vai Ser Ile Tyr Vai Gin Arg

SEQ IDNO: 153 ttgccttcaattaatgcaagcgattgcaaaaaaaagggagataggagtatgaagaggaaaaaatggactgcgttagcactatctttaccactagtt atgagcttatcaacaaacatacaagcagaaacattacataataataagggtcaaaaggcgcaaacaggaaataaagacggaattttttatgaact gtatgttaatictttttaLgatactgatagcaatggacatggtgatttaaaaggcgtcacaaagaaacttgattatttaaatgatggaaatccaagaac aaataatgatcttcaaauaacggiatclggatgatgcctattaacaçctctcctagttatcacaaatatgaxgtaacagattactataatatcgatcct cagtatggaagtttacaagatttccgtgaactaacaacagaagcgcalaaacgcaacgtaaaggtagtaatagatcttgttattaatcatacaagc agtgagcatccttggtttgtcgatgcattaaaaaataaaaacagtaagtatcgagattactatatttgggctgataaaaatacagacttaaatgaaaa aggcccatggggtcaacaagtatggcacaaagcgtcgaacggagagtatttctacgcaacgttctgggaagggatgccggacttaaactatga caaccctaaagtaagagaagaaatgattaaaatcgggaaatttiggctcaaacaaggagctgatggctttcgtctagatgcagccatgcacatctt taaagggcaaacacctgaaggagcaaagaaaaatattgaatggtggaatgaattccgcgacgcgatgagagaaacgaatccaaatacgtalct a gttggtgaaalatgggatcaaccagaagtagttgctccgtatta tcaatcgttagattc taca tttaacttcgacttag cata taaaatcgttaa ttcc gttaa aaa tggtactgatcaaggggtagc cgcggcagctgttgcaacggatgagtta tataaaacatata atccaaata aaa ttgatggaa cgttt ttaacgaatcatgaccaaaatcgtgtaatgagtgagttaaatggtgatgtaaacaaagcaaaatcagcagcctctattctgttgacactccctggta atccgticatttattatggcgaagaaaícggcaigacaggccaaaaaccagatgagttgattcgtgagcctttccgttggtatgaagatgataaag aaggtcaaacgagctgggagactccagtatataacattgatcataatggtgtrtcagttgaagcacaagataaacaaaaagcttctcttctaagcc attatcgtaaa at gattcgtgttcgtcagcaacac gatgaacttgtc aaaggtaatttagaacctatttctgtcaataatt caca ggttgttgc ctata at cgtacgtataaaaataaatcaattcaagtgtaccataatatttcagacaagccggttacattaactgtttcaaacaaaggaaaactgattttttctagt gaattaggagcaaaaaaggaaaaatcaacattagtaattccagcgaalacgacagtgctagtaaagtaa

Figi 16 (cont.)

90/116

SEQIDNO: 154

Met Pro Ser Ile Asn Ala Ser Asp Cys Lys Lys Lys Gly Asp Arg Ser Met Lys Arg Lys Lys Trp Thr Ala Leu Ala Leu Ser Leu Pro Leu Vai Met Ser Leu Ser Thr Asn De Gin Ala Glu Thr Leu His Asn Asn Lys Gly Gin Lys Ala Gin Thr Gly Asn Lys Asp Gly He Phe Tyr Glu Leu Tyr Vai Asn Ser Phe Tyr Asp Thr Asp Ser Asn Gly His Gly Asp Leu Lys Gly Vai Thr Lys Lys Leu Asp Tyr Leu Asn Asp Gly Asn Pro Arg Thr Asn Asn Asp Leu Gin Ile Asn Gly De Trp Met Met Pro Ile Asn Thr Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn íle Asp Pro Gin Tyr Gly Ser Leu Gin Asp Phe Arg Glu Leu Thr Thr Glu Ala His Lys Arg Asn Vai Lys Vai Vai íle Asp Leu Vai lie Asn His Thr Ser Ser Glu His Pro Trp Phe Vai Asp Ala Leu Lys Asn Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Pro Trp Gly Gin Gin Vai Trp His Lys Ala Ser Asn Gly Glu Tyr Phe Tyr Ala Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Lys Vai Arg Glu Glu Met Ile Lys Ile Gly Lys Phe Trp Leu Lys Gin Gly Ala Asp Gly Phe Arg Leu Asp Ala Ala Met His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Glu Trp Trp Asn Glu Phe Arg Asp Ala Met Arg Glu Thr Asn Pro Asn Thr Tyr Leu Vai Gly Glu Ile Trp Asp Gin Pio Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Thr Phe Asn Phe Asp Leu Ala Tyr Lys Re Vai Asn Ser Vai Lys Aso Gly Thr Asp Gin Gly Vai Ala Ala Ala Ala Vai Ala Thr Asp Glu Leu Tyr Lys Thr Tyr Asn Pro Asn Lys Ile Asp Gly Thr Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Asn Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Phe lie Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Gin Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Asp Asp Lys Glu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Ile Asp His Asn Gly Vai Ser Vai Glu Ala Gin Asp Lys Gin Lys Ala Ser Leu Leu Ser His Tyr Arg Lys Met Ile Arg Vai Arg Gin Gin His Asp Glu Leu Vai Lys Gly Asn Leu Glu Pro Ile Ser Vai Asn Asn Ser Gin Vai Vai Ala Tyr Asn Arg Thr Tyr Lys Asn Lys Ser He Gin Vai Tyr His Asn Ile Ser Asp Lys Pro Vai Thr Leu Thr Vai Ser Asn Lys Gly Lys Leu Ile Phe Ser Ser Glu Leu Gly Ala Lys Lys Glu Lys Ser Thr Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Vai Lys

SEQIDNO: 155 gtgtcaagaatgtttgcaaaacgattcaaaacctctttactgccgttattcgctggatttttattgctgtttcatttggttctggcaggaccaacggctg cgaatgctgaaacggctaacaaatcaaatgagcttacagcaccgtcgatcaaaagcggaaccattcttcatgcttggaattggtcgttcaatacgt taaaacacaatatgaaggatattcatgatgcaggatatacagcgattcagacgtctccgattaaceaagtçaaggaagggaaccaaggaaataa aaacatgtcgaactggtac tggctctatca gccgacatcgtaccaaattggcaaccgttactta ggtactgaacaagaatttaa agaaatgtgtgc agcc gctgaagaatatggcataaaggttattgttgacgcggtcatcaatcata ccaccagtgactatgcc gcgatttcc aatga gattaagagta tt:

ccaaactggacacatggaaacacacaaattaaaaactggtctgatcgatgggalgtcacgcagaatgcattgctcgggctgtatgactggaata cac aaaa tacacaagtacagtcctatttgaaacggttcttagaaa gagcattgaatgacggggcagacggttttc gatttgatgccgccaaacata tagagcttccggatgatggcagttacggcagtcãattttggccgaatatcacaaatacatctgcagagttccaatacggagaaatcctgcaggat agtgc ttcaagagatgcttcatatgcgaattatatgaatgtgacagcgtctaactatgggca ttc c ataaggtc cgctttaaaga ate gtaatctggg cgtgtcgaatatctcccactatgcatcagatgtgtctgcggacaagctagtgacatgggtagaatcgcatgalacgtatgccaatgatgatgaag agtcgacatggatgagcgatgaigatalccgtttaggctgggcggtgatagcrtctegtteaggcagtacgcctcttttcttttccagacctgaggg uggcggaaatggtgtgagattcccggggaaaagccaaataggcgatcgcgggagtgctttatttgaagatcaggctatcactgcggtcaatag atttcacaatgtgatggctggacagcctgaggaactcicgaacccaaatggaaacaaccagatatttatgaatcagcgcggctcacatggcgttg tgctggcaaatgcaggttcatcclctgtttctatcaatacgccaacaaaattgcctgatggcaggtatgataaiaaagctggggcaggttcatttca agtaaalgacggtaaactgacaggcacgatcaatgccaggtctgtggctgtgctttatcclgatgauttgcaaaagcgcctcatgttttccttgag aattacaaaacaggtgtaacacattctttcaatgatcaactgacgattacactgcgtgcagatgcgaatacaacaaaagccgtttatcaaatcaata atggaccagagacggcgtttaaggatggagatcaattcacaatcggaaaaggagatccatttggc aaaa ca taca ccatcatgttaaaaggaac gaacagtgatggtgtaacgaggaccgaggaatacagttttgttaaaagagatccagcttcggccaaaaccalcggctatcaaaatccgaatcatt ggagccaggtaaatgcttatatctataaacatgatgggggccgggca

SEQID NO: 156

91/116

Fig 16 (cont.)

Vai Ser Arg Met Phe Ala Lys Arg Phe Lys Thr Ser Leu Leu Pro Leu Phe Ala Gly Phe Leu Leu Leu Phe His Leu Vai Leu Ala Gly Pro Thr Ala Ala Asn Ala Glu Thr Ala Asn Lys Ser Asn Glu Leu Thr Ala Pro Ser 1 le Lys Ser Gly Thr IIe Leu His Ala Trp Asn Tip Ser Phe Asn Thr Leu Lys His Asn Met Lys Asp lie His Asp Ala Gly Tyr Thr Ala He Gin Thr Ser Pro Ile Asn Gin Vai Lys Glu Gly Asn Gin Gly Asn Lys Asn Met Ser Asn Trp Tyr Trp Leu Tyr Gin Pro Thr Ser Tyr Gin Ile Gly Asn Arg Tyr Leu Gly Thr Glu Gin Glu Phe Lys Glu Met Cys Ala Ala Ala Glu Glu Tyr Gly Ile Lys Vai Ile Vai Asp Ala Vai Ile Asn His Thr Thr Ser Asp Tyr Ala Ala He Ser Asn Glu Ile Lys Ser Ile Pro Asn Trp Thr His Gly Asn Thr Gin He Lys Asn Trp Ser Asp Arg Trp Asp Vai Thr Gin Asn Ala Leu Leu Gly Leu Tyr Asp Trp Asn Thr Gtn Asn Thr Gin Vai Gin Ser Tyr Leu Lys Arg Phe Leu Glu Arg Ala Leu Asn Asp Gly Ala Asp Gly Phe Arg Phe Asp Ala Ala Lys His Ile Glu Leu Pro Asp Asp Gly Ser Tyr Gly Ser Gin Phe Trp Pro Asn Ile Thr Asn Thr Ser Ala Glu Phe Gin Tyr Gly Glu Ile Leu Gin Asp Ser Ala Ser Arg Asp Ala Ser Tyr Ala Asn Tyr Met Asn Vai Thr Ala Ser Asn Tyr Gly His Ser Ile Arg Ser Ala Leu Lys Asn Arg Asn Leu Gly Vai Ser Asn Ile Ser His Tyr Ala Ser Asp Vai Ser Ala Asp Lys Leu Vai Thr Trp Vai Glu Ser His Asp Thr Tyr Ala Asn Asp Asp Glu Glu Ser Thr Trp Met Ser Asp Asp Asp Ile Arg Leu Gly Trp Ala Vai Ile Ala Ser Arg Ser Gly Ser Thr Pro Leu Phe Phe Ser Arg Pro Glu Gly Gly Gly Asn Gly Vai Arg Phe Pro Gly Lys Ser Gin Ile Gly Asp Arg Gly Ser Ala Leu Phe Glu Asp Gin Ala Ile Thr Ala Vai Asn Arg Phe His Asn Vai Met Ala Gly Gin Pro Glu Glu Leu Ser Asn Pro Asn Gly Asn Asn Gin Ile Phe Met Asn Gin Arg Gly Ser His Gly Vai Vai Leu Ala Asn Ala Gly Ser Ser Ser Vai Ser Ile Asn Thr Pro Thr Lys Leu Pio Asp Gly Arg Tyr Asp Asn Lys Ala Gly Ala Gly Ser Phe Gin Vai Asn Asp Gly Lys Leu Thr Gly Thr lie Asn Ala Arg Ser Vai Ala Vai Leu Tyr Pro Asp Asp Ile Ala Lys Ala Pro His Vai Phe Leu Glu Asn Tyr Lys Thr Gly Vai Thr His Ser Phe Asn Asp Gin Leu Thr Ile Thr Leu Arg Ala Asp Ala Asn Thr Thr Lys Ala Vai Tyr Gin Ile Asn Asn Gly Pro Glu Thr Ala Phe Lys Asp Gly Asp Gin Phe Thr Ile Gly Lys Gly Asp Pro Phe Gly Lys Thr Tyr Thr Ile Met Leu Lys Gly Thr Asn Ser Asp Gly Vai Thr Arg Thr Glu Glu Tyr Ser Phe Vai Lys Arg Asp Pro Ala Ser Ala Lys Thr He Gly Tyr Gin Asn Pro Asn His Trp Ser Gin Vai Asn Ala Tyr He Tyr Lys His Asp Gly Gly Arg Ala

SEQ ID NO: 157 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagcaítagctctaacactgccgctggctgctagcttatca acaggcgttcacgccgaaaccgtacataaaggtaaagctccaacagcagataaaaacggtgtcttttatgaggtgtatgtaaactctttttacgat gca aataa agatggacatggtga tltaa aaggtcttacacaaaagc tggattatttgaaigacggc aattctcataccaaaaatgatcttcaagtaa ac ggaatttggatgatgccggtaaacccttctcctagcta tcata aatatgatgtaacggacta tta taacattgatccgcagtacggaaatctgca agattttcgcaagctgatgaaagaagcagataaacgagacgtaaaggttattatggacctcgttgtgaatcatacaagcagtgaacatccttggtt tcaagctgcattaaaagalaaaaacagcaagtacagagattâctatatttgggccgataaaaatactgatttaaatgaaaaaggatcttgggggca gcaagtatggcataaagctccaaacggagagtatttttatggtacgttttgggaaggaatgc ctgaç ttaa attac gataatcccgaagtaagaaa a gaaatgattaacgtcgggaaattttggctaaagcaa ggc gttgacgggttccgctta gatgctgcgc Itcatatttttaaaggtcaa aca cctgaa ggcgctaagaaaaatatcgt gtggtggaa tgagttta ga gatgcaatgaaaaaagaaaaccc taacgtata tctaacgggtgaagtatgggatc aacc ggaagtagtagctccttactatcaatc gcttgattctttattlaactttgatttagcaggaaagattgtaaac tctgtaaaa tcaggaaatgatca a ggaatcgcgactgcagcagccgcaactgatgagctgticaaatcatacaatccaaataaaattgac ggcattttctta accaa c catgac caaa atcgcgtcatgagtgagctaagcggcgatgtgaataaagcaaagtcagctgcctctatcttacttacgcttcctggcaacccgtatatttattacgg tgaagaaattggaatgaccggtgaaaagcctgatgagttaatccgtgaaccgttccgctggtacgaaggcaatggacttggacaaaccagctg ggaaacatcc gta taca acaaaggcggcaatggtgtgtcagtagagacacaaacaaaacaaaaggattctttgttaaaicattaccgtgaaatga ttcgcgtgcgtcagcagcalgaagagttagtaaaaggaacccttcaatctatttcagtagacagtaaagaagtcgttgcctatagccgcacgtata aaggcaaatcgattagcgtgtalcataatattlcaaatcaaccggtaaaagtatclgtaacagcgaaaggtaaattgatttttgctagtgaaaaaggt gcaaaaaaagtcaaaaatcagcttgtggtlccagctaatacaacggttttaalaaaataa

SEQIDNO: 158

Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Va'l Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His • · *

Fig 16 (cont)

92/116

Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu GIn Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai He Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr He Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Va] Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His lie Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Vai Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Va] Asn Ser Vai Lys Ser Gly Asn Asp Gin Gly He Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly He Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Ser Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Thr Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Thr Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Vai Pro Ala Asn Thr Thr Vai Leu He Lys

SEQ IDNO: 159 ttgcaaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatcaacaggçgttc acgccgaaaccgtacatoaaggtaaatctccaacagcagataaaaacggtgtattttatgaggtgtatgiaaactctttttacgatgcaaataaaga tggac atggtgatttaaaa ggtcttaca caaaagttggattatttaaatgatggcaattctcatacaaagaa tgatcttcaagtaaac gggatttggat gatgccggtcaacccttctcc ca gctatcataaa tatgatgtaac ggactattataatattgatccgcagtalggaaatctgcaagattttcgcaaac tgatgaaagaagc agata a ac gagatgtaaaagtcattatggacctcgttgtgaatcatac gagcagtgaacacccttggtttca agctgca ttaa aa gataaaaacagcaagtaca gag atta cta tatctgggctgataaaaataccgacttgaa tgaaaaagga tcttggggac agcaagtatggca taa agctcca aacggagagtatttttacggaacgttttgggaaggaatgccggac ttaaattacgata a tcctgaagtaagaaaagaaatgattaa cgtaggaaagttttggctaaagcaaggagltgatgggttccgtctagatgctgcgcttcatatttttaaaggccaaacacctgaaggcgctaagaa aaatctcctgtggtggaatgaa tttaga gatgcaatgaaaaaggaa aaccctaacgtatatctaacgggjgaagta tggga tca accggaa gta gtagctccttacta tca ate gc ttgattctttatttaactttgatttagc aggaaagattgtaaactc tgtaaaa tcagga aa tga tcaagga ate gega ctgca gcagcggca acgga tgaactgtlcaaatcatacaatccaaataaaattgacggtattttc ttaacca accat gaccaaaatcgcgtc atga gtgagctaaac ggcgatgtgaataaagc aaagtcagctgcctctatcttactta cgcttcctg gcaacccgtatatttattac ggtgaagaaatcgg catgaccggtgaaaagcctgatgagttaatccgtgaaccgttcccctggtacgaaggaaacggacttggacaaaccagctgggaaacacctgt a tata acaaaggc ggcaacggc gtgtctgtagaagcacaaacaaaacaaaaggactctttgttaaa tcattac c gtgaaa tgattege gtgcgtc agcagcacgaagagttagtaaaaggaacgctlcaatctatttcagtagacagtaaagaagtcgttgcctatagccglacgtataaaggcaaatcg attagcgtgtatcataatatttcaaatcaaccggtaaaagtatctgtagcagcaaaaggtaaattgatttttgcta£tgaaaaaggtgctaagaaagt caaaaatcagcttgtgattccggcgaatacaacggttttaataaaataa

SEQIDNO: 160

Met Gin Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai He Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe GIn Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr lie Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Tip His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr

Fig ] 6 (cont)

93/116

Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Asn Ser Vai Lys SeT Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Asn Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Pro Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser lie Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Ile Lys SEQID NO: 161 gtggatccaaaga attgtagtc aatttatgcaaacgattgcaaaa aaaggggatga aacga tgaaaggga aaaaatgga ca gctttagctctaa cactgccgclggctgctagcttatcaacaggtgttcacgccgaaaccgíacataaaggtaaagctccaacagcagataaaaacggtgtcttttat gaggtatatgtaaactctttttacgatgcaaataaagalggacatggtgatttaaaaggccttacacaaaagttggactatttaaatgacggaaattc tcaiacaaagaatgatcttcaagtaaacgggatttggatgatgccggtcaacccttctcctagctatcataaatatgatgtaacggactattataatat tgatccgcagtatggaaatctgcaagattttcgcaaacttatgaaagaagcagataaacgagacgtaaaagtcattatggaccttgttgtgaatcat acgagcagtgaacacccttggtttcaagctgcgttgaaagataaaaacagcaagtacagagattactatatttgggctgataaaaatactgacttg aatgaaaaaggatcttggggacaacaaglatggcataaagctccaaacggagagtatttttacggaacgttctgggaaggaatgcctgacttaa altacgataaccetgaagtaagaaaagaaatgattaacgtcggaaagttttggctaaaacaaggcgttgacggcttccgcttagatgctgcccttc atatttttaaaggteaaacgcctgaaggcgctaagaaaaacattctatggtggaatgagtUagagatgcgatgaaaaaagaaaacccgaacgta ta tetaac gggtgaagtgtgggac cagccagaagtagtagccccttactatcaatcacttgattctctatttaattttgatttagc aggaaaaattgtc agctctgtaaaagcaggaaatgatcaaggaatcgccactgeagc3gcggcaactgatgagctgttcaaatcatacaatccaaataaaattgacg gcattrtcttaaccaaccatgaccaaaatcgcgtcatgagtgagttaagcggcgatgtgaataaagcaaaatcagccgcctctatcttacttacgct tectggaaatccgtatatnattacggtgaagaaattggcatgacaggtgaaaagcctgatgaattaatccgtgaaccgttccgctggtacgaagg caacggaattggacaaactagctgggaaacacctgtatataacaaaggcggtaacggcgtgtclgtagaagcacaaacaaaacaaaaggatt ccttgttaaa tcattaccgtgaaatgattcgtgtgc gceagçagcacgaagagttagtaaaaggaacgc tt caatcc atttc agtagaca gtaaag aagtc gttgcc tatagccgcacgtacaaa g gcaaatc gattagcgtgtatcataatatttcaaatca acc Igtaaaagtatctgta gca gcgaaa g gtaacttga tttttgctagtgaaaaaggtgctaagaaa gtcaaaaatcagcttgtgattccggc ga atgcgacggttttaataaaataa

SEQID NO: 162

Vai Asp Pro Lys Asn Cys Ser Gin Phe Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His lie Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly lie Ala Thr Ala Ala Ala Ala Thr Asp Glu

94/1 Ιό

Fig 16 (cont.)

Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly lie Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Ile Gly Gin Thr. Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser He Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Asn Leu He Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Ala Thr Vai Leu Ile Lys

SEQIDNO: 163 atggta c gtcccgaacgacgggctgcattggaacc gactatcgaacgac Icgcagcacttgaaagacattgggtgacga cggtgtggattccg ccggcgtacaaaggcacgtcacagaacgatgtcgggtatggggcgtacgatttatacgatctcggcgaattcaaccaaaaagggacgacccg gac gaagtacggga cgaaagcgca gctccagaccgccatctcgaacttgc gcggtaaagggatcggtgtgtacggcgacgtcgtc atgaat c acaagggc ggggccga ttataccgaatccgttcaggcgatcgaggtcaatccgtcgaaccggaaccaagaaacgtccggtgagtatggcat c tc ggcctggactgggttcaacttcgcggggc gcaacaatacatactcgccgttcaaatggcgctggtaccattttgac ggtac c gattgggatc agtcacgcagc ttga gccgca teta taagticaagagcacaggcaaggcgtgggacacggacgtgtcgaacgagaacggcaactatgattat cttatgtatgccgacgtcgatttcgagcatcccgaggtccgccaagagatgaagaactggggcaaatggtacgccgactcgçtcgggctcgac ggtttccggttggatgcggtcaaaca tatcagccactc gtacttgaagga gtgggtgacga gcgtgcgc cagacgacc gggaaaga gatgtte acggtcgccgagta ttggaagaac gatctc ggtgccatcaacgactatctgtataagac gggctacacgcac tccgtc ttcgatgtgccgctcc attataacttccaagcggcegguacggcggcgggtattacgatatgcgcaacatcttgaaaggcaccgtcaccgaacagcatccgtcgctgtc cgtgacgattgtcgataaccacgacteacagccgggccagtcgctcgagtcgacggtcgccaactggttcaaaccgctcgcctacgcgacga tcatgacgcgcggtcagggttatccggccctcttctatggagactattatggcacgaaagggacgacgaaccgcgaaatcccgaacatgtcgg gcacgctccaaccgartttgaaggcacgaaaagacttcgcctacgggacgcagcatgactacctcgatcatcaggacgtcatcggctggacac gtgaaggtgtgaccgaccgtgccaaatcgggtctcgcgacgattctatcggacggtccgggcggctcgaagtggatgtacgtcggcaaacag aacgccggcgaggtalggaaagacatgaçgaacaacaacgcccgtctcgtcacgatcaatgctgacggctggggtcagttcttcgtcaacgg aggctcggtctegatttatacgcaacaataa

SEQIDNO: 164

Met Vai Arg Pro Glu Arg Arg Ala Ala Leu Glu Pro Thr Ile Glu Arg Leu Ala Ala Leu Glu Arg His Trp Vai Thr Thr Vai Trp Ile Pro Pro Ala Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr Thr Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Gin Thr Ala Ile Ser Asn Leu Arg Gly Lys Gly Ile Gly Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Ser Vai Gin Ala Ile Glu Vai Asn Pro Ser Asn Arg Asn Gin Glu Thr Ser Gly Glu Tyr Gly ile Ser Ala Trp Thr Gly Phe Asn Phe Ala Gly Arg Asn Asn Thr Tyr Ser Pro Phe Lys Trp Arg Trp Tyr His Phe Asp G ly Thr Asp Trp Asp Gin Ser Arg Ser Leu Ser Arg Ile Tyr Lys Phe Lys Ser Thr Gly Lys Ala Trp Asp Thr Asp Vai Ser Asn Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Vai Asp Phe Glu His Pro Glu Vai Arg Gin Glu Met Lys Asn Trp Gly Lys Trp Tyr Ala Asp Ser Leu Gly Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Ser His Ser Tyr Leu Lys Glu Trp Vai Thr Ser Vai Arg Gin Thr Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Lys Asn Asp Leu Gly Ala lie Asn Asp Tyr Leu Tyr Lys Thr Gly Tyr Thr His Ser Vai Phe Asp Vai Pro Leu His Tyr Asn Phe Gin Ala Ala Gly Asn Gly Gly Gly Tyr Tyr Asp Met Arg Asn Ile Leu Lys Gly Thr Vai Thr Glu Gin His Pro Ser Leu Ser Vai Thr Ile Vai Asp Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Thr Vai Ala Asn Trp Phe Lys Pro Leu Ala Tyr Ala Thr Ile Met Thr Arg Gly Gin Gly Tyr Pro Ala Leu Phe Tyr Gly Asp Tyr Tyr Gly Thr Lys Gly Thr Thr Asn Arg Glu Ile Pro Asn Met Ser Gly Thr Leu Gin Pro lie Leu Lys Ala Arg Lys Asp Phe Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Gin Asp Vai Ile Gly Trp Thr Arg Glu Gly Vai Thr Asp Arg Ala Lys Ser Gly Leu Ala Thr Ile Leu Ser Asp Gly Pro Gly Gly Ser Lys Trp Met Tyr Vai Gly Lys Gin Asn Ala Gly Glu Vai Trp Lys Asp Met Thr Asn Asn Asn Ala Arg Leu Vai Thr Ile Asn Ala Asp Gly Τη) Gly Gin Phe Phe Vai Asn Gly Gly Ser Vai Ser Ile Tyr Thr Gin Gin

Fig 16(cOnt.)

95/1 Jfi

SEQIDNO: 165 atgcagtatttcgagtggtac gtgcc aaa tga tggggaacattggaatcgtttgcgtaatgatgctgaaaatttagctcataaaggaattacatctgt atggataccacccgtatataaaggaacttcacaaaatgatgtagggtatggagtgtatgatgtatatgatttgggagaatlcaatcaaaaaggaac gatacggacaaaatatgggacaaaagcacaattaaaatctgcaattgaggctttacataatcaaaatatcgatgtatacggtgatgttgrtatgaac cataaaggtggggcagattatactgaggttgtoacagccgttgaggtagaccgtaacaatcgaaatattgaaacatcgagtgattatcaaatagat gcgtggacgggatttgattttccaggacgcagggactcctattctaattttaaatggagatggtttcattttgatggaacagaítgggatgagggaa ggaaattaaatagaatttataaatttaaaggcgtaggtaaagcttgggactgggaagtgtctagtgagaatggtaactatgattatttaatgtatgca gatcttgatttcgatcatcctgaagttgcaaatgaaatgaaaaac tggggaacc tggtatgc ggac gaattaaatttagatggctttc gtttâgacg cagttaaacatattgaccatgagtatcttcgtgattgggtaaatcatgttagaaagcaaacggggaaggaaatgtttacagtagctgaatattggca aaatgatattcgtactttaaacaattatttagggaaagtaaattataaicaatctgtgttcgatgcacctcttcattalaattttcattatgcUcaacagg gaatggaaattatgatatgaggaatattttaaagggtacggtagtagaaagtcatcctacacttgctgttactcttgttgagaatcatgattctcagcc tggacagteattagaatctgttglgagtcc ttggttta agccgttggcctatgcatttatttta acgcgtgcagaagggtatcc ttc tgttttttatggag attactatggcacaaatggaaatagtagttatgaaattccaacgttaaaggataaaattgatccaattctgacggcacgaaaaaactttgcatatgg tacgcaacatgattatttagaccatccagatgtgattggctggacaagagaaggggatagtatacatgctaattctggtttâgcaacattaalctctg atggaccaggaggatc aaaatggatgaatgttggaaa gaacaacgcaggggaaatatggtacgatattacgggc aatcaaaca aatac tgtaa c gattaataaagatgga tgggggc agttccatgtaaatgggggctctgtttca atatatgttcagaagtaa

SEQID NO: 166

Met Gin Tyr Phe Glu Trp Tyr Vai Pro Asn Asp Gly Glu His Trp Asn Arg Leu Arg Asn Asp Ala Glu Asn Leu Ala His Lys Gly Ile Thr Ser Vai Trp Ile Pro Pro Vai Tyr Lys Gly Thr Ser Gin Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Vai Tyr Asp Leu Gly Glu Phe Asn Gin Lys Gly Thr He Arg Thr Lys Tyr Gly Thr Lys Ala Gin Leu Lys Ser Ala Ile Glu Ala Leu His Asn Gin Asn Ile Asp Vai Tyr Gly Asp Vai Vai Met Asn His Lys Gly Gly Ala Asp Tyr Thr Glu Vai Vai Thr Ala Vai Glu Vai Asp Arg Asn Asn Arg Asn Ile Glu Thr Ser Ser Asp Tyr Gin Ile Asp Ala Trp Thr Gly Phe Asp Phe Pro Gly Arg Arg Asp Ser Tyr Ser Asn Phe Lys Trp Arg Trp Phe His Phe Asp Gly Thr Asp Trp Asp Glu Gly Arg Lys Leu Asn Arg Ile Tyr Lys Phe Lys Gly Vai Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Phe Asp His Pro Glu Vai Ala Asn Glu Met Lys Asn Trp Gly Thr Trp Tyr Ala Asp Glu Leu Asn Leu Asp Gly Phe Arg Leu Asp Ala Vai Lys His Ile Asp His Glu Tyr Leu Arg Asp Trp Vai Asn His Vai Arg Lys Gin Thr Gly Lys Glu Met Phe Thr Vai Ala Glu Tyr Trp Gin Asn Asp lie Arg Thr Leu Asn Asn Tyr Leu Gly Lys Vai Asn Tyr Asn Gin Ser Vai Phe Asp Ala Pro Leu His Tyr Asn Phe His Tyr Ala Ser Thr Gly Asn Gly Asn Tyr Asp Met Arg Asn Ile Leu Lys Gly Thr Vai Vai Glu Ser His Pro Thr Leu Ala Vai Thr Leu Vai Glu Asn His Asp Ser Gin Pro Gly Gin Ser Leu Glu Ser Vai Vai Ser Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe He Leu Thr Arg Ala Glu Gly Tyr Pro Ser Vai Phe Tyr Gly Asp Tyr Tyr Gly Thr Asn Gly Asn Ser Ser Tyr Glu Ile Pro Thr Leu Lys Asp Lys Ile Asp Pro Ile Leu Thr Ala Arg Lys Asn Phe Ala Tyr Gly Thr Gin His Asp Tyr Leu Asp His Pro Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ser Ile His Ala Asn Ser Gly Leu Ala Thr Leu Ile Ser Asp Gly Pro Gly Gly Ser Lys Trp Met Asn Vai Gly Lys Asn Asn Ala Gly Glu Ile Trp Tyr Asp Ile Thr Gly Asn Gin Thr Asn Thr Vai Thr Ile Asn Lys Asp Gly Trp Gly Gin Phe His Vai Asn Gly Gly Ser Vai Ser Ile Tyr Vai Gin Lys SEQ IDNO: 167 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttalca acaggcgftcacgccgaaaccgtacataaaggtâaatctccaacagcagataaaaacggtgtattttatgaggtgtatgtaaactctttt(acgatg caaataaagatggacatggtgatttaaaaggtcttacacaaaagttggattatttaaatgatggcaattctcatacaaagaatgatcttcaagtaaac gggatttEgatgatgccggtcaacccttctcccagctatcataaatatgatgtaacggactattataatattgatccgcagtatggaaatctgcaag attttcgcaaactgatgaaagaagcagataaacgagatgtaaaagtcattalggacctcgttgtgaatcatacgagcagtgaacacçcttggtttc aagctgcattaaaagataaaaacagcaagtacagagattactatatctgggctgataaaaataccgacttgaatgaaaaaggatcttg£ggaca gcaagtatggcala a agcccca aacgga gagtatttttacggaa cgttttggga □ ggaa tgccggactta aattac gataatcctgaa gtaaga a aagaaatgattaacgtaggaaagttttggctaaagcaaggagttgacgggttccgtctagatgctgcgcttcatatttttaaaggccaaacacctg < *Fig· 16 (cont.)

96/116 aaggcgctaagaaaaatctcctgtggtggaatgaatttagagatgcaatgaaaaaggaaaaccctaacgtatatctaacgggtgaagtatggga tcaaccggaagtogtagctccttactatcaatcgcttgattctttatttaactttgamagcaggaaagattgtaaactctgtaaaatcaggaaatgat caaggaatcgcgactgcagcagcggcaacggatgaactgttcaaatcatacaatccaaataaaattgacggtattttcttaaccaaccatgacca aaatcgcgtcatgagtgagc taa gcggcgatgtgaataaagcaaagtca gctgcctc tate ttacttacgcttcct ggcaacccgtata tttattac ggtgaagaaatcggcatgaccggtgaaaagcctgatgagttaatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaaccag ctgggaaacacctgtatacaacaaaggcggcaacggcgtgtctgtagaagcacaaacaaaacaaaaggactcntgttaaatcaitaccgtgaa atgattcgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaagaagtcgrtgcctatagccgcac gtataaaggcaaatc gattagcgtgtatcataatatttcaaatcaaccggtaaaagtatctgtagcagcaaaaggtaaa ttgatttttggtagtgaaa aaggtgctaagaaagtcaaaaatcagcttgtgattccggcgaatacaacggttttaataaaataa

SEQ ID NO: 168

Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Τφ Thr Ala Leu Ala Leu Thr Leu Pro Leu Ata Ala Ser Leu Ser Thr Gly Vai Hís Ala Glu Thr Vai His Lys Gly Lys Ser Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Sei Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly lie Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn Hís Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys De Vat Asn Ser Vai Lys Ser Gly Asn Asp Gin Gly De Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr De Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser Ile Ser Vai TyT His Asn He Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Gly Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ee Pro Ala Asn Thr Thr Vai Leu Ile Lys

SEQ IDNO: 169 atgaaaacattcaaattaaaacgcacttttttaccgctaaccttgctgctcagtgctcctgcctttgctgggcaaaatggcaccatgatgcagtatttt cattggtatgtacctaatgatggcgcattatggacgcaggttgaaagcaatgctccagcactcgctgaaaacggttttacagcgctctggctacc gccagcttacaaaggcgcgggcggcagta atgacgtc ggttatggc gtc tatgatatgtacgattta ggtga gtttga tcaaa aaggclc agtac gaaccaaatacggcaccaaggctcagtacatctetgcaatcaatgccgcgcacaacaacaatatccaaatctacggcgatgttgtgtttaaccac c gaggtggtgctgatgggaa gtc gtgggtcgata ccaa gcgcgttga ttgggaca acc gta acattgaac tgggcgacaaa tggattgaagct tgggttgagtttaattttcctggccgcaacgacaaatactcaaacttccattggacttggiatcactttgacggtgttgactgggatgatgccggcaa agaaaaagcgatctttaaattcaaaggcgaaggaaaagcatgggattgggaagtcagctct£aaaaaggcaattacgactacctaatgtacgc cgatttagacatggatcaccaagaagttaaacaagagctgaaagattggggtgagtggtacatcaacatgaccggcgttgatggctttagaatg gatgccgtgaagcacattaaatatcagtatctacaagagtggattgaícatttacgttggaaaacaggcaaagagcttttcaccgttggtgagtatt ggaattacgacgtaaatcaactgcataactttattactaagacçtctggcagtatgtcgttgttcgatgcgccgcttcacatgaacttctacaacgcg tcaaaalctggcggcaattacgatatgcgccaaatcatgaatggcacgttgatgaaggacaacccagtcaaagctgtgactctcglagaaaacc acgatacacagccattgcaggcgttagagtcgacagtggattggtggttcaagcctcttgcttacgcattcattttattgcgtgaagaaggttatcc atcagtgttctacgcagattactacggcgcgcagtaçagcgacaaaggctacaacatcaatatggccaaagttccnacattgaagaacttgtaa

Fig 16 (cont.)

97/116 cactgcgtaaagagtatgcgtatggcaaacagaattcttatctcgaccactgggatgtgattggctggacccgagagggcgatgctgaacaícc aaactcaatggcggtgalcâtgagtgatggaccaggtggcaaaaaatggatgtataccggtaagccaagcacgcgctalgtcgacaagctgg gtetccgaactgaagaagtttggaccgauccaatggctgggcagaatttcctgtcaatggtggttcagtctcggtttgggtgggcgttaagtaa SEQIDNO: 170

Met Lys Thr Phe Lys Leu Lys Arg Thr Phe Leu Pro Leu Thr Leu Leu Leu Ser Ala Pro Ala Phe Ala Gly Gin Asn Gly Thr Met Met Gin Tyr Phe His Trp Tyr Vai Pio Asn Asp Gly Ala Leu Trp Thr Gin Vai Glu Ser Asn Ala Pro Al a Leu Ala Glu Asn Gly Phe Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly Glu Phe Asp Gin Lys Gly Ser Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr Ile Ser Ala Ile Asn Ala Ala His Asn Asn Asn lie Gin Ile Tyr Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asp Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp lie Glu Ala Trp Vai Glu Phe Asn Phe Pro Gly Arg Asn Asp Lys Tyr Ser Asn Phe His Tip Thr Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Asp Ala Gly Lys Glu Lys Ala He Phe Lys Phe Lys Gly Glu Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Gin Glu Vai Lys Gin Glu Leu Lys Asp Trp Gly Glu Trp Tyr Ile Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His Ué Lys Tyr Gin Tyr Leu Gin Glu Trp Ile Asp Hís Leu Arg Tip Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu Tyr Trp Asn Tyr Asp Vai Asn Gin Leu His Asn Phe Ile Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala Ser Lys Ser Gly Gly Asn Tyr Asp Met Arg Gin Ile Met Asn Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn Hís Asp Thr Gin Pro Leu Gin Ala Leu Glu Ser Thr Vai Asp Trp Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Asp TyT Tyr Gly Ala Gin Tyr Ser Asp Lys Gly Tyr Asn Ile Asn Met Ala Lys Vai Pro Tyr Ile Glu Glu Leu Vai Thr Leu Arg Lys Glu Tyr Ala Tyr Gly Lys Gin Asn Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai Ile Met Ser Asp Gly Pro Gly Gly Lys Lys Trp Met Tyr Thr Gly Lys Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Glu Vai Trp Thr Asp Thr Asn Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Tip Vai Gly Vai Lys

SEQIDNO: 171 gtgtatgtaaactctttttacgatgcaaataaagatggacatggtgatttaaaaggtcttacacaaaagttggattatttaaatgatggcaattctcata caaagaatgatcttcaagtaaacgggatttggatgatgccggtcaacccttctcccagctatcataaatatgatgtaacggactattataatattgat ccgcagtatggaaatctgcaagattttc gcaaactgatgaaa gaagcagataaacgagatgtaa aagtca ttatggacc tcgttgtgaatcatac gagca gtgaa cacccttggtttcaagctgcattaaaaga taa aaaca gcaagtacagaga ttactatatc tgggctgalaaaaataccgacttga atgaaaaaggatcttggggacagcaagtatggcataaagccccaaacggagagtatttttacggaacgttttgggaaggaatgccggacttaaa ttacgataatcctgaagtaagaaaagaaatgattaacgtaggaaagttttggctaaagcaaggagttgacgggttccgtctagatgctgcgcttca tatttttaaaggccaaacacctgaaggcgctaagaaaaatctcctgtggtggaatgaatttagagatgcaatgaaaaaggaaaaccctaacgtat atcta acgg gtgaa gUtgggatcaaccggaagtagUgctccttactatcaatcgcttgattctrtatttaactttgatttagcaggaaagattgtaa actctgtaaaatcaggaaatgatcaaggaatcgcgactgcagcagcggcaacggatgaactgttcaaatcatacaatccaaataaaattgacgg tattttcttaaccaaccatgaccaaaatcgcgtcatgagtgagctaagcggcgatglgaataaagcaaagtcagctgcctctatcttacttacgctt cctggcaacccgtatattta ttacggtgaagaaatcggcatgaccggtgaaaagcctgatgagttaatcc gtgaa ccgttccgctggtacgaagg aaacggactt£gacaaaccagctgggaaacacctgtatacaâcaaaggcggcaacggcgtgtctgtagaagcacaaacaaaacaaaaggac tctttgttaaatcattaccgtgaaatgattcgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaag aagtegttgcctatagccgcacgtataaaggcaaatçgattagcgtgtatcataatatttcaaatcaaccggtaaaâgtatctgtagcagcaaaag gtaaattgatttttggtagtgaaaaaggtgctaagaaagtcaaaaatcagcttgtgattccggcgaatacaacggttttaataaaataa

SEQIDNO: 172

Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser TyT His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro

Fig 16 (cont.)

98/116

Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Tip His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Asn Ser Vai Lys Ser Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys He Asp Gly He Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser He Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met He Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Lys Ser He Ser Vai Tyr His Asn He Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Gly Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Th! Thr Vai Leu Ile Lys SEQ ID NO: 173 atgcaaacgattgcaaaaaaaggggatgaaacgatgaaagggaaaaaatggacagctttagctctaacactgccgctggctgctagcttatca acaggcgttcacgcagaaactgtacataaaggtaaagctccaacagcagataaaaacggtgttttttatgaggtgtatgtaaacictttttacgatg caaataaagatggacatggtgatttaaâaggtctgaçacaaaagrtggattatttaaatgacggcaattctcatacaaagaatgatcttcaagtaaa cgggatttggatgatgccggtaaacccttctcctagctatcataaatatgatgtaacggactattataacattgatcctcagtacggaagtctgcaa gatttccgcaaactgatgaaa gaagcagataaacgagacgtaaaa gttattatggac cttgttgtgaatcatacgagca gtga ac acccttggttt caagctgcactaaaagataaaaacagcaagtacagagattactatatttgggctgataaaaataccgarttgaatgaaaaaggatcttggggaca gcaagtatggcataaagctecaaacggagagtatttttacggaacgttctgggaaggaatgcctgacttaaattacgataaccctgaagtaagaa aagaaatgattaacgtcggaaagttttggctaaagcaaggcgttgatggcttccgcttagatgctgccctteatatetttaaaggtcaaactcctga aggcgctaagaaaaatctcctgtggtggaatgagtttagagatgcaatgaaaaaagaaaaccctaacgtatatctaacgggtgaagtatgggat cagccgga agtágtagc tccttattatcaatc gc ttga ttccctatttaactttgatttagcaggaaaaattgtcagctctgtaaaagcagga aatgat caaggaatcgccactgcagcagcggcaacggatgagctgttcaaatcatacaatccaaataaaattgacggcattttcttaaccaaccatgacca aaaccgcgtcatgagtgagctaagcggagalgtgaataaagcaaaatcagctgcttdatcttacttacgcttcctggaaatccgtatatttattacg gtgaagaaattggcatgaccggtgaaaagcctgatgaattaa(ccgtgaaccgttccgctggtacgaaggcaacggaattggacaaactagct gggaaacacctgtatataacaaaggcggcaatggtgtgtctgtagaagcacaaaccaaacaaaaggattctttgttaaatcattaccgtgaaatg attcgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcagtctatttcagtagacagtaaagaagttgtcgcttatagccgtacgtat aaaggcaactccattagtgtgtatcataatatttcaaatcaacctgtaaaagtatctgtagcggcgaaaggtaaattgatttttgctaglgaaaaagg tgc taaaaaa ggcaaaaatcagcttgtgattccggcgaatgcgacggttttaa taaaataa

SEQ IDNO: 174

Mer Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Aía Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Giy Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Mel Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Ser Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Tip His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His He Phe Lys Gly

Fig 16 (cont.)

99/116

Gin Thr Pro Glu Gly Ala Lys Lys Asn Leu Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Val Tyr Leu Thr Gly Glu Val Trp Asp Gin Pro Glu Val Val Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Val Ser Ser Val Lys Ala Gly Asn Asp Gin Gly He Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Val Met Ser Glu Leu Ser Gly Asp Val Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly He Gly Gin Thr Ser Trp Glu Thr Pro Val Tyr Asn Lys Gly Gly Asn Gly Val Ser Val Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Val Arg Gin Gin His Glu Glu Leu Val Lys Gly Thr Leu Gin Ser He Ser Val Asp Ser Lys Glu Val Val Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Val TyT His Asn Ile Ser Asn Gin Pro Val Lys Val Ser Val Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Gly Lys Asn Gin Leu Val Ile Pro Ala Asn Ala Thr Val Leu Ile Lys

SEQ TD NO: 175 atgaaaaatataatacgactttgtgctgccagcgc tatee tcacggtgtcccacgceagttacgccgacgcaattttacacgcgtttaactggcaat ataccgatgta acc gccaatgcaaatcaaattgccgcaaatggctttaaa aaagtcctcattteacccgcaatgaaatccagcggc agtcaatgg tgggc cc gctatcaaccgcaa gacttgcgtgtcattga ttctccg ctgggcaacaaacaagatttagtcgcga tgatcaatgc gctc aac agcgt tggggtcgacgtgtatgctgacgtggtgcttaaccatatggctaacgagtcatggaagcgcagtgacctgaactacceggggagtgaggtgct caacgactatcaatcccgcagtgcttactatcaaaggcaaacacttttcggcaatttacaggagaaccttttttccgagaatgatttccatccggca ggctgtattaccaattggaatgatcctggccacgtccagtattggcgettgtgcggcggacagggcgatactgggctaccggatctcgatcctaa tcaatgggttgtgagtcagcagaagagttacttgaacgcactcaaatcaatgggaatcaaagggttccgtatogatgcggtcaaacatatgagtc aatatcaaatagaccaagtgtttaccccagacatlaccgctggtatgcatatattcggagaagtcattaceagtggtgggcaaggtgatagcggçt atgaggc ttttcttgccccttaccttaataata ccgatca cgccgcttatga cttccc gctatttgcatcgattcgagccgcgttttcattctctggtgg gttaaatcagctacacaatccacaa gcctatggccaagcgttac aggactcacgtgcg atcacc tttacgattacccacgaca ttccaaccaatg acggtttccgctaccagatcatggatccaacegatgaacagctcgcctatgcctacatcttgggcaaagatggaggaacgccacttgtctatagt gatgacctacctgac agcgaagacaaagacagtggtc gttgg gccgatgtgtggcaagatccgaac atgattaacatgcttgccttccacaacg cgatgcaaggacaaagcatgactgtagtggctagcgatcaatgtaccttgctatttaagcgcggeaagcaaggcglggtaggaatcaataaatg tgEcgagagtaagtcggtgactgtcgatacttaccagcatgagtttaactggiacaccccgtaccaagacgtattgagcggcgacatcaccaea gtga gttetc gtta tcaccaattlgttttgcca gcgcgca gtgcaaggat gtggaaactataa

SEQ ID NO: 176

Met Lys Asn Ile Ile Arg Leu Cys Ala Ala Ser Ala He Leu Thr Val Ser His Ala Ser TyT Ala Asp Ala He Leu His Ala Phe Asn Trp Gin Tyr Thr Asp Val Thr Ala Asn Ala Asn Gin Ile Ala Ala Asn Gly Phe Lys Lys Val Leu Ile Ser Pro Ala Met Lys Ser Ser Gly Ser Gin Trp Trp Ala Aig Tyr Gin Pro Gin Asp Leu Arg Val Ile Asp Ser Pro Leu Gly Asn Lys Gin Asp Leu Val Ala Met Ile Asn Ala Leu Asn Ser Val Gly Val Asp Val Tyr Ala Asp Val Val Leu Asn His Met Ala Asn Glu Ser Trp Lys Arg Ser Asp Leu Asn TyT Pro Gly Ser Glu Val Leu Asn Asp TyT Gin Ser Arg Ser Ala Tyr Tyr Gin Arg Gin Thr Leu Phe Gly Asn Leu Gin Glu Asn Leu Phe Ser Glu Asn Asp Phe His Pro Ala Gly Cys lie Thr Asn Trp Asn Asp Pro Gly His Val Gin TyrTrp Arg Leu Cys Gly Gly Gin Gly Asp Thr Gly Leu Pro Asp Leu Asp Pro Asn Gin Tip Val Val Ser Gin Gin Lys Ser Tyr Leu Asn Ala Leu Lys Ser Met Gly Ile Lys Gly Phe Arg Ile Asp Ala Val Lys His Met Ser Gin Tyr Gin Ile Asp Gin Val Phe Thr Pro Asp Ile Thr Ala Gly Met His Ile Phe Gly Glu Val lie Thr Ser Gly Gly Gin Gly Asp Ser Gly Tyr Glu Ala Phe Leu Ala Pro Tyr Leu Asn Asn Thr Asp His Ala Ala Tyr Asp Phe Pro Leu Phe Ala Ser Ile Arg Ala Ala Phe Ser Phe Ser Gly Gly Leu Asn Gin Leu His Asn Pro GIn Ala Tyr Gly Gin Ala Leu Gin Asp Ser Arg Ala lie Thr Phe Thr Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pro Thr Asp Glu Gin Leu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Thr Pro Leu Val Tyr Ser Asp Asp Leu Pro Asp Ser Glu Asp Lys Asp Ser Gly Arg Trp Ala Asp Val Trp Gin Asp Pro Asn Met Ile Asn Met Leu Ala Phe Hís Asn Ala Met Gin Gly Gin Ser Mel Thr Val Val Ala Ser Asp Gin Cys Thr Leu Leu Phe Lys Arg Gly Lys Gin Gly Val Val Gly Ile Asn Lys Cys Gly

100/136

Fig 16 (cont.)

Glu Ser Lys Ser Vai Thr Vai Asp Thr Tyr Gin His Glu Phe Asn Trp Tyr Thr Pro Tyr Gin Asp Vai Leu Ser Gly Asp He Thr Thr Vai Ser Ser Arg Tyr His Gin Phe Vai Leu Pro Ala Arg Ser Ala Arg Met Trp Lys Leu

SEQIDNO: 177 algaaaacattcaaattaaaacgcacttttttaccgctgacc ttgctgctca gtgctcctgcctttgc tgggcaaaatg gcacca tga tgcagtatttt cattggtacgtacctaatgatggcgcattatggacgcaggttgaaagcaatgctccagtactcgctgaaaacggttttacagcgctctggctacc gcc cgc a ta caaaggcgcgggcggcagtaatgacgtcggttatggegtctatgatatgocgatttaggtgagtttgaccaaaaaggctca gta cgaaccaaata c ggcaccaaggc teagtacatc tctgcaatcaatgccgcgcacaacaac aatatccaaatttacggcgac gttgtgtttaacca ccgaggtggcgctgatgggaagtcgtgggtcgataccaagcgcgttgattgggacaacegcaatattgaactgggcgacaaatggattgaag cttgggttgagtttaattttcctggccgcaac gac aaata ctcgaacttccattggacttggtafcactttgacggtgttgactggga tgatgc c ggc aaagaaaaagcgatctttaaattcaaaggcgaaggaaaagcatgggattgggaagtcagctctgaaaaaggcaattacgactacctaatgtac gccgatttagacatggatcacccagaagttaaacaagagctgaaagattggggtgagtgglacatcaacatgaccggegttgatggctttagaa lggatgccgtgaagcacattaaatatcagtatctacaagagtggattgatcatttacgttggaaaacaggcaaagagcttttcaccgttggtgagta ttggaattacgacgtaaatcaac tgcacaactttattactaagacctctggcagtatgtc gttgttcgatgcgccgcttca catgaatttctac aacgc gtcaaaatctggcggcacttacgatatgcgccaaatcatgaatggcacgttgatgaaggacaacccagtcaaagcagtgactctcgtagaaaac cacga tacgcagccattgcaggcgttagagtcgacagtagattggtggttcaagcctcttgcttacgcattca ttttattgcgtgaagaa ggíta tc c atcggtgttctacgcagattactac ggc gc gcagtacagc gacaaaggttacaacattaalatggccaaagtgccttacattgaagaacttgtaa cactgcgtaaagagtatgcgtatggcaaacagaattcttatctcgaccattgggatgtgattggctggacccgagagggcgatgctgaacatcc aaactcaatggcggtgatc atgagtgatggaccgggc ggcacaaaatggatgtataccggtaa gcca agtac gcgctatgtcgacaagctgg gtatccgaactgaagatgtttggaccgatgccaatggctgggcagaatttcctgtcaatggtggttcagtctcggtttgggtgggcgttaagtaa SEQIDNO: 178

Met Lys Thr Phe Lys Leu Lys Arg Thr Phe Leu Pro Leu Thr Leu Leu Leu Ser Ala Pro Ala Phe Ala Gly Gin Asn Gly Thr Met Met Gin Tyr Phe His Trp Tyr Vai Pro Asn Asp Gly Ala Leu Trp Thr Gin Vai Glu Ser Asn Ala Pro Vai Leu Ala Glu Asn Gly Phe Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly Glu Phe Asp Gin Lys Gly Ser Vai Arg Thr Lys TyT Gly Thr Lys Ala Gin Tyr Ile Ser Ala Ile Asn Ala Ala His Asn Asn Asn Ile Gin Ile TyT Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asp Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp Ile Glu Ala Trp Vai Glu Phe Asn Phe Pro Gly Arg Asn Asp Lys Tyr Ser Asn Phe His Trp Thr Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Asp Ala Gly Lys Glu Lys Ala Ile Phe Lys Phe Lys Gly Glu Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Lys Gin Glu Leu Lys Asp Trp Gly Glu Trp Tyr He Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His lie Lys Tyr Gin Tyr Leu Gin Glu Trp He Asp His Leu Arg Trp Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu TyT Trp Asn Tyr Asp Vai Asn Gin Leu His Asn Phe Ile Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala Ser Lys Ser Gly Gly Thr TyT Asp Met Arg Gin Ile Met Asn Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn His Asp Thr Gin Pro Leu Gin Ala Leu Glu Ser Thr Vai Asp Trp Trp Phe Lys Pro Leu Ala TyT Ala Phe Ile Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Asp Tyr Tyr Gly Ala Gin Tyr Ser Asp Lys Gly TyT Asn Ile Asn Met Ala Lys Vai Pro Tyr Ile Glu Glu Leu Vai Thr Leu Arg Lys Glu Tyr Ala Tyr Gly Lys Gin Asn Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai Ile Met Ser Asp Gly Pro Gly Gly Thr Lys Trp Met TyT Thr Gly Lys Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Asp Vai Trp Thr Asp Ala Asn Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Gly Vai Lys

SEQ ID NO: 179 atgaaaacattcaaattaaaacgcacttttttaccgctaaccttgctgctçagtgctcctgcctttgccgggcaaaatggcaccatgâtgcagtactt tcattggtacgtacctaatgatggcgcatlatggacgcaggttgaaagcaatgctccagcactcgctgaaaacggttttacagcgctctggctacc

Fig 16 (cont.)

101/116 gccagcttacaaaggcgcgggcggcagtaatgatgtcggttâtggcgtctâcgatatgtacgatttaggtgagtttgatcaaaaaggcicagtac gaaccaaatacggiaccaaggctcagtacatctctgcaatcaatgctgcgcacaacaacaatatccaaatttacggcgacgttgtgtttaaccatc gtggtggcgctgatgggaagtcgtgggtcgaiaccaagcgcgttgattgggacaaccgtaacattgaaclgggcgacaaatggattgaagctt gggttgagtttaattttcctagccgcaacgacaaatacicgaacttccattggacttggtatcactttgacggtgttgactgggatgatgccggcaa agaaaaagcgatctttaaattcaaaggcgaaggaaaagcatgggattgggaagtcagctctgaaaaaggcaattacgactacctaatgtacgc cgatttagacatggatcacccagaagttaaacaagagctgaaagattgg£gtgagtggtacatcaacatgaccggcgttgatggctttagaatg gaigcc gttaagcacattaaatatcagtatc Ucaagagtggattgatcatttacgttggaaaacaggc aaagagcttttc accgttggtgagtattg gaattacgacgtaaatcaac tgcataac tttattactaaga cctctggcagtatgtcgttgttcgatgcgccgcto: ac atgaacttctacaacgc gt caaaatctggcggcaattacgatatgcgccaaatcatgaatggcacgttgatgaaggacaacccagtcaaagctgtgactctcgtagaaaacca cgatacgcagccattgcaggcgttagagtcgacagtggattggtggttcaagcctcttgcttacgçattcatcttgttgcgtgaagaaggtíatcca tcggtgttctac gcagattactac ggcgcgcagta cagcgacaaaggtlacaacattaatatggccaaagtgçcttacattgaagaac ttgtaaca ctgcgtaaagagtatgcgUtggcaaacagaattcttatctcgaccattgggatgtgattggctggactcgagagggcgatgctgaacatccaaa ctcaatggcggtgatcatgagtgatggaccgggcggaacaaaatggatgtataccggtaatccaagcacgcgctatgtcgacaagctgggtat cc gaactgaagatgtttggaccgatgccaatggctgggcagaatttcctgtcaa tggtggttcagtctcggtttgggtgggcgtta agtaa

SEQID NO: 180

Met Lys Thr Phe Lys Leu Lys Arg Thr Phe Leu Pro Leu Thr Leu Leu Leu Ser Ala Pro Ala Phe Ala Gly Gin Asn Gly Thr Met Met Gin Tyr Phe His Trp Tyr Vai Pro Asn Asp Gly Ala Leu Trp Thr Gin Vai Glu Ser Asn Ala Pro Ala Leu Ala Glu Asn Gly Phe Thr Aía Leu Trp Leu Pro Pro Ala Tyr Lys Gly Ala Gly Gly Ser Asn Asp Vai Gly Tyr Gly Vai Tyr Asp Met Tyr Asp Leu Gly G1 u Phe Asp Gin Lys Gly Ser Vai Arg Thr Lys Tyr Gly Thr Lys Ala Gin Tyr He Ser Ala Ile Asn Ala Ala His Asn Asn Asn Ile Gin Ile Tyr Gly Asp Vai Vai Phe Asn His Arg Gly Gly Ala Asp Gly Lys Ser Trp Vai Asp Thr Lys Arg Vai Asp Trp Asp Asn Arg Asn Ile Glu Leu Gly Asp Lys Trp Ile Glu Ala Trp Vai Glu Phe Asn Phe Pro Ser Arg Asn Asp Lys Tyr Ser Asn Phe His Trp Thr Trp Tyr His Phe Asp Gly Vai Asp Trp Asp Asp Ala Gly Lys Glu Lys Ala Ile Phe Lys Phe Lys Gly Glu Gly Lys Ala Trp Asp Trp Glu Vai Ser Ser Glu Lys Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His Pro Glu Vai Lys Gin Glu Leu Lys Asp Trp Gly Glu Trp Tyr He Asn Met Thr Gly Vai Asp Gly Phe Arg Met Asp Ala Vai Lys His He Lys Tyr Gin Tyr Leu Gin Glu Trp Ile Asp His Leu Arg Trp Lys Thr Gly Lys Glu Leu Phe Thr Vai Gly Glu Tyr Trp Asn Tyr Asp Vai Asn Gin Leu His Asn Phe Ile Thr Lys Thr Ser Gly Ser Met Ser Leu Phe Asp Ala Pro Leu His Met Asn Phe Tyr Asn Ala Ser Lys Ser Gly Gly Asn Tyr Asp Met Arg Gin Ile Met Asn Gly Thr Leu Met Lys Asp Asn Pro Vai Lys Ala Vai Thr Leu Vai Glu Asn His Asp Thr Gin Pro Leu Gin Ala Leu Glu Ser Thr Vai Asp Trp Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu Leu Arg Glu Glu Gly Tyr Pro Ser Vai Phe Tyr Ala Asp Tyr Tyr Gly Ala Gin Tyr Ser Asp Lys Gly Tyr Asn Ile Asn Met Ala Lys Vai Pro Tyr He Glu Glu Leu Vai Thr Leu Arg Lys Glu Tyr Ala Tyr Gly Lys Gin Asn Ser Tyr Leu Asp His Trp Asp Vai Ile Gly Trp Thr Arg Glu Gly Asp Ala Glu His Pro Asn Ser Met Ala Vai lie Met Ser Asp Gly Pro Gly Gly Ώιτ Lys Trp Met Tyr Thr Gly Asn Pro Ser Thr Arg Tyr Vai Asp Lys Leu Gly Ile Arg Thr Glu Asp Vai Trp Thr Asp Ala Asn Gly Trp Ala Glu Phe Pro Vai Asn Gly Gly Ser Vai Ser Vai Trp Vai Gly Vai Lys

SEQIDNO: 181 ttgccagaggccttcggcctggccattacgccgtcacatagccggcgggggaggttggtgggcgtgtcgcgcgggggcagcctgccgatgc cggtcctccactggecggcgttcatcctcgtccggcgcttcgtcgccggtcatccgaacaagcacaagaaccggagtattgcgatgagccaca ccctgcgtgccgccgtanggcggcgatcctgctgccgttccccgccctçgclgaccaggccggcaagagcccggccggcgtgcgctacca cggcggc gacgaaatcatc ctc cagggcttccactggaacgtcgtccgc gaagcgcccaacgactggtacaacatccttc gccagcaggcc t cgacgatcgccgcggacggcttctcggcaatctggatgccggtgccctggcgtgacttctccagctggaccgacggcggcaagtcaggcgg cggcgaaggctacttctggcacgacttcaacaagaacggccgctacggcagcgacgcecagctgcgccaggccgccggcgcactcggtgg cgccggggtgaaggtgctctacgatgtggtgcccaatcacatgaaccgcggctatccggacaaggagatcaacctgccggccggccagggc ttctggcgcaacgactgcaccgacccgggcaactaccccaacgactgcgatgacggtgaccgctieatcggcggcaagtcggacctgaaca ccggccatccgcagatctacggcatgtttcgcgacgagcrtgccaacctgcgcagcgggtacggcgccggcggcttccgcttcgacttcgttc

102/116

Fig 16 (cont.) gcggcUtgcgcccgaacgggtcgacagctggatgagcgacagcgccgacagcagtttctgcgttggcgagctgtggaaaagcccgtccga gtacccgagctgggactggcgcaacacggcgagctggcagcagatcatcaaggactggtccgaccgggccaagtgcccggtgttcgacttc gcgctcaaggagcgcatgcagaacggctcggtcgccgactggaagcatggcctcaatggcaacecggacccgcgctggcgcgaggtggc ggtgacctttgtcgacaaccacgacaccggctattcgcccgggcagaacggcggccagcaccactgggcgctgcaggacgggctgatccg ccaggcctacgcctacatcctcaccagcccgggcacgccggtggtgtactggtçgcacatgtacgactggggctacggcgacttcattcgcca gctgatccaggtgcggcgcaccgctggcgtgcgcgccgattcggcgatcagcttccacagcggctacagcggcctggtcgctaccglcagc ggcagccatcagaccctggtggtggcgctcaactccgatctggccaaccccggccaggtcgccagcggcagcttcagcgaggcggtcaac gccagcaacggccaggtgcgcgtctggcgcagcggtagcggcgatggcggcggcaatgacggcggcgagggcggtctggtcaatgtgaa cttccgctgcgacaacggcgtgacgeagatgggcgacagcgtctacgcggtgggcaacgtcagccagcteggcaactggagcccggcctc cgcggtacggctgaccgaca ccagcagc tatccgac ctggaagggcagcategcc ctgcctgacggtcagaacgtggaatggaagtgcc tg atccgtaacgaggcggacgcgacgctggtgcgccagtggcaatcgggpggcaacaaccaggiccaggccgetgccggcgcgagcacca gcggctcgttctga

SEQ ID NO: 182

Met Pro Glu Ala Phe Gly Leu Ala Ile Thr Pro Ser His Ser Arg Arg Gly Arg Leu Vai Gly Vai Ser Arg Gly Gly Ser Leu Pro Met Pro Vai Leu His Trp Pro Ala Phe Ile Leu Vai Arg Arg Phe Vai Ala Gly His Pro Asn Lys His Lys Asn Arg Ser Ile Ala Met Ser His Thr Leu Arg Ala Ala Vai Leu Ala Ala Ile Leu Leu Pro Phe Pro Ala Leu Ala Asp Gin Ala Gly Lys Ser Pro Ala Gly Vai Arg Tyr His Gly Gly Asp Glu Ile Ile Leu Gin Gly Phe His Trp Asn Vai Vai Arg Glu Ala Pro Asn Asp Trp Tyr Asn Ile Leu Arg Gin Gin Ala Ser Thr Ile Ala Ala Asp Gly Phe Ser Ala Ile Trp Met Pro Vai Pro Trp Arg Asp Phe Ser Ser Trp Thr Asp Gly Gly Lys Ser Gly Gly Gly Glu Gly Tyr Phe Trp His Asp Phe Asn Lys Asn Gly Arg Tyr Gly Ser Asp Ala Gin Leu Arg Gin Ala Ala Gly Ala Leu Gly Gly Ala Gly Vai Lys Vai Leu Tyr Asp Vai Vai Pro Asn His Met Asn Arg Gly Tyr Pro Asp Lys Glu Ile Asn Leu Pro Ala Gly Gin Gly Phe Trp Arg Asn Asp Cys Thr Asp Pro Gly Asn Tyr Pro Asn Asp Cys Asp Asp Gly Asp Arg Phe Ile Gly Gly Lys Ser Asp Leu Asn Thr Gly Hís Pro Gin Πβ Tyr Gly Met Phe Arg Asp Glu Leu Ala Asn Leu Arg Ser Gly Tyr Gly Ala Gly Gly Phe Arg Phe Asp Phe Vai Arg Gly Tyr Ala Pro Glu Arg Vai Asp Ser Trp Met Ser Asp Ser Ala Asp Ser Ser Phe Cys Vai Gly Glu Leu Trp Lys Ser Pro Ser Glu Tyr Pro Ser Trp Asp Trp Arg Asn Thr Ala Ser Trp Gin Gin Ile Ile Lys Asp Trp Ser Asp Arg Ala Lys Cys Pro Vai Phe Asp Phe Ala Leu Lys Glu Arg Met Gin Asn Gly Ser Vai Ala Asp Trp Lys His Gly Leu Asn Gly Asn Pro Asp Pro ATg Trp Arg Glu Vai Ala Vai Thr Phe Vai Asp Asn His Asp Thr Gly Tyr Ser Pro Gly Gin Asn Gly Gly Gin His His Trp Ala Leu Gin Asp Gly Leu Ue Arg Gin Ala Tyr Ala Tyr Ile Leu Thr Ser Pro Gly Thr Pro Vai Vai Tyr Trp Ser His Met TyT Asp Trp Gly Tyr Gly Asp Phe Ile Arg Gin Leu Ile Gin Vai Arg Arg Thr Ala Gly Vai Arg Ala Asp Ser Ala Ile Ser Phe His Ser Gly Tyr Ser Gly Leu Vai Ala Thr Vai Ser Gly Ser His Gin Thr Leu Vai Vai Ala Leu Asn Ser Asp Leu AJa Asn Pro Gly Gin Vai Ala Ser Gly Ser Phe Ser Glu Ala Vai Asn Ala Ser Asn Gly Gin Vai Arg Vai Trp Arg Ser Gly Ser Gly Asp Gly Gly Gly Asn Asp Gly Gly Glu Gly Gly Leu Vai Asn Vai Asn Phe Arg Cys Asp Asn Gly Vai Thr Gin Met Gly Asp Ser Vai Tyr Ala Vai Gly Asn Vai Ser Gin Leu Gly Asn Trp Ser Pro Ala Ser Ala Vai Arg Leu Thr Asp Thr Ser Ser Tyr Pro Thr Trp Lys Gly Ser Ile Ala Leu Pro Asp Gly Gin Asn Va] G lu Trp Lys Cys Leu Ile Arg Asn Glu Ala Asp Ala Thr Leu Vai Arg Gin Trp Gin Ser Gly Gly Asn Asn Gin Vai Gin Ala Ala Ala Gly Ala Ser Thr Ser Gly Ser Phe

SEQIDNO: 183 atgcaaacgattgcaaaaaaaggggatgaaaçgatgaaagggaaaaaatggacagctttagctçtaacactgpcgctggctgctagcttatca acaggcgttcacgccgaaaccgtacataaagglaagtctgaagcaacagataaaaacggtgtcrtttatgaggtgtBtgtaaactctttttacgala caaataaagatggacatggtgatttaaaaggtctgacacaaaagttggattatttaaatgacggcaattctcatacaaagaatgatcttcaagtaaa cgggatttggatgatgcc agtcaacccttctcctagc tatea taa ata [gatgtaacggac tattataaca ttgatcctcagtacggaaalctgc aag attrtcgcaagctgatgaaagaagcagacaaacgagacgtaaaagtcattatggaccttgttgtgaatcatacgagcagcgaacacccttggttt caagctg cattaaaagataaaaacagcaagtacagagattactatatttgggctga taaaaa tace gatttgaatgaaaaaggatc ttgggggca gcaagtatggcataa agctccaaacggag agtatttttacggaacgttttgggaa ggaatgc ctgacttaaattacgataaccctgaagtaa gaa

Fig 16 (cont.)

103/116 aa gaaatgattaacgtcggaaagttttggctaaagcaaggcgttaatggcttccgcttagatgctgcgcrtcatattittaaaggtcaaaca cctga aggcgctaagaaaaatatcctgtggtggaatgagtttagagatgcgatgaaaaaagaaaaccctaacgtatatetaacgggtgaagtatgggat cagcctgaagtggtagctcctüctatcaatcgcttgattctttatttaattttgatttagcaggaaaaattgtcagctctgtaaflagcaggaaatgatc aaggaaicgccactgcagcagcggcaacagatgaactgttcaaatcatacaatccaaataaaattgacggcattttcrtaaccaaccatgaccaa aatcgc gtcatgagtgagctgagc ggcgatgtgaacaaagçaaaatcagctgcttctatcttac ttacgcttcctggcaa cccgtatatttattac g gtgaagaaattggcatgaccggtgaaaagcctgatgagttaatccgtgaaccattccgctggtacgaaggaaacggacttggacaaactagct gggaaacacctgtataiaacaaaggcggcaacggcgtgtctgtagaagtacaaaccaaacaaaaggattctttgttaaatcattatcgtgaaatg attcgcgtgcgtcagcagcatgaagagttagtaaaaggaacgcttcaatctatttcagtagacagtaaagaagtggttgcctatagtcgc3cgtat aaaggcaactcgattagcgtgtatcataatatttcaaateaacctgtaaaagtatctgtagcagcgaaaggtaaattgatttttgctagtgaaaaagg tgctaaaaaagtcaaaaatcagcttgtaattccggçtaatacaacggttttaataaaataa

SEQID NO: 184

Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Glu Ala Thr Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Thr Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asn Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn Ile Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr De Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Vai Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser De Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu lie Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Ile Lys SEQID NO: 185 atgaaactgatgaaa gggaaaaaatggacagc tttagc tctaacactgccgctggctgc tagc ttatcaacaggcgttcacgccga aactgtac ataaaggtaaagctccaacagcagataaaaacggtgtcttttatgaggtgtatgtaaactctttttacgatgcaaataaagatggacatggtgattta aaaggtcttacacaaaagctggac tattta aatgacggaaattctcatacaaagaatga tctt caagtaaacgggatttggatgatgccagtcaac ccttctcctagctatcataaatatgatgtaacggattattataacattgatccgcagtacggaaatctgcaagattttcgcaagctgalgaaagaagc agacaaacgagacgtaaaagtcatlatggaccttgttgtgaatcatacgagcagcgaacacccttggtttcaagctgcgttaaaagataaaaaca gcaagtacagagattactatatttgggctgataaaaataccgacttgaatgaaaaaggatcttggggacagcaagtatggcataaagctccaaac ggagagtatttttacggaacgttttgggaaggaatgcctgacttaaattacgataaccctgaagtaagaaaagaaatgattaacgtcggaaagtttt ggctaaagcaaggcgttgatggcttccgcttagatgctgcgcttcatatttttaaaggtcaaacgcctgaaggcgctaagaaaaatattctgtggt ggaatgagtttagagatgcgatga aaaaagaaaaccctaacgta tatctaacgggtgaagtatggga tca gcc tgaagtggtagctccttactat caatcgcttgattccctatttaactttgatttagcagggaaaat^gtcagttctgtaaaagcaggaaatgatcaaggaatcgccactgcagcagcgg caa cggatg age tgttcaaatcatacaalccaaataaaattgac ggcattttcttaac caa cc atgaccaaaacc gcgtcatgagtgaactga tcg gcgatgtgaacaaagcaaaatcagctgcttctatcttacttacgcttcctggcaacccgtatamattacggtgaagaaattggcatgaccggtga aaagcctgatgagttaatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaaccâgctgggaaacacctgtatataacaaagg

Fig 16 (cont.)

104/116 cggca ac ggcgtgtctgtagaagcacaaaccaaacaaaaggattctttgttaaatca ttacc gtgaaalga ttegcgtgcgtcagcagcatgaag agttagtaaaaggaacgcttcaatctattttagtagacagtaaagaagttgttgcctatagccgtacgtataaagacaaclcgattagcgtgtatcat aatatttcaaatcaaccggtaaaagtatctgtagcagcaaaaggtaaattaatttttgctagtgaa3aaggtgctaaaaaagtcaagaatcagcttg tgattccggctaataca acggttttaataaaata a

SEQ IDNO: 186

Met Lys Leu Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ala Pro Thr Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn He Leu Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly He Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly He Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ile Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr He Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu He Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met He Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Leu Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Asp Asn Ser He Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu He Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu He Lys

SEQ IDNO: 187 ttgtatctcatccaggaggggcacatgcgttttccgcccattattcacccgc ttacc ggcctggccgttccggttggagctctgcgtaccgcacag a gctgcggcataggggagtttgccgactlgccggttcttgccgaattctgcaaaaaagccggatttgatcttgtac agcttcttcc ggtc aatgac accggcaca gaaagttctcca taca gcgcgctttc tgcc tttgccctgcacccgctgtatatcaggctttcc gacc tgcc tgaa gca gc gggtttc gaaaagcagattacagatctgaaaagccggtttgagga cttgcc tcgtttcagctatac ggagctgcgcc gtgccaaactg gatatcctgc gtgc agtgtttgataaaaacaaggcaac catcatcggcagtgccgaac tggaagcctggatttcag ata acccctggatcatcgaatatgcggttttta t gaaccagaaacaccgcaactttgaagccggctggaaacattgggaaaagctgcgcaaccccactcataacgaaatacaaaaaacctggcag ggtaaaacctggcaggc tgaccatcaattctttgca tggctgcag atgcggctggaccagcagtttactgcc gcc gcta c agagtgc aacgcc ctgggtgtctatcttaagggcgatatacctataatgatgaacgaggattcc gcagatgcc tgggcgaatc c ggaattc ttccgtgacgatcttcgg gccggaagtccccctgacggtgaaaacccccagggacaaaactggggcttccccarttataactgggaaaaccttgcaaatgacgggtacag ctggtggaaaaaac gtctgaagcacagcgcacggtattaccatgcctac cgca ttgac catattettgggtttttcc ggatatgggctata ccc tat ggcgaata ctc cggctacctggga tggcccttgccgcatgaaccggtaagtg cagcagaactggcag aa cggggc ttttc caaggac cgctt gcgctggc ttacc gaaccccacttgcctacacgggcagccgaggaagc gaa taactgggactatctgggaacacac ggc tatctgaatcaga tcatgaa ccgtatcggtgaag aagaactatggctgttcaagccc gagatcacctgcgaggcagatatac gaa acaca aacctgccggatgccc tgaaag aggttctggtacggca gtggaa aaa ccggc tgctgcaggttaccggcc gcgacgaaaaaggacggacaatctacta tccgctgtgg cgtttccgtgacagcacigcatggcagacgcttaccgatggcgagaaacactccctggaagagctgttcgcccaaaaagcggcgcacaatga aa ccctgtggcgagaa c aggcggtggaacttctgggtgagctgacgcgatcta cg gatatgcttgc ctgtgc tgaa ga lctgggaa gtattccc ca cagtgtac cggaagtgctttcaaac ctttc aatttacagtctgcgggttacccgctgggcccgccaatggga tgccccc ggccagccctttca ca gactggaggagtatccgctcatgtcggta gcgacc ccateggttcatgattcctctaccctgcgcggatggtgggaa ac cgaaggcggc ga ccgggcctttatggacgcatggcctccggaacaggatgcatacgcaggagcaggccgccatgagttcgaaggcgcctggggaccccgcca

Fig 16 (cont.)

105/116 ggcatcctgggtactccguaactctgcgaagcccgttccgcgctctgtgttttccccatccaggatattttggccctgtcttcagacrtttatgcaat gacagcggacgaggaacgeatcaatattccÊggcagtgtatccggatttaactggacataccggttgcctgcggcaatcgaggatttatctaaa aacagccaacttttaaccgcaatccagaccgcgttgcaggaccgccgggcgaggaaggeacaaggagcacagcaatga

SEQIDNO: 188

Met Tyr Leu Ile Gin Glu Gly Hís Met Arg Phe Pro Pro Ile Ile His Pro Leu Thr Gly Leu Ala Vai Pro Vai Gly Ala Leu Arg Thr Ala Gin Ser Cys Gly He Gly Glu Phe Ala Asp Leu Pro Vai Leu Ala Glu Phe Cys Lys Lys Ala Gly Phe Asp Leu Vai Gin Leu Leu Pro Vai Asn Asp Thr Gly Thr Glu Ser Ser Pro Tyr Ser Ala Leu Ser Ala Phe Ala Leu His Pro Leu Tyr Ile Arg Leu Ser Asp Leu Pro Glu Ala Ala Gly Phe Glu Lys Gin Ile Thr Asp Leu Lys Ser Arg Phe Glu Asp Leu Pro Arg Phe Ser Tyr Thr Glu Leu Arg Arg Ala Lys Leu Asp Ile Leu Arg Ala Vai Phe Asp Lys Asn Lys Ala Thr Ile Ile Gly Ser Ala Glu Leu Glu Ala Tip Ile Ser Asp Asn Pro Trp Ile Ile Glu Tyr Ala Vai Phe Met Asn Gin Lys His Arg Asn Phe Glu Ala Gly Trp Lys His Trp Glu Lys Leu Arg Asn Pro Thr His Asn Glu lie Gin Lys Thr Tip Gin Gly Lys Thr Trp Gin Ala Asp His Gin Phe Phe Ala Trp Leu Gin Met Arg Leu Asp Gin Gin Phe Thr Ala Ala Ala Thr Glu Cys Asn Ala Leu Gly Vai‘Tyr Leu Lys Gly Asp Ile Pro Ile Met Met Asn Glu Asp Ser Ala Asp Ala Tip Ala Asn Pro Glu Phe Phe Arg Asp Asp Leu Arg Ala Gly Ser Pro Pro Asp Gly Glu Asn Pro Gin Gly Gin Asn Trp Gly Phe Pro Ile Tyr Asn Trp Glu Asn Leu Ala Asn Asp Gly Tyr Ser Trp Trp Lys Lys Arg Leu Lys His Ser Ala Arg Tyr Tyr His Ala Tyr Arg He Asp His Ile Leu Gly Phe Phe Arg He Trp Ala Ile Pro Tyr Gly Glu Tyr Ser Gly Tyr Leu Gly Trp Pro Leu Pro His Glu Pro Vai Ser Ala Ala Glu Leu Ala Glu Arg Gly Phe Ser Lys Asp Arg Leu Arg Trp Leu Thr Glu Pro His Leu Pro Thr Arg Ala Ala Glu Glu Ala Asn Asn Tip Asp Tyr Leu Gly Thr His Gly Tyr Leu Asn Gin Ile Met Asn Arg He Gly Glu Glu Glu Leu Trp Leu Phe Lys Pro Glu He Thr Cys Glu Ala Asp Ile Arg Asn Thr Asn Leu Pro Asp Ala Leu Lys Glu Vai Leu Vat Arg Gin Trp Lys Asn Arg Leu Leu Gin Vai Thr Gly Arg Asp Glu Lys Gly Arg Thr He Tyr Tyr Pro Leu Tip Arg Phe Arg Asp Ser Thr Ala Tip Gin Thr Leu Thr Asp Gly Glu Lys His Ser Leu Glu Glu Leu Phe Ala Gin Lys Ala Ala His Asn Glu Thr Leu Trp Arg Glu Gin Ala Vai Glu Leu Leu Gly Glu Leu Thr Arg Ser Thr Asp Met Leu Ala Cys Ala Glu Asp Leu Gly Ser He Pro His Ser Vai Pro Glu Vai Leu Ser Asn Leu Ser Ile Tyr Ser Leu Arg Vai Thr Arg Trp Ala Arg Gin Tip Asp Ala Pro Gly Gin Pro Phe Hís Arg Leu Glu Glu Tyr Pro Leu Met Ser Vai Ala Thr Pro Ser Vai His Asp Ser Ser Thr Leu Arg Gly Trp Trp Glu Thr Glu Gly Gly Asp Arg Ala Phe Met Asp Ala Trp Pro Pro Glu Gin Asp Ala Tyr Ala Gly Ala Gly Arg His Glu Phe Glu Gly Ala Trp Gly Pro Arg Gin Ala Ser Tip Vai Leu Arg Lys Leu Cys Glu Ala Arg Ser Ala Leu Cys Vai Phe Pro He Gin Asp He Leu Ala Leu Ser Ser Asp Phe Tyr Ala Met Thr Ala Asp Glu Glu Arg Ile Asn Ile Pro Gly Ser Vai Ser Gly Phe Asn Tip Thr Tyr Arg Leu Pro Ala Ala He Glu Asp Leu Ser Lys Asn Ser Gin Leu lie Thr Ala Ile Gin Thr Ala Leu Gin Asp Arg Arg Ala Arg Lys Ala Gin Gly Ala Gin Gin

SEQIDNO: 189 atgcaaacga ttgc aaa aaaaggggatgaaacgatgaaagggaaaaaatggacagctttagc tctaacactgccgctggctgc tagc tta tca acaggcgttcacgccgaaaccgtacataaaggtaaatetccagctgcagataaaaacggtgtcttttatgaggtgtttgUaactctttttacgatg caaataaagatggacatggtgatttaaaaggtcttacacaaaaactggactatttaaatgatggcaattctcatacaaagaatgatcttcaa gtaaa cgggatttggatgatgcc gatcaacccttctcctagc tatea taaatatgatgtaacgga cta tta taacattgattctcagtacggaaatctgcaag attttcgcaagctaatgaaagaagcagataaacgagatgtaaaagttattatggacctcgttgtgaatcatacgagcagtgaacaccctiggtttca agctgc gttaaaagataaaaaca gca agtacagagattaclatatttgggc tgataaaaata ccgatttgaatgaaaaaggatcttgggga caac aagtatggcacaaagctccaaacggagagtatttttacggaac£ttctgggaa ggaatgcctgacttaa attac gataaccc tgaagta agaaaa gaaatgatta acgtcg gaaagttttggctaaagca aggcgttgacggcttccgc ttagatgc tgcccttcatatctttaaaggtcaaacacc tgaa ggc gctaagaaaaatattgtgtggtggaatgaatttagagatgcgatgaaaaaa gaaaacccgaacgtatatc taacgggcgaagtatgggatc agccggaagtggtagctccttattatcagtcgcttgattccctatttaactttgattugcaggaaaaattgtcagctctgtaaaagcaggaaatgatc aaggaatcgctactgc agcagcggcaacagatgaaetgttcaaatcatacaatcca aa taaaattgacggcattttc ttaaccaatcatgaccaaa atcgcgtcatgagtgagttaagcggagatgtcaataaagcaaagtcagctgcctctatcttacttacgcttcctggaaatccgtatatttattacggt gaagaaatcggcatgaccggtgaaaagcctgatgaattaatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaactagttgg * ·

Fig [6 (cont.)

106/1 Ib gaaacacctgtatacaataaaggcggcaacggcgtgtctgtagaagcacaaaccaaacaaaaggactctttgttaaatcattaccgtgaaatgat

Icgcgtgcgtcagcagcacgaagagttagtaaaaggaacgcttcaalctatticagtagacagtoaagaagttgttgcttotogccgtocgtaiaa ag gcaactccattagtgtgta tcataa latttcaaatcaacctgtaaaagto tctgta gcagc gaaaggtaaattgatttttgcta gtgaa aaaggtg ctaaaaaggtcaaaaatcagcttgtgatlccggcgaatacaacggttttagtaaaataa

SEQ IDNO: 190

Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Trp Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Pro Ala Ala Asp Lys Asn Gly Vai Phe Tyr Glu Vai TyT Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Trp Met Met Pro lie Asn Pro Ser Pro Ser TyT His Lys Tyr Asp Vai Thr Asp Tyr Tyr Asn Ile Asp Ser Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vai Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn TyT Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His Ile Phe Lys Gly Gin Thr Pro Glu Gly Ala Lys Lys Asn He Vai Trp Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai Tyr Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys lie Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly Ile Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly Ile Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Asn Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile Tyr Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu Ile Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu Gly Gin Thr Ser Trp Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile Ser Vai Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Vai Tyr His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Ile Pro Ala Asn Thr Thr Vai Leu Vai Lys SEQ IDNO: 191 atgcaaacgattgcaaaaaaaggggalgaaacgÊlgaaagggaaaaaatggacagctttagcictaacactgccgctggctgcíagcttatca acaggcgttcacgcc gaaaccgta cataaaggta aatctccaacagcagataaaa acggtgtctttta tgaagtgtatgtaaa ctctttttacga tg caaataaagatggacatggtgacttaaaaggtcrtacacaaaagttggactatttaaatgacggcaattctcatacaaaaaatgatcttcaagtaaa cgggatttggatgatgccagtcaacccttctcctagctatcataaatatgatgtaacggactattataacattgatccgcagtacggaaatçtgcaa gattttcgcaagctgatgaaagaagcagacaaacgagacgtaaaagtcattatggacct1gttgtgaatcatacgagcagtgaacacccttggttt caagctgcgttaaaagataaaaacagcaagtocagagattocto(atttgggctgataaaaataccgacttgaatgaaaaaggatcttggggaca acaagtotggcatoaagctccaaacggagagtotttnacggaacgttctgggaaggaatgcctgacttaaattacgataaccctgaagtaagaa aagaaatgattaacgtcggaaagttttggctaaagcaaggcgttgacgggttccgcttogatgctgcgctrcatatttttoaaggtcaaacagctga aggc gc toa ga aaaa tatee igtggtggaatgagtttagagatgcgatgaaaaaagaaaa tccga a tgtatatcta acgggt gaagta tgggal cagcctgaagtggtagctccttattatcaatcgcttgattctttatttoattttgatttagcaggaaaaattgtcagctctgtaaaagcaggaaatgatc aaggaatcgccactgcagcagcagcaacagatgaactgrtcaaatcatacaatccaaacaaaartgatggcatattcttaaccaaccatgaccaa aatcgcgtcatgagtgagctgagcggcgatgtgagcaaagcaaaatcagctgcttctatcttacttacgcttcctggcaacccgtatatttattacg gtgaagaaatcggcatgaccggtgaaaagcctgatgaattoatccgtgaaccgttccgctggtacgaaggaaacggacttggacaaaccagtt gggaaacacctgtatacaatoaaggcggaaacggtgtgtctgtogaagcacaaaccaaacaaaaggattctttgttaaatcartaccgtgaaatg attcgcgtgcgtcagcagcatgaagagttagtaaaaggaacgcttcaatctotttcagtogacagtaaagaagttgttgcttotagccgtacglata aaggcaaclccanagtgtgtatcatoaratttcaaatcaaccggtaaaagtaictgtagcagcgaaaggtaaattgatttttgctagtgaaaaaggt gctaagaaagtcaaaaatcagcttgtggttccggcgaatacaacggttttaatgaaatoa

SEQ IDNO: 192 i

107/116

Fig 16 (cont.)

Met Gin Thr Ile Ala Lys Lys Gly Asp Glu Thr Met Lys Gly Lys Lys Ττρ Thr Ala Leu Ala Leu Thr Leu Pro Leu Ala Ala Ser Leu Ser Thr Gly Vai His Ala Glu Thr Vai His Lys Gly Lys Ser Pro Thr Ala Asp Lys Asn Gly Vai Phe TyT Glu Vai Tyr Vai Asn Ser Phe Tyr Asp Ala Asn Lys Asp Gly His Gly Asp Leu Lys Gly Leu Thr Gin Lys Leu Asp Tyr Leu Asn Asp Gly Asn Ser His Thr Lys Asn Asp Leu Gin Vai Asn Gly Ile Tip Met Met Pro Vai Asn Pro Ser Pro Ser Tyr His Lys Tyr Asp Vai Thr Asp Tyr TyT Asn Ile Asp Pro Gin Tyr Gly Asn Leu Gin Asp Phe Arg Lys Leu Met Lys Glu Ala Asp Lys Arg Asp Vai Lys Vai Ile Met Asp Leu Vat Vai Asn His Thr Ser Ser Glu His Pro Trp Phe Gin Ala Ala Leu Lys Asp Lys Asn Ser Lys Tyr Arg Asp Tyr Tyr Ile Trp Ala Asp Lys Asn Thr Asp Leu Asn Glu Lys Gly Ser Trp Gly Gin Gin Vai Trp His Lys Ala Pro Asn Gly Glu Tyr Phe Tyr Gly Thr Phe Trp Glu Gly Met Pro Asp Leu Asn Tyr Asp Asn Pro Glu Vai Arg Lys Glu Met Ile Asn Vai Gly Lys Phe Trp Leu Lys Gin Gly Vai Asp Gly Phe Arg Leu Asp Ala Ala Leu His He Phe Lys Gly Gin Thr Ala Glu Gly Ala Lys Lys Asn Ile Leu Ττρ Trp Asn Glu Phe Arg Asp Ala Met Lys Lys Glu Asn Pro Asn Vai TyT Leu Thr Gly Glu Vai Trp Asp Gin Pro Glu Vai Vai Ala Pro Tyr Tyr Gin Ser Leu Asp Ser Leu Phe Asn Phe Asp Leu Ala Gly Lys Ile Vai Ser Ser Vai Lys Ala Gly Asn Asp Gin Gly He Ala Thr Ala Ala Ala Ala Thr Asp Glu Leu Phe Lys Ser Tyr Asn Pro Asn Lys Ile Asp Gly He Phe Leu Thr Asn His Asp Gin Asn Arg Vai Met Ser Glu Leu Ser Gly Asp Vai Ser Lys Ala Lys Ser Ala Ala Ser Ile Leu Leu Thr Leu Pro Gly Asn Pro Tyr Ile TyT Tyr Gly Glu Glu Ile Gly Met Thr Gly Glu Lys Pro Asp Glu Leu He Arg Glu Pro Phe Arg Trp Tyr Glu Gly Asn Gly Leu G ly Gin Thr Ser Ττρ Glu Thr Pro Vai Tyr Asn Lys Gly Gly Asn Gly Vai Ser Vai Glu Ala Gin Thr Lys Gin Lys Asp Ser Leu Leu Asn His Tyr Arg Glu Met Ile Arg Vai Arg Gin Gin His Glu Glu Leu Vai Lys Gly Thr Leu Gin Ser Ile SeT Vaí Asp Ser Lys Glu Vai Vai Ala Tyr Ser Arg Thr Tyr Lys Gly Asn Ser Ile Ser Vai TyT His Asn Ile Ser Asn Gin Pro Vai Lys Vai Ser Vai Ala Ala Lys Gly Lys Leu Ile Phe Ala Ser Glu Lys Gly Ala Lys Lys Vai Lys Asn Gin Leu Vai Vai Pro Ala Asn Thr Thr Vai Leu Met Lys SEQ IDNO: 193 atgaaattcaaaaagagtttatctgcçgggctccttttgttcggagglCtgagcggtgtgacaccatccgtcgctgcggaggtgccacgaaccgc atttgtccatttattcgaatggagttggccggatattgccaccgaatgcgaaacctttcttggccctaaggggttctctgcggttcaggtgtctccgc

Cgcaaaaaagcgtcagcaatgctgcctggtgggcgcgctaccaacct£ttagttactcttttgaagggcgcagtggaacccgggctcaatttgc ggatatggtccagcgttgtaaagcggtgggggtcgatatttatctggatgcggtgatcaaccatatggcagcacaagalcgctattttccagaagt accttacagcagUalgattttcacagttgcacgggcgatatcgattattccaaccgctggtcgattcaaaattgcgatctggttgggctgaacgat ctcaaaaccga gtc agaatacgttcggcagaaaattgcagactatatgaacgatgcgctcagtc tgggc gtggcggggtttcggattgatgccg ccaagcatatcccggccggcgacatcgcggcgatcaagagcaagctcaacggcagcccgtatatctatcaggaggttatcggggcggcagg ggagccggtacaaaccagcgaglacacgtatattggagacgtgacggaatttaacttcgcccggaccatcgggcctaaatttaagcaaggtaat attaaagacctgcaggggattggttcgtggagcggctggctgagcagcgacgatgcggt gac ctttgtgaccaaccatgacgaagaac gcca taaccc tggccaggttctcagccatc a ggactttggcaatctgtatttcctcggtaac gtgtttactc tggcgtatc cttacggc tacc caa aa gtga tgtcggggtactacttcagtaattttgatgccgggccaccatcgacaggggtacattctggtaatgcgtgtggcttlgatggcggtgattgggtctg cgaacacaaatggcgtggtgtagccaacatggtggcgtttcgcaaccacacagcagcccagtggcaggtcactgactggtgggacgatggtt acaatcaggtggcgtttggtcgtggcgggctgggctttgtggtgatcaatcgagatgacaaLaaaggcatcaatcagagtttccagacgggaat gcccgctggcgagtattgtgacatcattgccggtgatttcgacacccagagcggtcattgcagcgctacgacgatcaccgtcgacagtcaggg gtotgcacattuactgicggtagtcatcaggccgctgcgattcacattggcgcgaaactcggctccgtgtgccaggactgtggcggcacggcc gcagagacaaaagtctgctttgacaatgcacaaaactttagccaaccgtatttgcattactggaatgicaatgcggatcaggccgtagcgaatgc aacctggccgggcgtcgcgatgacggctgaaaatggcggttactgctacgattttggtgtcggtctcaattcacttcaggtaattttcagcgataa cggcgccagccaaaccgctgalctgaccgcçagcaglccgacgttgtgttac caga ac ggaacgtggc gtga ca gtga cttctgtcagagta gcaatgtgggcaacgagagrtggtatttccgtggaacclcaaacggttggggcgtgagcgcactcacttatgaggctgcgacaggcctgtaca ctac ggtgcagagc tttaa cggggagga gtc gccc gcac gcttta aa atigatgatggc aactggaglgagtcglatccaagtgc tgattatcaa gtcggtgattatgccacctacacgatcacgtttgacagccagacgaaggccatcaccgtgacncgcagtaa

SEQ IDNO: 194

Met Lys Phe Lys Lys Ser Leu Ser Ala Gly Leu Leu Leu Phe Gly Gly Leu Ser Gly Vai Thr Pro Ser Vai Ala Ala Glu Vai Pro Arg Thr Ala Phe Vai His Leu Phe Glu Trp Scr Trp Pro Asp Ile Ala Thr

108/116

Fig 16 (cont.)

Glu Cys Glu Thr Phe Leu Gly Pro Lys Gly Phe Ser Ala Vai Gin Vai Ser Pro Pro Gin Lys Ser Vai Ser Asn Ala Ala Trp Trp Ala Arg Tyr Gin Pro Vai Ser Tyr Ser Phe Glu Gly Arg Ser Gly Thr Arg Ala Gin Phe Ala Asp Met Vai Gin Arg Cys Lys Ala Vai Gly Vai Asp Ile Tyr Leu Asp Ala Vai Ile Asn His Met Ala Ala Gin Asp Arg Tyr Phe Pro Glu Vai Pro Tyr Ser Ser Asn Asp Phe Hís Ser Cys Thr Gly Asp He Asp Tyr Ser Asn Arg Trp Ser lie Gin Asn Cys Asp Leu Vai Gly Leu Asn Asp Leu Lys Thr Glu Ser Glu Tyr Vai Arg Gin Lys Ile Ala Asp Tyr Met Asn Asp Ala Leu Ser Leu Gly Vai Ala Gly Phe Arg Ile Asp Ala Ala Lys Hís Ile Pro Ala Gly Asp Ile Ala Ala Ile Lys Ser Lys Leu Asn Gly Ser Pro Tyr Ile Tyr Gin Glu Vai Ile Gly Ala Ala Gly Glu Pro Vai Gin Thr Ser Glu Tyr Thr TyT Ile Gly Asp Vai Thr Glu Phe Asn Phe Ala Arg Thr Ile Gly Pro Lys Phe Lys Gin Gly Asn Ile Lys Asp Leu Gin Gly Ile Gly Ser Trp Ser Gly Trp Leu Ser Ser Asp Asp Ala Vai Thr Phe Vai Thr Asn His Asp Glu Glu Arg His Asn Pro Gly Gin Vai Leu Ser Hís Gin Asp Phe Gly Asn Leu Tyr Phe Leu Gly Asn Vai Phe Thr Leu Ala Tyr Pro Tyr Gly Tyr Pro Lys Vai Met Ser Gly Tyr Tyr Phe Ser Asn Phe Asp Ala Gly Pro Pro Ser Thr Gly Vai His Ser Gly Asn Ala Cys Gly Phe Asp Gly Gly Asp Trp Vai Cys Glu His Lys Trp Arg Gly Vai Ala Asn Met Vai Ala Phe Arg Asn His Thr Ala Ala Gin Trp Gin Vai Thr Asp Trp Trp Asp Asp Gly Tyr Asn Gin Vai Ala Phe Gly Arg Gly Gly Leu Gly Phe Vai Vai Ile Asn Arg Asp Asp Asn Lys Gly Ile Asn Gin Ser Phe Gin Thr Gly Met Pro Ala Gly Glu Tyr Cys Asp Ile Ile Ala Gly Asp Phe Asp Thr Gin Ser Gly His Cys Ser Ala Thr Thr Ile Thr Vai Asp Ser Gin Gly Tyr Ala His Phe Thr Vai Gly Ser His Gin Ala Ala Ala Ile His Ile Gly Ala Lys Leu Gly Ser Vai Cys Gin Asp Cys Gly Gly Thr Ala Ala Glu Thr Lys Vai Cys Phe Asp Asn Ala Gin Asn Phe Ser Gin Pro Tyr Leu His Tyr Trp Asn Vai Asn Ala Asp Gin Ala Vai Ala Asn Ala Thr Trp Pro Gly Vai Ala Met Thr Ala Glu Asn Gly Gly Tyr Cys Tyr Asp Phe Gly Vai Gly Leu Asn Ser Leu Gin Vai He Phe Ser Asp Asn Gly Ala Ser Gin Thr Ala Asp Leu Thr Ala Ser Ser Pro Thr Leu Cys Tyr Gin Asn Gly Thr Tip Arg Asp Ser Asp Phe Cys Gin Ser Ser Asn Vai Gly Asn Glu Ser Trp Tyr Phe Arg Gly Thr Ser Asn Gly Trp Gly Vai Ser Ala Leu Thr Tyr Glu Ala Ala Thr Gly Leu Tyr Thr Thr Vai Gin Ser Phe Asn Gly Glu Glu Ser Pro Ala Arg Phe Lys Ile Asp Asp Gly Asn Trp Ser Glu Ser Tyr Pro Ser Ala Asp Tyr Gin Vai Gly Asp Tyr Ala Thr Tyr Thr Ile Thr Phe Asp Ser Gin Thr Lys Ala Ile Thr Vai Thr Ser Gin

SEQ IDNO: 195 atgctgacagaccgtttc tttgatggcgatacatca aacaa cgacccttacaac cagaactacgatgctaaaaacgacc ggggaacttatcagg gcggcgattttaaaggaalcacgcaaaaattggattatctcgataagctaggcgtgaacacaatctgga(cagcccgatcgtggaaaatatcaag ca tga tgtcc gttatgacaac tctga agggcattcaíactatgcttaccacggcta c Igggcaagcaacttcggtgcgttaaacccacactt cggt acaatggaagatttccatacactgattgacgctgcccatgaaaaaggcatcaagatcatggttgacgtagtattaaaccacaciggttatggctta aaagatatcaacggagaagtttccaa tcc tccagccggttacccaactgacgcagaacgcagcaca tata gcagcctgcttcgccagggtlca aatgtcggctctgatgaggttgttggcgaattagctggccUcctgacttaaaaacagaagaccccgcagtccgccagacaatcatcgaclggc aaacagactggatcacgaaagctactacagctaaaggaaacacaartgactacttccgtgtcgacactglgaagcacgttgaagacgcaacat ggatggcattcaaaaatgacctcactgaaaaaatgccgacacacaaaatgatcggggaagcttggggagcaagtgccaataaccaacttggat accttgaaacaggtatgatggactcactgctigacttcgacttcaaaggcattgcgcacgatttcgtgaacggcaagcttaaggcagcaaacgat gcc ctgac tgcccgcaacggta aaattgacaacacagctactttaggttcattccttggaagccatgacgaagatggtttccta tttaaa gaagga aatgacaaaggcaagctlaaggttgctgCttcectgcaagcaacatcaaaaggccagccggtcatctattatggtgaagagcttggtcaaagtg ga gcaaaca actatcc gca atacgataaccgttatgacctggcatgggacaaa gtt gaaaacaa cgac gtccttgagcactacactaaggtcct gaacttcagaagcgctcattcagaagtgttcgctaaaggtgaacgcgcaacaattggcggttctgacgctgataaattcttactttttgctcgtaaa aatggaaacgaagctgcttacgtcggcttgaacgttgctgacacagcaaaagacgtaacactgactgtttcigcaggtgcaglcgtaactgacc actatgcagataaaacttatactgcttcagaagctggagaaatcacattgacgatcccggcaaaagctgatggcggtactgttttactaacggttg ^aagg^cBB^ag^aaatcac agctgctaaagcggcaagcgaaggcgacggcaca gttga gccagtccctgcgaaccacatccgcattcactacaa ccgtacagacaacaactatgaaaactacggtgcatggctgtggaacgatgtagcctccccttctgccaactggccgactggcgctacaatgtttg aaaaaacagacagctacggtgcatacatçgacgtaccacttaaagagggcgctaagaacatcggcttcctcgttalggaigtaacaaaaggtga tCâgggtaaagacggcggcgacaaaggttttacgatctcatcacctgaaatgaacgaaatttggatcaagcaaggttctgacaaggtgtacactt acgagccagttgatcttccggcgaacactgtccgcgtccactatgtacgtgacaacgcagactacgaaaacttcggtatctggaactggggcga tgtaacagcaccttccgaaaactggcciacaggcgcagcgaaancgatggtacagaccgttacggtgcgtatgtcgacattacgclaaaagaa

Fig 16 (cont.)

109/116 ggcgcaaagaacattggaatgattgctcttaâcactgcaaatggagagaaagacggcggagataaatccttcaaccttctggataaalataatcg catrtggartaaacaaggtgatgacaatgtctacgtttctccatactgggagcaggcaacaggaatcaccaatgcagaggtaatctclgaagata cga ttciattaggcttcacaatgac tgacggc ttaacacctgaatctttaaaaggaggtcttgtaa tiaaagattcaac tggtgc tgaa gttgccatc gaaagtgctgaaatcacaagcgcaacctctgtaaaagtaaaagcaacattcgatttagaaaagcttccattatccatcacatacgcaggcagaac agtttcagcttcaactggctggagaatgcttgatgaaatgtacgcttatgatggaaacgaccttggtgcgacttacaaggacggagcagcgacg cttaaattatgggctccgaaagcgagcaaggtaaccgctaacttctttgataaaaaiaatgccgctgaaaaaatcggcagcgtcgagttaacgaa gggtgaaaaaggagtctggtcagctatggttgctcctggcgacctgaacgtaaccgatcttgaaggttatttttaccagtatgatgtaacaaatga c ggtata actcgc caggtgttagatccttatgeaaaatcaatggcagc ctttactgtgaa tac a ga aggcaatgc tggtcc tga cggggac actg ttg gcaa ggc ggcaa ttcaaaaagcttctcgagagtacttctag

SEQID NO: 196

Met Leu Thr Asp Arg Phe Phe Asp Gly Asp Thr Ser Asn Asn Asp Pro Tyr Asn Gin Asn Tyr Asp Ala Lys Asn Asp Arg Gly Thr Tyr Gin Gly Gly Asp Phe Lys Gly Ile Thr Gin Lys Leu Asp Tyr Leu Asp Lys Leu Gly Vai Asn Thr Ile Trp Ile Ser Pro Ile Vai Glu Asn Ile Lys His Asp Vai Arg Tyr Asp Asn Ser Glu Gly His Ser Tyr Tyr Ala Tyr His Gly Tyr Trp Ala Ser Asn Phe Gly Ala Leu Asn Pro Hís Phe Gly Thr Met Glu Asp Phe His Thr Leu Ue Asp Ala Ala His Glu Lys Gly Ile Lys Ile Met Vai Asp Vai Vai Leu Asn His Thr Gly Tyr Gly Leu Lys Asp Ile Asn Gly Glu Vai Ser Asn Pro Pro Ala Gly Tyr Pro Thr Asp Ala Glu Arg Ser Thr Tyr Ser Ser Leu Leu Arg Gin Gly Ser Asn Vai Gly Ser Asp Glu Vai Vai Gly Glu Leu Ala Gly Leu Pro Asp Leu Lys Thr Glu Asp Pro Ala Vai Arg Gin Thr Ile lie Asp Trp Gin Thr Asp Trp Ile Thr Lys Ala Thr Thr Ala Lys Gly Asn Thr Ile Asp Tyr Phe Arg Vai Asp Thr Vai Lys His Vai Glu Asp Ala Thr Trp Met Ala Phe Lys Asn Asp Leu Thr Glu Lys Met Pro Thr His Lys Met Ile Gly Glu Ala Trp Gly Ala Ser Ala Asn Asn Gin Leu Gly Tyr Leu Glu Thr Gly Mel Met Asp Ser Leu Leu Asp Phe Asp Phe Lys Gly Ile Ala His Asp Phe Vai Asn Gly Lys Leu Lys Ala Ala Asn Asp Ala Leu Thr Ala Arg Asn Gly Lys Ile Asp Asn Thr Ala Thr Leu Gly Ser Phe Leu Gly Ser His Asp Glu Asp Gly Phe Leu Phe Lys Glu Gly Asn Asp Lys Gly Lys Leu Lys Vai Ala Ala SeT Leu Gin Ala Thr Ser Lys Gly Gin Pro Vai Ue Tyr Tyr Gly Glu Glu Leu Gly Gín Ser Gly Ala Asn Asn Tyr Pro Gin Tyr Asp Asn Arg Tyr Asp Leu Ala Trp Asp Lys Vai Glu Asn Asn Asp Vai Leu Glu His Tyr Thr Lys Vai Leu Asn Phe Arg Ser Ala His Ser Glu Vai Phe Ala Lys Gly Glu Arg Ala Thr Ile Gly Gly Ser Asp Ala Asp Lys Phe Leu Leu Phe Ala Arg Lys Asn Gly Asn Glu Alá Ala Tyr Vai Gly Leu Asn Vai Ala Asp Thr Ala Lys Asp Vai Thr Leu Thr Vai Ser Ala Gly Ala Vai Vai Thr Asp His Tyr Ala Asp Lys Thr Tyr Thr Ala Ser Glu Ala Gly Glu Ile Thr Leu Thr Ile Pro Ala Lys Ala Asp Gly Gly Thr Vai Leu Leu Thr Vai Glu Gly Gly Glu Ile Thr Ala Ala Lys Ala Ala Ser Glu Gly Asp Gly Thr Vai Glu Pro Vai Pro Ala Asn Hís Ile Arg Ile His Tyr Asn Arg Thr Asp Asn Asn Tyr Glu Asn Tyr Gly Ala Trp Leu Trp Asn Asp Vai Ala Ser Pro Ser Ala Asn Trp Pro Thr Gly Ala Thr Met Phe Glu Lys Thr Asp Ser Tyr Gly Ala Tyr Ile Asp Vai Pro Leu Lys Glu Gly Ala Lys Asn Ile Gly Phe Leu Vai Met Asp Vai Thr Lys Gly Asp Gin Gly Lys Asp Gly Gly Asp Lys Gly Phe Thr Ile Ser Ser Pro Glu Met Asn Glu Ile Trp Ile Lys Gin Gly Ser Asp Lys Vai Tyr Thr Tyr Glu Pro Vai Asp Leu Pro Ala Asn Thr Vai Arg Vai His Tyr Vai Arg Asp Asn Ala Asp Tyr Glu Asn Phe Gly Ile Trp Asn Trp Gly Asp Vai Thr Ala Pro Ser Glu Asn Trp Pro Thr Gly Ala Ala Lys Phe AspGly Thr Asp Arg Tyr Gly Ala Tyr Vai Asp He Thr Leu LysGlu Gly Ala Lys Asn Ile Gly Met Ile Ala Leu Asn Thr Ala Asn Gly Glu Lys Asp Gly Gly Asp Lys Ser Phe Asn Leu Leu Asp Lys Tyr Asn Arg He Trp Ile Lys Gin Gly Asp Asp Asn Vai Tyr Vai Ser Pro Tyr Trp Glu Gin Ala Thr Gly Ile Thr Asn Ala Glu Vai Ile Ser Glu Asp Thr He Leu Leu Gly Phe Thr Met Thr Asp Gly Leu Thr Pro Glu Ser Leu Lys Gly Gly Leu Vai Ile Lys Asp Ser Thr Gly Ala Glu Vai Ala Ile Glu Ser Ala Glu He Thr Ser Ala Thr Ser Vai Lys Vai Lys Ala Thr Phe Asp Leu Glu Lys Leu Pro Leu Ser Ile Thr Tyr Ala Gly Arg Thr Vai Ser Ala Ser Thr Gly Trp Arg Met Leu Asp Glu Met Tyr Ala Tyr Asp Gly Asn Asp Leu Gly Ala ThrTyr Lys Asp Gly Ala Ala Thr Leu Lys Leu Trp Ala Pro Lys Ala SeT Lys Vai Thr Ala Asn Phe Phe Asp Lys Asn Asn Ala Ala Glu Lys He Gly Ser Vai Glu Leu Thr Lys Gly Glu Lys Gly Vai Trp Ser Ala Met Vai Ala Pro Gly Asp Leu Asn Vai Thr Asp Leu Glu Gly Tyr Phe Tyr Gin Tyr Asp Vai Thr Asn Asp Gly He Thr Arg Gin Vai Leu Asp Pro Tyr Ala

Fíg ] 6 (cont.)

110/116

Lys Ser Met Ak Ala Phe Thr Vai Asn Thr Glu Gly Asn Ala Gly Pro Asp Gly Asp Thr Vai Gly Lys Ala Ála Ile Gin Lys Ala Ser Arg Glu Tyr Phe

SEQIDNO: 197 atgaaa ccgtcaaaattcgtttttctctctgctgccatcgcttgcagcctctccagkcc gccaatgc tgac gcc attttgc atgcarttaactggaa g tactccgacgtcacgcaaaacgcctcgcaaategcggcggcgggttataaaaaagtgctgatttcgccagcactgaaatcgagtggcaalgaa tggtgggcacgttatcaaccgcaagatctgcgcgtgatcgattccccacttggcaacaaaagtgacttaaaatccatgattgatgctclgaaggc ggtcggc gttga tgtgtatgc cgatgtggtgcttaa ccala tggccaatga aacatgga agcgt gaa gacttaaattaccctggcagtgaagtgc tgcaacaatacg ca gctaacaccagttattatgcggaccaa acgctttttggcaa tttaacggaaa ac ctattctctggctttgacttccacccaga aggctgtattagcgattggaatgatgccggcaalgttcagtactggcgtctttgtggcggtgctggtgaccgagggctgccagacttagatccga acaactgggtggtgtcacagcaacgtttgtarttgaargcgctaaaaggtttaggtgtgaaaggcttccgcattgatgcggttaaacacalgagcc aaUlcaaatcgaccagattttcactgcagagattaccgccggaatgcacgtgtttggtgaagtgatcaccagtggtggcaaaggcgactccag ctatgagaacttcttagcgccttatctcaacgccaccaaccattcggcttacgatltcccactgtttgcctctattcgcaacgccttctcctacagcgg tggcatgaacatgcttcatgafccacaagcctatggccaagggcttgaaaacgcacgttcaattacctttaccatcacgc2cgacatcccaacga acga cggtttccgttatcaaatcatggatc cgaaagatgaa ga gctggcttacgcttatatccteggtaaag atgg cggcacacctctgatttac a gcgacaacttacctgâtaacgaagatcgtgakatcgccgttgggaaggtgttlggaaccgtgacctgatgaagaacalgttgcgcttccataac caaatgcaagggcaagagatgacgatgctgtacagcgaccaatgtctactgatgtttaagcgcggtaaacaaggggtggtcggcattaataaat gcggtgaagagcgttctcat3ccgttgacacc£atcagcatgagttcaactggtatcagccttacacagatacactcactggcgtgactgaaacc gtgagttcgcgttaccacaccttccgaattccagctcgcagcgcgcgcatgtacatgctctaa

SEQ IDNO: 198

Met Lys Pro Ser Lys Phe Vai Phe Leu Ser Ala Ala Ile Ala Cys Ser Leu Ser Ser Thr Ala Asn Ala Asp Ala lie Leu His Ala Phe Asn Trp Lys Tyr Ser Asp Vai Thr Gin Asn Ala Ser Gin Ile Ala Ala Ala Gly Tyr Lys Lys Vai Leu Ile Ser Pro Ala Leu Lys Ser Ser Gly Asn Glu Tip Trp Ala Arg Tyr Gin Pro Gin Asp Leu Arg Vai Ile Asp Ser Pro Leu Gly Asn Lys Ser Asp Leu Lys Ser Met He Asp Ala Leu Lys Ala Vai Gly Vai Asp Vai Tyr Ala Asp Vai Vai Leu Asn His Met Ak Asn Glu Thr Trp Lys Arg Glu Asp Leu Asn Tyr Pro Gly Ser Glu Vai Leu Gin Gin Tyr Ak Ak Asn Thr Ser Tyr Tyr Ak Asp Gin Thr Leu Phe Gly Asn Leu Thr Glu Asn Leu Phe Ser Gly Phe Asp Phe His Pro Glu Gly Cys lie Ser Asp Trp Asn Asp Ala Gly Asn Vai Gin Tyr Trp Arg Leu Cys Gly Gly Ak Gly Asp Arg Gly Leu Pro Asp Leu Asp Pro Asn Asn Tip Vai Vai Ser Gin Gin Arg Leu Tyr Leu Asn Ak Leu Lys Gly Leu Gly Vai Lys Gly Phe Arg Ile Asp Ak Vai Lys His Met Ser Gin Tyr Gin Ile Asp Gin Ile Phe Thr Ala Glu Ile Thr Ala Gly Met His Vai Phe Gly Glu Vai Ile Thr Ser Gly Gly Lys Gly Asp Ser Ser Tyr Glu Asn Phe Leu Ala Pro Tyr Leu Asn Ala Thr Asn His Ser Ala Tyr Asp Phe Pro Leu Phe Ak Ser Ile Arg Asn Ala Phe Ser Tyr Ser Gly Gly Met Asn Met Leu His Asp Pro Gin Ala Tyr Gly Gin Gly Leu Glu Asn Ala Arg Ser He Thr Phe Thr Ile Thr His Asp Ile Pro Thr Asn Asp Gly Phe Arg Tyr Gin Ile Met Asp Pio Lys Asp Glu Glu Léu Ala Tyr Ala Tyr Ile Leu Gly Lys Asp Gly Gly Thr Pro Leu Ile Tyr Ser Asp Asn Leu Pro Asp Asn Glu Asp Arg Asp Asn Arg Arg Trp Glu Gly Vai Trp Asn Arg Asp Leu Met Lys Asn Mel Leu Arg Phe His Asn Gin Met Gin Gly Gin Glu Met Thr Met Leu Tyr Ser Asp Gin Cys Leu Leu Met Phe Lys Arg Gly Lys Gin Gly Vai Vai Gly Ile Asn Lys Cys Gly Glu Glu Arg Ser His Thr Vai Asp Thr Tyr Gin His Glu Phe Asn Trp Tyr Gin Pro Tyr Thr Asp Thr Leu Thr Gly Vai Thr Glu Thr Vai Ser Ser Arg Tyr His Thr Phe Arg Ile Pro Ak Arg Ser Ala Arg Met Tyr Met Leu

SEQ IDNO: 199 gtg^agtttgaccaaaaaggctcagtacgaaccaaatacggcaccaaggcteagtacatctctgcaatcaatgccgcgcacaacaacaatatcca aatttacggcgatgttgtgtttaaccaccgaggtggtgctgatgggaagtcglgggtcgataccaagcgcgttgattgggacaaccgcaatattg aactgggcgacaaatggattgaagcttgggttgagtttaartttcctggccgcaacgacaaatactcgaacttccattggacttggtatcactttgac ggtgttgactgggatgacgccggcaaagaaaaagcgatctttaaatlcaaaggcgaaggaaaagcatgggattgggaagtcagctctgaaaa aggcaattacgactacctaa

Fig 16 (cont.)

111/116

SEQ ID NO: 200

Vai Ser Leu Thr Lys Lys Ala Gin Tyr Glu Pro Asn Thr Ala Pro Arg Leu Ser Thr Ser Leu Gin Ser Met Pro Arg Thr Thr Thr Ile Ser Lys Phe Thr Ala Met Leu Cys Leu Thr Thr Glu Vai Vai Leu Met Gly Ser Arg Gly Ser lie Pro Ser Ala Leu Ile Gly Thr Thr Ala Be Leu Asn Trp Ala Thr Asn Gly Leu Lys Leu Gly Leu Ser Leu Ile Phe Leu Ala Ala Thr Thr Asn Thr Arg Thr Ser Ile Gly Leu Gly Ile Thr Leu Thr Vai Leu Thr Gly Mel Thr Pro Ala Lys Lys Lys Arg Ser Leu Asn Ser Lys Ala Lys Glu Lys His Gly Ile Gly Lys Ser Ala Leu Lys Lys Ala lie Thr Thr Thr

SEQIDNO: 201 atgacagccaaggctgatgacttacgcatttaccagatcatggtggaaagctttgtggatggcgataaacaggtcggccatggcaccggctacg gtaccagccatcacaaaggcgatctgcaagggatcattgactcgctggattacattcaatcgctgggcgtcaatgccatrtggctaacgccgattt. ttgaalctattccggtggagggacaagaccattgggcggacaggcttgatgctacaggctactttgccagtgactatttcaagatagaccctcgct ttggcacgttaga acaagcc cgtgagc tggtggaaaaggcacacgcgaaaggcttgtatgtettctttgatggagutttggtcaccata aaggc aatgtggtgccatcaccacaaggtagactgcctgtcggtgaaaataacccggtcagctacccagagagcctggcgttttacgaagaagtcgcc a grtactgggtgaaagagttaaagattgatggctggc gtciggatcaagc ctatcaa gtgccga cc gatgcatggaaa gcgatccgt cagagc gttgatgaagcgtcacagtccgtaacttatgtgaataacaaaggggaaaccgtccatcctttgggttacatggtggctgaaatttggaataacgaa cgttacatcacagaaaccggttacggcaaagaaggcgatccggcgttgtgclcggcttttgattttc cgatgcgtttc cga gtg glcgaaacc ttt gcggttaacgaaagtggtgtcagccgaaaaggcggcgaatggttgaatgacggcatgtcactgcacagtcagtatccggatcatgccHagcct aatttaatgttgggcaaccatgatgtggtgcgctttggggatctgctgcaacgtggcggtattgcgtcaccagaacaaccgcaatactggcagcg tcataaagcggcgatglctttcttagca gcgtatacc ggc ccaatta cctt gtattacggtga agaaattggcgatcaggttga cggc tttgctaaa a aaatca aagaagattgtgccgttattggtttgt gtgatga ccacgtggcgcgcaccagt gcga aga ttgatggc gtgacggcgtc actgaatg cacagca gtc tgaac tcaaagtatatgtctcttcattgatga cattac gtcagc aacatcctgcgttatcacaaggggaacgtactaatgtgatggc gacagagacagtatacgtagaccataaacaggcagacaatgaagccctgttgtacatggtgagtacgactgataacgcggagtcagtcacctt gaagggcaaagcgattggttcacaaggtgtgctgattgatttgttaac ga acgagcgttttat gcccaataatggggaglatgccattcca ttaac gggctttggcgcacgattcctcaagattgacactccgacagcggcgggtgtgatggcgcaatctgctgcctcggtatcgctagtaggtgaagg gatcatggcccaatgtgataccccaac cgttgaaggcaccggtccggtagc aga aaccttgta c gtggttggcgattttgccgatgc tggttgga agcaaaagccgc age gcgcgtatcaatacaaaggc aagcacaatggcagcaacttgtatcaagtggttgtcgatgaaaaa gcgggcgcctac aagatgcaatacgccacgaaagattggagcccacagtttactgcagacggfatggcattgaagccgggtaccgcaaaglcgctcatagcgggt ggctacggtaaagacaccgccgtgacgttgccggaatccggtaagtatgtgtggagcttaacattcagtgatcttggcgagccggagcaaatc atggtgt c ta agtgtca gtaa

SEQ ID NO: 202

Met Thr Ala Lys Ala Asp Asp Leu Arg lie Tyr Gin Ile Met Vai Glu Ser Phe Vai Asp Gly Asp Lys Gin Vai Gly His Gly Thr Gly Tyr Gly Thr Ser His His Lys Gly Asp Leu Gin Gly Ile Ile Asp Ser Leu Asp Tyr Ile Gin Ser Leu Gly Vai Asn Ala Ile Trp Leu Thr Pro Ile Phe Glu Ser Ile Pro Vai Glu Gly Gin Asp His Trp Ala Asp Arg Leu Asp Ala Thr Gly Tyr Phe Ala Ser Asp Tyr Phe Lys Ile Asp Pro Arg Phe Gly Thr Leu Glu Gin Ala Arg Glu Leu Vai Glu Lys Ala His Ala Lys Gly Leu Tyr Vai Phe Phe Asp Gly Vai Phe Gly His His Lys Gly Asn Vai Va] Pro Ser Pro Gin Gly Arg Leu Pro Vai Gly Glu Asn Asn Pro Vai Ser Tyr Pro Glu Ser Leu Ala Phe Tyr Glu Glu Vai Ala Ser Tyr Trp Vai Lys Glu Leu Lys Ile Asp Gly Trp Arg Leu Asp Gin Ala Tyr Gin Vai Pro Thr Asp Ala Tip Lys Ala Ile Arg Gin Ser Vai Asp Glu Ala Ser Gin Ser Vai Thr Tyr Vai Asn Asn Lys Gly Glu Thr Vai His Pro Leu Gly Tyr Met Vai Ala Glu Ile Trp Asn Asn Glu Arg Tyr Ile Thr Glu Thr Gly Tyr Gly Lys Glu Gly Asp Pro Ala Leu Cys Ser Ala Phe Asp Phe Pro Met Arg Phe Arg Vai Vai Glu Thr Phe Ala Vai Asn Glu Ser Gly Va] Ser Arg Lys Gly Gly Glu Trp Leu Asn Asp Gly Met Ser Leu His Ser Gin Tyr Pro Asp His Ala Lys Pro Asn Leu Met Leu Gly Asn His Asp Vai Vai Arg Phe Gly Asp Leu Leu Gin Arg Gly Gly Ile Ala Ser Pro Glu Gin Pro Gin Tyr Trp Gin Arg His Lys Ala Ala Met Ser Phe Leu Ala Ala Tyr Thr Gly Pro lie Thr Leu Tyr Tyr Gly Glu Glu Ile Gly Asp Gin Vai Asp Gly Phe Ala Lys Lys Ile Lys Glu Asp Cys Ala Vai Ile Gly Leu Cys Asp Asp His Va] Ala Arg Thr Ser Ala Lys Ile Asp Gly Vai Thr Ala Ser Leu Asn Ala Gin Gin Ser Glu Leu Lys Va] Tyr Vai Ser Ser Leu Met Thr Leu Arg Gin Gin His Pro Ala Leu Ser Gin Gly Glu Arg Thr Asn Vai Met Ala Thr Glu

Fig 16 (cont.)

J12/116

Thr Vai Tyr Vai Asp His Lys Gin Ala Asp Asn Glu Ala Leu Leu Tyr Met Vai Ser Thr Thr Asp Asn Ala Glu Ser Vai Thr Leu Lys Gly Lys Ala Ile Gly Ser GIn Gly Vai Leu He Asp Leu Leu Thr Asn Glu Arg Phe Met Pro Asn Asn Gly Glu Tyr Ala Ile Pro Leu Thr Gly Phe Gly Ala Arg Phe Leu Lys Ile Asp Thr Pro Thr Ala Ala Gly Vai Met Ala Gin Ser Ala Ala Ser Vai Ser Leu Vai Gly Glu Gly lie Met Ala Gin Cys Asp Thr Pro Thr Vai Glu Gly Thr Gly Pro Vai Ala Glu Thr Leu Tyr Vai Vai Gly Asp Phe Ala Asp Ala Gly Trp Lys Gin Lys Pro Gin Arg Ala Tyr Gin Tyr Lys Gly Lys His Asn Gly Ser Asn Leu Tyr Gin Vai Vai Vai Asp Glu Lys Ala Gly Ala Tyr Lys Met Gin Tyr Ala Thr Lys Asp Trp Ser Pro GIn Phe Thr Ala Asp Gly Met Ala Leu Lys Pro Gly Thr Ala Lys Ser Leu Ile Ala Gly Gly Tyr Gly Lys Asp Thr Ala Vai Thr Leu Pro Glu Ser Gly Lys Tyr Vai Trp Ser Leu Thr Phe Ser Asp Leu Gly Glu Pro Glu Gin Ile

SEQ ID NO: 203 atgaagatgaagtcccgggcgtggttgttagglagtgcagtggccatggcgttggcctcttcggcagccaatgccggtgtcatggttcacctgtt ccaglggaagtacaatgacatcgccaacgagtgcgàaaaggtgctcggtcccaaagggtatgaagcagtgcagaicacgccgcctgctgaa cacctgcaaggctcctcctggtgggtggtctatcagcccgtcagctacaagaacttcacttctctgggcggtaacgaggccgaactcaaaagca tgatcgeccgttgcaaggc c gcc ggggtcaagatttac gccgatgc ggtattc aaccagctggctggtggatcaggcgtc ggtacaggtggta gcagctacaatgccggcagcttcagctatccccaatttggctacaacgatttccatcacgctgggagcctcaccaactaígccgaccgcaacaa tgtgcaaaacggtgccctgctggggctgccggatctgga tacc ggctctgcctatgtgcaggatca gctggctacctatatgaagaccctgagt ggctggggtglggcaggttttcgtcttgatgcagcaaagcatatgagcgttgccgatctctcggccatcgtcagcaaggcgggcaatccttttgt ctactccgaggtgattggtgccacgggtgaaccaatccagccgggcgaatataccggcattggXgccgtgaccgaatttaaatacggcaccga tc tggcctccaacttc aaggggcagatcaagaatctcaagagc atggg cgagagctggggtctgcttgcgtc gaacaaggc tgaagtc tttgtg gtcaaccatgaccgtgagçggggacaiggcggtggcggtatgctgacctacaaggatggtgccctctacaatctggccaacatcttcatgctg gcctggcccta tggcgcc tatccccaggtgatgtccggcta tga tttcggcacc aataccgatattggt gg gccgagcgctaccccttgttc ttee ggctctagctggaactgcgaacaccgctggagcaacatcgccaacatggtctcgttccacaatgccgcccaaggcacgtccatgaccaactg gtgggataatggtaataaccagatcgcctttggtegcggcgccaaggcctttgtggtgatcaacaatgaatcttccactctgagcaagagcctgc agacgggtctgccagccggggagtactgcaacattctggccggtgatgccctgtgcagcggcagcaccatcaaggtggatgccagcggtat ggccaccttcaacgtggcagggatgaaggcggcagcgatccatatcaatgccaagccc gatage accagcagtggcagçtca ggctcttcct ctggctcttcttcctcígccaccaglaacaagtttgccagcatgaatctgcggggcaccaacaatggctgggccagcaccgceatgacagtgga tgc caaccgtgtc tggtcggcggatgtcacctttaccggggccgcggatgccaatggtgcccagcgc ttcaagttt gatgtctatggcaac tgg acagagagctatggcgatacacaagccgatggcattgccgacaaggggagcgccaaggacatctatttcaatggtgtgggcaagtatcgtgtc tcgctcaaggagagcgacatgagctacaccctgaçccagctctccagcaatcflggcaccgglggcggccatcacccccaagacactctccgt caagctgggtgactcagtggtgttcgatgcctccggctccaccgatgatgtgggtgtcactggctacagctggtctaccggtggcagtgccaag accgaaactgtgctgtttgatgctctgggtacçaagaccattaccgtgacagtggccgatgccgatggCttgacctccaaggccagtgccaccg tcaccgtcaccgatggcagcgtggctlataacagcaactttgccagcctgaacttccgtggcactcccaacagttggggcgcggcagccatga cgctggtggcagacaacacctgggaggcaacggtcaacttcgatggtcaggccaatcagcgcttcaagtlcgatatcaagggtgactggagc cagaactatggtgatagcaacaaggatggggtggccgaacgtacCggtgccgatatttacaccactgtgaccgglcaatataaggtgcaattta acgactccactttgaagtacaccctgaccaagctggccgatagcagcgccaccagctatagcgcgaactttgccagcctctacctgcgtggca çcccgaacagctggggcaccaccgccatgaagctggtggccaataacagctggcaggccgaggtgacctlcaccggcaagggcgatgcca ctggtgcccaacgcttcaagttcgacglcaagggtgactggagccagaactacggtgacagcaacatggacgggactgccgaacggactgg tggcgalatcaccagtgccgtggtgggcacctatctggtgacctttaatgacagcacactgaaatacaccctgaccgccaaataa

SEQ ID NO: 204

Met Lys Met Lys Ser Arg Ala Trp Leu Leu Gly Ser Ala Vai Ala Met Ala Leu Ala Ser Ser Ala Ala Asn Ala Gly Vai Met Vai His Leu Phe Gin Trp Lys Tyr Asn Asp Hc Ala Asn Glu Cys Glu Lys Vai Leu Gly Pro Lys Gly Tyr Glu Ala Vai Gin lie Thr Pro Pro Ala Glu His Leu GIn Gly Scr Scr Trp Trp Vai Vai Tyr Gin Pro Vai Ser Tyr Lys Asn Phe Thr Ser Leu Gly Gly Asn Glu Ala Glu Leu Lys Ser Met Ile Ala Arg Cys Lys Ala Ala Gly Vai Lys Ile Tyr Ala Asp Ala Vai Phe Asn GIn Leu Ala Gly Gly Ser Gly Vai Gly Thr Gly Gly Ser Ser Tyr Asn Ala Gly Ser Phe Ser Tyr Pro Gin Phe Gly Tyr Asn Asp Phe His His Ala Gly Ser Leu Thr Asn Tyr Ala Asp Arg Asn Asn Vai GIn Asn Gly Ala Leu Leu Gly Leu Pro Asp Leu Asp Thr Gly Ser Ala Tyr Vai GIn Asp GIn Leu Ala Thr Tyr Mel

Fig 36 (cont.)

113/116

Lys Thr Leu Ser Gly Trp Gly Val Ala Gly Phe Arg Leu Asp Ala Ala Lys His Met Ser Val Ala Asp Leu Ser Ala Ile Val Ser Lys Ala Gly Asn Pro Phe Val Tyr Ser Glu Val Ile Gly Ala Thr Gly Glu Pro Ile Gin Pro Gly Glu Tyr Thr Gly Ile Gly Ala Val Thr Glu Phe Lys Tyr Gly Thr Asp Leu Ala Ser Asn Phe Lys Gly Gin Ile Lys Asn Leu Lys Ser Met Gly Glu Ser Trp Gly Leu Leu Ala Ser Asn Lys Ala Glu Val Phe Val Val Asn His Asp Arg Glu Arg Gly His Gly Gly Gly Gly Met Leu Thr Tyr Lys Asp Gly Ala Leu Tyr Asn Leu Ala Asn Ile Phe Met Leu Ala Trp Pro Tyr Gly Ala Tyr Pro Gin Val Met Ser Gly Tyr Asp Phe Gly Thr Asn Thr Asp Ile Gly Gly Pro Ser Ala Thr Pro Cys Ser Ser Gly Ser Ser Trp Asn Cys Glu His Arg Trp Ser Asn Ile Ala Asn Met Val Ser Phe His Asn Ala Ala Gin Gly Thr Ser Met Thr Asn Trp Trp Asp Asn Gly Asn Asn Gin Ile Ala Phe Gly Arg Gly Ala Lys Ala Phe Val Val Ile Asn Asn Glu Ser Ser Thr Leu Ser Lys Ser Leu Gin Thr Gly Leu Pro Ala Gly Glu Tyr Cys Asn Ile Leu Ala Gly Asp Ala Leu Cys Ser Gly Ser Thr He Lys Val Asp Ala Ser Gly Met Ala Thr Phe Asn Val Ala Gly Met Lys Ala Ala Ala Ile His Ile Asn Ala Lys Pro Asp Ser Thr Ser Ser Gly Ser Ser Gly Ser Ser Ser Gly Ser Ser Ser Ser Ala Thr Ser Asn Lys Phe Ala Ser Met Asn Leu Arg Gly Thr Asn Asn Gly Trp Ala Ser Thr Ala Met Thr Val Asp Ala Asn Arg Val Trp Ser Ala Asp Val Thr Phe Thr Gly Ala Ala Asp Ala Asn Gly Ala Gin Arg Phe Lys Phe Asp Val Tyr Gly Asn Tip Thr Glu Ser Tyr Gly Asp Thr Gin Ala Asp Gly Ile Ala Asp Lys Gly Ser Ala Lys Asp Ile Tyr Phe Asn Gly Val Gly Lys Tyr Arg Val Ser Leu Lys Glu Ser Asp Met Ser Tyr Thr Leu Thr Gin Leu Ser Ser Asn Gin Ala Pro Vat Ala Ala Ile Thr Pro Lys Thr Leu Ser Val Lys Leu Gly Asp Ser Val Val Phe Asp Ala Ser Gly Ser Thr Asp Asp Val Gly Val Thr Gly Tyr Ser Tip Ser Thr Gly Gly Ser Ala Lys Thr Glu Thr Val Leu Phe Asp Ala Leu Gly Thr Lys Thr Ile Thr Val Thr Val Ala Asp Ala Asp Gly Leu Thr Ser Lys Ala Ser Ala Thr Val Thr Val Thr Asp Gly Ser Val Ala Tyr Asn Ser Asn Phe Ala Ser Leu Asn Phe Arg Gly Thr Pro Asn Ser Trp Gly Ala Ala Ala Met Thr Leu Val Ala Asp Asn Thr Trp Glu Ala Thr Val Asn Phe Asp Gly Gin Ala Asn GIn Arg Phe Lys Phe Asp Ile Lys Gly Asp Trp Ser Gin Asn Tyr Gly Asp Ser Asn Lys Asp Gly Val Ala Glu Arg Thr Gly Ala Asp Ile Tyr Thr Thr Val Thr Gly GIn Tyr Lys Val Gin Phe Asn Asp Ser Thr Leu Lys Tyr Thr Leu Thr Lys Leu Ala Asp Ser Ser Ala Thr Ser Tyr Ser Ala Asn Phe Ala Ser Leu Tyr Leu Arg Gly Thr Pro Asn Ser Trp Gly Thr Thr Ala Met Lys Leu Val Ala Asn Asn Ser Trp Gin Ala Glu Val Thr Phe Thr Gly Lys Gly Asp Ala Thr Gly Ala GIn Arg Phe Lys Phe Asp Val Lys Gly Asp Trp Ser Gin Asn Tyr Gly Asp Ser Asn Met Asp Gly Thr Ala Glu Arg Thr Gly Gly Asp He Thr Ser Ala Val Val Gly Thr Tyr Leu Val Thr Phe Asri Asp Ser Thr Leu Lys Tyr Thr Leu Thr Ala Lys

SEQ ID NO: 205 atgtacc gcgtaata cc tatta ttttgattatgagtatgattgtagcttgtgaglctccaaagaaaaaaacaaccgaaaccgctcaaccttcaacaaa tgccgaaaaaccctttgtttgggaggctgcca atgta la ttttttgttaactgaccgttttaacaacggtaacccaaacaatgac atcaattttaata g gactaaagaatcaggaaaactccgcaaTtttatgggaggcgatatcaagggcatcacccaaaaaata aatga ggggtattttagtaaactaggc gttaatgccatctggcttaccccggttgttgaacaaatacatggcagtgttgatgaaggiaccggcaatacctatgectttcatggctattgggcca aagãttggacaaacttagacccaaattttggcacaaaagaagaccttgccgaactggtggcaactgcccatgcaaaaggcatcaggatactttta gatgtggtaataaaccacaccggcccggtaaccgaccaagacccggtttggggagaagatígggtacgtacaggcccgcagtgtacctatga taattacaccaataccaccagttgcacgctggtagecaatttacctgatatacttacagaaagtaatgaaaatgtggccttaccaacctttttgttaga taaatggaaagccgaaggcagattagagcaagaactaaaagaacttgacgattttttttcccgcacaggccacccacgcgcaccccgcttttac attattaaatggcttaccgattacatccgagaatttggggtagatgggtttagggttgataccgtaaaacataccgaagaaacggrttgggccgag ttgtatgatgaagccgtaattgcttttgccgaa ta taaaaaagccaacccagacaaggtattggac gat aatga atttta tat ggtaggcga a gtgt acaactacggtatttc cggcgg aaggttctatgatttcggcgataaaaaggt ggaclattttga ccac ggattta aaagcctc atca attttgaaatg aaatatgatgccaattttacctacgatacactttttaggaagtacgatacecttttgcataccaaacttaaaggcagaagtgtgctcaactacctctca tctcacgacgatggaagtccatttgataaaatgcggcaaaaaccatacgagtcggcUcaaaattactgctcactccgggcgcatcccaaatttat tacggtgacgaaaccgccagaagccttaacatagaaggcgcacagggagatgctacgcttcgttcgtttatgaattgggaagagctcgcagaa gacccigccaagcaaaaaatacttcagcattggcaaaaactgggcagtttcaggaacaaccaccccgcagttggtgccggaaggcacaaaac ccttggcaaaaagccgttttacacctttagcagggtttatcaaaaaaatggttttattgacaaagttgtggtagcattagatgcccctaaaggccaaa aacaaattaccgtiaatggtgtrtttgatgacggtacaaaacttgtagatgccrattcaggcaaagaaacctca£ttaaaaatggtatcgtttcacttt cttctgaatttgatattgttttgttagaacaaaaataa

Fig 16 (cont)

SEQ ID NO: 206

Met Tyr Arg Vai lie Pro Ile Ile Leu Ile Met Ser Met Ile Vai AJa Cys Glu Ser Prõ Lys Lys Lys Thr Thr Glu Thr Ala Gin Pro SeT Thr Asn Ala Glu Lys Pro Phe Vai Trp Glu Ala Ala Asn Vai Tyr Phe Leu Leu Thr Asp Arg Phe Asn Asn Gly Asn Pro Asn Asn Asp Ile Asn Phe Asn Arg Thr Lys Glu Ser Gly Lys Leu Arg Asn Phe Met Gly Gly Asp Ile Lys Gly Ile Thr Gin Lys Ile Asn Glu Gly Tyr Phe Ser Lys Leu Gly Vai Asn Ala Ile Trp Leu Thr Pro Vai Vai Glu Gin Ile His Gly Ser Vai Asp Glu Gly Thr Gly Asn Thr Tyr Ala Phe His Gly Tyr Trp Ala Lys Asp Tip Thr Asn Leu Asp Pro Asn Phe Gly Thr Lys Glu Asp Leu Ala Glu Leu Vai Ala Thr Ala His Ala Lys Gly Ile Arg Ile Leu Leu Asp Vai Vai Ile Asn His Thr Gly Pro Vai Thr Asp Gin Asp Pro Vai Trp Gly Glu Asp Trp Va) Arg Thr Gly Pro Gin Cys Thr Tyr Asp Asn Tyr Thr Asn Thr Thr Ser Cys Thr Leu Vai Ala Asn Leu Pro Asp Ile Leu Thr Glu Ser Asn Glu Asn Vai Ala Leu Pro Thr Phe Leu Leu Asp Lys Trp Lys Ala Glu Gly Arg Leu Glu Gin Glu Leu Lys Glu Leu Asp Asp Phe Phe Ser Arg Thr Gly His Pro Arg Ala Pro Arg Phe Tyr Ile Ile Lys Trp Leu Thr Asp Tyr Ile Arg Glu Phe Gly Vai Asp Gly Phe Arg Vai Asp Thr Vai Lys His Thr Glu Glu Thr Vai Trp Ala Glu Leu Tyr Asp Glu Ala Vai Ile Ala Phe Ala Glu Tyr Lys Lys Ala Asn Pro Asp Lys Vai Leu Asp Asp Asn Glu Phe Tyr Met Vai Gly Glu Vai Tyr Asn Tyr Gly Ile SeT Gly Gly Arg Phe Tyr Asp Phe Gly Asp Lys Lys Vai Asp Tyr Phe Asp His Gly Phe Lys Ser Leu Ile Asn Phe Glu Met Lys Tyr Asp Ala Asn Phe Thr Tyr Asp Thr Leu Phe Arg Lys Tyr Asp Thr Leu Leu His Thr Lys Leu Lys Gly Arg Ser Vai Leu Asn Tyr Leu Ser Ser His Asp Asp Gly Ser Pro Phe Asp Lys Met Arg Gin Lys Pro Tyr Glu Ser Ala Thr Lys Leu Leu Leu Thr Pro Gly Ala Ser Gin Ile Tyr Tyr Gly Asp Glu Thr Ala Arg Ser Leu Asn Ile Glu Gly Ala Gin Gly Asp Ala Thr Leu Arg Ser Phe Met Asn Trp Glu Glu Leu Ala Glu Asp Pro Ala Lys Gin Lys Ile Leu Gin His Trp Gin Lys Leu Gly Ser Phe Arg Asn Asn His Pro Ala Vai Gly Ala Gly Arg His Lys Thr Leu Gly Lys Lys Pro Phe Tyr Thr Phe Ser Arg Vai Tyr Gin Lys Asn Gly Phe Ile Asp Lys Vai Vai Vai Ala Leu Asp Ala Pro Lys Gly Gin Lys Gin Ile Thr Vai Asn Gly Vai Phe Asp Asp Gly Thr Lys Leu Vai Asp Ala Tyr Ser Gly Lys Glu Thr Ser Vai Lys Asn Gly Ile Vai Ser Leu Ser Ser Glu Phe Asp Ile Vai Leu Leu Glu Gin Lys

SEQ ID NO: 207 ctgtcgactgagcctttcgttttgggctcgagactgaetctcagcccaccccgcagtagctccagacggagtagccgtaatagccgttggcçgg gtcgtgggcaggggcctcgaggtacacccacccgcrtgagtccacccacttgtccacccagccgccgaggrtgccgglgtactcgtggatgc acgctecegcgaacttcggaacgtagacccaccttccggctttgcttgaggcgaggttgatgtatgttatcagtcccggcttgcttccgtagccgt ttcicacgaatatcagctcgtcgttgtcgtagtaaacgacgtcagtgcttcctccggccaggttgtcatgtatccagatgaggttcttgagettatcct tgttga gccactcctcgtagtcgc ggta gaatattgtcggctggcc ctcgta ggtga ggatgaa cgcgtagg ctggata cttgttccaga ttatat cggtgtegtggtttgcaacgaaggttacggccttaaacgggtcgcggctgacgactgtgcccccgttcttgagggcctegacgagtgcgggaa tgttcttgttgtcaaaggccgcgtccatcttgtagtagagcgggaagtcgaagaccttggcgccgctcgagtaggcccagttgaggagtgcatc aacgttggtgEcccagiacícgccaacggpccagccgccccaccagttgagccagtccttgacgacccacgctccgtggcccttcacgtagtc aaagcgccaggcatcaacgccgatgctccttaggtaggcggcgtagctctcatcgctcgcccagagccagtgctggtcccagctcttctcgtg ggctatgtctgggaagcctccaaatgtgccctcgtcacagcacttgacctcgttggggtggaagtcgagglagttggcagtatatttgcccgagg ccacc tttgaga a gtccgtccaggtgta gtccccaa c gaac gggttccactc gaggtc tccgcctgc gcg gtggttta tgacga tgtccgctatg acctttatgccgtaggcatgggccgtgtttalcatgttcacgagctcctgcttggagccaaagcgcgtctctaccgttcccttctggtcgtactcacc gaggicaaagaagtcgtaggggtcgtagcccatcgaataggcgccgcccatgcccttgctcgccgggggaatccaaatggcggatattcccg ccícgtaccactccggtatcttgctcctgalggtgtcccaccagattcctccacctgggacgtcccagtagaaggcctgcattataacgccgccct cttcc age tcggagt acttggccataa gttaccic ctactagtagattaaaa

SEQ ID NO: 208

Leu Sei Thr Glu Pro Phe Vai Leu Gly Ser Arg Leu Thr Leu Ser Pro Pro Arg Ser SeT Ser Arg Arg Ser Ser Arg Asn Ser Arg Tip Pro Gly Arg Gly Gin Gly Pro Arg Gly Thr Pro Thr Arg Leu Ser Pro Pro Thr Cys Pro Pro Ser Arg Arg Gly Cys Arg Cys Thr Arg Gly Cys Thr Leu Pro Arg Thr Ser Glu Arg Arg Pro Thr Phe Arg Leu Cys Leu Arg Arg Gly Çys Met Leu Ser Vai Pro Ala Cys Phe Arg

115/136

Fig 16 (cont.)

Ser Arg Phe Ser Arg Ile Ser Ala Arg Arg Cys Arg Ser Lys Arg Arg Gin Cys Phe Leu Arg Pro Gly Cys His Vai Ser Arg Gly Ser Ala Tyr Pro Cys Ala Thr Pro Arg Ser Arg Gly Arg Ile Leu Ser Ala Gly Pro Arg Arg Gly Thr Arg Arg Leu Asp Thr Cys Ser Arg Leu Tyr Arg Cys Arg Gly Leu Gin Arg Arg Leu Arg Pro Thr Gly Arg Gly Arg Leu Cys Pro Arg Ser Gly Pro Arg Arg Vai Arg Glu Cys Ser Cys Cys Gin Arg Pro Arg Pro Ser Cys Ser Arg Ala Gly Ser Arg Arg Pro Trp Arg Arg Ser Ser Arg Pro Ser Gly Vai His Gin Arg Trp Cys Pro Ser Thr Arg Gin Arg Pro Ser Arg Pro Thr Ser Ala Ser Pro Arg Pro Thr Leu Arg Gly Pro Ser Arg Ser Gin Ser Ala Arg His Gin Arg Arg Cys Ser Leu Gly Arg Arg Arg Ser Ser His Arg Ser Pro Arg Ala Ser Ala Gly Pro Ser Ser Ser Arg Gly Leu Cys Leu Gly Ser Leu Gin Met Cys Pro Arg His Ser Thr Pro Arg Trp Gly Gly Ser Arg Gly Ser Trp Gfn Tyr Be Cys Pro Arg Pro Pro Leu Arg Ser Pro Ser Arg Cys Ser Pro Gin Arg Thr Gly Ser Thr Arg Gly Leu Arg Leu Arg Gly Gly Leu Arg Cys Pro Leu Pro Leu Cys Arg Arg His Gly Pro Cys Leu Ser Cys Ser Arg Ala Pro Ala Trp Ser Gin Ser Ala Ser Leu Pro Phe Pro Ser Gly Arg Thr His Arg Gly Gin Arg Ser Arg Arg Gly Arg Ser Pro Ser Asn Arg Arg Arg Pro Cys Pro Cys Ser Pro Gly Glu Ser Lys Trp Arg lie Phe Pro Pro Arg Thr Thr Pro Vai Ser Cys Ser Trp Cys Pro Thr Arg Phe Leu His Leu Gly Arg Pro Ser Arg Arg Pro Ala Leu Arg Arg Pro Leu Pro Ala Arg Ser Thr Trp Pro Vai Thr Ser Tyr Ile Lys

SEQ ID NO: 209 atgattcagcccatgcactctcgggaacaggcctgccgtctcattccggcactgatcatgacatttgcactggcactgccgttgcaaatlcgtgccg atgtcaccctgcatgctttcaactggagctatgccgatgtcgctgatcgggccgttgacatcgctgcagcagggtacagtgccgtgcíggtggccc cgccacttcgatccgaaggcacggcctggtgggcgcgataccagccccaggatctccgccttatcgaccatccgctgggcaatacacatgacttc gtcaacaígatcgatgctctcgatgatgtgggtgtgggcgtgtacgccgacatcgtgctcaaccacatggccaatgaggctgcacaaaggcctga cc tgaacta ccctggtcaggcagtgcttg acgaa tatgcttccgatcc cggtcatttc gagggcttgaggctgttcggtaatctgagcttcaa tttcct gtcggaacalgatttc ggaccc gcccagtgcattcaggattaca gc gatgtgtttca ggtccaga ac (ggeggctgtgcggaccgccgccgga cc cgggcctgcccgacctggtcgccaatgactgggigatctctcaacagcgccagtatctggaagccatcaaggcgctgggtgtggclggcatgcg ca tcgacgcggtcaagcatatgcccatgagcca tatea atgccgttctcacccccgagatccggtcgggcttgcatgtgtttggcgaagtcatcacc tccggtggggctggtgatacatcctacgaccgtrttctggccccttacctggcacaaagcgaccatggtgcctatgactttccattgtttgaaaccatt cgccgtgcrttcggcttcggtggcagcatgagtgaactggtcgatcctgctgcctacggtcaggccctgccaccggaccgcgccatcaccttcgtc alcacgcacgatattccgaacaatgacggatttcgctaccagatactcgaccccgtcgatgaatcactggcctacgcctacattctgggccgcgatg gcggtgtcccgcttctgtattccgacaacaatgaaagcggcgatggccgctggatcgatgcctggcaacgtccggatctggttgcaatggtcggct tccacaatgcagtccacggtcaggacatggccgtgctttcacatgacgactgccacctgcigtttcggcgcggcagcctcgggattgtcggcatca acaagtgcggccatgcactcagctcctgggtcaacatgaaccagagcgtactgtggtggtacgcggactacacagacgtgctcgacagcaacag cgttgtcaa catee agtcatcc tggcacgagttcatccttcccgcccgccaggcacgcc tgtggttg cga

SEQ ID NO: 210

MIQPMHSREQACRLIPALIMTFALALPLQIRADVTLHAFNWSYADVADRAVDIAAAGYSA

VLVAPPLRSEGTAWWAKYQPQDLRL1DHPLGNTHDFVNMJDÀLDDVGVGVYADIVLNHM

ANEAAQRPDLNYPGQAVLDEYASDPGHFEGLRLFGNLSFNFLSEHDFGPAQCIQDYSDVF

QVQNWRLCGPPPDPGLPDLVANDWV1SQQRQYLEAIKALGVAGMRIDAVKHMPMSHINA

VLTPEIRSGLHVFGEVITSGGAGDTSYDRFLAPYLAQSDHGAYDFPLFETIRRAFGFGGSMS

ELVDPAAYGQALPPDRAITFVITHDIPNNDGFRYQILDPVDESLAYAYILGRDGGVPLLYSD

NNESGDGRWIDAWQRPDLVAMVGFHNAVHGQDMAVLSHDDCHLLFRRGSLGIVGINKC

GHALSSWVNMNQSVLWWYADYTDVLDSNSWNIQSSWHEFILPARQARLWLR

SEQ ID NO: 211

GTGTTTCGTTCTGACACAGTTTCGCGTACCTGCATGTATGGTGCGCTGCGTAATGCCTA

CCAACCCGATCGGGTGTTTACTGGAGTCACGGTGCGGACATGCAACTTAAAAAAGCAT

GCTCATCGCCAGGCGCTGTTGTTCATCGTGACGCGGTGCCTGTGCCTGAAATCCAGGC

AGACCCATAAAAACAACAACAAACCGATAACAAACGACCCAAGCCTTCTAAGAGGAG

AAAACGGGATGGCTTTTAAACTACGCAAAAAGGCGCTCGTTGGCCTGTTCACGGCCGG

Fig 16 (cont.)

116/116

CGCAATGGTATATGCCGGTGCAGCGGCGAGTGGTGÀAATCATTCTGCAGGGCITCCAC

TGGCACTCCAAGTGGGGCGGCAACAATCAGGGTTGGTGGCAGGTGATGGAAGGTCAG

GCCAACACCATCGCCAACGCCGGCTTTACGCACGTGTGGTTCCCGCCGGTCCATAACT

CGGCCGATGCCGAGGGTTACCTACCCCGCGAGCTGAACAACCTCAACTCCAGCTATGG

CTCCGAAGCACAGCTGCGCAGCGCCATCCAGGCACTGAACAATCGCGGCGTGCATGCG

ATTGCCGATGTGGTCATGAACCACCGGGTGGGCTGCTCTGGCTGGGCGGATTTCTGTA

ACCCGGACTGGCCGACCTGGTACATCGTCGCCAATGATTCCTGGCCCGGTGGCCCGAA

AAGCCAGAACTGGGACACGGGTGAGACGTACCACGCCGCCCGTGACCTCGATCACGC

CAATCCGCAGGTGCGCAACGATATCTCGCACTACCTGAACAGCCGCCTCAAGGACGTC ggcttctccggctggcgctgggactatgccaagggtttctggcccggctatgtcggcg

AGTACAACTGGAACACCAACCCGAACTTCTGTGTGGGTGAGGTGTGGGACGATCTCGA

CCCCAACAATCCCAACCCGCACCGCCAGCAACTGGTGGACTGGGTTGATGCTACCGGT

GGCAGTTGTCACGTCTTCGACTTCACCACCAAGGGGCTGACGAACTATGCGCTGCAGC

ATGGCC AGTACTGGCGCCTGCAGGGTGATAATGGTGGCCCGGCTGGCGGCATCGGCTG

GTGGCCGCAACGCATGGTGACCÍTCGTCGACAACCATGACACGGGCCCGAGCAATCAC

TGTGGTGACGGCCAGAACCTCTGGCCCGTGCCCTGTGACAAGGTCATGGAGGCGTATG

CCTACATCCTGACCCATCCGGGCGTGCCGTCGGTGTACTGGACGCACTTCTTCAACTGG

AATCTTGGTAGCGAGATCAGCCAGTTGATGCAGATCCGCAAGAACCAGGGCGTGCACT

CCGGTTCCGACGTCTGGATCGCCGAGGCCCGTCACGGCCTGTACGCCGCCTATATCAA

CGGTAATGTGGCGATGAAGATGGGCTGGGATAACTGGAGCCCGGGCTGGGGCTGGTC

GCTGGCGGCCTCCGGTAACAACTGGGCCGTCTGGACACGCTGA

SEQIDNO: 212

VFRSDTVSRTCMYGALRNAYQPDRVFIGVTVRTCNLKKHAHRQALUFIVTRCLCLKSRQT

HKNNNKPITNDPSLLRGENGMAFKLRKKALVGLFTAGAMVYAGAAASGEnLQGFHWHS

KWGGNNQGWWQVMEGQANTIANAGFTFíVWFPPVHNSADAEGYLPRELNNLNSSYGSEA

QLRSAIQALNNRGVHAIADWMNHRVGCSGWADFCNPDWPTWYIVANDSWPGGPKSQN

WDTGETYHAARDLDHANPQVRNDISHYLNSRLKDVGFSGWRWDYAKGFWPGYVGEYN

WNTNPNFCVGEVWDDLDPNNPNPHRQQLVDWVDATGGSCHVFDFTTKGLTNYALQHGQ ywrlqgdnggpaggigwwpqrmvtfvdnhdtgpsnhcgdgqnlwpvpcdkvmeaya

YILTHPGVPSVYWTHFFNWNLGSEISQLMQIRKNQGVHSGSDVWIAEARHGLYAAYINGN vamkmgwdnwspgwgwslaasgnnwavwtr

1/1