PT611584E - Dispositivo de regeneracao de ar num recinto fechado - Google Patents

Dispositivo de regeneracao de ar num recinto fechado Download PDF

Info

Publication number
PT611584E
PT611584E PT94400259T PT94400259T PT611584E PT 611584 E PT611584 E PT 611584E PT 94400259 T PT94400259 T PT 94400259T PT 94400259 T PT94400259 T PT 94400259T PT 611584 E PT611584 E PT 611584E
Authority
PT
Portugal
Prior art keywords
leu
ala
gin
gli
csf
Prior art date
Application number
PT94400259T
Other languages
English (en)
Inventor
Albert James Kussener
Pierre Rouzies
Original Assignee
Etat Francais Repr Par Deleg G
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Etat Francais Repr Par Deleg G filed Critical Etat Francais Repr Par Deleg G
Publication of PT611584E publication Critical patent/PT611584E/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A62LIFE-SAVING; FIRE-FIGHTING
    • A62BDEVICES, APPARATUS OR METHODS FOR LIFE-SAVING
    • A62B11/00Devices for reconditioning breathing air in sealed rooms

Landscapes

  • Health & Medical Sciences (AREA)
  • Pulmonology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Separation By Low-Temperature Treatments (AREA)
  • Gas Separation By Absorption (AREA)
  • Peptides Or Proteins (AREA)

Description

*7<" 9
Descrição “Composições de análogos do FEC-G e métodos”
Campo da invenção A presente invenção refere-se aos análogos do factor estimulador das colónias de granulócitos (FEC-G, o mesmo que G-CSF).
Antecedentes A hematopoiese é regulada por dois sistemas: as células contidas no microambiente da medula óssea e os factores de crescimento. Os factores de crescimento, também designados por factores estimuladores de colónias, estimulam as células progenitoras empenhadas no processo, levando-as a proliferarem e a formarem colónias de bematócitos que se vão diferenciar. Um destes factores é o factor estimulador de colónias de granulócitos, aqui designado por FEC-G, que estimula preferencialmente o crescimento e o desenvolvimento dos neutrófilos, o que significa que tem uma utilidade potencial em doenças neutropénicas. Welte el ai, PMAS-USA 82: 1526-1530 (1985); Souza el ai, ‘Science’ 232: 61-65 (1986) e Gabrilove, ‘J. Seminars in Hematology’ 26: (2) 1-14 (1989).
Nos seres humanos o FEC-G endógeno é detectável no plasma sanguíneo. Jones el al., ‘Bailliere's Clinicai Hematology’ 2 (1): 83-111 (1989). O FEC-G é produzido pelos fibro-blastos, macrófagos, trofoblastos das células T, células endoteliais e células epiteliais e é o produto das expressão de um gene de uma só cópia constituído por quatro exões e cinco intrões localizados no décimo sétimo cromossoma. A transcrição deste locus produz uma 2 espécie de ARNm que é modificado diferencialmente, dando origem a duas formas de ADNm do FEC-G, codificando uma das verfêes uma proteína de 177 aminoácidos e codificando a outra versão uma proteína de 174 aminoácidos, Nagata, et ai, ΈΜΒΟ J’ 5: 575-581 (1986), tendo sido comprovado que a forma constituída pelos 174 aminoácidos possui a maior actividade biológica específica in vivo. O FEC-G é interreactivo entre espécies, de tal forma que ao ser administrado o FEC-G humano a um outro mamífero, tal como um murganho, um canino ou um macaco, é eduzida uma leucocitose persistente dos neutrófilos. Moore et ai, PNAS-USA 84: 7134-7138 (1987). O FEC-G humano pode ser obtido e purificado a partir de inúmeras fontes. O FEC-G humano natural (FEC-Ghn, o mesmo que nhG-CSF) pode ser isolado a partir dos sobrenadantes de linhagens de células tumorais humanas criadas em cultura. O desenvolvimento da tecnologia do ADN recombinante, conforme explicado, por exemplo, na patente de invenção norte--americana n° 4 810 643 (Souza), documento que aqui se considera incorporado por referência, veio permitir a produção, à escala comercial, de quantidades de FEC-G numa forma glicosilada enquanto produto da expressão de células de hospedeiros eucarióticos e a produção de FEC-G numa forma não glicosilada enquanto produto da expressão de células de hospedeiros pro-carióticos.
Verificou-se que o FEC-G é útil no tratamento de casos em que seja benéfico um aumento de neutrófilos. Por exemplo, no caso dos pacientes com cancro, o FEC-G é benéfico como meio para estimular de forma selectiva a produção de neutrófilos para compensar o défice hematopoiético resultante da quimioterapia ou da radioterapia. Também podem ser prescritos para o tratamento de diversas doenças infecciosas e estados patológicos congéneres, tais como a sépsis que é tipicamente provocada por um inetabolito de origem bacteriana. O FEC-G também é útil quando utilizado por si só ou em combinação com outros compostos, tais como outras citoquinas, para induzir o crescimento ou a multiplicação de células em cultura, por exemplo, para o transplante de medula óssea A transdução de sinal, que é a via pela qual o FEC-G participa no metabolismo celular, não é ainda um processo perfeitamente conhecido. O FEC-G liga-se a um receptor da superfície celular que inicia aparentemente as modificações dentro de células progenitoras particulares, levando à diferenciação celular. Foram já descritos diversos FEC-G modificados. De um modo geral, para a concepção de fármacos, sabe-se que há determinadas modificações que conferem determinados efeitos estruturais. Por exemplo, a supressão de uma cisteína poderia originar o desdobramento de uma molécula que no seu estado inalterado se encontra normalmente entrelaçada por uma ponte dissulfureto. Há outros métodos conhecidos para acrescentar, suprimir ou substituir aminoácidos com o intuito de se modificar a função de uma proteína.
Foram já produzidos mutantes dos FEC-G humanos recombinantes, mas o método para a sua preparação não inclui informação geral sobre a relação entre estrutura/função. Por exemplo, foram já descritas a mutação e a modificação bioquímica de Cis 18. Kuga et ai, ‘Biochem. Biophy. Res. Comm.’ 159: 103-111 (1989); Lu et a!., ‘Arch. Biochem. Biosphys.’ 268: 81-92(1989).
Na patente de invenção norte-americana n° 4 810 643, com o título “Produção do Factor Estimulador de Colónias de Granulócitos Pluripotentes” (“Production of Pluripotent Granulocyte Colony Stimulating Factor”), (citada supra) são descritos genericamente análogos de polipeptidos e fragmentos peptídicos do FEC-G. Os análogos específicos do FEC-G descritos são aqueles em que os resíduos cisteína nas posições 17, 36,42,64 e 74 (das
4 espécies de 174 aminoácidos ou daquelas que possuem 175 aminoácidos, sendo o aminoácido adiciona] o resíduo metionina do terminal N) são substituídos com outro aminoácido (tal como o resíduo serina) e ainda os FEC-G com um resíduo alanina na primeira posição (terminal N). O documento EP 0 335 423, com o título “FEC-G Humanos Modificados” (”Modified Human G-CSF”) descreve com rigor a modificação de um grupo amino pelo menos num polipeptido que possui actividade de FEC-Gh. O documento EP 0 272 703 com o título “Novos Polipeptidos” (“Novel Polypeptide”) descreve a preceito derivados de FEC-G que possuem um aminoácido substituído ou suprimido no terminal N Ou “na sua vizinhança”. O documento EP 0 459 630, com o título “Polipeptidos” (“Polypeptides”) descreve com minúcia derivados de FEC-G que ocorrem naturalmente e que possuem pelo nienos uma das propriedades biológicas dos FEC-G que ocorrem naturalmente e uma estabilidade em solução que é pelo menos de 35% para a concentração de 5 mg/mL, em que os derivados possuem pelo menos um resíduo Cis da sequência natural substituído por um resíduo Ser e possuem um resíduo Asp27 da sequência natural substituído por um resíduo Ser27. O documento EP 0 256 843, com o título “Expressão do FEC-G, Suas Muteínas e Suas Utilizações” (“Expression of G-CSF and Muteins Thereof and Their Uses”) descreve convenientemente uma sequência de ADN modificado que codifica o FEC-G, em que o terminal N é modificado para uma expressão destacada da proteína em células hospedeiras recombinante, sem nenhuma modificação da sequência de aminoácidos da proteína. O documento EP 0 243 153 com o título “Expressão das Proteínas do FEC-G Humano” (“Human G-CSF Protein Expression”) descreve adequadamente os FEC-G que irão ser modi-
ficados inactivando pelo menos um local de transformação da protease de levedura KEX2 para que haja um aumento do rendimento na produção recombinante, utilizando levedura. A patente de invenção norte-americana n° 4 904 584 de Shaw, com o título “Modificação de Polipeptidos, Homogénea e Específica do Local” (“Site-Specific Homogeneous Modification of Polypeptides”) descreve perfeitamente proteínas modificadas pelo resíduo lisina. O documento WO/9012874 descreve adequadamente variantes de proteínas modificadas pelo resíduo cisteína. O pedido de patente de invenção australiana n° AU-A-10948/92, com o título “Activação Aperfeiçoada de Proteínas Recombinantes” (“Improved Activation of Recombinant Proteins”) descreve na perfeição a adição de aminoácidos a qualquer dos terminais da molécula de FSC-G com a finalidade de ajudar a entrelaçar a molécula após a expressão procariótica. O pedido de patente de invenção australiana n° AU-A-76380/91 com o título “Muteínas do Factor Estimulador de Colónias de Granulócitos (FEC-G)” (“Granulocyte Colony Stimulating Factor (G-CSF)”) descreve convenientemente muteínas do factor estimulador de colónias de granulócitos (FEC-G) na sequência Leu-Gli-His-Ser-Leu-Gli-Ile na posição 50-56 do FEC-G com 174 aminoácidos e na posição 53-59 do FEC-G com 177 aminoácidos, e/ou pelo menos um dos quatro resíduos histidina nas posições 43, 79, 156 e 170 do FEC-G maduro (perfeitamente desenvolvido) com 174 aminoácidos ou nas posições 46, 82, 159 ou 173 do FEC-G maduro com 177 aminoácidos. O documento GB 2 213 821 com o título “Gene Sintético do Factor Estimulador de Colónias de Granulócitos Humanos” (“Synthetic Human Granulocyte Colony Stimulating Factor Gene”) descreve com minúcia uma sequência sintética de ácido nucleico que codifica o FEC-G que incorpora locais de restrição, para facilitar a mutagenese da cassete de regiões seleccionadas, e locais de restrição de flanqueamento, para facilitar a incorporação do gene num sistema desejado de expressão. Há um apontamento, v.£. no documento EP 344 796, que aborda o relativo grau de cristalização do FEC-G, tendo a estrutura global do FEC-G sido sujeita a conjecturas e inferida, mas apenas por alto. Bazan, Tmmunology Today’ _N: 350-354 (1990): Parry et ai, ‘J. Molecular Recognition’ 8: 107-110 (1988). Até ao momento presente não houve mais nenhuma descrição sobre a estrutura geral do FEC-G nem foram realizados estudos sistemáticos sobre a relação entre a estrutura geral e a função da molécula, estudos esses que são essenciais para se conceber e projectar de forma sistemática análogos do FEC-G. Assim sendo, é necessário que haja um método para se conceber e projectar de forma sistemática análogos do FEC-G e para a preparação das composições resultantes.
Descrição abreviada da invenção A estrutura tridimensional do FEC-G foi agora determinada ao nível atómico. A partir desta estrutura tridimensional é possível agora antever com um grau de certeza substancial o modo como as alterações na composição de uma molécula de FEC-G podem dar origem a modificações estruturais. Estas características estruturais podem ser correlacionadas com a actividade biológica para efeitos de concepção e de produção de análogos de FEC-G.
Embora outros autores tivessem especulado a propósito da estrutura tridimensional do FEC-G, Bazan, ‘Immunology Today’, _Π: 350-354 (1990) e Parry et ai, ‘J. Molecular Recognition’ 8: 107-110 (1988), tais especulações não serviram para nada àqueles que pretenderam preparar a análogos do FEC-G, ou porque a estrutura inferida por meio de conjecturas estivesse inconecta (Parry et ai, supra) e/ou porque a estrutura inferida por meio de conjecturas não pormenorizava nenhuma correlação entre os radicais constituintes e a estrutura. A presente determinação da estrutura tridimensional ao nível atómico é, sem duvida alguma, a análise mais completa até hoje realizada e proporciona informação importante a. todos quantos pretendam conceber e preparar análogos do FEC-G. Por exemplo, a partir da presente análise estrutural tridimensional foram determinadas as zonas exactas de hidrofobidade e de hidrofilidade. A hidrofobidade relativa é importante, posto que diz respeito directainente à estabilidade da molécula. De um modo geral, as moléculas biológicas existentes em ambientes aquosos são extemamente hidrófilas e intemamente hidrófobas; de acordo com a segunda lei da termodinâmica, este é o estado energético mais baixo e que confere estabilidade. Embora se tenha especulado sobre a hipótese de núcleo interno do FEC-G poder ser hidrófobo e as zonas exteriores poderem ser hidrófilas, nunca houve forma de se conhecer zonas específicas hidrófobas ou hidrófilas. Munidos do conhecimento actual respeitante as zonas de hidrofobidade/hidrofilidade, é possível antever com um grau de certeza substancial quais as modificações da molécula do FEC-G que irão afectar a estrutura geral da molécula.
Como regra geral, é possível recorrer ao conhecimento da geografia das regiões hidrófobas e hidrófilas para conceber e projectar análogos em que a estrutura geral do FEC-G não é alterada, mas em que a modificação afecte realmente a actividade biológica (sendo a expressão “actividade biológica” aqui utilizada no seu sentido mais amplo para designar uma função). É possível correlacionar a actividade biológica com a estrutura. Se a estrutura não tiver sido modificada e se a mutação não tiver nenhum efeito sobre a actividade biológica, então a mutação não tem nenhuma função biológica. No entanto, se a estrutura não tiver sido modificada e se a mutação afectar realmente a actividade biológica, então o resíduo (ou 8 átomo) é essencial, pelo menos para uma função biológica. Alguns dos presentes exemplos experimentais foram concebidos para que não houvesse nenhumas modificações na estrutura geral, se bem que houvesse uma modificação na função biológica.
Com base na correlação entre estrutura e actividade biológica, a presente invenção estuda e descreve análogos do FEC-G. Estes análogos são moléculas que possuem resíduos aminoácidos a mais, a menos, diferentes ou modificados, comparativamente com a sequência de aminoácidos do FEC-G. As modificações podem ser obtidas por adição, substituição ou supressão de um ou vários resíduos aminoácidos. A modificação pode ser uma adição ou uma substituição de análogos dos próprios aminoácidos, tais como peptidomiméticos ou aminoácidos com radicais modificados, tais como grupos laterais modificados. O FEC-G utilizado como base de comparação pode ser de origem humana ou animal ou obtido por meio da tecnologia do ácido nucleico recombinante (embora os exemplos experimentais aqui descritos tenham por base a produção recombinante das espécies de 174 aminoácidos do FEC-G humano, possuindo a mais um resíduo metionilo no terminal N). Os análogos podem ter funções diferentes das funções da molécula natural do FEC-G humano, ou podem ter as mesmas funções ou ainda graus variáveis das mesmas funções. Por exemplo, os análogos podem ser concebidos e projectados para terem uma actividade biológica mais elevada ou mais baixa, um período de armazenamento mais duradouro ou uma menor estabilidade, para serem de formulação mais fácil ou mais difíceis de serem combinados com outros ingredientes. Os análogos podem não ter nenhuma actividade hematopoiética e por esse motivo podem ser úteis como antagonistas contra o efeito do FEC-G (por exemplo, nos casos em que haja uma produção excessiva de FEC-G). De vez em quando, e por razões de conveniência, os análogos da presente invenção recebem aqui a designação de proteínas ou péptidos, mas
também aqui estão contemplados outros tipos de moléculas, tais como moléculas peptido-miméticas ou péptidos modificados por via química. De acordo com outro dos seus aspectos, a presente invenção descreve composições congéneres que contêm um análogo de FEC-G como ingrediente activo. A expressão “composição congénere”, tal como aqui utilizada, designa uma composição que pode ser obtida logo que confirmada a identidade do análogo do FEC-G (tal como um análogo de FEC-G marcado com um marcador detectável, um receptor conotado ou uma composição farmacêutica). Também se considera como composições congéneres as versões quimicamente modificadas dos análogos de FEC-G, tais como aqueles aos quais esteja acoplada pelo menos uma molécula de polietileno-glicol.
Por exemplo, é possível preparar um análogo de FEC-G ao qual é acoplado um marcador detectável, tal como uma molécula fluorescente, quimioluminescente ou radioactiva.
Outro exemplo é uma composição farmacêutica que pode ser formulada por meio de técnicas conhecidas, utilizando materiais conhecidos, ver v.g., ‘Remington’s Pharmaceutical Sciences’, 18a Ed. (1990, Mack Publishing Co., Easton, Pennsylvania 18042), páginas 1435--1712, obra que aqui se considera incorporada por referência. De um modo geral, a formulação vai depender de inúmeros factores, tais como a via de administração, a estabilidade, os parâmetros de produção e outros. O análogo de FEC-G pode ser administrado por injecção ou pode ser administrado aos pulmões por inalação. Também são concebíveis formas de dosagem entéricas para as composições dos análogos de FEC-G da presente invenção e consequentemente a administração por via oral pode ser eficaz. Os análogos de FEC-G podem ser incorporados em lipossomas ou noutros microveículos para efeitos de administração e podem ser formulados em geles ou noutras composições de libertação prolongada. Embora as composições preferenciais possam variar em função da utilização que
10 lhes está destinada, no caso dos análogos de FEC-G que possuam pelo menos uma das actividades biológicas dos FEC-G naturais, as composições farmacêuticas preferidas são geralmente as preparadas para injecção subcutânea ou para administração pulmonar por inalação, embora as formulações particulares para cada tipo de administração dependam das características do análogo.
Outro exemplo de uma composição congénere é um receptor para um análogo da presente invenção. Tal como aqui utilizado, o termo “receptor” designa um radical que se liga de forma selectiva à molécula do análogo da presente invenção. Por exemplo, é possível utilizar como receptores anticorpos ou os seus fragmentos ou “anticorpos recombinantes” (ver Huse et ai, ‘Science’ 246: 1275 (1989)). A expressão ‘ligação selectiva’ significa não só uma ligação específica (embora aqui estejam contemplados os receptores específicos da ligação), mas também significa que a ligação não é um fenómeno aleatório. Os receptores podem estar sobre a superfície da célula ou podem ser intracelulares ou extracelulares e podem actuar de modo a realizarem, inibirem ou localizarem a actividade biológica dos análogos da presente invenção. A ligação ao receptor também pode ser um mecanismo que desencadeie uma sequência de actividade em cascata indirectamente relacionada com o próprio análogo. A presente invenção contempla também os ácidos nucleicos, os vectores que contenham tais ácidos nucleicos e as células hospedeiras que contenham os ácidos nucleicos que codifiquem tais receptores.
Um outro exemplo de uma composição congénere é um análogo de FEC-G com um radical químico acoplado. De um modo geral, a modificação química pode alterar a actividade biológica ou as propriedades antigénicas de uma proteína, ou pode alterar outras características, devendo tais factores ser tomados em consideração pelos especialistas na matéria. Conforme se disse antes, um exemplo de um tal radical químico é o polietileno-glicol. A modificação pode ser a adição de uma ou várias células poliméricas hidrófilas ou hidrófobas, moléculas de ácidos gordos ou moléculas de polissacáridos. Como exemplos de modificadores químicos refere-se os seleccionados entre polietileno-glicol, alquil-propileno-glicóis, Dl-poliaminoácidos, polivinil-pirrolidona, álcool polivinílico, copolímeros de pirano, ácido acético/acilação, ácido propiónico, ácido palmítico, ácido esteárico, dextrano, carboximetil-celulose, polulano ou gelose. Ver, Francis, Focus on Gmwth Faclors 3: 4-10 (Maio de 1992) (publicado por Mediscript, Mountview Court, Friem Bamet Lane, London N20 OLD, UK). A modificação química também pode compreender uma outra proteína ou uma sua parcela, a utilização de um agente citotóxico ou um anticorpo. A modificação química também pode compreender a lecitina.
De acordo com outro dos seus aspectos, o texto presente descreve ácidos nucleicos que codificam tais análogos. Os ácidos nucleicos podem ser os ADN ou os ARN ou os seus derivados e irão ser, de forma típica, clonados ou expressos num vector, tal como um fago ou plasmídeo que contenha sequências reguladoras adequadas. Os ácidos nucleicos podem ser marcados (por exemplo, utilizando um marcador radioactivo, quimioluminescente ou fluorescente), por exemplo, para fins de diagnóstico ou de prognóstico. A sequência de ácido nucleico pode ser optimizada para efeitos de expressão, por exemplo, pode conter codões preferenciais para efeitos de expressão bacteriana. Também estão contemplados o ácido nucleico e a sua cadeia complementar e ainda as suas modificações que não impeçam a codificação do análogo pretendido.
De acordo com outro dos seus aspectos, a presente invenção refere-se às células hospedeiras que contenham os ácidos nucleicos referidos supra que codifiquem os análogos -7<r
agora revelados. As células hospedeiras podem ser eucarióticas ou procarióticas e os sistemas de expressão podem compreender passos complementares referentes ao acoplamento (ou destinados a evitar) de grupos açúcar (glicosilação), o entrelaçamento adequado da molécula, a adição ou a supressão de sequência líderes ou outros factores associados à expressão recombinante.
De acordo com outro dos seus aspectos, a presente invenção refere-se aos ácidos nucleicos anti-sentido que sirvam para evitar ou modificai o tipo ou a quantidade de expressão de tais sequências de ácidos nucleicos. Podem ser preparados por métodos conhecidos.
De acordo com outro dos aspectos da presente invenção, os ácidos nucleicos que codifiquem uma análogo dos agora revelados podem ser utilizados para efeitos de terapia génica, por exemplo, introduzindo num beneficiário um vector que contenha a sequência que codifica o análogo, de tal modo que o próprio ácido nucleico seja expresso dentro do beneficiário que esteja a necessitar da composição do análogo. O vector pode ser colocado em primeiro lugar num veículo, por exemplo, uma célula, e depois o veículo ira ser introduzido no beneficiário. Tal expressão pode ser localizada ou sistémica. Como exemplos de outros veículos refere-se aqueles que possam ocorrer de forma não natural, tais como lipossomas ou outros microveículos ou partículas com capacidade para mediarem a transferencia de genes para um beneficiário. A presente invenção também propicia programas informáticos para a expressão (por exemplo, para permitir visualizar) a estrutura tridimensional do FEC-G ou de um seu análogo, e também um programa informático que exprima a identidade de cada constituinte de uma molécula de FEC-G e a localização exacta desse constituinte dentro da estrutura global, indo até ao nível atómico. Apresenta-se mais adiante um exemplo de um desses programas. <r & S? *v' 13
Presentemente há disponíveis inúmeros programas informáticos para a expressão da estrutura tridimensional de uma molécula. De um modo geral, estes programas prevêem a introdução das coordenadas para a estrutura tridimensional de uma molécula (isto é, por exemplo, a atribuição de um valor numérico a cada átomo de uma molécula do FEC-G segundo os eixos coordenados x, y e z), meios para exprimir (por exemplo, mostrar visualmente) tais coordenadas, meios para alterar tais coordenadas e meios para exprimir uma imagem de uma molécula em que tais coordenadas tenham sido alteradas. É possível programar informação cristalográfica, isto é, as coordenadas da localização dos átomos de uma molécula de FEC-G no espaço tridimensional, em que tais coordenadas tenham sido obtidas por análise cristalográfica da referida molécula de FEC-G, segundo programas que permitam gerar uma aplicação informática para a expressão (por exemplo, para visualizar) da estrutura tridimensional do FEC-G. Assim a invenção proporciona também um programa informático para a expressão da estrutura tridimensional de um análogo do FEC-G. É preferível o programa informático ‘Insight IP, versão 4, que pode ser obtido em “Biosym”, San Diego, Califórnia, com as coordenadas dadas a conhecer na figura 5. A melhor forma de visualização consiste em utilizar um computador ‘Silicon Graphics 320 VGX’, com óculos de tipo ‘Crystal Eyes’ (também fornecidos por “Silicon Graphics”), que peimitem observar estereoscopicamente a molécula de FEC-G ou o seu análogo. Em alternativa, as presentes coordenadas cristalográficas do FEC-G e os correspondentes valore numéricos de difracção também estão depositados no banco de dados de proteínas do departamento de química do Laboratório Nacional de Brookhaven, Upton, Nova Iorque 119723, E.U.A.. Estes valores numéricos podem ser utilizados para a preparação de um programa informático diferente para traduzir a 'estrutura tridimensional de uma molécula de FEC-G ou de um seu análogo. Assim sendo, de acordo 14<r /? com outro dos seus aspectos, a presente invenção proporciona um programa informático para traduzir a estrutura tridimensional de uma molécula de FEC-G. Também está previsto o referido programa informático para permitir visualizar a estrutura tridimensional de uma molécula de FEC-G e o programa em causa ainda pode ter uma configuração que permita alterar tal visualização. A invenção proporciona também o aparelho útil para representar tal programa informático, em particular para visualizar a imagem da referida - estrutura tridimensional, obtida por meio de um computador, de uma molécula de FEC-G ou de um seu análogo e proporciona ainda os meios para a preparação do referido programa informático e do referido aparelho. O programa informático é útil para a preparação dos análogos de FEC-G, uma vez que permite que se faça a selecção de locais específicos da molécula de FEC-G para efeitos de alteração e determinação imediata do efeito que tal alteração irá ter na estrutura global da molécula de FEC-G. A selecção do referido local, para efeitos de alteração, vai depender da característica biológica desejada do análogo de FEC-G. No caso de se pretender modificar aleatoriamente a referida molécula de FEC-G (FEC-G-hu-met-r, o mesmo que r-met-hu-G-CSF), ΛΑ seriam possíveis 175 substituições e ainda seriam possíveis mais análogos em que houvesse modificações, adições ou supressões múltiplas. Graças ao facto de se ver a estrutura tridimensional que está correlacionada com a composição da molécula, a escolha dos locais de alteração deixa de ser um fenómeno aleatório, podendo os locais de alteração ser determinados racionalmente.
Conforme foi explicado antes, a identidade da estrutura tridimensional do FEC-G, incluindo a colocação de cada constituinte, de forma minuciosa, até ao nível atómico, veio agora proporcionar informação que permite concluir quais os radicais que são necessários ~7< 15 para se manter a estrutura global da molécula de FEC-G. Assim, é possível escolher se se deve manter a estrutura global da molécula de FEC-G, ao preparar um análogo de FEC-G da presente invenção, ou se se deve modificar (e a forma de o fazer) a estrutura global da molécula de FEC-G ao preparar um análogo de FEC-G da presente invenção. De forma facultativa, uma vez preparado tal análogo, é possível testá-lo para se pesquisar uma características desejada.
Por exemplo, é possível procurar conservar a estrutura global de uma molécula FEC-G natural não alterada ou recombinante. A estrutura global está representada nas figuras 2, 3 e 4 e está descrita minuciosamente infra. A conservação da estrutura global pode garantir eventualmente a ligação ao receptor, que é uma característica interessante para um análogo que possua as aptidões hematopoiéticas do FEC-G natural (se não houver ligação ao receptor, não há tradução do sinal em consequência da presença do análogo). Está previsto o caso em que uma das classes dos análogos de FEC-G possui a estrutura nuclear tridimensional de uma molécula de FEC-G natural ou recombinante (não alterado), se bem que possua características diferentes, tais como uma aptidão maior para estimular os neutrófilos selectivamente. Uma outra classe de análogos de FEC-G é constituída por aqueles que possuem uma estrutura global diferente que diminui a aptidão de uma molécula de um análogo do FEC-G para se ligar a um receptor do FEC-G e que possui uma menor aptidão para estimular os neutrófilos
I de forma selectiva, comparativamente com o FEC-G recombinante ou natural não alterado.
Por exemplo, sabe-se agora quais são os radicais existentes nas regiões internas de uma molécula de FEC-G que são hidrófobos e correspondentemente sabe-se quais são os radicais existentes na parte externa da molécula de FEC-G que são hidrófilos. Sem se conhecer a estrutura tridimensional global, de preferência ao nível atómico, tal como consta da presente invenção, não seria possível prever quais as alterações nessas zona interna hidrófoba que daria origem a uma modificação na conformação estrutural global da molécula. Uma modificação estrutural global pode dar origem a uma modificação funcional, por exemplo, falta de ligação ao receptor e consequentemente uma diminuição da actividade biológica, tal como existe no FEC-G não alterado. Uma outra classe de análogos de FEC-G é pois constituída pelos análogos de FEC-G que possuem a mesma hidrofobidade do FEC-G recombinante ou natural (não alterado). Mais particularmente, há uma outra classe de análogos de FEC-G que possuem os mesmos radicais hidrófobos contidos nos quatro feixes helicoidais do seu núcleo interno correspondentes aos radicais hidrófobos existentes num FEC-G recombinante ou natural (não alterado), se bem que tenha uma composição diferente desse FEC-G recombinante ou natural não alterado.
Outro exemplo diz respeito às espiras externas que são estruturas que ligam o núcleo intemo (hélices) da molécula do FEC-G. A partir a estrutura tridimensional - incluindo a informação respeitante à localização espacial dos resíduos aminoácidos - é possível prever que determinadas modificações em determinadas espiras não irão ter como resultado modificações conformacionais globais. Assim sendo, outra classe de análogos de FEC-G proporcionada pela presente invenção é aquela que possui as espiras externas modificadas, mas em que a estrutura global é igual à do FEC-G recombinante ou natural (não alterado). Mais particularmente , uma outra classe de análogos de FEC-G proporcionada pela presente invenção é constituída pelos análogos que possuem espiras externas modificadas, sendo tais espiras escolhidas no conjunto constituído pelas que estão entre as hélices A e B, entre as hélices B e C, entre as hélices C e D e entre as hélices D e A, nos termos em que tais espiras e hélices são aqui identificados. Mais particularmente, as referidas espiras, de preferência a 17 espira AB e/ou a espira CD são modificadas para aumentar o período de semi-vida da molécula, mediante a estabilização de tais espiras. Tal estabilização pode ser conseguida unindo a totalidade ou uma parte das referidas espiras a uma parte de um feixe helicoidal α existente no núcleo de uma molécula de FEC-G (ou de um seu análogo). Tal união pode ser realizada por meio de uma folha β, por ponte salina, por pontes dissulfureto, por interacção hidrófoba ou por qualquer outro meio de união conhecido pelos especialistas na matéria, servindo tais meios de união para estabilizar as referidas expiras externas. Por exemplo, é possível estabilizar as espiras AB ou CD unindo a espira AB a uma das hélices contidas na região intema da molécula. O terminal N também pode ser modificado sem alteração da estrutura global de uma molécula de FEC-G, uma vez que o terminal N não participa na estabilidade estrutural das hélices internas, aplicando-se os mesmos preceitos gerais ao terminal N, embora as espiras externas sejam preferíveis para efeitos de modificação.
Por outro lado, tais espiras externas podem ser os locais para a modificação química, uma vez que nos FEC-G recombinantes ou naturais (não alterados) tais espiras são relativamente flexíveis e têm tendência a não interferirem com a ligação ao receptor. Assim, poderia haver mais espaço para que um radical químico fosse acoplado directamente (ou acoplado indirectamente através de outro radical químico que sirva de meio químico de união). O radical químico pode ser seleccionado entre diversos radicais convenientes para a modificação de uma ou várias funções de uma molécula de FEC-G. Por exemplo, uma espira extema pode proporcionar locais para a adição de um ou vários polímeros, com a finalidade de se aumentar o período de semi-vida sérico, por exemplo, utilizando uma molécula de polietileno-glicol. É possível acrescentar tais moléculas de polietileno-glicol nos casos em 18 que a referida espira é alterada para conter mais resíduos lisina que possuem grupos secundários reactivos aos quais as moléculas de polielileno-glicol são capazes de se ligarem. Há outras classes de radicais químicos que também podem ser acoplados a uma ou várias espiras externas, incluindo, mas sem que isso constitua qualquer limitação, a ligação a outras moléculas biologicamente activas, tais como receptores, outras proteínas terapêuticas (tais como outros factores hematopoiéticos que poderiam dar origem a uma molécula híbrida) ou agentes citotóxicos (tais como a toxina da difteria). Como é evidente, esta listagem não é exaustiva; um especialista na matéria, tendo à sua disposição o radical químico desejado, sabe como realizar o acoplamento do referido radical desejado à espira externa desejada. Assim sendo, há uma outra classe de análogos de FEC-G da presente invenção, constituída por aqueles que em que há pelo menos uma alteração numa espira externa, em que a referida alteração consiste na adição de um radical químico, por exemplo, pelo menos uma molécula de polietileno-glicol.
Nas espiras externas também podem ser efectuadas supressões, tais como supressões de locais reconhecidos pelas proteínas pará degradação da molécula. Isto proporciona meios alternativos para aumentar o período de semi-vida de uma molécula que de outra forma teria capacidade para se ligar ao receptor de FEC-G e para efectuar a transdução do sinal (isto é, potencial para estimular selectivamente a maturação dos neutrófilos). Posto isto, há uma outra classe de análogos de FEC-G da presente invenção, constituída por aqueles em que foi realizada pelo menos uma alteração numa espira externa, em que tal alteração faz diminuir a degradação desses análogos pela acção das proteases. As espiras preferidas para tais alterações são a espira AB e a espira CD. É possível preparar uma molécula de FEC-G mais curta suprimindo uma parte dos resíduos aminoácidos existentes nas espiras externas (adiante 19 identificados mais minuciosamente), podendo a referida molécula mais curta de FEC-G ter outras vantagens em termos de preparação ou de funções biológicas.
Outro exemplo diz respeito às cargas eléctricas relativas entre resíduos aminoácidos que estejam na vizinhança uns dos outros. Conforme se disse antes, a molécula de FEC-G contém um feixe de quatro hélices relativamente coeso. Algumas das faces das hélices estão voltadas para outras hélices. No ponto (por exemplo, um resíduo) em que uma hélice está voltada para outra hélice, os dois radicais aminoácidos que se encontram voltados um para o outro podem ter a mesma carga e por tal motivo repelir-se-ão mutuamente, o que confere instabilidade à molécula na sua totalidade. Isto pode ser eliminado modificando a carga eléctrica (pássando-a para uma carga eléctrica oposta ou para uma carga neutra) de um ou dos dois radicais aminoácidos, por forma a que deixe de haver repulsão. Assim sendo, há outra classe de análogos de FEC-G constituída pelos análogos de FEC-G em que foram introduzidas alterações para modificar a instabilidade originada pelas interaeções superficiais, tais como a localização da carga do electrão. A presente invenção também descreve métodos para conceber e projectar análogos de FEC-G e composições congéneres e ainda os produtos resultantes da aplicação de tais métodos. Os produtos finais obtidos por tais métodos podem ser os análogos de FEC-G definidos supra ou composições congéneres. Assim sendo, os exemplos aqui descritos demonstram: (a) o efeito de substituições nos constituintes (isto é, radicais químicos) da molécula do FEC-G na estrutura do FEC-G e (b) os efeitos de modificações na estrutura sobre as funções biológicas. Posto isto, em termos essenciais, um aspecto da presente invenção diz respeito a um método para a preparação de uma análogo de FEC-G, o qual compreende os passos seguintes. 20 (a) procurar ao nível de um aminoácido ou ao nível atómico informação associada à estrutura tridimensional de uma molécula de FEC-G, conforme ilustrado na figura 5, em que os radicais químicos, tais como cada um dos resíduos aminoácidos ou cada átomo de cada um dos resíduos aminoácidos, da molécula do FEC-G estejam correlacionados com a referida estrutura; (b) a partir da referida informação escolher um local numa molécula de FEC-G para sofrer uma alteração; (c) preparar uma molécula de um análogo de FEC-G que possua tal alteração; e (d) testar facultativamente tal molécula do análogo de FEC-G para pesquisar uma característica desejada.
Para a preparação de um análogo de FEC-G é possível aplicar um método automático comandado e gerado por programas informáticos aqui apresentados. Assim sendo, outro aspecto da presente invenção diz respeito a um método para a preparação de um análogo de FEC-G, em conformidade com o método do parágrafo anterior, tendo por base a utilização de um computador, o qual compreende os passos seguintes: (a) procurar obter a expressão informática da estrutura tridimensional da molécula de FEC-G em que os radicais químicos, tais como cada um dos resíduos aminoácidos ou cada átomo de cada um dos resíduos aminoácidos da molécula de FEC-G, estejam correlacionados com a referida estrutura; (b) a partir da referida expressão informática escolher um local numa molécula de FEC-G para sofrer uma alteração; (c) preparar uma molécula de FEC-G que possua tal alteração; e (d) testar facultativamente tal molécula de FEC-G para pesquisar uma característica desejada. \ 21
Dito de forma mais concreta, a presente invenção proporciona um método para a preparação de um análogo de FEC-G, o qual compreende os passos seguintes: (a) procurar ao nível de um aminoácido ou ao nível atómico informação associada à estrutura tridimensional de uma molécula de FEC-G, por meio de um computador, sendo tal computador programado (i) para exprimir as coordenadas de uma molécula de FEC-G no espaço tridimensional e (ii) para permitir a entrada de dados relativos à informação para a alteração da referida expressão do FEC-G e para permitir a sua visualização; (b) escolher um local na referida imagem visual da referida molécula de FEC-G para experimentar uma alteração; (c) introduzir no referido computador os dados respeitantes à infoimação para essa alteração; (d) observar a estrutura tridimensional da referida molécula alterada do FEC-G por meio do referido computador; (e) repetir facultativamente os passos (a) - (d); (t) preparar um análogo de FEC-G com a referida alteração; e (g) testar facultativamente o referido análogo de FEC-G para pesquisar uma característica desejada.
De acordo com outro dos seus aspectos, a presente invenção descreve métodos para utilizar estes análogos de FEC-G e as composições congéneres e descreve também métodos para o tratamento ou para a protecção de mamíferos, quer por si sós quer combinados com outros fármacos ou factores hematopoiéticos, no tratamento de doenças hematopoiéticas. Prevê-se que um aspecto da concepção e projecto de análogos de FEC-G venha a ser o objectivo de aumentar ou modificar as características que se sabe que tem o FEC-G não modificado. 22
Por exemplo, os análogos podem possuir actividades mais intensas ou modificadas, pelo que no caso de o FEC-G ser útil para o tratamento (por exemplo) de neutropenia, as composições e os métodos da presente invenção também podem ser utilizáveis.
Outro exemplo é a modificação do FEC-G com o objectivo de interactuar mais eficientemente quando utilizado em combinação com outros factores, em particular no tratamento de doenças de natureza hematopoiética. Um exemplo de uma tal utilização combinada consiste em recorrer a um factor hematopoiético de actuação precoce (isto é, um factor que actue em primeiro lugar na cascata da hematopoiese em células relativamente indiferenciadas) e em utilizar simultânea ou sequencialmente um factor hematopoiético que actue mais tarde, tal como o FEC-G ou um seu análogo (uma vez que o FEC-G actua sobre a linhagem de GM-UFC (o mesmo que CFU-GM) na estimulação selectiva dos neutrófilos). Os métodos e composições podem ser úteis em terapias que envolvam tais combinações ou “misturas” de factores hematopoiéticos.
As composições e métodos também podem ser úteis para o tratamento de leucopenia, leucemia mielogénica, neutropenia crónica grave, anemia aplásica, doença de armazenagem do glicogénio, mucossistite e outras doenças associadas à insuficiência de medula óssea. As composições e os métodos também podem ser úteis para o tratamento de défices hematopoiéticos resultantes de quimioterapia ou de radioterapia. O sucesso de uma transplantação de medula óssea ou a utilização, por exemplo, de células progenitoras do sangue periférico para transplantação são casos que podem ser melhorados mediante a aplicação dos métodos e das composições da presente invenção (proteínas ou ácidos nucleicos para terapia génica). As composições e os métodos também podem ser úteis para o tratamento de doenças infecciosas, tal como sucede no caso da cicatrização de ferimentos, tratamento de queimaduras, 23 & bacteremia, septicemia, infecções fúngicas, endocardite, osteopielite, infecções associadas ao trauma abdominal, infecções que não respondam aos antibióticos e pneumonias, podendo ainda o tratamento de inflamações bacterianas beneficiar da aplicação das composições e dos métodos da presente invenção. Além disso, tais composições e métodos podem ser úteis para o tratamento de leucemia, devido à capacidade assinalada para a diferenciação das células leucémicas. Welte eí ai, ‘PNAS-USA’ 82: 1526-1530 (1985). Outras aplicações há que incluem o tratamento de indivíduos com tumores, utilizando as composições e os métodos referidos, facultativamente na presença de receptores (tais como anticorpos) que se liguem às células tumorais. Para leitura e estudo de artigos sobre aplicações terapêuticas veja-se Lieshhke e Burgess, ΊΜ. Engl. J. Med.’ 327. 28-34 e 99-106 (1992), estando ambos os documentos aqui incorporados por referência.
As composições e métodos também podem ser úteis para actuarem como intermediários para a produção de outros radicais; por exemplo, foi já assinalado que o FEC-G influencia a produção de outros factores hematopoiéticos e esta função (se confirmada) pode ser reforçada ou modificada através das composições e/ou dos métodos da presente invenção.
As composições relacionadas com os análogos de FEC-G da presente invenção, tais como os receptores, podem ser úteis para actuarem como antagonistas que impeçam a actividade do FEC-G ou de um seu análogo. E possível obter uma composição com a totalidade ou com uma parte da actividade do FEC-G não alterado ou de um análogo de FEC-G e acrescentar um oú vários radicais químicos para modificar uma ou várias propriedades de tal FEC-G ou de um seu análogo. Tendo conhecimento desta conformação tridimensional, um especialista pode antever qual a melhor localização geográfica para tal modificação química, de modo a obter o efeito pretendido. 24
Os objectivos gerais das modificações químicas podem ser a obtenção de um maior período de semi-vida (por exemplo, uma depuração renal, imunológica ou celular reduzida), uma bioactividade alterada (por exemplo, propriedades enzimáticas alteradas, bioactividades dissociadas ou actividade em solventes orgânicos), toxicidade reduzida (por exemplo, dissimulação de epítopos tóxicos, compartimentaiização e biodistribuição selectiva), imunoneactividade modificada (imunogenicidade reduzida, antigenicidade reduzida ou acção adjuvante) ou propriedades físicas modificadas (por exemplo, maior solubilidade, maior estabilidade térmica, maior estabilidade mecânica ou estabilização confoimacional). Ver Francis, Focus on Growth fàctors 3: 4-10 (Maio de 1992) (publicado por Mediscript, Mountview Court, Friem Bamet Lane, London N20 OLD, UK).
Os exemplos subsequentes ilustram a presente invenção sem contudo a limitarem. Faz-se observar que há variações e modificações que podem ocorrer aos especialistas na matéria, considerando-se abrangidas pela reivindicações anexas todas essas variantes equivalentes que estejam contidas no âmbito da invenção, tal como reivindicada.
Descrição minuciosa dos desenhos A figura 1 é uma ilustração da sequência de aminoácidos das espécie de FEC-G de 174 aminoácidos com mais um resíduo metionina no terminal N (Seq 1D N° 1) (Seq ID N°: 2). A figura 2 é um diagrama topológico da estrutura cristalina do FEC-G e também de HCh, HCp, FEC-GM (o mesmo que respectivamente hGH, pGH, GM-CSF), INF-β, IL-2 e IL-4. Estas ilustrações têm por base os dados contidos nas referências citadas. O comprimento dos elementos estruturais secundários está traçado em proporção com o número de resíduos. As hélices A, B, C e D são marcadas em conformidade com o esquema aqui utilizado para o FEC-G. No caso do INF-β a marcação original das hélices está indicada entre parênteses.
25 A figura 3 é um “diagrama de serpentina” da estrutura tridimensional do FEC-G. A hélice A é constituída pelos resíduos aminoácidos 11-39 (numerados de acordo com a figura 1 supra), a hélice B é constituída pelos resíduos aminoácidos 72-91, a hélice C é constituída pelos resíduos aminoácidos 100-123 e a hélice D é constituída pelos resíduos aminoácidos 143-173. A hélice relativamente curta 310 está nos resíduos aminoácidos 45-48 e a hélice α está nos resíduos aminoácidos 48-53. Os resíduos 93-95 constituem quase uma volta completa de uma hélice levógira. A figura 4 é um “diagrama de cilindros” da estrutura tridimensional do FEC-G. Os cilindros completos e as suas orientações para a estrutura tridimensional do FEC-G estão ilustrados por meio de diversos tons de cinzento. Os números indicam a posição dos resíduos aminoácidos em conformidade com a figura 1 supra. A figura 5 é uma listagem das coordenadas utilizadas para se gerar uma imagem visual da estrutura tridimensional dó FEC-G por meio de um computador. Tais coordenadas são explicitadas a seguir. As colunas correspondem a campos independentes: (i) o campo 1 (a partir do lado esquerdo) é o átomo, (ii) o campo 2 é o número atribuído ao átomo, (iii) o campo 3 é o nome do átomo (de acordo com a nomenclatura convencional do quadro periódico, sendo CB o átomo de carbono β, CG o átomo de carbono γ, etc.), (iv) o campo 4 é o tipo de resíduo (de acordo com a nomenclatura de três letras para os aminoácidos, por exemplo, conforme consta v.g. na obra de Stryer, ‘Biochemistry’, 3a Ed., W.H. Freeman e Company, N.Y., 1988, no verso da contracapa; (v) os campos 5-7 são as posições do átomo no eixo dos x, no eixo dos y e no eixo dos z; (vi) o campo 8 (frequentemente um “1.00”) designa uma ocupação nessa posição; (vii) o campo 9 designa o factor β; (viii) o campo 10 indica a designação da molécula. Há três moléculas (designadas por a, b e c) do FEC-G que cristalizaram conjuntamente, formando uma unidade. A designação a, b ou c indica quais as coordenadas pertencentes a cada molécula. O número a seguir à letra (1, 2 ou 3) indica a posição atribuída ao resíduo aminoácido, tendo sido atribuídas à molécula a as posições 10-175, à molécula b as posições 210-375 e à molécula c as posições 410-575. Estas posições foram assim definidas para que não houvesse nenhuma sobreposição entre as três moléculas que cristalizaram conjuntamente. (O símbolo “W” significa água). A figura 6 é uma representação esquemática da estratégia associada ao refinamento da matriz de cristalização para os parâmetros implicados na cristalização. A matriz de cristalização corresponde à concentração final dos componentes (sais, tampões e agentes precipitantes) das soluções de cristalização contidas nas cavidades de uma placa de 24 cavidades para cultura de tecidos. Estas concentrações são obtidas pipetando o volume adequado de soluções-mãe para dentro das cavidades da placa de microtitulação. Para conceber e arquiteclar a matriz, um especialista em cristalografia decide-se sobre uma maior ou menor concentração do componente. Estas concentrações maiores ou menores podem ser obtidas por meio de uma pipeta, quer ao longo das diveisas fileiras (linhas) (v.g. A1-A6, B1-B6, C1-C6 ou D1-D6), quer ao longo de todo o tabuleiro (A1-D6). O primeiro método é útil para confirmar a reprodutibilidade do crescimento cristalino de um único componente ao longo de um número limitado de cavidades, ao passo que o segundo método é mais útil na pesquisa inicial. Os resultados das diversas fases de refinamento da matriz de cristalização estão ilustrados por uma representação de três placas. O aumento dos tons de sombreado nas cavidades indica um resultado positivo de cristalização, podendo ser, nas fases finais, cristais de qualidade confirmada aos raios X, mas que nas fases iniciais poderiam ser gotículas de óleo, precipitados granulares ou pequenos cristais com dimensões sensivelmente inferiores a 0,05 mm. A parte A representa uma pesquisa inicial de um parâmetro em que o intervalo de concentração entre a primeira cavidade (Al) e a última cavidade (D6) é grande, sendo o aumento de concentração entre cavidades calculado pela expressão ((concentração em Al) -- (concentração em D6))/23). A parte B representa o facto de o refinamento da dispersão da concentração entre A l e D6, nas fases finais da matriz de cristalização, vir a ser reduzida e tendo pois por consequência a formação de mais cristais por placa. A parte C indica uma fase final do refinamento da matriz, em que são encontrados cristais de qualidade na maior paite das cavidades da placa.
Descrição Minuciosa da Invenção A presente invenção assenta na descoberta da estrutura tridimensional do FEC-G. Esta estrutura tridimensional foi expressa por meio de um programa informático para efeitos de visão estereoscópica. Ao efectuar tal observação estereoscopicamente, foram identificadas as relações entre estrutura e funções e foram concebidos, projectados e produzidos análogos de FEC-G.
Estrutura Tridimensional Geral do FEC-G O FEC-G utilizado para a determinação da estrutura foi uma espécie não glicosilada de 174 aminoácidos, que possui mais um resíduo metionina no terminal N, próprio para a 28 expressão bacteriana. As sequências de AON e de aminoácidos deste FEC-G estão ilustradas na figura 1.
Em termos gerais, a estrutura tridimensional do FEC-G é predominantemente helicoidal, com 103 dos 175 resíduos a formarem um feixe helicoidal 4α. A única estrutura secundária a mais está na espira entre as primeiras duas hélices compridas, em que uma hélice 310 de 4 resíduos é seguida imediatamente por uma hélice α de 100 resíduos. Conforme se observa na figura 2, comparou-se a estrutura geral com a estrutura atribuída a outras proteínas: hormona do crescimento (Abdel-Meguid et al., ‘PNAS-USA’ 84: 6434 (1987) e Vos et al., ‘Science’ 255: 305-312 (1992)), factor estimulador das colónias de macrófagos granulócitos (Diederichs et al., ‘Science’ 254: 1779-1782 (1991), interferão β (Senda et αί, ΈΜΒΟ J.’ FF 3193-3201 (1992)), interleucina 2 (McKay, ‘Science’ 257: 1673-1677 (1992)) e interleucina 4 (Powers ei al., ‘Science’ 256: 1673-1677 (1992) e Smith et al., ‘J. Mol. Biol.’ 224: 899-904 (1992)). Há uma similitude estrutural entre estes factores de crescimento, apesar da ausência de similitude nas suas sequências de aminoácidos. A informação estrutural disponível era, no momento, a correlação da bioquímica do FEC-G e tal facto pode ser resumido conforme a seguir se indica (estando a posição 1 da sequência no terminal N): 29 29 Posição da sequência 1-10 Cis 18 34 20-47 (inclusive) 20,23,24 165-175 (inclusive)
Descrição da estrutura
Cadeia alargada
Parcialmente encoberto
Local alternativo de junção Hélice A, primeira ponte dissulfureto e parte da hélice AB Hélice A terminal carboxi
Análise A supressão não provoca nenhuma perda de actividade biológica Reactivo com DTNB e Thimersosol’, mas não com iodo-acetato A inserção reduz a actividade biológica A região prevista de ligação ao receptor tem por base dados de anticorpos neutral izantes A mutação de resíduos por um só resíduo alanina reduz a actividade biológica. Ligação ao receptor previsível (local B) A supressão reduz a actividade biológica
Esta informação bioquímica, obtida a partir de estudos de ligação de anticorpos, ver Layton et ai, ‘Biochemistry’ 266: 23815-23823 (1991), foi sobreposta à estrutura tridimensional com a finalidade de se conceber e projectar os análogos de FEC-G. A concepção, a preparação e a experimentação destes análogos de FEC-G está descrita no Exemplo 1 subsequente. EXEMPLO 1
Este exemplo descreve a preparação do FEC-G cristalino, a visualização da estrutura tridimensional do FEC-G humano recombinante por meio de imagens geradas por computador, a preparação de análogos, utilizando para tal a mutagenese dirigida ao local ou métodos de amplificação dos ácidos nucleicos, experiências biológicas e análises por CLER utilizadas para pesquisa e estudo dos análogos de FEC-G e a determinação resultante das relações gerais entre estrutura/funções. Todas as publicações citadas são consideradas aqui incorporadas por referência.
A, Recurso à Cristalização Automatizada A necessidade de se encontrar uma estrutura tridimensional para o factor estimulador de colónias de granulócitos humanos recombinantes (FEC-G-hu-r, o mesmo que r-hu-G-CSF) e a disponibilidade de grandes quantidades de proteína purificada levaram à concepção de métodos de crescimento de cristais por amostragem factorial incompleta e inoculação. Começando com a implementação do processo de cristalização factorial incompleta, descrito por Jancarik e Kim, ‘J. Appl. Crystallogr.’ 24: 409 (1991), eféctuou-se uma avaliação das condições da solução que produzissem gotículas de óleo e agregados birrefringentes. Além disso, efectuou-se também as necessárias modificações do equipamento e dos programas informáticos de um sistema de pipetagem automático para assim se produzir à volta de 400 condições de cristalização diferentes diariamente. Weber, ‘J. Appl. Crystallogr.’ 20: 366-373 (1987). Este procedimento conduziu a uma solução de cristalização que produziu cristais de FEC-G-hu-r. O tamanho, a reprodutibilidade e a qualidade dos cristais são características que foram aperfeiçoadas por meio de um método de inoculação em que o número de “unidades iniciadoras da nucleação” foi estimado por diluição sequencial de razão constante de uma solução inoculante. Estes métodos proporcionaram o crescimento reproduzível de cristais de FEC-G-hu-r com 2,0 mm. O grupo espacial destes cristais é P212 j 21 com as dimensões celulares definidas por a = 90 Λ, b=l 10 Â e c=49 Á, difractando para uma resolução de 2,0 Á. 1, Metodologia Geral
Para pesquisar as condições de cristalização de uma nova proteína, Cárter e Cárter, ‘J. Biol. Chern.’ 254: 122219-12223 (1979) propuseram o método factorial incompleto. Estes autores sugeriram que uma amostragem de um grande número de condições de cristalização seleccionadas aleatoriamente, mas geralmente prováveis, pode conduzir a uma combinação bem sucedida de reagentes que produza a cristalização da proteína. Esta ideia foi levada à prática por Jancarik e Kim, ‘J. Appl. Crystallogr.’ 24: 409 (1991), que descreveram 32 soluções para as experiências iniciais de cristalização num intervalo de valore de pH e para um conjunto de sais e de agentes precipitantes. Descrevemos aqui uma extensão das suas experiências para um conjunto ampliado de 70 soluções. Para se minimizar o esforço e os erros humanos da preparação das soluções, programou-se o método para ser executado por uma máquina de pipetagem automática.
Seguindo o método de Weber de pesquisa sequencial automática do retículo (PSAR, o mesmo que SAGS), 4J. Cryst. Growth’ 90: 318-324 (1988), utilizou-se o sistema robótico para gerar um conjunto sequencial de soluções que permitiram refinar continuamente as condições de cristalização respeitantes a temperatura, valores de pH, sais e agentes precipitantes. Uma vez determinada uma solução que permitiu fazei' crescer os cristais de forma reproduzível, desenvolveu-se então uma técnica de inoculação que permitiu aumentar bastante a qualidade dos cristais. A combinação destes dois métodos permitiu produzir em poucos dias centenas de cristais de qualidade difractiva (cristais que difractam pelo menos a cerca de 2,5 Angstrom, possuindo de preferência pelo menos parcelas que difractam abaixo de 2 Angstrom e mais preferencialmente a cerca de 1 Angstrom).
De um modo geral, o método de cristalização que é possível utilizar com qualquer proteína que se pretenda cristalizar compreende os passos seguintes: (a). combinar aliquotas aquosas da proteína desejada quer com (i) aliquotas de uma solução salina, possuindo cada aliquota urna concentração diferente de sal, quer com (ii) 32 •y aliquolas de uma solução de agente precipitante, possuindo cada aliquota uma concentração diferente de agente precipitante, sendo a combinação das aliquotas efectuada facultativamente num intervalo de valores de pH; (b) observar as referidas aliquotas combinadas para pesquisar formações pré--cristalinas e escolher a referida combinação de sal ou de agente precipitante e do referido valor de pH que seja eficaz para produzir as formas pré-cristalinas ou então, se assim não tiverem sido produzidas nenhumas formas pré-cristalinas, aumentar a concentração inicial da proteína das referidas aliquotas aquosas de proteína; (c) depois de seleccionada a concentração do referido sal ou do referido agente precipitante, repetir o passo (a) com a referia solução que anteriormente não foi seleccionada, agora na presença da referida concentração escolhida; e (d) repetir o passo (b) e o passo (a) até se obter um cristal com a qualidade pretendida. O método descrito supra pode ser facultativamente automatizado, o que permite poupar bastante tempo e trabalho. As concentrações preferidas para a proteína no início estão compreendidas entre 10 mg/mL e 20 mg/mL, mas esta concentração inicial irá variar em função da proteína em causa (o FEC-G infra foi analisado utilizando uma concentração de 33 mg/mL). Um intervalo preferido para a concentração da solução salina para começar a análise com NaCl está compreendidos entre 0-2,5 M. Um agente precipitante preferido é o polietileno-glicol 8000, havendo no entanto outros agentes precipitantes seleccionados entre solventes orgânicos (tais como o etanol), moléculas de polietileno-glicol com pesos moleculares compreendidos no intervalo entre 500 e 20 000 e ainda outros agentes precipitantes conhecidos pelos especialistas na matéria. O intervalo preferido de valores de pH é definido pela sequência de valores de pH 4,5, 5,0, 5,5, 6,0, 6,5, 7,0, 7,5, 8,0, 8,5 e 9,0. As formas de pré-cristalização podem ser óleos, agentes precipitantes birrefringentes, cristais pequenos (com dimensões sensivelmente inferiores a 0,05 mm), cristais médios (com dimensões compreendidas aproximadamente entre 0,05 mm e 0,5 mm) e cristais grandes (com dimensões sensivelmente superiores a 0,5 mm). O período de espera preferido para se ver uma estrutura cristalina é de 48 horas, embora a observação semanal também seja preferida e ao fim de cerca de um mês, de um modo geral, passa-se a utilizar uma concentração diferente da proteína (normalmente aumenta-se a concentração da proteína). É preferível recorrer a um processo automático, utilizando para tal o sistema ‘Accuflex’ tal como foi modificado. Os parâmetros preferidos de automatização estão descritos mais adiante.
De um modo geral, combinou-se uma proteína com uma concentração compreendida entre 10 mg/mL e 20 mg/mL com soluções de NaCl com concentrações variáveis entre 0 e 2,5 M e cada uma dessas combinações foi realizada (separadamente) no intervalo de valores de concentrações definido supra. Uma vez observada uma estrutura de pré-cristalização, executa-se uma experiência independente para optimizar a concentração salina e o intervalo de valores de pH, até se conseguir obter um cristal com a qualidade desejada. A seguir optimiza-se também a concentração do agente precipitante para níveis variáveis de pH. Logo que estes parâmetros se encontrem optimizados, efectua-se um ensaio com as condições óptimas em simultaneidade para se conseguir obter o resultado pretendido (isto está ilustrado por meio de um diagrama na figura 6). a. Implementação de um sistema automático de pipetagem
Realizou-se a preparação de soluções de gotas e soluções-mãe recorrendo a um sistema de pipetagem ‘Accuflex’ (ICN Phannaceuticals, Costa Mesa, CA) que é comandado y<j, 34 por um computador pessoal que envia códigos ‘ASCII’ através de um dispositivo interface sequencial convencional. O dispositivo de pipetagem retira amostras de seis soluções diferentes por meio de uma válvula rotativa e vai pipetar estas soluções numa placa cuja translação no sistema de coordenadas x - y é possível regulai'. O componente veitical do sistema manipula uma seringa que é capaz quer de fornecer quer de retirar líquido.
As aplicações informáticas fornecidas com o sistema ‘Accuflex’ tinham por base o método de PSAR (o mesmo que SAGS) sugerido por Cox e Weber, ‘J. Appl. Crystallogr.’ 20: 366-373 (1987). Este método implica a variação sistemática de dois parâmetros principais de cristalização, isto é, o valor do pH e a concentração do agente precipitante, com possibilidade de fazer variar outros dois. Assentes nestes conceitos, as aplicações informáticas aqui utilizadas conferiram maior flexibilidade à concepção e à implementação das soluções de cristalização utilizadas na estratégia de pesquisa automática sequencial do retículo (grelha). Devido a esta flexibilidade, as aplicações informáticas da presente invenção também criaram um número maior de soluções diferentes. Isto é essencial para a implementação do método factorial incompleto, tal como descrito mais adiante na correspondente secção.
Para aumentar a velocidade e melhorai' a aiquitectura da estratégia de pesquisa automática da grelha, é necessário introduzir modificações nas aplicações lógicas e no equipamento respeitantes ao sistema de pipetagem ‘Accuflex’. As modificações introduzidas ao nível do equipamento permitiram a utilização de dois tabuleiros diferentes de microtitulação, tendo um deles sido utilizado nas experiências com as gotas suspensas e o outro nas experiências com as gotas em repouso, e ainda um tabuleiro de ‘Plexiglas’ que continha mais 24 soluções de tampão, sais e precipitantes. Estas soluções complementares aumentaram a grelha de condições de cristalização que foi possível investigar.
Para se utilizar as modificações realizadas no equipamento, as aplicações lógicas de pipetagem foram escritas em duas subrotinas. uma subrotina permite que o cristalógrafo desenhe uma matriz de soluções de cristalização baseadas nas concentrações dos seus componentes e a outra subrotina transforma estas concentrações num código informático que faz pipetar os volumes adequados das soluções nos tabuleiros de cristalização. As matrizes das concentrações podem ser geradas por um qualquer de dois programas. O primeiro programa (MRF, fornecido por Amgen, Inc., Thousand Oaks, CA) faz referência a uma listagem de concentrações das soluções permanentes, fornecidas pelo cristalógrafo, e calcula o volume que é necessário pipetar para se conseguir a concentração pretendida. O segundo método, considerado preferível, incorpora um programa de folha de cálculo (Lotus) que pode ser utilizado para a produção de gradientes mais sofisticados de precipitantes ou de valores de PH. A matriz de concentrações criada por qualquer dos programas é inteipretada pelo programa de controlo (SUX, uma modificação do programa que acompanha originariamente o pipetador ‘Accuflex’ e que pode ser adquirido a “Amgen, Inc. Thousand Oaks, CA”) sendo as cavidades preenchidas em conformidade. b. Implementação do Método Factorial Incompleto A conveniência do sistema de pipetagem modificado para a preparação das diversas soluções melhorou a implementação de um método factorial incompleto expandido. O desenvolvimento de um novo conjunto de soluções de cristalização, com componentes “aleatórios”, foi conseguido utilizando o programa INFAC, Cárter et ai, ‘J. Cryst. Growth’ 90. 60-73 (1988) que produziu uma listagem que continha 96 combinações aleatórias de um factor resultante de três variáveis. As combinações de cálcio e fosfato que precipitaram
36 imediatamente foram eliminadas, ficando 70 combinações distintas de precipitantes, sais e tampões. Estas combinações foram preparadas utilizando o pipetador automático e ficaram a incubar durante uma semana. Realizou-se uma inspecção das misturas e preparou-se novamente as soluções que formaram precipitantes, com concentrações menores dos seus componentes. Repetiu-se este procedimento até deixar de haver precipitantes em todas as cavidades. c. Cristalização do FEC-G-hu-r (o mesmo que r-hu-G-CSF)
Foram utilizadas diversas estratégias diferentes de cristalização para se encontrar uma solução que produzisse cristais de qualidade observável aos raios X. Tais estratégias incluíram a utilização do método factorial incompleto, o refinamento das condições de cristalização recorrendo a pesquisas de grelha sucessivas e automáticas (PGSA), a implementação de uma técnica de inoculação e o desenvolvimento de um procedimento de produção de cristais que permitiu obter centenas de cristais excelentes de um dia para o outro. Salvo quando especificado de outro modo, para a pesquisa e para a produção dos cristais de FEC-G-hu-r utilizou-se o método de difusão a vapor de gotas suspensas. Afmsen et al., ‘Physical Principies of Protein Ciystallization’. In: Eisenberg (ed ), ‘Advanced in Protein Chemistry’ 41. 1-33 (1991).
Para a pesquisa inicial das condições de cristalização do FEC-G-hu-r utilizou-se o método factorial incompleto de Jancarik e Kim, ‘J. Appl. Crystallogr. ’ 24: 409 (1991), daí resultando diversas soluções que permitiram obter resultados de “pré-cristalização”. Estes resultados compreendem no seu conjunto precipitantes binefringentes, óleos e cristais muito pequenos (< 0,05 mm). Estas soluções de pré-cristalização serviram depois como pontos de partida para uma pesquisa sistemática. s<? f? és * 37 O processo de pesquisa exigiu o desenvolvimento de matrizes de cristalização. Estas matrizes correspondiam à concentração dos componentes nas soluções de cristalização e foram criadas utilizando a folha de cálculo da aplicação Lotus™ para um PC da IBM, tendo sido implementadas com o sistema de pipetagem modificado da ‘Accuílex’. A estratégia para a produção das matrizes consistiu em fazer variar um parâmetro de cristalização (por exemplo, a concentração salina), mantendo constantes todos os outros parâmetros, por exemplo, o valor de pH e a concentração dos precipitantes. No início da pesquisa, o intervalo de concentrações dos parâmetros variáveis foi grande, mas tal intervalo de concentrações foi sendo sucessivamente refinado até ao ponto em que em todas as cavidades do tabuleiro de microlitulação foi obtido o mesmo resultado de cristalização. Estas resultados foram classificados do modo seguinte: cristais, precipitado birrefringente, precipitado granular, gotículas oleosas e massa amorfa. Se a concentração de um determinado parâmetro de cristalização não produziu pelo menos um precipitante, fez-se aumentar a concentração desse parâmetro até se formar um precipitante. Depois de completado cada um dos tabuleiros, deixou-se ficar em repouso pelo menos durante dois dias e depois efectuou-se uma inspecção para investigar o crescimento dos cristais. Após esta pesquisa inicial, os tabuleiros passaram a ser inspeccionados semanalmente.
Graças a este processo de pesquisa foram identificadas duas soluções independentes, com os mesmos valores de pH e com os mesmos precipitantes, mas de sais diferentes (MgCl, US04) que produziram cristais pequenos (0,1 mm x 0,05 mm x 0,05 mm). Com base nestes resultados produziu-se um novo conjunto de matrizes de concentração em que se fez variar a concentração do MgCl relativamente à do L1SO4, mantendo constantes todos os outros parâmetros de cristalização. Este conjunto de experiências permitiu identificar uma solução que produziu cristais de qualidade difractiva (> a aproximadamente 0,5 mm) em cerca de três semanas. Para se encontrar esta solução de crescimento dos cristais (SCC) (Mes 100 mM a pH 5,8, MgCl2 380 mM, LiSQ* 220 mM e 8% de PEG 8k) foram pesquisadas aproximadamente 8 000 condições que consumiram cerca de 300 mg de proteína. O tamanho dos cristais dependeu do número de cristais que se formam por cada gotã. De forma típica, foram-se entre 3 e 5 cristais com um tamanho médio de 1,0 mm x 0,7 mm x 0,7 mm. Foram obtidas duas morfologias que tinham um grupo espacial idêntico (P2i2|2,) e dimensões celulares por unidade centradas a a=90,2, b=l 10,2 e c=49,5, dependendo isso do facto de ter sido ou não implementada a inoculação (ver infra). Sem inoculação, os cristais de FEC-G-hu-r adquiriram uma superfície plana comprida e arestas arredondadas.
Quando se recorreu à inoculação foram obtidos cristais com faces bem pronunciadas e definidas na gota ao fim de 4 a 6 horas (0,05 mm x 0,05 mm x 0,05 mm). Em 24 horas os cristais tinham crescido para 0,7 mm x 0,7 mm x 0,7 mm e continuaram a aumentar para além de 2 mm, dependendo tal facto do número de cristais em formação na gota. d. Inoculação e determinação dos locais de início da nucleação O método agora proposto para inocular cristais define o número de unidades de início da nucleação em cada cavidade utilizada (aqui, depois de terem sido determinadas as condições óptimas para os cristais crescerem). O método aqui descrito é vantajoso na medida em que o número de “inóculos” afecta a qualidade dos cristais e isto por sua vez afecta o grau de resolução. O método de inoculação da presente invenção também tem vantagens pelo facto de a inoculação fazer com que os cristais de FEC-G cresçam num período de cerca de 3 dias, ao passo que sem inoculação 0 período de crescimento passa a ser aproximadamente de 3 semanas. ~7< 39 '
Numa experiência de produção de cristais (ver os métodos) foram produzidas grandes quantidades destes, de um dia para o outro (<0,01 mm x 0,01 mm x 0,01 mm). Foram praticadas as condições de cristalização anteriormente descritas, com a excepção de se ter reutilizado uma ponta de pipeta já anteriormente utilizada. Presumivelmente, o efeito de grande produção de cristais foi originado por pequenas unidades de nucleação que se tinham formado na ponta utilizada e que constituíram locais de nucleação para os cristais. A adição de uma pequena quantidade (0,5 pL) de gotas que continham as grandes quantidades de cristais a uma nova gota, em condições convencionais para a produção de cristais, teve como consequência uma grande produção de cristais, de um dia para o outro. Este método foi utilizado para a produção de vários tabuleiros de gotas contendo grandes quantidades de cristais a que se atribuiu a designação de “reserva de inoculo”. O número de unidades de início da nucleação (UIN) contidas nas gotas de “reserva de inoculo” foi avaliado com a finalidade de se melhorar a reprodutibilidade e a qualidade dos cristais de FEC-G-hu-r. Para se determinar o número de UIN na “reserva de inoculo” diluiu-se sequencialmente uma aliquota da gota ao longo de uma placa de microtitulação de 96 cavidades. Preparou-se a placa de microtitulação juntando 50 pL de uma solução que continha volumes iguais de solução de FEC-G-hu-r (33 mg/mL) e de solução de crescimento dos cristais (descrita supra) em cada cavidade. Transferiu-se uma aliquota de 3 pL de uma das gotas de “reserva de inoculo” para a primeira cavidade da placa de microtitulação. Misturou-se bem a solução contida na cavidade e depois transferiu-se 3 pL para a cavidade seguinte ao longo da fileira da placa de microtitulação. Preparou-se de forma idêntica cada fileira da placa de microtitulação e vedou-se correctamente o tabuleiro com uma fita de plástico. Formaram-se pequenos cristais, de um dia para o outro, no fundo das cavidades da 40 placa de microtitulação e estabeleceu-se uma correlação entre o número de cristais nas cavidades e a diluição da “reserva de inoculo” original. Para se produzir cristais individuais grandes, diluiu-se adequadamente a gota de “reserva de inoculo” em SCC recente e depois transferiu-se para uma gota uma aliquota desta solução que continha as UIN.
Uma vez optimizadas as condições de cristalização, deixou-se os cristais crescerem segundo um método de produção em que 3 mL de cada um dos produtos SCC e solução de FEC-G-hu-r (33 mg/mL) foi misturado para a preparação de 5 tabuleiros (possuindo cada um deles 24 cavidades). Este método incluiu a produção da solução de cristalização refinada em grandes quantidades, a mistura desta solução com a proteína e a colocação da solução de cristalização/proteína em tabuleiros de gotas suspensas ou em tabuleiros de gotas em repouso. Este processo permitiu obter de forma típica 100 a 300 cristais de qualidade (>0,5 mm) em cerca de 5 dias. e. Métodos Experimentais
Materiais
Obteve-se a informação cristalográfíca começando com FEC-G-met-hu-r (o mesmo que r-hu-met-G-CSF) com a sequência de aminoácidos indicada na figura 1 com uma actividade especifica de 1,0 ± 0,6 x 108 U/mg (conforme medido pelo ensaio de mitogenese celular em tampão de acetato 10 mM a pH 4,0 (em água para injecção)) e com uma concentração de cerca de 3 mg/mL. Concentrou-se a solução com o concentrador de modelo ‘Amicon’ a 75 psi, utilizando um filtro ΎΜ10’. De forma típica, concentrou-se a solução 10 vezes a 4°C e guardou-se durante vários meses.
Pesquisa Inicial
Os cristais adequados para análise por raios X foram obtidos por equilíbrio entre difusão - vapor, utilizando gotas suspensas. Para a pesquisa preliminar misturou-se 7 pL da solução de proteína na concentração de 33 mg/mL (tal como preparada anteriormente) com igual volume da solução da cavidade, colocou-se em placas de vidro tratadas com silicone e colocou-se em suspensão sobre a solução da cavidade, utilizando placas de cultura de tecidos de tipo ‘Linbro’ (Flow Laboratories, McLean, Va). A pipetagem foi sempre realizada com a pipetadora de modelo ‘Accuflex’, tendo no entanto os tabuleiros sido retirados da pipetadora automática depois de as soluções terem sido criadas nas cavidades e muito bem misturadas pelo menos durante 10 minutos com um mecanismo de agitação montado por cima da mesa. Depois recolocou-se os tabuleiros de tipo ‘Linbro’ na pipetadora que acrescentou as soluções das cavidades e de proteína às peças de cobertura tratadas com silicone. As peças de cobertura foram então invertidas e aplicadas estanquemente sobre 1 mL das soluções das cavidades, utilizando para tal massa lubrificante de silicone.
Os componentes do sistema automático de cristalização são os que a seguir se indica. Utilizou-se um computador individual de tipo ‘PC-DOS’ para se desenhar uma matriz de soluções de cristalização com base na concentração dos^seus componentes. As matrizes foram obtidas com qualquer ‘MRF’ da folha de cálculo Lotus (referida supra). O produto final deste programa é um ficheiro de dados. O ficheiro contém a informação necessária ao programa ‘SUX’ para pipetar o volume conveniente das soluções de reserva para se obter as concentrações descritas nas matrizes. Fez-se passar a informação do programa ‘SUX’ através de uma porta sequencial de tipo E/S (o mesmo que 1/0) e utilizou-se para indicar ao sistema de pipetagem ‘Accuflex’ a posição da válvula relativamente às soluções de reserva, a quantidade
/. 42 de solução a recuperar, as instruções para pipetar nas cavidades das placas de microtitulação e a posição X-Y de cada cavidade (a intersecção coluna/linha (ou fileira) de cada cavidade). Transmitiu-se informação complementar à pipetadora para lhe indicar a posição Z (altura) da seringa durante o enchimento e também a posição de um dreno onde o sistema pára momentaneamente para efectuar uma purga da seringa entre enchimentos de soluções diferentes. A placa de microtitulação de 24 cavidades (de tipo Linbro ou Cryschem) e o suporte das peças de cobertura foram colocados numa armadura que se movia no plano X-Y. O movimento da armadura da placa permitiu que a pipetadora colocasse a seringa de modo a pipetar para dentro das cavidades. Também colocou correctamente as peças de cobertura, os frascos e as soluções dos extractos destas fontes. Antes da pipetagem, as placas de microtitulação ‘Linbro’ tinham uma película delgada de massa consistente aplicada em tomo dos rebordos das cavidades. Depois de as soluções de cristalização terem sido preparadas nas cavidades, e antes de terem sido transferidas para as peças de cobertura, retirou-se a placa de microtitulação do sistema de pipetagem e aguardou-se que as soluções se misturassem por acção de uma misturadora montada por cima da mesa, a trabalhar durante 10 minutos. Depois de realizada a mistura, transferiu-se as soluções das cavidades para as peças de cobertura (no caso do protocolo das gotas suspensas) ou fez-se a sua transferência para o suporte intermédio na cavidade (no caso do protocolo das gotas em repouso). Extraiu-se a proteína de um frasco e juntou-se à gota da peça de cobertura que continha a solução da cavidade (ou ao suporte). Aplicou-se uma fita de plástico na parte de cima da placa de tipo ‘Ciyschem’ para fechar bem as cavidades. 43
Desenvolvimento da Produção
Uma vez estabilizadas as condições de cristalização, teve então lugar o crescimento dos cristais utilizando um método de “produção”. Preparou-se em quantidades de 1 litro a solução de cristalização contendo Mes 100 mM a pH 5,8, MgClj 380 mM, L1SO4 220 mM e 8% de PEG 8k. Utilizando uma pipetadora de seringa de Eppindorf pipetou-se aliquotas de 1 mL desta solução para cada uma das cavidades da placa ‘Linbro’. Misturou-se uma solução que continha 50% desta solução e 50% de solução de FEC-G (33 mg/mL) sobre as peças de cobertura tratadas com silicone. Os volumes típicos destas gotas estavam compreendidos entre 50 pL e 100 pL e devido às grandes dimensões de tais gotas foi necessário tomar precauções ao enchei as peças de cobertura e ao colocar as gotas em suspensão sobre as cavidades.
Recolha de Dados
Refinou-se a estrutura com ‘X-PLOR’ (Bruniger, versão 3.0 do X-PLOR, que é um sistema para cristalografia e RMN, Universidade de Yale, New Haven CT) em contraste com os dados a 2,2 Ã obtidos com um detector de imagens ‘R-AX1S’ de placas (Molecular Structure, Corp. Houston, TX). f. Observações
Produziu-se um FEC-G-hu-r terapêutico humano recombinante eficaz em grandes quantidades e foram facultados vários gramas para análise estrutural. Presume-se que os métodos de cristalização aqui descritos possam vir a ter outras aplicações a partir da altura em que estejam disponíveis outras proteínas relevantes. Este método pode ser aplicado a qualquer projecto cristalográfico em que estejam em jogo grandes quantidades de proteínas 44 (aproximadamente para valores acima de 200 mg). Conforme é evidente para o especialista na matéria, os materiais e os métodos da presente invenção podem ser modificados e podem ser facultados materiais e métodos equivalentes para a cristalização de outras proteínas.
B. Programa Informático Para Visualizar A Estrutura Tridimensional do FEC-G
Embora os diagramas, tais como os ilustrados nas figuras anexas, sejam úteis para visualizar a estrutura tridimensional do FEC-G, considera-se preferível um programa informático que permita a representação estereoscópica da molécula. Esta representação estereoscópica ou “realidade virtual”, conforme é dito por vezes na gíria da especialidade, permite visualizar a estrutura na sua forma tridimensional, segundo qualquer ângulo, com uma resolução bastante minuciosa, desde a estrutura molecular até ao nível atómico. Os programas informáticos aqui previstos também permitem modificar a perspectiva do ângulo de observação da molécula, por exemplo, fazendo rodar a molécula. Os programas aqui previstos também permitem introduzir modificações tais como, por exemplo, supressão, adição ou substituição de uma ou várias imagens de átomos, incluindo resíduos aminoácidos inteiros, ou permitem acrescentar radicais químicos aos grupos existentes ou substituídos e permitem ainda visualizar as modificações introduzidas na estrutura. É possível utilizar outros sistemas assentes em meios informáticos, os quais devem possuir como elementos constituintes: (a) um dispositivo para permitir a introdução de informação, por exemplo, coordenadas ortogonais ou outras coordenadas de tipo numérico correspondentes à estrutura tridimensional da FEC-G; (b) um dispositivo para exprimir tais coordenadas, por exemplo, um órgão de visualização que pennita observar a estrutura tridimensional e correlacionar tal estrutura tridimensional com a composição da molécula do 45 FEC-G, por exemplo, a composição de aminoácidos; (c) facultativamente um dispositivo para a introdução de informação que modifique a composição da molécula de FEC-G expressa, por forma a que a imagem de tal estrutura tridimensional revele a composição alterada.
As coordenadas para o programa informático preferido que se utiliza estão indicadas na figura 5. O programa informático preferido é a versão 4 de ‘Insight II’, fornecido por “Biosym” em San Diego, CA. No que diz respeito à estrutura cristalográfica bruta, as intensidades observadas respeitantes a dados de difracção (“F-obs”) e as coordenadas ortogonais também estão na base de dados sobre proteínas do Departamento de Química do Laboratório Nacional de Brookhaven, Upton, Nova Iorque 119723, EUA (Protein Data Bank, Chemistry Department, Brookhaven National Laboratory, Upton, New York 119723, USA), considerando--se tais dados aqui incorporados por referência.
Uma vez introduzidas as coordenadas no programa ‘Insight 1Γ, é então possível observar facilmente a representação tridimensional do FEC-G num ecrã de um computador. O sistema informático preferido para a visualização é o modelo ‘Silicon Graphics 320 BGX’ (San Diego, CA). Para uma obseivação estereoscópica é possível aplicar sobre os olhos um dispositivo óptico (Crystal Eyes, Silicon Graphics) que permite que qualquer pessoa visualize a molécula de FEC-G estereoscopicamente nas suas três dimensões, permitindo pois rodar a molécula e antever a arquitectura molecular.
Posto isto, a presente invenção proporciona um método para conceber e projectar ou para preparar um análogo de FEC-G com a ajuda de um computador, o qual compreende os passos seguintes: (a) dotar o referido computador de um dispositivo que permita obter uma imagem da estrutura tridimensional de uma molécula de FEC-G, incluindo a imagem da composição dos radicais da referida molécula de FEC-G, e que permita, de preferência, obter a imagem da localização tridimensional de cada aminoácido e mais preferencialmente permita obter a imagem da localização tridimensional de cada átomo de uma molécula de FEC-G; (b) observar a referida imagem; (c) seleccionar um local na referida imagem para alterar a composição da referida molécula ou a localização de um radical; e (d) preparar um análogo de FEC-G com tal alteração. A alteração pode ser escolhida com base nas características estruturais desejadas do produto final constituído pelo análogo de FEC-G, descrevendo-se adiante mais minuciosamente as particularidades para tal arquitectura. Tais particularidades compreendem: a localização e as composições de resíduos aminoácidos hidrofóbicos, em particular resíduos internos das estruturas helicoidais de uma molécula de FEC-G, alterando esses resíduos, quando modificados, a estrutura global do núcleo interno da molécula e podendo impedir a ligação ao receptor; a localização e as composições de estruturas espirais externas cuja alteração possa não afectar a estrutura global da molécula de FEC-G.
As figuras 2 a 4 ilustram a conformação tridimensional geral por vias diferentes. Temos pois o diagrama topológico, o diagrama de serpentina e o diagrama de cilindros, ilustrando todos eles aspectos da conformação do FEC-G. A figura 2 ilustra uma comparação entre a molécula de FEC-G e outras moléculas. Há uma determinada semelhança de arquitectura, emboras estes factores de crescimento sejam diferentes no que diz respeito às conformações locais das suas espiras e da geometria dos feixes. No entanto, é conservada em todas estas seis moléculas comparadas a topologia ascendente - ascendente - descendente - descendente com duas ligações intermédias compridas, apesar da dissemelhança existente na sequência de aminoácidos. -7<" & - - A figura 3 ilustra mais minuciosamente a estrutura secundária da molécula de FEC-G humana recombinante. Este diagrama de serpentina ilustra o sentido de enrolamento das hélices e das suas posições relativas entre si. A figura 4 ilustra, de forma diferente, a conformação da molécula de FEC-G humana recombinante. Este diagrama de “cilindros” ilustra a arquitectura geral da molécula de FEC-G humana recombinante. C. Preparação de Análogos Utilizando a Mutauenese do Μ13
Este exemplo descreve a preparação de análogos de FEC-G utilizando técnicas de mutagenese dirigida ao local, envolvendo o bacteriófago M13 de cadeia única, em conformidade com os métodos publicados no pedido de patente de invenção PCT com o número WO 85/00817 (Souza eí ai, publicado em 28 de Fevereiro de 1985, aqui incorporado por referência).
Este método implica essencialmente a utilização de uma matriz de ácido nucleico de cadeia única da sequência não mutagenizada e a ligação que se lhe faz de um oligonucleótido mais pequeno que contém a desejada modificação na sequência. As condições de hibridação permitem que tenha lugar a hibridação de sequências não idênticas e a sequência restante é preenchida de modo a ficar idêntica à matriz original. Daqui resulta uma molécula de cadeia dupla em que uma das duas cadeias possui a modificação desejada. Esta cadeia única mutagenizada é separada e por sua vez utilizada como matriz para a sua cadeia complementar.
Isto vai criar uma molécula de cadeia dupla com a modificação desejada. A sequência utilizada de ácido nucleico do FEC-G original está apresentada na figura 1 e os oligonucleótidos que contêm os ácidos nucleicos mutagenizados estão apresentados no quadro 2. As abreviaturas aqui utilizadas para os resíduos aminoácidos e para os nucleótidos 48 / são as convencionais (ver Stryer, ‘Biochemistry’, 3a ed., W.H Freeinan e Company, N.Y., N. Y. 1988, no verso da contracapa). A sequência do ácido nucleico do FEC-G original foi colocada em primeiro lugar dentro do vector M13mp21. Depois isolou-se e colocou-se novamente em suspensão em água o ADN do fago M13mp2l de cadeia singular que continha a sequência do FEC-G original. Para cada reacção misturou-se 200 ng deste ADN com 1,5 pmol de oligonucleótido fosforilado (quadro 2) e colocou-se em suspensão em meio constituído por Tris 0,1 M, MgCl2 O, 01 M, DTT 0,005 M e ATP 0,1 mM a pH 8,0. A recombinação dos ADN teve lugar mediante aquecimento a 65°C e arrefecimento lento até à temperatura ambiente.
Depois de os ADN terem arrefecido acrescentou-se 0,5 mM de cada uma das substâncias ATP, dATP, dCTP, dGTP e TTP, 1 unidade de ligase do ADN das T4 e 1 unidade do fragmento de Klenow de poliinerase 1 de E. co/i a 1 unidade de ADN recombinado em meio constituído por Tris 0,1 M, NaCl 0,025 M, MgCl2 0,01 M e DTT 0,01 M a pH 7,5. O ADN circular fechado, agora de cadeia dupla, foi utilizado sem mais nenhuma purificação para transfectar E coli. Efectuou-se uma pesquisa das placas efectuando a colheita com filtros de nitrocelulose e hibridando depois os filtros com ADN de cadeia única marcado na extremidade com 32P, durante 1 hora a 55-60°C. Depois a hibridação efectuou-se a lavagem dos filtros a uma temperatura de 0-3°C abaixo da temperatura de fusão do oligonucleótido (2°C para o A-T e 4°C para o G-C) que emitiu selectivamente sinais autonadiográficos correspondentes às placas com o fago que continha a sequência mutacionada. Os clones positivos foram confirmados por sequenciação.
Seguidamente estão indicados os oligonucleótidos utilizados para cada análogo de FEC-G preparado pelo método e mutagenese do M13. A nomenclatura indica o resíduo e a i ,··' f' 49 - posição do aminoácido original (v.g, o resíduo lisina na posição 17) e o resíduo e a posição do aminoácido substituído (v.g., o resíduo arginina na posição 17). Uma substituição envolvendo mais do que um resíduo é indicada pelo mutação com sobrescrito, com vírgulas entre as posições assinaladas ou com um ponto e vírgula a indicar resíduos diferentes. As supressões sem nenhumas substituições não estão assinaladas.
Indica-se a seguir as sequências oligonucleotídicas para a mutagenese efectuada com base no Ml3; estes oligonucleótidos foram produzidos por via sintética, embora o método de preparação não seja crítico, podendo ser utilizado qualquer método e/ou equipamento de síntese de ácidos nucleicos. Também está indicado o comprimento do oligonucleótido. Conforme se disse antes, permitiu-se que estes oligonucleótidos contactassem com o vector bacteriófago de cadeia singular e depois foram acrescentados nucleótidos simples para completar a sequência de ácidos nucleicos do análogo de FEC-G.
t/
Quadro 2 ANALOGOS DE FEC-G SEOUÊNCIAS í5’->3’) CaTOrirnento Sea ID (hiicleóddo) Lisl7->Arg17 CTT TCT GCT GCG TTG TCT GGA ACA 24 3 Lis^Arg24 ACA GGT TCG TCG TAT CCA GGG TG 23 4 Lisi3->Arg35 CAC TGC AAG AAC GTC TCT GCG CT 23 5 Lis4l->Arg41 CGC TAC TTA CCG TCT GTC CCA TC 23 6 L.s,m3í->Arg17^ CTT TCT GCT GCG TTG TCT GGA ACA 24 7 ACA GGT TCG TCG TAT CCA GGG TC 23 8 CAC TGC AAG AAC GTC TCT GCG CT 23 9 Lis17iW,-> Arg17'24'41 CTT TCT GCT GCG TTG TCT GGA ACA 24 10 ACA GGT TCG TCG TAT CCA GGG TC 23 11 CGC TAC TTA CCG TCT GTC CCA TC 23 12 Lisl7J5'4'->Arg'735’·" CTT TCT GCT GCG TTG TCT GGA ACA 24 13 CAC TGC AAG AAC GTC TCT GCG CT 23 14 CGC TAC TTA CCG TCT GTC CCA TC 23 15 Lislu'41->Arg1J'5'41 ACA GGT TCG TCG TAT CCA GGG TG 23 16 CAC TGC AAG AAC GTC TCT GCG CT 23 17 CGC TAC TTA CCG TCT GTC CCA TC 23 18 Ljs.7.2-».3.Vn_>Argl7,24.35.41 CTT TCT GCT GCG TTG TCT GGA ACA 24 19 ACA GGT TCG TCG TAT CCA GGG TG 23 20 CAC TGC AAG AAC GTC TCT GCG CT 23 21 CGC TAC TTA CCG TCT GTC CCA TC 23 22 Cis1!i->Ala,!i TCT GCT GAA AGC TCT GGA ACA GG 23 23 Gln"*^>Glu“ CTT GTC CAT CTC AAG CTC TTC AG 23 24 Cis37’4:,->Ser37’43 GAA AAA CTC TCC GCT ACT TAC AAA 37 25 CTC TCC CAT CCG G Gln2ft->Ala2,i TTC GTA AAA TCG CGG GTC ACG G 22 26 Glnl74->Alam TCA TCT GGC TCC GCC GTA ATA G 22 26 Arg,7U->Alal7° ' CCG TCT TCT GGC TCA TCT GGC T 22 28 Argl<i7->Alal<i7 GAA GTA TCT TAC GCT GTT CTC CGT 24 29 Supressão 167 GAA GTA TCT TAC TAA GTT CTC CGT C 25 30 Lis41->Ala41 CGC TAC TTA CGC ACT GTC CCA T 22 31 His^Lis44 CAA ACT GTC CAA GCC GGA AGA G 22 32
Quadro 2 (continuação) ANÁLOGOS DE FEC-G SEOUÊNCIAS í5’->3’) Corrcrimento ínucfccddo) Sea. 1D Glu47->Ala47 CAT CCG GAA GCA CFG GTA CFG C 22 33 Arg2J->Ala2·’ GGA ACA GGT TGC TAA AAT CCA GG 23 34 Lis24->Ala24 . GAA CAG GTT CGT GCG ATC CAG GGT G 25 35 Glu20->Ala2U GAA ATG TCT GGC ACA GGT TCG T 22 . 36 Asp2*->Ala2l! TCC AGG GTG CCG GTG CTG C 19 37 Met[27->Glu127 AAG AGC TCG GTG AGG CAC CAG CT 23 38 Metl,s->GluUil CTC AAG GTG CTG AGC CGG CAT TC 23 39 Met,27->Leu127 GAG CTC GGT CTG GCA CCA GC 20 40 Met,M->Leul3‘ TCA AGG TGC TCT GCC GGC ATT 21 41 Seru->Ala15 TCT GCC GCA AGC CTT TCT GCT GA 23 42 Lis17->Ala17 CTT TCT GCT GGC ATG TCT GGA ACA 24 43 Gln'2,->Ala12' CTA TTT GGC AAG CGA TGG AAG AGC 24 44 Gkil24->Ala124 CAG ATG GAA GCG CTC GGT ATG 21 45 Meti27' l,8->Leu127’118 GAG CTC GGT CTG GCA CCA GC 20 46 TCA AGG TGC TCT GCC GGC ATT 21 47 **Glu20->Ala20; GAA ATG TCT GGC ACA GGT TCG T 22 48
Serl3->Gli13 ** Este análogo apareceu durante a preparação do análogo Glu2"—>AIa20 do FEC-G. Tendo sido sequenciados diversos clones para se identificar o análogo Glu20—>Ala20, identificou-se o análogo Glu2l’->Ala211; Ser13—>Gli13. Este mutante duplo resultou de um erro de reacção de Klenow in viiro com a polimerase de ADN. D. Preparação de Análogos de FEC-G Recorrendo à Amplificação do ADN Este exemplo descreve métodos para a produção de análogos de FEC-G utilizando a técnica de amplificação do ADN. Dito de forma prática, amplificou-se o ADN que codifica cada análogo em duas partes separadas, depois combinou-se e a seguir amplificou-se a própria sequência total. Dependendo da modificação desejada que se pretendia realizar no ADN do FEC-G original, assim foram utilizados iniciadores internos para incorporar a 52 modificação e para gerar as duas partes amplificadas e separadas. Por exemplo, para a amplificação da extremidade 5’ do ADN do análogo desejado, utilizou-se um iniciador de flanqueamento em 5’ (complementar de uma sequência do plasmídeo a montante do ADN original do FEC-G) numa extremidade da região que se pretendia amplificar e utilizou-se um iniciador interno, capaz de hibridar com o ADN original, mas que incorporava a mudança desejada, para excitar a outra extremidade. A região amplificada resultante alongou-se desde o iniciador de flanqueamento em 5’, através do iniciador interno. Executou-se procedimento idêntico para o terminal 3’, utilizando um iniciador de flanqueamento em 3’ (complementar de uma sequência do plasmídeo a jusante do ADN original do FEC-G) e um iniciador interno complementar da região da mutação pretendida. A partir do momento em que as duas “metades” (que podem ter ou não um comprimento igual, dependendo isso da localização do iniciador interno) foram amplificadas, permitiu-se que essas “metades” se unissem entre si. Uma vez unidas, o iniciador de flanqueamento em 5’ e o iniciador de flanqueamento em 3’ foram utilizados para amplificar a sequência completa que continha a modificação pretendida.
No caso de se pretender realizar mais do que uma modificação, é possível alterar o processo descrito antes, de modo a incoiporar a modificação no iniciador interno, ou então é possível repetir o processo utilizando um iniciador interno diferente. Em alternativa, é possível utilizar o processo de amplificação génica com outros métodos para produzir modificações na sequência do ácido nucleico, por exemplo, a técnica de mutagenese com base nos fagos, conforme descrito supra. Seguidamente efectua-se a descrição de exemplos do processo para a preparação de análogos com mais de uma modificação.
Para a criação dos análogos de FEC-G descritos adiante, o ADN matricial utilizado foi a sequência ilustrada na figura 1 mais determinadas regiões de flanqueamento (de um plasmídeo que continha a região de codificação do FEC-G). Estas regiões de flanqueamento foram utilizadas como iniciadores de flanqueamento em 5’ e 3’ e estão definidas adiante. As reacções de amplificação foram realizadas em volumes de 40 pL contendo Tris-HCl 10 mM, MgC^ 1,5 mM, KC1 50 mM, gelatina na concentração de 1,0 mg/mL a pH 8,3 e a 20°C. Os volumes de reacção de 40 pL também continham 0,1 mM de cada um dos dNTP, 10 pmoles de cada iniciador e 1 ng de ADN matricial. Repetiu-se cada amplificação durante 15 ciclos. Cada ciclo consistiu em trabalhar 0,5 minutos a 94°C, 0,5 minutos a 50°C e 0,75 minutos a 72°C. Os iniciadores de flanqueamento tinham um comprimento de 20 nucleótidos e os iniciadores internos tinham um comprimento entre 20 e 25 nucleótidos. Isto deu origem a cópias múltiplas do ADN de cadeia dupla codificando quer a parte anterior quer a parte posterior do análogo desejado de FEC-G.
Para efectuar a combinação das duas “metades”, combinou-se a quadragésima parte de cada uma das duas misturas de reacção com um terço da mistura de reacção de amplificação do ADN. Aguardou-se que tivesse lugar a recombinação das duas partes no local do iniciador interno, uma vez que as suas extremidades portadoras da mutação eram complementares, e a seguir a um ciclo de polimerização obteve-se uma sequência de ADN de comprimento completo. Uma vez assim recombinado, amplificou-se o análogo inteiro, utilizando os iniciadores de flanqueamento em 5’ e 3’. Repetiu-se este processo de amplificação durante 15 ciclos, conforme descrito antes. A sequência completa do ADN do análogo amplificado foi clivada com as endonucleases de restrição Xbal e Xhol para proporcionar extremidades coesivas para inserção num vector. Colocou-se o ADN clivado dentro de um vector plasmídico e utilizou-se esse vector para transformar K coli. Os transformantes foram estimulados com canamicina na concentração de 50 pg/mL e subsequentemente incubados a 30°C. A produção da proteína análoga de FEC-G foi confirmada por electroforese em gel de poliacrilamida realizada com um lisado celular integral. A presença da mutação desejada foi confirmada pela análise da sequência de ADN do plasmídeo purificado a partir do isolado produzido. Depois deixou-se as culturas crescerem e efectuou-se uma colheita de células, tendo os análogos de FEC-G sido purificados conforme adiante se explica.
No quadro 3 subsequente estão indicados os iniciadores específicos utilizados para cada análogo feito coin recurso à amplificação génica. Quadro 3 Análogo Iniciador Interno (5’->3’) Sequência ID His^Ala44 iniciador em 5' TTCCGGAGCGCACAGTTTG 49 iniciador em 3’ CAAACTGTGGGCTCCGGAAGAGC 50 Thrn7-> Ala"7 iniciador em 5’ ATGCCAAATTGCAGTAGC AAAG 51 iniciador em 3’ CTTTGCTACTGCAATTTGGCAACA 52 Asp"l>-> Ala11" iniciador em 5’ AT C AGCT ACTGCT AGCT GC AG A 53 iniciador em 3’ TCT GC AGCT AGC AGT AGCTG ACT 54 Gln2l-> Ala21 iniciador em 5’ TTACGAACCGCTTCCAGACATT 55 iniciador em 3’ AATGTCTGGAAGCGGTTCGTAAAAT 56 Asp"3-> Ala"3 iniciador em 5’ GT AGC AAATGC AGCT AC ATCT A 57 iniciador em 3’ T AGATGT AGCTGCATTTGCT ACT AC 58 His53-> Ala53 iniciador em 5’ CCAAGAGAAGCACCCAGCAG 59 iniciador em 3’ CTGCTGGGTGCTTCTCTTGGGA 60 Para cada análogo utilizou-se o seguinte iniciador de flaiiqueamento em 5’: 5 ’-C ACTGGCGGTG ATAATGAGC Para cada análogo utilizou-se o seguinte iniciador de flanqueamento em 3’: 61 3 ’-GGTC ATT ACGG ACCGGATC 62 "70 55 I. Construção da Mutação Dupla
Para se obter o análogo Gln12,2l-> Glu1221 de FEC-G foiçam realizadas diias amplificações separadas de ADN para se criar as duas mutações de ADN. O ADN matricial utilizado tinha a sequência indicada na figura 1 mais determinadas regiões de flanqueamento (de um plasmídeo que continha a região de codificação do FEC-G). As sequências exactas estão indicadas adiante. Cada uma das duas reacções de amplificação do ADN foi realizada utilizando um aparelho ‘Perlcin Elmer/Cetus DNA Thermal Cycler’. O volume de 40 pL da reacção era uma mistura constituída por tampão de RCP IX (Cetus), 0,2 mmol de cada um dos quartos dXTP (Cetus), 50 pmol de cada um dos oligonucleótidos iniciadores, 2 ng do ADN matricial de FEC-G (num vector plasmídico) e uma unidade de polimerase de Taq (Cetus). O processo de amplificação decorreu durante 30 ciclos. Cada ciclo consistiu em trabalhar durante 1 minuto a 94°C, 2 minutos a 50°C e 3 minutos a 72°C.
Na amplificação “A” do ADN foram utilizados os oligonucleótidos: 5’ CCACTGGCGGTGATACTGAGC 3’ (Seq 1D 63) e 5’ AGCAGAAAGCTTTCCGGCAGAGAAGAAGCAGGA 3’ (Seq ID 64)
Na amplificação “B” do ADN foram utilizados os oligonucleótidos: 5’ GCCGCAAAGCTTTCTGCTGAAATGTCTGGAAGAGGTTCGTAAAATCCAGGGTG A 3 ’ (Seq ID 65) e 5’ CrGGAArGCAGAAGCAAATGCCGGCAlAGCACCTICAGTCGGITGCAGAGCTGGTGCCA 3’ (SeqlD66). A partir do produto de ADN de cadeia dupla de 109 pares de bases, obtido a seguir à amplificação “A” do ADN, cortou-se e isolou-se um fragmento de ADN de 64 pares de bases de Xbal para Hindlll, o qual continha a mutação Glnl2->Glu12 do ADN. A partir do produto de ADN de cadeia dupla de 509 pares de bases, obtido a seguir à amplificação “B” do ADN,
cortou-se e isolou-se um fragmento de ADN de 197 pares de bases de Hinlll para Bsml, o qual continha a mutação Gln2l->Glu21 do ADN.
Os fragmentos “A” e “B” foram ligados conjuntamente com um segmento de Xbal de 4,8 mil pares de bases para o fragmento do vector plasmídico do ADN de Bsml. A mistura de ligação era constituída por fragmentos de restrição de ADN equimolares, tampão de ligação Tris-HCl 25 mM a pH 7,8, MgCl2 10 mM, DTT 2 mM, ATPr 0,5 mM, ASB na concentração de 100 pg/mL) e ligase do ADN das T4, tendo a incubação decorrido de um dia para o outro a 14°C. O ADN ligado foi então transformado dentro de células FM5 de E. co/i por electro-poração, utilizando para tal um aparelho de modelo ‘Bio Rad Gene Pulsar’ (BioRad, Richmond, GA). Isolou-se um clone e comprovou-se por sequenciação do ADN que o arquétipo plasmídico continha as duas mutações. Neste vector ‘intermediário’ também havia uma supressão de um segmento de 193 pares de bases de de Bsml para o fragmento de ADN do Bsml. Construiu-se um vector plasmídico final por ligação e transformação (conforme descrito supra) dos fragmentos de ADN obtidos por corte e isolamento de um segmento de Sstl de 2 mil pares de bases para o fragmento de ADN do BainHI proveniente do vector intermediário, um segmento de Sstl de 2,8 kpb para o fragmento de ADN de EcoRI proveniente do vector plasmídico e um segmento de BainHI de 360 pb para o fragmento de ADN de EcoRI proveniente do vector plasmídico. Verificou-se o arquétipo final por sequenciação do ADN do gene do FEC-G. Depois de as culturas se terem desenvolvido, efectuou-se a colheita das células e realizou-se a purificação dos análogos de FEC-G como a seguir se descreve.
Confoime indicado antes, é possível utilizar qualquer combinação de técnicas de mutagenese para se gerar um ácido nucleico análogo de FEC-G (e o produto de expressão) em que haja uma ou mais dò que uma alteração. Os dois exemplos anteriores, utilizando a mutagenese à base de Ml3 e a mutagenese à base da amplificação génica, são ilustrativos.
E. Expressão de ADN de Análogos de FEC-G Introduziu-se seguidamente os ADN de análogos de FEC-G num vector plasmídico que foi utilizado para transformar a estirpe FM5 de E. coli (ATCC#53911). Estes ADN dos análogos de FEC-G, contidos nos plasmídeos e nas células hospedeiras bacterianas, podem ser obtidos na Colecção Americana de Culturas Tipo (American Type Culture Collection, Rockville, MD) cujos números de acesso são indicados a seguir.
Foram produzidas culturas de 1 L num caldo que continha 10 g de triptona, 5 g de extracto de levedura e 5 g de NaCI, à temperatura de 30°C, até se atingir uma densidade de 0,5 a Aw>0, tendo então as culturas nessa altura sido aquecidas rapidamente para 42°C. A agitação dos balões prosseguiu durante 3 horas.
Também é possível utilizar outras células hospedeiras procarióticas ou eucarióticas, por exemplo, outras células, estirpes ou espécies bacterianas, células em cultura retiradas de mamíferos (COS, OCC (o mesmo que CHO) ou de outro tipo), células de insectos ou órgãos ou organismos multicelulares correspondentes, ou células de plantas ou órgãos ou organismos multicelulares correspondentes, sabendo os especialistas na matéria como identificar o hospedeiro conveniente. Os presentes análogos de FEC-G e as composições congéneres também podem ser preparados por via sintética, por exemplo, pelos métodos de síntese de péptidos em fase sólida, ou então por meio de outras técnicas de produção por via química. Há outros sistemas de clonagem e de expressão que são evidentes para os especialistas na matéria.
F. Purificação de Proteínas de Análogos de FEC-G Efectuou-se uma colheita de células por centrifugação (10 000 x g, 20 minutos, 4°C). Colocou-se a massa obtida (nonnahnente 5 g) novamente em suspensão em 30 inL de DTT
IrnM e fez-se passar três vezes por uma prensa continental à pressão de 10 000 psi. Esta suspensão de células desmembradas foi centrifugada a 10 000 x g durante 30 minutos, depois removeu-se o sobrenadante e com a massa obtida preparou-se nova suspensão em 30 - 40 inL de água. Centrifugou-se esta suspensão a 10 000 x g durante 30 minutos e a massa obtida foi depois dissolvida em 25 mL de ‘SarkosyF a 2% e Tris 50 mM a pH 8. Juntou-se sulfato de cobre até uma concentração de 40 μΜ e deixou-se a mistura sob agitação pelo menos durante 15 horas a 15-25°C. A seguir centrifugou-se a mistura a 20 000 x g durante 30 minutos. Diluiu-se a mistura proteica solubilizada resultante quatro vezes com Tris 13,3 mM a pH 7,7, removeu-se a substância ‘SarkosyF e depois aplicou-se o sobrenadante a uma coluna de DEAE--celulose (Whatman DE-52) equilibrada com Tris 20 mM a pH 7,7. Depois de se ter carregado e lavado a coluna com o mesmo tampão, efectuou-sé a eluição dos análogos com Tris 10 mM/ /NaCl (entre 35 mM e 100 mM, dependendo isso do análogo, conforme indicado adiante) a pH 7,7. Para a maioria dos análogos ajustou-se para 5,4 o valor do pH do eluente proveniente da coluna de DEAE, utilizando para tal ácido acético a 50%, diluído conforme necessário (para se obter uma condutividade conecta) com acetato de sódio 5 mM a pH 5,4. Depois introduziu-se a solução numa coluna de ‘CM-Sepharose’ equilibrada com acetato de sódio 20 mM a pH 5,4. A seguir lavou-se a coluna com NaAc 20 mM a pH 5,4, até a absorvência a 280 nm ser aproximadamente zero. Realizou-se depois a eluição do análogo de FEC-G com acetato de sódio/NaCl em concentrações indicadas no quadro 4 subsequente. Os eluentes da coluna de DEAE para esses análogos não aplicados à coluna de ‘CM-Sepharose’ foram dialisados directamente num tampão de NaAc 10 mM a pH 4,0. Os análogos de FEC-G purificados foram então isolados convenientemente para análise in vitro. As concentrações salinas praticadas 59 para a eluição dos análogos variaram, conforme se disse antes. Seguidamente estão indicadas as concentrações para a coluna de DEAE-celulose e para a coluna de ‘CM-Sepharose’.
Quadro 4
Concentrações salinas
Análouo DEAE-celulose CM-Senharose Lis,7->Arg17 35mM 37,5mM Lis24->Arg24 35mM 37,5mM Lis35->Arg33 35mM 37,5mM Lis4,->Arg4' 35mM 37,5mM Lis17'24 35->Arg'7'24,35 35mM 37,5mM Lis'7,35,4,->Arg17,35,41 35mM 37,5mM Lis24,35,4'->Arg24,35,41 35mM 37,5mM Lis'7JllM^Aig,7X’M' 35mM 37,5mm Li s17:24,41 -> Arg17,24,41 35mM 37,5mM Gln6i!->Glu68 60mM 37,5mm - Cis37,43->Ser37,43 40mM 37,5mM Gln26->Ala26 40mM 40mM Gln174->Ala174 40mM 40mM Arg'70->Ala,7° 40mM 40mM Aig^Aia*7 40mM 40mM Supressão 167* N/A N/A Lis41->Ala41 160mM 40mm His44->Lis44 40mM 60mM Glu47->Ala47 40inM 40mM Arg23->Ala23 40mM 40mM Lis24->Ala24 l20mM 40mM Glu20->Ala20 40mM 60mM Asp28->Ala28 40mM 80mM
Quadro 4 (continuação) Análogo DEAE-celulose CM-Senharose Metl27->Glu127 80inM 40mM Met,38->Glu138 80mM 40mM MetI27->Leu127 40mM 40mM Met138->Leu138 40mM 40mM Cisl8->AIa18 40mM 37,5mM Glnl2,2l->Glu1221 60mM 37,5mM Gln,2-2,’fl8->Glu,2’2l6H 60mM 37,5mM Glu2l,->Ala20; Ser,3->Gli13 40mM 80mM Met,27J38->Leu127·138 40mM 40mM Ser,3->Ala13 40mM 40mM Lisl7->Ala17 80mM 40mM Gin121-> Ala121 40mM 60mM Gln2l->Ala21 50mM Gradiente 0-150 mM His44->Ala44** 40mM N/A His53->Ala53** 50mM N/A Aspll0->Ala110*** 40mM N/A Asp,l3->Ala113*** 40mM N/A Thr,l7->Ala117** 50mM N/A Asp28->Ala28; 50mM N/A Asp110 Ala110** Glu124->Ala124** 40mM 40mM * Para a supressão167 não há dados disponíveis. ** Para estes análogos fez-se a purificação utilizando apenas a coluna de DEAE-celulose 61
Os métodos de purificação referidos antes são ilustrativos e qualquer especialista na matéria sabe identificar outros meios para a obtenção dos análogos de FEC-G da presente invenção. G, Ensaios Biológicos lndependentemente dos métodos utilizados para a criação dos análogos de FEC-G da presente invenção, tais análogos foram sujeitos a ensaios de pesquisa da actividade biológica. Foram realizadas experiências com timidina tritiada para se avaliar o grau de divisão celular. No entanto, é possível realizar outro tipo de ensaios biológicos para se determinar a actividade desejada. Os ensaios biológicos, tais como os que são efectuados para determinação da capacidade de indução da diferenciação terminal na linhagem de células leucémicas WEH1-3B (D+) do murganho, também proporcionam uma indicação sobre a actividade dos FEC-G. Ver Nicola, et ai, ‘Blood’ 54: 614-27 (1979). É possível recorrer a outros ensaios in vitro para avaliar a actividade biológica. Ver Nicola, Annu. Rev. Biochem. 58: 45-77 (1989). De um modo geral, os testes de pesquisa da actividade biológica devem compreender a análise dos resultados desejados, por exemplo, aumento ou diminuição de actividade biológica (comparativamente com os FEC-G não modificados), actividade biológica diferente (comparativamente com os FEC-G não modificados), análises de afinidade com o receptor ou análises de período de semi-vida no soro. Esta enumeração é incompleta, sabendo os especialistas na matéria como identificar outros ensaios úteis para testar o resultado final desejado.
Realizou-se o ensaio com ^H-timidina utilizando métodos convencionais. A medula óssea foi retirada de fêmeas de murganho da estirpe Balb C, depois de sacrificadas. As células da medula óssea foram rapidamente colocadas em suspensão, centrifúgadas e novamente 62 colocadas em suspensão num meio de crescimento. Em cada cavidade de uma placa de microtitulação de 96 cavidades introduziu-se uma aliquota de 160 pL que continha aproxi-madamente 10 000 células. Juntou-se a cada cavidade as amostras do análogo do FEC-G purificado (preparado conforme se disse antes) e manteve-se a incubar durante 68 horas. Juntou--se timidina tritiada a cada uma das cavidades e deixou-se incubar durante mais 5 horas. Decorrido o período de incubação de 5 horas efectuou-se a colheita das células, filtrou-se e enxaguou-se muito bem. Os filtros foram então colocados num frasco que continha fluido de cintilação. Efectuou-se a contagem da emissão β (contador de cintilação de modelo LKB Betaplate). Foram analisados em triplicado padrões e análogos e as amostras que ficaram bastante acima ou bastante abaixo da curva padrão foram novamente analisadas, utilizando a diluição adequada. Os resultados aqui indicados são a média dos dados em triplicado obtidos com os análogos, comparativamente com os resultados normais obtidos com o FEC-G humano recombinante inalterado.
H, Análise por CLER
As amostras de análogos purificados foram estudadas por cromatografia em líquido de elevada resolução. Embora a posição dos picos numa coluna de CLER de fase inversa não seja um indicador definitivo da semelhança estrutural entre duas proteínas, os análogos que têm tempos de retenção semelhantes podem ter com a coluna de CLER o mesmo de tipo de interacções hidrofóbicas da molécula inalterada. Isto é um indicador da existência de uma estrutura global semelhante.
Efectuou-se a análise de amostras do análogo e do FEC-G humano recombinante inalterado numa coluna de fase inversa de modelo lVydac 2I4TP54’ (0,46 cm x 25 cm) 63 (Separations Group, Inc. Hesperia, CA). As amostras purificadas do análogo de FEC-G foram preparadas em acetato 20 mM e em solução de NaCl 40 mM tamponada a pH 5,2 até uma concentração final entre 0,1 mg/mL e 5 mg/mL, dependendo isso do comportamento do análogo na coluna. Carregou-se na coluna de CLER quantidades variáveis (dependendo da concentração), a qual havia sido equilibrada com uma solução aquosa que continha 1% de isopropanol, 52,8% de acetonitrilo e 0,38% de trifluoroacetato (TFA). Submeteu-se as amostras a um gradiente de acetonitrilo à razão de 0,86%/minuto e TFA a 0,002%. 1. Resultados
Seguidamente são apresentados os resultados dos ensaios biológicos anteriores e das análises por CLER. A actividade biológica é a média dé dados em triplicado e está indicada como percentagem relativamente ao padrão de contraprova (FEC-G inalterado). A posição relativa do pico na CLER é a posição do análogo de FEC-G relativamente ao pico do padrão de contraprova (FEC-G inalterado). Os símbolos “+” ou indicam se o pico do análogo na CLER estava avançado ou atrasado em relação ao pico do padião de contraprova (em minutos). Nem todas as variantes haviam sido analisadas para pesquisa do pico relativo na CLER, apenas estando indicadas a seguir as que foram analisadas. Também estão indicadas as designações das células hospedeiras de li coli existentes na Colecção Americana de Culturas Tipo (o mesmo que ATCC) que contêm os ácidos nucleícos que codificam os análogos da presente invenção, preparados conforme se disse antes. 64
Quadro 5
Seq.Id Variante Análogo Pico relativo na CLER ATCC N° Actividade do FEC-G (noirnal (%) 67 1 Lis17->Arg17 N/A 69184 N/A 68 2 Lis^+Arg24 N/A 69185 N/A 69 3 Lis35->Arg35 N/A 69186 N/A 70 4 Lis4l->Arg41 N/A 69187 N/A 71 5 Lis‘W5->Arg17’2435 N/A 69189 N/A 72 6 Lis,7354,->Arg'7-35’41 N/A 69192 N/A 73 7 Lis24’35’4,->Arg2435’41 N/A 69191 N/A 74 8 Lis17’24’?5'41->Arg17'24’35'4' N/A 69193 N/A 75 9 Lis1724,4l->Arg17'24’41 N/A 69190 N/A 76 10 Gln68->Glu08 N/A 69196 N/A 77 11 Cis37,43->Ser37,43 N/A 69197 N/A 78 12 G1 n2ú->Ala2í> +0,96 69201 51% 79 13 Glnl74->Ala174 +0,14 69202 100% 80 14 Arg17,,->Ala170 +0,78 69203 100% 81 15 Arg167->Alal<i7 +0,54 69204 110% 82 16 Supressão167 -0,99 69207 N/A 83 17 Lis4l->Ala41 +0,25 69208 81% 84 18 His44->Lis44 -1,53 69212 70% 85 19 Glu47->Ala47 +0,14 69205 0% 86 20 Arg^Ala23 -0,03 69206 31% 87 21 Lis^Ala24 +1,95 69213 0% 88 22 Glu^Ala20 -0,07 69211 0% 89 23 Asp^Ala28 -0,30 69210 147% 90 24 Metl27->Glu127 N/A 69223 N/A 91 25 Metr,8->G1 u138 N/A 69222 N/A 92 26 Met127->Leu127 N/A 69198 N/A 93 27 Met138->Leu13íi N/A 69199 N/A 94 28 Cisl8->Ala'8 N/A 69188 N/A 95 29 Gln12,2,->Glulz21 N/A- 69194 N/A 65 Ζ\;.
Quadro 5 (continuação)
Seq.ld Variante Análogo Pico relativo na CLER ATCC Nc ’ Actividade do FEC-G (normal (%) 96 30 G\n'vm->G\u'^M N/A 69195 N/A. 97 ‘31 Glu^Ala20; Ser13->Gli13 +1,74 69209 0% 98 32 Met'27,138->Leu127’B8 +1,43 69200 98 99 33 Ser,3->Ala13 0 69221 110% 100 34 Lis'7->Ala'7 +0,50 69226 70% 101 35 Glnl21->Ala12' +2,7 69225 100% 102 36 Gln2,->Ala21 +0,63 69217 9,6% 103 37 His^Ala44 +1,52 69215 10,8% 104 38 His53->Ala53 +0,99 69219 8,3% 105 39 Aspll0->Ala"" +1,97 69216 29% 106 40 Aspn3->Ala"v -0,34 69218 0% 107 41 Thr"7->Ala"7 +0,4 69214 9,7% 108 42 Asp2S->Ala2,i;Asp",,->Ala"0 +3,2 69220 20,6% 109 43 Glu124->A1a'24 +0,16 69224 75% 110 44 Phe"4->Val"4, T,n->An7 ** +0,53 0% ** Este análogo foi aparentemente um resultado de um erro casual no oligo que utilizado para a preparação do número 41, indicado supra (Thr1 l7->Ala'n), e por isso foi preparado em conformidade com o processo utilizado para esse análogo “N/A” significa que os dados não estão disponíveis 1 Identificação de Relações de Tipo Estrutura-Função O primeiro passo utilizado para a concepção dos análogos da presente invenção consistiu em determinar quais os radicais necessários para se manter a integridade estrutural da molécula de FEC-G. Isto foi feito ao nível dos resíduos aminoácidos, embora para efeitos de análise também seja possível trabalhar ao nível atómico. A modificação dos resíduos
66 necessários para se manter a integridade estrutural origina uma mudança na estrutura global da molécula de FEC-G. Isto pode ou não ser desejável, dependendo do análogo que se pretenda produzir. Os exemplos experimentais aqui descritos foram concebidos para se manter a integridade estrutural genérica da molécula de FEC-G, com a finalidade de manter a propriedade de ligação do análogo ao receptor de FEC-G (tal como utilizada a seguir nesta secção, a expressão “receptor de FEC-G” designa o receptor do FEC-G natural, existente nas células hematopoiéticas). Admitiu-se e confirmou-se pelos estudos aqui apresentados que a ligação ao receptor do FEC-G é um passo necessário para que haja pelo menos uma actividade biológica, conforme determinado pelos ensaios biológicos indicados supra.
Conforme se observa nas figuras, o FEC-G (neste caso, o met-FEC-G humano recom-binante) é um feixe helicoidal 4-a antiparalelo com torção levógira e com dimensões totais 45Â x 30Ã x 24Ã. As quatro hélices do feixe são designadas por hélices A, B, C e D e as suas espiras de ligação são designadas por espiras AB, BC e CD. Os ângulos de desenvolvimento helicoidal variam entre -167,5° e -159,4°. As hélices A, B e C são contínuas, ao passo que a hélice D contém duas espécies de caracteristicas estruturais, em Gli 150 e Ser 160 (do met--FEC-G humano recombinante). Acima de tudo, as moléculas de FEC-G são constituídas por um feixe de quatro hélices ligadas em série por espiras externas. Esta informação estrutural foi correlacionada depois com a informação funcional conhecida. Sabia-se que os resíduos (incluindo o resíduo metionina na posição 1) 47, 23, 24, 20, 21, 44, 53, 113, 110, 28 e 114 podiam sei- modificados e que o efeito sobre a actividade biológica seria importante. A maior parte das mutações singulares que fazem diminuir a actividade biológica estava centrada em tomo de duas regiões do FEC-G que estão separadas por 30Â e estão localizadas em faces diferentes do feixe de 4 hélices. Uma região implica interacções entre a
vA
67 hélice A e a hélice D. Isto também foi confirmado pelo presença de pontes salinas na molécula inalterada, conforme a seguir se indica: Átomo Hclicc / Átomo Hélice Distância Arg 170 NI D Tir 166 OH A 3,3 Tir 166 OH ' D Arg 23 N2 A 3,3 Glu 163 OE1 D Arg23 NI A 2,8 Arg23 NI A Gin 26 OE1 A 3,1 Gin I59NE2 D Gin 26 O A 3,3
As distâncias aqui assinaladas são para a molécula A, conforme indicado na figura 5 (em que três moléculas de FEC-G cristalizaram conjuntamente e foram designadas por A, B e C). Conforme se pode ver, há uma rede de pontes salinas entre a hélice A e a hélice D, que actuain no sentido de estabilizarem a estrutura da hélice A e consequentemente afectam a estrutura total da molécula de FEC-G. A área centrada em tomo dos resíduos Glu 20, Arg 23 e Lis 24 foi observada na face hidrofilica da hélice A (resíduos 20-37). A substituição dos resíduos com os resíduo alanina sem carga nas posições 20 e 23 originou tempos de retenção semelhantes na CLER, indicando isso similaridade estrutural. A alteração destes sítios modificou a actividade biológica (conforme indicado pelos estudos da presente invenção). A substituição em Lis modificou a actividade biológica, mas não proporcionou na CLER um tempo de retenção idêntico ao das outras duas alterações. O segundo local em que a alteração fez baixar a actividade biológica envolve a hélice AB. A troca de glulamina na posição 47 por alanina (análogo número 19, supra) reduziu a zero a actividade biológica (no ensaio de incorporação da timidina). A hélice AB é predominantemente hidrofóbica, excepto nos terminais amino e carboxi; contém uma espira de uma hélice 310
68 Má dois resíduos histidina em cada terminal (Mis 44 e 1 lis 56) e mais um radical glutamato no resíduo 46 que tem o potencial de formar uma ponte salina para His 44. A análise espetrográfica de infravermelhos pela transformada de Fourier (I.VFT) efectuada ao análogo sugere que este é estruturalmente semelhante à molécula inalterada do FEC-G recombinante. Experiências complementares comprovaram que este análogo poderia não cristalizar nas mesmas condições em que cristaliza a molécula recombinante inalterada.
As alterações no terminal carboxi (Gin 174, Arg 167 e Arg 170) tiveram um efeito diminuto sobre a actividade biológica. Pelo contrário, a supressão dos últimos 8 resíduos (167-175) fez baixar a actividade biológica. Estes resultados podem significar que a supressão desestabiliza a estrutura global, o que impede o mutante de se ligar convenientemente ao receptor do FEC-G (e consequentemente impede o início da transdução do sinal).
De um modo geral, para o núcleo intemo do FEC-G, isto é, o feixe das quatros hélices internas a que faltam as espiras externas, os resíduos internos hidrofóbicos são essenciais para a sua integridade estrutural. Por exemplo, na hélice A, os resíduos hidrofóbicos internos são (estando a metionina na posição 1) Phe 14, Cis 18, Vai 22, Ue 25, Ue 32 e Leu 36. De um modo geral, para o núcleo intemo do FEC-G, isto é, o feixe das quatros hélices internas a que faltam as espiras externas, os resíduos internos hidrofóbicos são essenciais para a integridade estrutural. Por exemplo, na hélice A, os resíduos hidrofóbicos internos são (estando a metionina na posição 1, tal como na figura 1) Phe 14, Cis 18, Vai 22, Ile 25, Ile 32 e Leu 36. Os outros resíduos hidrofóbicos (mais uma vez com o resíduo met (metionina) na posição 1) são. para a hélice B, Ala 72, Leu 76, Leu 79, Leu 83, Tir 86, Leu 90, Leu 93; para a hélice C, Leu 104, Leu 107, Vai 111, Alá 114, Ile 118, Met 122; e para a hélice D, Vai 154, Vai 158, Phe 161, Vai 164, Vai 168 e Leu 172. ./ν '-· / - 69
Os dados sobre actividade biológica anteriormente indicados, atribuídos aos análogos de FEC-G agora preparados, demonstram que a modificação das espiras extemas interfere pelo menos com a estrutura global do FEC-G. As espiras preferidas para a preparação dos análogos são a espira AB e a espira CD. As espiras são estruturas relativamente flexíveis quando comparadas com as hélices. As espiras podem contribuir para a proteólise da molécula. O FEC-G actua de uma forma relativamente rápida in vivo, uma vez que a molécula tem a finalidade de gerar uma resposta a um estimulo biológico, isto é, estimular selectivamente os neutrófilos. O ritmo de substituição do FEC-G também é relativamente rápido. A flexibilidade das espiras pode dar uma “ajuda” às proteases para atacarem a molécula para a inactivarem. Pode ser efectuada a modificação das espiras para impedir a acção degradativas das proteases, mantendo mesmo assim a actividade biológica sem peidas nenhumas (mediante a retenção da estrutura global do FEC-G não modificado).
Este fenómeno não se limita provavelmente à molécula de FEC-G, podendo também ser comum a outras moléculas com estruturas globais semelhantes conhecidas, conforme indicado na figura 2. A alteração da espira externa, por exemplo, da HCh (o mesmo que hGH) do inteiferão B, da IL-2, do FEC-MG (o mesmo que GM-CSF) e da IL-4 pode originar pelo menos uma modificação na estrutura global. As espiras extemas da molécula do FEC-MG não são tão flexíveis como as da molécula do FEC-Ci e tal facto pode significar um período de vida inais longo no soro, consistente com a actividade biológica mais ampla do FEC-MG. Assim sendo, as espiras extemas do FEC-MG podem ser modificadas libertando-as da estrutura da folha β, o que pode fazer com que as espiras fiquem mais ilexíveis (de flexibilidade idêntica às do FEC-G) e fazer consequentemente com que a molécula fique mais sensível à acção degradativa das proteases (aumentando assim o ritmo de substituição). “Ο 70 A alteração destas espiras externas pode ser efectuada estabilizando-as por ligação a uma ou a várias das hélices internas. Os mecanismos de ligação são conhecidos na especialidade, por exemplo, mediante a formação de uma folha β, uma ponte salina, uma ponte dissulfureto ou por interacções hidrofóbicas e ainda por outros meios conhecidos. Além disso, também é possível efectuar a supressão de um ou vários resíduos, por exemplo, um ou vários resíduos aminoácidos ou partes suas, para se preparar uma molécula abreviada e consequentemente eliminar determinadas partes das espiras extemas.
Posto isto, mediante a alteração das espiras externas, de preferência a espira AB (os aminoácidos 58-72 do FEC-G-met-hu-r (o mesmo que r-hu-met-G-CSF) ou a espira CD (aminoácidos 119 a 145 de FEC-G-met-hu-r), e menos preferencialmente o terminal amino (aminoácidos 1 a 10), é possível pois modificar a actividade biológica sem se eliminai a ligação ao receptor FEC-G da molécula de FEC-G. Por exemplo, é possível fazer o seguinte: (1) aumentar o período de seini-vida (ou preparar, por exemplo, uma forma de dosagem oral) da molécula de FEC-G, fazendo baixar a capacidade que as protease têm para actuarem sobre a molécula de FEC-G ou introduzindo modificações químicas na molécula de FEC-G, por exemplo, acrescentar uma ou várias moléculas de polietileno-glicol ou aplicar revestimentos entéricos para formulação oral que iriam actuar no sentido de modificarem algumas das características da molécula de FEC-G, anterionnenle descritas, por exemplo, o aumento do período de semi-vida no soro ou noutros meios ou a diminuição da antigenicidade; (2) preparar uma molécula híbrida, por exemplo, combinando o FEC-G com uma parle ou com a totalidade de outra proteína, por exemplo, outra citoquina ou outra proteína que realize a transdução do sinal mediante a penetração na célula através de um mecanismo de transporte do receptor FEC-G da molécula de FEC-G; ou (3) aumentar a actividade biológica por' exemplo, tal como sucede com a capacidade para estimular selectivamente os neutrófilos (comparativamente com uma molécula de FEC-G não modificada). Esta listagem não se limita aos exemplares anteriores.
Outra conclusão a tirar dos dados anteriores é o facto de as interacções superficiais estabilizadoras poderem afectar a actividade biológica.. Isto é evidente numa comparação entre os análogos 23 e 40. O análogo 23 contém uma substituição do resíduo asparagina, com carga, na posição 28 por troca o resíduo alanina com carga neutra nessa posição, tendo tal substituição originado um aumento de 50% da actividade biológica (medida pelos ensaios divulgados de incorporação da timidina). O resíduo asparagina na posição 28 tem uma interacção superficial com o resíduo asparagina na posição 113; estando os dois resíduos carregados negativamente, há um certo grau de instabilidade (devido à repulsão entre radicais com cargas iguais). No entanto, quando o resíduo asparagina na posição 113 é substituído com o resíduo alanina de carga neutra, a actividade biológica cai para zero (no sistema de ensaio presente). Isto indica que o resíduo asparagina na posição 113 é crítico para a actividade biológica e que a eliminação do resíduo asparagina na posição 28 serve para aumentar o efeito que possui o resíduo asparagina na posição 113.
Foram determinados também os domínios necessários para a ligação do receptor de FEC-G com base nos análogos anteriores preparados e na estrutura do FEC-G. O domínio de ligação do receptor de FEC-G está localizado nos resíduos (com o resíduo metionina na posição 1)11 a 57 (entre as hélices A e AB) e 100 a 118 (entre as hélices B e C). Também é possível preparar moléculas abreviadas capazes de se ligarem a um receptor de FEC-G e de iniciarem a transdução do sinal para estimular os neutrófilos de forma selectiva, mediante a modificação da estrutura da espira externa e deixando ficar intactos os domínios de ligação ao receptor. 72
Foram identificados os resíduos essenciais responsáveis pela actividade biológica e presumivelmente pela ligação ao receptor de FEC-G ou pelo transdução do sinal. Há dois locais distintos localizados em duas regiões diferentes da estrutura secundária. O “local A”, tal como aqui designado, está situado numa hélice confinada por contactos de tipo ponte salina entre dois outros membros do feixe helicoidal. O segundo local, designado por “local B” está situado numa hélice relativamente mais flexível que é a hélice AB. A hélice AB é potencialmente mais sensível a variações locais do pH devido ao tipo de posição dos resíduos nos terminais carboxi e amino. A importância funcional desta hélice flexível pode ser relevante num ajustamento induzido conformacionalmente aquando da ligação ao receptor de FEC-G. Além do mais, a parte prolongada da hélice D também é tida como um domínio de ligação ao receptor de FEC-G, conforme determinado por análise da estrutura das proteínas por via mutacional directa e por via comparativa indirecta. A supressão da extremidade do terminal carboxi de FEC-G-met-hu-r reduz a actividade, tal como sucede com a HCh, ver Cunningham e Wells, ‘Science’ 244: 1081-1084 (1989). As citoquinas que possuem estruturas semelhantes, tais como a IL-6 e a FEC-MG, com topologia semelhante prevista, também centram a sua actividade biológica ao longo da extremidade carboxi da hélice D, ver Bazan, ‘Immunology Today’ LL 350-354 (1990).
Uma comparação das estruturas e das posições dos determinante de ligação ao receptor de FEC-G, entre o FEC-G e a HCh, sugere que as duas moléculas possuem meios idênticos de transdução do sinal. Foram identificados dois locais separados de ligação ao receptor de FEC-G; ver De Vos et ai, ‘Science’ 255: 306-32 (1991). Um destes locais de ligação (designado por “Local I”) é formado por resíduos das faces expostas da hélice 1 da HCh, da região de ligação entre as hélices 1 e 2 e da hélice 4. Um segundo local de ligação (designado por “Local Π”) é fotmado pelos resíduos da superfície da hélice 1 e da hélice 3. ** /s - •· & .... 73
Os detenriinantes da ligação ao receptor de FEC-G identificados no FEC-G estão localizados nas mesmas posições relativas às dos que foram identificados para a HCh. O local de ligação ao receptor de FEC-G situado na região de união entre as hélices A e B na hélice AB (local A) está numa posição semelhante à que foi assinalada para um pequeno fragmento de hélice (resíduos 38 a 47) da HCh. Uma única mutação pontual na hélice AB do FEC-G reduz de forma significativa a actividade biológica (conforme determinado nas experiências da presente invenção), indicando o papel que tem no interface ligando-receptor de FEC-G. A ligação ao receptor de FEC-G pode desestabilizar a natureza helicoidal 310 desta região e induzir uma modificação conformacional que melhore a energia de ligação do complexo ligando/receptor de FEC-G.
No complexo receptor de HCh, a primeira hélice do feixe fornece resíduos aos dois locais de ligação necessários para dimerizar o receptor de HCh. Numa analise mutacional da correspondente hélice de FEC-G (hélice A) foram identificados três resíduos que são necessários para a actividade biológica. Desses três resíduos, há dois, Glu 20 e Arg 24, que estão sobre uma face do feixe helicoidal voltada para a hélice C, ao passo que a cadeia lateral de Arg 23 ( em duas das três moléculas na unidade assimétrica) aponta para a face do feixe voltada para a hélice D. A posição das cadeias laterais destes resíduos biologicamente importantes indica que, tal como sucede com a HCh, também o FEC-G pode ter um segundo local de ligação ao receptor de FEC-G ao longo da interface entre a hélice A e a hélice C. Contrariamente ao que sucede com a molécula de HCh, o terminal amino da molécula de FEC-G tem um papel biológico limitado, na medida em que a supressão dos primeiros 11 resíduos tem um efeito diminuto sobre a actividade biológica. 74
Conforme se disse antes (ver, por exemplo, a figura 2), o FEC-G tem uma semelhança topológica com outras citoquinas. Uma correlação da estrutura com estudos bioquímicos anteriores, a analise mutacional e a comparação directa de resíduos específicos do complexo receptor de HCh indicam que o FEC-G tem dois locais de ligação ao receptor. O local A fica situado ao longo da interface das hélices A e D e compreende os resíduos existentes na pequena hélice AB. O local B também compreende resíduos da hélice A, mas fica situado ao longo da interface entre as hélices A e C. A conservação da estrutura e as posições relativas de resíduos biologicamente importantes entre as moléculas de FEC-G e HCh são uma indicação da existência de um método comum de transdução do sinal, na medida em que o receptor se encontra ligado em dois locais. Verificou-se consequentemente que os análogos de FEC-G que possuem domínios modificados de ligação ao receptor de FEC-G podem ser preparados por alteração de qualquer dos locais de ligação ao receptor de FEC-G (resíduos 20 a 57 e 145 a 175). O conhecimento da estrutura tridimensional e da correlação da composição da proteína FEC-G faz com que seja possível conceber um método sistemático e racional para a preparação de análogos de FEC-G. Os exemplos experimentais anteriormente descritos demonstraram que as limitações de tamanho e polaridade das cadeias laterais dentro do núcleo da estrutura determinam a quantidade de modificações que a molécula pode tolerar antes de a sua estrutura global ficar alterada.
LISTAGEM DE SEQUÊNCIAS (!) INFORMAÇÃO GERAL: (i) REQUERENTE: Amgen Inc. (ii) TÍTULO DA INVENÇÃO: (iii) NÚMERO DE SEQUÊNCIAS: 110 (iv) ENDEREÇO PARA CORRESPONDÊNCIA: (A) ENDEREÇO: Amgen Inc (B) RUA: Amgen Center, 1840 DeHavilland Drive (C) CIDADE: Thousand Oaks (D) ESTADO. Califórnia (E) PAÍS. Estados Unidos da América (F) CÓDIGO POSTAL: 91320-1789
(v) FORMA LEGÍVEL POR COMPUTADOR (A) SUPORTE, disquete
(B) COMPUTADOR: CP compatível com IBM
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:l. (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 565 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (genómico) (ix) PARTICULARIDADES:
(A) NOME/CÓDIGO: CDS (B) LOCALIZAÇÃO: 30 .554
76 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1 TCTAGÃÀAAA ACCAAGGAGG TAATAAATA ÃTG ACT OCA ΤΓΑ GGT CCT GCT TCT 53 Met Thr Pro Leu Gli Pro Ala Ser 5 tct CIG OOG CAA AGC TTT CIG CIG AAA TGT CIG GAA CAG GTT CGT AAA 101 Ser Leu Pro Gin Ser Phe Leu Leu Lis Cis Leu Glu Gin Vai A1¾ Us 10 15 20 ATT CAG GGT GAC GGT GCT GCA CFG CAA GAA AAA CIG TGC GCT ACT TAC 149 Ile Gin Gli Asp Gli Ala Ala Leu Gin Glu Lis Leu Cis Ala Thr Tir 25 30 35 40 AAA CIG TGC CAT OGG GAA GAG CIG GTA CIG CIG GGT CAT TCT CTT OGG 197 lis Leu Cis His Pro Glu Glu Leu Vai Leu Leu Gli His Ser Leu Gli 45 50 55 ATT OCG TGC. GCT CCG CIG TCT TCT TGT OCA TCT CAA GCT CTT CAG CIG 245 Ile Pro Trp Ala Pro Leu Ser Ser Cis Pro Ser Gin Ala Leu Gin Leu 60 65 70 GCT GGT 'IGT CIG TCT CAA CIG CAT TCT GGT CIG TTC CIG TAT CAG GGT 293 Ala GB Cis Leu Ser Gin Leu His Ser Gli Leu Phe Leu Tir Gin Gli 75 80 85 CFT CIG CAA GCT CIG GAA GGT ATC TCT OCG GAA CIG GGT OOG ACT CIG 341 Leu Leu Gin Ala Leu Glu Gli lie Ser Pino Glu Leu Gli Pro Thr Leu 90 95 100 GAC ACT CIG CAG CTA GAT GTA GCT GAC TTT GCT ACT ACT ATT TOG CAA 389 Asp Thr leu Gin Leu Asp Vai Ala Asp Phe Ala Thr Thr lie Tip Gin 105 110 115 120 CAG ATG GAA GAG CTC GGT ATG GCA OCA GCT CIG CAA OOG ACT CAA GGT 437 Gin Met Glu Glu Leu Gli Met Ala Pro Ala Leu Gin Pro Thr Gin Gli 125 130 135 ΟΠ' ATG CCG OCA TTC GCT TCT GCA TIC CAG CGT CGT GCA GGA GGT GTA 485 Ala Met Pro Ala Phe Ala Ser Ala Phe Gin Arç» Aig Ala Gli Gli Vai 140 145 150 crc GTT GCT tct CAT CIG CAA TCT TIC CIG GAA GTA TCT TAC OGT GIT 533 Leu Vai Ala Ser His Leu Gin Ser Phe Leu Glu Vai Ser Tir Atg Vai 155 160 165 CIO CGT GAT CIG GCT CAG OOG TAATAGAA1T C 565 Leu An» His Leu Ala Gin Pro 170 175 // . ' ' 77 $ (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:2: (i) C ARACTERÍ STIC AS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 pares de bases (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2:
Met Thr Pro Leu Gli Pro Ala Ser Ser leu Pro Gin Ser Phe Leu leu 1 5 10 15 Lis Cis leu Glu Gin Vai Aie Us Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Us Leu Cis His Pro Glu Glu leu 35 40 45 Vai leu Leu Gli His Ser Leu Qi He Pro Tip Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe leu Tir Gin Gli leu leu Gin Ala leu Glu Gli He 85 90 95 Ser Pro Glu Leu Gli Pro Thr leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr He Tip Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pio Ala Leu Gin Pro Thr Gin Gli Ala Md Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arç» Al£ Ala Gli GB Vai Leu Vai Ala Ser His leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Arg Vai leu Arg His Leu Ala Gin Pro 165 170 175
(2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:3 (i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA. ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:3: CTTTCTGCTG CGTTGTCTGG AACA (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D N0.4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA SEQ ID NO:4: ACAGGTTCGT CGTATCCAGG GTG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:5 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA SEQ ID NO:5: CACTGCAAGA ACGTCTGTGC GCT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:6: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:6: CGCTACTTAC CGTCTGTGCC ATC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0.7: (i) C ARACTERÍ STICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:7: CTTTCTGCTG CGTTGTCTGG AACA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:8 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:8: ACAGGTTCGT CGTATCCAGG GTG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:9:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:9: ??CTGCAAGA ACGTCTGTGC GCT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 10: CTTTCTGCTG CGTTGTCTGG AACA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico '81rs (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 11: ACAGGTTCGT CGTATCCAGG GTG 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 12: CGCTACTTAC CGTCTGTCCC ATC 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 13: 24
CtttctGCTG CGTTGTCTGG AACA
.-Cf 82 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 14:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 14: ??CTGCAAGA ACGTCTGTGC GCT 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA. ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 15. CGCTACTTAC CGTCTGTGCC ATC 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 16 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN 83 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 16: ACAGGTTCGT CGTATCCAGG GTG 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 17: CACTGCAAGA ACGTCTGTGC GCT 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO 18. CGCTACTTAC CGTCTGTGCC ATC 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 19: CTTTCTGCTG CGTTGTCTGG AACA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO 20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO 20 ??AGGTTCGT CGTATCCAGG GTG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 21 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:2): CACTGCAAGA ACGTCTGTGC GCT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 22: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:22: CGCTACTTAC CGTCTGTGCC ATC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 23: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 23 TCTGCTGAAA GCTCTGGAAC AGG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 24 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0.24: CTTGTCCATC TGAAGCTCTT CAG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:25. (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 37 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 25: ??AAAACTGT CCGCTACTTA CAAACTGTCC CATCCGG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0.26: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 2Ó: TTCGTAAAAT CGCGGGTGAC GG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0.27 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO, simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 27: TCATCTGGCT GCGCCGTAAT AG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 28: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0.28: CCGTGTTCTG GCTCATCTGG CT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 29
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:29: GAAGTATCTT ACGCTGTTCT GCGT (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO:30: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 25 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:30: GAAGTATCTT ACTAAGTTCT GCGTC (2) INFORMAÇÃO PARA A SEQUENCIA ID NO 31:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA. ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:31: ??CTACTTAC GCACTGTGCC AT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:32 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:32: CAAACTGTGC AAGCCGGAAG AG (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D N0.33 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ 1D N033: CATCCGGAAG CACTGGTACT GC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0.34: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:34: GGAACAGGTT GCTAAAATCC AGG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 35: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO. 25 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:35: GAACAGGTTC GTGCGATCCA GGGTG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 36: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 36: ??AATGTCTG GCACAGGTTC GT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:37 (i) CARACTERÍSTICAS DA SEQUÊNCIA. (A) COMPRIMENTO: 19 pares de bases (B) T1PÓ: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 37:
TCCAGGGTGC CGGTGCTGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N038: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) ΤΓΡΟ DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N038: AAGAGCTCGG TGAGGCACCA GCT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 39: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO, simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0.39: CTCAAGGTGC TGAGCCGGCA TTC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO 40 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO 40: GAGCTCGGTC TGGCACCAGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 41: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:41: TCAAGGTGCT CTGCCGGCAT T (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0.42 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:42: ??TGCCGCAA GCCTTTCTGC TGA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 43 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TÍPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 43: CTTTCTGCTG GCATGTCTGG AACA (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO:44: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:44 CTATTTGGCA AGCGATGGAA GAGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 45 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO, simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 45
CAGATGGAAG CGCTCGGTAT G 94 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 46: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) ΤΓΡΟ DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:46: GAGCTCGGTC TGGCACCAGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:47:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:47: ??AAGGTGCT CTGCCGGCAT T (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:48: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGI A: linear
(ii) TIPO DE MOLÉCULA: ADN ***** - 95
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:48: GAAATGTCTG GCACAGGTTC GT (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:49: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 pares de bases (B) TIPO: acido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ IDN0 49: TTCCGGAGCG CACAGTTTG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO 50: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:50: CGAGAAGGCC TCGGGTGTCA AAC 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 51: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 51: ATGCCAAATT GCAGTAGCAA AG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 52 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 24 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:52: ACAACGGTTT AACGTCATCG TTTC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:53 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:53: ??CAGCTACT GCTAGCTGCA GA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 54:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 23 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:54: TCAGTCGATG ACGATCGACG TCT 23 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 55: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO 55: TTACGAACCG CTTCCAGACA TT 22 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0.56: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 25 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN ff
* V
Js 98
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 56: TAAAATGCTT GGCGAAGGTC TGTAA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:57 (i) C ARACTERÍ STIC AS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA, linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 57: GTAGCAAATG CAGCTACATC TA (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:58: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 25 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:58: ??TCATCGTT TACGTCGATG TAGAT 25 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:59: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO 59 CCAAGAGAAG CACCCAGCAG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:60: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 22 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:60: AGGGTTCTCT TCGTGGGTCG TC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0.61 (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 20 pares dc bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 61:
CACTGGCGGT GATAATGCAGC (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 62: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 19 pares de bases (B) TIPO: ácido nucleico (C) ΤΓΡΟ DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:62: CTAGGCCAGG CATTACTGG (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 63: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 21 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN
(xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:63: CCACTGGCGG TGATACTGAG C (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 64 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 33 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN v ' -7 ^ “ 101 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0.64: AGCAGAAAGC TTTCCGGCAG AGAAGAAGCA GGA 33 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:65: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 54 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:65: GCCGCAAAGC TITCTGCTGA AATGTCTGGA AGAGGTTCGT AAAATCCAGG GTGA 54 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 66: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 59 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CORDÃO: simples (D) TOPOLOGIA: linear
(ii) TIPO DE MOLÉCULA: ADN (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:66: CTGGAATGCA GAAGCAAATG CCGGCATAGC ACCÍTCAOTC GGTTGCAGAG CTGGTGCCA 24 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:67: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido Μ & /y 102 (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA, proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:67:
Met 1 Thr Pro ‘ Leu Gli 5 Pro Ala Ser Ser Leu 10 Pro Gin Ser Phe Leu 15 Leu 1 Arg Cis Leu Glu 20 Gin Vai Arg Lis lie 25 Gin Gli Asp Gli Ala 30 Ala Leu Gin Glu lis 35 Leu Cis Ala Thr Tír 40 lis Leu Cis His Pro 45 Glu Glu Ijeu Vai Leu 50 LeU Gli His Ser Leu 55 Gli lie Pro Tip Ala 60 Pio Leu Ser Ser Cis 65 Pro Ser Gin Ala Leu 70 Gin Leu Ala Gli Cis 75 Leu Ser Gin Leu His 80 Ser Gli Leu Phe Leu 85 Tir Gin Gli Leu Leu 90 Gin Ala l_eu Glu Gli 95 lie Ser Pro Glu Leu 100 Gli Ito Thr Leu Asp 105 Thr Leu Gin Lai Asp 110 Vá Ala Asp Phe Ala 115 Thr Thr lie Trp Gin 120 Gin Met Glu Glu Leu 125 Gli Ma Ala Pro Ala Leu Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe 145 Gin Arg Arg Ala Gli 150 Gli Vá Ijsu Vá Ala 155 Ser His Leu Gin Ser 160 Phe Leu Glu Vai Ser 165 Tir Aig Vá Leu Arg 170 His Leu Ala Gin Pro 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO:68: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:68: vlet Thr Pro Lai Gli Pio Ala Ser Sa Leu Pro Gln Ser Phe Leu Leu 1 5 10 15 IJs Cis Loi Glu Gin Vai Arg Aig lie Gln Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu lis Leu Cis Ala Thr Tir lis Leu Cis His Pro Glu Glu Loi 35 ' 40 45 VaJ loa Leu Gli His Ser Leu Gli lie Pro Ttp Ala Pro Leu Sa Sa 50 55 60 Cis Pio Ser Gin Ala loa Gin I.£u Ala Gli Cis Leu Ser Gln Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Qi loi Leu Gln Ala loa Glu Qi lie 85 90 95 Sα IVo Glu Leu Gli Pro Thr loi Asp Thr Ioj Gln Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ue Trp Gln Gln Met Glu Glu Loa Gli Md Ala 115 120 125 Pio Ala loa Gin Pro Tlir Gin Gli Ala Md Pio Ala Phe Ala Sa Ala 130 135 140 Phe Gin Aig Aig Ala Gli Gli Vai Lai Vai Ala Sa His loa Gln Sa 145 150 155 160 Phe loa Glu Vai Sa Tir Arg Vai Leu Arg His Loi Ala Gln Pro 165 170 175. (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 69: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA, linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 69: Md Thr Pro Leu Gli Pro Ala Ser Ser Leu Pio Gln Ser Phe Leu Leu 1 5 10 15 Lis Cis Leu Glu Gin Vai Arg lis lie Gln Gli Asp Gli Ala Ala Lai 20 25 30 Gin Glu Arg Leu Cis Ala Thr Tir Lis Loi Cis His Pro Glu Glu Lai 35 40 45 //. 104
Vai Ljeu Leu Gli Kis Ser Leu Gli lie Pro Τφ Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser. Gin Ala Leu Gin leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Ixu Phe Leu Tir Gin Gli Leu Leu Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp TTir Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Tip Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala Leu Gin Pro Tir Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli Gli Vai Leu Vai Ala Ser His ljeu Gin Ser 145 150 155 160 Phe ljeu Glu Vai Ser Tir Arg Vai Leu Aig His Leu Ala Gin Pro 165 170 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO 70: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO 70:
Met Tir Pro Leu Gli Pro Ala Ser Ser Leu Pio Gin Ser Phe Leu Lai 1 5 10 15 Us Cis Leu Glu Gin Vai Aig Lis lie Gin Gli Asp Gli Ala Ala Leu 20 .25 30 Gin Glu Lis Lai Cis Ala Thr Tir Aig Leu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Ixu Gli His Ser Lai Gli lie Pro Tip Ala Pro Leu Ser Sa 50 55 60 Cis Pro Ser Gin Ala Leu Gin Lai Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80
Ser Gli Leu Phe Leu Tir Gin Gli Leu Lai Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ue Τφ Gin Gin Ma Glu Glu leu Gli Ma Ala 115 ' 120 125 Pro Ala leu Gin Pro Thr Gin Gli Ala Ma Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli ai Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Lai Glu Vai Sei- Tu' Arg Vai Leu Arg His Leu Ala Gin Pio 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO.71: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xí) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 71:
Ma Thr ho leu Gli Pro Ala Ser Ser leu Do Gin Ser Plie Lai leu 1 5 10 15 Aig Cis Leu Glu Gin Vai Arg Arg Ile Gin Gli Asp Gli Ala Ala leu 20 25 30 Gin Glu Arg Leu Cis Ala Thr Tir Lis Leu Cis His Do Glu Glu leu 35 40 45 Vai leu Leu Gli His Ser Leu Gli lie Pro Tip Ala ΡΐΌ Leu Sa Sa 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu AJa Gli Cis Leu Sa Gin Leu His 65 70 75 80 Ser Gli Ijeu Phe Leu Tir Gin Gli Leu leu Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu leu Gli Pro Thr leu Asp Thr Leu Gin leu Asp Vai Ala 100 105 110
Asp Phe Ala 115 Thr Tlr lie Tip Gin 120 Gin Met Glu Glu Leu 125 Gli Met Ala Pro Ala 130 IjOÍ Gln Pro ΊΤίγ Gin 135 Gli Ala Met Pro Ala 140 Phe Ala Ser Ala Phe 145 Gin Arg Arg Ala Gli 150 Gli Vai Leu Vai Ala 155 Ser His Leu Gin Ser 160 Plie Leu Glu Vai Ser 165 Tir Arg Vai Leu Arg 170 His Leu Ala Gin Pro 175
(2) INFORMAÇÃO PARA A SEQUÊNCIA 1D N0 72
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 72:
Met 1 Tlir Pro Leu Gli Pro Ala Ser Ser Leu Pro Gin Ser Phe Ijeu Leu 5 10 15 Arg Cis Leu Glu Gin Vai Arg Lis lie Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Aig Ijeu Cis Ala Thr Tir Aig teu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Leu Gli His Ser Ixu Gli lie Pro Trp Ala Po Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis I^eu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu Leu Gin Ala Lai Glu Gli He 85 90 95 Ser Pio Glu Leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Tip Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala Ιχιι Gin Pro Thr Gin Gli Ala Met Pio Ala Phe Ala Sa Ala 130 135 140 / & 107
Phe 145 Gin Arg Aig Ala Gli 150 Gi Vai Leu Vai Ala 155 Ser His Leu Gin Phe Leu Glu Vai Ser 165 Tir Arg Vai Leu Aig 170 His Leu Ala Gin Pro 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO.73.
(i) CARACTERÍST1CAS DA SEQUÊNCIA (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:73:
Met 1 Thr Pro Leu Gli 5 Pro Ala Sd Ser Leu 10 Pro Gin Sd Phe Leu 15 leu Lis Cis leu Glu 20 Gin Vai Arg Aig lie 25 Gin Gli Asp Gli Ala 30 Ala Leu Gin Glu Arg Leu Cis Ala Thr Tir 40 Arg Leu Cis His Pro 45 Glu Glu Leu Vai leu 50 jJ leu Gli His Ser leu 55 Gli lie IVo Τφ Ala 60 Pro leu Sd Sd Cis 65 Pro Ser Gin Ala Leu 70 Gin leu Ala Gli Cis 75 leu Sd Gin Leu His 80 Ser Gli Leu Plie leu 85 Tir Gin Gli leu leu 90 Gin Ala Leu Glu Gli 95 lie Ser Pro Glu Leu 100 Gli Pro Thr leu Asp 105 Tir Leu Gin Leu Asp 110 Vai Ala Asp Phe Ala 115 Thr Thr lie Τφ Gin 120 Gin Md Glu Glu leu 125 Gli Md Ala Pro Ala Leu Gin Pro Thr Gin Gli Ala Md Pro Ala Phe Ala Sd Ala 130 135 140 Phe 145 Gin Arg Arg Ala Gli 150 Gli Vai Leu Vai Ala 155 Sd His Leu Gin Sd 160 Phe Leu Glu Vai Ser 165 Tir Arg Vai Leu Aig 170 His Leu Ala Gin Pro 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 74 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:74:
Met Thr Pro leu Gli Pio Ala Sei' Sei Leu Pro Gin Ser Phe Leu Leu 1 5 10 15 Aig Cis Leu Glu Gin Vai Arg Arg He Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Arg Leu Cis Ala Thr Tir Arg Leu Cis His Pio Glu Glu Leu 35 40 45 Vai Ijeu leu Gli His Ser leu Gli lie Pro T.p Ala Pio Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu leu Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu GO Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr He Tip Gin Gin Met Glu Glu Ijeu Gli Met Ala 115 120 125 Pro Ala Leu Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Aig Atg Ala Gli Gli VaJ leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe leu Glu Vai Ser Tir Arg Vai Leu Arg His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 75: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO.75:
Met | Thr Pro" Leu Gli 5 Pro Ala Ser Ser Leu 10 Pro Gin Ser Phe Leu 15 Leu Arg Cis Leu Glu 20 Gin Vai Arg Arg Ile 25 Gin Gli Asp Gli Ala 30 Ala Leu Gin Glu Us leu Cis Ala Thr Tir Arg Leu Cis His Pio ac Glu Glu Leu 35 40 4.) Vai Leu 50 Leu Gli His Ser Leu 55 Gli lie 1½) Τφ Ala 60 Pro Leu Ser Ser Cis 65 Pro Ser Gin Ala Leu 70 Gin Leu Ala Gli Cis 75 Leu Ser Gin Leu His 80 Ser Gli Leu Plie Leu 85 Tir Gin Gli Leu Leu 90 Gin Ala Ijeu Glu Gli 95 lie Ser Pro Glu Leu 100 Gli Pio Thr Leu Asp 105 Thr l^eu Gin Leu Asp 110 Vai Ala Asp Plie Ala 115. Thr Thr Ue Tip Gin 120 Gin Met Glu Glu Ijeu 125 Gli Met Ala Pro Ala Leu Gln Pro Thr Gin Gli Ala Met Pro Ala Plie Ala Ser Ala 130 135 140 Plie 145 Gin Arg Aig Ala Gli 150 Gli Vai leii Vai Ala 155 Ser His Leu Gin Ser 160 Phe I.jeu Glu Vai Ser 165 Tir Aig Vai Leu Arg 170 His leu Ala Gn Pro 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D N0 76: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0.76: 110 .V >
Met Thr Pro Ijeu Gli Pro Ala Ser Ser Leu Pro GIn Ser Phe Leu Leu 1 5 10 15 Lis Cis l^eu Glu Gin Vai Aig Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu I is Ijeu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Glu Ijeu 35 40 45 Vai Ijeu I^eu Gli His Ser l.£U Gli lie Pro Trp Ala Pio Leu Ser Sei' 50 55 60 Cis Pro Ser Glu Ala Leu Gin Ijeu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu Leu Gin Ala Leu Glu Gli Ile 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp Thr Ixu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr He Trp Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pio Ala I_£U Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli Gli Vai Ijeu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Glu Vai Ser Tir Arg Vai Leil Arg His Ijeu Ala GIn Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 77:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 77:
Met 1 Thr Pro L^u Gli 5 Pro Ala Ser IJs Cis Leu Glu 20 Ciln Vai Arg IJs
Ser Leu 10 Pro Gin Ser Phe Leu 15 Leu Ile 25 Gin Gli Asp Gli Ala 30 Ala Leu
111
Gin Glu Lis Leu Ser Ala Thr Tir Lis Leu Ser His Pro Glu Glu Lai 35 40 45 Vai Leu Leu Gli His Ser Leu Gli Ile Pro T.p Ala Pro Lai Ser Ser 50 55 60 Cis Pro Ser Gin Ala Ljai Gin Lai Ala Gli Cis Lai Ser Gin Lai His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu Leu Gin Ala Leu Glu Gli He 85 90 95 Ser Pro Glu Leu Gli Pro Thr Lai Asp Tir Lxu Gin Lai Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Tip Gin Gin Met Glu Glu Leu Gli Ma Ala 115 120 125 Pro Ala Lai Gin Pro Thr Gin Gli Ala Ma Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli Gli Vai Lai Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Arg Vai Leu Aig His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 78: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 78:
Ma 1 Thr Pro Leu Gli 5 Pro Ala Sa Sa Lai 10 Pro Gin Sa Phe Lai 15 L^ai Lis Cis Leu Glu 20 Gin Vai Arg Lis lie 25 Ala Gli Asp Gli Ala 30 Ala Lai
Lis Leu
Cis His
Glu Lai
Pio Glu 45
Gin Glu Lis Leu Cis Ala Tlir Tir 35 40 1
Vai Leu Leu Gli His Ser Leu Gli Ile Pio Trp Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe lai Tir Gin Gli Leu Leu Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ile T.p Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala Leu Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli Gli Vai Ijeu Vai Ala Ser ITis Leu Gin Ser 145 150 155 160 Plie Ixu Glu Vai Ser Tir Arg Vai Leu Aig His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 79: (i) C ARACTERÍ STIC AS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SF.Q 1D NO:79:
Met Thr Pro Leu Gli Pio Ala Ser Ser Lar Pio Gin Ser Pire Leu Leu 1 5 10 15 lis Cis Ijeu Glu Gin Vai Arg Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu lis Leu Cis Ala Thr Tir lis Ijeu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Leu Gli His Ser Lai Gli Ile Pro Trp Ala Pio l^eu Ser Ser 50 55 60 Cis Pio Ser Gin Ala Ixu Gin lar Ala Qi Cis lar Ser Gin Leu His 65 70 75 80
113
Ser Gli Leu Phe Ser Pro GIu Leu 100 Asp Phe Ala 115 Thr Pro Ala 130 Leu Gin Plie 145 Gin Al£ Arg Phe leu Glu Vai
Leu 85 Tir Gin Qi Gli Pro Tir Leu Thr He Tip Gin 120 Pro Thr Gin 135 Gli Ala Gli 150 Gli Vai Ser 165 Tir Arç> Vai
Leu leu 90 Gin Ala Asp 105 Thr Leu Gin Gin Md Glu Glu Ala Md Pro Ala 140 Leu Vai Ala 155 Ser leu Anr 170 His leu
Leu Glu Gli 95 Ile Leu Asp 110 Vai Ala Leu 125 Gli Md Ala Phe Ala Sd Ala His Leu Gin Ser 160 Ala Gin Pro 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:80: (i) CARACTERÍSTJCAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína
Md 1 Thr Pio leu Us Cis Leu Glu 20 Gin Glu lis leu 35 Vai Leu Leu Gli 50 Cis Pro Ser Gin 65 Ser Gli leu Phe Sd Pio Glu Leu 100 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:80: Gli Pro Ala Ser 5 Gin Vai A^ Us Cis Ala Tir Tir 40 His Ser Leu 55 Gli Ala leu 70 Gin Leu Leu Tir Gin Gli 85 Gli Pio Tir Leu
Sa‘ Leu 10 Pro Ciln (le 25 Gin Gli Asp IJs leu Cis His lie Pro T.p Ala 60 Ala Gli Cis 75 Leu Leu Leu 90 Gin Ala Asp 105 Tir leu Gin
Sd Phe leu 15 Leu Gli Ala 30 Ala Leu Pro 45 Glu Glu Leu Pro Leu Sd Sd Sd Gin Leu His 80 Leu Glu Gli 95 Ile Leu Asp 110 Vai Ala
114
Asp Phe Ala Thr Thr lie Tip Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 1¾ Ala Leu Gln Pro Thr Gn Gli Ala Met Pio Ala Phe Ala Ser Ala 130 135 140 Plie Gin Arg Aig Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Plie Leu Glu Vai Ser Tir Arg Vai Leu Ala His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO:81: (i) CARACTERÍ STIC AS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 81:
Met ΊΊιτ Pro Lai Gli Pro Ala Ser Ser Leu Pio Gln Ser Phe Leu Lai 1 5 10 15 Us Cis Leu Glu Gin Vai Arg Us Ile Gln Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Us Leu Cis Ala Thr Tir Us Leu Cis His Pro Glu Glu Leu 35 40 45 Vai leu Leu Gli His Ser Leu Gli lie Pio Tip Ala lho Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Lai Gln Leu Ala Gli Cis Leu Ser Gln Lai His 65 70 75 80 Ser Gli Leu Plie leu Tir Gln Gli leu Lai Gln Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr leu Asp Thr Leu Gln Leu Asp Vai Ala 100 105 110 Asp Phe Ala Tlir [To Ue Tip Gln Gln Met Glu Glu Leu Gli Met Ala 115 120 125 1¾) Ala leu Gin lho ΊΤιγ Gln Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Plie Gin Arg Arg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gln Ser 145 150 155 160 115
115 - /X
Phe Leu Glu Vai Ser Tir Ala Vai Leu Arg His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:82: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 174 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 82:
Met Tlir Pro Leu Gli Pro Ala Ser Ser Leu 1¾ Gin Ser Phe Leu Leu 1 5 10 15 lis Cis Leu Glu Gin Vai Arg Us He Gin Gli Asp Gli Ala Ala leu 20 25 30 Gin Glu Us Leu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Leu Gli His Ser leu Gli lie Pro Tip Ala Pro leu Ser Ser 50 55 60 Cis 1¾ Ser Gin Ala Leu Gin Leu Ala Gli Cis leu Ser Gin Leu His 65 70 75 80 Ser GB Leu Plie Leu Tir Gin Gli Leu leu Gin Ala Leu Glu Gli lie 85 90 95 Ser Do Glu leu Gli Uo Ilir Leu Asp ΊΤιτ leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ile Tip Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala Leu Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Plie Gin Arg Aig Ala Gli Gli Vai leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Vai Leu Arg His leu Ala Gin Pro 165 170 174
116 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 83: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:83:
Md Thr Pro Leu Gli Pro Ala Sa Sa' Leu 1¾) Gin Sa Phe Leu loa 1 5 10 15 lis Cis Leu Glu Gin Vai Arç* Lis lie Gin Gli Asp Gli Ala Ala loa 20 25 30 Gin Glu lis Leu Cis Ala Thr Tir Ala Leu Cis His Pro Glu Glu loa 35 40 45 Vai loa Leu Gli His Ser Leu Gli lie Pro Trp Ala Pro Leu Sa Sa 50 55 60 Cis Pro Ser Gin Ala Leu Gin Lai Ala Gli Cis Leu Sa Gin Leu His 65 70 75 80 Ser Gli Iaa Phe Ioj Tir Gin Gli loi loa Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr loa Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala llir Thr ne Trp Gin Gin Ma Glu Glu Leu Gli Ma Ala 115 120 125 Pio Ala lai Gin Pro Thr Gin Gli Ala Ma Pro Ala Phe Ala Sa Ala 130 135 140 Phe Gin Aig Arg Ala Gli Gli Vai Leu Vai Ala Sa His Leu Gin Sa 145 150 155 160 Phe Lai Glu Vai Ser Tir Aig Vai Loa Aib His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 84: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ IDN084:
Met Tíir I*ro Leu Gli Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu 1 5 10 15 Lis Cis Leu Glu Gin Vai Arg Lis Ue Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Us Leu Cis Ala Thr Tir Lis leu Cis Lis Pro Glu Glu leu 35 40 45 Vai Leu Leu Gli His Ser Leu Gli lie Pro Tip Ala Pio Leu Ser Ser 50 55 60 Cis Pio Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu Leu Gin Ala Leu Glu Gli lie 85 90 95 Ser Pio Glu Leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr He Trp Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala leu Gin IV) Thr Gin Gli Ala Met Pio Ala Phe Ala Ser Ala 130 135 140 Plie Gin Arg Arg Ala Gli Gli Vai Leu Vai Ala Ser His leu Gin Ser 145 150 155 160 Phe ÍjCLI Glu Vai Ser Tir Arg Vai Leu Arg 1 lis leu Ala Gin Pio 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:85: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 85:
Met Thr Pio Lai Gli Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu 1 5 10 15 lis Cis Lai Glu Gin Vai Aib Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Ala Leu 35 40 45 Vai Lai Leu Gli His Ser Leu Gli lie Pio Tip Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Lai Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tír Gin Gli Leu Ioj Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Tip Gin Gin Met Glu Glu Leu Gli Md Ala 115 120 125 Pro Ala Leu Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Aib Aib Ala Gli Gli Vai Leu Vai Ala Ser His luai Gin Ser 145 150 155 160 Phe Lai Glu Vai Ser Tir Aib Vai I^eu Aib ITis Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:86 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 86:
Met Thr Pro Leu Gli Pro Ala Ser Ser Leu Pro Gin Ser Plie Lai Lo.i 1 5 10 15 Us Cis Leu Glu Gin Vai Ala Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Lai Cis Ala Ότι- Tir lis Lai Cis His Pio Glu Glu Lai 35 40 45
Vai Leu Leu Gli Mis Ser Leu Gli Ile Pro Τφ Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gln Ala Leu Gln Leu Ala Gli Cis I-eu Ser Gln Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gln Gli Leu Leu Gln Ala Leu Glu Gli Ile 85 90 95 Ser Pro Glu I^eu Gli Pro Thr I^eu Asp Thr Leu Gln Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ile Τφ Gln Gln Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala [-eu Gln Pio Thr Gln Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Aig Arg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gln Ser 145 150 155 160 Phe I^eu Glu Vai Ser Tir Arg Vai Leu Arg His Leu Ala Gln Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA IDN0 87: d) < CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TI ÍPO: aminoácido (D) Ti ΟΡΟΙ -OGIA: : linear («<)' T IPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA SEQ ID NO:87: Met ΊΤιτ Pio Leu Gli Pio Ala Ser Ser Ixu Pro Gln Ser Plie Leu Leu 1 5 10 15 Lis Cis Leu Glu Gln Vai Arg Ala lie Gln Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu 1 is Leu Cis Ala Thr Tir Lis l-eu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Leu Gli lTis Ser Leu Gli Ile Pro Tip Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gln Ala Leu Gln I-eu Ala Gli Cis Ιλχι Ser Gln Leu His 65 70 75 80 Sei' Gli Lai Phe Leu Tir Gln Gli Leu Leu Gln Ala Leu Glu Ga lie 85 90 95 y
Ser Pro Glu leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ile Tip Gin Gin Met Glu Glu Leu Gli Ma Ala 115 120 125 Pio Ala Leu Gln Pro Thr Gin Gli Ala Ma Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Aig Ala Gli Gli Vai Lai Vai Ala Ser His Lai Gin Sa 145 150 155 160 Phe Lai Glu Vai Ser Tir Arg Vai leu Aig His Ijeu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:88: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 88:
Ma Thr Pio Leu Gli Pro Ala Sa Sa Lai Pro Gin Sa Phe Lai Lai 1 5 10 15 Lis Cis Leu Ala Gin Vai Aig lis Ile Gin Gli Asp Gli Ala Ala Ijeu 20 25 30 Gin Glu Lis Leu Cis Ala Tir Lis Leu Cis His Pio Glu Glu Lai 35 40 45 Vai Leu leu Gli His Sa Ijeu Gli Ile Pio Τφ Ala Pro Leu Sa Sa 50 55 60 Cis Pro Sa Gin Ala Leu Gin Leu Ala Gli Cis Lai Sa Gin Lai His 65 70 75 80 Ser Gli Lai Phe Leu Tir Gin Gli Lai Leu Gin Ala Lai Glu Gli Ile 85 90 95 Sa Pro Glu leu Gli Pio Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Τφ Gin Gin Ma Glu Glu Leu Gli Ma Ala 115 120 125 Pro Ala Leu Gin Pio Thr Gin Gli Ala Ma Pio Ala Phe Ala Sa Ala 130 135 140
Phe 145 Gin Aig Arg Ala Phe Leu Glu Vai Ser 165 Gli Gli 150 Tír Arg Vai
Vai Leu Leu Vai Ala 155 Ser His Leu Gin Aig 170 His Leu Ala Gin Pro 175 Ser 160 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO:89: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 89:
Met rnir Pio Leil Gli Pro Ala Ser Ser leu Pio Gin Ser Phe leu leu 1 5 10 15 lis Cis Leu Glu Gin Vai Aig LLs Ile Gin Gli Ala Gli Ala Ala Leu 20 25 30 Gin Glu Lis leu Cis Ala ITir Tir Lis Leu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu leu Gli Ffis Ser leu Gli Ile Pro Τφ Ala Pro Leu Ser Ser 50 55 60 Cis fto Ser Gin Ala leu Gin l.eu Ala Gli Cis Leu Ser Gin leu His 65 70 75 80 Sa' Gli Leu Phe leu lir Gin Gli leu Leu Gin Ala leu Glu Gli Ile 85 90 95 Se· Pro Glu leu Gli Pro Thr Leu Asp Thr Leu Gin leu Asp Vai Ala 1(X) 105 110 Asp Phe Ala Thr rFhr lie Τφ Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala Leu Gin Pro ΊΙττ Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Aig Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Plie Leu Glu Vai Se Tir Aig Vai Leu Arg His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA IDNO:90. (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO.90:
Met Thr Pro Leu Gli Pro Ala Ser Sa Leu Pro Gin Ser Phe Leu Leu 1 5 10 15 lis Cis Leu Glu Gin Vai Aijg lis lie Gin Gli Asp Gli Ala Ala Lai 20 25 30 Gin Glu lis Leu Cis Ala Thr Tir Lis Lai Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Lai Gli His Sct Leu Gli He Pro Tip Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe Lai Tir Gin Gli Leu Lai Gin Ala Leu Glu Gli He S5 90 95 Ser Pro Glu Leu Gli 1¼) Thr Ijeu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Trp Gin Gin Met Glu Glu Leu Gli Glu Ala 115 120 125 \\o Ala Leu Gin Pro Thr Gin Gli Ala Ma Pio Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Atg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Arg Vai Lai Aig His Lai Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO:91: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido
(D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ 1D N0.9I:
Met Thr Pro Leu Gli Pro Ala Ser Ser Leu Pro Gin Ser Plie Leu Leu 1 5 10 15 lis Cis leu Glu Gin Vai Aig Lis lie Gin Gli Asp Gli Ala Ala leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir lis Leu Cis His Pro Glu Glu leu 35 40 45 Vai Lai leu Gli His Ser Lai Gli lie Pro Τφ Ala Pro Leu Ser Sa 50 55 60 Cis Pro Ser Gin Ala 1.01 Gin Leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser GD Leu Plie Leu Tir Gin Gli leu Leu Gin Ala Leu Glu Gli Ile 85 90 95 Sei' Pro Glu Ixu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Plie Ala Thr Thr Ile Τφ Gin Gin Ma Glu Glu Leu Gli Ma Ala 115 120 125 IVo Ala Leu Gin Pro Thr Gin Gli Ala Glu Pro Ala Phe Ala Sa Ala 130 135 140 Phe Gin Αικ Aig Ala Gli Gli Vai Leu Vai Ala Sei' His Leu Gin Sa 145 150 155 160 Phe Ijeu Glu Vai Ser Tir Arg Vai Leu Al£ His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D N0 92: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 92:
Met Thr Pro Leu Gli Do Ala Ser Ser Leu Pro Gin Ser Plie Ijeu Leu 1 5 10 15 Lis Cis Leu Glu Gin Vai Aig lis lie Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu lis Leu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Glu Leu 35 40 45 Vai l^eu Leu Gli His Ser Leu Gli Ile Pro Tip Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe l^eu Tir Gin Gli Leu l^eu Gin Ala Ijeu Glu Gli lie 85 90 95 Ser Do Glu Leu Gli Pro Thr l.jeu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Plie Ala Tlir Thr fle Τφ Gin Gin Met Glu Glu Leu Gli I^eu Ala 115 120 125 Pro Ala Lxxi Gin Do Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Arg’ Vai Leu Arg His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D N0 93: 0)' CARACTERTST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B)TI IPO: ! aminoácido (D)TOPOLOGIA : linear TIPO DE MOLÉCULA proteína (x i) DESCRIÇÃO 1 DA SEQUÊNCIA: SEQ ID N0 93: Met Thr Pro Leu Gli Do . Ala Ser Ser Leu Do Gin Ser Phe Leu Leu 1 5 10 15 lis Cis Leu Glu Gin Vai Arg Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Lis Leu Cis His Do Glu Glu Leu 35 40 45 125 Vai Leu Lxu Gli Mis Ser Ijeu Gli Ile Pro Trp Ala Pro Leu Sa Sa 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Ijeu Sa Gin Ijeu His 65 * 70 75 80 Ser Gli lai Phe Leu Tir Gin Gli Ijèu Leu Gin Ala Leu Glu Gli Ile 85 90 95 Sa Pro Glu lai Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ile Tip Gin Gin Met Glu Glu Leu Gli Met Ala 115 120 125 Pro Ala Leu Gln Pro Thr Gin Gli Ala Leu 1¾ Ala Phe Ala Sa Ala 130 135 140 Plie Gin Aig Arg Ala Gli Gli Vai Lai Vai Ala Sa His Lai Gin Sa 145 150 155 160 Phe lai Glu Vai Ser Tir Aig Vai Leu Arg His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID Ν0 94: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: s iminoácido (D) TOPOLOGIA : linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:94: Met rlhr 1*10 Leu Gli 1¾) Ala Sa Sa Ijeu Pro Gin Sa Phe Leu Ijeu 1 5 10 15 lis Ala Leu Glu Gin Vai Arg Lis Ile Gin Gli Asp Gli Ala Ala Lai 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Lis leu Cis His Pro Glu Glu Leu 35 40 45 Vai Ijeu Leu Gli Hs Sa Ijeu Gli lie Pro Trp Ala Pio Ijeu Sa Sa 50 55 60 Cis Pro Ser Gin Ala Ijeu Gin Leu Ala Gli Cis Leu Sa Gin lai His 65 70 75 80 Ser Gli Ijeu Phe Ijeu Tir Gin Gli Lai Lai Gin Ala Lai Glu Gli Ile 85 90 95
Ser Pio Glu Leu Gli Pro Tlir Leu Asp Thr Leu Gin Leu Asp Val Ala 100 105 110 Asp Phe Ala Thr Thr Ile T.p Gin Gin Ma Glu Glu Lai Gli Ma Ala 115 120 125 Pro Ala Ijeu Qn Pro Thr Qn Gli Ala Ma Pio Ala Phe Ala Sa Ala 130 135 140 Phe Gin Aig Arg Ala Gli Gli Vai Leu Val Ala Sa His Lai Gin Sa 145 150 155 160 Phe Lai Glu Vai Ser Tir Arg Vai Leu Aig His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 95:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:95:
Ma Thr Pro Leu Gli Pro Ala Sa Sa Leu Pro Glu Sa Phe Lai Lai 1 5 10 15 Us Cis- Leu Glu Glu Val Arg Us Ile GIn Gli Asp Gli Ala Ala Leu 20 25 30 Qn Glu I is Lai Cis Ala Thr Tir Us Leu Cis His Pro Glu Glu Leu 35 40 45 Val Leu Leu Gli His Sa Ioj Gli lie Pio Tip Ala Pro Leu Sa Sa 50 55 60 Cis Pio Sa Gin Ala Leu Gin Leu Ala Gli Cis Lai Sa GIn Loj His 65 70 75 80 Sa Gli I.ai Phe Leu Tir Gin Gli Leu Leu GIn Ala Ioj Glu Gli Ile 85 90 95 Sa' Pio Glu Leu Gli Pro Thr Lai Asp Tlir lo.i GIn Lai Asp Val Ala 100 105 110 Asp Phe Ala Thr Thr Ile Tip Gin GIn Ma Glu Glu Lai Gli Ma Ala 115 120 125 Pio Ala IjíU Gin Pro Ihr Gin Gli Ala Ma Pio Ala Phe Ala Sa- Ala 130 135 140
127
Phe 145 Gin Arg Arg Ala Gli 150 Gli Vai Leu Vai Ala 155 Ser His Ljai Gin Plie Lai Glu Vai Ser 165 Tir Arg Vai Lai Arg 170 1 lis loi Ala Gin PlO 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 96: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 96:
Met Thr Pro loi Gli Pro Ala Sa Sa loi Pro Glu Sa" Phe Loi Leu 1 5 10 15 lis Cis loi Glu Glu Vai Arg Lis lie Gin Gli Asp Gli Ala Ala Loi 20 25 30 Gin Glu Lis 1.04 Cis Ala Thr Tir Lis loi Cis His Pro Glu Glu Leu 35 40 45 Vai leu loi Gli His Sa I 04 Gli lie Pro Trp Ala lho Leu Sa Sa 50 55 60 Cis Ro Ser Glu Ala Leu Gin Lai Ala Gli Cis loi Sa Gin loi His 65 70 75 80 Sa Gli 1.04 Plie Ιθ4 Tir Gin Gli loi Loi Gin Ala loi Glu Gli lie 85 90 95 Sa Pro Glu Leu Gli Pro TTir Lai Asp Th- Leu Gin Leu Asp Val Ala 100 105 110 Asp Phe Ala Thr Thr lie Trp Gin Gin Μα Glu Glu Leu Gli Ma Ala 115 120 125 Pro Ala Leu Gin Pio Thr Gin Gli Ala Ma Pro Ala Phe Ala Sa Ala 130 135 140 Plie Gin Arg Arg Ala Gli Gli Vai Leu Val Ala Sa His Lai Gin Sa 145 150 155 160 Plie loi Glu Vai Sa Tir Arg Vai loi Arg His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 97: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUENCIA: SEQ ID N0 97:
Met Thr Pro Leu Gli l^ro Ala Ser Ser Leu Pro Gin Gli Plie Leu Leu 1 5 10 15 Lis Cis Leu Ala Gin Vai Arg Us Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Us Leu Cis His 1¾) Glu Glu Leu 35 40 45 Vai Leu l^eu Gli His Ser Leu Gli Ile Pro Tip Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Lai Ala Gli Cis Leu Ser Gin Lai His 65 70 75 80 Ser Gli I_Oi Phe Leu Tir Gin Gli Lai Lai Gin Ala L>ai Glu Gli Ile 85 90 95 Ser Pro Glu Ιαι Gli Pro Thr lai Asp Thr Lai Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr Ile T.p Gin Gin Met Glu Glu I^eu Gli Ma Ala 115 120 125 Pro Ala I^eu Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Ur Aig Vai Leu Arg His leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID N0 98: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO:98:
Met Thr Pró Leu Gli Pro Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu 1 5 10 15 Lis Cis Leu Glu Gin Vai Arg Lis lie Gin Gli Asp Qi Ala Ala leu 20 25 30 Gin Glu IJs Leu Cis Ala Lhr Tir Lis Leu Cis His Pro Glu Glu Leu 35 40 45 Vai leu Leu Gli His Ser Leu Gli He Pro T.p Ala Pro leu Ser Ser 50 55 60 Cis Pio Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli leu Phe Leu Tir Gin Gli Leu Leu Gin Ala leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli ho ΊΠττ Leu Asp 'ITir leu Gin Leu Asp Vai Ala 100 105 110 Asp Plie Ala nir Thr Ile Trp Gin Gin Mel Glu Glu leu Gli leu Ala 115 120 125 Pro Ala leu Gin Pro Thr Gin Gli Ala Leu Pro Ala Phe Ala Ser Ala 130 135 140 Plie Gin Aib Aib Ala Gli Gli Vai Leu Vai Ala Sei' His leu Gin Ser 145 150 155 160 Plie Leu Glu Vai Ser Tir EP < Vai Leu Aib His Ijeu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO:99: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N0 99: 130
Met Thr Pro Leu Gli Pro Ala Sa Sa Leu Pro Gin Ala Phe Leu Leu 1 5 10 15 lis Cis Leu Glu Gin Vai Arg Lis lie Gin Gli Asp Gli Ala Ala Lai 20 25 30 Gin Glu lis l£u Cis Ala Thr Tir lis Lai Cis His Pro Glu Glu Leu 35 40 45 Vai Lai L^u Gli Mis Sa Lai Gli He Pro Τφ Ala Pio Lai Sa Sa 50 55 60 Cis Pro Sa' Gin Ala Lai Gin Leu Ala Gli Cis Lai Sa Gin Lai His 65 70 75 80 Ser Gli Ijeu Phe Leu Tír Gin Gli Lai Lai Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu [jai Gli Pro rFhr Leu Asp Thr Leu Gin lau Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Τφ Gin Gin Met Glu Glu Leu Gli Ma Ala 115 120 125 Pro Ala Leu Gin Pro Thr Gin Gli Ala Ma Pro Ala Phe Ala Sa Ala 130 135 140 Plie Gin Aig Arg Ala Gli Gli Vai Leu Vai Ala Sa His Leu Gin Sa 145 150 155 160 Phe Lai Glu Vai Ser Tir Arg Vai Leu Aig Mis Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO: 100: (*)' CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D)TOPOLOGIA : linear (ii)' TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 100: Met Thr Pro Leu Gli Pro Ala Sa Sa Lai IVo Gin Sa Plie Lai Leu 1 5 10 15 Ala Cis Lai Glu Gin Vai Arg Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Lai Cis Ala Thr Tir Lis Lai Cis His IYo Glu Glu Lai 35 40 45
Vai Leu Leu Gli His Sei' Leu Gli Ile Pro Trp Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin ljeu Ala Gli Cis Leu Ser Gin Leu His 65 70 75 80 Ser Gli Leu Phe leu Tir Gin Gli Leu Leu Gin Ala Leu Glu Qi lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp Thr Lai Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Trp Gin Gin Met Glu Glu Leu Gli Md Ala 115 120 125 Pro Ala Leu Gin Pio Thr Gin Gli Ala Md Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Aíg Arg Ala Gli Gli Vai Leu Vai Ala Ser His Lai Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Arg Vai Leu Aig His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 101 (i)< CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: í aminoácido (D) TOPOI OGIA : linear (ii)' TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 101: Mel Thr Pro leu Gli 1¼) Ala Ser Ser Leu Pro Gin Ser Phe leu Leu 1 5 10 15 Lis Cis Leu Glu Gin Vai Aig Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Leu Gli Flis Ser ljeu Gli lie Pro TiP Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala leu Gin l^eu Ala Gli Cis Leu Ser Gin leu ITis 65 70 75 80 Ser Gli Leu Phe I_£U Tir Gin Gli Leu ljeu Gin Ala leu Glu Gli lie 85 90 95
131 /7^ 'ÉS ér' & 132
Ser Pro Glu Leu Gli Pro Thr leu Asp Thr leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Τφ Gin Ala Md GHu Glu Leu Gli Md Ala 115 120 125 Pro Ala Leu Gin Pro Thr Gin Gli Ala Md Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arç> Arg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Αφ Vai Leu Αφ His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO: 102: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO. 102: Mel Thr Pro Leu Gli Pro Ala Ser Ser leu Pro Gin Ser Phe leu leu 1 5 10 15 Ljs Cis leu Glu Ala Vai Arg Us ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu lis leu Cis Ala Thr Tir Lis Leu Cis His Pio Glu Glu Leu 35 40 45 Vai Leu leu Gli His Ser leu Gli Ile Pro Τφ Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis leu Ser Gin leu His 65 70 75 80 Ser Gli Leu Phe leu Tir Gin Gli Leu Leu Gin Ala Leu Glu Gli Ile 85 90 95 Ser Pro Glu Leu Gli Pio Tlir leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Plie Ala Thr Thr Ile Τφ Gin Gin Md Glu Glu Leu Gli Md Ala 115 120 125 Pro Ala Leu Gln Pro Thr Gin Gli Ala Md Pio Ala Pite Ala Ser Ala 130 135 140
Phe 145 Gin Aig Aig Ala Gli 150 Gli Vai Leu Vai Ala 155 Ser His Lai Gin Phe Leu Glu Vai Ser 165 Tir Arg Vai Leu Aig 170 His leu Ala Gin l>ro 175
(2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 103: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 103:
Md: Tlir Pro Leu Gli Pro Ala Sd Sd leu Pro Gin Sd' Phe Leu 1X34 1 5 10 15 lis Cis Leu Glu Gin Vai Aig lis lie Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Lis Lai Cis Ala Pro Glu Glu leu 35 40 45 Vai I xxi IjCU Gli Mis Ser leu Gli Ile Pro Trp Ala Pio Leu Sd Sd 50 55 60 Cis 1*10 Ser Gin Ala leu Gin leu Ala Gli Cis Leu Sd Gin Lxu His 65 70 75 80 Ser Gli Leu Phe leu Tir Gin Gli leu Leu Gin Ala Leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp Thr ÍX3J Gin Lai Asp Vai Ala 100 105 110 Asp Plie Ala Thr Thr lie Τφ Gin Gin Md Glu Glu Leu Gli Md Ala 115 120 125 Pro Ala Leu Gln Pio Thr Gin Gli Ala Md Pro Ala Plie Ala Sd Ala 130 135 140 Phe Gin Arg Aig Ala Gli Gli Vai leu Vai Ala Sd His Leu Gin Sd 145 150 155 160 Plie Lxu Glu Vai Ser Tir Aig Vai lxu Aig His leu Ala Gin Pro 165 - 170 175 / d
•\V (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 104: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 104:
Met TTir Pro Leu Gli Pio Ala Ser Ser leu Pio Gin Ser Phe leu Leu I 5 10 15 lis Cis Leu Glu Gin Vai Arg lis lie Gin Gli Asp Qi Ala Ala leu 20 25 30 Gin Glu lis Leu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Glu Leu 35 40 45 Vai Leu Leu Gli Ala Ser Leu Gli He Pio ΤΦ Ala Pro Lai Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu Leu Gin Ala leu Glu Gli lie 85 90 95 Ser Pro Glu Leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Tip Gin Gin Met Glu Glu leu Gli Met Ala 115 120 125 Pio Ala Leu Gin Pro Thr Gin Gli Ala Met Pio Ala Phe Ala Ser Ala 130 135 140 Phe Gin Aig Aig Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Aie Vai Leu Arg His leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 105: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 105:
Met ΊΊιγ Pró Leu Gli Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu leu .1 5 10 15 Lis Cis Leu Glu Gin Vai Aig Us lie Gln Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir lis Leii Cis His Pio Glu Glu leu 35 40 45 Vai Leu Leu Gli His Ser Leu Gli Ile Pro Τφ Ala Pro leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gln Leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu Leu Gln Ala Leu Glu Gli Ile 85 90 95 Ser Pio Glu Leu Gli Pro Thr Leu Asp Thr Leu Gln Leu Ala Vai Ala 100 105 110. Asp Phe Ala Thr Thr Πε Tip Gln Gln Mel Glu Glu leu Gli Met Ala 115 120 125 Pio Ala leu Gin Pro Thr Gln Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe C.ln Aig Arg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gln Ser 145 150 155 160 Phe Leu Glu Vai Ser Tir Aig Vai Leu Arg His Leu Ala Gln Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 106: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 106: 7</ A 136
Met 1 Thr Pro Leu lis Cis Leu Glu 20 Gin Glu Lis Leu 35 Vai Leu Leu Gli 50 Cis Pro Ser Gin 65 Ser Gli Leu Phe Ser Pio Glu Leu 100 Ala Phe Ala Thr 115 Pro Ala leu Gin 130 Pite Gin Arg Arg 145 Phe Leu Glu Vai
Gli 5 Pro Ala Ser Gin Vai Aig Lis Cis Ala Thr Tir 40 His Ser Leu 55 Gli Ala Leu 70 Gin Leu Leu 85 Tir Gin Gli Gli Pio Thr Leu Thr lie Tip Gin 120 Pro Thr Gin 135 Gli Ala Gli 150 Gli Vai Ser 165 Tir Arg Vai
Ser Leu 10 Pro Gin He Gin Gli Asp 25 Lis Leu Cis His lie Pro Τφ Ala 60 Ala Gli Cis 75 Leu leu leu 90 Gin Ala Asp Thr leu Gin 105 Gin Met Glu Glu Ala Met Pro Ala 140 Leu Vai Ala 155 Ser Leu Arg 170 His leu
Ser Phe leu 15 Leu Gli Ala 30 Ala leu Pro Glu Glu Leu 45 Pio Leu Ser Ser Ser Gin Leu His 80 Leu Glu Gli 95 lie leu Asp 110 Vai Ala Leu Gli Md Ala 125 Plie Ala Ser Ala His Leu Gin Ser 160 Ala Gin Pro 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO: 107: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ 1D NO: 107:
Met 1 Thr Pro Leu Lis Cis Leu Glu 20 Gin Glu lis leu 35
Gli Pro Ala Sei 5 Gin Vai Arg lis Cis Ala Tlir Tir 40
Ser Leu 10 Pro Gin lie 25 Gin Gli Asp Lis Leu Cis His
Ser Phe leu 15 Leu Gli Ala 30 Ala Leu Pro 45 Glu Glu Leu
137
Vai Leu Leu Gli His Ser Leu Gli lie Pro Tip Ala Pro Leu Sa Sa' 50 55 60 Cis Pro Ser Gin Ala Leu Gin leu Ala Gli Cis Leu Sa Gin leu His 65 70 75 80 Ser Gli Leu Phe Leu Tir Gin Gli Leu Leu Qn Ala Leu Glu Gli lie 85 90 95 Sa Pro Glu leu Gli Pro Thr Lai Asp Thr Leu Gin Leu Asp Val Ala 100 105 110 Asp Phe Ala Thr Ala lie Tip Gin Gin Met Glu Glu Leu Gli Ma Ala 115 120 125 Pro Ala Leu Gin Pio Tlir Gin Gli Ala Ma Pio Ala Phe Ala Sa Ala 130 135 140 Plie Gin Aig Arg Ala Gli Gli Vai Leu Val Ala Sa His leu Gin Sa 145 150 155 160 Phe Leu Glu Vai Ser Tir Aq> Vai Leu Arg His Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO: 108: (i) CARACTERÍST1CAS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 108:
Ma Ilir ho Leu Gli Pro Ala Sa' Ser Leu Pro Gin Sa Phe Leu Leu 1 5 10 15 Lis Cis leu Glu Gin Val Arg Lis lle Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis leu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Glu Leu 35 40 45 Val leu leu Gli His Sa leu Gli lie Pro ΤΦ Ala Pro Leu Sa Sa 50 55 60 Cis Pio Sa Gin Ala Leu Gin Leu Ala Gli Cis Leu Sa Gin Leu His 65 70 75 80 Sa- Gli Leu Phe Leu Tir Gin Gli Leu Leu Gin Ala Leu Glu Gli Ile 85 90 95
Ser Pio Glu leu Gli Pro Thr Leu Asp Or Leu Gin Ijeu Ala Vai Ala 100 105 110 Asp Phe Ala Thr Thr lie Trp Gin Gin Met Glu Glu Leu Gli M et Ala 115 120 125 Pro Ala Leu Gin Pro Thr Gin Gli Ala Met Pro Ala Phe Ala Ser Ala 130 135 140 Phe Gin Arg Arg Ala Gli Gli Vai Leu Vai Ala Ser His Leu Gin Ser 145 150 155 160 Phe leu Glu Vai Ser Tir Arg Vai Leu Arg Hís Leu Ala Gin Pro 165 170 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA ID NO 109 (i) C ARACTERÍ STIC AS DA SEQUÊNCIA: (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 109:
Met Thr Pro Leu Gli Pio Ala Ser Ser Leu Pro Gin Ser Phe Leu Leu 1 5 10 15 lis Cis Leu Glu Gin Vai Arg Lis Ile Gin Gli Asp Gli Ala Ala Leu 20 25 30 Gin Glu Lis Leu Cis Ala Thr Tir Lis Leu Cis His Pro Glu Glu Lar 35 40 45 Vai Leu Leu Gli His Ser Leu Gli Ile Pio Trp Ala Pro Leu Ser Ser 50 55 60 Cis Pro Ser Gin Ala Leu Gin Leu Ala Gli Cis Leu Ser Gin Leu Hís 65 70 75 80 Sei' Gli leu Phe Leu Tir Gin Gli Leu Leu Gin Ala I_eu Glu Gli Ile 85 90 95 Ser Pio Glu Leu Gli Pro Thr Leu Asp Thr Leu Gin Leu Asp Vai Ala 100 105 110 Asp Plie Ala ITu Thr lie Tip Gin Gin Md Glu Ala leu Gli Md Ala 115 120 125
Pio Ala 130 Leu Gin 1¾ Thr Gin 135 Gli Ala Met Pro Ala 140 Phe Ala Ser Ala Phe 145 Gin Arg Arg Ala Gli 150 Gli Vai Leu Vai Ala 155 Ser His Leu Gin Ser 160 Phe Leu Glu Vai Ser 165 Tir Arg Vai Leu Arg 170 His Leu Ala Gin Pro 175 (2) INFORMAÇÃO PARA A SEQUÊNCIA 1D NO: 110:
(i) CARACTERÍSTICAS DA SEQUÊNCIA (A) COMPRIMENTO: 175 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID NO: 1 10:
Met Thr Pro Lai Gli Ho Ala Ser Sa Lai Ho Gin Sa Phe Leu Lai l 5 10 15 Lis Cis Leu Glu Gin Vai Arg Lis Ile Gin Gli Asp Gli Ala Ala Lai 20 25 30 Gin Glu lis Lai Cis Ala Thr Tir Lis Lai Cis His Pro Glu Glu lai 35 40 45 Vai Lai Lai Gli His Ser Lai Gli Ile Pro Trp Ala Pro Leu Sa Sa 50 55 60 Cis Pro Ser Gin Ala lai Gin Lai Ala Gli Cis Lai Sa Gin Leu l-lis 65 70 75 80 Ser Gli Lai Phe Leu Tir Gin Gli Lai Leu Gin Ala Lai Glu Gli Ile 85 90 95 Ser Pro Glu Lai Gli Pro Thr Leu Asp Thr Lai Gin Leu Asp Vai Ala 100 105 110 Asp Vai Ala Thr Ala Ile Trp Gin Gin Met Glu Glu Lai Gli Met Ala 115 120 125 Pro Ala Lai Gin Pro Thr Gin Gli Ala Met Pro Ala Plie Ala Sa Ala 130 135 140 140
Phe 145 Gin Arg Arg Ala Gli 150 Gli Vai Leu Vai Ala 155 Ser His Leu Gin Phe Leu Glu Vai Ser 165 Tir Aig Vai L£U Aig 170 His Leu Ala Gin Pio 175
Lisboa, 12 de Outubro de 2000

Claims (3)

  1. Reivindicações 1. Método para a preparação de um análogo de FEC-G, o qual compreende os passos seguintes: (a) examinar ao nível atómico ou dos aminoácidos a informação que toma conhecida a estrutura tridimensional de uma molécula de FEC-G, tal como explicitado na figura 5; (b) seleccionar entre essa informação examinada pelo menos um local da referida molécula de FEC-G para alteração; (c) preparar uma molécula de FEC-G que possua tal alteração; e (d) testar facultativamente tal molécula de FEC-G para pesquisar uma característica desejada.
  2. 2. Método para a preparação de um análogo de FEC-G de acordo com a reivindicação 1, recomendo para isso ao auxilio de um computador, o qual compreende os passos seguintes: (a) obter expressão informática ao nível atómico ou dos aminoácidos da estrutura tridimensional de uma molécula de FEC-G, tal como explicitado na figura 5; (b) seleccionar entre essa expressão informática pelo menos um local da referida molécula de FEC-G para alteração; (c) preparar uma molécula de FEC-G que possua tal alteração; e (d) testar facultativamente tal molécula de FEC-G para pesquisar uma característica desejada.
  3. 3. Método para a preparação de um análogo de FEC-G de acordo com a reivindicação 2, o qual compreende os passos seguintes:
    (a) dotar o computador utilizado com meios que permitam visualizar a estrutura tridimensional de uma molécula de FEC-G, incluindo a apresentação de imagens da composição dos radicais da referida molécula de FEC-G, mostrando de preferência a localização tridimensional de cada aminoácido e mais preferencialmente mostrando a localização tridimensional de cada átomo de uma molécula de FEC-G; (b) examinar as referidas imagens; (c) seleccionar o local dessas imagens para alteração da composição da referida molécula ou da localização de um radical; e (d) preparar um análogo de FEC-G com tal alteração. Método auxiliado por computador para a preparação de um análogo de FEC-G de acordo com a reivindicação, o qual compreende os passos seguintes: (a) examinar ao nível atómico ou dos aminoácidos a estrutura tridimensional de uma molécula de FEC-G, tal como ilustrado na figura 5, por meio de um computador, em que esse computador foi previamente programado (i) para exprimir as coordenadas de uma molécula de FEC-G no espaço tridimensional e (ii) para permitir a entrada de informação para alteração da referida expressão da molécula de I EC-G e para a observar; (b) escolher um local na referida imagem visual dessa molécula de FEC-G para alteração; (c) introduzir no referido computador a informação para essa alteração; (d) examinar a estrutura tridimensional da referida molécula alterada de FEC-G por meio do referido computador; (e) repetir facultativamente os passos (a) - (e) enunciados antes; (I) preparar um análogo de FEC-G com a referida alteração; e 3 (g) testar facullalivamente o referido análogo de FEC-G para pesquisa de uma característica desejada. Lisboa, 12 de Outubro de 2000
    1 Resumo “Composições de análogos do FEC-G e métodos” A invenção proporciona análogos do factor estimulador das colónias de granulócitos (“FEC-G”), as composições que contêm tais análogos e composições congéneres. De acordo com outro dos seus aspectos, a invenção proporciona ácidos nucleicos que codificam os análogos da presente invenção ou ácidos nucleicos congéneres e células hospedeiras e vectores afins. Ainda de acordo com outro dos seus aspectos, a invenção proporciona programas informáticos e aparelhos para exprimir a estrutura tridimensional do FEC-G e dos seus análogos. Ainda de acordo com outro aspecto, a invenção proporciona métodos para conceber e projectar de fonna racional análogos de FEC-G e composições congéneres. Ainda de acordo com outro dos seus aspectos, a invenção proporciona métodos de tratamento em que são utilizados os análogos de FEC-Çi da preseqte iqvenção. Lisboa, 12 de Outubro dè 2000
PT94400259T 1993-02-15 1994-02-08 Dispositivo de regeneracao de ar num recinto fechado PT611584E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR9301677A FR2701547B1 (fr) 1993-02-15 1993-02-15 Dispositif de régénération de l'air dans une enceinte fermée.

Publications (1)

Publication Number Publication Date
PT611584E true PT611584E (pt) 2001-01-31

Family

ID=9444064

Family Applications (1)

Application Number Title Priority Date Filing Date
PT94400259T PT611584E (pt) 1993-02-15 1994-02-08 Dispositivo de regeneracao de ar num recinto fechado

Country Status (6)

Country Link
EP (1) EP0611584B1 (pt)
CA (1) CA2115632C (pt)
DE (1) DE69425596T2 (pt)
ES (1) ES2149848T3 (pt)
FR (1) FR2701547B1 (pt)
PT (1) PT611584E (pt)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102720531A (zh) * 2012-07-02 2012-10-10 北京科技大学 一种适用于矿山避难硐室的制冷除湿系统和方法
RU2499622C1 (ru) * 2012-08-30 2013-11-27 Военный институт (военно-морской политехнический) федерального государственного казенного военного образовательного учреждения высшего профессионального образования "Военный учебно-научный центр Военно-Морского Флота "Военно-морская академия имени Адмирала Флота Советского Союза Н.Г. Кузнецова" Способ контроля степени отработки электролита в системах электрохимической регенерации воздуха совмещенного типа подводных лодок

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3775976A (en) * 1972-05-26 1973-12-04 Us Navy Lox heat sink system for underwater thermal propulsion system
FR2209597A1 (en) * 1972-12-08 1974-07-05 Comp Generale Electricite Electrolytic separator of carbon dioxide from oxygen - to purify air for re-use in submarines etc.
JPS572678A (en) * 1980-06-06 1982-01-08 Hitachi Ltd Device for aerated cultivation
DE3235564A1 (de) * 1982-09-25 1984-04-26 Messerschmitt-Bölkow-Blohm GmbH, 8012 Ottobrunn Vorrichtung zum abschneiden von kohlendioxid aus der raumluft
IT1223213B (it) * 1987-12-04 1990-09-19 Tecnomare Spa Sistema per il trattamento e lo stoccaggio criogenici dei prodotti di combustione di motori termici

Also Published As

Publication number Publication date
CA2115632C (fr) 2005-05-10
EP0611584A1 (fr) 1994-08-24
ES2149848T3 (es) 2000-11-16
FR2701547B1 (fr) 1995-03-31
DE69425596T2 (de) 2001-01-04
DE69425596D1 (de) 2000-09-28
FR2701547A1 (fr) 1994-08-19
CA2115632A1 (fr) 1994-08-16
EP0611584B1 (fr) 2000-08-23

Similar Documents

Publication Publication Date Title
PT612846E (pt) Composicoes de analogos do fec-g e metodos
PT611584E (pt) Dispositivo de regeneracao de ar num recinto fechado
AU724260B2 (en) G-CSF analog compositions
AU2011201971B2 (en) G-CSF analog compositions
AU3515001A (en) G-CSF analog compositions
AU2012201071A1 (en) G-CSF analog compositions