PT85148B - Processo para a obtencao de variantes, do virus lav e de compostos proteicos, assim como as suas aplicacoes - Google Patents

Processo para a obtencao de variantes, do virus lav e de compostos proteicos, assim como as suas aplicacoes Download PDF

Info

Publication number
PT85148B
PT85148B PT85148A PT8514887A PT85148B PT 85148 B PT85148 B PT 85148B PT 85148 A PT85148 A PT 85148A PT 8514887 A PT8514887 A PT 8514887A PT 85148 B PT85148 B PT 85148B
Authority
PT
Portugal
Prior art keywords
quot
xxx xxx
lav
virus
cdna
Prior art date
Application number
PT85148A
Other languages
English (en)
Other versions
PT85148A (en
Inventor
Luc Montagnier
Marc Alizon
Pierre Sonigo
Simon Wain-Hobson
Original Assignee
Pasteur Institut
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pasteur Institut filed Critical Pasteur Institut
Publication of PT85148A publication Critical patent/PT85148A/pt
Publication of PT85148B publication Critical patent/PT85148B/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/702Specific hybridization probes for retroviruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/70Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving virus or bacteriophage
    • C12Q1/701Specific hybridization probes
    • C12Q1/702Specific hybridization probes for retroviruses
    • C12Q1/703Viruses associated with AIDS
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56983Viruses
    • G01N33/56988HIV or HTLV
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16021Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16051Methods of production or purification of viral material

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Virology (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Medicinal Chemistry (AREA)
  • AIDS & HIV (AREA)
  • Biophysics (AREA)
  • Urology & Nephrology (AREA)
  • Food Science & Technology (AREA)
  • Cell Biology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Description

I
ί
INSTITUT PASTEUR "PROCESSO PARA A OBTENÇÃO DE VARIANTES DO VlRUS LAV E DE COMPOSTOS PROTEICOS,ASSIM COMO AS SUAS APLICAÇÕES" A presente invenção refere-se a vírus capazes de induzirem linfadenopatias (referido em ceguida pela abreviatura LAS) síndromes de imuno-deficiência adquirida (referido posteriormen te com a abreviatura SIDA), aos antigénios dos referidos viras, particularmente sob uma forma purificada e a processos para a preparação destes antigénios, particularmente antigénios envolvidos nestes vírus. A presente invenção também se refere a poli péptidos quer glicosilados quer não, codificados pelas sequências do DNA referidas. A presente invenção também descreve sequências de DITA cio nado hibridizável com DITA e RITA genémico de novos vírus associados com linfadenopatia LAV, aqui descritos posteriormente, a processos para a sua preparação e suas utilizações. A presente invenção refere de um modo especial, sondas estáveis que incluem uma sequência de DITA que pede ser utilizada para a detecção de neves ví rus LAV ou vírus com estes relacionados ou pro-vírus de DITA, em qualquer meio, especislmente amostras biológicas que contenham qualquer deles.
Um polimorfismo genético importante foi reconhecido no retrovírus humano na origem da síndrome de deficiência de imunida, de adquirida (SIDA) e outras doenças, tal como a síndrome de lin- - 2 -
fadenopatia (LAS), complexo relacionado com a SIDA (ABC) e, pr£ vavelmente, algumas encefalopatias (para revisão consultar WEISS, 1984). De facto, todas as réplicas analisadas até ao momento, pos_ suem um mapa de restrição diferente ainda que obtidos no mesmo local e na mesma altura (EEER et al., 1985). Mapas de restrição idênticos foram observados somente para os dois primeiros isolados designados por vírus associados à linfadenopatia (ALIZOR et al., 1984) e vírus linfotrópicos de células T-humanas, tipo 3i HTLV-3 (HAHR et al., 1984) e portanto que aparecem como uma ex-cepção. 0 polimorfismo genético do vírus da SIDA foi melhor enten dido após a determinação da sequência nucleotídica completa de IAV (WAIR-HOBSOR et aL, 1985), HtVL-3 (EATEER et al. , 1985; MUESIRG et al., 1985) e de uma terceira réplica designada por retrovírus associado à SIDA e à ABV (Sanchez-PESCADQR et al.,1985)· Em parti cular, parece que para além das variações do ácido nucleico respon sáveis pelo polimorfismo do mapa de restrição, réplicas poderão diferir de um modo significativo, no seu conteúdo proteico, especialmente no invólucro (até 13 % de diferença entre AR7 e LA7), pelas substituições de aminoácidos e pelas anulações-inserções recíprocas. (RABSOR e MÁRTIR, 1985).
Além disso, as diferenças mencionadas antes, não vão tão longe quanto a destruição dum nível de suficiente relacionamento imunológico, como é evidenciado pelas capacidades de proteínas s_e melhantes, isto é, proteínas nucleares de natureza semelhante, tais como as proteínas P25 ou glicoproteínas de invólucro semelhante, tais como as glicoproteínas de 110-120 KD, para reacção -3- ( imunolôgica cruzada. Do mesmo modo, as proteínas de qualquer dos referidos vírus LAV podem ser utilizadas para detecção in vitro de anticorpos induzidos in vivo, presentes nos fluidos "biológicos obtidos a partir de indivíduos infectados com outras varian tes de LA7. Portanto estes vírus, são agrupados numa classe de vírus MV, de uma maneira geral referida aqui como pertencendo à classe de vírus LA7-1. A presente invenção parte da descoberta de novos vírus que, ainda que responsáveis por doenças que clini camente estão relacionadas com a SIDA ou pertencentes ainda à cias, se de vírus LA7-1, diferem geneticamente em muito maior extensão das variantes LA7 referidas antes.
Os novos vírus são fundamentalmente caracterizados por sequências de DITA que se mostram nas figuras de 7A a 73 (MY-RTiT) e as figuras de 8A a 81 ÇLAV^AT[) respectivamente. A presente invenção também se refere a variantes de RNAs dos novos vírus ou a cDNA relacionados, derivados dos referidos RDA que são hidrolisáveis com as partes correspondentes de cDITA quer de ou LAY^. A presente invenção também se refere aos EITAs, propriamen te ditos, dos referidos vírus que incluem fragmentes de DITA derivados dos correspondentes hibridizáveis com o RITA genómico de LAV-g^j ou LAV]^· Particularmente os referidos DITA consistem nos referi dos cDHAs ou fragmentos de cDNA ou DNAs recombinantes que contêm os referidos cDNAs ou fragmentos de cDNA.
Além disso, referem-se recombinantes de DITA que contêm DITAs ou fragmentos de cDNa quer de LAYgjj ou LAY^^ ou de vírus relacionados. Entende-se evidentemente que os fragmentos que po- dem incluir algumas anulações ou mutações as quais não alteram substancialmente a sua capacidade para também hibridar com os genomas de retrovírus de LAV^j ou e são também considera dos como equivalentes obvios dos MAs ou dos fragmentos de MA mais especificamente referidos antes. A presente invenção também se refere mais especificamen te a sondas dobadas que podem ser feitas a partir de qualquer fragmento de MA, de acordo com esta invenção, portanto para re-combinação dos MAs que contêm tais fragmentos, particularmente qualquer plasmídeo amplificável em células procarióticas ou eu-carióticas e que transportam os referidos fragmentos.
Por meio da utilização de MA clonado contendo um fragmento de MA de LAV·^ ou como uma sonda de hibridação molecular -quer por mareagem com radionucleótidos quer com reagen tes fluorescentes - pode detectar-se RITA de vírus LAV por exemplo, no sangue, líquidos corporais e produtos do sangue (p. ex. facto-res anti-hemofílicos tais como os concentrados de factor VIII). 0 método apropriado para se obter tal detecção consiste na imobilização do vírus sobre um suporte, por exemplo sobre um filtro de nitrocelulose, etc, desagregação do vírus e hibridação com sondas marcadas (radiomarcadas ou marcadas por meio de enzimas ou "cold" fluorescentes). Tais vias têm sido já desenvolvidas para o vírus da hepatite B no sangue periférico, de acordo com SCOTTO J. et al. Hepatologia I, 379 - 384 (1983).
As sondas de acordo com a presente invenção podem também ser utilizadas para sondagem rápida de MA genómico, derivado de tecidos de doentes com sintomas relacionados com os LAV, para ver ί.-5 - ί νι se DNA ou ΕΝΑ proviral, estão presentes no tecido hospedeiro ou nou tros tecidos relacionados com ou 0 método que pode ser utilizado para tal investigação, com preende as seguintes fases: extracção de DNA do tecido, cisão com enzima de restrição do referido DNA, electroforese dos fragmentos e marcação de Southern do DNA genómico dos tecidos, subsequente hi bridação com DNA proviral de LAV clonado e marcado. Também pode ser utilizada a hibridação in situ.
Eluidos linfáticos e outros tecidos não linfáticos de seres humanos, primatas e outras espécies de mamíferos também podem ser sondados para se averiguar da existência de outros retrovírus rela_ cionados evolutivos. Os métodos referidos antes podem ser utiliz_a dos ainda que a hibridação e lavagens devam ser feitas sob condições não restritas. 0 DNA de acordo com a presente invenção também pode ser utilizado para se obter a expressão de antigénios virais da LAV para diagnóstico, assim como para a· produção de vacinas con_ tra LAV. Os fragmentos de interesse particular neste aspecto serão apresentados posteriormente.
Os métodos que podem ser utilizados são múltiplos: a) 0 DNA pode ser transfectado para células de mamífero com marcadores de selecção adequados, por meio de urra varie dade de técnicas, precipitação com fosfato de cálcio, polietileno glicol, fusão de protoplastos, etc. b) Os fragmentos de DNA que correspondem a genes podem ser cionados no interior de veotores de expressão por E. coli, leveduras ou células de mamíferos e as proteínas resultantes purificadas. - 6 -
c) o DM proviral pode ser fragmentado ("shot-gunned") em vectores de expressão procarióticos para gerar polipépti dos de fusão. Podem identificar-se recombinantes que pr£ duzem proteínas de fusão, competentes do ponto de vista de constituição antigenica, por sondagem simples dos re combinantes com anticorpos contra antigênios IAV-^j ou
LAV ΜΑΙ Α este respeito ê feita uma referência particular aquelas fracções de genomas de IAV-pj[T ou que? nos desenhos, são re presentadas como pertencendo a cadeias de leitura abertas e que C£ dificam os produtos que têm os suportes principais polipeptídicos representados.
Mais particularmente, a presente invenção refere-se a dife rentes polipêptidos que aparecem nas figuras 7A e 81. Os processos descritos no pedido de patente de invenção europeu 0 178 978 e no pedido de patente de invenção PCT/EP 85/0054-8 depositado em 18 de
Outubro de 1985, são aplicáveis para a produção de tais péptidos a partir dos vírus correspondentes. A presente invenção também tem o objectivo de fornecer poljl péptidos que contêm sequências em comum com polipêptidos que compr£ endem determinantes antigênios incluídos nas proteínas codificadas e expressa pelo genoma de IAY^T|T ou
Um outro objecto da presente invenção é também fornecer meios para a detecção de proteínas relacionadas com estes vírus LAV, particularmente para o diagnóstico de SIDA ou de pré-SIDA ou, pelo contrário, para a detecção de anticorpos contra os vírus LAV ou proteínas com eles relacionadas, especialmente em doentes atiii gidos pela SIDA ou prê-SIDA ou, de um modo mais geral, em veículos assintomáticos e em produtos relacionados com o sangue.
Finalmente a presente invenção também tem por objectivo fornecer polipéptidos imunogénicos e mais particularmente poli-plptidos protectores, para utilização na preparação de composições de vacinas contra a SIDA ou síndromas relacionados com a SIDA. A presente invenção também se refere a fragmentos de poli péptidos que têm pesos moleculares mais baixos e que possuem sjb quências peptídicas, ou fragmentos peptídicos, em comum com os re presentados nas figuras desde 7A ate 81. Fragmentos de menores dimensões podem ser obtidos por meio de técnicas conhecidas. Por exemplo: um método que compreende a clivagem do polipéptido maior original, por meio de enzimas capazes de o cortarem em sítios específicos. Como exemplo de tais proteínas pode-se mencionar a enzima de Stafilococcus aureus V8, (X-quimotripsina, a "protease da glândula sub-maxilar do murganho" comercializada pela companhia BOEHRIDGER, Vibrio alginolyticus chemovar iophagus colagenase, que reconhece dum modo específico os referidos péptidos Gly-Pro e Gly-Ala, etc.
Outros aspectos desta invenção aparecerão na descrição seguinte dos dados obtidos a partir de e LAY^^, em rela ção com os desenhos em que: - A fig. IA e a fig. 1B representam os mapas de restrição dos genomas de IAV^yj e comparados com LAY^^ (uma réplica de LAY conhecida, depositada na CNCM sob o número 1-232 em 15 de Julho de 1983); - A fig. 2 representa os mapas comparativos indicando as posições relativas das cadeias de leitura abertas dos genomas refe
- A fig. 3A-3F (algumas vezes também designadas globalmente a seguir por fig. 3) indicam a correspondência relativa entre as proteínas (ou glicoproteínas) codificadas pelas cadeias de leitura abertas, enquanto que os resíduos de aminoécidos das sequências das proteínas LAV-^-p e IAV^t, estão alinhadas na vertical com os resíduos de aminoécidos correspondentes (numerados) das proteínas correspondentes ou das proteínas homólogas ou glicoproteínas de MVBRU; - Fig. 4A-4B (algumas vezes aqui designadas globalmente por fig. 4) representam a quantificação da sequência divergente entre as proteínas homólogas de LAY^-g, IAVVTJ e LAV^-j-,; - Fig. representa por meio de diagrama o grau de divergência entre as proteínas do invólucro dos diferentes vírus; - Fig. 6A e 6B (ou fig. 6 quando consideradas em conjunto), tornam evidente as repetições directas que surgem nas proteínas das diferentes réplicas de vírus da SIDA; - Fig. 7A-7J e 8A-8I, representam as sequência nucleotídi- cas completas de LAV^-p e , respectivamente.
Resultados
Uaracterização e clonagem molecular de duas réplicas africanas .
As diferentes réplicas de vírus da SIDA em consideração, são designadas pelas três letras correspondentes ao nome dos doen_ tes, LAY^y que se refere ao protótipo do vírus da SIDA isolado num doente homossexual francês, em 1983 com LAS e que se pensa ter - 9 -
έ ν- sido infectado nos Estados Unidos da América do Forte em anos an teriores (BARRÊ-SIFOUSSI et al, 1983)· Ambos os doentes africanos eram oriundos do Zaire; o vírus foi recolhido em 1983 de uma mulher com 24 anos com SIDA e o em 1985, de uma crian ça com 7 anos com ARC, provavelmente infectada em 1981, após uma transfusão de sangue no Zaire, uma vez que os pais eram LAV-ser£ negativos. A recolha e purificação de cada um dos dois vírus foram re_a lizados de acordo com método descrito no pedido de patente de in venção europeu 84.401.834/138.667, registado em 9 de Setembro de 1984. ΜνΕυΐ e ^MAL eram indistinguíveis das réplicas, caracte rizadas previamente, pela sua estrutura e propriedades biológicas in vitro. Os vírus definidos metabolicamente e por precipitação imune, de doentes com soro ELI e soro ML, assim como soros de re ferência, mostraram que as proteínas de LAV-^j e tinham o mesmo peso molecular (PM) e reacçào imunológica cruzada com os pr£ totipos do vírus da SIDA da classe "LAV 1" (dados não representados). A referência e novamente feita ao pedido de patente de in vençso europeu 178 978 e ao pedido de patente de invenção interna cional PCT/EP 85/00548 no que se refere à purificação, esquemati_ zação e processos de sequênciação aqui utilizados. Ver ainda, "processos experimentais" e "legendas das figuras", em seguida. A análise dos enzimas de restrição originais dos genomas de LAV-p,TT e LAVM^ foi executada por manchas de Southern, com DNA total derivado de linfócitos infectados agudamente, utilizando-se > como sonda o genoma completo de LAV^-g clonado. Toda a hibridação usada foi observada sob condições restritas, mas os perfis de re_s trição das réplicas zairenses eram nitidamente diferentes. Os cio nes do Phago lambda que incorporam a informação genética virai completa, foram obtidos e posteriormente caracterizados por esquema tização de restrição e análise de sequência nucleotídica; o clone E-H^2 é derivado de células infectadas IAI^j e contem um provírus integrado com as sequências celular flanqueadoras 5' excepto uma ("repeat") repetição de terminal longa 3'» truncada (LTR); o clone M-H11 foi obtido por restrição com HindIII, completa do DNA de cé_ lulas infectadas com tendo a vantagem da existência dum único sítio HindIII no LTR. 0 M-H-^ é, portanto derivado provável, mente de DNA virai não incorporado, uma vez que a espécie ere pelo menos 10 vezes mais abundante do que o provírus incorporado.
I A fig. 1B fornece uma comparação dos mapas de restrição de LàNyjj e LAYj^j, e o protótipo LAY^^, todos três derivados das suas sequências nucleotídicas assim como as três réplicas zairenses pre viamente esquematizadas para este enzima de restrição (Been et al., 1985)· Apesar deste número limitado, todos os perfis são claramen te diferentes, (além dos 23 sítios que constituem a mapa de LAY^y, apenas sate estão presentes em todos os seis mapas representados), o que confirma o polimorfismo genético do vírus da SIDA. Nenhuma relação óbvia é evidente entre os cinco mapas zairenses e todos cs seus sítios comuns também são encontrados em LAY,^,.
Conservação da organização genética. A organização genética de LAV-
ELI
e LAY
MAL tal como deduzida - 11 -/
das sequências nucleotídicas completas dos seus genomas clonados é idêntica p encontrada em outras réplicas, isto ê, 5'-gag-pol--região centrsl-snv-F3'. 0 mais notável ê a conservação da "região central" (fig. 2) localizada entre os genes pol e env que é composta de uma série de cadeias de leitura abertas sobrepostas (orf) que previamente se designaram por Q, E, S, T e U apôs a observação de uma organização idêntica no visma de lentivírus ovino (Sonigo et al., 1985). 0 produto de orf S (também designado "tat") está implicado na transactivação da expressão do vírus (Sodrosti et al., 1985; Arya et al., 1985); o papel biológico do produto de orf Q (também designado "sor" ou "orf A") é ainda desconhecido (Lee et al., 1986; Kang et al., 1986). Las outras três orfs (R, T e U) apenas a orf R é provavelmente um sétimo gene virai pelas sequintes razões: a conservação exacta da sua posição relativa no que se refere a Q e S (fig. 2), a presença constante de um aceita dor de excisão possível e de um codão iniciador AUG consenso, sua utilização de codão semelhante no que se refere aos genes virais e, finalmente, da variação da sua sequência proteica nas diferentes réplicas ser comparável à de gag, pol e Q (ver fig. 4).
Também são conservadas as dimensões dos elementos U3 e U5 de LTR (dados não representados), a localização e sequência dos seus elementos reguladores tais como caixa TATA e sinal de poli--adenilação AATAAA e as suas sequências flanqueadoras, isto é, o sítio de ligação iniciador (PBS), complementar à extremidade 3' de TRHA e o tracto da polipurina (PPT'). A maior parte da variabili dade genética do LTR está localizada na metade 5' de U3 (que cod_i fica uma parte de orf F), enquanto a extremidade 3' de U3 e R, que transporta a maior parte dos elementos reguladores de acruação cis: - 12 -
ί - ο promotor, ο reforçador e ο receptor do factor de trans-activa-ção (Eosen et al., 1985), assim como o elemento U5 estão "bem co£ servados.
Globalmente, apresenta-se claramente 0 facto das réplicas zairenses pertencerem ao mesmo tipo de retrovírus, como as réplicas sequenciadas previamente, de origem americana ou europeia.
Variabilidade_das_proteínas_virais
Apesar da sua organização genética, estas réplicas mostra ram diferenças substanciais na estrutura primária das suas proteínas. As sequências de amino-écido das proteínas de IAY-p,T|T e LAYmL estão representadas nas figuras 3A - 3P (p&ra serem examina das em conjunto com as figuras 7A - 7J e de 8A a 81), alinhadas com as de LAV^y e AEV 2. A sua divergência foi quantificada sob a forma de percentagem de substituições de amino-ácidos nos alinha mentos dois-a-dois (fig. 4). Também se registou 0 número de inserções e de anulações que têm sid 0 introduzidos em cada um destes ali nhamentos.
Puderam ser feitas três observações gerais. Primeiro, as se_ quências de proteínas das réplicas africanas são mais divergentes de do que são as de HTLY-3 e AEY 2 (fig. 4A); foram obtidos resultados semelhantes quando se tomou como referência AEY 2 (não representado). A escala de polimorfismo genético entre as réplicas do vírus da SIDA, ê consideravelmente maior do que se tinha observado previamente. Segundo, as duas sequência presentes confirmam que 0 invólucro é mais variável do que os genes gag e pol. Ainda assim, as diferenças, relativamente pequenas,observadas entre o env - 13 -
de LA.V^y e HTLV-3 apresentam-se como uma excepçao. Terceiro, a di_ vergência mútua das duas réplicas africanas (fig. 4B) é comparável à que existe entre e qualquer delas; tanto quanto é possivel fazer a extrapolação a partir somente das três réplicas sequenciais dos Estados Unidos da América do Norte, da Europa e as duas de África, aquela indicava uma grande evolução de vírus da SIDA em África.
Gag_e_polí o seu grande grau de conservação comparado com o invólucro é consistente com as suas importantes actividades estria turais codificadoras ou actividades enzimáticas. Das três proteínas gag maduras, a p25, que foi a primeira proteína imunogénica re conhecida de LAV (Barre-Sinoussi et al., 1983), é também melhor conservada (fig· 3)· Nos gag e pol, a diferença entre as réplicas sao principalmente devidas a mutações pontuais e somente se obser vou um pequeno número de inserções ou anulações. Entre estas, deve notar-se a presença, na parte sobreposta de gag e pol de ΙΑΎ-^j, de uma inserção de doze aminoácidos (AA) que é codificada pela se. guinte copia de uma repetição directa de 36 pares de bases presen te'apenas nesta réplica e em HTLY-3· Esta duplicação foi omitida porque houve um erro de calculo na sequência publicada de (posição 1712, Wain-Hobson et al., 1985), mas de facto estava pre sente nas sequências de HTLY-3 (itatner et al., 1985; Muesing et al., 1985).
Env: podem ser distinguidos três segmentos do precursor glicoproteínico do invólucro (Allan et al., 1985; Montagnier et al., 1985; niMarzoVeronese et al., 1985)· 0 primeiro é um péptido sinal (posição de 1 a 33 na fig. 3) e, a sua sequência, apresenta -se como variável ; o segundo segmento (posição de 34 a 53O)1 forma a parte mais estreita da membrana proteica (OMP ou gp 110) e transporta a maior parte da variação genética e em especial a maior parte de todas as Dumerosas inserções recíprocas e anulações; 0 terceiro segmento (531-877), é separado de OMP por um s_í tio de cisão potencial, seguindo-se uma cadeia básica constante (Arg-Glu-Lys-Arg) e formas de transmembrana proteica (TMP ou gp 41) responsável pela "ancorageih" do invólucro glicoproteínico na membrana celular. Uma melhor conservação de TMP do que OMP também foi observada entre os diferentes vírus de leucêmia murina (ML·?, Koch et al., 1983), e que pode ser devida a contracções estruturais.
Do alinhamento da figura 3 , e da representação gráfica da variedade do invólucro representado na figura 5, pode ver-se nitidamente a existência de domínios conservados, com pouca ou nenhuma variação genética e domínios hipervariáveis, em que o alinhamento das diferentes sequências é muito difícil, por causa da existência de um grande número de mutações e inserções e anulações recíprocas. Não se incluiu a sequência do invólucro da réplica H7L7-3, uma vez que é muito próxima da de DAY-ggy (fig. 4) mesmo nos domínios hiper variáveis , porque não acrescentaria qualquer coisa â análise. En quanto que esta representação gráfica pode ser refinada por mais dados de sequências, o perfil geral é já evidente, com os três domí nios hipervariáveis (Hyl, 2 e 3), todos localizados em OMP e separados por três cadeias bem conservadas (resíduos 37-130, 211 --289 e 488 - 530 no alinhamento da fig. 3) provavelmente associados com funções biológicas importantes.
Apesar da extrema variabilidade genética 0 esquema de dobra - 15 -
L ί gem das glicoproteínas do invólucro é provavelmente constante. De facto, é conservada a posição de, virtualmente todos os resíduos de cisteína nas diferentes réplicas (fig. 3 e 5) e apenas três cisteínas variáveis caem quer no péptido sinal ou quer na extremi, dade do C-terminal de TMP. Os domínios hipervariáveis de OMP são li_ gados por cisteínas conservadas, o que sugere que estas podem repre sentar ansas ligadas a esquemas de dobragem comuns. Também os perfis hidropáticos calculados (Kyte e Doolittle, 1982), das diferentes proteínas do invólucro, estão notavelmente conservadas (não represenuado). - Cerca de metade dos sities de ΪΤ-glicosilação potencial, Asn -X-Ser/Thr, encontrados nos invólucros das réplicas zairenses es_ quematizam para as mesmas posições em kAVjgju (17/26 para Lklyjj e 17/28 para Os outros sítios parecem cair nos domínios va riáveis de env, sugerindo a existência de diferenças na extensão da glicosilação do invólucro entre as diferentes réplicas.
Proteínas virais: das três ou uras proteínas identificadas, a p27 codificada por orf F, 5' de env (Allan et al., 1985 b), é a mais variável (fig. 4). As proteínas codificadas por orfs Q e S da região central são notáveis pela sua ausência de inserções/anulações. Surpreendentemente, uma elevada frequência de substituições de ami noácidos, comparada com a existente em env, foi observada para 0 produto de orf S (factor de trans-activação). Por outro lado, a pro teína codificada por orf Q, não é mais variável do que a gag. Tam bém é notável a diminuta variação das proteínas codificadas pelas regiões centrais de e - 16 -
DISCUSSÃO
Com a disponibilidade das sequências nucleotídicas completas das cinco réplicas independentes, alguns aspectos gerais do vírus da SIDA, no que se refere â variabilidade genética, estão agora a emergir. Primeiramente a principal causa desse facto são as mutações pontuais, muitas vezes resultantes nas substituições de aminoácidos e que são mais frequentes na parte 3' do genoma (orf S, env e orf F). Pensa-se que os retrovírus uai como outros vírus de EM, são altamente submetidos a mutações provocadas por erros das EM polímerases durante a sua replicação, uma vez que não há uma revisão desta fase (Holland et al., 1982; Steinhauer e Holland, 1986).
Outra fonte de diversidade genética são as inserções/anula çoes. D:s alinhamentos da fig. 3 os episódios insercionais parecem estar implicados na maior parte dos casos, uma vez que as anulações, doutro modo, teriam que ocorrer em réplicas independentes pre cisamente na mesma localização. Além disso, após a análise destas inserções, observou-se que elas, na maior parte das vezes, representam uma das duas cópias de uma replicação directa (fig. 6). Algumas são perfeitamente conservadas tal como a replicação de 36 pares de bases na camada sobreposta gag-pol de LAV-g^-g (fig. 6-a); outras, transportam mutações pontuais, resultantes de substituições de aminoácidos e, como consequência, são mais difíceis de observar, ainaa que nitidamente presentes, nos domínios hipervariáveis de env (ver a fig. 6-g e 6-h). Como se fez notar para as mutações pon tuais, o gene env e orf F também aparecem como mais susceptíveis para esz-: forma de manipulação genética, do que o resto do genoma. - 17 -
0 grau de conservação destas replicações deve ser relacionado cora a sua data de ocorrência nas sequência analisadas: quanto mais dege nerado mais antigo. Uma divergência muito mais recente de LAV-g^y e HTLV-3 é sugerida pelo número extremamente baixo de aminoácidos trocados entre as suas proteínas homólogas. Contudo uma replica-ção de LkVggy (localizada no domínio Hil de env, fig. 6-f) não está presente em HIL7-3, o que indica que esua geração de replicações em · tandem é uma origem rápida de diversidade genética. Não se verificam vestígios de tal fenómeno, mesmo quando comparado com vírus muito proximamente relacionados, tal como o vírus de macaco Mascn-Pfizer Έ£Μ (Sonigo et al., 1986). um vírus imunossupressivo de símio SR7-1 (Power et al. , ”.>86). a inserção ou anulação de uma cópia de uma replicação directa foi ocasionalmente descrita em retro vírus mutantes (Shimotohno e Temin, 1981; Darlix, 1986), mas a ex tensão com que se observou este fenómeno é imprecedente. A base molecular destas duplicações é pouco clara, mas p_o de ser o fenómeno de "copoy-choice" que resulta da diploidia do genoma retróviral (Varmus e Swantrom, 198A; Clark e Mak, 1983). Durante a síntese da primeira cadeia do DNA virai, verificaram-se que ocorriam saltos de uma molécula de RITA para outra, especialmente quando uma fenda ou uma estrutura secundária estável estava presente na matriz; uma reiniciação inexacta de outra matriz de RNA pode resultar na geração (ou a eliminação) de uma replicação directa curta. A variabilidade genética e modificações antigénicas subsje quentes tem sido desenvolvidas muitas vezes por microrganismos como um meio para fugir à resposta imune do hospedeiro, quer por f
/ ( « modificação dos seus epitopes durante o decurso da infecção, como nos tripanossomas (Borst e Cross, 1982), ou quer gerando um largo reportório de antigénios, tal como observado com o vírus da influao za (Webster et al., 1982)· Como o vírus humano da SIDA está relacionado com lentivírus de animais (Sonigo et al., 1985; Chiu et al., 1985), a sua variabilidade genética pode ser uma origem da variação antigénica, como se pode observar durante o curso da infecção pelo visna do lentivírus ovino (Scott et al., 1979 5 Clements et al., 1980) ou pelo vírus da anemia infecciosa equina (EIAY, Montelarc et al., 1984). Contudo a maior discrepância com estes modelos animais é a extremamente baixa, se alguma, actividade de neutralização dos soros dos indivíduos infectados pelo vírus da SIDA, quer se, jam portadores saudáveis, exibindo sintomas menores quer atingidos por SIDA (Weiss et al., 1985; Clavel et al., 1985)· Além disso, mes_ mo para o vírus do visna o papel exacto da variação sntigenétáca na pa_ togénese não está esclarecido (Thormar et al., 1983; Lutley et al., 1983). De preferência, sente-se que a variação genética representa uma vantagem selectiva para os lentivírus, permitindo uma adaptação aos diferentes ambientes, pór exemplo, mediante modificação do seu tecido ou tropismos para o hospedeiro. No caso particular do vírus da SIDA, as variações genéticas rápidas são toleradas espec:nL_ mente no invólucro. Elas poderão permitir ao vírus adaptar-se aos diferentes "micro-ambientes" da membrana das células, prineipalmen te alvejadas, nomeadamente os linfócitos T4. Estes "micro-ambien tes" podem resultar de uma vizinhança imediata ao receptor do vírus, para proteínas de superfície polimórficas que diferem quer entre os indivíduos ou quer entre clones de linfócitos.
Domínios conservados no invólucro do vírus da SIDA
Uma vez que as proteínas da maior parte das réplicas pos suem, do ponto de vista antigénico, reacção-cruzada, os diferen-tes genotipos não parecem afectar a sensibilidade dos testes de diagnóstico actuais, baseados na detecção de anticorpos para o ví rus da SIDA e que utilizam como antigénio, vírus purificados. No entanto, aqueles que têm que ser considerados por o desenvolvimen to de testes de uma "2- geração" que se espera sejam mais específicos e que utilizarão antigénio virais sintéticos mais pequenos ou obtidos por meio de engenharia genética. A identificação de do_ mínios conservados na glicoproteína do invólucro, altamente imuno génico e ainda nas proteínas estruturais do núcleo (gag) é muito importante per-, estes testes. A cadeia conservada na extremidade da OMP s o início de TMP (490 - 520, fig. 3) poderá ser um bom can didato desde que uma proteína de fusão bacteriana que contenha este domínio seja bem detectada pelo soro dos doentes com SIDA (Chang et al., 1983). 0 invólucro da OKP especificamente, medeia a interacção entre um retrovíros e o seu receptor celular específico (DeLarco e Todaro, 1975; Eobinson et al., 1980). No caso do vírus da SIDA, in vitro, ensaios de ligação mostraram a interacção da glicoproteína do invólucro gp 110 com o antigénio de superfície celular T4 (McDougal et al., 1986), anteriormente julgado ser ou estar estritamente associado com o receptor do vírus (Klatzmann et al., 1982; Dagleish et al., 1984). A identificação de domínios do invólucro do vírus da SIDA que são responsáveis por esta interacção (domínios receptor-ligação) apresenta-se como fundamental por a compre
- 20 - ,- { * ensão das interacções hospedeiro-vírus, mas também para a constru ção de uma vacina protectora, desde que uma resposta imune contra estes epitopes, possa provocar a formação de anticorpos neutralΊ-zantes. Como o receptor do vírus da SIDA é, pelo menos, parcialmen te formado por uma estrutura constante, o antigénio T4, o sítio de ligação do invólucro não é provavelmente de exclusiva codifi^ cação pelos domínios sob alterações genéticas drásticas, entre as réplicas, mesmo que estas possam ser implicadas em alguma espécie de "adaptação”. Um ou vários dos domínios analisados de OMP (resíduos 37 - 130, 211 - 289 e 4-88 - 530 no alinhamento da fig. 3) produzidos em conjunto pela dohragem das proteínas, devem desempe. nhar um papel na interacçao vírus-receptor, e este facto pode ser explorado com péptidos sintéticos ou produzidos por técnicas genéticas derivados, destes domínios quer por ensaio de ligação direç_ ta ou indirecta ou quer por meio de ensaio de neutralização da acti_ vidade de anticorpos específicos nascidos contra estes. Vírus da SIDA africano 0 zaire e os países vizinhos da África Central são consid_e rados uma área de infecção de vírus da 8IDA endémica e a possibili dade de que o vírus tenha emergido em África tem sido objecto de in tensa controvérsia (Ver ITormsn, - Dos presentes estudos é evi dente que a organização genética das réplicas zairenses é a mesma que as das réplicas americanos, portanto indicam uma origem comum. As diferenças de sequência observadas, muito importante-, entre as proteínas são consistentes com um processo de evolução divergente. Além disso, as duas réplicas africanas são mutuamente mais diver-"
gentes do que as réplicas americanas até agora analisadas; tanto quanto à observação pode ser extrapolada, sugere-se que uma evolução maior do vírus em África é também consistente com o facto de que é maior a fracção de população susceptível do que nos países desenvolvidos.
Um novo retrovírus humano com morfologia e propriedades biológicas (citopatogenicidade, tropismo T4) semelhante âs de LA7, mas contudo evidentemente distinto genética e antigeneticamente deste último, foi recentemente isolado de dois pacientes com SIDA provenientes da Guiné-Bissau, África Ociiental (Clavel et al., 1986). No Senegal vizinho, a população parece estar exposta também a um retrovírus igualmente diferente de ItAV, mas aparentemen te não patogénico (Barin et al., 1935; Kánki et al., 1986). Amvoa O'-: novos retrovírus africanos parecem ser antigenicamente relacio nados com o vírus linfotrópico de células t de macaco, STLV-III, que se mostra estar frequentemente presente em macacos verdes africanos saudáveis ·:- c”tras espécies de símios (Kanki et al., 1985). Este facto fornece a possibilidade da existência de um gran de grupo de lentivírus de primata africano, compreendido entre vírus de macaco aparente-mente não natogénicos e vírus do tipo LAV. A sua relação exacta poderá ser conhecida apenas s re a sua caracte rizsção genética completa, mas é também muito provável que estes possuam um progenitor comum. A variabilidade genética importante que se observou entre as réplicas de vírus da SIDA na África Central é, provavelmente, uma marca deste grupo inteiro e pode contribuir para a divergência genética aparentemente importante entre os seus membros (perda de antigenicidade cruzada nos invólucros). Neste sen tido, a conservação do tropismo para os linfócitos T4 sugere que e_s / - 22 -
ta é uma vantagem principal adquirida por estes retrovírus.
Processos_exj3erimentais
Isolamento de vírus:
Isolaram-se 1ΑΎ·^ιΤ e de linfócitos de sangue p_e riférico de doentes como descreveu Barré-Sinoussi et al., 1983; de modo breve, os linfócitos foram fraccionados e co-cultivados com linfócitos humanos normais, estimulados com fito-hemaglutini na na presença de interleuquina 2 e soro anti-interferão alfa. A produção virai foi avaliada por ensaio da actividade da trans criptase inversa isenta de células (ET) na cultura e por meio de microscopia electrónica.
Clonagem molecular:
Linfócitos de dador normal foram cuidadosamente infecta dos (IO4 cpm de actividade ET/10^ células) como descrito por Barré-Sinoussi et al., 1983 e extraiu-se o DEA total no início do máximo de actividade de transcriptase inversa (ET). Para LAA^j utilizou-se um vector L47-1 para construir uma biblioteca lamt da por digestão parcial com Hind III de DEA, como descrito antes (Alizon et al. , 1984). Para o DEA das células infec tadas foi digerido completamente com Hind-III e seleccionada a fretcçãcde9-10 kb sobre gel de agarose a 0,8% do ponto de fusão inferior e ligado a ramos Hind-III de L47-1. Cerca de 5 * 10^ placas por e 2 x 10^ para obtidas por reunião in vitro (Amersham) foram colocadas numa placa em E. coli LA. 101 e sondadas in situ sob condições restritas, utilizand£ -se a inserção Sac I de 9 kb do clone J 19 lambda como sonda (Alizon et al., 1984), que transporta a maior parte do genoma . de LAVg-pTT. Os clones exibindo sinais positivos foram purificados em placa e propagados em E. coli C 600 rec BC, e dois fagos r£ combinantes, transportando a informação genética completa de LAVEli (E-H12) e (M-Hll), foram posteriormente caracteri zados por esquematização de restrição.
Estratégia_de^sequenciaçãq^nucleotídica
Os fragmentos de vírus derivados de E-II12 e K-Hll foram sequenciados pelo processo de terminação de cadeia por di-deóxi (Sanger et al., 1977) após clonagem "shotgun" no vector MIJmpS (Messing e Viera, 1982) como descrito previamente por Sonigo et al., 1985- 0 genoma de vírus LAV^-j- tem 9176 nucleó-tidos, o de 9229 nucleótidos de comprimento. Cada nucleó_ tido foi determinado em média a partir de mais do que cinco clones independentes. As sequências nucleotípicas completas não estão apresentadas neste artigo por razões óbvias de limitação 24 -
de espaço, mas são facilmente obtidas mediante pedido aos pre sentes autores até que estejam disponíveis através de bancos de dados de sequências.
LEGENDAS DAS FIGURAS
Figura 1: Análise de mapa de restrição de réplica de vírus de SIDA. A - Mapas de restrição das inserções dos clones de fago lambda das células infectadas com (E-H12) e (M-Hll). A organização genética esquemática do vírus da SIDA foi desenhada sobre os mapas. Os LTRs estão indicados por traços cheios. A: AYAL-E: Bam HI-Bg; BgIII-E: EcoRI-H; Hind III-Kc:
Hinc II—K: Kpnl-N: N de I-P: PstI-S: Sacl-X: Xbal. Os asteriscos indicam os sítios de clonagem de Hind III no vectDr L47-1 lamt da. E - Comparação dos sítios para sete enzimas de restrição em seis réplicas: protótipos e ‘^dELI de ν^Γ’αε da SIDA; 21, 22, 23 representam réplicas zairenses com os mapas de restrição publicados (Benn et al., 1985)· Os sítios de restrição estão representados pelos seguintes símbolos: Bg III; EcoRI; Hinc II; Hind III; Kpn; Ndel; Saci.
Figura 2· Conservação da organização genética da região central das réplicas de vírus da SIDA.
Os codões de paragem estão representados em cada fase por "barras verticais. As setas verticais indicam possíveis codões de iniciação AUG (A) sítio aceitador de excisão e (D) sítio dador identificados no mRNA subgenomico virai (Muesing et al., 1985) mostram-se na parte inferior do gráfico de LAT-gRu e sítios correspondentes também se mostram em IiAV-p,T|T e MV^^.PPT indica a replicação da extensão de polipurina que flanqueia o LTR3'· Tal como se observa em LAY (Wain-Hobson et al., 1985), a PPT é ERU replicada 256 nucleótidos 5' para a extremidade do gene pol em ambas as presentes sequências, mas esta replicação é degenere^ da em duas posições em LAT-^j.
Figura 3: Alinnamento das sequências de proteína de 4 réplicas de' vírus da SIDA. A réplica LAV-g^-y (Wain-Hobson et al., 1985) é considerada como referência; só são notadas diferenças com pa ra APV2 (Sanchez-Pescador et al., 1985) e para as duas réplicas zairenses LAY e IAV-ρ^,γ. Nos alinhamentos foi introduzido um número mínimo de interrupções (-). Os terminais amínioos de P25gSg e pl8gag estão indicados (Sanchez-Pescador, 1985). Os - 26 - sítios de cisão potencial no percursor do invólucro (Allan et al., 1985a ; diMarzo-Veronese, 1985) que separam o péptido sinal (SP), a membrana proteínica mais externa (OMP) e as pro teínas da transmembrana (IMP) estão indicados com setas verti_ cais; as cisteínas conservadas estão indicadas por círculos pretos e as cisteínas variáveis estão enquadradas. 0 código de uma única letra para os aminoácidos é:A:Ala; C:Cys; D:Asp; E:Glu; F:Phe; G:Gly; H:His; I:Ile; K:Lys; L:leu; M:Met; N:Asn; P:Pro; Q:Gln; R:Arg; S:Ser; T:Thr; V:Yal; W:Trp; I:Tyr.
Figura 4: Quantificação da divergência de sequência en tre as proteínas homólogas das diferentes répljl cas. A parte A de cada quadro fornece resultados deduzidos a partir dos alinhamentos dois a dois, utilizando-se como referén cia as proteínas de ^^Y^u’ a parte B fornece as de ΙΑΥ·ρ,Τ[Τ co mo referência.
Fontes: Kuesing et al., 1985 para HTL7-3; oarchez-Pes-cador et al., 1985, para ARY2 e Wain-Hobson et al., 1985 para IAY-g^u* Para cada caso dos quadros a dimensão em aminoácidos da proteína (calculada a partir do primeirp resíduo de metionina ou a partir do início de orf para pol) está representado na par te esquerda superior. Por baixo estão representados o número de anulações (esquerdo) e inserções (direito) necessárias para o alinhamento. Os números maiores em evidência representam a percentagem de substituições de aminoácidos (excluídas as in-serções/anulações). Os alinhamentos dois a dois foram construí_ dos com o auxílio de computador (Wilburg e Lipman, 1983), uti-
lizando-se um intervalo de interpolação de 1, factor de multipli cação de 1 e janela de 20, excepto para os domínios de hipervaria bilidade de env onde o número de omissões se tornou mínimo e que são alinhados essencialmente como se mostra na figura 3· A sequência das proteínas previstas codificada por orf E de HTLV-3 não foi comparada por via de uma terminação prematura re lativa a todas as outras réplicas.
Figura 5: Variabilidade das proteínas do invólucro do vírus da SIDA.
Para cada posição x do alinhamento de env (fig. 3) a variabilidade V(x) foi calculada como um número de diferentes aminoácidos na posição x.
Os tracejados nos alinhamentos são considerados como outros aminoácidos. Para um alinhamento de A proteínas V(x) varia de 1 (aminoácidos idênticos em quatro sequências) até 16 (quatro diferentes aminoácidos): Este tipo de representaçro foi anteriormente utilizado numa compilação da sequência AA de regi_ ões variáveis de imunoglobulinas (Wu e Kabat, 1970). As setas verticais indicam os sítios de clivagem; os asteriscos represen tam sítios de IT-glicosilação potenciais (1T-X-S/T) conservadas em todas as quatro .réplicas; os triângulos pretos representam resíduos de cisteína conservados. Os losangos pretos marcam os três domínios hidrófobos principais. OMP: proteínas da membra_ na exterior; TMP: proteínas da transmembrana; sinal: péptido sinal; Hyl, 2, 3· domínios hipervariáveis.
Figura 6: Eeplicações directas nas proteínas das dife rentes réplicas d0 vírus da SIDA.
Estes exemplos são derivados das sequências alinhadas / - 28 - das omissões (a,b), P(c,d) um env (e,f,g,h) representados na fig. 3· Os dois elementos da replicação directa estão enquadra dos, enquanto que posições degeneradas estão a tracejado. A presente invenção portanto, diz respeito mais espe-cificamente ès proteínas, polipéptidos ou glicoproteínas que in cluem as estruturas polipeptídicas representadas no desenho. O primeiro e 0 último resídu de aminoácidos destas proteínas, po_ lipéptidos ou glicoproteínas transportam números calculados a par tir do primeiro aminoácido das cadeias de leitura abertas em rela_ ção, ainda que estes números não correspondam exactamente aos dos relacionados com as proteínas LAV^j, ou roais do que as de Í^T-gRu correspondentes ou sequências representadas nas figuras 3A, 3>B e 30* Assim, um número que corresponda a um primeiro resíduo de aminoácido, de uma proteína de LAT^-p-p corresponde ao número do primeiro resíduo amino-acilo da proteína corresponden te de que? em qualquer das figuras 3A, 3B ou 3C está em alinhamento directo com 0 primeiro aminoácido correspondente da proteína LAV^j. As sequências relacionadas podem ser lidas nas figuras de 7A a 7J e de 8A até 81, até â extensão onde elas não se apresentam com suficiente evidência nas figuras 3A até 3B.
As sequências proteicas preferidas da presente invenção prolongam-se desde o 'primeiro" e do "último" resíduo de aminoáci do correspondentes (também foi feita referência â proteína(s) ou ss fracções de glicoproteína(s) que incluem parte das sequên cias seguintes: - 29 -
Proteínas OMP ou gp 110, que incluem os precursores: 1 até 530 OMP ou gp 110 sem precursor: 34 - 530 sequências que transportam ΊΜΡ ou a proteína gp 41: 531 - 877, especialmente 680 - 700 cadeias bem conservadas de OKP: 37 - 130 211 - 289 e 488 - 530
cadeia bem conservada detectada na extremidade de OMP e no início de TMP: 490 - 620.
As proteínas que contém ou que consistem em "extensões bem conservadas" são de interesse especial para a produção de composições imunogénicas e (de preferência em relação com as extensões da proteína env) de composições de vacinas contra vírus LAV da classe 1, tal como se definiu antes. A presente invenção diz respeito mais particularmente, a todos os fragmentos de DHA que foram mais especificamente re feridos nos desenhos e que correspondem a cadeias de leitura abertas. Deve-se entender que um técnico nesta matéria será capaz de obter todas elas, por exemplo, por cisão de um DNA completo que corresponde ao genoma completo quer de LAV^jj ou de LAV.
MA.L , tal como clivagem por digestão completa ou parcial da quele com enzima de restrição apropriada e seguido de recolha dos fragmentos importantes. Os diferentes DKAs descritos antes, po- - 30 - / L. i dem ser recrutados para representarem também uma fonte de fragmen tos apropriados. As técnicas descritas no pFedido de patente de invenção PCT para o isolamento de fragmentos que podem, em segui da, ser incluídos em plasmídeos apropriados, também são aqui aplicáveis.
Evidentemente podem ser utilizados outros métodos. Alguns deles foram exemplificados no pedido de patente de invenção europeia M 178 978, depositado em 17 de Setembro de 1985· Por exemplo, podem-se referir os seguintes métodos: a) Pode transfèctar-se DM para células de mamífero com marcadores de selecção apropriados mediante uma variedade de téç_ nicas, precipitação com fosfato de cálcio, polietilenoglicol, fusão do protoplasma, etc. b) . Podem clonar-se fragmentos de DM que correspondem . a genes em vectores de expressão para B. coli , leveduras ou cé lulas de mamíferos e as proteínas resultantes purificadas. c) Pode cindir-se DM proviral (fragmentado) em vectores de expressão procarióticos para gerar polipéptidos de fusão. Recom binantes que produzam proteÍDas de fusão antigenicamente com-petantes, podem ser identificados por sondagem simples dos recom binantes com anticorpos contra antigénios LAY. A presente invenção também se refere mais especifica-mente a recombinantes de DM, particularmente vectores modificados que incluem qualquer das sequências de DM precedentes e adaptados para transformar microrganismos ou células correspon dentes, particularmente células eucarióticas tais como leveduras, por exemplo saccharomyces cerevisiar ou células eucarióticas su periores, particularmente células de mamífero e para permitir a - 31 -
V., · / .»· expressão das referidas sequências de DNA nos correspondentes microrganismos ou células. Métodos gerais deste tipo foram relem trados no pedido de patente de invenção internacional PCT re ferido antes, PCT/EP 85/0054-8, depositado em 18 de Outubro de 1985.
Mais especificamente a presente invenção refere-se a tais vectores recomtinantes de DHA modificados por meio das sequên cias de DKA referidas antes e que são capazes de transformar células eucarióticas superiores particularmente células de mamí feros. De preferência, qualquer das sequência referidas entes são colocadas sot controlo directo de um promotor contido nos re feridos vectores e que é reconhecido pelas polimerases das referidas células tal que os primeiros codões nucleotídicos ex pressos correspondem aos primeiros tripletos das sequências de DNA definidas antes. De acordo com a presente invenção tamtém se referem os fragmentos de DNA correspondentes que podem ser obtidos por qualquer método apropriado, a partir dos genomas de LAV-^-j- ou LAV^^ ou dos correspondentes cDNAs. Por exemplo, um método que compreende a cisão dos referidos genomas de ΊΑΥ ou de cDNAs por meio de enzimas de restrição, de preferência ao nível dos sítios de restrição que circundam os referidos fragmentos e unir as suas extremidades respectivamente opostas, re cuperar e identificar os fragmentos obtidos de acordo com as dimen sões e, se necessário, verificar os seus mapas de restrição ou sequências nucleotídicas (ou por meio de reacção com anticorpos monoclonais especificamente dirigidos contra os epitopes transpoj? tados pelos polipéptidos codificados pelos referidos fragmentos de DNA), e ainda, se necessário, guarnecer as extremidades do fragmento, por exemplo, por meio de um enzima exonucleolítico - 32 -
a > tal como Ba 131, com a finalidade de controlo das sequências nucleotídicas desejadas das extremidades dos referidos fragmentos de DM ou, inversamente, reparar as referidas extremida des com enzima de Klenow e possivelmente unir o último a frag mentos polinucleotídicos sintético designados para permitir a reconstituição das extremidades nucleotídicas dos referidos fragmentos. Aqueles fragmentos podem.em seguida ser inseridos em qualquer dosvecfcores referidos para originarem a expressão dos polipéptidos correspondentes pelas células transformadas com estes. O polipéptido correspondente pode em seguida ser recuperado a partir das células transformadas e, se desejado, após a sua lise, ser purificado por meio de métodos, tal como electr£ forese. 35 desnecessário referir que todos os métodos convenci£ nais para realizar estas operações podem ser utilizados. A pr£ sente invenção também se refere mais especificamente a sondas clonadas que podem ser obtidas partindo de qualquer fragmento de DM, de acordo com esta invenção, portanto de DMs recombi nantes que contém tais fragmentos, particularmente qualquer plasmídeo amplificável ou células procarióticas ou eucarióticas que transportam os referidos fragmentos.
Utilizando fragmentos de DM clonados como uma sonda de hibridação molecular - quer por mareagem com radionucleôtidos ou com reagentes fluorescentes - EM de vírus LAV pode ser detectado directamente no sangue, líquidos corporais e produtos do sangue (por exemplo dos factores anti-bemofílicos, tais como os concen trados do Fator VIII) e vacinas, isto é, vacina de hepatite B. Ficou já demonstrado que o vírus completo pode ser detectado nos sobrenadantes de cultura de LAV que produz células. 0 método - 33 - / L.,„ / .¾ apropriado para se obter esta detecção inclui a imobilização do vírus num suporte, por exemplo, filtros de nitrocelulose, etc., desintegração do vírus e bibridação com sondas marcadas (radiomarcadas ou "colã" fluorescentes ou marcadas com enzima). Uma tal via foi já desenvolvida para o vírus da hepatite B no sangue periférico de acordo com SCOTTO J. et al., Hepatoly, 3, 379 - 384 (1983).
Sondas de acordo com a presente invenção também podem ser utilizadas para sondagem rápida do DM genómico derivado de tecidos doentes com sintomas relacionados com LA.V, para se verificar se 0 DM proviral ou EM presentes nos tecidos do hospedeiro e noutros tecidos, pedem ser relacionados com os de ^ELI ou %L··
Um método que pode ser utilizado para uma tal sondagem inclui as seguintes fases: extraeção do DM do tecido, cisão com enzimas de restrição do referido DM, electroforese dos fragmentos e mancha de Southern do DM genómico a partir dos tecidos, hibridação subsequente com DM proviral IAY clonado mar cado. Também se pode usar a hibridação in situ.
Os líquidos e tecidos linfáticos e outros tecidos não linfáticos de seres humanos, primatas e outras espécies de mamí_ feros também podem ser sondados para se verificar se existe ou tro retrovírus relacionado de uma forma evolutiva. Os métodos referidos antes, podem ser utilizados, embora a hibridação e la vagens devam ser feitas sob condições não restritas.
Os fragmentos de DM ou os DMs de acordo com a presente invenção também podem ser utilizados para a obtenção da expres. são dos antigénios virais de IiâV^^ ou LA7^^ com fim de diagnós. tico. - 3*- - / A presente invenção refere-se igualmente aos próprios polipéptidos, quer sintetizados quimicamente, isolados de prepara ções virais, quer expressos por diferentes DNAs da presente invenção, especialmente por orfs ou seus fragmentos, em _hospedei_ ros apropriados especialmente hospedeiros eucarióticos ou procarió ticos após a sua transformação com um vector apropriado previa-mente modificado pelos correspondentes DNAs.
De um modo mais geral a presente invenção também se refere a qualquer dos fragmentos polipeptídicos (ou moléculas par ticularmente glicoproteínas que possuem a mesma estrutura poli peptídica que os polipéptidos referidos antes) que transportam um epitope característico de uma proteína ou uma glicoproteína de ou LkVfl&L cujo polipéptido ou molécula que possuem extremidades N-terminal e C-terminal respectivamente livres ou independentes uma da outra, ligadas de modo covalente a outros aminoécidos diferentes que estão normalmente associados com elas nos polipéptidos ou glicoproteínas maiores do vírus IAV em que os aminoécidos ultimamente referidos são então livres ou perten cem a outra sequência polipeptídica. Particularmente a presente invenção refere-se a polipéptidos híbridos que contém qualquer dos polipéptidos que transportam o epitope, que foram, definidos mais especificamente antes, recomtinados com outros fragmentos polipeptídicos normalmente estranhos a proteínas de IAV que possu em dimensões suficientes para fornecerem uma imunogenicidade aumen tada do referido polipéptido que incorpora o epitope, sendo os fragmentos polipeptídicos estranhos referidos quer inertes do pon to de vista imunogénico ou não interferindo com as propriedades imunogénicas do polipéptido que incorpora o epitope.
Tais polipéptidos híbridos que podem conter de 5 até 150 ou mesmo 250 aminoácidos, usualmente consistem em produtos de expressão de um vector que contém ab initio uma sequência de áci dos nucleicos exprimível sob controlo de um permutador apropria do ou replicão num hospedeiro adequado, sequência de ácidos nu cleicos que tenha sido contudo anteriormente modificada por inserção de uma sequência de DHA que codifica o referido polipéjD tido" que transporta o epitope.
Os referidos polipéptidos que incorporam 0 epitope, par ticularmente aqueles dos aminoácidos do C-terminal e do E-termi. nal são livres e são também acessíveis por meio de síntese de química de acordo com técnicas conhecidas na química das proteí_ nas. A síntese de péptidos em soluções homogéneas e em fase sólida é bem conhecida. A este respeito pode-se recorrer ao método de síntese em solução homogénea descrito por KOUBENWEYL no trabalho intitu lado "Methoden der Organischen Chemie" (Methods of Organic Chemis try) editado por E. Vunsch, vol I, 15-1 e II, Ί'ΗΙΕΜΕ, Stuttgart 1974.
Este método de síntese consiste em condensações sucessivas quer de aminoácidos sucessivos em dois numa ordem adequada ou em fragmentos peptídicos sucessivos previamente obtidos ou for mados e que contém já diferentes resíduos aminoacílicos numa or dem respectivamente adequada. Excepto para grupos carboxilo e ami no que serão utilizados na formação das ligações peptídicas, de ve ser tomada precaução para proteger previamente todos os outros grupos reactivos produzidos por estes grupos ou fragmentos - 36 -
aminoacíclicos. Contudo, antes da formação das ligações peptíd_i cas, os grupos carboxilos são activados de um modo vantajoso de acordo com métodos convencionais utilizados na síntese de pépti dos. Alternativamente, pode-se recorrer âs reacções de ligação que põem em jogo reagentes de ligação convencionais, p. ex. do tipo carbodiimida como l-etil-3-(3-dimetil-aminopropil)-carbodi_ imida. Quando o grupo aminoácido utilizado transporta um grupo amina adicional (p. ex. lisina) ou outra função ácida (p. ex. ácido glutâmico) estes grupos podem ser protegidos por grupos carbobenzoxi ou t-butiloxicarbonilo no que diz respeito a gru pos amina ou por grupos de éster t-butílico, no que diz respei_ to a grupos carboxílicos. Procedimentos semelhantes estão disponíveis para a protecção de outros grupos reactivos. Por exem pio, o grupo SH (p. ex. na cisteína) pode ser protegido por um grupo acetamidometilo ou parametoxibenzilo.
No caso de síntese progressiva aminoácido a aminoácido, a síntese inicia-se de preferência por condensação do aminoáci do de C-terminal com o aminoácido que corresponde ao grupo ami, noacilo vizinho na sequência desejada e assim por diante, passo a passo até ao aminoácido do N-terminal. Outra técnica preferida pode ser utilizada de acordo com a descrição de R. T. Kerri-field em "Solide phase peptide synthesis" (J.‘ Am. Ciiem. Soc., 4-5, 2149 - 2154).
De acordo com 0 processo de Merrifield 0 primeiro amino ácido do O-terminal da cadeia é fixado a uma resina polimérica porosa adequada, por meio do seu grupo carboxílico, 0 grupo ami no do referido aminoácido é em seguida protegido p. ex. por um grupo t-butiloxicarbinilo.
Quando o primeiro aminoácido do C-terminal está fixado deste modo â resina, o grupo protector do grupo amina é eliminado por lavagem da resina com ácido, isto é, com ácido triflu£ roacético, quando o grupo protector do grupo amina é um grupo t-butiloxicarbonilo.
Em seguida, o grupo carboxílico do segundo aminoácido que é para fornecer o segundo grupo aminoacilo da sequência peptí-dica procurada, é ligado ao grupo amina desprotegido do aminoá_ eido do C-terminal fixado à resina. De preferência, o grupo car boxilo deste segundo aminoácido foi activado, p. ex. por meio de di-ciclo-hexil-carbodiimida, enquanto que o seu grupo amina foi produzido, por exemplo, por um grupo t-butiloxicarbonilo. A pri meira parte da cadeia peptídica desejada que compreende os pri meiros dois aminoácidos, é obtida deste modo. Como previamente, o grupo amina é então desprotegido e pode-se processar a seguir a fixação do grupo aminoacilo seguinte e assim por diante até que se tenha obtido todo o péptido idealizado.
Os grupos protectores dos diferentes grupos laterais, se existem, da cadeia peptídica formada deste modo podem, em seguida, ser eliminados. 0 péptido idealizado pode em seguida ser separado da resina por exemplo por meio de ácido clorídrico e fi nalmente recolhido sob uma forma pura da solução ácida de acordo com processos habituais.
No que se refere às sequência peptídicas de menor dimen são e que transportam o epitope ou um determinante imunogénico e mais particularmente aquelas que são rapidamente obtidas por síntese química, pode ser necessário, com a finalidade de se au mentar o seu caracter imunogénico in vivo, ligar ou conjuga-las dum modo covalente a uma molécula veicular não tóxica e aceitável no ponto de vista fisiológico.
Como exemplo de moléculas que servem de transporte ou de suportes moleculares que se podem utilizar para se obterem os conjugados de acordo com a presente invenção, mencionar-se-ão proteínas naturais tais como o toxoidejtetânico, ovalbumina, seroalbumina, hemocianinas, etc. Também podem ser utilizadas como veículos macromoléculas sintéticas, p. ex. polisinas ou poli (D-L-alanina)-poly(L-Lisina)s.
Podem-se utilizar outros tipos de veículos macromolecu lares com pesos moleculares geralmente superiores a 20 000 e que são bem conhecidos na bibliografia.
Os conjugados podem ser sintetizados por processos conven cionais, tais como os descritos por Frantz e Robertson em "Infect. and Iramunity", 33» 193 - 198 (1981), ou por P.E. Kauffman em "Applied and Environmental Microbiology", Outubro, vol. 42 n2 4, 611 - 614, 1981.
Por exemplo, podem-se utilizar os seguintes agentes de ligação: aldeído glutárico, cloroformato de etilo, carbodiimidss solúveis na água (N-etil-M'(3-dimetilaminapropil)carbodiimidas, HC1), diisocianatos, bis-diazobenzidina, di- e tricloro-s-tria-zinas, brometos de cianogeno, benzoquinona, assim como agentes de ligação referidos em "Scand J. Immunol., vol 8, p. 7 - 23· 1978 (Avrameas, Ternynck, guesdon).
Qualquer processo de ligação pode ser utilizado para ligar um ou vários grupos reactivos do péptido por um lado, e um ou vários grupos reactivos do veículo por outro lado. Ainda se pode obter a ligação de um modo vantajoso entre os grupos carboxilo e - 39 -
/ ,, amina transportados pelo péptido e o veículo ou vice-versa na presença de um agente de ligação do tipo utilizado na síntese das proteínas, isto é, l-etil-3-(3-dimetilaminopropil)-carbodi_ imida, N-hidroxibenzotriazo, etc. A ligação entre os grupos amina respectivamente prove nientes do péptido e do veículo também pode ser realizada com glutaraldeído, p. ex. de acordo com método descrito por BOQUET; P. et al. (1982) Holec. Immunol., 19, 1441 - 1549, quando o veículo é a hemocianina. A imunogenicidade de péptidos que transportam epítopes pode também ser reforçada por a sua oligomerização, por exemplo, na presença de glutaraldeído ou qualquer outro agente de ligação apropriado. Em particular a presente invenção refere-se a oli gómeros imunogénicos solúveis na água obtidos deste modo, que com preendem particularmente desde 2 a 10 unidades monoméricas.
As glicoproteínas, proteínas e polipéptidos designados geralmente aqui como "antigénios" da presente invenção se obtidos por métodos tais como os descritos nos pedidos de patente de invenção primeiramente referidos nesta memória, num estado puri_ ficado de preparações de vírus ou IAYmTi ou - como no que diz respeito mais particularmente a péptidos - por meio de sínte se química, são utilizáveis nos processos para a detecção da pre sença de anticorpos anti-LAY em meios biológicos, particularmente líquidos biológicos, tais como o soro humano ou animal, especialmente com a finalidade de uma possibilidade de diagnóstico de LAS ou SIDA.
De um modo particular a pressite invenção refere-se a um processo de diagnóstico in vitro que utiliza uma glicoproteína - 40 -
ê do invólucro (ou de um polipéptido que transporta um epítope desta gliccproteína proveniente de ou Para a detecção de anticorpos anti-IAV nos soros de indivíduos que os transportam. Outros polipéptidos- em particular os que transportam um epítope de uma proteína nuclear - podem ser também utilizados.
Um aspecto preferido do processo da presente invenção compreende: - colocação de uma quantidade pré-determinada de um ou vá rios dos referidos antigénios nas cavidades de uma microplaca de titulação; - a introdução de diluições crescentes do líquido biológico, isto é, soro para ser diagnosticado nas mesmas cavidades; - incubação de microplaca; - lavagem cuidadosa da microplaca com tampão apropriado; - adição nas cavidades de anticorpos marcados específicos dirigidos contra imunoglobulinas sanguíneas;e - detecção de o complexo formado pelo antigénio-anticorpo que será o indicativo da presença de anticorpos LAV no referido líquido biológico. A marcação dos anticorpos de anti-imunoglobulina pode ser obtida de um modo vantajoso por meio de uma enzima selecci£ nada entre as enzimas que são capazes de hidrolisar um substra_c to, o qual sofre uma modificação da sua absorção-radiação, pelo menos numa'dada banda de comprimentos de onda pré-determinados. A detecção do substracto, de preferência em comparação com um controlo, proporciona então uma medida dos riscos potenciais ou da presença efectiva da doença.
Assim, preferem-se métodos imuno-enzimáticos ou também / - 41 - / detecções por imuno-fluorescência, em particular de acordo com a técnica ELISA. As titulações podem ser determinadas por imuno-fluo rescência ou determinações imuno-enzimáticas directas ou indire£ tas. Também se podem realizar titulações quantitativas dos anticorpos nos soros estudados. A presente invenção também se refere a conjuntos para diagnósticos, propriamente ditos, para a detecção in vitro de anticorpos contra vírus IAV, conjuntos que compreendem qualquer dos polipéptidos identificados antes e todos os reagentes biológicos e químicos, assim como equipamento necessário para reali zar o ensaio de diagnóstico. Conjuntos preferidos compreendem todos os reagentes necessários para se realizar o ensaio ELISA. Assim, conjuntos preferidos incluirão também qualquer dos referidos polipéptidos, tampões apropriados, anti-imunoglobulinas humanas que podem ser -.rti-imunoglobulinas humanas msrcadss por uma molécula imunofluorescente ou por uma enzima. Em última ins tância os conjuntos preferidos podem também compreender um subs tracto hidrolisável pela enzima e proporcionando um sinal, em par ticular uma absorção modificada de uma variação, pelo menos para um determinado comprimento de onda, sinal que e indicativo da pre sençe de anticorpo no líquido biológico a analisar com o referido conjunto.
Pode ser de facto vantajoso utilizando-se vár^a-- proteínas ou polipéptidos e não apenas ambos os e LAY^j., mas também qualquer um ou ambos destes conjuntamenue com proteínas homólogas ou polipéptidos descritos antes provenientes de vírus, p, ex. de LAV^-g ou HTLV-III ou AEY, etc. A presente invenção também se refere a composições para ! - 42 - vacinas cujo principio activo deve ser constituído por qualquer antigénio, isto é, os antigénios completos dos poliplptidos des. critos antes quer de LAV^^-ou ou de ambas, especialmen te gp 110 purificada ou seus fragmentos de imunogénios polipép tidos de infusão ou oligopéptidos em associação com o veículo farmacêutico ou fisiologicamente compatível. 0 primeiro tipo de principio activo dos referidos imu nogénios é o imunogénio gp 110.
Outros princípios activos preferidos a considerar neste aspecto, consistem nos péptidos que contêm menos de 250 unidades de aminoácidos, de preferência menos do que 150, particularmente entre 5 e 150 resíduos de aminoácidos como deduzível dos genomas completos de ItAV-^j e IáY^j, e ainda mais preferido aqueles pépti dos que contêm um ou mais grupos colhidos entre Asn-X-Ser e Asn-X-Ser como se referiu antes. Péptidos preferidos para se util_i zarem na produção de princípios para vacinação são péptidos desde (a) a (f) como referido antes. A título de exemplo, sem carácter limitativo, podem-se mencionar que as doses de vacina apropriadas para composições são as que são capazes de provocar anticorpos in vivo no hospedeiro, particularmente num hospedeiro humano.
Poses apropriadas estão entre os limites de 10 e 500 microgra-mas de pol:péptido, proteína ou glicopróteína por quilograma, por exemplo entre 50 e 100 miligramas por quilograma.
Os diferentes péptidos de acordo com esta invenção também podem ser utilizados eles próprios para a produção de anticorpos, de preferência anticorpos monoelonais específicos dos diferentes péptidos respectivamsnte. Para a produção de híbrido, mas que segregam os referidos anticorpos monoelonais, são utiliza. dos métodos de produção e de sondagem convencionais. Estes anti- corpos monoclonaís que eles próprios fazem parte da presente in venção, então fornecem elementos deveras úteis para a identificação e, ainda, determinação de proporções relativas dos diferen tes polipéptidos ou proteínas em amostras biológicas, particu-larmente amostras búmanas-que contém vírus ΊΑΥ ou virus com eles relacionados. A presente invenção também se refere a hospedeiros (célu las eucarióticas ou procarióticas) que são transformados pelos recombinantes referidos antes e que são capazes de exprimir os referidos fragmentos de DNA.
Finalmente, a presente invenção também diz respeito a ve£ tores para a transformação de células eucarióticas de origem hu mana, particularmente linfócitos, a polimerase dos que são capazes de reconhecer os vírus LTRs de LAV.
Especialmente os vectores referidos são caracterizados pela presença de um IffR de LAV, sendo referido LTR então activo com o pro motor que possibilita a transcrição eficiente e translacção num hospedeiro apropriado, de uma inserção de uM. que codifica para uma proteína determinada, colocada sob'o seu controlo. É desnecessário dizer que a presente invenção se estende a todas as variantes de genomas e fragmentos de DHA correspondeu tes (ORFs) que possuem propriedades substancialmente equivalentes, todos os referidos genomas que pertencem a retrovírus que podem ser considerados como equivalentes a IAY. neve-se entender que as reivindicaçõse que se seguem também devem ser compreendidas como abrangendo todos os equivalentes dos produtos (glicoproteínas polipéptidos, Jilâs, etc.) pelo que um equivalente e um produto, isto é, um polipéptido que - 44 - * se possa distinguir de um outro específico definido em qualquer das referidas reivindicações, seja através de um ou vários ami noacidos, desde que ainda possua essencialmente as mesmas propriedades imunológicas ou imunogénicas. Uma regra semelhante de equivalência deverá aplicar-se aos DHA.S, entendendo-se que a re gra de equivalência será então vinculada como regra de equivalên cia pertencente aos polipéptidos codificador por eles.
I
Também se deve entender que toda a bibliografia aqui re ferida, antes ou posteriormente, e todos os pedidos de patente de invenção ou patentes de invenção não especificamente identificados mas que complementam as especificamente designadas aqui, devem ser consideradas como incorporadas, aqui por referência. »
Também deve ser ainda mencionado que a presente invenção também se refere a composições imunogénicas que contêm de preferên cia não somente qualquer dos polipéptidos mais especificamente identificados, antes e que possuem sequências de aminoácidos de “TEDI e de MYML que foram identificados, mas que correspondem a sequências peptídicas para também definir proteínas MB. JNo que se refere a este facto, a presente invenção refe re-se mais particularmente a polipéptidos especiais que possuem as sequências que correspondem mais especificamente âs sequências M?-^ que foram referidas antes, isto é, sequências que se prolorp gam entre o primeiro e o último aminoácidos das próprias proteínas de , isto é, os polipéptidos quc possuem sequências con tidas em MY^^ OHP ou MV-g^-g TMP ou sequências que se prolongam sobre ambas, particularmente aquelas que estão entre as posi_ ções seguintes dos aminoácidos incluídos ns. cadeia dr leitúra aberta env do genoma de LiV^j,
1 — 530 34 — 530 e mais preferivelmente 531 — 877, particularmente 680 — 700 37 — 130 211 — 289 488 — 530 490 — 620.
Estas sequências diferentes podem ser utilizadas para qual_ quer um dos fins referidos antes e em qualquer das composições que foram descritas.
Finalmente, a presente invenção também se refere a anti corpos diversos que podem ser formados especificamente contra diversos péptidos que aqui foram descritos, particularmente anticorpos monoclonais que os reconhecem de um modo específico.
Os hibridomas correspondentes que podem ser formados a partir de células de baço previamente imunizadas com esses péptidos que são fundidos com células de mieiorna apropriadas e escolhidas de acordo com processos convencionais, também fazem parte desta invenção. 0 clone E-H12 proveniente do fago A. (lambda) derivado de células infectadas com foi depositado na "Collection Na- tionale des Cultures de Micro-organismes" (National Collection of Cultures of Microorganisms) (CNCM) do Instituto Pasteur de Paris, em França sob o número de acesso 1-550, em 9 de Maio de 1986. 6 - 46 - 0 clone M-Hll de fago ]\ derivado de células infectadas com foi depositado na CNCM sob o número de acesso 1-551? em 9 de Maio de 1986.

Claims (9)

  1. -47-
    REIVINDICAÇÕES 1.- Processo para a preparação de um DNA clonado, caracte-rizado pelo facto de se inserir em um vector, por recombinação genética, um cDNA que consiste quer em um cDNA representado a seguir: ICCTCTCTCTGGTTAGACCAGATTTGAGCCTGGGAGCTCTCTGGCTAGCIAGGGAACCCAC tccttaagcctcaataaagcttcccttgactccttca^gtagtgtgtgcccgtctgttgt • · · 100 · · gtgactctggtaactagagatccctcagacccctttagtcagactgcaaaatcictagca U5t-i · · · · · · CTpGCCCCCGAACAGGGACCTGAAAGCGAAAGTAGAACCAGAGGAGCTCTCTCGACGCAG • 200 · · · · gactcggcttcctgaagcgcgcacggcaagaggcgaggggcagcgactggtgagtacgct . . . . 300 * WetGlyAlaArgAl*SerVclLeuSer aaaatttttgactagcggaggctaga/.ggagagagàtgggtgccagagcgtcagtattaa GlyGlyLysLeuAspLysTrpGluLyslleArgLeuArgProG lyGlyLysLysLysTyr gcgggggaaaattagataaatgggaaaaaattcggttacggccaggaggaaagaaaaaat · · 400 · · ArgLeulysEisIleValTrpAlaSerArgGluLeuGluArgTyrAlaLeuAsrProGly atagaciaaaacatatagtatggccàagcagggagctagaacgatatgcacttaatcctg LeuLeuGluTbrSerGluGlyCysLytGlcIlelleGlyGlnLauGlnProAlalleGlD GCCITTTAGAAACATCAGAAGGCTGTAAACAAATAATAGGGCAGCTACAACCAGC7ATTC • 300 v · » · ThrGlyThrGluGluLeuArgSerLeulyrAsnThrValAlaThrLeuTyrCysValHis AGACAGGAACACAAGAACTTAGATCATTATATAATACACTAGCAACCCTCTATTGTGTAC • · · · · 600 LyeGlylleAspValLysAspTbrLysGluAlaLeuGluLytMetGluGluGluGloAsa ATAAAGGAATAGATGTAAAAGACACCAAGGAAGCTTTAGAAAAGATGGAGGAAGAGCAAA LysSerLyELysLysAlaGlnGlnÀlaAlaAlaAspTbrGlyAsr.AErSerClnValSer ACAAAAGTAACAAAAACGCACAGCAAGCAGCAGCTGACACAGGAAACAACAGCCAGGTCA • · . 700 · · GlnAEr.TyrProlleValGlnAsnLeuGlDGlyGlcHetPalHisGlnAlalleSerPro GCCAAAATTATCCTATAGTGCAGAACCTACAGGGGCAAATGGTACATCAGGCCATATCAC ArgTbrLeuAErAlaTrpValLyfiValIleGluGluLyEAlaPheSerPxoGluVallle CTAGAACTITGAACGCATGGGIAAAAGTAATAGAAGAAAAGGCTTTCAGCCCAGAAGTAA • 800 · · · · ProL'et?LcSerAlaLeuterGluGlyAleThr?rcGlr.AspLeuAsrThrHetLeuAEr TACCCÁTGTTTTCAGCAT TAlCAGAAGGAGCCACCCCACAAGATT7AAACACCATGCTAA • · » · . 9 00 TfcrVclGlyGlyKisC-lrAlaAlaUetGlclJetLeulysCluThrlleAETiGluGluAla ACACAGTGGGGGGACATC AAGCAC-CCATGC AAATGC 7AAAAGAGAC CAT CAATC-AAGAAG • · · · · « AlaGluTrpAspArgLeuKisProValHisAlaGlyProlleAlôProGlyGlnlletArg CTGCACAATGGCATAGGTTACATCCAGTGCATGCAGGGCCTATTGCACCAGGCCAGATGA • · « 1000 · · GluProArgGlySerAspIleAlaGlyThrThrSerTbrLeuGlnGluGlcIleAlaTrp GAGAACCAAGGGGAAGTGATATAGCAGGAACTACTAGTACCCTTCAGGAACAAATAGCAT l!ctThrSerAstiProProIleProValGlyGlulleTyrLysArgTrpIleIleValGly CGATCACAAGTAACCCACCTATCCCACTACCAGAAATCTATAAAAGATGGATAATTGTGG • 1100 · · » · LeuAsr.LysIleValArgMetTyrSerProValSeiIleleuAípIleArgGlnGlyPro G/.TTAAATAAAATAGTAAGAATGTATAGCCCTGTCAGCATTTTGGACATAAGACAGGC-AC 1200 -49- LysCluProPheArgAepTyrValAapArgPheTyrLyeThrLeuÀTgAlaGluGlijAl· CAAAGGAACCTTTTAGAGACTATGTAGACCGCT7CTATAAAACTCTAAGAGCCGAGCAAG • I · · · * SerGlnAcpValLysAfnTrplIetThrGltiThrLeuLeuValGlnAsnAlaAsnFroAsp C7TCACAGGATGTAAAAAATTCGATGACAGAAACC7TGTTGGTCCAAAATGCAAACCCÁG • · · 1300 t · CysLysThrlleLeuLysAlaLeuGlyProGlnÁlaThrLeuGluGluMetMetThrAla ATTGCAAGACTATC7TAAAAGCATTGGGACCACAGGCTACACTAGÂAGAAATGATGACAG ···«·· CysGlnGlyValGlyGlyPxoSerllisLysAlaArgV&lLeuAlaGluAlalIetSerGln CATGTCAGGGAGTGGGGGGGCCCAGCCATAAAGCAAGAGTTCTGGCTGAGGCAATGAGCC • 1400 · · * · AlaThxAsnSexVa lThxThxAlaMetlJetGlnAxgG lyAsnPheLysG lyProArgLya AAGCAACAAATTCAGTTACTACAGCAATGATGCAGAGAGGCAATTTTAAGGGCCCAAGAA • · · · 1500 IlelleLysCysPheAsnCysGlyLysGluGlyBisIleAlaLysAsnCysArgAlaPro AAATTATTAAGTGTTTCAATTGTGGCAAAGAAGGGCACATAGCAAAAAATTGCÁGGGCCC • · · · · · ArgLysLysClyCysTrpArgCysGlyLysGluGlyHisGlnLeuLysAspCysTtarGlu CTAGGAAAAAGGGCTGTXGGAGATGTGGAAAGGAAGGACACCAACTAAAAGATTGCACTG • pOL · · 1600 > · |PhePbeAigGluAsnLeuAlaPheProCInGlyLysAlaGlyGluLcu AxgGlnAlaAsnPbeLeuGlyAxglleTxpPxoSexHisLysGlyAxgPxoGlyAsnPhe AGAGACAGGCTAATTTTTTAGGGAGAATTTGGCCTTCCCACAAGGGAAGGCCGGGGAACI • · · · · · SerPxoLyíGlnThrArgAlaÀsnSexPxoThxSeiÀxgGluLeuÀxgValTxpGlyAxg LeuGlnSerArgProGluPxoThxAlaPxoPxoAlaGluSexPheGlyPheGlyGluGlu TTCTCCAAAGCAGACCAGAGCCAACAGCCCCACCAGCAGAGAGCTTCGGGTTTGGGGAAG • 1700 · · * · AspAsnProLeuSerLyaThrGlyAlaGluArgGlnGlyTbrValSerPheAsnPhePro IleThrProSerGlnLysGlnGluGlnlysAspLysGlubeuTyrProLeuThrSerLeu AGATAACCCCCTCTCAAAAACAGGAGCAGAAAGACAAGGAACTGTATCCTTTAACTTCCC • · -GAGf« · · 1*00 ClDlleThrLeuTrpGlnArgProLeuValAlalleLysIleGlyGlyGlnLeuLysGlu LysSerLeuPbeGlyAsnAspProLeuSerGlm tcaaatcactctttggcaacgaccccttgtcgcaa|taaaaatagggggacagctaaaggà • · · · · · AlaLeuLeuAspThrG lyAlaA6pAspThrVa ILeuG luGlulle t AsnLeuProG lyLys AGCTCTATTAGATACAGGAGCAGATGATACAGTATTAGAAGAAATGAATTTGCCAGGAAA • · 1900 . . TrpLysProlyslIetlleGlyGlylleGlyGlyPhelleLysValArgGlnTyrAspGln ATGGAAACCAAAAATGATAGGGGGAATTGGAGGTTTTATCAAAGTAAGACAGTATGATCA • · · · · · IleProIleGluIleCysGlyGlnLysAlalleGlyThrValLeuValGlyProTbrPro AATACCCATAGAAATCTGTGGACAGAAAGCTATAGGTACAGIATTAGTAGGACCTACGCC . 2000 .... ValAsnllelleGlyArgAsnLeuLeuThrGlnlleGlyCysTbrLeuAsnPbeProIle TCTCAACATAATCGGAAGAAATTTGTTGÀCCCAGATTGGCTGCACTTTAAATTTTCCAAT . · . · . 2100 SerProlleGluThrValProTalLysLeuLysProGlyíletAspGlyProLysValLys TAGTCCTATTGAAACTGTACCAGTAAAATTAAAGCCAGGAATGGATGGCCCAAAAGTTAA GlnTxpPxoLeuThxGluGluLyalleLysAlaLeuThxGluIleCysThrAspMetGlu ACAATGGCCATTGACAGAAGAAAAAATAAAAGCATTAACAGAAATTTGTACAGATATGGA . . . . 2700 LyaGluGlyLysIleSerArglleGlyProGluAsoProTyrAcoThrProIlePbeAla AAAGGAAGGAAAAATTTCAAGAATTGCGCCTGAAAATCCATACAATACTCCAATATTTGC • · · · · · IleLysLysLyiAspSerTbrLysTrpArgLyaLeuValAspPbeArgGluLeuAsDLya CATAAAGAAAAAAGACAGTACCAAGTGGAGAAAATTAGTAGATTTCAGAGAACTTAATAA • 23 00 · · · · ArgThrGlnAapPheTrpGluValGlnLeuGlylleProBiaProAlaGlyLeuLyiLya CAGAACTCAAGATTTCTGGGAAGTTCAATTAGGAATACCGCATCCTGCAGGGCTGAAAÀA • .· * · · 2400 LysLysSerValThrValLeuAspValGlyAspAlaTyrPbeSerValProLeuAspGlu GAAAAAATCAGTAACAGTACTGGATGTGGGTGATGCATATTTTTCAGTTCCCTTAGATGA ·»··*· AspPbeArgLysTyrTbrAlaPbeThrlleSerSerlleAsnAsoGluTbrProGlylle AGATTTTAGGAAATATACCGCCTTTACCATATCTAGTATAAACAATGAGACACCAGGGAT • · · 2500 . · ArgTyrGlnTyrAsnValLeuProGlnGlyTrpLysGlySerProAlallePbeGlnSer TAGATATCAGTACAATGTGCTTCCACAGGGATGGAAAGGATCACCGGCAATATTCCAAAG ···«·· SerlIetThrLysIleLeuGluProPheArgLyíGlnAsnProGluMetValIleTyrGln TAGCATGACAAAAATCTTAGAGCCCTTTAGAAAACAAAATCCAGAAATGGTTATCTATCA • 26 00 · · · · TyrlíetAspABpLeuTyrValGly Ser AspleuGlulleGlyGlsEisArgThrLy alie ATACATGGATGATITGTATGTAGGATCTGACTTAGAAATAGGGCAGCATAGGACAAAAAT • · · · · 2700 GluLysLeuArgGluEisLeuLeuArgTrpGlyPbeThrArgFroAspLysLysBiaGln AGAGAAATTAAGAGAACATCTATTGAGGTGGGGATTTACCAGACCAGATAAAAAACATCA ·*···· LyaGluProProPbeLeuTrpMetGlyTyrGluLeuHiaProÀ*pLysTrpThrValGln GAAAGAACCCCCATTTCTTTGGATGGGTTATGAACTCCATCCTGATAAATGGACAGTACA . . . 2800 SerlleLysLeuProGluLysGluSerTrpThrValAsnAspIleGlnAsnLeuValGlu GTCTATAAAACTGCCAGAAAAGGAGAGCTGGACTGTCAATGATATACAGAACTTAGTGGA • · · · · · ArgLeuAsnTrpAlaSerGlnlleTyrProG lyIleLysValArgGlnLeuCysLyaLeu GAGATTAAACTGGGCAAGCCAGATITATCCAGGAATTAAAGTAAGACAATTATGTAAACT . 2900 .... LeuArgGlyThrLysAlaLeuThrGluValIleProLeuTbrGluGluAlaGluLeuGlu ccttaggggaaccaaagcactaacagaagtaataccactaacagaagaagcagaattaga , . . . . 3000 LeuÀlaGluAsnArgGluIleLeuLysGluProValHisGlyValTyrTyrAspProSer ACTGGCAGAAAACAGGGAAATTTTAAAAGAACCAGTACATGGAGTGTATTATGACCCATC Lys/.spLeuIleAlaGluI leGlnLysGlnGlyHisGlyGlnTrpThrTyrGlnlleTyr AAAAGACTTAATACCAGAAATACAGAAACAAGGGCACGGCCAATGGACATACCAAATTTA * · · .3100 . . GlnGluPr oPheLysAsnLeuLysThrGlyLysTyrAl aArgítetArgGlyAlaEisThr TCAAGAACCATTTAAAAATCTGAAAACAGGAAAGTATGCAAGAATGAGGGGTGCCCACAC • · · · · · AsnAspValLysGlnLeuAlaGluAlaValGlnArglleSerTbrGluSerlleValIle TAATGATGTAAAGCAATTAGCAGAGGCAGTGCAAAGAATATCCACAGAAAGCAIAGTGAT . 3200 . . . . TrpGlyArgThrProLysPheArgLeuProIleClnLysGluThrTrpGluThrTrpTrp ATGGGGAAGGACTCCTAAATTTÀGACTACCCATACAAAAGGAAACATGGGAAACATGGTG . . . . . 3300 AlaGluTyrTrpGlnAlaThrTrpIleProGluTrpGluPbeValAanTbrFroProLeti GGCAGAGTATTGGCAAGCCACTTGGATTCCTGAGTGCGAATTTCTCAATACCCCTCCTTT • » · * · · VallyaleuTrpTyrGItiLeuGluLyaGluPr oIlelleGlyÀlaGluThrPheTyrVal AGTAAAATTATGGTACCAGTTAGAGAAGGAACCCATAATAGGAGCAGAAACTTTCTATGT • · · 3400 · · AspGlyAlaAlaAsnArgGluThrLysLeuGlyLyaAlaGlyTyrValThrAipArgGly AGATGGGGCAGCTAATAGAGAGACTAAAITAGGAAAAGCAGGATATGTTACTGACAGAGG • · · · V · ArgGlnLysValValProLeuThrAspThrThrAsnGlnLyaThrGluleuGlnAlall· AAGACAGAAAGTTGTCCCTTTGACTGACACGACAAATCAGAAGACTGAGTTACAAGCAAT • 3 500 · · · · AínLeuAlaLeuGlnAspSerGlyleuGluValAsnlleValTbrAspSerGlnTyrAla TAATCTAGCCTTGCAGGATTCGGGATTAGAAGTAAACATAGTAACAGATTCACAATATGC • · · · · 3600 LeuGlyllelleGlnAlaGlnProAspLysSerGluSerGluLeuValAsnGlnllelle ATTAGGAATCATTCAAGCACAACCAGATAAGAGTGAATCAGAGTTAGTCAATCAAATAAT • · · · · · GluGlnLeuIleLyaLysGluLysValTyrLeuAlaTrpValProAlaEisLysGlylle AGAGCAGTTAAXAAAAAAGGAAAAGGTTTACCTGGCATGGGTACCAGCACACAAAGGÀAT • · · 3700 · · GlyGlyAsnGluGlnValAspLysLeuValSerGlnGlylleArgLysValLeuPbeLett TGGAGGAAATGAACAAGTAGATAAATTAGTCAGTCAAGGAATCAGGAAAGTACTÀTTTTT ······ AspGlylleAapLysAlaGlnGluGluBisGluLyaTyrHisAsnAcnTrpArgAlaHet GGATGGAATAGATAAGGCTCAAGAAGAACATGAGAAATATCACAACAATTGGAGAGCAAT • 3800 · · · · AlaSerAspPheAsnLeuProProVaIValAlaLysGluIleValAlaSerCyaAspLya GGCTAGTGATTTTAACCTACCACCCGTGGTAGCAAAAGAAATAGTAGCTACCTGTGATAA • · · · « 3900 CyeGlnLeuLysGlyGluAlaíIe tHisG lyGlnValAspCysSerProG lylleTrpGln ATGTCAGCTAAAAGGAGAAGCCATGCATGGACAAGTAGACTGTAGTCCAGGAATATGGCA • · · · a · LeuAspCysThrBieLeuGluGlyLysVaIIleLeuValAlaValBisValAlaSerGly ATTAGATTGTACACACTTAGAAGGAAAAGTTATCCTGGTAGCAGTTCATGTAGCCAGTGG • · 4000 · · TyrlleGluAlaGluValIleProAlaGluThrGlyGlnGluThrAlaTyrPheLeuLeu CTATATAGAAGCAGAAGTTATTCCAGCAGAAACAGGGCAGGAAACAGCATATTTTCTTTT • · · · · · LysLeuAlaGlyArgTrpProValLysValValHisThrAspAsnGlySerAsnPheThr AAAATTAGCAGGAAGATGGCCAGTAAAAGTAGTACATACAGACAATGGCAGCAATTTCAC • 4100 · · · · SerAlaAlaValLysAlaAlaCysTrpTrpAlaGlylleLvsGlnGluFheGlyllePro CAGTGCTGCAGTTAAGGCCGCCTGTTGGTGGGCAGGTATCAAACAGGAATTTGGAATTCC . . * . . 4200 TyrAsnProG InSerGInGly Vai ValGluSerlletAsnLysGluLeuLysLy si lelle CTACAATCCCCAAAGTCAAGGAGTAGTAGAATCTATGAATAAAGAATTAAAGAAAATTAT GlyGlnValArgAspGlnAlaGluHisLeuLysThrAlaValGlnKetAlaValPhelle AGGACAGGTAAGAGATCAAGCTGAACATCTTAAGACAGCAGTACAAATGGCAGTATTCAT • · · 4 j00 · 9 BisAsnPheLysArgArgArgGlylleGlyGlyTyrSerAlaGlyGluArgllelleAsp ccacaattttaaaagaagaagggggattgggggatacagtgcaggggaaagaataataga -52- IleXleAlaTbrAtpIleGlnTbrLysGluleuGlnLysClBXleXlelyiXleCl&Asn CATAATAGCAACAGACATACAAACTAAAGAATTACAAAAACAAATTATAAAAATTCAAAA- • 4400 , · · · · FbeArgValTyrTyrArgAapSerArgAtpFrolleTrpLyaClyProAlaLyiLeuLeu TTTTCGGGTTTATTACAGAGACAGCAGAGATCCAATT1GGAAAGGACCAGCAAAGCTCCT . . . . 4500 TrpLy*GlyGluClyAl*V*lV*nieGlnA«pLy*SerA*pIleLy*V*lV»lPreAr| CTGGAAAGGTGAAGGGGCAGTAGTAATACAAGACAAGAGTGACATAAAGCIAGTACCAAG • · · . · · . ArgLysValLysIlelleArgAtplyrG lyLyiGlnMetAlaClyAspAspCysValAla (UetGlBAanArgTrpGlnValMetlleValTrpGlii AAGAAAAGTAAAGATTATTAGGGATTATGGAAAACAGATGGCAGGTGATGATTGTGTGGC . POL<ev. . 4600 SerArgGlnAspGluAsn PalAspArglíe tArgllleLy tThrTrpLysSerLeuValLysHisHicKetTyrValSer AAGTAGAC/.GGATGAGGAltrAAAACATGCAAAAGTTTAGTAAAACACCATATGTATGTTT LysLysAlaAsnArgTrpPheTyrArgKisBisTyrGluSerFroEisProLysIleEer CAAAGAAAGCTAACAGATGGTTTTATAGACATCACTATGAAAGCCCCCACCCAAAAATAA . 47 00 .... SerGluValHisIleProLeuGlyGluAla/.rgLeuValIlel.ysThrTyrTrpGlyLeu GTTCAGAAGTACACATCCCACTAGGAGAAGCTAGACTGGTAATAAAAACATATTGGGGTC • · · · 4800 EisThrGlyGluArgGluTrpBisLeuGlyGlnGlyValSerlleGluTrpArgLysArg TGCATACAGGAGAAAGAGAATGGCATCTGGGTCAGGGAGTCTCCATAGAATGCAGGAAAA ÀrgTyr SerThrGlnValAspProGljLeuAlaAapGlnLeuIleHiílIetTyrTyrPbe CGAGAIATAGCACACAAGTAGACCCTGGCCTGGCAGACCAA-CTÀATTCATATGTATTATT • . · 4900 t · AspCysPheSerGluSerAlalleArgLysAlalleLeuGlyAspIleValSerProArg TTGATTGTTTTTCACAATCTGCTATAAGAAAAGCCATATTAGGAGATATAGTTAGTCCTA CysGluTyrGlnAlaGlyHisAsnLyeValClySerLeuGlnTyrLeuAlaleuThrAla GGTGTGAGTATCAAGCAGGACATAACAAGGTAGGATCCCTACAGTATTTGGCACIAACAG . 5000 .... LeulleAlaProLysGlnlleLysPreProLeuProSerValArgLysLeuThrGluAsp CATTAATAGCACCAAAACAGATAAAGCCACCTTTGCCTAGTGTTAGGAAGCTAACAGAAG * ^ p. . · · · 5100 YíetGluGlnAlaProAlaAspGlnGlyProGlnArgGluProTyrAsnGluTrpAla ArcTrpAsnLysPr oGlnGlnThrATgGlyHisArgGlySerHisThrMetAsnGlyEis atagEtggaacaagccccagcagaccaggggccacagagggagccatacaatgaatgggc
    • · · · · · uGluLeuLeuGluGluLeuLysSerGluAlaValArgEisPheProArglleTrpLeu agagcttttagaggagcttaagagtgaagctgttagac/.ttttcctaggatatggct 5200 HisSerLeuGlyGlnEisI1eTyrGluThrTyrGlyAspThrTrpValGlyVs1GluAla CCATAGCTTAGGACAACATATTTATGAAACXTATGGGGATACCTGGGTAGGAGTIGAAGC snGlySerSerArgSer KetAspFroValAspPraAsnLeuGlu ATGGATCCAGTAGATCCIAACCTAG . . 5400 IlelleArglleLeuGlnGlnLeuLeuPhelleEisPbeArglleGlyCysGlnKisSer TATAATAAGAATACTGCAACAATTACTGTTTATTCATTTCAGAATTGGGTGTCAACATAG . 5300 . ppS . ArglleGlyllelleArgGlnArgArgAlaArg/ CAGAATAGGCATTATTCGACAGAGAAGAGCAAGA/ -53- ProTrpAenHieProGlySerGlnProArgTbrProCyaAsnLyaCyaHiaCyaLyaLy· AGCCCTGGAACCAXCCAGGAAGXCAGCCXAGGACXCCXTGTAACAAGTGTCAXXGXAAAA CysCysXyrHiaCysProValCysPbeLeuAsnLysGlyLeuGlylleSerTyrGlyArg AGTGTTGCTATCATTGCCCAGTTTGCTTCTTAAACAAAGGCXTAGGCATCTCCTATGGCA • · 0 5500 · · LycLysArgArgGlnArgArgGlyProProGlnGlyGlyGlnAlaHisGloValProIle GGAAGAAGCGGAGACAGCGACGAGGACCTCCTCAAGGCGGTCAGGCTCATCAAGTTCCTA S* · * · · AAGTAGTACATGTAATGCÀACCTTTAGGGATAATAGCAATAGCAGCAT 5600 TAGTAGTAGCAATAATACTAGCAATAGTTGTGTGGACCATAC-TAXTCATAGAATATAGAA 5700 » GGATAAAAAAGCAAAGGAGAAXAGACXGTXTACXTGATAGAAXAACAGAAAGAGCAGAAG γΛ E N V · · · · · |HetArgAlaArgGlylleGluArgAsnCysGInAsnXrpIrpLyeXrpGly ACAGTGGCAAXGAGAGCGAGGGGGAXAGAGAGAAAXIGICAAAACIGGXGGAAAIGGGGC • · · 5800 · · IleHe tLeuLeuGlylleLeuIIetThrCysSerAlaAlaAspAsnLeuTrpVa lThrVa 1 AICATGCTCCTTGGGATATTGAIGACCTGTAGTGCTGCAGACAATCTGIGGGICACAGIT XyrXyrGlyValProValTrpLysGluAlalhrlhrlhrLeuPheCysAlaSerAspAla XAXIAIGGGGTGCCTGTATGGAAGGAAGCAACCACCACTCTATTTTGTGCATCAGATGCT • 5900 · · · · LysSerTyrGluIhrG luAlaHisAsnlleTrpAlaThrBisAlaCyeValProThrAsp AAAXCAXAXGAAACAGAGGCACAIAAIAICIGGGCCACACAIGCCIGIGXACCCACGGAC • · · · · 6000 ProAsnProGlnGluIleAlaLeuGluAsnValIhrGluAsnPheAsnKetTrpLysAsn CCCAACCCACAAGAAAXAGCACXGGAAAAXGXGACAGAAAACIIXAACAXGIGGAAAAAI I Asnlíet ValGluGlnlíetHisGluAspIlelleSerLeuIrpAspGlnSerLeuLysPro AACAIGGTGGAACAGATGCAXGAGGAXAXAAXCAGTXXAXGGGAXCAAAGCCTAAAACCA · · · 6100 · · CysYalLysLeuXhrProLeuCysValIhrLeuAsnCysSerAspGluLeuArgAsnAsn XGXGXAAAAXIAACCCCACTCTGTGXCACIXXAAACIGXAGXGAXGAAXIGAGGAACAAX GlyXhrlIetGlyAenAsnValXhrThrGluGluLysGlylIetLysAsnCysSerPheAsn GGCACTAXGGGGAACAAXGXCACTACAGAGGAGAAAGGAAIGAAAAACIGCICIIICAAI . 6200 . . . . ValXhrThrValLeuLysAspLysLysGlnGInValTyrAIaLeuPhelyrArgLeuAsp GXAACCACAGTACTAAAAGAXAAGAAGCAGCAAGTATATGCACXTTTTTATAGACXTGAX • · « · · 6300 IleValProIleAspAsnAspSerSerXhrAsnSerThrAsnlyrArgLeuIleAsnCys ATAGTACCAATAGACAAIGAXAGTAGXACCAAIAGTACCAATXAXAGGTTAAXAAATXGI • · * a · * AsnThrSerAlalleThrGlnAlaCysProLysValSerPheGluProIleProIleKis AATACCTCAGCCATTACACAGGCTTGTCCAAAGGTATCCTTTGAGCCAAITCCCAXACAT • · i 6400 · · XyrCysAlaProAlaGlyPheAlalleLeuLysCysArgAspLysLysPheAsaGlylhr XAXTGXGCCCCAGCXGGTTTXGCGATXCXAAAGIGTAGAGAXAAGAAGTTCAAXGGAACA • · a · · · GlyProCysIhrAsnValSerThrValGlnCysXhrSisGlylleArgProValValSer GGCCCAXGCACAAAXGXCAGCACAGXACAAXGTACACATGGAAXTAGGCCAGTGGTGTCA < 6 500 * · · · -54- TbrGlnLeuLeuLeuA*nGlySerLeuAl*CluGruGluV*lIl«IleArgSerCluÀ«n ACTCAACTGCTGTTGAATGGCAGTCTAGCAGAAGAAGAGGTCATAATTAGATCCGAAAAT • · · · · 6600 LeuIhrAanAsnAlaLysAínllelleAlaHiaLeuAanGluSerValLysIleThrCys CTCACAAACAATGCTAAAAACATAATAGCACATCTTAATGAATCTGTAAAAATTACCTGX • · · · · « AlaArgProTyrGlnAenThrArgGlnArgThrProIleGlyLeoGlyGltiSerLeuTyr GCAAGGCCCTATCAAAATÀCAAGACAAAGAACACCTATAGGACTAGGGCAATCACTCTAT • · « 67 00 · · XbrXhrArgSerArgSerllelleGlyGlnAlaKisCysAsnlleSerArgAlaGlnlrp ACTACAAGATCAAGATCAA7AATAGGACAAGCACATTGTAATATTAGTAGAGCACAATGG • · · · · · > SerLysThrLeuG InGliiValAlaArgLysLeuGlyThrLeuLeuAsnLysThrllelle AGTAAAACTTTACAACAAGTAGCTAGAAAATTAGGAACCCTTCTTAACAAAACAATAATA • 6 800 · · · · LysPheLysProSerSerGlyGlyAspProGluIleXhrlhrEisSerPheAenCysGly AAGTTTAAACCATCCTCAGGAGGGGACCCAGAAATTACAACACACACTTTTAATTGTGGA • · · · · 6900 GlyGluPhePbeTyrCysAsnThrSerGlyLeuPheAsDSerTbrTrpAenlleSerAla GGGGAATTCTTCTACTGTAATACATCAGGACXGTTTAATAGTACATGGAATATTAGTGCA • · · · · · IrpAsnAsnIleThrGluSerABnAsDSerXhrAsnIbrAsnIleThrI»euGlnCysÀrg TGGAATAATATTACAGAGTCAAATAATAGCACAAACACAAACATCACACTCCAATGCAGA . . . 7000 IleLysGlnllelleLysIIetValAlaGlyArgLysAlaZleTyrAlaProProIleGlu ATAAAACAAATTATAAAGATGGTGGCAGGCAGGAAAGCAATATATGCCCCTCCTATCGAA • · « · · · ArgAanlleLeuCyaSerSerAsnlleThrGlyLeuLeuLeuThrÀrgAspGlyGlylle AGAAACATTCTATGTTCATCAAATATTACAGGGCTACTATTGACAAGAGATGGTGGTATA • 7100 · * · · AsnAsnSerThrAsnGluThrPbeArgProGlyGlyGlyAspHetArgAspAsnTrpArg AATAATAGTACTAACGAGACCTTTAGACCTGGAGGAGGAGATATGAGGGACAAITGGAGA I • · · · · · 7 2 0 0 SerGluLeuTyrLyBTyrLysValValGlnlleGluProLeuGlyValAlaProThrArg agtgaattatataaatataaggtagtacaaattgaaccactaggagxagcacccaccagg AlaLysArgArgValValGluArgGluLysArgAlalleGlyLeuGlyAlaKetPheLeu gcaaagagaagagxggxggaaagagaaaaaagagcaaiagcaixaggagcxaigxtccii » · · 7300 » · GlyPheLeuGlyAl aAlaGlySerXhrlíetGlyAlaArgSerValThrLeuIhrValGln GGGIXCTTGGGAGCAGCAGGAAGCACGATGGGCGCACGGTCAGTGACGCXGACGGXACAG ······ AlaArgGlnLeuíÍetSerGlylleValGlnGlnG lnAsnAsnLeuLeuArgAlai 1 eGlu GCCAGACAATTAATGTCTGGTATAGTGCAACAGCAAAACAAXXTGCTGAGGGCTAXAGAG • 7400 · · · · AlaGlnGlnHisLeuLeuGlnLeuThrValIrpGlylleLysGlnLeuGlnAlaArglle GCGCAACAGCAICTGTTGCAACTCACGGTCTGGGGCATTAAACAGCXCCAGGCAAGAATC • · · · · 7500 LeuAlaValGluArgXyrLeuLysAspGlnGlnLeuLeuGlylleTrpGlyCysSerGly ctggctgtggaaagaxaccxaaaggatcaacagctcctaggaaxxiggggitgctctgga LyaHialleCyaThrThrAsnValProTrpAanSerSerTrpSerAsnArgSerLeuAsn AAACACATTTGCACCACTAATGTGCCCTCGAACTCTAGTTGGAGTAATAGATCTCTAAAT • · · 7 600 · · GluIlêTrpGlnAsnMetThrTrpKetGluTrpGluArgGluIleAspAsnTyrThrGly GAGATTTGGCAGAACATGACCTGGATGGAGTGGGAAAGAGAAATTGACAATTACACAGCC • · · · » ' · LeulleTyrSerLeuIleGluGluSerGlnThrGlnGlnGluLysAsnGluLytGluLeu TTAATATATAGCTTAATTGAGGAÀTCGCAGACCCAGCAAGAAAAGAATGAAAAAGAATTG 77 00 · · · · LeuGluLeuAspLysTrpAlaSerLeuTrpAanTrpPheSerlleThrGlnXrpLeuTrp TTGGAATTGGACAAGTGGGCAAGTTTGTGGAATTGGTTTAGCATAACACAATGGCTGTGG • ·· · · 7800 TyrlleLyBllePhelleHetllelleGlyGlyLeuIleGlyLeuArglleValPheAU TATATAAAAATATTCATAATGATAATAGGAGGCTTGATAGGTTTAAGAATAGTTTTTGCT ······ ValLeuSe rLeuValAsnArgValArgGlnGlyTyrSerProLeuSerPheGlnlhrLeu GTGCTTTCTTTAGTAAATAGAGTTAGGCAGGGATACTCACCTCTGTCGTTTCAGACCCTC • · · 7900 « · LeuProAlaProArgGlyProAspArgProGluGlyThrGluGluGluGlyGlyGluArg CTCCCAGCCCCGAGGGGACCCGACAGGCCCGAAGGAACAGAAGAAGAAGGTGGAGAGCGA • · · · · · GlyArgAspArgSerValArgLeuLeuAsnGlyPbeSerAlaLeuIleTrpAapAspLea GGCAGAGACAGATCCGTGAGATTGCTGAACGGATTCTCGGCACTTATCTGGGACGACCTG • 8000 · · · · ArgSerLeuCyELeuPheSerXyrHisArgLeuArgAspLeuIleLeuIleAlaValArg CGGAGCCTGTGCCTCTTCAGCTACCACCGCTTGAGAGACTTAATCTTAATTGCAGTGAGG • · « · · 8100 IleValGluleuLeuGlyArgÀrgGlylrpAspIleLeuLysXyrLeuXrpAsnLeuLeu AIXGXAGAACIXCXGGGACGCAGGGGGIGGGACAXCCXCAAAXATCIGIGGAAXCICCXA GlnXyrlrpSerGlnGluLeuArgAsnSerAlaSerSerLeuPheAspAlalleAlalle CAGTATTGGAGTCAGGAACTGAGGAACAGTGCTAGTAGCXTGTTTGATGCCATAGCAATA • · « 8200 · · AlaValAlaGluGlyThrAEpArgValIleGluIlelleGlnArgAlaCysArgAlaVal GCAGTAGCTGAGGGGACAGAXAGAGXXAXAGAAAXAAXACAAAGAGCXXGCAGAGCTGXX • · · · W « * · LeuAsnlleProArgArglleArgGlnGlyLeuGluArgSerLeuLet: «— (lletG lyGly CITAACAIACCCAGAACAATAAGACAGGGCTTAGAAAGGTCTTIACTTOAAAAIGC-GTGÇ. . 8300 .... LysTrpSerLysSerSerlleVclGlyXrpProAlalleArgGluArglleArgArglhr CAAATGGTCAAAAAGXAGXATAGTGGGATGGCCTGCTAIAAGGGAAAGAAXAAGAAGAAC ..... 8400 AsnProAlaAlaAspGlyValGlyAlaPalSerArgAspLeuGluLysEisGlyAlalle IAATCCAGCAGCAGAIGGGGTAGGAGCAGIAICXCGAGACCTGGAAAAAC/.TGGGGCAAI *····· XhrSerSerAsnlhrAlaSerThrAsnAlaAspCysAlaTrpLeuGluAlaGlnGluGlu CACAAGIAGCAATACAGCAAGTACTAAXGCTGACIGTGCCXGGCIAGAAGCACAAGAAGA . . · 8500 . . SerAspGluValGlyPheProValArgProGlnValProLeuArgProlIetThrlyrLys GAGCGACGAGGTGGGCTTTCCAGTCAGACCCCAGGTACCTTTAAGACCAAXGACITACAA r* U3 LeuGluGlyLeuIleTrp iciggaagggctaatttg GluAlaLeuAspLeuSerHisPheLeuLysGluLysGlyGly agaagctctagaicxcagccaciiixxaaaagaaaaggggggI» . 8600 -56- SerLysLysArgGlnGluIleLeuAspL~eu7rpValXyrAsDXhrGlnGlyIlePbeP'ro CICCAAAAAGAGACAAGAGAICCIICAXCXXIGCGICIACAACACACAAGGCATCIXCCC • · · · · 87 00 AspTrpGlnAsnXyrThrProGlyPxoGlylleArgXyrProLeuXhrPheGlyXrpCy* XGATTGGCAAAACTACACACCAGGGCCAGGGAXCAGAXAXCCACXAACCXXXGGAXGGXG ······ TyrGluLeuValProVâlAspProGlnGluValGluGluAspXhrGluGlyGluXhrAsn CTACGAGCXAGXACCAGXXGATCCACAGGAGGXAGAAGAAGACACXGAAGGAGAGACCAA • · · 8800 · · SerLeuLeuEiíProIleCyíGlnBisClyHetGluAspProGluArgGlnValLeuLy* CAGCXXGXXACACCCXAXAXGCCAGCAXGGAAXGGAGGACCCGGAGAGACAAGTGXXAAA XrpArgPheAsnSerArgLeuAlaPheGluBisLysAlaArgGluUetHisProGluPhe ATGGAGATTTAACAGCAGACXAGCAXXTGAGCACAAGGCCCGAGAGAXGCAXCCGGAGTX • 8900 · > · · TyrLysAsn CTACAAAAACTGAXGACACCGAGCTTTCXACAAGGGACTTTCCGCXGGGGACXTICCAGG • t · » · 9000 GAGGCG7GGAC7GGGCGGGACTGGGGAGTGGCXAACCCTCAGATGCTGCATAXAAGCAGC • U3e-pfcR · . . . TGCTTTTTGCCTGTACTGpGTCTCTCTGGTTAGACCAGATXTGAGCCTGGGAGCTCTCTG • · · 9100 · fié-k · GCTAGCIAGGGAACCCACTGCTTAAGCCTCAATAAAGCTTGCCTTGAGTGCTTCAA] • · t · · derivado de uni RNA de LAV^j ou de uma sua fracção quer em um cDNA representado a seguir: -57- §' / rR IGGTCTCTCTTGTTAGACCAGGTCGAGCCCGGGAGCTCTCTGGCTAGCAAGGAACCCACTG • · · R 4t*U5· * * CTTAAGCCTCAATAAAGCTTGCCTTGAGTGCCTCA/JGCAGTGTGTGCCCATCTGTTCTGT • · · ♦ U5 *-«· GACTCTGGTAACTAGAGATCCCTCAGACCACTCTAGACGGTGTAAAAATCTCTAGCAGTp • · · · · · GCGCCCGAACAGGGACTTTAAAGTGAAAGTAACAGGGACXCGAAAGCGGAAGTTCCAGAG • 200 · · · · AAGTTCTCTCGACGCAGGACTCGGCTTGCTGAGGTGCACACAGCAAGAGGCGAGAGCGGC I GACTGGTGAGTACGCCAATTTTTGACTAGCGGAGGCTAGAAGGAGAGAG^.TGGGTGCGAG AlaSerValLeuSerGlyGlyLysLeuÀEpAlaTrpGluLyalleArgLeuArgProGly AGCGTCAGTATTAAGCGGGGGAAAATTAGATGCATGGGAGAAAATTCGGTTAAGGCCAGG • .... · - - 400 i · — GlyLysLysLysTyrArgLeuLysBisLeuValTrpAlaSerArgGluLeuGluArgPhe GGGAAAGAAAAAATATAGACTGAAACATTTAGTATGGGCAAGCAGGGAGCTGGAAAGATT AlaLeuAsnProGlyLeuLeuGluTbrGlyGluGlyCysGlnGlnlleMetGluGlnLeu CGCACTTAACCCTGGCCTTTTAGAAACAGGAGAAGGATGTCAACAAATAATGGAACAGCT • 500 · · · · GlnSerThrLeuLysThrGlySerGluGluIleLysSerLeuTyrAsnThrValAlaTbr ACAATCAACTCTCAAGACAGGATCAGAAGAAATTAAATCATTATATAATACAGTAGCAAC • · · · · 600 LeuTyrCysValHisGlnArglleAspValLysAepThrLysGluAlaLeuAepLyellê CCTCTATTGTGTACATCAAAGGATAGATGTAAAAGACACCAAGGAAGCGCTAGATAAAAT » GluGluIleGlnAsnLysSerArgGlnLysTbrGlnGlnAlaAlaAlaAlaGlnGlnAla AGAGGAAATACAAAATAAGAGCAGGCAAAAGACACAGCAGGCAGCAGCTGCACAGCAGGC • · 700 · · AlaAlaAlaThrLysAsnSerSerSerValSerGlnAsnTyrProIleValGlnAsnAla AGCAGCTGCCACAAAAAACAGCAGCAGTGTCAGTCAAAATTACCCCATAGTGCAAAATGC »·»··· GlnGlyGlnlíet IleHisGlnAlalleSerProArgThrLeuAsnAlaTrpValLysVal ACAAGGGCAAATGATACATCAGGCCATATCACCTAGGACTTTGAAIGCATGGGTGAAAGT • SOO · · · · IleGluGluLysAlaPheSerProGluValIleProlIetPheSerAlaLeuSerGluGly AATAGAAGAAAAGGCTTTCAGCCCAGAAGTGATACCCATGTTCTCAGCATTATCAGAGGG • * · · > 900 AlaThrProGlnAspLeuAsnlíetMetLeuAsnlleValGlyGlyKisGlnAlaAlaliet GGCCACCCCACAAGATTTAAATATGATGCTGAACATAGTTGGAGGACACCAGGCAGCTAT «·«··· GlnMetLeuLysAspThrlleAsnGluGluAlaAlaAspTrpAspArgValHisProVal GCAAATGTTAAAAGATACCATCAATGAGGAAGCTGCAGACTGGGACAGGGTACATCCAGT . . . 1000 HisAlaGlyProIleProProGlyGlnHetArgGluProArgGlySerAspIleAlaGly ACATGCAGGGCCTATTCCCCCAGGCCAGATGAGAGAACCAAGAGGAAGTGACATAGCAGG -58-
    TlirTtrrSTTThTEFuC inG iuG ln 11 eG lyTr pMe t Tbr Se r A s n? r oF r ο ϊ 1 e? r o Va 1 AACIACXACIACCCIICAACAACAAAIACGÀTGGÀXGACAAGCAACCCACCIAXCCCACT 1100 · · i · GlyAapIleTyrLysÂrgTrpIleIleLeuGiyI.euA*DLyaIleValArgMeiTyrSer GGGAGACATCTATAAAAGATGGATAATCCTGGGATTAAATAAAATAGTAAGAATGTATAG • * · · · 1200 FroValSerXleLeuAspIleArgGloGlyProLytGluProFbeArgAspTyrValAap CCCTGTCAGCATITTGGACATAAGACAAGGGCCAAAGGAACCTITTAGAGACTATGTAGA • · · I · t ArgPhePheLyaThrLeuArgÀlaGluGlnAlaThrGlnGluValLysAsnlrpMetThr TAGGTTCTTTAAAACTCTCAGAGCTGAGCAAGCTACACAGGAGGTAAAAAATTGGATGAC • · · 1300 · · » GluIhrLeuLeuValGlnAsnAlaAsnProAspCyíLytXhrlleLeuLysÀlaLeuGly AGAAACCTTGCTGGTCCAAAATGCGAATCCAGACTGTAAGACCATTTTAAAAGCATTAGG • · · · · · ProGlyAlaThrLeuGluGluMetMetThrAlaCysGlnGlyValGlyGlyProSerHia ACCAGGGGCTACATTAGAAGAAATGATGACAGCATGCCAGGGAGTGGGAGGACCCAGTCA Φ 1400 t m · · LyaAlaArgValLeuAlaGluAlalíet SerGlnAlaThrAsnSerThrAlaAlal lellet TAAAGCAAGAGTTITGGCTGAGGCAATGACCCAAGCAACAAATTCAACTGCTGCCATAAT • · · · · 1300 HetGl&ArgGlyAcnPheLysGlyGlnLysArglleLysCysPheAsDCyaGlyLysGlu GATGCAGAGAGGTAATTTTAAGGGCCAGAAAAGAATTAAGTGTTTCAACTGTGGCAAAGA • · # · · · GlyHisLeuAlaArgAínCyaArgAlaProArgLysLyaGlyCyaTrpLyeCysGlyLya AGGACACCTAGCCAGAAATTGCAGGGCCCCTAGGAAAAAGGGCTGTTGGAAATGTGGGAA • · · 1600 —^POL · · PhePheÁrgGluAanLeu GluGlyEisGlnKetLysAspCysThrGluArgGlnAlaAsbPbeLeuGlyLytIleTrp GGAAGGACACCAAATGAAAGACTGCACTGAGAGACAGGCTAAuTTTITAGGGAAAATTTG I AlaPheProGlnGlyLysAlaArgGluPbePrcSerGluGlnThrArgÀlaAsnSerPro ProSêrBieLyeG lyArgProGiyÀsnPheLeuGlnSerArgProGluProThrAlaP.r-o-GCCIICCCACAAGGGAAGGCCAGGGAÀITTCCITCAGAGCAGACCAGAGCCAACAGCCCC • 1700 · · * ThrSerArgGluLeuArgValTrpGlyGlyAspLysTbrLeuSerGluThrGlyAlaGlu ProAlaGluSerPheGlyPheGlyGluGluIleLysPioSerGlnLysGlnGluGlnLy* accagcagagagcttcgggxttggggaggagataaaaccctctcagaaacaggagcagaa • * · · · 1800 ArgGlnGlylleValSerPheSerPheProGlnlleXhrLeuIrpGlnArgProValVal AspLysGluLeuXyrProLeuAlaSerLeuLysSerLeuPheGlyAsnAspGlnLeuSer AGACAAGGAATTGTATCCTTTAGCTTCCCTCAAATCACTCTTTGGCAACGACCAGTTGTC GAQgi-η · * · · ThrValArgValGlyGlyGlnLeuLysGluAlaLeuLeuAspThrGlyAlaAspAspThr Gin ACAG rAAGAGTAGGAGGACAGCTAAAAGAAGCTCTATTAGACACAGGAGCAGATGATACA • · 1900 · · ValLeuGluGluIleAsnLeuProGlyLysTrpLysProLysIíetlleGlyGlylleGly GTATTAGAAGAAATAAATTTGCCAGGAAAATGCAAACCAAAAATGATAGGGGGAATTGGA • · · · * · GlyPhelleLysValArgGlnTyrAspGlnlleLeuIleGlulleCysGlyLyELysAla GGIIXTAXCAÀÀGXAAGACAGIAXGAICAAAXACIXAIAGAAAIIIGTGGAAAAAAGGCT • 2000 · · · · 3 -59- 3 -59- 'st / IleGlyThrlleLeuValGlyProThrProValAanllelleGlyArgÀanHetLeuThr ATAGGTACAATATTGGTAGGACCTACACCTGTCAACATAATTGGACGAAATATGTTGACT • · · · · 2100 GlnlleGlyCy sThrLeuAanPheProIleSerProIleGluXhrVtlProValLyaleu cagattggttgtactttaaattticcaattagtcctattgagactgtaccagtaaaatta • · · · · · LysProGlyMetAspGlyProArgValLyaGlnTrpProLeuXbrGluGluLyalleLys AAGCCAGGGATGGATGGCCCAAGGGTXAAACAATGGCCATTGACAGAAGAAAAAATAAAA • · · 2200 · · AlaLeuXbrGluIleCysLysAepMetCluLysGluGlyLysIleLeuLysIleGlyPro GCATTAACAGAAATTTGTAAAGATATGGAAAAGGAAGGAAAAATTTTAAAAATTGGGCCT • · · · · · > GluAsnProTyrAsnXhrProValPheAlalleLysLysLysAspSerXhrLysXrpArg GAAAATCCATACAATACTCCAGTATTTGCCATAAAGAAAAAAGACAGCACTAAATGGAGÀ . 2300 . LysLeuVa1AsnPheArgGluLeuAsnLysArgXhrGlnAspPhelrpGluValGlnLeu AAATTAGTGAATTTCAGAGAGCTTAATAAAAGAACTCAAGATTTTTGGGAAGTTCAATTA • · · · · 2400 GlylleProHisProAlaGlyLeuLysLystysLysSerValThrValLeuAspValGly GGAATACCACATCCTGCTGGGTTGAAAAAGAAAAAATCAGTCACAGTATTGGATGTGGGG • · · · · · AspAlaTyrPheSerValProLeuAapGluAspPheArgLysIyrThrAlaPheThrlle GATGCATATTTTTCAGTCCC1XTAGAIGAAGATTTCAGGAAGTATACXGCATTCACTATA • · · 2500 · · ProSerlleAsnAsnG luThrProGlylleArgTyrGlnlyrAsnValLeuProGlnGly CCCAGTATTAATAATGAGACACCAGGGATXAGATATCAGTACAATGTGCTACCACAGGGA • · · ♦ # · IrpLysGlySerProAlallePbeGlaSerSerKetThrLysIIeLeuGluProPheArg tggaaaggatcaccagcaatattccagagtagcatgacaaaaatcttagaaccctttaga • 2600 · · · I XhrLysAsnProGluIleValIleTyrGlnTyrKetAspAspLeuTyrValGlySer Asp ACAAAAAAXCCAGAAAIAGTCATAXACCAATACATGGATGATTTG XAXGXAGGGXCTGAT * · · · · 2700 LeuGlu11eGlyGInE isArglhrLysIleGluGluLeuArgGluEisLeuLeuLysXrp TTAGAAAXAGGACAACATAGAACAAAAAXAGAGGAACXAAGAGAACATCXAXXGAAAXGG GlyPheXhrXhrProAspLysLysEisGlnLysGluProProPheLeulrpHetGlyXyr GGAXXXACCACACCAGACAAAAAGCAXCAGAAAGAACCCCCAITICTTTGGAXGGGGTAX . . . 2800 GluLeuHisProAspLysTrpXhrValGlnProIleGlnLeuProAspLysGluSerTrp GAACXCCACCCXGACAAAXGGACAGXGCAGCCTATACAACTGCCAGACAAGGAAAGCTGG • · · t · · XhrValAsnAsplleGlnLysLeuValGlyLysLeuAsnXrpAlaSerGlnlleXyrPro acxgxcaatgaxaxacagaaaxxggxgggaaaactaaattgggcaagxcagaixxatcca • 2900 * · · ClyIleLyeValLyeClnLeuCyeLyeLeuLeuArgClyAlaLysAlaLeuIhrAspI.lt- ggaaxiaaagtaaagcaaiiaxgxaaacicciiaggggagcaaaagcaciaacagacaia • · · · 3000 ValProLeuIhrAlaGluAlaGluLeuGluLeuAlaGluAsnArgGluIleLeuLysGlu gxaccatiaactgcagaggcagaattagaaxxggcagagaacagggaaattctaaaagaa -60 FroValBisGlyValTyrTyrAspProSerLyaAapLeuIleAlaGluIleGlnLysGln CCAGTGCATCGGGTATATTATGACCCATCAAAAGACTTAATAGCAGAAATACAGAAGCAG • · · 3100 · · GlyGlnGlyGlnTrpThrTyrGlnlleTyrGlnGluGloTyrLyaAsnLeuLysThrGly gggcaaggtcaatggacatatcaaatataccaagagcaatataaaaatctgAaaacaggg • · · · # · LysTyrAlaArglleLysSerAlaHiaThrAsnAtpValLytGlnLeuTbrGluAlaVal AAGTATGCAAGAATAAAGTCTGCCCACACTAATGATGTAAAACAATTAACAGAAGCAGTG • 3200 · · · · GlnLyalleAlaGisGluSerlleValIleTrpGlyLysTbrProLyaPheArgLeuPro CAAAAGATAGCCCAAGAAAGCATAGTAATATGGGGAAAAACTCCTAAATTTAGACTACCC • · · i · 3300 I HeGlnLysGluThrTrpGluAlaTrpTrpThrGluTyrTrpGlnAlaThrTrpIlePro ATACAAAAAGAAACATGGGAGGCATGGTGGACAGAATATTGGCAAGCCACCTGGATCCCT • · · · · Φ GluTrpGluPheValAsnTbrProProLeuValLysLeuTrpTyrGlnLeuGluThrGlu GAATGGGAGTTTGTCAATACTCCTCCCCTAGTAAAACTATGGTACCAGTTAGAAACAGAA • · * 3400 · i ProIleValGlyAlaGluTbrPbeTyrValAspGlyAlaAlaAsnArgGluThrLysLya CCCATAGTAGGAGCAGAAACTTTCTATGTAGATGGGGCAGCTAATAGAGAAACTAAAAAG GlyLysAlaGlyTyrValThrAepArgGlyArgGlnLysValValSerLeuTbrGIuTbr GGAAAAGCAGGATATGTTACTGACAGAGGAAGACAAAAGGTTGTCTCCTTAACTGAAACA • 3500 · · · · TbrÀsnGlnLysThrGluLeuGlnAlalleBisLeuAlaLeuGlnAepSerGlySerGlu ACAAATCAGAAGACTGAATTACAAGCAATCCACTTAGCTTTACAGGATTCAGGATCAGAA • · · · · 3600 ValAanlleValTbrAspSerGlnTyrAlaLeuGlyllelleGlnAlaGlnProAspiyt GTAAACATAGTAACAGACTCACAGTATGCATTAGGGATTATTCAAGCACAACCAGATAAA • · · · · · SerGluSerGluIleValAsoGlnllelleGluGlnLeuIleGlnLysÀspLysValTyr AGTGAATCAGAGATTGTTAATCAAATAATAGAGCAATTAATACAGAAGGACAAGGTCTAC I • '· · 3700 · · LeuSerTrpValProAlaHisLysGlylleGlyGlyAsnGluGlnValÀspLyeLeuVal CTGTCATGGGTACCAGCACACAAAGGGATTGGAGGAAATGAACAAGTAGATAAATTAGTC • · · · a * SerSerGlylleArgLysValLeuPbeLeuAspGlylleAspLysAlaGlnGluGluHis AGCAGTGGAATCAGAAAGGTACTATTTTTAGATGGGATAGATAAGGCICAAGAAGAACAT « 3 800 * · · · GluLysTyrHisSerAsnTrpArgAlaKetAI a SerAspPheAscLeuProProIleVal GAAAAATATCACAGCAATTGGAGAGCAATGGCTAGTGACTTTAATCTACCACCTATAGTA 3900 AlalysGluIleValAlaSerCysAspLysCysGlnLeuLysGlyGluAlalietEisGly GCGAAGGAAATAGTAGCCAGCTGTGATAAATGTCAACTAAAAGGGGAAGCCATGCATGGA GlnValAspCysSerProGlylleTrpGlnLeuAspCysThrHisLeuGluGlyLysIle CÀAGTAGACTGTAGTCCAGGGATATGGCAATTAGATTGCACACATCTAGAAGGAAAAATA • · · 4000 i · IlelleValAlaVallIisValAlaSerGlyTyrlleGluAlaGluValIleProAlaGlu ÀTCATAGTAGCAGTCCATGTAGCCAGTGGATATATAGAAGCAGAAGTTATCCCAGCAGAA ThrGlyGlnGluTbrAlaTyrPbelleLeuLysLeuAlaGlyArgTrpProValLysVal ACAGGACAGGAGACAGCATACTTTATACTAAAATXAGCAGGAAGATGGCCAGTAAAAGTA • 4100 · · * » -61 / ValBieTbrAspAcnClySerianfbeThrSerAlaAlaVelLysAlcAleCyfTrpTrp GTACACACACACAATCGCAGCAATTTCACCAGTGCTGCACTTAAAGCAGCCTCTTGGTGG • · · · · 4200 AlaAinXleLyiGlnGluPheGlylleProTyrAinProGloSerGloGlyValPalGlti GCAAATATCAAACAGGAATTTGGAATTCCCTACAACCCCCAAAGTCAAGGAGTAGTGGAA • · · · · · SerHetAanLysGluLeuLyaLyallelleGlyGlsValArgGluGlnAlaGluEisLeu.. TCTATGAATAAGGAATTAAAGAAAATCATAGGGCAGGTAAGAGAGCAAGCTGAACACCTT • · · 4300 · · LyaThrAlaPalGlnHetAlaValPhelleHieAenPheLyaArgLyaGlyGlylleGly AAGACAGCAGTACAAATGÇCAGTGTTCATTCACAATTTTAAAAGAAAAGGGGGGATTGGG I GlyTyr SerAlaGlyGluÀrgllelleAspMetlleAlaThrAspIleGltiThrLysGlu CGGTACAGTGCAGGGGAAAGAATAATAGACATGATAGCAACAGACATACAAACTAAAGAA-. 4400 .... LeuGlQLysGlnlleThrLysIleGlnAs&PheArgValTyrTyrArgAspAsDArgAsp TTACAAAAACAAATTACAAAAATTCAAAATTTTCGGGTTTATTACAGGGACAACAGAGAC • · t · 4300 ProIleTrpLysGlyProAlaLysLeuLeuTrpLysGlyGluGlyAlaPalValIleGln CCAATTTGGAAAGGACCAGCAAAACTACTCTGGAAAGGTGAAGGGGCAGTAGTAATACAG
    • · · · · AspAsnSerAspIleLysValPalProArgÀrgLysAlaLyaIlelleÀrgAsp GACAATAGTGATATAAAGGTAGTACCAAGAAGAAAAGCAAAAATCATTAGGGAT » · · 4600 POla*-» · LysGloMetAlaGlyAspAspCysValAlaGlyGlyGlnAspGluAspj As d Ar gTrpG lcValMet IleValTrpGlnValAspArgHetArglljeArgThrTrpBii AAACAGATGGCAGGTGATGATTGTGTGGCAGGTGGACAGGATGAGGATjTAGAACATGGCA I SerLeuValLysEiaEisMet TyrValSerLysLysAlaLysAsnTrpPbeTyrArgBia CAGTTTAGTAAAACATCATATGTATGTCTCAAAGAAAGCTAAAAATTGGTTTTATAGACA . 4700 .... BisTyrGluSerArgBisProLysValSerSerGluValBisIleProLeuGlyAspAla TCACTATGAAAGCAGGCATCCAAAAGTAAGTTCAGAAGTA CACATCCCACTAGGGGATGC • · · · . 4600 ArgLeuValValArgThrTyrTrpGlyLeuGlnThrGlyGluLysAspTrpBisLeuGly TAGATTAGTAGTAAGAACATATTGGGGTCTGCAAACAGGAGAAAAAGACTGGCACTTGGG BisGlyValSerlleGluTrpArgGlnLysArgTyrSerTbrGlnLeuAspProAspLeu TCATGGGGTCTCCATAGAATGGAGGCAGAAAAGATATAGCACACAACTAGATCCTGACCT • · · 4900 · · AlaAspGlnLeuIleEisLeuTyrTyrPheAspCysPheSerGluSerAlalleArgGln AGCAGACCAACTGATTCATCTGTACTATTTTGATTGTTTTTCAGAATCTGCCATAAGACÀ • «ia·· Alall eLeuG lyKis I leVal SerProArgCy sAspTyrC-lnAlaGlyHisAsnLy sVal AGCCATATTAGGACATATAGTTAGTCCTAGGTCTGATTATCAAGCAGGACATAACAAGGT • 3000 · · · · GlySerLeuGlnTyrLeuAlaLeuTbrAlaLeuIleAlaPrcLysLysThrArgProPro AGGATCTTTACAGTATTTGGCACTAACAGCATTAATAGCACCAAAAAAGACAAGGCCACC • · · · 3100 MetGluGliiAlaProAlaAspGlnGly LeuProSerValArgLysLeuThrGluAspArgTrpAsnLysProGlnGlnThrLysGly TTTGCCTAGTGTTAGGAAGCTAACAGAAGATAGATGGAACAAGCCCCAGCAGACCAAGGG 62- 62- hr3í Hia catji ProGlnArgGluProBi*A»nGluTrpThrl]euGluLeuIieuGluGluLeuLy*GlnGlu BisArgGlySerflisTbrMetAanGlyBj ccacagagggagccacacaatgaatggacaUtagaacttttagaggagcttaagcaagaa 5200 AlaValArgHisPbeProArglleTrpLeuEifSerLeuGlyGlnBialleTyrGluThr GCTGTCAGACACTTTCCTAGGATATGGCTCCATAGTTTAGGACAACAXATCTATGAAACT TyrGlyAspThrTrpGluGlyValGluAlallelleArgSerLeuGlnGlnLeuLeuPhe TATGGGGATACCTGGGAAGGAGTTGAAGCTATAATAAGAAGTCTGCAACAACTGCTGTTT • 53 00 · · · · IleEisPheArglleGlyCysGlnHisSerArglleGlylleThrArgGlnArgArgAla ATTCATTTCAGAATTGGGTGTCAACATAGCAGAATAGGCATTACTCGACAGAGAAGAGCA p^S · p λ ·—» · · * 5400 ArgAJsnGlySer SerArgsei IletAspProValAspPi AGAA ATGGATCCAGTAGATCC oAsnLeuGluProTrpAsnHisProGlySerGlnProArg TAACTTAGAGCCCTGGAACCATCCAGGGAGTCAGCCTAG ThrProCysAsnLysCysTyrCysLysLysCyaCysTyrHisCysGlnMetCysPhelle GACGCCTTGTAATAAGTGTTATTGTAAAAAGTGCTGCTATCATTGCCAAATGTGCTTCAI-- • · · 5500 · · TbrLysGlyLeuGlylleSerTyrGlyArgLysLysArgArgGlnArgÀrgArgProPro AACGAAAGGCTTAGGCATCTCCTATGGCAGGAAGâAGCGGAGACAGCGACGAAGACCTCC • · · St f · · GlnGlyAsnGlnAlaHisGlnAspFroLeuProGluGlnj TCAGGGCAATCAGGCTCATCAAGATCCTCTACCAGAGCAGtAAGTAGTATATGTAATACA . 5600 . J ACCTTTAGTGATATTAGCAATAGTAGCATTAGTAGTAACGCTAATAATAGCAATAGTTGT • · · · · · 57 00 gtggaccatagtatttatagaaattàggaaaataagàagacaaaggaaaatagacaggtt ->ENV MetArgValArgGluIleGlnArg GATTGATAGAATAAGAGAAAGAGCAGAAGATAGTGGCdATGAGAGTGAGGGAGATACAGA 5800 AsnTy rG lnAsnTrpTrpArgTrpG lyMetl-Iet LeuLeuGlyKetLeuHetThrCy sSer GGAATTATCAAAACTGGTGGAGATGGGGCATGATGCTCCTTGGGATGTTGATGACCTGTA IleAlaGluAspLeuTrpValThrValTyrTyrGlyValFroValTrpLysGluAlaThr GTATTGCAGAAGATTTGTGGGTTACAGTTTATTATGGGGTACCTGTGTGGAAAGAAGCAA . 5900 .... ThrThrLeuPheCysAlaSerAspAlaLys SerTyrGluThrGluValHisAsnlleTrp CCACTACTCTATTTTGTGCATCAGATGCTAAATCATATGAAACAGAAGTACATAACATCT . . . . i 6000 AlaThrHisAlaCysValProThrAspProAfinProGlnGluIleGluLeuGluAsnVal GGGCTACACATGCCTGTGTACCCACGGACCCCAACCCACAAGAAATAGAACTGGAAAATG • · · · · · ThrGluGlyPheAsnMetTrpLysAsnAsnKetValGluGlnKetEisGluAspIlelle TCACAGAAGGGTTTAACATGTGGAAÀAATAACATGGTGGAGCAGATGCATGAGGATATAA . . . 6100 . . SerLeuTrpAapGlnSerLeuLysProCyaValLyaLeuThrProLeuCysValTbrLeu TCAGTITATGGGAXCAAAGCCXAAAACCATGTCTAAAGCTAACCCCACTCTGTCTCACTT • · · · · t · AanCy«ThrAsnValAsoGlyThrAlaValAanGlyThrÀanAlaGlySerAanArgThr TAAACTGCACTAATGTGAATGGGACTGCTGTGAATGGGACTAATGCTGGGACTAATAGGÀ • 6 200 · · · · AsnAlaGluLeuLyaKetGluIleGlyGluValLyaAsnCysSerPheAsnlleTbrPro CTAATGCAGAATXGAAAATGGAAATTGGAGAAGTGAAAAACTGCTCXTTCAATATAACCC • · · · · 6300 ValGlySerAspLy&ArgGlnGluTyrAlaThrPbeTyrAtcLeuAapLeuValGlnXle CAGTAGGAAGTGATAAAAGGCAAGAATATGCAACTTTTTATAACCTTGATCTAGTACAAA ······ AspAspSerAspAenSerSerTyrArgLeuIleAsnCysAa&ThrSerValIleThrGln TAGATGATAGTGATAATAGTAGTTATAGGCTAATAAATTGTAATACCTCAGTAATTACAC • · · 6400 · · AlaCysProLysValThrPheAspFroIleProIleBisTyrCysAlaProAlaGlyPhe AGGCTTGTCCAAAGGTAACCTTTGATCCAATTCCCATACATTATTGTGCCCCAGCTGGTT • · ·· · « · AlalleLeuLysCyaAsnAspLyaLysPheAsnGlyTbrGluIleCysLysAsnValSer TTGCAATTCTAAAGTGTAATGATAAGAAGTTCAATGGAACGGAAATATGTAAAAATGTCA • 6300 · · · · ThrValGlnCysThrHieGlylleLysProValValSerThrGlnLeuLeuLeuAsnGly GIACAGTACAATGTACACATGGAATTAAGCCAGTGGTGTCAACTCAACTCCTGTTAAATG • · · · · 6600 SerLeuAlaGluGluGluIleMetlLeAxgSerGluAsnLeuThrAspAsnThrLysAsn GCAGTCTAGCAGAAGAAGAGATAATGATTAGATCTGAAAATCTCACAGACAATACTAAAA • · · · · · IlelleValGlnLeuAsnGluIhrValThrlleAsnCysThrArgProGlyAsnAsnThr ACATAATAGTACAGCTTAATGAAACTGTAACAATTAATTGTACAAGGCCTGGAAACAATA • · · 67 00 · · ArgArgGlyIleEisPheGlyProGlyGlnAlaLeuTyrThrThrGlyIleValGlyAsp CAAGAAGAGGGATACATTTCGGCCCAGGGCAAGCACTCTATACAACAGGGATAGTAGGAG • · » · * » IleArgArgAlaXyrCysThrlleAsnGluThrGluTrpAspLysThrLeuGlnGlnVal ATATAAGAAGAGCATATTGTACTATTAATGAAACAGAATGGGATAAAACTTTACAACAGG • 6 800 · . · AlaValLy.sLeuGlySerLeuLeuAsnLysThrLysIlellePheAsnSerSerSerGly. XAGCXGXAAAACIAGGAAGCCIICXIAACAAAACAAAAAXAAIXIXIAAXXCAXCCXCAG t · · · · 6900 GlyAspProGluIlelhrXhrHisSerPheAsnCysArgGlyGluPhePhelyrCyEAsn GAGGGGACCCAGAAATTACAACACACAGTTTTAATTGTAGAGGGGAATTTTTCTACTGTA • * ♦· · · · XhrSerLysLeuPheAsr.SerlhrlrpG lnAsnAscG lyAlaArgLeuSerAsnSerXhr ATACATCAAAACTGTTTAATAGTACATGGCAGAATAATGGTGCAAGACTAAGTAATAGCA • · · 7000 φ · GluSerlhrGlySer IlelhrLeuProCysArglleLysGlnllelleAsnlIetlrpGln CAGAGTCAACTGGTAGXATCACACTCCCATGCAGAATAAAACAAATTATAAATATGTGGC LysIhrGlyLysAlaKetTyrAl aProProIleAlaGlyValIleAsijCysLeuSerAsn AGAAAACAGGAAAAGCXAXGXAXGCCCCICCCAXCGCAGGAGICAICAACXGIXXAXCAA • 7100 t · · · IleXhrGlyLeuIleLeuXhrArgABpGlyGlyAsnSerSerAspAsnSerAspAsnGlu AXAXIACAGGGCXGAIAIIAACAAGAGATGGTGGAAATAGXAGIGACAAXÀGTGACAATG • · · · · 7200 -64- ( XhrLeuArgProGlyGlyGlyAc pMetArgAapásnXrpXleSerGluLetiTyrLyiTyr AGACCTTAAGACCTGGAGGAGGAGATATGAGGGACAATTGGATAAGTGAATTATATAAAI LyaValValArgtleGluProLeuClyValAlaProXbrLyaAlaLysArgArgValVai ATAAAGTAGTAAGAATTGAACCCCTAGGAGTAGCACCCACCAAGGCAAAGAGAAGAGTGG • · · 7300 · · GluArgGluLysArgAlalleGlyLeuGlyAlaMetPbeLeuGlyPheLeuGlyAlaAla TGGAAAGAGAAAAAAGAGCAATAGGACTAGGAGCCATGTTCCTTGGGTTCTTGGGAGCAG ······ GlySerXhrMetGlyAlaAlaSerLeuXhrLeuXbrValGlnAlaArgGlcLeuLeuSer CAGGAAGCACGATGGGCGCAGCGTCACTAACGCTGACGGTACAGGCCAGACAGTTACTGT • 7400 · · · · GlyIleValGlnGInGlnAsnAsnLeuLeuArgAlalleGluAlaGInGInEisLeuLeu CTGGTATAGTGCAACAGCAAAACAATTTGCTGAGGGCTATAGAGGCGCAACAGCATCTGT • · · » · 7500 GlnleuThrValTrpGlyIleLysGlnLeuGInAlaArgValLeuAlâValGluArgXyr tgcaactcacggtctggggcattaaacagciccaggcaagagtcctggctgiggaaagax • · · · · · LeuGlnAspGlnArgLeuIeuGlyMetXrpGlyCysSerGlyLysHisIleCyalbrlhr ACCTACAGGATCAACGGCTCCTAGGAATGTGGGGTTGCTCTGGAAAACACATTTGCACCA • · · 7600 · · PheValFroXrpAsnSerSerlrpSerAsnArgSerLeuAspAepIleXrpAsnAsnMet CATTTGTGCCTTGGAACXCXAGTTGGAGTAAXAGAXCTCTAGATGACATTTGGAATAATA ······ XbrXrpMetGlnXrpGluLysGluIleSerAanXyrXbrGlyllelleXyrAsnLeuIle XGACCTGGAXGCAGXGGGAAAAAGAAAXXAGCAAXXACACAGGCAXAAXAXACAACXXAA • 7700 · · ,· · GluGluSerGlnlleGlnGloGluLysAsnGluLysGluLeuleuGluLeuAspLyeXrp XXGAAGAAXCGCAAATCCAGCAAGAAAAGAAXGAAAAGGAAXXAXXGGAAXXGGACAAGX • · · · * 7 800 AlaSerLeuTrpAsnXrpPheSerlleSerLysIrpLeulrpIyrlleÀrgIlePhelle GGGCAAGTTTGTGGAATTGGTTIAGCATATCÀAAAIGCCTGTGGTATATAAGAATATTCA tf··· · IleValVaiGlyGlyLeuIleGlyLeuArgllellePbeAlaValLeuSerLeuValAsn IAAXAGTAGTAGGAGGCITAAXAGGITIAAGAAXAAIITITGCTGXGCTTTCTTTAGTAA • · # 7 900 * · ArgValArgGlnGlyXyvSerProLeuSerLeuGlnlhrLeuLeuProIhrProArgGly AXAGAGTTAGGCAGGGAIACTCACCTCTGTCGTTGCAGACCCTCCTCCCAACACCGAGGG ProProAspArgProGluGlylleGluGluGluGlyGlyGluGlnGlyArgGlyArgSer GACCACCCGACAGGCCCGAAGGAATAGAAGAAGAAGGTGGAGAGCAAGGCAGAGGCAGAI • SOOO · · · · IIeArgLeuValAsnGlyPheSerAlaLeuIlelrpAspAspLeuArgAsnLeuCysLeu CAATTCGATTGGTGAACGGATTCTCAGCACTTATCTGGGACGACCTGAGGAACCTGTGCC • · i · · 8100 PheSerlyrHisArgLeuArgAspLeuLeuLeuIleAlaThrArglleValGluLeuLeu TCTTCAGTTACCACCGCTTGAGAGACTTACTCTTAATTGCAACGAGGATTGTGGAACTTC GlyArgArgGlyTrpGluAlaLeuLy 6lyrLeuTrpAsnLeuLeuGlnTyrTrpGlyG-ln TGGGACGCAGGGGGTGGGAAGCCCTCAAATAICTGTGGAATCTCCTGCAATATTGGGGTC . . , 8200 -65- / GluLeuLyaAa&SerAlalleSerLeuLeuAanXbrXbTAlalleAlaValAlaGluCya AGGAACXGAAGAAXAGXGCXAXXAGCXXGCXXAAXACCACAGCAATAGCAGXAGCXGAAX XbrAspArgValIleGluIleGlyGlnArgPbeGlyArgAlalleLeuEialleFroArg GCACAGAXAGGGXXAXAGAAAXAGGACAAAGAXXXGGXAGAGCXAXXCXCCACAXACCXA • 6300 · » .p · · EW I tHetGlyGlyLyelrpSerLya ArgZleArgGloGlyPbeGluArgAlaleuLeu) I GAAGAATTAGACAGGGCTTCGAAAGGGCTTTGCTAirAAqATGGGTGGCAAGTGGICAAAA . . . 1 . 8400 SerSerlleValGlyXrpProLyalleArgGluArglleArgArgXbrProProXhrGlo AGTAGCATAGTAGGAIGGCCXAAGAXIAGGGAAAGAAXAAGACGAACXCCCCCAACAGAA XbrGlyValGlyAlaValSerGlnAapAlaValSerGlnAspLeuAspLyaCysGlyAla ACAGGAGTAGGAGCAGTATCTCAAGATGCAGIATCTCAAGATTTAGATAAATGTGGAGCA • · · 6500 · · AIaAlaSerSerSerProAlaAlaAsnAsnAlaSerCysGluProProCluGluGluGlu GCCGCAAGCAGCAGTCCAGCAGCTAATAATGCXAGTTGTGAACCACCAGAAGAAGAGGAG GluValGlyPheProValArgProGInVa lProLeuArgProMetThrTyrlysGlyAla GAGGTAGGCTTTCCAGTCCGTCCTCAGGTACCTTTAAGACCAATGACTTATAAAGGAGCX • 8600 · 3 · · · PLcAspLeuSer HisPheLeuLysG luLysGlyGllyLeuAspG lyLeuVa HrpSerPro ITTGAICTCAGCCACTTTTTAAAAGAAAAGGGGGqACTGGATGGGIIAGITTGGICCCCA . . . 1 . . 8700 LyiArgGlnGluIleLeuAapLeuXrpValIyrEisXbrGlnGlylyrPheProAepIrp AAAAGACAAGAAATCCTTGATCIGIGGGICTACCACACACAAGGCXACTXCCCIGATXGG GlnAanTyrTbrProGlyProGlyIIeArgPheProLeuTbrPheGlyTrpCysPheLy* CAGAATTACACACCAGGGCCAGGGATTAGATTCCCACTGACCTTCGGATGGTGCTITAAG . . . $600 LeuValProKetSerProGluGluValGluGluAlaAsnGluGlyGluAeiiAsDCysLeu TTAGTACCAATGAGTCCAGAGGAAGTAGAGGAGGCCAATGAAGGAGAGAACAACTGTCTG LeuHi sProIleSerGlnEisGlylíetGluAapAlaGluArgGluValLeuLyaTrplys TTACACCCTATTAGCCAACATGGAATGGAGGACGCAGAAAGAGAAGTGCTAAAATGGAAG • 6900 · · · · PhcAapSer SexLeuAlaLeuArgE isArgAlaArgGluGlnEisProGluTyrTyrLys TTTGACAGCAGCCTAGCACTAAGACACAGAGCCAGAGAACAACATCCGGAGTACTACAAA _ . « . * · 9000 AspCysj gactgcJtgacacagaagttgctgacaggggactttccgctggggactttccacgggaggc • · · · · · gtaacttgggcgggaccggggagtggctaaccctcagatgctgcatataagcagctgctt JL’Vr^R . . 9100 TTCGCCTGTACTGpGTCTCTCTTGTTAGACCAGGTCGAGCCCGGGAGCTCTCTGGCTAGC • · ♦ · · ♦ AAGGAACCCACTGCTTAAGCCTCAATAAAGCTTGCCTTGAGTGCCTCAA . 9200 -66- / '"ν> derivadc de um RNA de LAVELI ou de uma sua fracção, de se clonar o cDNA citado antes em um microrganismo apropriado ou célula trans formãvel pelo vector citado antes e de se recolher o DNA clonado dos microrganismos ou célula transformada citados antes.
  2. 2. - Processo para a identificação da presença em um tecido de hospedeiro de um vírus ou de um provxrus relacionado quer com LAVeli quer com LAV^^ caracterizado pelo facto de se formar um DNA híbrido obtido a partir do tecido citado antes com uma sonda formada pelo DNA clonado obtido pelo processo de acordo com a reivindicação 1 e de se detectar a presença do vírus ou provirus citado antes no referido tecido de acordo com a eventual detecção da hibridação com a sonda citada antes.
  3. 3. - Processo para a preparação de um peptido, proteína ou de uma sua fracção codificada por cadeias de leitura abertas da sequência de DNA do DNA clonado produzido pelo processo de acordo com a reivindicação 1 ou de um seu fragmento, caracterizado pelo facto de se transformar um organismo celular superior tal como leveduras ou células de mamíferos por via de um vector recombinan- te contendo o DNA clonado com o significado definido na reivindicação 1 e de se escolher o vector recombinante entre os organismos que permitem a expressão de uma inserção de um acido nucleico que corresponde ao DNA clonado gue corresponde ao cDNA citado antes e de se recuperar o pêptido codificado pelo cDNA citado antes a partir dos produtos de expressão das células transformadas. -67
  4. 4.- Processo de acordo com a reivindicação 3, caracteri-zado pelo facto de o cDNA citado antes codificar um péptido que corresponde a uma qualquer das cadeias que se prolongam respecti-vamente desde o resto aminoacilo 37 até ao resto aminoacilo 130, ou desde o resto aminoacilo 211 até ao resto aminoacilo 289, ou desde o resto aminoacilo 488 até ao resto aminoacilo 530 representados a seguir: I • % · 68· νί I © κ
    » Qo mm o X O X © 1 1 H ► o X Cr X c* o O w m «ο X A» mt x σ x * ► M © r% X Λ X <# m% ϋ s ui o w t* cr o O x X ► < < mJ ui V) x X O W «Λ W * X o «0 X ►- O u o X u u V) X X < X u M X mm ·* M m pj o SS X X X o H O o O X O o o n u X mm P © X •I pj «th w ft. p^ H» r* X rm mm «·% > «r >- X X * O O < «4 y% X V» > p4 1 X X 1 z H > > X X < 1 < < 1 ο X X 9 u. > 1 1 < 1 χ M s mm X 1 1 Cr 1 < >- © Μ M H X w 1 1 O 1 < X X O pj 1 1 < « Ο X V «J w O < c> Χ O > e o O X x M < o ο •O mm > «* c %n M < e* u Λ V ·"» p <« < < o > X o Cr © Cr »- mm pj P et > < H X o X ui •J X *J •4 ► H H © X O X P* z U X X H X mm X a •J M 9 UI u X X x e X O J O et e u O jj *4 >· mm z *· O U* X Cr X mm Ο PM a M > H *r z X Χ ·-« ê. mt < u X w 1- U © < p cr w o u < O X o X O > o u u. X u X •4 u X O X u V) p* < X — J X tt X O < O X O X e -J e u o u X %n A© s x mm r* o X ·*· X «M X e· X M «0 H mg X uj H X fr- X © O X z V X X X < X X mm © O X o f- > X > > o X X <· •4 u o A o X mm z X u X X mm X O < V o X (J «1 Ui ac * o o o X O u O O © O O X u u ΙΛ »> SE fs. X -J fO > < •J ► «*— u tH fr j sf mm mi > u Ui io •4 SZ V) >· ui H ·- O < *4 > M PW Ι W u» H > Ο t ui < x X < X P o > > M z u x h > O z z 490 500 510 LA V BAU 5FRSCVETTT fSQKQEPIDR ELYPLTS LAS LFCNOPSSQ ARV 7 F E K UV IML cr t lt· QK A K OL GAG © J mm © pj ►— © mm © pJ mm © pJ ·«· © pJ mm * < mi X X •J X < «4 X < ml X < mi X X mi B ff g ui X n £ Ui X ff £ UI £ ui X *»· X ui X mm z hl >>> > > > > X > > > > > > > > > > > > > > > > < X -ς < < X < < < X < < < X < < X X < < X X < < *J < mi mi pj < «! •d pJ < •4 < mi •4 •J < nl ^ mi X mi _! -69- P H O > ► ► tf tf 0Λ > tf K MC ► — tf tf tf ©PP P P O P «0 tf ► u mi tf tf e -* «r* < « mi tf © •1 «A O tf tf O tf «r s — O tf θ' tf P w .J •J © •j ~ > > o ar tf MC © ·-«© < tf >> P < tf tf © tf © P ► < © © tf < tf © M SP P © O © © tf tf < tf P VI tf σ o >- «V tf © p & tf tf tf tf tf .< tf P tf tf tf V) > « o >· r> : tf tf tf mi © «A tf» > — ·- tf X tf © P mi m* ~ ~ tf tf * © m tf O M M tf *— M p w tf w V) I*. P o w tf «« X tf cr p tf ο VI Μ M O X «r tf X tf O tf P tf tf tf P tf < P P P tf © tf tf x tf ►* -J tf * P ><: ©><· tf © tf X — mi mi © P © X X ·* X — tf t/> P tf CO s tf P tf tf tf © o I- p fc> p P P o «. O Q - > m» © H «A tf tf tf c o*D)CD Cr © O tf tf © tJ P tf © tf «0 tf — © tf tf •c © tf © tf © © m X tf © tf tf mi tf tf tf tf tf O p «-N tf CO >crtf •c tf w r> < > P © : p •j © *-tf» «J -· tf tf tf tf tf tf tn ©sS tf tf tf wc © © tf— o © Q tf < < tf < © tf «A < P e «ctf < tf © © tf tf tf M *- »· O P tf Z tf tftf z z z u < tf tf © tf r* tf tf tf tf tf © (/) P tf X X X © tf — ui mitf z z ztf © tf ca cωO d mi m4 © -J *« p ·«* tf < mi tf < mi © © •J *— © J •m AC < •J « PI x w a Ui tf < P tf < _í tf tf mi *«· X Ui «D ΓΜ X w β M X UI tf 1*4 X Ul > > > > tf tf >· tf tf tf > tf tf > > tf tf tf > tf tf tf tf tf < «J tf < < pj < pj < tf < < mi < -J < tf < < < •J < tf < tf -J < mi tf P •K < tf tf mi tf mi ac < tf P tf pi -7(
    Ο Η X Ο © ο Μ ' Ο X ο χ o X o ·· m > «· Η X X Ν © ο > m X © X χ z X (Μ X #η © 4 © «V w «A X â. •1 X X X Ζ X X X X aí X Η •4 ζ Otf «ft» cr X V> X X X X z © © X U X X •1 X ζ X z μ — h Μ X cr X X X X ** X X >· U < © Ο θ' ο ζ ο Ο* Ο X Ο X e X o r·* A» W» a. η < Μ Μ X © X X »A M lo «* Η Μ X Λ © «η s *# X trs > «A μ. > mm X X X ·* fc. © X Η X < tn H > Η U ο X X > *4 X — X X X μ © μ > 2 Η X Z μ- *a X LA u Η X η Η X •w > Cr © X Μ -2 U. X X X X X O X Ο m* ο Μ Ο X VJ © © O X z o © ^ Q W X «a < Ν X Ο Μ © Ζ «0 > ** *r > X X Μ © π Η ια χ X ·* X o «A X o X © ►* X X H X < H h © X X < X X H X *4 X © «Α © Η Μ X X V) mm >- © 10 X X © *X Μ X X X H < X «0 μ μ μ* Ζ © X X © > X X »4 μ ·. Μ X X X X © O X t ( ο ** © X © ο Ο X O X o z m o u η © mm ΙΟ ζ bJ X fk W x\ X A μ K (3 O Μ ο Ν χ Ν Ο η X «a X Λ 2» O >- © © © «4 1- u < Z © Ι X X X X © M > Ο > S © X X θ' * * ► «4 %η © XXX μ s X •4 X ΙΟ X © z X μΐ Μ ζ 1- Η >- mm X < χ Ιο •4 χ X >· o x «A «A Ο Ο © X © © Ο X o © o X «# h 1 1 « © © X © © 10 © %r X < « o tu I 1 Μ Ο* ΙΝ ο* «Μ > η μ ·* z μ IA 1 1 © X © © X 1 1 © W «4 > © X < 1 1 ψ* μι > Ζ M z X | 1 JJ· μ. μ X < X μ 1 1 Μ © ζ © > X μ- © 1 « a. X «0 © X X © IO 1 1 X X X = X X O M • 1 ο χ Ο © Ο X © ζ # e X X o © r» m 1 1 1 ·* X IS X «Λ © © X ·· > k. « 1 Μ © mm > Μ X <-ι Ζ «a > *A μ μ. X ae •4 Μ •O © •u .4 X © Ζ X z >- m Μ Ζ ζ ζ © < ο· «w © X X X Μ ο X © X X z < W X ζ X o © W © X ss z o H •4 X Μ © X > © X © Cr ο > © X Ο © © X H © μ o o W LO X © Η X © ο •4 «a χ p< z o © (A fb Ο mm X *Η θ' ΙΑ u. «a IA X M ft. Ο > > X © X LO © lo X X X ΙΟ X X M M © > 9 X IO o X x o Η Η X mm X X < © © © X X > K *4 Μ © Η > ; σ v X © X X Η s © © Cr ο ’< ο Μ © X © «A o X LA © X -* *4 μ μ Cr> 1*1 ζ* Μ *α X f\ m aatf © * LA to χ Μ X IS Ζ «a © •4 > k* X < »4 X »4 u. H o •a © ζ ΙΟ r· > >* c Μ X © «4 X < X >· u © Η* U. X © > x Μ > © © ζ LA X © X μ X X X © ζ U sz 12 u Μ > m •4 X X > POL D X x z X 9 X r- 9 X mm 9 X ~ 9 X mm 9 X ·* X < X X X X X X x X X X X X X X X X X X aj B IS Z X B ·*· X B IS X u B IS = u • 03 IS X X B IS = X m IS u > > > > > > > > > > > > > > > > > > > > > > > > > > > X X X X X X < X X XXX < X < < < X < < < X < X < X X X X < X X X < X X X < X X X < X X X < X X X < X X X < X X 71 0** OC 9 Ot9 019 009 00( 08C Οί( k O M O mm O M O k H N k o ► mm M m «a Φ o o w #* •J ·§ X m > 0* et x h < X U > V» x X J p- a W U o H ·* M k k pJ Θ et k θ' X x k k u k Cr k X a u k k θ' p o X X X O o e pj e k e k o mm x Cr k» k X x ** U k > •0 mm k Cr S£ β fi O X m o Ptf μ X O k X k < k W k prt k ki M Θ mm o > u %C cr < k Ci mm %t X < M > O X Cr p e pj O cr O < O pj pi X e k X o 90 > Ui X k k k X m X k X fr X X υ k ia u O < < cr et X Ui < *- o %ft x X * x pm cr O X > o k ia O < •P fr- < < < Θ o Cr Cr k < < pp X o a O ia O u o IA O — X O M P ► k »« k X k k» O < >» «o P4 k o e u. k k pm mm O k k cr u X ·· u frl X M «0 X X o *1 ► < o ia o «4 > X o o p w P- A < < k •M n X k IA X mm ta X X k Cr k» o M O ·< e > > o o O w ta x X 90 *r k > > 19 o o P U M k «e O kr k k. 10 X > k o o k o pJ Θ k k P et X cr < •a X X X mm v· Cr s k et PM * k 19 X X m· x < k X X ΰ (A X X > o -1 o 5 O X o = o X •1 k < «rt rt .J — M k X k. «e k k •C X mi PP k k k k k H Cr V) X ·» k k > < k > z O X < X X k fr- IA X k O k k X ta > o ia prt >* Cr < «A > X u u k * ia o > O ia o fr e X o n x £J «f k* ia o mi X θ k •1 o) k D ec < k X k PP z o o ta ta ia k «J > k *0 Cr < k a < > O" < cr z cr -J X o u < a et u P u >. < P* ta > P ta .j (4 — cr X k z X o = X O O X o k o P o 5e •Λ •1 ** u k mm k «J z < k b. X %n «D «— k J H < < θ < X X u -1 > > X < z u X X -) b· μ fr- c£ > iJ P u X »— < U X X X Cr cr X O < •n cr > - Ξ ? pj P* > X > > > > < x < -< j < «j «j n -J — κ < -J fi N £ u > > > > < x < < -J < -J -J => J -x < J « r* S U > > > > x x < < _> < ~J -J => J * < — « r« X -Ϊ ia > > > > < x < < •J < -> -* D *J — X < -J > >>> < x < < •J < -J pj 72 / I i Ο μ o 1 M M · O M O tf tf (3 e μ O i μ o 9 o m àm * W 1 tf tf μ tf O tf m i i «A 1 © μ «XM * μ u. MS μ tf UI tf X •A MS • u X tf tf 1 u X u s μ X mm < X 3 -J O < X θ' O tf « o X UI X tf tf X u μ tu o H U 1 < UI tf H A» X A tf IA 1 X ui tu X tf tf 3 Μ 1 HH μ μ tf M μ ' ► P* P* VI · tf H X tu tf © X O X 1 > O M O X μ Ο Η X o J pm O κ ae ^ μ 1 MS MS tf M» Mi tf > μ μ K J Ml > < — X 1 u rs μ- •n u» < μ tf Λ N tf O MS kl M tf O tf > UI μ h Μ Z X w A kA μ tf P* A M UJ X hl- tf O ui g u A X CL μ H O O V) H X O IA tf «A M X > J o V) mJ 2 tf * μ ► z tf cr X tu < < tf tf > < «A tf «A X *J μ e a Ο X tf H -j eto e m Ο θ' IA tf O N o « V) tf O 1 μ < e ·* tf tf X X tf cr μ X tf ^ < — 1 1 X · « cr η μ X X n tf tf o tf MS 0. lo «J > Ui μ tf M > tf kA O tf Ul ar* μ A X Ρ* < μ Mi mm μ *r» > tf X f · tf U “ μ Φ U kA A X X H tf O H tf X X X μ χ μ j j tf tf W μ m) X u. X μ < MHHH tu X UI u» X 1 1 X M O ul O > O kA X X X O tf o o o 1 % © tf © f^O - μ m «4 mm μ kA tf tf j g MS g rs 3 — «1 w #J n tf η θ' g g tf U 1 MS > tf μ tf tf tf UI kA μ μ μ tf U» μ μ > X ~ tf U U ui tf u > •j • x ΙΑ X > pm pi Cr tf U tf 1 H 1 μ UJ tf 3 > »- > • μ • «A Ui •A tf > tf X μ tu 1 z 1 X ui < > X tf > u. i μ 1 t tf •4 > > O h O tf e » μ μ O J e cr c k M _ pm © 4 > r* Ο μ X kA m tA - tf tf w C7 Cr tf θ' n 3 M μ μ M O «A μ o n j tf tf MS J • θ' A tf (A X μ tf O X A X A «j < X tf tf tf U O 3 A «2 X O IA tu _ ^ μ < < -> m» •3 3 tf Cr tn tf Cr Cr * cr u cr mi M mm *» > > > μ < μ μ - tu mm — > •J kA tf UI M4 O M T T o o O A O > O kA X / * Ο μ IA X e «PA X — u J P*. > mm «tf P* MS O u μ mm •J — x cr - U ^ X tf μ u MS X μ tf ΙΑ X μ X MS /% *" Z X μ tf «e tf tu O kA μ CL u cr u. U· X μ U x V) w á Ul tf -1 μ -» O tf μ X > tf X Cr tf tf X O kA x -J μ z μ tf o X ul Μ H s ** O X X X UJ > • o X p* M *4 kA H Ul O 1 1 · X tf » Cr Cr X A a — O X 1 μ Ο X 1 1 1 e tf o a o > o o IA © UJ X 1 mm O w tf 1 1 1 O 3 m > ·-» tf tf * μ tf 1-4 μ tf Mm g mi X O 3 1 1 1 -· X — tf N kA MS | pm 1 1 tf IA tf tf X MS O ~ o o O o > tf tf pm Vi 3 1 tf X u. ÊC kA tf X U tf μ i u tf tf tf X o P* O -J tf tf μ μ μ kA I X 3 UI %n > > # u μ X I 3 3 μ H à. u» M > X > μ U 1 Cr X x X X > ΙΛ tf tf tf u w u. mi m3 3 © X > μ tf < IA μ O V sg o > O o u O X o o O tf a cr O kA X O —' tf 2 c* -J f>. tf Μ. X MS O — X IO tf tf tf > UI < — W> Mi tf MS «. mi tf u. tf 1 tf Cr ui > — ~ • U tf tf tf u •J 1 μ Mi Ui X ví tf 1 1 1 tf o • u ui o Cr tf mC A A Cr i 1 * μ kA IA tf tf a: tf mm > £ X tf M- u. kA μ μ μ > < » Ui 1 • u tf μ X tf X (£ u tf O t tf **· μ • u A tf 1 1 mJ «A U tf μ NIICSCIFKrC CCDMRDIMIRS ELYKYKVVKI EPLCVAPTKA KKK VVQREKR AVCI-CALTU CTLCAACSTH CARSMTLTVQ > LU A mi r4 A •J A pi mé 3 P mi PP P M> P -1 M* tf tf K tf u tf < mi tf tf •J tf tf PÍ tf tf U tf < mi M mm X Ui «tt rm X Ul •a N X u Γ4 X UJ tf rm X u * f<4 Ul rm X UJ > > > > > > > μ μ μ μ μ > > μ > > μ μ > > > > > > > > > < tf tf tf tf m < < < tf < tf tf tf tf < tf « < tf < « tf tf < m tf tf -* tf .J tf .j •j < mi •j «j < u •i mi tf .J mI tf -J mi < «g mi 73- « » e w e «f «I ^ V) X O ri x X X > m e h< © ► < m mm > < < OS > X w o © X UJ X M © X fef x X M mi pJ © X X X mi pp •4 ► > pj mJ P» pJ < Vi UJ pi > M u > mm mm O x X UJ ui 1 1 UJ O Vi X >- X X u < V) M pi mi pJ b. ui © X © x o Ui > O 3 O o © X ·< © cr © © u. e © n x > mm ^ >· r-» m r* X Ub «A X b > r- mm > r- m m M ui •M H < *· h X X 1*. mm u. 4 • u X X X X -1 * < 1 1 • pi X >- X ·© mm mm X x mi Vi X X X © < © V) © X > pp SP pj X X m X mi mi pJ < © X >- mi PP > X O o o X o © o < o X Vi © © Μ M o pi «cu «£) X, © < © X o r-* X z x cr r- > H «D ç >- © U- < H u. H >· pp X H H w mi < o © X X X X tn IA X © O z V) ΙΛ tO Vi ·Λ > x © " w > J X Vi U u. u. >· ptf »- < © pi > O UJ mm < X © « X z © mm < X o & o X o > pJ O > o O u © >m u« m e x •J ** mi #9 « •rv a Π © V) m* eL O X M © •J X UJ < X X O mm > V) X © > © H O Ui < 0 H UJ pJ A 1 i A © 1 h a >- > X > > pi c > 1 1 to 1 UJ © O © < 1 1 > 1 pJ pi ac © PP 1 1 < t o O *- > > © -i O UJ o < O 1 t © 1 © pi © x 8* < θ' «0 © Ui Cr faJ X X o o u w «r X H «< X H P4 © «* X Vi < • © > > > w © © UJ w UJ ,J X UJ pJ u» < X u X cr y X uj UJ fr" J X «O © > X © X X Cr o > ptf u o IO Q Cr u A < o H s Λ 3 9 X a- t- X * Vi < w *· > O > o Cr O X O X O < H o pJ r h r- «n mi ♦r* © ^ 1 1 1. 1 n O X pJ X A. u Ub X — © w © θ' U ãm u < H fr- pi pi p. -J tí © X © •J mi m VJ — © 1 u· • « © V. H X a- 1 u 1 X cr θ' = >- > ί t- > a. < >- © 1 l < X 1 K t 1 Ui w < — h pJ X pi o w o LO Z ο u O Z «e mi mi o pJ o C pp PP o u. «D M © H h f* X v> fS X o z *•9 < >- ^ Cr m z UJ PP ΙΛ ac X u. mi > mi -J • «J *" pJ .J O kO fi V} pj >- H > H < X < © > pJ u. -J X UJ a. •J u. IO < © X u u «0 < X X UJ C7 o w UJ u >» M © © X Cr X o X > O >- o cr O GJ o Cr © cr O O © > X - — o H fs > X m ac. —· X V» c- z pp © r* > B u X X X O l-· X © X X ΙΛ X X to pi pJ > pJ mm z u. PÍ z o Cr P. mi ~Í u X > Cr X kO > © © 1/ r -J p- ¥* O A. < Cr o d u > X »- X X X © pi ~ m < β M X ϋ Í3 «1 -· & -i ·-· cc < ~> «C < -j β N X U B Μ x U => pJ *« K < -J ·* rv χ w LL © pJ ·- x < ·-! B N X U © mi *- X < -J B N X U > > > > > > < B ^ " J < J J -J < > > > > > > < *< <*<<< pJ -I pi < mJ -J > > > > -<·*·<< pJ < pJ -i > > > > < m < < •J < pJ -i > > > > ·< x < < _» < J -i 170 180 190 700 710 LAV MU DKVEEANKCE KTSLLHVVSL IICHDDP CREV LEVRFDSRLA FHHVARELMF EYFKMC A * V 7 E ti; H CAKV K Η Y D LAV MAL εε E NC 1 Q CA KKSLRKQ YD LAV ELI QE DTE TM ICQ E Q K N ER Μ ΓΥ- -74-
  5. 5.- Processo de acordo com a reivindicação 3, caracte-rizado pelo facto de o cDNA citado antes codificar para um pêptido que corresponde â cadeia que se prolonga desde o resto aminoacilo 490 até ao resto aminoacilo 620 tal como definidos na reivindicação 4.
  6. 6. - Processo de acordo com a reivindicação 3, caracte-rizado pelo facto do cDNA citado antes codificar para uma fracção de uma proteína ou gliccproteina cuja sequência de aminoacidos inclui a totali. dade aroma fracção das sequências seguintes: OMP ou proteínas gp 110 incluindo precursores: 1 a 530 OMP ou gp 110 sem precursor: 34-530 Sequência que transporta o TMP ou a proteína gp41: 531-877, especialmente 680-700 cadeias bem conservadas de OMP: 37-130, 211-289 e 488-530 cadeia bem conservada encontrada na extremidade de OMP e no início de TMP: 490-620.
  7. 7, - Processo para a preparação de um qualquer dos pépti-dos definidos antes em uma qualquer das reivindicações 4 a 6, ca-racterizado pelo facto de se condensar sucessivamente os amino-ãcidos sucessivos em grupos de dois, pela ordem apropriada, ou fragmentos de piptidos sucessivos previamente disponíveis ou fabricados e contendo já diferentes restos de aminoacilo na ordem -75-
    apropriada respectiva e de se recolher, finalmente, o péptido guando a sua síntese ficou concluída.
  8. 8.- Processo para a detecção in vitro da presença de anticorpos dirigidos contra LAV£LI ou ou contra vírus com estes relacionados em líquidos corporais humanos, caracteri-zado pelo facto de se fazer contactar os líquidos corporais citados antes com péptidos obtidos pelo processo de acordo com uma qualquer das reivindicações 3 a 7 e de se detectar a reacção imu-nolõgica entre os antigénios e os anticorpos citados antes.
  9. 9.- Processo de acordo com a reivindicação 8 caracteri- zado pelo facto: - de se depositar uma quantidade pré-determinada de um ou mais dos antigénios citados antes em cavidades de uma microplaca de titulação; - de se introduzir diluições crescentes do líquido biológico, isto é, do soro a diagnosticar nessas cavidades; - de se incubar a microplaca; - de se lavar cuidadosamente a microplaca com um tampão apropriado; - de se adicionar às cavidades anticorpos marcados específicos dirigidos contra imunoglobulinas sanguíneas, e - de se detectar o complexo anticorpo-antigénio formado o qual é neste caso indicativo da presença de anticorpos LAV no líquido biológico. Lisboa, 29 de Setembro de 1988
PT85148A 1986-06-23 1987-06-23 Processo para a obtencao de variantes, do virus lav e de compostos proteicos, assim como as suas aplicacoes PT85148B (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP86401380 1986-06-23

Publications (2)

Publication Number Publication Date
PT85148A PT85148A (en) 1987-07-01
PT85148B true PT85148B (pt) 1990-03-30

Family

ID=8196317

Family Applications (1)

Application Number Title Priority Date Filing Date
PT85148A PT85148B (pt) 1986-06-23 1987-06-23 Processo para a obtencao de variantes, do virus lav e de compostos proteicos, assim como as suas aplicacoes

Country Status (10)

Country Link
US (5) US5030714A (pt)
EP (1) EP0253701B1 (pt)
JP (1) JPS63503513A (pt)
AU (1) AU621031B2 (pt)
DE (1) DE3783282T2 (pt)
DK (1) DK175819B1 (pt)
ES (1) ES2052591T3 (pt)
GR (1) GR3007493T3 (pt)
PT (1) PT85148B (pt)
WO (1) WO1987007906A1 (pt)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9309574B1 (en) 1984-08-22 2016-04-12 The United States Of America As Represented By The Secretary, Department Of Health And Human Services Molecular cloning of HIV-1 from immortalized cell lines
US5034511A (en) * 1987-04-13 1991-07-23 Institut Pasteur Variant of LAV viruses
US5824482A (en) 1986-06-23 1998-10-20 Institut Pasteur Purification, cloning, and characterization of a novel human immunodeficiency virus LAVMAL
US5030714A (en) * 1986-06-23 1991-07-09 Institut Pasteur Variant of LAV viruses
SE8701765L (sv) * 1987-04-28 1988-10-29 Statens Bakteriologiska Lab Analysmetod och medel foer denna
US5043262A (en) * 1988-05-12 1991-08-27 Dana Farber Cancer Institute Protein, sequences containing the VPU gene therefore, vectors, methods of preparation and use
EP0657532B1 (en) * 1988-06-09 2003-12-17 N.V. Innogenetics S.A. HIV-3 retrovirus strains and their use
FR2640877A1 (pt) * 1988-12-06 1990-06-29 Centre Nat Rech Scient
US5278042A (en) * 1989-02-06 1994-01-11 The United States Of America As Represented By The Department Of Health & Human Services Method for detecting inhibitors of tat protein
FR2644176B1 (fr) * 1989-03-07 1993-10-08 Franceville Ctre Internal Recher Retrovirus viscpz infectant naturellement le chimpanze, fragments d'adn de ce retrovirus, procede de preparation d'une proteine et/ou d'une enzyme de ce virus et leurs utilisations
FR2646606B1 (fr) * 1989-05-03 1994-06-17 Inst Nat Sante Rech Med Retrovirus hautement cytopathogenique hiv-ndk. fragment d'adn de ce retrovirus, procede de preparation d'une proteine et/ou enzyme de ce virus et leurs utilisations
EP0400245B1 (en) * 1989-05-31 1995-12-20 Institut Pasteur Proteins and glycoproteins of the HIV-2 EHO retrovirus antibodies directed against them - application for the diagnosis
US7022814B1 (en) 1992-01-21 2006-04-04 Institut Pasteur And Institut National De La Sante Et De La Recherche Medicale Nucleotide sequences derived from the genome of retroviruses of the HIV-1, HIV-2 and SIV type, and their uses in particular for the amplification of the genomes of these retroviruses and for the in vitro diagnosis of the diseases due to these viruses
FR2647809B1 (fr) * 1989-06-02 1991-09-20 Pasteur Institut Amorces oligonucleotidiques pour l'amplification du genome des retrovirus du type hiv-1, hiv-2 et siv, et leurs applications au diagnostic in vitro des infections dues a ces virus
FR2647810B1 (fr) * 1989-06-02 1994-07-22 Pasteur Institut Amorces oligonucleotidiques pour l'amplification du genome des retrovirus du type hiv-2 et siv, et leurs applications au diagnostic in vitro des infections dues a ces virus
CA2062829C (fr) 1989-06-02 2007-08-07 Maurice Moncany Sequences nucleotidiques issues du genome des retrovirus du type hiv-1, hiv-2 et siv, et leurs applications notamment pour l'amplification des genomes de ces retrovirus et pour lediagnostic in vitro des infections dues a ces virus
PT726962E (pt) 1991-12-23 2006-10-31 Chiron Corp Sondas para hiv para uso em ensaios de hibridacao em sanduiche em fase de solucao
JP3277045B2 (ja) * 1992-10-06 2002-04-22 デイド・ベーリング・マルブルク・ゲゼルシヤフト・ミツト・ベシユレンクテル・ハフツング Hiv−グループのレトロウイルスおよびその使用
DE4405810A1 (de) 1994-02-23 1995-08-24 Behringwerke Ag Von einem Retrovirus aus der HIV-Gruppe abgeleitete Peptide und deren Verwendung
EP1849869A3 (fr) * 1994-10-20 2011-05-18 Institut Pasteur Séquences nucléotidiques d'antigènes rétroviraux VIH-1 groupe (ou sous-groupe) 0
FR2734281B1 (fr) * 1995-05-18 1997-07-25 Commissariat Energie Atomique Fragments d'acide nucleique derives du genome du virus vih-1, peptides correspondants et leurs applications en tant que reactifs d'evaluation du risque de transmission materno-foetale du vih-1
US6001558A (en) * 1997-06-25 1999-12-14 Ortho Clinical Diagnostics, Inc. Amplification and detection of HIV-1 and/or HIV 2
US5891994A (en) * 1997-07-11 1999-04-06 Thymon L.L.C. Methods and compositions for impairing multiplication of HIV-1
DE19850186A1 (de) * 1998-10-30 2000-05-25 Roche Diagnostics Gmbh Neue Primer und Sonden zum Nachweis von HIV
DE19908766C2 (de) * 1999-02-19 2001-02-15 Ulrich Schubert Verwendung synthetischer Vpr-Peptide des Humanen Immundefizienzvirus Typ 1 (HIV-1) zur Entwicklung von therapeutischen und diagnostischen Reagenzien
US6399067B1 (en) * 2000-04-28 2002-06-04 Thymon L.L.C. Methods and compositions for impairing multiplication of HIV-1
US6582920B2 (en) 2000-09-01 2003-06-24 Gen-Probe Incorporated Amplification of HIV-1 RT sequences for detection of sequences associated with drug-resistance mutations
EP1315839B9 (en) 2000-09-01 2009-08-12 Gen-Probe Incorporated Amplification of hiv-1 sequences for detection of sequences associated with drug-resistance mutations
US20040191905A1 (en) * 2002-11-22 2004-09-30 University Of Massachusetts Modulation of HIV replication by RNA interference
TW200613554A (en) * 2004-06-17 2006-05-01 Wyeth Corp Plasmid having three complete transcriptional units and immunogenic compositions for inducing an immune response to HIV
US7563437B2 (en) 2005-02-15 2009-07-21 Thymon, Llc Methods and compositions for impairing multiplication of HIV-1
US8405379B1 (en) 2008-09-18 2013-03-26 Luc Montagnier System and method for the analysis of DNA sequences in biological fluids
EP2808387B1 (en) * 2012-01-25 2017-06-21 Japan Science And Technology Agency Oligonucleotide for hiv detection, hiv detection kit, and hiv detection method

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8423659D0 (en) * 1984-09-19 1984-10-24 Pasteur Institut Cloned dna sequences
GB8324800D0 (en) 1983-09-15 1983-10-19 Pasteur Institut Antigens
US4784941A (en) 1985-04-08 1988-11-15 Genetic Systems Corporation Expression and diagnostic use of pENV-3 encoded peptides which are immunologically reactive with antibodies to LAV
US4629783A (en) 1985-04-29 1986-12-16 Genetic Systems Corporation Synthetic antigen for the detection of AIDS-related disease
AU590382B2 (en) * 1985-12-24 1989-11-02 United States of America, as represented by the Secretary, U.S. Department of Commerce, The Plasmid and phage clones of human t-cell lymphotropic virus type iii
US4839288A (en) * 1986-01-22 1989-06-13 Institut Pasteur Retrovirus capable of causing AIDS, antigens obtained from this retrovirus and corresponding antibodies and their application for diagnostic purposes
US5034511A (en) * 1987-04-13 1991-07-23 Institut Pasteur Variant of LAV viruses
US5030714A (en) 1986-06-23 1991-07-09 Institut Pasteur Variant of LAV viruses
US5763160A (en) * 1988-02-12 1998-06-09 United Biomedical, Inc. Synthetic peptides and process of using same for the detection of antibodies to human immunodeficiency virus (HIV) gp120 envelope protein, diagnosis of AIDS and pre-AIDS conditions and as vaccines
NZ263373A (en) * 1993-03-11 1997-05-26 Univ Southern California Monoclonal antibodies and use against immunoinfective cluster viruses

Also Published As

Publication number Publication date
DE3783282T2 (de) 1993-05-27
AU7546887A (en) 1988-01-12
EP0253701B1 (en) 1992-12-30
PT85148A (en) 1987-07-01
WO1987007906A1 (en) 1987-12-30
ES2052591T3 (es) 1994-07-16
DE3783282D1 (de) 1993-02-11
DK93388A (da) 1988-02-23
EP0253701A1 (en) 1988-01-20
DK175819B1 (da) 2005-03-14
JPS63503513A (ja) 1988-12-22
US20030224352A1 (en) 2003-12-04
US7767800B2 (en) 2010-08-03
US20020177128A1 (en) 2002-11-28
AU621031B2 (en) 1992-03-05
US5030714A (en) 1991-07-09
GR3007493T3 (pt) 1993-07-30
US5773602A (en) 1998-06-30
US6426073B1 (en) 2002-07-30
DK93388D0 (da) 1988-02-23

Similar Documents

Publication Publication Date Title
PT85148B (pt) Processo para a obtencao de variantes, do virus lav e de compostos proteicos, assim como as suas aplicacoes
ES2293643T3 (es) Secuencias nucleotidicas de antigenos retroviricos vih-1 del grupo (o subgrupo) o.
JP2777115B2 (ja) 生物学的流体中の抗lavウイルス抗体の検出法
RU2279883C2 (ru) Гибридные полипептиды с усиленными фармакокинетическими свойствами
US5830634A (en) Peptides derived from a retrovirus of the HIV group and their use
US6054565A (en) Nucleic Acids of HIV-2, Diagnostic Test Kit and Method using Nucleic Acid Probes of HIV-2
US6355789B1 (en) Cloned dna sequences related to the entire genomic rna of human immunodeficiency virus ii (hiv-2), polypeptides encoded by these dna sequences and use of these dna clones and polypeptides in diagnostic kits
AU606928B2 (en) Synthetic peptide antigens for the detection of hiv-1 infection
US6544728B1 (en) Methods and kits for diagnosing human immunodeficiency virus type 2 (HIV-2), proteins of HIV-2, and vaccinating agents for HIV-2
DK174533B1 (da) Fremgangsmåde til påvisning af antistof mod HIV-virus
US7226598B2 (en) Peptide inhibitors of HIV entry
WO1988005440A1 (fr) Peptides ayant des proprietes immunologiques 2-hiv-2
US6979535B2 (en) Human immunodeficiency virus type 2 (HIV-2) env polypeptide and diagnostic assays
US7115363B1 (en) Retrovirus capable of causing AIDS, means and methods for detecting it in vitro
US6635752B2 (en) Variant of LAV viruses
AU629528B2 (en) Synthetic peptides and mixtures thereof for detecting hiv antibodies
JP2650217B2 (ja) Htlv―1感染の診断、治療及び予防接種のためのペプチド
US5858651A (en) Nucleotide sequences of human immunodeficiency virus type 2 (HIV-2), probes of HIV-2, and methods of using these probes
US6080846A (en) Composition containing a B epitope of the envelope glycoprotein of a retrovirus and a T epitope of another distinct protein of this retrovirus
US5688914A (en) Composition containing a B epitope of the envelope glycoprotein of a retrovirus and a T epitope of another distinct protein of this retrovirus
US5980900A (en) Amino acid DNA sequences related to genomic RNA of human immunodeficiency virus (HIV-1)
JP2865203B2 (ja) エイズの原因となる新規なレトロウィルスの抗原の混合物
JPH03503639A (ja) レトロウイルスhivのペプチドpf10〜pf19、該ペプチドの合成方法、特に診断用としてのその使用
US7205102B1 (en) Cloned DNA sequences related to the genomic RNA of lymphadenopathy-associated virus (LAV) and proteins encoded by said LAV genomic RNA
CA1340875C (en) Variants of lav viruses their dna- and protein- components and their uses, particularly for diagnostic purposes and for the preparation of immunogenic compositions