BRPI0613784A2 - expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise - Google Patents

expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise Download PDF

Info

Publication number
BRPI0613784A2
BRPI0613784A2 BRPI0613784-9A BRPI0613784A BRPI0613784A2 BR PI0613784 A2 BRPI0613784 A2 BR PI0613784A2 BR PI0613784 A BRPI0613784 A BR PI0613784A BR PI0613784 A2 BRPI0613784 A2 BR PI0613784A2
Authority
BR
Brazil
Prior art keywords
protein
sequence
nucleic acid
expression vector
polypeptide
Prior art date
Application number
BRPI0613784-9A
Other languages
English (en)
Inventor
Gerald R Carson
Wendy Gion
Jochen G Salfeld
Jijie Gu
Dean A Regier
Yune Kunes
Original Assignee
Abbott Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Abbott Lab filed Critical Abbott Lab
Publication of BRPI0613784A2 publication Critical patent/BRPI0613784A2/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/64General methods for preparing the vector, for introducing it into the cell or for selecting the vector-containing host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/67General methods for enhancing the expression
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1055Protein x Protein interaction, e.g. two hybrid selection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/90Fusion polypeptide containing a motif for post-translational modification
    • C07K2319/92Fusion polypeptide containing a motif for post-translational modification containing an intein ("protein splicing")domain

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Veterinary Medicine (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

EXPRESSãO DE GENE MúLTIPLA INCLUINDO CONSTRUCTOS SORF E MéTODOS COM POLIPROTEINAS, PRO-PROTEINAS E PROTEóLISE. São revelados constructos e métodos úteis para a expressão de proteínas usando produtos de tradução primários que são processados numa célula hospedeira recombinante. Constructos compreendendo uma única estrutura de leitura aberta (sORF') são descritos para a expressão de proteína, incluindo a expressão de múltiplos polipeptideos. Um produto de tradução primário (uma pro-proteina ou poliproteina) contém polipeptídeos tais como inteinas ou domínios auto-processadores da família do porco-espinho, ou variantes seus, inseridos na estrutura entre múltiplas subunídades de proteína de interesse. O produto primário também pode conter seqüências de clivagem tais como outros sítios de reconhecimento de protease ou de clivagem proteolítica, ou peptídeos de sinal os quais contêm seqüências de reconhecimento para peptidases de sinalização, separando pelo menos duas das subunídades de proteína múltiplas. As seqüências dos polipeptídeos auto-processadores ou dos sítios de clivagem inseridos podem ser manipuladas para aumentar a eficiência da expressão das subunidades de proteína múltipla separadas. Também revelados são os aspectos independentes de conduzir a expressão, secreção e/ou construção multímérica eficiente das proteínas, tais como imunoglobulinas. Onde a poliproteina contém segmentos de cadeia pesada e leve de imunoglobulina ou fragmentos capazes do reconhecimento de antígeno, numa modalidade uma proporção estequlométrica selecionável é de pelo menos duas cópias de um segmento de cadeia leve por segmento de cadeia pesada, com o resultado de que a produção de anticorpo funcional propriamente dobrado e construído é feita. Peptideos de sinal modificados, incluindo tais das cadeias leves de imunoglobulina, são descritos.

Description

"EXPRESSÃO DE GENE· MÚLTIPLA INCLUINDO CONSTRUCTOSSORF E MÉTODOS COM POLIPROTEÍNAS, PRO-PROTEÍNAS E PROTEÓLISE"
REFERÊNCIAS CRUZADAS A PEDIDOS RELACIONADOS
Esse pedido reivindica o beneficio do Pedido Pro-visório Americano No. 60/701855, requerido em 21 de julho de2005, o qual é aqui incorporado por referência na totalidade.
DECLARAÇÕES NA PESQUISA OU DESENVOLVIMENTOFEDERALMENTE FINANCIADO
Não aplicável
REFERÊNCIA À LISTAGEM DE SEQÜÊNCIAS, UMA TABELA OUUM APÊNDICE DE DISCO COMPACTO DE LISTAGEM DE PROGRAMA DECOMPUTADOR
Não aplicável (listagem de seqüências fornecida,mas não como um apêndice de disco compacto).
ANTECEDENTES DA INVENÇÃO
0 campo da presente invenção é a biologia molecu-lar, especialmente como geralmente relacionado com a área deexpressão de proteína recombinante, e a expressão e o pro-cessamento, incluindo o processamento pós-traducional depré-proteínas ou de poliproteínas recombinantes em particular.
O uso de anticorpos como ferramentas de diagnósti-co e modalidades terapêuticas tem encontrado uso crescentenos anos recentes. 0 primeiro anticorpo monoclonal aprovadopelo FDA, 0KT3 (Johnson & Johnson) foi aprovado para o tra-tamento de pacientes com rejeição de transplante de rim.Herceptina (marca comercial da Genentech Inc., Sul de SãoFrancisco, CA), um anticorpo monoclonal humanizado para otratamento de pacientes com câncer de mama metastático, foiaprovado em 1998. Várias terapias baseadas em anticorpo es-tão apresentando promessas em vários estágios de desenvolvi-mento clinico. Uma limitação na ampla aplicação clinica datecnologia de anticorpo é que tipicamente grandes quantida-des de anticorpo são requeridas para a eficácia terapêuticae os custos associados com a produção suficiente são signi-ficativos. Células de Ovário de Hamster Chinês (CHO) e célu-las de mieloma NSO são as linhagens de células de mamíferosmais comumente usadas para a produção em escala comercial deproteínas humanas glicosiladas, tais como anticorpos e ou-tras bioterapêuticas (Humphreys e Glover 2001, Curr. Opin.Drug Discov. Devei. 4: 172 - 85). Os rendimentos da produçãode linhagem celular de mamífero variam tipicamente de 50 -250 mg/L por 5-7 dias de cultura num fermentador de loteou 300 - 600 mg/L em 7-12 dias em fermentadores de lote dealimentação. Proteínas de imunoglobulina não-glicosiladaspodem ser produzidas com sucesso em levedura ou E. colí(ver, por exemplo, Humphreys DP, et al. , 2000, Protein ExprPurif. 20(2) : 252-64), entretanto, a maior parte do sucessoem sistemas de expressão bacterianos tem sido com fragmentosde anticorpo (Humphreys, D.P. 2003, Curr. Opin. Drug Discov.Devei. 2003 6: 188 -96).
Um importante desenvolvimento no campo da expres-são de múltiplos segmentos de gene ou genes tem sido a des-coberta de inteínas (ver, por exemplo, Hirata, R et al.,1990, J. Biol. Chem. 265: 6726 - 6733; Kane, PM et al.,1990, Science 250: 651 - 657; Xu, M-Qe Perler, FB, 1996,EMBO Journal 15(19): 5146 - 5153). Inteinas são consideradaso equivalente de proteína dos íntrons de gene e facilitam aunião de proteínas. Conforme notado na US 7026526 por SnellK., a união da proteína é um processo no qual uma região in-terior de uma proteína precursora (uma inteína) é cortada eas regiões flanqueadoras da proteína (exteínas) são ligadaspara formar a proteína madura. Esse processo tem sido obser-vado em numerosas proteínas tanto de procariotos quanto deeucariotos (Perler, F. B., Xu, M. Q., Paulus, H. Current 0-pinion in Chemical Biology 1997, 1, 292 - 299; Perler, F. B.Nucleic Acids Research 1999, 27, 346 - 347) . A unidade deinteína contém os componentes necessários para catalisar aunião de proteínas e geralmente contém um domínio de endonu-clease que participa na mobilidade da inteína (Perler, F.B., et al., Nucleic Acids Research 1994, 22, 1127 - 1127).
Enquanto o foco principal de sistemas baseados eminteína tem sido na geração de tecnologias de purificação ede novas proteínas de fusão da expressão de segmentos de ge-ne, US 7026526 reporta constructos de DNA com inteínas modi-ficadas para a expressão de múltiplos produtos de gene comoproteínas separadas para alcançar traços registrados nasplantas. Ainda faltando, entretanto, é uma indicação de queaqueles sistemas podem ser usados com sucesso para a expres-são de proteínas separadas que se montem em proteínas multi-méricas funcionais, proteínas extracelularmente secretadas,proteínas de mamíferos ou proteínas produzidas em célulashospedeiras eucarióticas. É notório que imunoglobulinas cai-am em todas essas categorias.
Compondo a dificuldade de estender a abordagem dainteina modificada da US 7026526 para outros genes ou propó-sitos é o reconhecimento da importância potencial das con-tribuições dos segmentos do gene da exteina desejados em re-lação ao sistema de inteina que está envolvido. Paulus re-porta, "Realmente, a união de proteínas, embora catalisadainteiramente pela inteina, pode ser notavelmente influencia-da por seqüencias de exteina. Essa influência é mostrada pe-lo fato de que a expressão de sistemas de união de proteínasquiméricas, nos quais seqüências de inteina são inseridas naestrutura entre as seqüências codificantes externas, geral-mente leva a reações secundárias substanciais, tais comoclivagem nas junções de união à montante ou à jusante (Xu M-Q et al., 1993, Cell 75: 1371 - 77; e Shingledecker K, etal., 1998, Gene 207: 187 - 95) . Isso sugere que a capacidadeque as inteínas têm de assumir uma estrutura ótima para. ounião de proteínas sem reações secundárias evoluiu no con-texto das exteínas específicas". Ver Paulus H, 2000, ProteinSplicing and related forms of protein autoprocessing, Annu.,Ver. Biochem. 69: 447 - 96. Outro comentarista estabelece:"Embora seja possível introduzir propriedades desejáveis eatividades em proteínas usando o projeto racional, altera-ções sutis necessárias para fazer um produto projetado efi-ciente e prático ainda estão além de nossa capacidade predi-tiva (Shao, Ζ. E Arnold, F. H. 1996. Curr. Opin. Struct. Bi-ol. 6, 513 - 518). ...Todavia, as regiões imediatamenteflanqueando as inteinas foram descobertas como afetando aeficiência do união (Chong., S. Et al., 1998, Nucleic AcidsRes. 26, 5109 - 5115; Southworth, M. W. Et al., 199, Biote-chniques 27, 110 - 114) e alguns hospedeiros de proteína de-vem ser incompatíveis com a atividade da inteína. Embora aelevada expressão e a pureza do produto sejam consideraçõesimportantes, elas são discutíveis se o produto final for i-nativo". Ver Amitai G e Pletrokovski, 1999,. Nature Biotech-nology 17: 854 - 855.
Conseqüentemente, num sistema de inteína modifica-do onde um resultado preferido é a clivagem sem· religamento,a presença de uma exteína externa em relação a uma dada se-qüência de inteína pode afetar uma combinação praticamenteeficiente de clivagens precisas, ausência de religamento eausência de reações secundárias. Claramente, a adaptação deuma abordagem de inteína modificada para a produção recombi-nante de certos produtos que retêm a atividade funcional co-mo produto final, por exemplo, imunoglobulinas e outros bio-terapêuticos, representa um desafio substancial para inovação.
Na presente invenção, esse desafio tem sido tomadonão somente para sistemas baseados em inteína, mas tambémtem sido explorado num sentido pioneiro para aplicações Ci-teis considerando domínios hedgehog. Proteínas na famíliahedgehog são moléculas de sinalização intercelulares essen-ciais para a padronização em embriões vertebrados. Ver, porexemplo, Mann, R. K. e Beachy, P. A. (2000) Biochim. Bio-phys. Acta. 1529, 188 - 202; Beachy, PA, (1997) Cold SpringHarb Symp Quant Biol 62: 191 - 204. Proteínas precursorashedgehog naturais são clivadas era fragmentos C-terminais(Hh-C) e N-terminais (Hh-N) por uma reação de autoprocessa-mento que tem similaridade com a união de proteínas. 0 sis-tema hedgehog representa uma oportunidade não-testada para odesenvolvimento criativo de sistemas incluindo versões modi-ficadas adequadas para a expressão de múltiplos segmentos deproteína separados.
Tentativas anteriores de expressar uma molécula deanticorpo/imunoglobulina de comprimento total através datecnologia de DNA recombinante usando um único vetor tem si-do feitas com sucesso limitado, tipicamente resultando emníveis significativamente diferentes de expressão das cadei-as pesada e leve da molécula de anticorpo/imunoglobulina e,mais particularmente, num nível mais baixo de expressão parao segundo gene. Outros fatores podem requerer níveis de ex-pressão relativamente mais altos de uma cadeia em comparaçãocom a outra para a produção ótima de um anticorpo multiméri-co propriamente montado ou fragmento funcional seu. Dessaforma, um problema é uma estequiometria subótima de expres-são das cadeias pesada e leve na célula, o que resulta numbaixo rendimento global de anticorpo montado, multiraérico.Fang et al. indica que para expressar altos níveis de um an-ticorpo completamente funcional biológico de um único vetor,é necessária a expressão equimolar das cadeias leve e pesada(ver Fang et al., 2005, Nature Biotechnology 23: 584 - 590;Publicação de Patente Americana 2004/0265955A1). Adicional-mente, sistemas de expressão convencionais baseando-se emsistemas de vetores que expressam independentemente múlti-plos polipeptideos são significativamente afetados por taisfatores como interações de promotor (por exemplo, interfe-rência de promotor). Essas interações podem comprometer aeficiente expressão dos genes e/ou montagem das cadeias ex-pressas, ou requerem o uso de mais de um vetor (ver, por e-xemplo, Patente Americana 6331415, Cabilly et ai.)· 0 reque-rimento de múltiplos vetores é desvantajoso devido às com-plicações potenciais, tais como perda de um ou mais dos ve-tores individuais além, geralmente, da necessidade de mani-pulações adicionais.
Outros fatores que limitam a capacidade de expres-sar duas ou mais seqüências codificadoras de um único vetorincluem a capacidade de empacotamento do próprio vetor. Porexemplo, considerando o vetor apropriado/seqüência codifica-dora, fatores a serem considerados incluem a capacidade deempacotamento do vetor (por exemplo, aproximadamente 4.500pb para virus adenoassociado, AAV) ; a duração da expressãoin vitro/in vivo da proteína recombinante por uma célula ouórgão transfectado com vetor (por exemplo, expressão de cur-ta duração para vetores adenovirais); os tipos celulares quesuportam a eficiente infecção pelo vetor se for usado um ve-tor viral; e o nível de expressão desejado do(s) produto(s)de gene. 0 requerimento para a expressão controlada de doisou mais produtos de gene juntamente com as limitações de em-pacotamento de vetores virais, tais como adenovírus e AAV,limitam as escolhas em relação à construção do vetor e sis-temas para a expressão de certos genes, tais como imunoglo-bulinas ou fragmentos seus.
Em outras tentativas de expressar duas ou mais se-qüências de proteína ou polipeptideo de um único vetor, doisou mais promotores ou um único promotor e uma seqüência desitio de entrada de ribossomo interno (IRES) entre as se-qüências codificadoras de interesse são usados para direcio-nar a expressão de seqüências codificadoras individuais. Ouso de dois promotores num único vetor pode resultar na bai-xa expressão de proteína devido à interferência do promotor.
Quando duas seqüências codificadoras são separadas por umaseqüência IRES, a expressão traducional da segunda seqüênciacodificante é geralmente significativamente mais fraca doque aquela da primeira (Furler et al., 2001. Gene Therapy 8:864 - 873). A Publicação de Patente Americana 2004/0241821descreve vetores de flavivírus nos quais uma seqüência codi-ficadora heteróloga é incorporada à jusante da seqüência co-dificadora da poliproteína viral, e separada daí por umIRES. Uma estratégia de vetor ancorado nuclear para a ex-pressão de gene recombinante, incluindo proteínas de fusãonas quais segmentos são separados por sítios de reconheci-mento de protease, é descrita na Publicação de Patente Ame-ricana 2005/0026137.
A ligação de proteínas na forma de poliproteínasnuma estrutura de leitura aberta individual (ORFs) é uma es-tratégia observada na replicação de muitos vírus naturais,incluindo o picornaviridae. Na tradução, proteínas codifica-das por vírus medeiam a rápida clivagem intramolecular (eis)de uma poliproteína para produzir produtos de proteína madu-ra discretos. Virus da febre aftosa (FMDV) são um grupo den-tro do picornaviridae o quais expressam uma única estruturade leitura aberta e longa que codifica uma poliproteina deaproximadamente 225 KD. 0 produto de tradução de comprimentototal sofre uma rápida clivagem intramolecular (eis) no C-terminal de uma região 2A de ocorrência entre o precursor daproteína de cápsideo (P1-2A) e domínios replicativos da po-liproteina 2BC e P3, e essa clivagem é mediada pela própriaregião 2A através de um mecanismo de stutter ribossomal(Ryan et al. 1991. J. Gen. Virol. 72: 2727 - 2732); Vakhariaet al. 1987. J. Virol. 61: 3199 - 3207). Os resíduos de ami-noácidos essenciais para a expressão da atividade de cliva-gem pela região 2A de FMDV foram identificados. Os domínios2A e similares também foram caracterizados a partir de af-torviridae e de cardioviridae da família picornavirus (Don-nelly et al. 1997. J. Gen. Virol. 78: 13 - 21).
Em ainda outras tentativas de usar técnicas deprocessamento proteolítico, descrições iniciais da produçãode insulina recombinante incluem, por exemplo, EP055945 (Ge-nentech); e EP037723 (The Regents of the University of Cali-fórnia). É um pulo tremendo, entretanto, ser capaz de apli-car tais esforços no contexto da exploração da expressão re-combinante de proteínas funcionais muito maiores e mais com-plexas, tais como imunoglobulinas. Exemplos de moléculas deanticorpo funcionais podem envolver heteromultímeros reque-rendo a montagem de quatro ou mais cadeias (por exemplo, du-as cadeias pesadas e duas cadeias leves de imunoglobulina).
Ainda permanece uma necessidade por sistemas deexpressão alternativos e/ou melhorados para gerar proteínasrecombinantes. Uma necessidade particular é refletida na á-rea da expressão eficiente e/ou correta de imunoglobulinasde comprimento total e de seus fragmentos de ligação a antí-geno, os quais proporcionam vantagens em relação à tecnolo-gia atualmente disponível. A presente invenção endereça es-sas necessidades proporcionando constructos de vetor indivi-duais usando uma variedade de estratégias tais como inteí-nas, segmentos autoprocessadores hedgehog, proteases viraisautocatalíticas e variações suas, respectivamente. Indepen-dentemente, a necessidade de montagem multimérica eficiente(por exemplo, imunoglobulina) é endereçada pelo ajuste darelação estequiométrica das subunidades (por exemplo, cadeialeve e cadeia pesada ou fragmentos seus). Em modalidades, osconstructos num sORF codificam um componente peptídico auto-processador para a expressão de um polipeptídeo biologica-mente ou industrialmente funcional, tal como uma enzima, i-munoglobulina, citocina, quimiocina, receptor, hormônio,componentes de um sistema de dois híbridos ou outras proteí-nas com múltiplas subunidades de interesse.
BREVE SUMÁRIO DA INVENÇÃO
A presente invenção proporciona cassetes de ex-pressão, vetores, células hospedeiras recombinantes e méto-dos para o processamento e expressão recombinante, incluindoo processamento pós-traducional de pré-proteínas e de poli-proteínas recombinantes.
Numa modalidade, a invenção proporciona um vetorde expressão para a geração de um ou mais produtos de prote-ina recombinante compreendendo uma inserção sORF; a referidainserção sORF compreendendo uma primeira seqüência de ácidonucléico codificando um primeiro polipeptideo, uma seqüênciade ácido nucléico interveniente codificando um primeiro sí-tio de clivagem de proteína e uma segunda seqüência de ácidonucléico codificando um segundo polipeptideo; em que a refe-rida seqüência de ácido nucléico interveniente codificando oreferido primeiro sítio de clivagem da primeira proteína éoperativamente posicionado entre a referida primeira seqüên-cia de ácido nucléico e a referida segunda seqüência de áci-do nucléico; e em que o referido vetor de expressão é capazde expressar um polipeptideo sORF clivável no referido pri-meiro sítio de clivagem de proteína. Numa modalidade, o pri-meiro sítio de clivagem de proteína compreende um sítio declivagem autoprocessador. Numa modalidade, o sítio de cliva-gem autoprocessador compreende um segmento de inteína ou umsegmento de inteína modificado, em que o segmento de inteínamodificado (ou não-modifiçado) permite a clivagem, porém nãoa ligação completa dos primeiros polipeptídeos expressos aossegundos polipeptídeos expressos. Numa modalidade, o sítiode clivagem autoprocessador compreende um segmento hedgehogou um segmento hedgehog modificado, em que o segmento hedge-hog modificado (ou não-modifiçado) permite a clivagem dosprimeiros polipeptídeos expressos e os segundos polipeptí-deos expressos. Numa modalidade, múltiplas proteínas separa-das (por exemplo, primeiros polipeptídeos, segundos polipep-tídeos, terceiros polipeptídeos, etc.) são expressas. Numamodalidade, o primeiro polipeptideo e o segundo polipeptideosão capazes de montagem multimérica. Numa modalidade, pelomenos um do referido primeiro polipeptideo e segundo poli-peptideo são capazes de secreção extracelular. Numa modali-dade, pelo menos um do referido primeiro polipeptideo e se-gundo polipeptideo são de origem de mamífero. Numa modalida-de, são fornecidos vetores e métodos gerando anticorpos montados.
Em modalidades, a invenção proporciona constructose métodos para a expressão recombinante de múltiplas proteí-nas separadas. Em modalidades particulares, as proteínas sãocapazes de secreção extracelular. Em modalidades particula-res, as proteínas são de origem mamífera. Em modalidadesparticulares, as proteínas são capazes de montagem multimé-rica. Em modalidades particulares, as proteínas são imuno-globulinas.
Numa modalidade, a incorporação de um sítio de re-conhecimento de protease, peptídeo de sinal clivável ou umaseqüência de polipeptideo autoprocessadora (incluindo umainteína, um domínio de autoprocessamento C-terminal de hed-gehog de Drosophilla, camundongo, humano e outras espécies(Dassa et al, Trends in Genetics, Vol. 20, No. 11, Nov.2004, 538 - 542; Ibrahim et al, Biochimica et Biophysics Ac-ta 1760 (2006) 347 - 355). Nós notamos que em alguns casosuma seqüência de polipeptideo autoprocessador pode ser refe-rida como um sítio proteolítico juntamente com o processa-mento proteolítico. Os domínios autoprocessadores C-terminais de genes contendo warthog, groundhog e outros hogsde nematóides tais como Caenorhabditis elegans (Snell EA etal., Proc. R. Soe. B (2006) 273, 401 - 407; Aspock et al,Genome Research, 1999, 9: 909 - 923); e domínio autoproces-sador Hoglet-C de coanoflagelado (Aspock et al, Genome Rese-arch, 1999, 9: 909 - 923) são usados. Domínios tipo inteínabacterianos (BIL) do tipo A, tais como aqueles de bactériastais como Clostridium thermocellum, e domínios BIL do tipo Bde bactérias tais como Rhodobacter sphaeroides (Dassa etal., Journal of Biological Chemistry, Vol 279, No. 31, 30 dejulho, 32001 - 32007), em formas do tipo selvagem, cortadasou de outra forma modificadas) numa seqüência de pré-proteína recombinante permitem a expressão e clivagem efici-ente de uma pró-proteína de forma que a porção bioativa éliberada ou de forma que as proteínas desejadas expressasnuma poliproteína são liberadas. Essa modalidade elimina anecessidade pela co-expressão das enzimas de processamentoproteolítico naturais de pró-proteínas. Alternativamente, umcognato de protease para o sítio de reconhecimento particu-lar pode ser expresso de forma co-extensiva com a seqüênciade pré-proteína, com um sítio de reconhecimento de proteaseno meio de forma que a protease possa ser liberada atravésda ação proteolítica e a porção precursora da pré-proteínaé, então, liberada pela subseqüente clivagem proteolítica,de forma que a porção ativa da pré-proteína é liberada. Ain-da numa outra modalidade, a seqüência de peptídeo de proces-samento autoproteolítica 2A pode ser projetada na pré-proteína entre a porção madura (bioativa) e a proteína pre-cursora de forma que haja o autoprocessamento da proteínarecombinante projetada depois da expressão.Em outra modalidade da invenção, a presente inven-ção proporciona um método para a expressão eficiente de mo-léculas de imunoglobulina recombinantes, através da expres-são recombinante de uma poliproteina compreendendo pelo me-nos uma região de cadeia pesada e pelo menos uma região decadeia leve, em que as referidas regiões são separadas porum ou mais sítios de reconhecimento de protease, peptídeosde sinal, seqüencias de inteína as quais medeiam a clivagem,porém não a junção dos polipeptideos, da seqüência hedgehog,de outras seqüências autoprocessadoras tipo hedgehog ou tipointeína ou de variações suas, ou por seqüencias tais como opeptídeo 2A que separa os peptídeos flanqueadores durante atradução. Numa outra modalidade, uma protease pode ser ex-pressa como parte da poliproteina, separada do restante dapoliproteina por sítios de reconhecimento de protease e emque cada sítio de reconhecimento de protease é cognato daprotease concomitantemente expressa. Então, a ação proteolí-tica ou de sinal da peptidase libera a protease e as outrasproteínas individuais do produto de tradução primário. Osmétodos acima descritos para separar subunidades de proteínanuma poliproteina podem também ser usados em combinação paraalcançar a clivagem desejada e os resultados da expressão daproteína.
No caso de uma modalidade da expressão de imuno-globulina, a duplicação da região codificadora da cadeia le-ve permite a montagem e/ou expressão melhorada da moléculade imunoglobulina completa em relação à situação onde as re-giões que codificam a cadeia leve estão presentes no cassetede expressão e/ou no vetor de expressão numa proporção 1:1com a região codificadora de cadeia pesada. No contexto dapresente invenção, as proteínas de cadeia pesada e leve po-dem ser fragmentos funcionais das cadeias pesada e leve deocorrência natural (um fragmento funcional retém a capacida-de de se ligar à sua cadeia de anticorpo contraparte e a ca-pacidade de se ligar ao antigeno cognato também é retida,conforme é bem conhecido na técnica. Dessa forma, a invençãoproporciona constructos e métodos em que a proporção de re-gião codificadora do componente da cadeia leve em relação aocomponente de cadeia pesada é de 1:1 ou maior do que 1:1.Por exemplo, numa modalidade a proporção L:H é de 2:1 oumaior do que 2:1; em outras modalidades, a proporção é de3:1, 3:2, 4:1 ou maior do que 4:1.
Num aspecto preferido da invenção, a seqüência co-dificadora da imunoglobulina de cadeia leve, ou o fragmentocomponente seu, é duplicado na seqüencia codificadora de po-liproteina, e as seqüências codificadoras de imunoglobulinade cadeia pesada e leve estão presentes numa proporção molarde cerca de 2 cadeias leves para cerca de uma cadeia pesada,e expressa numa proporção de mais do que 1:1 de cadeia le-ve: cadeia pesada. As seqüencias de cadeia leve e de cadeiapesada estão ligadas na poliproteina pelos sítios de cliva-gem da protease, peptídeos sinal (ou líder), inteínas ou sí-tios autoprocessadores.
Proteases (endoproteases) e peptidases de sinal eas seqüências de aminoácidos de seus sítios de reconhecimen-to úteis para separar componentes da proteína biologicamenteativa no produto de tradução de poliproteina e suas seqüên-cias de reconhecimento incluem, sem limitação, furina, (RXR-K-R (SEQ ID NO: 1), VP4 de IPNV, S/TXA-S/AG (SEQ ID NO: 2);protease do virus etch de tabaco (TEV), EXXYXQ-G (SEQ ID NO:3); protease 3C do rinovirus, LEVLFQ-GP (SEQ ID NO: 4); pro-tease PC5/6; protease PACE, protease LPC/PC7; enteroquinase,DDDDK-X (SEQ ID NO: 5); protease do fator Xa, IE/DGR-X (SEQID NO: 6); trombina, LVPR-GS (SEQ ID NO: 7); genenase I,PGAAH-Y (SEQ ID NO: 8); e protease MMP; proteína de inclusãonuclear a (Nla) de potivírus mosaico de nabo; NS2B/NS3 doflavivirus do tipo 4 da dengue (DEN4), protease NS3 do vírusda febre amarela (YFV); ORF V do vírus mosaico de couve-flor; e KEX2 protease, MYKR-EAD (SEQ ID). Outra opção de sí-tio de clivagem interno é CB2. A posição no sítio de reco-nhecimento no qual ocorre a clivagem é mostrada como um hífen.
Numa modalidade, seqüencias de sinal empregadassão as do tipo selvagem, modificadas ou modificadas aleato-riamente e selecionadas através de varredura usando técnicasentendidas na técnica.
Também dentro do escopo da invenção, conforme es-tabelecido acima está um cassete de expressão, em que a se-qüencia codificadora de pré-proteína ou poliproteina parti-cular (proproteína, poliproteina) está operativamente ligadaàs seqüencias regulatórias de transcrição, vetores de ex-pressão e células hospedeiras recombinantes contendo o vetorde expressão ou o cassete de expressão.
A presente invenção proporciona um sistema para aexpressão de uma imunoglobulina de comprimento total oufragmento seu baseando-se na expressão de seqüencias codifi-cadoras de cadeia pesada e leve sob o controle transcricio-nal de um único promotor, em que a separação das cadeias pe-sada e leve é mediada por inteinas ou inteinas modificadas(as quais clivam, porém não se ligam às moléculas de proteí-na liberadas, ou o anticorpo ou outras seqüências de proteí-na flanqueadoras podem ser modificadas de forma a prevenir aligação das proteínas), ou pelo domínio autoprocessador Ο-terminal de hedehog de drosophilla, camundongo, humano e ou-tras espécies, ou por domínios autoprocessadores C-terminaisde genes de warthhog, groundhog e outros contendo hog de ne-matóides tais como Caenorhabditis elegans. O domínio auto-processador Hoglet-C de coanoflagelado, ou por um domíniotipo inteína bacteriano tipo A (BIL) , tais como aqueles debactérias tal como Clostridium thermocellum, ou por um domí-nio BIL tipo B de bactérias tal como Rhodobacter sphaeroi-des. Inteinas úteis na presente invenção incluem, sem limi-tação, a VMA de Saccharomyces cerevisiae, Pyrococcus,Synechoeystis e outras inteinas conhecidas na técnica. A se-paração de cadeias pesada e leve também pode ser mediada pe-lo sítio de clivagem autoprocessador, por exemplo, uma se-qüência tipo 2A ou 2A.
Num aspecto, a invenção proporciona um vetor paraa expressão de uma imunoglobulina recombinante, a qual in-clui um promotor operativamente ligado à seqüencia codifica-dora para uma primeira cadeia de uma molécula de imunoglobu-lina ou um fragmento seu, uma seqüencia codificando um sítiode clivagem autoprocessador e a seqüencia codificante parauma segunda cadeia de uma molécula de imunoglobulina oufragmento seu, em que a seqüencia codificando o sitio declivagem autoprocessador é inserida entre a seqüencia codi-ficadora para a primeira cadeia da molécula de imunoglobuli-na e a seqüencia codificadora para a segunda cadeia da mo-lécula de imunoglobulina. Ou a primeira ou a segunda cadeiada molécula de imunoglobulina pode ser uma cadeia pesada ouuma cadeia leve, e a seqüencia codificando a imunoglobulinarecombinante pode ser uma seqüencia codificadora de compri-mento total ou um fragmento seu. Uma segunda região corres-pondendo à cadeia leve é separada de uma região adjacentepor um sitio de reconhecimento da protease, peptideo de si-nal ou sitio autoprocessador, tal como um sitio 2A. Pode ha-ver duas cópias da seqüencia de cadeia L e uma da seqüenciade cadeia H (ou múltiplas cópias de cada), com a condição deque cada componente de cadeia de anticorpo tem o sitio deprocessamento apropriado ou a seqüencia associada com ele deforma que cadeias de anticorpo corretamente processadas se-jam produzidas.
0 vetor pode ser qualquer vetor recombinante capazde expressão de um polipeptideo de comprimento total, porexemplo, uma molécula de imunoglobulina ou fragmento seu,por exemplo, um vetor de plasmideo, especialmente um adequa-do para a expressão gênica em células de mamíferos, um vetorde baculovírus para a expressão em células de insetos, umvetor de vírus adeno-associado (AAV), um vetor de lentiví-rus, um vetor de retrovírus, um vetor de adenovírus compe-tente de replicação, um vetor de adenovirus deficiente dereplicação, e um vetor de adenovirus sem teor, um vetor deherpes vírus ou um vetor não-viral (plasmídeo), dentre outros.
Sítios de clivagem autoprocessadores incluem umaseqüencia de peptídeo 2A, por exemplo, uma seqüencia 2A de-rivada do vírus da febre aftosa (FMDV). Num outro aspectopreferido, o vetor compreende uma seqüencia a qual codificaum sítio de clivagem proteolítica adicional localizado entrea seqüencia codificadora para a primeira cadeia da moléculade imunoglobulina ou fragmento seu e a seqüencia codificado-ra para a segunda cadeia da molécula de imunoglobulina oufragmento seu (isto é, adjacente à seqüencia para um sítiode clivagem autoprocessador, tal como um sítio de clivagem2A) e também adjacente à segunda seqüencia de cadeia leve.
Numa tentativa exemplar, o sítio de clivagem proteolíticoadicional é um sítio de clivagem de furina com a seqüênciade consenso RXK/R-R (SEQ ID NO: 1). Um vetor para a expres-são da imunoglobulina recombinante usando um peptídeo auto-processador pode incluir qualquer um de uma variedade depromotores, em que o promotor é constitutivo, regulável ouinduzível, específico de tipo celular, específico de tecidoou específico de espécie. 0 vetor pode ainda compreender umaseqüencia codificando uma seqüencia de sinal para uma oumais das seqüencias codificadoras das cadeias de imunoglobu-lina, pré-proteínas ou semelhantes.
A invenção ainda compreende células hospedeiras ouclones estáveis de células hospedeiras infectadas com um ve-tor que compreende uma seqüencia codificando cadeias pesadae leve de uma imunoglobulina (isto é, um anticorpo); uma se-qüencia codificando um sitio de clivagem autoprocessador; epode ainda compreender uma seqüencia codificando um sitio declivagem proteolitico adicional, e opcionalmente uma regiãocodificadora de protease similarmente separada do restanteda(s) seqüencia(s) codificadora(s) por um sitio autoproces-sador ou por uma seqüência de reconhecimento de protease. 0uso de tais células ou clones na geração de imunoglobulinasrecombinantes de comprimento total ou fragmentos seus tambémestá incluído no escopo da invenção. Células hospedeiras a-dequadas incluem, sem limitação, células cultivadas de inse-tos tais como células de Spodoptera frugipedra, micróbiosincluindo bactérias, células de levedura tais comoSaccharomyces eerevisiae ou Pichia pastoris, fungos tais co-mo Triehoderma reesei, Aspergillus, Aureobasidum e espéciesde Penieilliumr assim como células de mamíferos tais como deovário de hamster chinês (por exemplo, CH0-K1, ATCC CCL 61;CHO DG44, Chasin et al. 1986, Som. Cell. Molec. Genet. 12:555), rim de hamster jovem (BHK-21, BHK-570, ATCC CRL 8544,ATCC CRL 10314), COS, camundongo embriônico (NIH-3T3, ATCCCRL 1658), células VERO (rim de macaco verde africano, dis-ponível como ATCC CRL 1587), células de rim de canino (porexemplo, MDCK, ATCC CCL 34), células pituitárias de rato(GH1, ATCC CL 34), certas linhagens de células humanas in-cluindo células de rim embrionárias humanas (por exemplo,HEK293, ATCC CRL 1573) e vários sistemas de animais transgê-nicos, incluindo sem limitação porcos, camundongos, ratos,ovelha, cabra, vacas podem ser usadas da mesma forma. Siste-mas de galinha para expressão em clara de ovo e sistemas deovelha, cabra e vaca transgênica, são conhecidos para ex-pressão em leite, dentre outros. Células vegetais também sãoadequadas como células hospedeiras.
Num aspecto relacionado, a invenção proporcionauma molécula de imunoglobulina recombinante ou fragmento seuproduzido por tal célula ou clones, em que a imunoglobulinacompreende aminoácidos derivados de um sitio de clivagem au-toprocessador, peptideo de sinal, inteina, genes contendohog autoprocessador C-terminal, domínios tipo inteina bacte-rianos (BIL) ou seqüencia de reconhecimento de protease, emétodos para a produção das mesmas. Onde uma inteina está emuso, ela é preferivelmente uma inteina modificada de formaque as duas cadeias de anticorpo não são unidas juntas paraformar uma única cadeia polipeptídica ou o terminal dos po-lipeptideos do anticorpo são tais que eles não podem ser u-nidos juntos pela inteina. A inteina é colocada como numafusão na estrutura entre uma N-exteína e uma C-exteína, porexemplo, entre uma cadeia pesada de imunoglobulina e uma ca-deia leve de imunoglobulina, com a condição de que a inteinae/ou seqüencia de aminoácidos proximal das junções do produ-to de tradução primário da poliproteína resulta na clivagempara liberar as exteínas, mas nenhuma ligação daquelas pro-teínas de exteína ocorre.
A presente invenção proporciona ainda uma estraté-gia de processamento de proteína pós-traducional usando umdomínio de processamento de proteína hedgehog posicionadoentre uma primeira porção de proteína expressa e uma segundaporção de proteína. Opcionalmente, o domínio de processamen-to de proteína hedgehog (Hh-C) pode ser cortado para anulara porção de transferência de colesterol de forma que ocorrasomente a clivagem da proteína. No caso de não ocorrer a ex-cisão completa do Hh-C, a inclusão de um domínio de peptídeode sinal no N-terminal da segunda porção da proteína podepermitir a separação proteolítica de uma segunda proteínamadura da porção da primeira proteína/Hh-C. Também dentro doescopo desse aspecto da presente invenção estão as moléculasde DNA recombinante de ocorrência não-natural compreendendouma seqüência codificando uma poliproteína a qual inclui umdomínio de processamento de proteína hedgehog posicionadoentre uma primeira seqüência codificante de porção de prote-ína expressa e uma segunda seqüência codificante de porçãode proteína expressa de forma que seja produzida uma poli-proteína por tradução de um mensageiro individual.
Num aspecto adicional da presente invenção estáuma furina modificada, caracterizada pela adição de uma re-gião peptídica a qual alveja a proteína de furina recente-mente sintetizada para o lúmen do retículo endoplasmático.Também englobada é a estratégia de inteína ou de inteína mo-dificada, conforme aqui estabelecido.
Outro aspecto da presente invenção é a aplicaçãoda poliproteína/autoprocessadora, do processamento da inteí-na, da clivagem do peptídeo de sinal ou da tentativa de cli-vagem proteolítica para a tecnologia de dois híbridos e detrês híbridos (e variantes) . A primeira e a segunda ou aprimeira, a segunda e a terceira proteínas são expressas co-mo uma poliproteina de um único transcrito numa célula hos-pedeira adequada, e as seqüências codificadoras para essasproteínas são separadas por um sítio autoprocessador (porexemplo, 2A), inteína, peptídeo de sinal ou por sítios dereconhecimento da protease. Essa estratégia elimina a neces-sidade pela co-transfecção com mais de um vetor ou pela ex-pressão de cada proteína fora de um transcrito individual,conforme é feito convencionalmente, com o resultado usando apresente invenção a presente invenção que há economia, efi-ciência e expressão de proteína melhorada, e os pares de li-gação potenciais estão na íntima proximidade uns dos outros,o que se acredita que melhore a probabilidade de ligação deparceiros se associando uns com os outros. Numa modalidadeparticular, a poliproteina compreende uma proteína isca(bait) e uma seqüência de reconhecimento de peptídeo ou pro-tease de sinal, inteína, autoprocessadora, e seqüências deDNAc inseridas, as quais representam uma ou mais proteínasvítimas (prey) que interagem com a proteína isca de interes-se. Essa estratégia de clonagem e expressão é mostrada es-quematicamente nas Figs. 8 e 9.
Numa modalidade, a invenção proporciona construc-tos de DNA para a expressão de produtos de gene múltiplosnuma célula compreendendo um único promotor e a extremidade5' do constructo, uma unidade contendo inteína compreendendoduas ou mais seqüências de exteína codificando proteínas se-paradas, e uma ou mais seqüências de inteína fundidas com aporção codificadora carbóxi-terminal de cada seqüência deexteina, exceto a última seqüência de exteina a ser expres-sa; e uma seqüência de terminação 3' compreendendo um sinalde poliadenilação após a última seqüência codificadora deproteína exteina. Em que a unidade contendo inteína é ex-pressa como uma proteína precursora contendo pelo menos umainteína flanqueada por proteínas codificadas de exteina; emque pelo menos uma das inteínas pode catalisar a excisão dasexteínas; e, preferivelmente, em que pelo menos um resíduode aminoácido é substituído em, ou adicionado à unidade con-tendo inteína de forma que as exteínas cortadas não são li-gadas pela inteína. Numa modalidade particular, os construc-tos estão configurados em que pelo menos duas das seqüênciasde exteina, sob expressão como proteínas, são capazes de seassociar numa montagem multimérica. Numa modalidade, pelomenos duas seqüências de exteina são capazes de codificaruma imunoglobulina ou outra molécula de reconhecimento deantígeno. Numa modalidade, pelo menos uma seqüência de exte-ina, na expressão como uma proteína, é capaz de secreção ex-tracelular. Numa modalidade, pelo menos uma seqüência de ex-teína é um gene de mamífero.
Em modalidades, a invenção proporciona constructose métodos para a expressão de imunoglobulina usando uma in-teína modificada ou não-modifiçada onde segmentos de imuno-globulina expressos não são religados/fundidos, dessa formapermitindo a produção de um anticorpo montado a partir demúltiplas subunidades. Numa modalidade particular, a inteínamodificada inclui uma alteração num resíduo de aminoácidolocalizado na primeira posição da C-exteína. Numa modalidadeparticular, há uma alteração no segundo para o último amino-ácido no segmento de inteina.
Em modalidades, a invenção proporciona constructose métodos para a expressão de qualquer gene ou combinação degenes. Numa modalidade particular, a C-exteina é modificada.Numa outra modalidade particular, a C-exteina é modificadausando uma seqüência de sinal. Numa outra modalidade parti-cular, há uma ausência de um componente de C-exteina terminal.
Em modalidades, a invenção proporciona constructose métodos para a expressão de genes de anticorpo usando umpeptideo de sinal modificado para a segunda cadeia de imuno-globulina (seja cadeia pesada ou cadeia leve) e a terceira,caso usada, as quais são colocadas depois de uma inteina oude um dominio autoprocessador hedgehog. Numa modalidade umaordem de segmentos é como se segue: primeira cadeia - pri-meira inteina ou hedgehog - primeiro peptideo de sinal modi-ficado - segunda cadeia - segundo peptideo de sinal modifi-cado - terceira cadeia (numa situação de duas cadeias, porexemplo, a terceira cadeia ou o segmento ^segundo peptideode sinal modificado - terceira cadeia' é omitido). Em outramodalidade, uma segunda inteina ou segmento hedgehog é in-cluído depois da segunda cadeia. Numa modalidade particular,o uso de tal peptideo de sinal modificado origina uma secre-ção de anticorpo aumentada. Numa modalidade, o peptideo desinal usado é modificado para reduzir a hidrofobicidade. Nu-ma modalidade, um peptideo de sinal é não-modifiçado.
Em modalidades, os vetores sORF são fornecidos pa-ra a expressão transitória. Em outra modalidade, os vetoressORF são fornecidos em sistemas de expressão estáveis. Numamodalidade, células hospedeiras estáveis são geradas confo-mre entendido na técnica, por exemplo, por transfecção e ou-tras técnicas.
Enquanto muitos constructos exemplares são especi-ficamente aqui revelados para a expressão de anticorpos es-pecíficos para o fator α (alfa) de necrose tumoral, se en-tende que os constructos podem ser prontamente preparadosusando as mesmas estratégias com a substituição das seqüên-cias que codificam outras proteínas. Exemplos particularesincluem outras imunoglobulinas e moléculas bioterapêuticas.
Outros exemplos particulares incluem anticorpos específicospara a E/L selectina, interleucina-12, interleucina-18 oureceptor de eritropoietina, ou qualquer outro anticorpo deespecificidade desejada para o qual a seqüência de aminoáci-dos e/ou a seqüência codificadora é disponível para a técnica.
Numa modalidade,, a invenção proporciona um vetorde expressão para gerar um ou mais produtos de proteína re-combinante compreendendo uma inserção sORF; a referida in-serção sORF compreendendo uma primeira seqüência de ácidonucléico codificando um primeiro polipeptídeo, uma primeiraseqüência de ácido nucléico interveniente codificando umprimeiro sítio de clivagem de proteína e uma segunda seqüên-cia de ácido nucléico codificando um segundo polipeptídeo;em que a referida seqüência de ácido nucléico intervenientecodificando o referido primeiro sítio de clivagem de proteí-na é operativamente posicionado entre a referida primeiraseqüência de ácido nucléico e a referida segunda seqüênciade ácido nucléico; e em que o referido vetor de expressão écapaz de expressar um polipeptideo sORF clivável no referidoprimeiro sitio de clivagem de proteína. Numa modalidade, oreferido primeiro sítio de clivagem de proteína compreendeum sítio de clivagem autoprocessador.
Numa modalidade, o sítio de clivagem autoprocessa-dor compreende um segmento de inteína ou segmento de inteínamodificado, em que o segmento de inteína modificado permitea clivagem, porém não a ligação completa do referido primei-ro polipeptideo ao referido segundo polipeptideo. Numa moda-lidade, o sítio de clivagem autoprocessador compreende umsegmento hedgehog ou segmento hedgehog modificado, em que osegmento hedgehog modificado permite a clivagem do referidoprimeiro polipeptideo do referido segundo polipeptideo. Numamodalidade, o primeiro polipeptideo e o segundo polipeptideosão capazes de montagem multimérica. Numa modalidade, pelomenos um do referido primeiro polipeptideo e do segundo po-lipeptídeo são capazes de secreção extracelular. Numa moda-lidade, pelo menos um do referido primeiro polipeptideo e dosegundo polipeptideo são de origem de mamífero.
Numa modalidade, pelo menos um do referido primei-ro polipeptideo e do segundo polipeptideo compreende uma ca-deia pesada de imunoglobulina ou fragmento funcional seu.
Numa modalidade, pelo menos um do referido primeiro polipep-tideo e do segundo polipeptideo compreende uma cadeia levede imunoglobulina ou fragmento funcional seu. Numa modalida-de, o referido primeiro polipeptideo compreende uma cadeiapesada de imunoglobulina ou fragmento funcional seu e o re-ferido segundo polipeptideo compreende uma cadeia leve deimunoglobulina ou fragmento funcional seu; e em gue os refe-ridos primeiro e segundo polipeptideos estão em qualguer or-dem. Numa modalidade, o referido primeiro polipeptideo e se-gundo polipeptideo tomados juntos são capazes de se associarnuma montagem multimérica para formar um anticorpo funcionalou outra molécula de reconhecimento de antigeno.
Numa modalidade, o referido primeiro polipeptideoestá à montante do referido segundo polipeptideo. Numa moda-lidade, o referido segundo polipeptideo está à montante doreferido primeiro polipeptideo.
Numa modalidade, um vetor de expressão ainda com-preende uma terceira seqüência de ácido nucléico codificandoum terceiro polipeptideo, em que a referida terceira seqüên-cia de ácido nucléico é operativamente posicionada depois dareferida segunda seqüência de ácido nucléico; e em que a re-ferida terceira seqüência pode ser independentemente a mesmaou diferente ou da referida primeira ou segunda seqüência deácido nucléico. Numa modalidade, pelo menos dois dos referi-dos primeiro, segundo e terceiro polipeptideos tomados jun-tos são capazes de se associar na montagem multimérica.
Numa modalidade, o vetor de expressão ainda cora-preende uma segunda seqüência de ácido nucléico intervenien-te codificando um segundo sitio de clivagem de proteína, emque a referida segunda seqüência de ácido nucléico interve-niente é operativamente posicionada depois da referida pri-meira e da referida segunda seqüência de ácido nucléico; eem que a referida segunda seqüência interveniente pode ser amesma ou diferente da referida primeira seqüência de ácidonucléico interveniente. Numa modalidade, um vetor de expres-são ainda compreende uma terceira seqüência de ácido nucléi-co codificando um terceiro polipeptideo, e uma segunda se-qüência de ácido nucléico interveniente codificando um se-gundo sitio de clivagem de proteína; em que a segunda se-qüência de ácido nucléico interveniente e a terceira seqüên-cia de ácido nucléico, naquela ordem, são operativamente po-sicionadas depois da referida segunda seqüência de ácido nu-cléico. Numa modalidade, a referida terceira seqüência deácido nucléico codifica uma cadeia pesada, cadeia leve deimunoglobulina ou respectivamente um fragmento funcionalseu. Numa modalidade, a referida terceira seqüência de ácidonucléico codifica uma cadeia leve de imunoglobulina ou frag-mento funcional seu. Numa modalidade a referida terceira se-qüência de ácido nucléico codifica uma cadeia pesada de imu-noglobulina ou um fragmento funcional seu.
Numa modalidade de um vetor de expressão, a refe-rida primeira seqüência de ácido nucléico interveniente co-dificando um primeiro sítio de clivagem de proteína compre-ende um ácido nucléico de peptídeo de sinal codificando umaseqüência de sítio de clivagem de peptídeo de sinal ou sítiode clivagem de peptídeo de sinal modificado. Numa modalida-de, o vetor de expressão ainda compreende uma seqüência deácido nucléico de peptídeo de sinal codificando um sítio declivagem de peptídeo de sinal, operativamente posicionadoantes da referida primeira seqüência de ácido nucléico ou dareferida segunda seqüência de ácido nucléico.
Numa modalidade, um vetor de expressão compreendeainda duas seqüências de ácido nucléico de peptideo de si-nal, cada uma codificando independentemente um sitio de cli-vagem de peptideo de sinal, em que uma seqüência de ácidonucléico de peptideo de sinal é operativamente posicionadaantes do referido primeiro ácido nucléico codificando o re-ferido primeiro polipeptideo e a outra seqüência de ácidonucléico de peptideo de sinal é operativamente posicionadaantes do referido segundo ácido nucléico codificando o refe-rido segundo polipeptideo. Em modalidades, as duas seqüên-cias de peptideo de sinal são as mesmas ou diferentes.
Numa modalidade, uma seqüência de ácido nucléicode peptideo de sinal codifica um sitio de clivagem de pepti-deo de sinal de cadeia leve de imunoglobulina ou sitio declivagem de peptideo de sinal de cadeia leve de imunoglobu-lina modificado.
Numa modalidade, uma seqüência de ácido nu-cléico de peptideo de sinal codifica um sitio de clivagem depeptideo de sinal de cadeia leve de imunoglobulina modifica-do ou não-modifiçado, e em que o referido sitio modificado écapaz de efetuar a clivagem e o aumento da secreção de pelomenos um dentre o referido primeiro polipeptideo, o referidosegundo polipeptideo, e uma molécula montada dos referidosprimeiro e segundo polipeptideos; e em que um nivel de se-creção na presença do referido sitio de peptideo de sinal éde cerca de 10% maior até cerca de 100 vezes maior do que onivel de secreção na ausência do referido sitio de peptideode sinal.
Numa modalidade, uma seqüência de ácido nucléicointerveniente codificando um primeiro sitio de clivagem deproteína compreende uma seqüência de inteína ou inteína mo-dificada selecionada do grupo consistindo de: uma seqüênciaPho Pol I de Pyrococcus horikoshii, uma seqüência VMA deSaccharomyces eerevisiae, uma seqüência DnaE da cepa PCC6803de Synechoeystis spp., uma seqüência GyrA de Myeobaeteriumxenopi, DNA polimerase GB-D de espécie Pyroeoeeus, um domí-nio tipo inteína bacteriano (BIL) tipo A e BIL tipo B.
Numa modalidade, uma seqüência de ácido nucléicointerveniente codificando um primeiro sítio de clivagem deproteína compreende um domínio autoprocessador C-terminal deum membro da família hedgehog, em que o membro da famíliahedgehog é de Drosophila, camundongo, humano ou outra espé-cie de inseto ou animal. Numa modalidade, uma seqüência deácido nucléico interveniente codificando um primeiro sítiode clivagem de proteína compreende um domínio autoprocessa-dor C-terminal de um gene warthog, groundhog ou outro con-tendo hog de um nematóide, ou domínio Hoglet de um coanofla-gelado.
Numa modalidade, o primeiro e o segundo polipeptí-deo compreendem um anticorpo funcional ou outra molécula dereconhecimento de antígeno; com uma especificidade de antí-geno direcionada para a ligação a um antígeno selecionado dogrupo consistindo de: fator α de necrose tumoral, receptorde eritropoietina, RSV, EL/selectina, interleucina-1, inter-leucina-12, interleucina-13, interleucina-18, interleucina-23, CXCL-13, GLP-IR e beta amilóide. Numa modalidade, o pri-meiro e o segundo polipeptideos compreendem um par de cadei-as de imunoglobulina de um anticorpo de D2E7, ABT-007, ABT-325, EL246 ou ABT-874. Numa modalidade, o primeiro e o se-gundo polipeptideo são cada um independentemente seleciona-dos de um segmento de cadeia pesada de imunoglobulina ou decadeia leve de imunoglobulina de um segmento análogo deD2E7, ABT-007, ABT-325, EL246 ou ABT-874, ou outro anticorpo.
Numa modalidade, um vetor ainda compreende um ele-mento regulatório promotor para a referida inserção de sORF.Numa modalidade, o referido elemento regulatório promotor éinduzivel ou constitutivo. Numa modalidade, o referido ele-mento regulatório promotor é especifico de tecido. Numa mo-dalidade, o referido promotor compreende um promotor tardioprincipal de adenovirus.
Numa modalidade, um vetor ainda compreende um áci-do nucléico codificando uma protease capaz de clivar o refe-rido primeiro sitio de clivagem de proteína. Numa modalida-de, o referido ácido nucléico codificando uma protease é o-perativamente posicionado na referida inserção de sORF; oreferido vetor de expressão ainda compreendendo um ácido nu-cléico adicional codificando um segundo sítio de clivagemlocalizado entre o referido ácido nucléico codificando umaprotease e pelo menos um dentre o referido primeiro ácidonucléico e o referido segundo ácido nucléico.
Numa modalidade, a invenção proporciona uma célulahospedeira compreendendo um vetor aqui descrito. Numa moda-lidade, a célula hospedeira é uma célula procariótica. Numamodalidade, a referida célula hospedeira é Escherichia coli.Numa modalidade, a referida célula hospedeira é uma célulaeucariótica. Numa modalidade, a referida célula eucarióticaé selecionada do grupo consistindo de uma célula protista,uma célula animal, uma célula vegetal e uma célula fúngica.Numa modalidade, a referida célula eucariótica é uma célulaanimal selecionada do grupo consistindo de uma célula de ma-mífero, uma célula de ave e uma célula de inseto. Numa moda-lidade preferida, a referida célula hospedeira é uma célulaCHO ou uma célula CHO deficiente de diidrofolato redutase.Numa modalidade, a referida célula hospedeira é uma célulaCOS. Numa modalidade, a referida célula hospedeira é uma cé-lula de levedura. Numa modalidade, a referida célula de Ie-vedura é Saccharomyces cerevisíae. Numa modalidade, a refe-rida célula hospedeira é uma célula Sf9 de inseto Spodopterafrugiperda. Numa modalidade, a referida célula hospedeira éuma célula de rim embrionária humana.
Numa modalidade, a invenção proporciona um métodopara a produção de uma poliproteína recombinante ou de umapluralidade de proteínas, compreendendo o cultivo de uma cé-lula hospedeira num meio de cultura sob condições suficien-tes para permitir a expressão de uma proteína de vetor. Numamodalidade, o método compreende ainda a recuperação e/ou pu-rificação da referida proteína do vetor. Numa modalidade, areferida pluralidade de proteínas é capaz de montagem multi-mérica. Numa modalidade, a poliproteína recombinante ou plu-ralidade de proteínas são biologicamente funcionais e/ou te-rapêuticas.
Numa modalidade, a invenção proporciona um métodopara a produção de uma proteína de imunoglobulina ou frag-mento funcional seu, anticorpo montado ou outra molécula dereconhecimento de antígeno, compreendendo o cultivo de umacélula hospedeira de acordo com a reivindicação 38 num meiode cultura sob condições suficientes para produzir uma pro-teína de imunoglobulina ou fragmento funcional seu, anticor-po montado ou outra molécula de reconhecimento de antígeno.
Numa modalidade, a invenção proporciona uma prote-ína ou poliproteína produzida de acordo com um método aqui.Numa modalidade, a invenção proporciona uma imunoglobulinamontada; outra molécula de reconhecimento de antígeno monta-da; ou cadeia de imunoglobulina individual ou fragmento fun-cional seu produzido de acordo com os métodos aqui. Numa mo-dalidade, a imunoglobulina; outra molécula de reconhecimentode antígeno; ou cadeia de imunoglobulina individual ou frag-mento funcional seu tem a capacidade de efetuar ou contribu-ir para a ligação específica de antígeno ao fator α de ne-crose tumoral, ao receptor de eritropoietina, à interleuci-na-18, à EL/selectina ou à interleucina-12. Numa modalidade,a imunoglobulina é D2E7 ou em que o fragmento funcional é umfragmento de D2E7.
Numa modalidade, a invenção fornece uma composiçãofarmacêutica ou medicamento compreendendo uma proteína e umveículo farmaceuticamente aceitável. Excipientes e veículospara formulações farmacêuticas são selecionados como poderiaser entendido na técnica.Numa modalidade, a invenção proporciona um vetorde expressão em que o primeiro sitio de clivagem de proteínacompreende um sítio de clivagem de protease celular ou umsítio de clivagem de protease viral. Numa modalidade, o re-ferido primeiro sítio de clivagem de proteína compreende umsítio reconhecido pela furina; VP4 ou IPNV; protease do ví-rus etch de tabaco (TEV); protease 3C de rinovírus; proteasePC5/6; protease PACE, protease LPC/PC7; enteroquinase; pro-tease do fator Xa; trombina; genenase I; MMP protease; pro-teína de inclusão nuclear a (Nla) de potivírus mosaico de na-bo; NS2B/NS3 de flavivírus tipo 4 da dengue, protease NS3 dovírus da febre amarela; ORF V do vírus mosaico de couve-flor; protease KEX2; CB2; ou 2A. Numa modalidade, o referidoprimeiro sítio de clivagem da proteína é um sítio de cliva-gem de peptídeo de sinal internamente clivável. Numa modali-dade, o referido sítio de clivagem de peptídeo de sinal in-ternamente clivável viral compreende um sítio do vírus in-fluenza C, do vírus da hepatite C, de hantavírus, de flavi-vírus ou de vírus da rubéola.
Numa modalidade, a invenção proporciona um métodopara a expressão de proteínas de um sistema de dois híbri-dos, em que o referido sistema de dois híbridos compreendeuma proteína isca e uma proteína vítima candidata, o referi-do método compreendendo os passos de: fornecer uma célulahospedeira na qual tenha sido introduzido um vetor de ex-pressão codificando uma poliproteína compreendendo uma por-ção de proteína isca e uma porção de proteína vítima candi-data, as referidas porções separadas por uma seqüência declivagem autoprocessadora, uma seqüência de peptideo de si-nal ou um sitio de clivagem da protease; e o cultivo da cé-lula hospedeira sob condições as quais permitem a expressãoda poliproteina e o autoprocessamento ou a clivagem da poli-proteina pela protease. Numa modalidade, a poliproteina ain-da compreende um componente clivável de um sistema de trêshíbridos.
Numa modalidade um vetor de expressão não contémuma seqüência 2A. Numa modalidade, um vetor de expressão éfornecido em que o referido primeiro sítio de clivagem daproteína compreende uma seqüência FMDV 2Δ; um domínio tipo2A de outro Picornaviridade, um vírus de inseto, rotavírustipo C, tripanossoma ou Thermatoga marítima.
Numa modalidade, a invenção proporciona um vetorde expressão para a expressão de uma proteína recombinante,compreendendo uma seqüência codificadora para uma poliprote-ina, em que a poliproteina compreende pelo menos um primeiroe um segundo segmento de proteína, em que os referidos seg-mentos de proteína são separados por um sítio de clivagem deproteína entre eles, em que o sítio de clivagem de proteínacompreende uma seqüência de clivagem de peptideo autoproces-sador, uma seqüência de clivagem de peptideo de sinal ou umaseqüência de clivagem de protease; e em que a referida se-qüência codificadora é exprimível numa célula hospedeira e éclivada na célula hospedeira.
Numa modalidade, a invenção proporciona um vetorde expressão onde uma seqüência de ácido nucléico interveni-ente codifica adicionalmente uma etiqueta.Outros aspectos, características e vantagens dainvenção são aparentes a partir da seguinte descrição da in-venção, fornecida para o propósito da descoberta quando to-mada juntamente com os desenhos associados.
Em geral, os termos e frases aqui utilizados têmseus significados reconhecidos na técnica, os quais podemser encontrados por referência aos textos padrões, referên-cias de jornal e contextos conhecidos pelas pessoas versadasna técnica. Definições aqui fornecidas são tencionadas paraclarificar seus usos específicos no contexto da invenção.
Sem desejar estar ligado por qualquer teoria par-ticular, pode haver discussão aqui das crenças ou entendi-mentos dos princípios ou mecanismos subjacentes relacionadoscom a invenção. É reconhecido que independentemente da pre-cisão da conclusão de qualquer explicação ou hipótese, umamodalidade da invenção pode, entretanto, ser operativa e ú-til.
BREVE DESCRIÇÃO DOS DESENHOS
Fig. 1 ilustra um constructo de vetor de expressãosORF estável preferido.
Fig. 2 ilustra um constructo de vetor de expressãosORF estável preferido, compreendendo ainda um (segundo) á-cido nucléico interveniente adicional codificando um segundosítio de clivagem de proteína (o qual pode ser um sítio au-toprocessador) e uma terceira seqüência de ácido nucléicocodificando um terceiro polipeptídeo. Tal vetor é capaz deexpressão de mais de dois polipeptídeos.
Fig. 3 ilustra um constructo de vetor de expressãosORF transiente preferido (por exemplo, pTT3-HC-Ssp-GA-intLC-Oaa).
Fig. 4 ilustra um vetor de expressão com um seg-mento 2A para um sistema de dois híbridos. O cassete de ex-pressão do vetor é estruturado para traduzir a proteína iscaprimeiro como uma fusão de peptídeo GAL4::isca::2A, a qual éautoprocessada depois da traduç ao do peptídeo 2A. A segundaestrutura de leitura aberta (ORF) é uma proteína de fusãoNFcapaB::biblioteca.
Fig. 5 é uma vista linear expandida da região deexpressão do plasmídeo da Fig. 4 (sistema de 2 híbridos comclivagem 2A).
Fig. 6 ilustra vetores sORF baseados em inteínapara a expressão da imunoglobulina.
Fig. 7 ilustra vários constructos de sORF com mu-tações pontuais selecionadas para a expressão da montagem demoléculas multiméricas, tais como anticorpos.
Fig. 8 ilustra constructos sORF com peptídeos desinal alterados, por exemplo, peptídeos de sinal de cadeialeve de imunoglobulina modificados.
Fig. 9 ilustra constructos sORF usando domíniosautoprocessadores hedgehog.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A invenção pode ser ainda entendida pela seguintedescrição e exemplos não-limitativos.
A presente invenção proporciona sistemas, por e-xemplo, constructos e métodos, para a expressão de uma pro-teína estrutural ou biologicamente ativa tal como uma enzi-ma, hormônio (por exemplo, insulina), citocina, quimiocina,receptor, anticorpo ou outra molécula. Preferivelmente, aproteína é uma proteína imunomodulatória tal como uma inter-leucina, uma imunoglobulina de comprimento total, um frag-mento seu, outra molécula de reconhecimento de antígeno con-forme entendido na técnica ou outra molécula bioterapêutica.Uma visão geral de tais sistemas está no contexto específicode uma molécula de imunoglobulina onde a produção recombi-nante é baseada na expressão de seqüências codificadoras decadeia pesada e leve sob o controle tanscricional de um úni-co promotor, em que a conversão de um único produto de tra-dução (poliproteína) para as cadeias pesada e leve separadasé mediada pelas inteínas, domínios autoprocessadores conten-do hog, seqüência 2A ou tipo 2A que separa os peptídeosflanqueadores no ribossomo durante a tradução ou é o resul-tado do processamento proteolítico em uma ou mais seqüênciasde reconhecimento de protease localizadas entre as duas ca-deias da proteína biologicamente ativa madura.
O sítio interveniente (seja relacionado com umsegmento de inteína, com um domínio hog, 2A ou tipo 2A, ousítio de reconhecimento da protease; e variações suas de ca-da) pode ser referido como sítio de clivagem. No caso ondeuma pluralidade de três ou mais segmentos de proteína é ex-pressa, tal sítio de clivagem pode ser localizado entre pelomenos quaisquer dois dos múltiplos segmentos, ou um sítio declivagem pode estar localizado depois de cada segmento, op-cionalmente e preferivelmente não depois do último segmento.Se múltiplos sítios de clivagem são usados, cada um pode sero mesmo que ou independente um do outro.
Num aspecto, a invenção proporciona um vetor paraa expressão de uma imunoglobulina recombinante, a qual in-clui um promotor operativamente ligado à seqüência codifica-dora para uma primeira cadeia de uma molécula de imunoglobu-lina ou um fragmento seu, uma seqüência codificando um sitioautoprocessador ou outro sitio de clivagem proteolitica e aseqüência codificadora para uma segunda cadeia de uma molé-cula de imunoglobulina ou fragmento seu, em que a seqüênciacodificando o sitio autoprocessador ou outro sitio de cliva-gem proteolitico é inserido entre a seqüência codificadorapara a primeira cadeia da molécula de imunoglobulina e a se-qüência codificadora para a segunda cadeia da molécula deimunoglobulina, e uma terceira região codificando uma cadeialeve de imunoglobulina, também separada do restante da poli-proteina por um sitio autoprocessador ou outro sitio de cli-vagem proteolitica.
Numa modalidade, ou a primeira ou a segunda cadeiada molécula de poliproteina de imunoglobulina pode ser umacadeia pesada ou uma cadeia leve. Uma seqüência codificandoum segmento de imunoglobulina recombinante pode ser uma se-qüência codificadora de comprimento total ou um fragmentoseu. Numa modalidade especifica, uma segunda seqüência codi-ficadora de cadeia leve deve ser pare da seqüência que codi-fica a poliproteina a ser processada na prática da presenteinvenção, isto é, tomados juntos existem três segmentos com-preendendo duas cadeias leves e uma cadeia pesada, em qual-quer ordem. Em modalidades particulares, constructos sãoconfigurados com esses componentes e nessa ordem: a) IgH-IgL; b) IgL-IgH; c) IgH-IgL-IgL; d) IgL-IgH-IgL; e) IgL-IgL-IgH; f) IgH-IgH-IgL; g) IgH-IgL-IgH; e/ou h) IgL-IgH-IgH.Numa modalidade, o hifen pode indicar o local onde uma se-qüência de sitio de clivagem está localizada.
Alternativamente, as seqüências codificadoras decadeia pesada e leve de imunoglobulina são fundidas na es-trutura para uma seqüência codificadora de inteina entre e-las, com a inteina ou modificada de forma a não ter ativida-de de união ou o terminal das cadeias pesada e leve designa-das de forma que a união preferivelmente não ocorra ou talunião ocorra com fraca eficiência de forma que as moléculasde anticorpo não-unidas predominem. Além disso, uma inteinamodificada pode ainda ser modificada ainda adicionalmente deforma que não haja região de endonuclease (onde uma regiãode endonuclease tenha existido anteriormente), com a condi-ção de que a atividade de clivagem proteolitica sitio espe-cifica permaneça de forma que os polipeptideos de anticorpode cadeia pesada e leve estejam livres da porção de inteinainterveniente do produto de tradução primário. Ou o polipep-tideo do anticorpo leve ou pesado pode ser a N-exteina, equalquer um pode ser a C-exteina.
0 vetor pode ser qualquer vetor recombinante capazde expressão de uma poliproteina de comprimento total, porexemplo, um vetor de vírus adenoassociado (7\AV) , um vetor delentivírus, um vetor de retrovírus, um vetor de adenovíruscompetente de replicação, um vetor de adenovírus deficientede replicação, e um vetor de adenovírus sem teor, um vetorde herpes vírus ou um vetor não-viral (plasmídeo) ou qual-quer outro vetor conhecido na técnica, com a escolha do ve-tor apropriado para a célula hospedeira na qual a imunoglo-bulina ou outra(s) proteína (s) são expressas. Vetores de ba-culovírus são disponíveis para a expressão de genes em célu-las de inseto. Numerosos vetores são conhecidos na técnica,e muitos são comercialmente disponíveis ou, de outra forma,prontamente acessíveis para a técnica.
Sítios de clivagem
Sítios de clivagem autoprocessadores preferidosincluem uma seqüência de inteína; inteína modificada; se-qüência hedgehog; outra seqüência da família hog; uma se-qüência 2A, por exemplo, uma seqüência 2A derivada do vírusda febre aftosa (FMDV); e suas variações para cada.
Proteases cujas seqüências de reconhecimento podemsubstituir para a seqüência 2A incluem, sem limitação, furi-na, uma furina modificada alvejada para o retículo endoplas-mático ao invés da rede de Golgi trans, VP4 de IPNV, TEVprotease, uma TEV protease deficiente de sinal de localiza-ção nuclear (TEV Nis-), 3C protease de rinovírus, PC5/6 pro-tease, PACE protease, LPC/PC7 protease, enteroquinase, Xaprotease, trombina, genenase I e MMP protease, conforme dis-cutido acima. Outras endoproteases úteis na prática da pre-sente invenção são proteases incluindo, mas sem limitação, aproteína de inclusão nuclear a (Nla) do potivírus mosaico denabo (Kim et al. 1996. Virology 221: 245-249); NS2B/NS3 doflavivírus tipo 4 da dengue (DEN4) (Falgout et al. 1993. J.Virol. 67: 2034-2042; Lai et al. 1994. Arch. Virol. Suppl.9: 359-368), NS3 protease do vírus da febre amarela (YFV)(Chambers et al. 1991. J. Virol. 65: 6042-6050); ORF V dovírus mosaico de couve-flor (Torruella et al. 1989. EMBOJournal 8: 2819-2825); inteínas, um exemplo das quais é ainteína Psp-GBD Pol (Xu, M.Q. 1996. EMBO 15: 5146-5153); umpeptídeo de sinal internamente clivável, um exemplo do qualé o peptídeo de sinal internamente clivável do vírus de in-fluenza C (Pekosz A. 1992. Proc. Natl. Acad. Sei. USA 95:3233-13238); e a KEX2 protease, MYKR-EAD (SEQ ID NO: 9) ;KEX2 e uma KEX2 modificada, a qual é alvejada para o ER (verChaudhuri et al. 1992. Eur. J. Biochem. 210: 811-822). AKEX2 modificada, a qual é unicamente direcionada para o ER,têm seqüências codificantes e de aminoácidos conforme dadasna Tabela 7A e 7B, respectivamente; ela é chamada KEX2-sol-KDEL. A seqüência de aminoácidos primária da KEX2 deSaccharomyces cerevisiae foi modificada para remover o domí-nio de associação à membrana e para adicionar a seqüência dealvejamento ao ER DKEL no C terminal da proteína. Outrasproteases humanas úteis para clivar poliproteínas contendoos sítios de reconhecimento de clivagem apropriados incluemaqueles estabelecidos na Publicação de Patente Americana2005/0112565. A proteína de hedgehog sônica de Drosophilamelanogaster, especialmente o domínio de processamento dela,também pode servir para liberar proteínas de um produto detradução primário de poliproteína.
Dentro do escopo da presente invenção está umaprotease de furina modificada, a qual é alvejada para o re-tículo endoplasmático (ER) ao invés da rede de Golgi trans(TGN), como é na protease de furina de ocorrência natural.Vorhees et al. 1995. EMBO Journal 14: 4961-4975 descreveu aporção EEDE (SEQ ID NO: 10) da furina (aminoácidos 775 -778) conforme envolvidos no alvejamento da protease ao TGN(Nakayama et al. 1997. Biochem. Journal 327: 625-635) . Ze-rangue et al. 2001. Proc. Natl. Acad. Sei. USA 98: 2431-2436reportou sinais de movimento no ER, incluindo KKXX no C ter-minal de uma proteína. Dessa forma, uma furina modificada édesenvolvida e usada para alvejar a atividade de clivagem defurina para o compartimento ER ao invés de ou além do TGN ede compartimentos posteriores.
Num outro aspecto, o vetor compreende uma seqüên-cia a qual codifica um sítio de clivagem adicional localiza-do entre a seqüência codificadora para a primeira cadeia damolécula de imunoglobulina ou fragmento seu e a seqüênciacodificadora para a segunda e/ou terceira cadeia (por exem-plo, uma duplicata da primeira ou da segunda cadeia) da mo-lécula de imunoglobulina ou fragmento seu (isto é, adjacenteà seqüência para um sítio de clivagem, o qual poderia ser umsítio de clivagem 2A). Numa abordagem exemplar, o sítio declivagem proteolítica adicional é um sítio de clivagem defurina com a seqüência de consenso RXK(R)R (SEQ ID NO: 1).
Seqüências regulatórias incluindo promotores; cé-lulas hospedeiras
Um vetor para a imunoglobulina recombinante ou ou-tra proteína de expressão pode incluir qualquer um de umavariedade de promotores conhecidos na técnica, em que o pro-motor é constitutivo, regulável ou induzível, específico detipo celular, especifico de tecido ou especifico de espécie.Outros exemplos específicos incluem, por exemplo, promotoresresponsivos à tetraciclina (Gossen M, Bujard H, Proc NatlAcad Sci USA. 1992, 15; 89 (12) : 5547-51) . O vetor é umreplicon adaptado à célula hospedeira na qual o gene quimé-rico é para ser expresso, e sua desejabilidade também com-preende um replicon funcional numa célula bacteriana da mes-ma forma, vantajosamente, Escherichia coli, uma célula con-veniente para manipulações de biológicas moleculares.
A célula hospedeira para expressão gênica podeser, sem limitação, uma célula animal, especialmente uma cé-lula de mamífero, ou ela pode ser uma célula microbiana(bactéria, levedura, fungo, mas preferivelmente eucariótica)ou uma célula vegetal. Células hospedeiras particularmenteadequadas incluem células cultivadas de insetos tais comocélulas de Spodoptera frugiperda, células de levedura taiscomo células de Saccharomyces cerevisiae ou Pichia pastoris,fungos tais como Triehoderma reesei, espécies deAspergillus, Aureobasidum e Penicillium assim como célulasde mamíferos tais como CHO (ovário de hâmster chinês), BHK(rim de hamster jovem), COS, 293, 3T3 (camundongo), célulasvero (macaco verde africano) e vários sistemas de animaistransgênicos, incluindo sem limitação, porcos, camundongos,ratos, ovelha, cabra, vacas podem ser usados da mesma forma.Sistemas de galinha para expressão em clara de ovo e emsistemas de ovelha, cabra e vaca transgênicos são conhecidospara expressão em leite, dentre outros. Baculovírus,especialmente AcNPV, vetores podem ser usados para aexpressão e clivagem do anticorpo individual ORF da presenteinvenção, por exemplo, com a expressão do sORF sob ocontrole regulatório de um promotor de poliedrina ou outropromotor forte numa linhagem de célula de inseto; taisvetores e linhagens celulares são bem conhecidas na técnicae comercialmente disponíveis. Promotores usados em célulasde mamíferos podem ser constitutivos (promotor TK de herpesvírus, McKnight, Célula 31:355, 1982; promotor inicial SV40,Benoist et al. Nature 290: 304, 1981, promotor do vírus desarcoma de Rous, Gorman et al. Proc. Natl. Acad. Sei. USA79: 6777, 1982; promotor de citomegalovírus, Foecking et al.Gene 45: 101, 1980; promotor do vírus de tumor mamário decamundongo, ver de um modo geral Etcheverry em Protein Engi-neering: Principies and Practice, Cleland et al., eds, pp.162-181 , Wiley & Sons, 1996) ou regulado (promotor de meta-loproteína, Hamer et al. J. Molec. Appl. Genet. 1: 273,1982, por exemplo). Vetores podem ser baseados em vírus queinfectam células de mamíferos particulares, especialmenteretrovírus, vírus vaccinia e adenovírus e seus derivados sãoconhecidos na técnica e comercialmente disponíveis. Promoto-res incluem, sem limitação, os promotores de citomegaloví-rus, adenovírus tardio e 7,5 K de vaccinia. Vetores de leve-dura e fúngicos (ver, por exemplo, Van den Handel, C. et al.(1991) em: Bennett, J.W. e Lasure, LL (eds.), More Gene Ma-nipulations in Fungi, Academy Press, Inc., Nova Iorque, 397-428) e promotores são também bem conhecidos e amplamentedisponíveis. Enolase é um promotor de levedura constitutivobem conhecido, e a álcool desidrogenase é um promotor regu-lado bem conhecido.
A seleção de promotores específicos, seqüências determinação de transcrição e outras seqüências opcionais,tais como seqüências que codificam seqüências específicas detecido, será determinada em grande parte pelo tipo de célulana qual a expressão é desejada. Elas podem ser bacterianas,de levedura, fúngicas, de mamífero, inseto, galinha ou ou-tras células animais.
Seqüências de sinal
A seqüência codificante da proteína a ser clivada,proteoliticamente processada ou autoprocessada, a qual é in-corporada no vetor, pode ainda compreender uma ou mais se-qüências codificando uma ou mais seqüências de sinal. Essasseqüências de sinal codificadas podem ser associadas com umou mais dos segmentos maduros na poliproteína. Por exemplo,a seqüência que codifica a seqüência líder da cadeia pesadade imunoglobulina pode preceder a seqüência codificadora pa-ra a cadeia pesada, operativamente ligada e na estrutura como restante da seqüência codificadora de poliproteína. Seme-lhantemente, uma seqüência codificadora de peptídeo líder decadeia leve ou outra seqüência codificadora de peptídeo lí-der pode ser associada na estrutura com uma ou ambas as se-qüências codificantes de cadeia leve de imunoglobulina, coma cadeia da seqüência líder sendo separada pela cadeia adja-cente ou do sítio autoprocessador (tal como 2A) ou por umaseqüência codificando uma seqüência de reconhecimento daprotease, com a estrutura de leitura apropriada sendo mantida.Estequiometria das cadeias pesada e leve de imuno-globulina
Em muitas modalidades aqui, as cadeias leves (IgL)e as cadeias pesadas (IgH) de imunoglobulina/anticorpo estãopresentes no nivel do vetor ou num nivel intracelular ex-presso numa célula hospedeira numa proporção de cerca de 1:1(IgL:IgH). Enquanto tentativas recombinantes aqui e em ou-tros lugares têm se baseado na expressão equimolar das ca-deias pesada e leve (ver, por exemplo, Publicação de PatenteAmericana 2005/0003482A1 ou Publicação InternacionalW02004/113493), em outras modalidades a presente invençãoproporciona métodos e cassetes de expressão e vetores comseqüências codificadoras de cadeia leve e pesada numa pro-porção de 2:1 e co-expressos com o autoprocessamento ou oprocessamento proteolitico das cadeias quando o produto detradução primário é uma poliproteina. Em modalidades, a pro-porção é maior do que 1:1, tal como cerca de 2:1 ou maior doque 2:1. Numa modalidade particular, uma seqüência codifica-dora de cadeia leve é usada numa proporção maior do que 1:1(IgL:IgH). Numa modalidade especifica, a proporção de I-gL:IgH é de 2:1.
A invenção ainda proporciona células hospedeirasou clones estáveis de células hospedeiras transformados ouinfectados com um vetor que compreende uma seqüência codifi-cando uma cadeia pesada e ou uma ou pelo menos duas cadeiasleves de uma imunoglobulina (isto é, um anticorpo); seqüên-cias que codificam sítios de clivagem, tais como sítios dereconhecimento de protease autoprocessadores ou peptídeos desinal entre eles; e podem ainda compreender uma seqüência ouseqüências codificando um sitio de clivagem proteolitico a-dicional. Também incluído no escopo da invenção é o uso detais células ou clones na geração de imunoglobulinas recom-binantes de comprimento total ou fragmentos seus ou outrasproteínas biologicamente ativas as quais são compreendidasde múltiplas subunidades (por exemplo, moléculas de duas ca-deias ou de múltiplas cadeias ou aquelas as quais são na na-tureza produzidas como uma proproteína e clivadas ou proces-sadas para liberar uma proteína derivada de precursor e aporção ativa). Exemplos não-limitativos incluem insulina,interleucina-18, interleucina-1, proteína morfogênica de os-so 4, proteína morfogênica de osso 2, quaisquer outras pro-teínas morfogênicas de osso de duas cadeias, fator de cres-cimento de nervo, renina, quimotripsina, fator de crescimen-to transformante β e interleucina 1β.
Num aspecto relacionado, a invenção proporcionauma molécula de imunoglobulina recombinante ou fragmento seuou outra proteína produzida por tal célula ou clones, em quea imunoglobulina compreende aminoácidos derivados de um sí-tio de clivagem autoprocessador (tal como uma inteína ou do-mínio hedgehog), sítio de clivagem ou clivagem de peptídeode sinal e métodos, vetores e células hospedeiras para pro-duzir os mesmos. Em modalidades, a invenção proporciona cé-lulas hospedeiras contendo um ou mais constructos conformeaqui descrito.
A presente invenção proporciona constructos de ve-tor individuais para a expressão de uma molécula de imuno-globulina ou fragmento seu e métodos para o uso in vitro ouin vivo dos mesmos. Os vetores têm seqüências autoprocessa-doras ou outras de reconhecimento de protease entre uma pri-meira e uma segunda e entre uma segunda e uma terceira se-qüência codificadora de imunoglobulina, permitindo a expres-são de uma molécula de anticorpo funcional usando um trans-crito e um promotor individual. Constructos de vetor exem-plares compreendem uma seqüência que codifica um sitio declivagem autoprocessador entre as estruturas de leitura a-bertas e pode ainda compreender um sitio de clivagem proteo-litico adicional adjacente ao sitio de clivagem autoproces-sador para remoção dos aminoácidos que compreendem o sitiode clivagem autoprocessador após a clivagem. Os constructosdo vetor encontram utilidade nos métodos relacionados com aprodução aumentada de imunoglobulinas biologicamente ativasde comprimento total ou fragmentos seus in vitro e in vivo.Outras proteínas biologicamente ativas com pelo menos duascadeias diferentes podem ser feitas usando a mesma estraté-gia, embora seja entendido que possa não ser necessário quequalquer seqüência codificadora de cadeia esteja presentenuma proporção maior do que 1 em relação à outra seqüênciacodificadora de cadeia.
Embora composições particulares e métodos sejamaqui exemplificados, é entendido que qualquer um de uma va-riedade de composições e métodos alternativos são aplicáveise adequados para o uso na prática da invenção. Será tambémentendido que uma avaliação dos vetores e do cassete de ex-pressão de poliproteina, células hospedeiras e métodos dainvenção pode ser executada usando os procedimentos padrõesna técnica. A prática da presente invenção irá empregar, anão ser que seja indicado de outra forma, técnicas conven-cionais de biologia celular, biologia molecular (incluindotécnicas recombinantes) , microbiologia, bioquímica e imuno-logia, as quais estão dentro do escopo daqueles indivíduosversados na técnica. Tais técnicas são explicadas completa-mente na literatura, tal como em Molecular Cloning: A Labo-ratory Manual, segunda edição (Sambrook et al., 1989); Oli-gonucleotide Synthesis (M. J. Gait, ed., 1984); Animal CellCulture (R. I. Freshney, ed., 1987); Methods in Enzymology(Academic Press, Inc.); Handbook of Experimental Immunology(D. M. Weir & C. C. Blackwell, eds.); Gene Transfer Vectorsfor Mammalian Cells (J. M. Miller & Μ. P. Calos, eds.,1987); Current Protocols in Molecular Biology (F. M. Ausubelet al. , eds., 1993); PCR: The Polymerase Chain Reaction,(Mullis et al., eds., 1994); e Current Protocols in Immuno-Iogy (J. E. Coligan et al., eds., 1991), cada um dos quais éexpressamente incorporado aqui por referência.
A não ser que seja indicado de outra forma, todosos termos aqui utilizados têm o mesmo significado que elesteriam para uma pessoa versada na técnica e a prática dapresente invenção irá empregar técnicas convencionais de mi-crobiologia e de tecnologia do DNA recombinante, as quaisestão dentro do conhecimento daquelas pessoas versadas natécnica.
O termo "modificado", conforme geralmente aqui u-tilizado no contexto de uma proteína, se refere a um segmen-to em que pelo menos um resíduo de aminoácido é substituídoem, anulado de ou adicionado à molécula referenciada. Seme-lhantemente, no contexto de um ácido nucléico, o termo serefere a um segmento em que pelo menos uma subunidade de á-cido nucléico é substituída em, anulada de ou adicionada àmolécula referenciada.
0 termo "inteína", conforme aqui utilizado, tipi-camente se refere a um segmento interno de uma proteína quefacilita sua própria remoção e efetua a junção de segmentosflanqueadores conhecidos como exteínas. Muitos exemplos deinteínas são reconhecidos numa variedade de tipos de orga-nismos, em alguns casos com características estruturais e/oufuncionais compartilhadas. A invenção é amplamente capaz deempregar inteínas, e suas variantes, conforme percebido porexistir e ainda ser reconhecido ou descoberto. Ver, por e-xemplo, Gogarten JP et al., 2002, Annu Rev Microbiol. 2002;56: 263-87; Perler, F. B. (2002), InBase, the Intein Databa-se. Nucleic Acids Res. 30, 383-384 (também através da inter-net no sítio da rede da New England Biolabs, Inc., Ipswich,MA; http://www.neb.com/neb/inteins.html; Amitai G, et al.,Mol Microbiol. 2003, 47(1): 61-73; Gorbalenya AE, NucleicAcids Res. 1998; 26 (7): 1741-1748. Non-canonical inteins).
Numa proteína, uma unidade contendo inteína ou unidade deunião de inteína pode ser entendida como englobando porçõesdas exteínas flanqueadoras onde aspectos estruturais podemcontribuir para reações de clivagem, ligação, etc. 0 termotambém pode ser entendido como uma categoria na referência aum sistema baseado em inteína com um componente de "inteínamodificada".
O termo "inteína modificada", conforme aqui utili-zado, pode se referir a uma inteina sintética ou a uma inte-ína natural em que pelo menos um resíduo de aminoácido ésubstituído em, anulado de ou adicionado à unidade de uniãode inteína de forma que as exteínas clivadas ou cortadas nãosejam completamente ligadas pela inteína.
O termo "hedgehog", conforme aqui utilizado, serefere a uma família de gene (e segmentos de proteína cor-respondentes) com membros que têm função autoproteolíticaefetiva. Membros da família incluem, por exemplo, análogosde Drosophila, camundongo, humano e outras espécies. Alémdisso, o termo "segmento hedgehog" é tencionado a englobarnão somente tais membros da família mas também se refere am-piamente a domínios autoprocessadores de gene de warthog,groundhog e outros contendo hog de nematóides tais comoCaenorhabditis elegans e domínio autoprocessador Hoglet-C decoanoflagelados. Ver, por exemplo, Perler FB. Protein splic-ing of inteins and hedgehog autoproteolysis: structure,function, and evolution, Cell. 1998, 92 (1): 1-4; Koonin, EVet al., (1995) A protein splice-junction motif in hedgehogfamily proteins. Trends Biochem Sei. 20(4): 141-2; Hall TMet al., (1997) Crystal structure of a Hedgehog autoprocess-ing domain: homology between Hedgehog and self-splicing pro-teins. Cell 91 (1): 85-97; Snell EA et al, Proc. R. Soe. B(2006) 273, 401-407; Aspock et al, Genome Research, 1999, 9:909-923. Um exemplo particular de um segmento hedgehog é aproteína hedgehog sônica de Drosophila melanogaster. 0 termotambém pode ser entendido como uma categoria na referência aum sistema baseado em hedgehog com um componente "hedgehog"modificado.
0 termo segmento "hedgehog modificado" pode se re-ferir a um segmento hedgehog sintético ou a um segmento hed-gehog natural em que pelo menos um resíduo de aminoácido ésubstituído em, anulado de ou adicionado à unidade de uniãode hedgehog de forma que segmentos clivados não são comple-tamente ligados.
0 termo "vetor", conforme aqui utilizado, se refe-re a uma molécula de DNA ou de RNA tal como um plasmídeo,vírus ou outro veículo, o qual contém uma ou mais seqüênciasde DNA heterólogo ou recombinante e é designado para trans-ferência entre diferentes células hospedeiras. Os termos"vetor de expressão" e "vetor de terapia de gene" se referema qualquer vetor que é eficaz para incorporar e expressarfragmentos de DNA heterólogos numa célula. Um vetor de ex-pressão ou clonagem pode compreender elementos adicionais,por exemplo, o vetor de expressão pode ter dois sistemas dereplicação, dessa forma permitindo que ele seja mantido emdois organismos, por exemplo, em células humanas para ex-pressão e num hospedeiro procariótico para clonagem e ampli-ficação. Qualquer vetor adequado pode ser empregado que sejaeficaz para a introdução de ácidos nucléicos em células deforma que a expressão de proteína ou polipeptídeo resulte,por exemplo, num vetor viral ou num vetor de plasmídeo não-viral. Quaisquer células eficazes para a expressão, por e-xemplo, de células de inseto e de células eucarióticas taiscomo células de levedura ou de mamífero, são úteis na práti-ca da invenção.
Os termos "DNA heterólogo" e "RNA heterólogo" sereferem a nucleotideos que não são endógenos (naturais) paraa célula ou parte do genoma ou vetor no qual eles estão pre-sentes. Geralmente, DNA ou RNA heterólogo é adicionado a umacélula por transdução, infecção, transfecção, transformação,eletroporação, transformação biolística ou semelhante. Taisnucleotideos geralmente incluem pelo menos uma seqüência co-dificante, mas a seqüência codificante não precisa ser ex-pressa. 0 termo "DNA heterólogo" pode se referir a uma "se-qüência codificadora heteróloga" ou a um "transgene".
Conforme aqui utilizado, os termos "proteína" e"polipeptídeo" podem ser usados de forma permutável e tipi-camente se referem a "proteínas" e "polipeptídeos" de inte-resse que são expressos usando os vetores contendo sítio declivagem autoprocessador da presente invenção. Tais "proteí-nas" e "polipeptídeos" podem ser quaisquer proteínas ou po-lipeptídeos úteis para pesquisa, diagnóstico ou propósitosterapêuticos, conforme adicionalmente descrito abaixo. Con-forme aqui utilizado, uma poliproteína é uma proteína a qualé destinada para o processamento para produzir dois ou maisprodutos de polipeptídeo.
Conforme aqui utilizado, o termo "multímero" serefere a uma proteína compreendida de duas ou mais cadeiasde polipeptídeo (algumas vezes referidas como "subunidades",as quais são montadas para formar uma proteína funcional.
Multímeros podem ser compostos de duas (dímeros), três (trí-meros), quatro (tetrâmeros) ou mais (por exemplo, pentâme-ros, e assim por diante) cadeias peptidicas. Multimeros po-dem resultar de automontagem, ou podem requerer um componen-te tal como um catalisador para ajudar na montagem. Multime-ros podem ser compostos somente de cadeias peptidicas idên-ticas (homomultimero) ou de duas ou mais cadeias peptidicasdiferentes (heteromultimeros). Tais multimeros podem ser es-truturalmente ou quimicamente funcionais. Muitos multimerossão conhecidos e usados na técnica, incluindo, mas sem selimitar a enzimas, hormônios, anticorpos, citocinas, quimo-cinas e receptores. Como tais, multimeros podem ter tantoutilidade biológica (por exemplo, farmacêutica) quanto in-dustrial (por exemplo, bioprocessamento/bioprodução) .
Conforme aqui utilizado, o termo "etiqueta" se re-fere a um peptideo, o qual pode ser incorporado num vetor deexpressão que pode funcionar para permitir a detecção e/oupurificação de um ou mais produtos de expressão das inser-ções do vetor. Tais etiquetas são bem conhecidas na técnicae podem incluir um aminoácido radiomarcado ou ligado a umpolipeptideo de porções biotinil que pode ser detectado poravidina marcada (por exemplo, estreptavidina contendo ummarcador fluorescente ou atividade enzimática que pode serdetectada por métodos óticos ou colorimétricos). Etiquetasde afinidade tais como FLAG, glutationa-S-transferase, pro-teina de ligação à maltose, domínio de ligação à celulose,tiorredoxina, NusA, mistina, domínio de ligação à quitina,cutinase, AGT, GFP e outras são amplamente usadas tais comona expressão de proteína e em sistemas de purificação. Ou-tros exemplos não-limitantes de etiquetas para polipeptideosincluem, porém não estão limitados, aos seguintes: etiquetade histidina, radioisótopos ou radionuclideos (por exemplo,3H, 14C, 35S, 90Y, "Tc, 111In, 125I, 131I, 177Lu, 166Ho, ou 153Sm);etiquetas fluorescentes (por exemplo, FICT, rodamina, fosfo-rescentes lantanidicos), etiquetas enzimáticas (por exemplo,peroxidase de rábano silvestre, luciferase, fosfatase alca-lina); etiquetas quimiluminescentes; grupos de biotinila;epitopos de polipeptideo predeterminados reconhecidos por umrepórter secundário (por exemplo, seqüências de par ziper deleucina, sitios de ligação para anticorpos secundários, do-mínios de ligação a metal, etiquetas de epitopo); e agentesmagnéticos, tais como quelatos de gadolínio.
O termo "defeituoso de replicação", conforme aquiutilizado, em relação a um vetor de terapia de gene viral dainvenção significa que o vetor viral não pode independente-mente ainda se replicar e empacotar o seu genoma. Por exem-plo, quando uma célula de um indivíduo é infectada com viri-ons rAAV, o gene heterólogo é expresso nas células infecta-das, entretanto, devido ao fato de que as células infectadasnão têm os genes rep e cap de AAV e genes de funções acessó-rias, o rAAV não é capaz de se replicar.
Conforme aqui utilizado, um "vetor de transferên-cia retroviral" se refere a um vetor de expressão que com-preende uma seqüência de nucleotídeos que codifica um trans-gene e ainda compreende seqüências de nucleotídeos necessá-rias para o empacotamento do vetor. Preferivelmente, o vetorde transferência retroviral também compreende as seqüênciasnecessárias para expressar o transgene nas células.
Conforme aqui utilizado, "sistema de empacotamen-to" se refere a um grupo de constructos virais compreendendogenes que codificam proteínas virais envolvidas no empacota-mento de um vírus recombinante. Tipicamente, os constructosdo sistema de empacotamento são incorporados no final dascontas numa célula de empacotamento.
Conforme aqui utilizado, um sistema de vetor Ien-tiviral de "segunda geração" se refere a um sistema de empa-cotamento lentiviral que não tem genes acessórios funcio-nais, tais como um dos quais os genes acessórios, vif, vpr,vpu e nef, foram anulados ou inativados. Ver, por exemplo,Zufferey et al. 1997. Nat. Biotechnol. 15: 871-875.
Conforme aqui utilizado, um sistema de vetor Ien-tiviral de "terceira geração" se refere a um sistema de em-pacotamento lentiviral que tem as características de um sis-tema de vetor de segunda geração, e ainda não tem um genetat funcional, tal como um do qual o gene tat tenha sido a-nulado ou inativado. Tipicamente, o gene que codifica rev éfornecido num constructo de expressão separado. Ver, por e-xemplo, Dull et al. 1998. J. Virol. 72: 8463-8471.
Conforme aqui utilizado, em relação a um vírus ouvetor viral, "pseudotipado" se refere à substituição de umaproteína de envelope de vírus natural com uma proteína deenvelope de vírus heteróloga ou funcionalmente modificada.
O termo "operativamente ligado", conforme aqui u-tilizado em relação a um constructo de DNA recombinante ouvetor, significa que componentes de nucleotídeo do vetor ouconstructo de DNA recombinante são geralmente covalentementeunidos uns aos outros. Geralmente, seqüências de DNA "opera-tivamente ligadas" são contíguas e, no caso de um líder se-cretório, contíguas e na mesma estrutura de leitura. Entre-tanto, intensificadores não têm que ser contíguos com as se-qüências cuja expressão é supra-regulada. 0 termo é consis-tente com operativamente posicionado.
Seqüências intensificadoras influenciam a expres-são de gene dependente de promotor e podem estar localizadasnas regiões 5' ou 3' do gene natural. "Intensificadores" sãoelementos de ação eis que estimulam ou inibem a transcriçãode genes adjacentes. Um intensificador que inibe a transcri-ção também é nomeado um "silenciador". Intensificadores po-dem funcionar (isto é, podem estar associados com uma se-qüência codificadora) em qualquer orientação, em distânciasde até vários pares de quilobase (Kb) da seqüência codifica-dora e de uma posição à jusante de uma região transcrita.Além disso, seqüências de abertura de cromatina ou isolan-tes, tais como regiões de ligação à matriz (Chung, Cell,1993, Ago 13: 74(3): 505-14, Frisch et al, Genome Research,2001, 12: 349-354, Kim et al, J. Biotech 107, 2004, 95-105)podem ser usadas para intensificar a transcrição de cassetesde gene estavelmente integrados.
Conforme aqui utilizado, o termo "gene" ou "se-qüência codificadora" significa a seqüência de ácido nucléi-co a qual é transcrita (DNA) e traduzida (RNAm) num polipep-tídeo in vitro ou in vivo quando operativamente ligada àsseqüências regulatórias apropriadas. 0 gene pode ou não in-cluir regiões precedendo e depois da região codificadora,por exemplo, seqüências 5' não-t raduzidas (5' UTR) ou se-qüências "líder" e seqüências 3' UTR ou "rótulo" ("trai-ler"), assim como seqüências intervenientes (íntrons) entresegmentos codificantes individuais (éxons).
Um "promotor" é uma seqüência de DNA que direcionaa ligação da RNA polimerase e, dessa forma, promove a sínte-se de RNA, isto é, uma seqüência mínima suficiente para di-recionar a transcrição. Promotores e a proteína ou polipep-tídeo de expressão correspondente podem ser específicos detipo celular, específicos de tecido ou específicos de espé-cie. Também incluídos nos vetores ou constructos de ácidosnucléicos da invenção são as seqüências intensificadoras asquais podem ou não ser contíguas com a seqüência promotora.
"Seqüências regulatórias de transcrição", ou se-qüências de controle de expressão, conforme amplamente aquiutilizadas, incluem uma seqüência promotora e seqüências fi-sicamente associadas as quais modulam ou regulam a transcri-ção de uma seqüência codificadora associada, geralmente emresposta a sinais nutricionais ou ambientais. Aquelas se-qüências associadas podem determinar a expressão específicade tecido ou célula, a resposta a um sinal ambiental, a li-gação de uma proteína a qual aumenta ou diminui a transcri-ção e assim por diante. Um "promotor" regulável" é qualquerpromotor cuja atividade é afetada por um fator de ação eisou trans (por exemplo, um promotor induzível, o qual é ati-vado por um agente ou sinal externo).
Um "promotor constitutivo" é qualquer promotor quedireciona a produção de RNA em muitos ou todos os tipos detecido/célula na maioria das vezes, por exemplo, a regiãointensificadora/promotora inicial imediata do CMV humano, aqual promove a expressão constitutiva de inserções de DNAclonado em células de mamíferos.
Os termos "proteína regulatória tanscricional","fator regulatório transcricional" e "fator de transcrição"são usados de forma permutável aqui, e se referem a um pro-teína nuclear que se liga a um elemento de resposta de DNAe, dessa forma, regula de maneira transcricional a expressãode um gene ou genes associados. Proteínas regulatóriastranscricionais geralmente se ligam diretamente a um elemen-to de resposta de DNA, entretanto, em alguns casos, a liga-ção ao DNA pode ser indireta através da ligação com outraproteína que, por sua vez, se liga a ou é ligada a um ele-mento de resposta de DNA.
Conforme aqui utilizado, um "sítio de entrada deribossomo interno" ou "IRES" se refere a um elemento quepromove a entrada do ribossomo interna direta no códon deiniciação, tal como ATG, de um cistron (uma região codifica-dora de proteína), levando dessa forma à tradução indepen-dente de cap do gene, Ver, por exemplo, Jackson R J. et al.1990. Trends Biochem Sci 15: 477-83) e Jackson R. J. eKaminski, A. 1995. RNA 1: 985-1000. Os exemplos aqui descri-tos são relevantes para o uso de qualquer elemento IRES, oqual é capaz de promover a entrada do ribossomo interna di-reta no códon de iniciação de um cistron. "Sob controle detradução de um IRES", conforme aqui utilizado, significa quea tradução está associada com o IRES e procede de uma formaindependente de cap. Por exemplo, as seqüências codificado-ras de cadeia pesada e de duas cadeias leves podem ser tra-duzidas através do IRES separando as seqüências codificado-ras individuais, sem a necessidade proteolitica ou autopro-cessadora para separar as duas cadeias uma da outra.
Um "sitio de clivagem autoprocessador" ou "seqüên-cia de clivagem autoprocessadora" é aqui definido como umaseqüência do sitio de clivagem processador pós-traducionalou co-traducional. Tal sitio ou seqüência de "clivagem auto-processador" se refere a um DNA ou seqüência de aminoácido,exemplificado aqui por um sitio, seqüência ou domínio 2A, ouum sítio, seqüência ou domínio tipo 2A. Conforme aqui utili-zado, um "peptídeo autoprocessador" é aqui definido como oproduto de expressão de peptídeo da seqüência de DNA que co-difica um sítio ou seqüência de clivagem autoprocessador, oqual na tradução, medeia a rápida clivagem intramolecular(eis) de uma proteína ou polipeptídeo compreendendo o sítiode clivagem autoprocessador para produzir os produtos deproteína ou polipeptídeo maduros distintos.
Conforme aqui utilizado, o termo "sítio de cliva-gem proteolitica adicional" se refere a uma seqüência a qualé incorporada num constructo de expressão da invenção adja-cente a um sítio de clivagem autoprocessador, tal como umaseqüência 2A ou tipo 2A, e proporciona uma forma de removeraminoácidos adicionais que permanecem após a clivagem pelaseqüência de clivagem autoprocessadora. "Sítios de clivagemproteolíticos adicionais" exemplares são descritos aqui eincluem, mas não estão limitados, a sítios de clivagem defurina com a seqüência de consenso RXK/R-R. Tais sítios declivagem de furina podem ser clivados por proteases tiposubtilisina endógenas, tais como proteases de furina e ou-tras serina-proteases na via de secreção da proteína.
Conforme aqui utilizado, os termos "imunoglobuli-na" e "anticorpo" se referem a moléculas intactas assim comoa seus fragmentos, tais como Fa, F(ab')2 e Fv, os quais sãocapazes de se ligar a um determinante antigênico de interes-se. Tal "imunoglobulina" e "anticorpo" é composto de duascadeias de polipeptídeo leves idênticas de peso molecular deaproximadamente 23.000 daltons, e duas cadeias pesadas idên-ticas de pelo molecular de 53.000 a 70.000. As quatro cadei-as são unidas por ligações dissulfeto numa configuração "Y".
Cadeias pesadas são classificadas como gama (IgG), mi (IgM),alfa (IgA), delta (IgD) ou épsilon (IgE) e são a base paraas designações de classe de imunoglobulinas, a qual determi-na a função efetora de um dado anticorpo.As cadeias levessão classificadas ou como capa ou como lambda. Quando aqui éfeita referência a uma "imunoglobulina ou fragmento seu",será entendido que tal "fragmento seu" é um fragmento de i-munoglobulina imunologicamente funcional, especialmente um oqual se liga ao seu ligante cognato com afinidade de ligaçãode pelo menos 10% daquela da imunoglobulina intacta.
Um fragmento Fab de um anticorpo é um fragmento deligação a antígeno monovalente de uma molécula de anticorpo.
Um fragmento Fv é um fragmento geneticamente projetado con-tendo a região variável de uma cadeia leve e as regiões va-riáveis de uma cadeia pesada expressas como duas cadeias.
O termo "anticorpo humanizado" se refere a uma mo-lécula de anticorpo na qual um ou mais aminoácidos foramsubstituídos nas regiões que não são de ligação a antígenospara assemelhar mais intimamente com um anticorpo humano,enquanto ainda retendo a atividade de ligação original doanticorpo. Ver, por exemplo, Patente Americana No.6.602.503.
O termo "determinante antigênico", conforme aquiutilizado, se refere àquele fragmento de uma molécula (istoé, um epítopo) que faz contato com um anticorpo particular.Várias regiões de uma proteína ou peptídeo ou glicopeptídeode uma proteína ou glicoproteína podem induzir a produção deanticorpos os quais se ligam especificamente a uma dada re-gião ou estrutura tridimensional na proteína. Essas regiõesou estruturas são referidas como determinantes antigênicosou epítopos. Um determinante antigênico pode competir com oantígeno intacto (isto é, o imunógeno usado para eliciar aresposta imune) para ligação a um anticorpo.
O termo "fragmento", quando se referindo a umaproteína ou polipeptídeo recombinante da invenção, significaum peptídeo ou polipeptídeo o qual tem uma seqüência de ami-noácido a qual é a mesma ou parte de, mas não de toda a se-qüência de aminoácidos da correspondente proteína ou poli-peptídeo de comprimento total, a qual retém pelo menos umadas funções ou atividades da correspondente proteína ou po-lipeptídeo de comprimento total. 0 fragmento preferivelmenteinclui pelo menos 20 - 100 resíduos de aminoácidos contíguosda proteína ou polipeptideo de comprimento total.
Os termos "administrando" ou "introduzindo", con-forme aqui utilizados, significam a distribuição da proteína(incluindo imunoglobulina) a um humano ou animal necessitadodisso por qualquer via conhecida na técnica. Veículos e for-mulações farmacêuticas ou composições também são bem conhe-cidos na técnica. Vias de administração podem incluir a in-travenosa, intramuscular, intradérmica, subcutânea, trans-dérmica, da mucosa, intratumoral ou da mucosa. Alternativa-mente, esses termos podem se referir à distribuição de umvetor para a expressão de proteína recombinante para uma cé-lula ou para células em cultura e ou para células ou órgãosde um indivíduo. Tal administração ou introdução pode ocor-rer in vivo, in vitro ou ex vivo. Um vetor para a expressãode proteína ou polipeptideo recombinante pode ser introduzi-do numa célula por transfecção, o que tipicamente significaa inserção de DNA heterólogo numa célula por meios físicos(por exemplo, transfecção com fosfato de cálcio, eletropora-ção, microinjeção ou lipofecção); infecção, a qual tipica-mente se refere à introdução através de um agente infeccio-so, isto é, um vírus; ou transdução, a qual tipicamente sig-nifica a infecção estável de uma célula com um vírus ou atransferência de material genético de um microrganismo paraoutro através de um agente viral (por exemplo, bacteriófago).
"Transformação" é tipicamente usado para se refe-rir à bactéria compreendendo células ou DNA heterólogo osquais expressam um oncogene e que foi, conseqüentemente,convertido num modo de crescimento continuo, por exemplo,células tumorais. Um vetor usado para "transformar" uma cé-lula pode ser um plasmideo, virus ou outro veículo.
Tipicamente, uma célula é referida como "transdu-zida", "infectada", "transfectada" ou "transformada" depen-dendo da forma usada para administração, introdução ou in-serção de DNA heterólogo (isto é, o vetor) na célula. Ostermos "transduzido", "transfectado" e "transformado" podemser usados de forma permutável aqui indiferentemente do mé-todo de introdução de DNA heterólogo.
Conforme aqui utilizado, os termos "estavelmentetransformado", "estavelmente transfectado" e "transgênico"se referem às células que têm uma seqüência de ácido nucléi-co não-natural (heteróloga) integrada no genoma. A transfec-ção estável é demonstrada pelo estabelecimento de clones oulinhagens celulares compreendidos de uma população de célu-las filhas contendo o DNA transfectado replicando estavel-mente através da integração nos seus genomas ou como um ele-mento epissomal. Em alguns casos, "transfecção" não é está-vel, isto é, é temporária. 0 caso de transfecção temporária,o DNA exógeno ou heterólogo é expresso, entretanto, a se-qüência introduzida não é integrada no genoma ou a célulahospedeira não é capaz de replicar.
Conforme aqui utilizado, "administração ex vivo"se refere a um processo onde as células primárias são toma-das de um indivíduo, um vetor é administrado às células paraproduzir células recombinantes transduzidas, infectadas outransfectadas e as células recombinantes são readministradasao mesmo ou a um diferente indivíduo.
Um "transcrito multicistrônico" se refere a umamolécula de RNAm que contém mais de uma região codificadorade proteína, ou cistron. Um RNAm compreendendo duas regiõescodificadoras é denotado um "transcrito bicistrônico". A re-gião codificadora "5'-proximal" ou cistron é a região codi-ficadora cujo códon de iniciação de tradução (geralmenteAUG) é o mais próximo da extremidade 5' de uma molécula deRNAm multicistrônica. Uma região codificadora "5'-distai" oucistron é uma cujo códon de iniciação de tradução (geralmen-te AUG) não é o códon de iniciação mais próximo da extremi-dade 5' do RNAm.
0 termo "5'-distai" e "à jusante" são usados sino-nimicamente para se referir a regiões codificantes que nãosão adjacentes à extremidade 5' de uma molécula de RNAm.
Conforme aqui utilizado, "co-transcrito" significaque duas (ou mais) estruturas de leitura abertas ou regiõescodificantes ou polinucleotídeos estão sob controle trans-cricional de um único elemento regulatório ou de controletranscricional compreendendo um promotor.
O termo "célula hospedeira", conforme aqui utili-zado, se refere a uma célula a qual foi transduzida, infec-tada, transfectada ou transformada com um vetor. O vetor po-de ser um plasmídeo, uma partícula viral, um fago, etc. Ascondições de cultivo, tais como temperatura, pH e semelhan-tes, são aquelas anteriormente usadas com a célula hospedei-ra selecionada para expressão, e serão aparentes para aspessoas versadas na técnica. Será percebido que o termo "cé-lula hospedeira" se refere à célula original transduzida,infectada, transfectada ou transformada e à sua progenia.
Conforme aqui utilizado, os termos "atividade bio-lógica" e "biologicamente ativo" se referem à atividade a-tribuida a uma proteina particular numa linhagem celular emcultura ou num sistema livre de células, tal como num ensaiode ligante-receptor em placas de ELISA. A "atividade bioló-gica" de uma "imunoglobulina", "anticorpo" ou fragmento seuse refere à capacidade de ligar um determinante antigênicoe, dessa forma, facilitar a função imunológica. A "atividadebiológica" de um hormônio ou interleucina é conforme conhe-cida na técnica.
Conforme aqui utilizado, os termos "tumor" e "cân-cer" se referem a uma célula que exibe pelo menos uma perdaparcial de controle sobre o crescimento e/ou desenvolvimentonormal. Por exemplo, geralmente células tumorais ou cancerí-genas geralmente perderam a inibição de contato e podem serinvasivas e/ou terem a capacidade de realizar metástase.
Anticorpos são proteínas de imunoglobulina que sãoheterodímeros de uma cadeia pesada e leve. Um anticorpo tí-pico é multimérico com duas cadeias pesadas e duas cadeiasleves (ou fragmentos funcionais seus) os quais se associamjuntos. Anticorpos podem ter outra ordem polimérica de es-trutura em sendo dimérico, trimérico, tetramérico, pentamé-rico, etc, geralmente dependente do isotipo. Eles se mostra-ram extremamente difíceis de exprimir numa forma de compri-mento total de um único vetor ou de dois vetores em sistemasde expressão de cultura de mamíferos. Vários métodos são a-tualmente usados para a produção de anticorpos: imunizaçãoin vivo de animais para produzir anticorpos "policlonais",cultura de células in vitro de hibridomas de células B paraproduzir anticorpos monoclonais (Kohler, et al. 1988. Eur.J. Immunol. 6: 511; Antibodies: A Laboratory Manual, ColdSpring Harbor Laboratory, 1988; incorporado aqui por refe-rência) e tecnologia de DNA recombinante (descrito, por e-xemplo, em Cabilly et al., Patente Americana No. 6331415,incorporada aqui por referência).
A estrutura molecular básica dos polipeptideos deimunoglobulina é bem conhecida por incluir duas cadeias le-ves idênticas com um peso molecular de aproximadamente23.000 daltons, e duas cadeias pesadas idênticas com um pesomolecular de 53.000 - 70.000, onde as quatro cadeias são u-nidas por ligações dissulfeto numa configuração "Υ". A se-qüência de aminoácidos corre da extremidade N-terminal notopo do Y até a extremidade C-terminal na superfície inferi-or de cada cadeia. Na extremidade N-terminal está uma regiãovariável (de aproximadamente 100 aminoácidos de comprimento)a qual proporciona a especificidade da ligação do antígeno.
A presente invenção é direcionada para métodos me-lhorados para a produção de imunoglobulinas de todos os ti-pos, incluindo, mas sem se limitar, a anticorpos de compri-mento total e a fragmentos de anticorpo com uma seqüêncianatural (isto é, aquela seqüência produzida em resposta aoestímulo por um antígeno), anticorpos de cadeia individualos quais combinam a região variável de ligação ao antígenotanto da cadeia pesada quanto da leve numa única cadeia depolipeptideo estavelmente dobrada individual; anticorpos u-nivalentes (os quais compreendem um dimero de cadeia pesa-da/cadeia leve ligado à região Fc de uma segunda cadeia pe-sada) ; "Fragmentos Fab", os quais incluem a região "Y" com-pleta da molécula de imunoglobulina, isto é, as ramificaçõesde "Y", ou da cadeia leve ou da cadeia pesada sozinha, ouporções suas (isto é, agregados de uma cadeia pesada e deuma cadeia leve, comumente conhecidos como Fab'); "imunoglo-bulinas híbridas" as quais têm especificidade para dois oumais diferentes antígenos (por exemplo, quadromas ou anti-corpos biespecificos conforme descrito, por exemplo, na Pa-tente Americana No. 6.623.940); "imunoglobulinas compostas",em que as cadeias pesada e leve mimetizam aquelas de dife-rentes espécies ou especificidades; e "anticorpos quiméri-cos", em que porções de cada uma das seqüências de aminoáci-dos da cadeia pesada e leve são derivadas de mais de uma es-pécie (isto é, a região variável é derivada de uma fontetal como um anticorpo de murino, enquanto a região constanteé derivada de outra, tal como um anticorpo humano).
As composições e métodos da invenção encontram u-tilidade na produção de imunoglobulinas ou fragmentos seus,em que a cadeia pesada ou leve é "mamífera", "quimérica" oumodificada de uma forma para aumentar a sua eficácia. Anti-corpos modificados incluem tanto variantes de seqüências deaminoácidos quanto de ácido nucléico as quais retêm a mesmaatividade biológica da forma não-modifiçada e aquelas asquais são modificadas de forma que a atividade é alterada,isto é, alterações na região constante que melhoram a fixa-ção do complemento, a interação com as membranas e outrasfunções efetoras, ou alterações na região variável que me-lhoram as características de ligação a antigeno. As composi-ções e métodos da invenção podem ainda incluir imunoglobuli-nas catalíticas ou fragmentos seus.
Uma seqüência de polinucleotídeo que codifica imu-noglobulina "variante" pode codificar uma seqüência de ami-noácido de imunoglobulina "variante" a qual é alterada porum ou mais aminoácidos da seqüência de polipeptídeo de refe-rência. Essa mesma discussão a qual se segue é aplicável aoutras seqüências de proteína biologicamente ativas (e suasseqüências codificantes) de interesse. A seqüência de poli-nucleotídeo variante pode codificar uma seqüência de aminoá-cido variante a qual contém substituições "conservativas",em que o aminoácido substituído tem propriedades estruturaisou químicas semelhantes às do aminoácido o qual ele substi-tui. É entendido que uma variante da proteína de interessepode ser feita com uma seqüência de aminoácidos . a qual ésubstancialmente idêntica (pelo menos cerca de 80% a 99% i-dêntica, e todos os números inteiros entre eles) à seqüênciade aminoácido da seqüência de ocorrência natural, e ela for-ma uma estrutura tridimensional funcionalmente equivalente eretém a atividade biológica da proteína de ocorrência natu-ral. É bem sabido nas técnicas biológicas que certas substi-tuições de aminoácidos podem ser feitas em seqüências deproteína sem afetar a função da proteína. Geralmente, subs-tituições de aminoácidos conservativas ou substituições deaminoácidos similares são toleradas sem afetar a função daproteína. Aminoácidos similares podem ser aqueles que sãosimilares em tamanho e/ou propriedades de carga, por exem-plo, aspartato e glutamato e isoleucina e valina são ambospares de aminoácidos similares.
Substituições de um por outro são permitidas quan-do a formação de estrutura secundária e terciária naturalnão são rompidas, exceto quando tencionado. A similaridadeentre pares de aminoácidos tem sido avaliada na técnica numavariedade de formas. Por exemplo, Dayhoff et al. , em Atlasof Protein Sequence and Structure, 1978. Volume 5, Suplemen-to 3, Capítulo 22, páginas 345-352, o qual é aqui incorpora-do por referência, proporciona tabelas de freqüência parasubstituições de aminoácidos as quais podem ser empregadascomo uma medida de similaridade de aminoácido. As tabelas defreqüência de Dayhoff et al são baseadas em comparações deseqüências de aminoácidos para proteínas com a mesma funçãode uma variedade de fontes evolucionariamente diferentes.
Variantes de mutação por substituição, insercionale de anulação das seqüências de nucleotídeo (e aminoácidos)reveladas podem ser prontamente preparadas por métodos osquais são bem conhecidos na técnica. Essas variantes podemser usadas da mesma forma que as seqüências especificamenteexemplificadas contanto que as variantes tenham identidadede seqüência substancial com uma seqüência especificamenteexemplificada da presente invenção e a funcionalidade dese-jada seja preservada.
Conforme aqui utilizado, identidade de seqüênciasubstancial se refere à homologia (ou identidade) a qual ésuficiente para capacitar o polinucleotideo ou proteína va-riante de funcionar na mesma capacidade que o polinucleoti-deo ou proteína do qual a variante é derivada. Preferivel-mente, essa identidade de seqüência é maior do que 70% ou80%, mais preferivelmente, essa identidade é maior do que85%, ou essa identidade é maior do que 90%, e ou alternati-vamente, essa é maior do que 95%, e todos os números intei-ros entre 70 e 100%. Está bem dentro da técnica de uma pes-soa treinada nessa técnica fazer as mutações por substitui-ção, as mutações insercionais e de anulação as quais são e-quivalentes em função ou são designadas para melhorar a fun-ção da seqüência ou, de outra forma, proporcionar uma vanta-gem metodológica. Nenhuma modalidade/variante a qual podeler em quaisquer proteínas de ocorrência natural ou as quaislêem num item da técnica anterior qualificante é tencionadapara estar dentro do escopo da presente invenção conformereivindicado. É bem conhecido na técnica que as seqüênciasde polinucleotideo da presente invenção podem ser cortadase/ou, de outra forma, modificadas de forma que alguns dosfragmentos resultantes e/ou mutantes da seqüência de compri-mento total original possam reter as características deseja-das da seqüência de comprimento total. Uma ampla variedadede enzimas de restrição as quais são adequadas para gerarfragmentos de moléculas de ácido nucléico maiores é bem co-nhecida. Além disso, é bem conhecido que a exonuclease Bal31pode ser convenientemente usada para a digestão limitadacontrolada pelo tempo de DNA. Ver, por exemplo, Maniatis etal. 1982. Molecular Cloning: A Laboratory Manual, Cold S-pring Harbor Laboratory, Nova Iorque, páginas 135-139, in-corporado aqui por referência. Ver também Wei et al. 1983.J. Biol. Chem. 258: 13006-13512. Pelo uso da exonucleaseBal31 (comumente referida como procedimentos de "apagar umabase"), o artesão normalmente versado pode remover nucleotí-deos de qualquer uma das duas extremidades dos ácidos nu-cléicos em questão para gerar um amplo espectro de fragmen-tos os quais são funcionalmente equivalentes às seqüênciasde nucleotideo em questão. Uma das pessoas normalmente ver-sadas na técnica pode, dessa forma, gerar centenas de frag-mentos de comprimentos variantes e controlados a partir delocais todos ao longo da seqüência codificadora original. 0artesão normalmente habilitado pode testar ou fazer a varre-dura rotineiramente dos fragmentos gerados para as suas ca-racteristicas e determinar a utilidade dos fragmentos con-forme aqui ensinado. É também bem sabido que as seqüênciasmutantes da seqüência de comprimento total, ou fragmentosseus, podem ser facilmente produzidos com a mutagênese dire-cionada a sitio. Ver, por exemplo, Larionov, O.A. e Nikifo-rov, V. G. 1982. Genetika 18: 349-59; Shortle et al. (1981)Annu. Rev. Genet. 15: 265-94; ambos aqui incorporados porreferência. 0 artesão habilitado pode rotineiramente produ-zir mutações tipo anulação, inserção ou substituição e iden-tificar aqueles mutantes resultantes os quais contêm as ca-racteristicas desejadas da seqüência de tipo selvagem decomprimento total, ou seus fragmentos, por exemplo, aquelesos quais retêm atividade hormonal, de citocina, de ligação aantigeno ou outra atividade biológica.Além disso, ou alternativamente, a seqüência depolipeptideo variante pode codificar uma seqüência de amino-ácido variante a qual contém substituições "não-conservativas", em que o aminoácido substituído tem proprie-dades estruturais ou químicas diferentes do aminoácido oqual ele substitui. Polinucleotídeos que codificam imunoglo-bulinas variantes também podem codificar seqüências de ami-noácidos variantes as quais contêm inserções ou anulações deaminoácidos, ou ambas. Além disso, um polinucleotídeo quecodifica uma imunoglobulina variante pode codificar o mesmopolipeptideo que a seqüência de polinucleotídeo de referên-cia, mas, devido à degeneração do código genético, tem umaseqüência de polinucleotídeos a qual é alterada por uma oumais bases da seqüência de polinucleotídeo de referência.
O termo "fragmento", quando se referindo a uma i-munoglobulina recombinante da invenção, significa um poli-peptideo o qual tem uma seqüência de aminoácido a qual é amesma que parte de, porém não de toda a seqüência de aminoá-cido da proteína de imunoglobulina de comprimento total cor-respondente, a qual ou retém essencialmente a mesma funçãoou atividade biológica que a proteína de comprimento totalcorrespondente, ou retém pelo menos uma das funções ou ati-vidades da proteína de comprimento total correspondente. Ofragmento preferivelmente inclui pelo menos 20 - 100 resí-duos de aminoácidos contíguos da imunoglobulina de compri-mento total e, preferivelmente, retém a capacidade de se li-gar ao mesmo antígeno que o anticorpo de comprimento total.
Conforme aqui utilizado, o termo "identidade deseqüência significa identidade de seqüência de ácido nucléi-co ou de aminoácido em duas ou mais seqüências alinhadas,quando alinhadas usando um programa de alinhamento de se-qüência. O termo "% de homologia" é usado de forma permutá-vel aqui com o termo "% de identidade" aqui e se refere aonivel de identidade de seqüência de ácido nucléico ou de a-minoácido entre duas ou mais seqüências alinhadas, quandoalinhadas usando um programa de alinhamento de seqüência.
Por exemplo, conforme aqui utilizado, 80% de homologia sig-nifica a mesma coisa que 80% de identidade de seqüência de-terminada por um algoritmo definido, e da mesma forma um ho-mólogo de uma dada seqüência tem mais do que 80% de identi-dade de seqüência sobre uma extensão de uma dada seqüência.
0 alinhamento ótimo de seqüências para comparaçãopode ser efetuado, por exemplo, pelo algoritmo de homologialocal de Smith e Waterman. 1981. Adv. Appl. Math. 2: 482,pelo algoritmo de alinhamento de homologia de Needleman eWunsch. 1970. J Mol. Biol. 48: 443, pela busca para o métodode similaridade de Pearson e Lipman. 1988. Proc. Natl. Acad.Sei. USA 85: 2444, pelas implementações computadorizadasdesses algoritmos (GAP, BESTFIT, FASTA e TFASTA no Pacote deprogramas de computador de genética Wisconsin, Genetics Com-puter Group, Madison, Wis.), pelo algoritmo BLAST, Altschulet al. 1990. J Mol. Biol. 215: 403-410, com programa de com-putador que é publicamente disponível através do sítio darede do National Center for Biotechnology Information (vernlm.nih.gov/), ou por inspeção visual (ver de um modo geralAusubel et al., abaixo). Para propósitos da presente inven-ção, o alinhamento ótimo de seqüências para comparação émais preferivelmente conduzido pelo algoritmo de homologialocal de Smith e Waterman. 1981. Adv. Appl. Math. 2: 482.Ver também, Altschul et al. 1990 e Altschul et al. 1997.
Os termos "idêntico" ou "identidade" porcentual nocontexto de duas ou mais seqüências de proteína ou de ácidonuclêico, se referem a duas ou mais seqüências ou subseqüên-cias que são as mesmas ou têm uma porcentagem especificadade resíduos de aminoácidos ou nucleotídeos que são os mes-mos, quando comparados e alinhados para um máximo de corres-pondência, conforme medido usando um dos algoritmos de com-paração de seqüência aqui descritos, por exemplo, o algorit-mo de Smith-Waterman, outros conhecidos na técnica, por e-xemplo, BLAST, ou por inspeção visual.
De acordo com a presente invenção, são também en-globadas variantes de seqüência as quais codificam polipep-tídeos de clivagem autoprocessadores e polipeptídeos que e-Ies próprios têm 80, 85, 88, 89, 90, 91, 92, 93, 94, 95, 96,97, 98, 99% (e todos os números inteiros entre 80 e 100) oumais de identidade de seqüência em relação à seqüência natu-ral. São também englobados fragmentos de aminoácidos dos po-lipeptídeos que representam um filamento contínuo de pelomenos 5, pelo menos 10 ou pelo menos 15 unidades; e fragmen-tos homólogos a eles de acordo com as condições de identida-de descritas; e fragmentos de seqüências de ácido nuclêicoque representam um filamento contínuo de pelo menos 15, pelomenos 30 ou pelo menos 45 unidades.
Uma seqüência de ácido nuclêico é considerada comosendo "seletivamente hibridizável" em relação a uma seqüên-cia de ácido nucléico de referência se as duas seqüências sehibridizam especificamente uma com a outra sob condições dehibridização e lavagem de estringência moderada a alta. Con-dições de hibridização são baseadas na temperatura de fusão(Tf) da sonda ou complexo de ligação a ácido nucléico. Porexemplo, "máxima estringência" tipicamente ocorre em cercade Tf - 5 °C (5 °C abaixo da Tf da sonda) ; "alta estringên-cia" em cerca de 5 - 10 ° abaixo da Tf; "estringência inter-mediária" em cerca de 10 - 20 ° abaixo da Tf da sonda; e"baixa estringência" em cerca de 20 - 25 ° abaixo da Tf.Funcionalmente, condições de estringência máxima podem serusadas para identificar seqüências com identidade estrita ouidentidade próxima da estrita com a sonda de hibridização;enquanto que altas condições de estringência são usadas paraidentificar seqüências com cerca de 80% ou mais de identida-de de seqüência com a sonda.
Condições de hibridização de estringência de mode-rada a alta são bem conhecidas na técnica (ver, por exemplo,Sambrook, et al, 1989, Capítulos 9 e 11, e em Ausubel, F.M., et al., 1993. Um exemplo de condições altas de estrin-gência incluem a hibridização a cerca de 42 °C em 50% deformamida, SSC 5x, solução de Denhardt 5x, SDS 0,5% e 100μg/mL de DNA carreador desnaturado seguido pela lavagem duasvezes em SSC 2x e SDS 0,5% em temperatura ambiente e duasvezes adicionais em SSC 0,lx e SDS 0,5% a 42 °C. Variantesda seqüência 2A que codificam um polipeptídeo com a mesmaatividade biológica que a proteína de ocorrência natural deinteresse e hibridizam sob condições de hibridização de es-tringência moderada a alta são considerados como estandodentro do escopo da presente invenção.
Como resultado da degeneração do código genético,uma variedade de seqüências codificantes pode ser produzidaas quais codificam a mesma seqüência de polipeptideo 2A outipo 2A ou outra seqüência de clivagem de peptidase de sinalou protease. Por exemplo, o triplete CGT codifica o aminoá-cido arginina. Arginina é alternativamente codificada porCGA, CGC, CGG, AGA, e AGG. Conseqüentemente, é percebido quetais substituições de códons sinonimicos na região codifica-dora caem dentro das variantes de seqüência que são cobertaspela presente invenção.
É ainda percebido que tais variantes de seqüênciapodem ou não hibridizar para a seqüência de origem sob con-dições de alta estringência. Isso poderia ser possível, porexemplo, quando a variante de seqüência inclui um diferentecódon para cada um dos aminoácidos codificados pelo nucleo-tídeo de origem. Tais variantes são, entretanto, especifica-mente contemplados e englobados pela presente invenção.
O potencial dos anticorpos como modalidades tera-pêuticas é atualmente limitado pela capacidade de produção egastos da tecnologia atual. Um vetor de expressão individualviral ou não-viral melhorado para a produção de imunoglobu-Iina (ou outra proteína) facilita a expressão e a distribui-ção de duas ou mais seqüências codificantes, isto é, imuno-globulinas ou outras proteínas com bi- ou múltiplas especi-ficidades de um único vetor. A presente invenção endereçaessas limitações e é aplicável a qualquer imunoglobulina(isto é, um anticorpo) ou fragmento seu ou outra proteínamultiparte ou par de proteína de ligação conforme adicional-mente detalhado aqui, incluindo anticorpos projetados taiscomo anticorpos de cadeia individual, anticorpos de compri-mento total ou fragmentos de anticorpo, hormônios de duascadeias, citocinas de duas cadeias, quimocinas de duas ca-deias, receptores de duas cadeias e semelhantes.
IRES
Os elementos de sítio de entrada do ribossomo in-terno (IRES) foram primeiramente descobertos em RNAms de pi-cornavírus (Jackson et al. 1990. Trends Biochem. Sei. 15:477-83) e Jackson e Kaminski. 1995. RNA 1: 985-1000). Exem-plos de IRES geralmente empregados por aqueles indivíduosversados na técnica incluem aqueles referenciados na TabelaI, assim como aqueles descritos na Patente Americana No.6.692.736. Exemplos de "IRES" conhecidos na técnica incluem,mas não estão limitados, a IRES obteníveis de picornavírus(Jackson et al., 1990) e IRES obteníveis de fontes de RNAmviral ou celular, tais como, por exemplo, proteína de liga-ção de cadeia pesada de imunoglobulina (BiP), o fator decrescimento endotelial vascular (VEGF) (Huez et al. 1998.Mol. Cell. Biol. 18: 6178-6190), o fator de crescimento defibroblasto 2 (FGF-2) e o fator de crescimento tipo insulina(IGFII), o fator de iniciação de tradução eIF4G e os fatoresde transcrição de levedura TFIID e HAP4, os vírus de encefa-lomiocardite (EMCV) o qual é comercialmente disponível daNovagen (Duke et al. 1992. J. Virol 66: 1602-9) e o IRES deVEGF (Huez et al. 1998. Mol. Cell. Biol. 18: 6178-90). IREStambém tem sido reportados em diferentes virus tais comocardiovírus, rinovírus, aftovírus, HCV, virus da leucemia demurino Friend (FrMLV) e vírus da leucemia de murino Moloney(MoMLV). Conforme aqui utilizado, "IRES" engloba variaçõesfuncionais das seqüências IRES contanto que a variação sejacapaz de promover a entrada de ribossomo interno direta nocódon de iniciação de um cistron. Um IRES pode ser de mamí-fero, viral ou de protozoário.
O IRES promove a entrada do ribossomo interno di-reta no códon de iniciação de um cistron à jusante, levandoa uma tradução independente de cap. Dessa forma, o produtode um cistron à jusante pode ser expresso a partir de umRNAm bicistrônico (ou multicistrônico) sem requerer ou aclivagem de uma poliproteína ou a geração de um RNAm mono-cistrônico. Os sítios de entrada de ribossomo internos sãode aproximadamente 450 nucleotídeos de extensão e são carac-terizados pela conservação moderada da seqüência primária epela forte conservação da estrutura secundária. A caracte-rística da seqüência primária mais significativa do IRES é osítio rico em pirimidina cujo início está localizado aproxi-madamente 25 nucleotídeos à montante da extremidade 3' doIRES. Ver Jackson et al. (1990).
Três classes principais o IRES de picornavírus fo-ram identificadas e caracterizadas: a classe de cardio e af-tovírus (por exemplo, o vírus da encefalomiocardite, Jang etal. 1990. Gene Dev 4: 1560-1572); a classe de entero e rino-vírus (por exemplo, poliovírus, Borman et al. 1994. EMBO J.13: 3149-3157); e a classe do vírus da hepatite A (HAV) ,Glass et al. 1993. Virol 193: 842-852). Para as primeirasduas classes, dois princípios gerais se aplicam. Primeiro, amaior parte da seqüência de 450 nucleotídeos das funçõesIRES funcionam para manter as estruturas secundárias e ter-ciárias particulares condutivas para a ligação do ribossomoe a iniciação da tradução. Em segundo, o sítio de entrada doribos somo é um triplete AUG localizado na extremidade 3' doIRES, aproximadamente 25 nucleotídeos à jusante de uma áreade oligopirimidina conservada. A iniciação da tradução podeocorrer ou no sítio de entrada do ribossomo (cardiovírus) ouno próximo AUG à jusante (classe de entero/rinovírus) . A i-niciação ocorre em ambos os sítios no aftovírus. HCV e pes-tivírus, tal como o vírus da diarréia viral de bovino (BVDV)ou o vírus da febre suína clássico (CSFV) têm 341 nt e 370nt de extensão da 5'-UTR, respectivamente. Esses fragmentosde 5' -UTR formam estruturas secundárias de RNA similares epodem ter a função IRES moderadamente eficiente (Tsukiyama-Kohara et al. 1992. J. Virol. 66: 1476 - 1483; Frolov et al.1998. RNA 4: 1418-1435). Estudos recentes mostraram que tan-to as seqüências de 5'-UTR de vírus da leucemia de murinoFriend (MLV) quanto 30S tipo vírus retrotransposon de rato(VL30) contêm estrutura IRES de origem retroviral (Torrentet al. 1996. Hum. Gene Ther 7: 603-612).
Em células eucarióticas, a tradução é normalmenteiniciada pela varredura do ribossomo da extremidade 5' deRNAm coberto, sob o controle dos fatores de iniciação. En-tretanto, vários RNAms celulares foram descobertos como ten-do estrutura IRES para mediar a tradução independente de cap(van der Velde, et al. 1999. Int J Biochem Cell Biol. 31:87-106). Exemplos dos elementos IRES incluem, sem limitação,proteína de ligação da cadeia pesada de imunoglobulina (BiP)(Macej ak et al. 1991. Nature 353: 90-94), RNAm de antenape-dia de Drosophila (Oh et al. 1992. Gene and Dev 6: 1643-1653), fator de crescimento de fibroblasto 2 (FGF-2) (Vagneret al. 1995. Mol. Cell. Biol. 15: 35-44), fator de cresci-mento derivado de plaqueta B (PDGF-B) (Bernstein et al.1997. J. Biol. Chem. 272: 9356-9362), fator de crescimentotipo insulina II (Teerink et al. (1995) Biochim. Biophys.Acta 1264: 403-408) e o fator de iniciação de tradução eIF4G(Gan et al. 1996. J. Biol. Chem. 271: 623-626). Recentemen-te, o fator de crescimento endotelial vascular (VEGF) tambémfoi descoberto como tendo o elemento IRES (Stein et al.1998. Mol. Cell. Biol. 18: 3112-3119; Huez et al. 1998. Mol.Cell. Biol. 18: 6178-6190) . Outros exemplos de seqüênciasIRES incluem HAV de picornavírus (Glass et al. 1993. Virol-ogy 193: 842 - 852); EMCV (Jang e Wimmer. 1990. Gene Dev. 4:1560-1572); Poliovirus (Borman et al. 1994. EMBO J. 13:3149-3157); HCV (Tsukiyama-Kohara et al. 1992. J. Virol. 66:1476-1483); BVDV de pestivírus (Frolov et al. 1998. RNA. 4:1418-1435); LRV-I de Leishmania (Maga et al. 1995. Mol.Cell. Biol. 15 : 4884-4889); Retrovírus: MoMLV (Torrent etal. 1996. Hum. Gene Ther. 7: 603-612). VL30, vírus de sarco-ma de murino Harvey, REV (Lopez-Lastra et al. 1997. Hum. Ge-ne Ther. 8: 1855-1865). IRES pode ser preparado usando méto-dos recombinantes e sintéticos padrões conhecidos na técni-ca. Por conveniência de clonagem, os sítios de restrição po-dem ser projetados nas extremidades dos fragmentos IRES aserem usados.
Para expressar duas ou mais proteínas de um únicotranscrito determinado por um vetor viral ou não-viral, umaseqüência de sítio de entrada de ribossomo interno (IRES) écomumente usada para direcionar a expressão da segunda, ter-ceira, quarta seqüência codificadora, etc. Quando duas se-qüências codificadoras são ligadas por um IRES, o nível deexpressão de tradução da segunda seqüência codificadora égeralmente significativamente reduzido (Furler et al. 2001.Gene Therapy 8: 864-873). De fato, o uso de um IRES paracontrolar a transcrição de duas ou mais seqüências codifi-cantes operativamente ligadas ao mesmo promotor pode resul-tar num nível de expressão mais baixo da segunda, terceira,etc. seqüência codificadora em relação à seqüência codifica-dora adjacente ao promotor. Além disso, uma seqüência IRESpode ser suficientemente longa para impactar no completo em-pacotamento do vetor, por exemplo, o IRES eCMV tem um com-primento de 507 pares de base.
A expressão das proteínas na forma de poliproteí-nas (como um produto de tradução primário) é uma estratégiaadotada na replicação de muitos vírus, incluindo, porém semse limitar, ao picornaviridae. Na tradução, peptídeos auto-processadores codificados por vírus medeiam a rápida cliva-gem intramolecular (eis) da poliproteína para produzir pro-dutos de proteína distintos (maduros). A presente invençãoproporciona vantagens em relação ao uso de um IRES pelo fatode que um vetor para a expressão da proteína ou polipeptideorecombinante compreendendo uma seqüência de peptideo auto-processador (exemplificada aqui por seqüência de peptideo2A) ou outros sítios de clivagem de protease é fornecido oqual facilita a expressão de duas ou mais seqüências codifi-cadoras de proteína ou de polipeptideo usando um único pro-motor, em que as duas ou mais proteínas ou polipeptídeos sãoexpressos numa proporção molar vantajosa. Para imunoglobuli-nas, a poliproteína é codificada por uma seqüência codifica-dora para uma cadeia pesada e seqüências codificadoras parauma ou duas cadeias leves, com um sítio autoprocessador ousítio de reconhecimento de protease codificado entre cadauma delas.
Num constructo contendo inteína, pode haver somen-te um de cada um dos segmentos de cadeia pesada e leve, ex-pressos no e numa poliproteína de fusão de estrutura com umainteína entre as duas cadeias de imunoglobulina, com as ca-racterísticas apropriadas para capacitar a clivagem nas jun-ções de cadeia de inteína-imunoglobulina, mas não o religa-mento das duas proteínas de imunoglobulina. Em outro cons-tructo contendo inteína, um ou mais segmentos de imunoglobu-lina adicionais estão presentes, opcionalmente separados doprimeiro e/ou do segundo segmento por um sítio de clivagem.Por exemplo, a abordagem da inteína é usada para expressarum segmento de cadeia pesada e um segmento de cadeia leve oupara expressar uma cadeia pesada e duas cadeias leves, e as-sim por diante.
Um "sítio de clivagem autoprocessador" ou "seqüên-cia de clivagem autoprocessadora", conforme definido acima,se refere a uma seqüência de aminoácido ou de DNA codifican-te, em que na tradução, a clivagem intramolecular rápida(eis) de um polipeptideo compreendendo o sitio de clivagemautoprocessador ocorre para produzir produtos de proteínamaduros discretos. Tal "sítio de clivagem autoprocessador"também pode ser referido como um sítio de clivagem de pro-cessamento co-tradução ou pós-tradução, exemplificado aquipor um sítio, seqüência ou domínio 2A ou uma inteína. Um sí-tio, seqüência ou domínio 2A demonstra um efeito de traduçãopela modificação da atividade do ribossomo para promover ahidrólise de uma ligação éster, liberando dessa forma o po-lipeptideo do complexo de tradução de uma forma que permitaa síntese de um produto de tradução à jusante discreto paraproceder (Donnelly, 2001) . Alternativamente, um sítio ou do-mínio 2A demonstra "autoproteólise" ou "clivagem" pela cli-vagem de seu próprio C-terminal em eis para produzir os pro-dutos de clivagem primários (Furler e Palmenberg. 1990. Ann.Rev. Microbiol. 44: 603-623). Outras seqüências de reconhe-cimento de protease, incluindo sítios de clivagem de pepti-dase de sinal, podem ser substituídos para o sítio autopro-cessador. Inteínas também são úteis em poliproteínas.
INTEÍNAS
Conforme aqui utilizado, uma inteína é um segmentonuma proteína expressa, ligada através do N-terminal do pro-duto de expressão primário por uma N-exteína e ligado para oC-terminal do produto de expressão primário por uma C-exteína. Inteínas de ocorrência natural medeiam a excisãodas inteinas e o ajuntamento (ligação de proteína) das N- eC-exteínas. Entretanto, no contexto dos presentes produtosde expressão, a seqüência primária da inteína ou da seqüên-cia de aminoácido de exteina flanqueadora é tal que a cliva-gem da estrutura da proteína ocorre na ausência de ou comuma quantidade reduzida ou mínima de ligação com as exter-nas, de forma que as proteínas de exteina são liberadas doproduto de tradução primário (poliproteína) sem serem reuni-dos para formar uma proteína de fusão. A porção de inteínado produto de expressão primário (a proteína sintetizada porRNAm, antes de qualquer clivagem proteolítica) medeia a cli-vagem proteolítica nas junções de N-exteína/inteína e de in-teína/C-exteína. Em geral, inteinas de ocorrência naturaltambém medeiam a união em conjunto (junção pela formação deuma ligação peptídica) da N-exteína e da C-exteína. Entre-tanto, na presente invenção conforme aplicado para a meta deexpressar dois polipeptídeos (conforme especificamente exem-plificado pelas cadeias pesada e leve de uma molécula.de an-ticorpo) é preferível que a ligação da proteína não ocorra.Isso pode ser alcançado pela incorporação de uma inteína aqual ou naturalmente ou através de mutação não tenha ativi-dade de ligação. Alternativamente, a união pode ser preveni-da pela mutação para alterar o(s) aminoácido(s) no ou próxi-mo ao sítio de união para prevenir a ligação das proteínasliberadas. Ver Xu e Perler, 1996, EMBO J. 15: 5146-5153;Ser, Thr ou Cys normalmente ocorrem no início da C-exteína.
Inteinas são uma classe de proteínas cujos genessão encontrados somente nos genes de outras proteínas. Jun-tamente com os genes hospedeiros flanqueadores nomeados ex-ternas, as internas são transcritas como um único RNAm, etraduzidas como um único polipeptideo. De forma pós-traducional, as internas iniciam um evento autocataliticopara remover elas próprias e juntam os segmentos de proteínahospedeira flanqueadores com uma nova ligação polipeptidica.Essa reação é catalisada somente pela interna, não requeroutras proteínas celulares, co-fatores ou ATP. Inteinas sãoencontradas numa variedade de organismos unicelulares e elastêm diferentes tamanhos. Muitas internas contêm um domíniode endonuclease, o qual contabiliza para as suas mobilidadesnos genomas.
As reações mediadas por interna foram usadas embiotecnologia, especialmente para colocações in vitro taiscomo para purificações e para a construção de um fragmentode proteína, e na melhoria do filamento vegetal (Perler,F.B. 2005. IUBMB Life 57(7): 469-76). Mutações foram intro-duzidas em seqüências de nucleotídeo de inteína naturais, ealguns desses mutantes são reportados por ter propriedadesalteradas (Xu e Perler, 1996. EMBO J. 15(9), 5146-5153). A-lém das internas, domínios tipo inteína bacterianos (BIL) edomínios autoprocessadores hedgehog (Hog), os outros 2 mem-bros da superfamília Hog/inteína (HINT) também são conheci-dos por catalisar o autoprocessador pós-traducional atravésde mecanismos similares (Dassa et al 2004 J. Biol. Chem. 279(31) : 32001 - 32007).
Internas ocorrem como inserções na estrutura emproteínas hospedeiras específicas. Numa reação de autounião,as inteinas cortam a si próprias de uma proteína precursora,enquanto as regiões flanqueadoras, as exteinas, se tornamunidas para restaurar a função de gene hospedeiro. Esses e-lementos também contêm uma função de endonuclease que conta-biliza para as suas mobilidades nos genomas. Inteinas ocor-rem numa faixa de tamanhos (134 a 1650 aminoácidos) e elasforam identificadas nos genomas de eubactéria, eucariotos earachea. Experimentos usando sistemas de união/repórter mo-delos mostraram que as funções de endonuclease, de clivagemde proteína e de união de proteína podem ser separadas (Xu ePerler. 1996. EMBO J. 15: 5146-5153). 0 exemplo descrito a-baixo usa uma inteína Pho Pol I de Pyrococcus horikoshii,uma VMA de Saceharomyces eerevisiae e Synechoeystis spp paracriar uma proteína de fusão com seqüências de uma cadeia pe-sada e leve de anticorpo. A mutação da inteína designada pa-ra anular a capacidade de união de inteína resulta num únicopolipeptídeo que sofre uma autoclivagem para produzir cadei-as pesada e leve de anticorpo corretamente codificadas. Essaestratégia pode ser semelhantemente empregada na expressãode outras proteínas com múltiplas cadeias, hormônios ou ci-tocinas, e ela também pode ser adaptada para o processamentode proteínas precursoras (proproteínas) para as suas formasmaduras biologicamente ativas. Enquanto o uso de inteinas dePho Pol I de Pyroeoeeus horikoshii, VMA de S. eerevisiae eSynechoeystis spp. é especificamente exemplificado aqui, ou-tras inteinas conhecidas na técnica podem ser usadas nos ve-tores de expressão de poliproteína e nos métodos da presenteinvenção.Muitas outras inteinas além das inteinas Pho Pol Ide Pyrococcus horikoshii, VMA de S. cerevisiae eSynechocystis spp. são conhecidas na técnica (ver, por exem-plo, Perler, F.B. 2002, InBase, the Intein Database, Nucl.
Acids Res. 30(1): 383-384 e no Intein Database and Registry,disponível através do sítio da rede da New England Biolabs,por exemplo, em http://tools.neb.com/inbase/). Inteinas fo-ram identificadas numa ampla faixa de organismos tais comoleveduras, micobactérias e archaebactérias extremamente ter-mofílicas. Certas inteinas têm atividade de endonuclease as-sim como as atividades de corte e junção de proteínas sítio- especificas. A atividade da endonuclease não é necessáriapara a prática da presente invenção; uma região codificadorade endonuclease pode ser anulada, com a condição de que aatividade de clivagem da proteína seja mantida.
O mecanismo do processo de união da proteína temsido estudado com grandes detalhes (Chong et al. 1996. J.Biol. Chem. 271: 22159-22168; Xu e Perler. 1996. EMBO J 15:5146-5153) e foram encontrados aminoácidos conservados nospontos de união da inteína e da exteína (Xu et al. 1994.EMBO J 13: 5517-5522). Os constructos aqui descritos contêmuma seqüência de inteína fundida no 5'-terminal da primeiraseqüência codificadora, com uma segunda seqüência codifica-dora fundida na estrutura C-terminal da inteína. Seqüênciasde inteína adequadas podem ser selecionadas de qualquer umadas proteínas conhecidas por conter elementos de união deproteína. Um banco de dados contendo todas as inteinas co-nhecidas pode ser encontrado na Rede Mundial de Computadores(Perler, F. Β. 1999. Nucl. Acids Res. 27: 346-347). A se-qüência codificadora de inteina é fundida (na estrutura) naextremidade 3' até a extremidade 5' de uma segunda seqüênciacodificadora. Para o alvejamento dessa proteína para certaorganela, um peptídeo de sinal apropriado pode ser fundidocom a seqüência codificadora da proteína.
Depois da segunda seqüência codificadora de exter-na, a seqüência codificadora de inteína-seqüência codifica-dora de exteína pode ser repetida sempre que desejado para aexpressão de múltiplas proteínas na mesma célula. Para cons-tructos contendo múltiplas inteínas, pode ser útil usar ele-mentos de inteina de diferentes fontes. Depois da seqüênciado último gene a ser expresso, uma seqüência de terminaçãode transcrição, e vantajosamente incluindo uma seqüência depoliadenilação é desejavelmente inserida. A ordem de uma se-qüência de poliadenilação e uma seqüência de terminação podeser conforme entendido na técnica. Numa modalidade, uma se-qüência de poliadenilação pode preceder uma seqüência determinação.
Unidades de união de inteina modificadas foram de-signadas de forma que tal inteina modificada de interessepossa catalisar a excisão das exteínas das inteínas, mas nãopossa catalisar a ligação das exteínas (ver, por exemplo,Patente Americana 7026526 e a Publicação de Patente America-na 20020129400). A mutagênese da junção de exteína C-terminal na GB-D DNA polimerase de espécies de Pyrococcusproduziu um elemento de união alterado que induz a clivagemdas exteínas e das inteínas, mas previne a subseqüente liga-ção das exteínas (Xu e Perler. 1996. EMBO J 15: 5146-5153).
A mutação da serina 538 para ou uma alanina ou glicina (Serpara Ala ou Gly) induziu a clivagem, porém preveniu a liga-ção. Em tal posição, Ser para Met ou Ser para Thr também sãousadas para alcançar a expressão de uma poliproteina que éclivada em segmentos separados e pelo menos parcialmente nãoligados. A mutação de resíduos equivalentes em outras unida-des de união de inteína também pode prevenir a ligação dossegmentos de exteína devido à conservação relativa dos ami-noácidos na junção de exteína C-terminal com a inteína. Emexemplos de baixa conservação/homologia, por exemplo, osprimeiros vários, por exemplo, cerca de cinco resíduos da C-exteína e/ou os últimos vários resíduos do segmento de inte-ína são sistematicamente variados e submetidos à varredurapara a capacidade de suportar a clivagem, porém não a uniãode dados segmentos de exteína, particularmente segmentos deexteína revelados aqui e conforme entendido na técnica. E-xistem inteínas que não contêm um domínio de endonuclease;essas incluem a inteína dnaE de Synechocystis spp e a prote-ína GyrA de Mycobacterium xenopi (Magnasco et al, Biochemis-try, 2004, 43, 10265-10276; Telenti et al. 1997. J. Bacteri-ol. 179: 6378-6382). Outras foram descobertas na natureza ouforam criadas artificialmente pela remoção dos domínios quecodificam endonuclease das seqüências que codificam inteínascontendo endonuclease (Chong et al. 1997. J. Biol. Chem.272: 15587-15590). Onde desejado, a inteína é selecionadaoriginalmente de forma que ela consiste da quantidade mínimade aminoácidos necessária para efetuar a função de união,tal como a inteina da proteína GyrA de Mycobacterium xenopi(Telenti et al. 1997. acima) . Numa modalidade alternativa,uma inteina sem atividade de endonuclease é selecionada, talcomo uma inteina da proteína GyrA de Mycobacterium xenopi oua inteina VMA de Saccharomyees eerevisiae que foi modificadapara remover os domínios de endonuclease (Chong et al. 1997.acima).
Outra modificação da unidade de união de inteinapode permitir que a taxa de reação da reação de clivagem se-ja alterada, permitindo que a dosagem da proteína seja con-trolada simplesmente pela modificação da seqüência do geneda unidade de união.
Numa modalidade, o primeiro resíduo da exteína C-terminal é projetado para conter uma glicina ou alanina, umamodificação que foi demonstrada por prevenir a ligação daexteína com a GB-D DNA polimerase da espécie Pyrococcus (Xue Perler. 1996. EMBO J 15: 5146-5153). Nessa modalidade,proteínas de exteína C-terminais preferidas naturalmentecontêm um resíduo de glicina ou alanina após a metionina N-terminal na seqüência de aminoácido natural. A fusão da gli-cina ou alanina da exteína com o C-terminal da inteina pro-porciona a seqüência de aminoácido natural depois do proces-samento da poliproteína. Em outra modalidade, uma glicina oualanina artificial é posicionada na exteína C-terminal oupela alteração da seqüência natural ou pela adição de um re-síduo de aminoácido adicional no N-terminal da seqüência na-tural. Nessa modalidade, a seqüência de aminoácido naturalda proteína será alterada por um aminoácido depois do pro-cessamento da poliproteina. Em outras modalidades, outrasmodificações úteis na presente invenção estão descritas naUS 7026526.
A seqüência de DNA da inteina da GB-D DNA polime-rase da espécie de Pyrococcus é a SEQ ID NO: 1 da PatenteAmericana no. 7.026.526. 0 ponto da junção de exteina N-terminal é a seqüência "aac" (nucleotideos 1 - 3 da SEQ IDNO: 1) e codifica um resíduo de asparagina. Os sítios de u-nião na proteína precursora da GB-D DNA polimerase naturalseguem o nucleotídeo 3 e o nucleotídeo 1614 na SEQ ID NO: 1.
0 ponto de junção da exteina C-terminal é a seqüência "age"(nucleotideos 1615- 1617 da SEQ ID NO: 1) a qual codifica umresíduo de serina. A mutação da serina da exteina C-terminalpara uma alanina ou glicina forma um elemento de união deinteina modificada que é capaz de promover a excisão da po-liproteina, mas não a ligação das unidades de exteina.
A seqüência de DNA da inteina mínima GyrA deMycobacter.ium xenopi é a SEQ ID NO: 2 da Patente Americana7.026.526. 0 ponto de junção da exteina N-terminal é a se-qüência "tac" (nucleotideos 1 - 3 da SEQ ID NO: 2) e codifi-ca um resíduo de tirosina. Os sítios de união na proteínaprecursora seguem o nucleotídeo 3 e o nucleotídeo 597 da SEQID NO: 2. 0 ponto de junção da exteina C-terminal é a se-qüência "aac" (nucleotideos 598 - 600 da SEQ ID NO: 2) e co-difica um resíduo de treonina. A mutação da treonina da ex-teina C-terminal para uma alanina ou glicina forma um ele-mento de união de inteina modificado que promove a excisãoda poliproteina, mas não liga as unidades de exteina.Sistemas 2A
Se voltando agora para a modalidade de processa-mento da protease 2A da presente invenção, a atividade da 2Apode envolver o salto ribossomal entre os códons o qual pre-vine a formação de ligações peptidicas (de Felipe et al.2000. Human Gene Therapy 11: 1921-1931; Donnelly et al.2001. J. Gen. Virol. 82: 1013-1025), embora tenha sido con-siderado que o domínio aja mais como uma enzima autolítica(Ryan et al. 1989. Virology 173: 35-45). Estudos nos quais aregião codificadora 2A do vírus da febre aftosa (FMDV) foiclonada nos vetores de expressão e transfectada em célulasalvo estabeleceu que a clivagem 2A de FMDV das poliproteínasrepórteres artificiais é eficiente numa ampla faixa de sis-temas de expressão heterólogos (lisato de gérmen de trigo eplanta de tabaco transgênica (Halpin et al., Patente Ameri-cana No. 5.846.767 (1998) e Halpin et al. 1999. The PlantJournal 17: 453-459); a linhagem celular do glioma humano Hs683. (de Felipe et al. 1999. Gene Therapy 6: 198-208; de ago-ra em diante referida como "de Felipe II"); células HTK-143humanas e lisato de reticulócito de coelho (Ryan et al.1994. EMBO J. 13: 928-933); e células de inseto (Roosien etal. 1990. J. Gen. Virol. 71: 1703- 1711). A clivagem mediadapor 2A de FMDV de uma poliproteína heteróloga para uma molé-cula biologicamente relevante foi mostrada para a IL-12 (he-terodímero p40/p35; Chaplin et al. 1999. J. Interferon Cyto-kine Res. 19: 235-241). Em células COS-7 transfectadas, 2Ade FMDV mediou a clivagem de uma poliproteína p40-2A-p35 nassubunidades p40 e p35 biologicamente funcionais com ativida-des associadas com IL-12.
A seqüência 2A de FMDV foi incorporada em vetoresde expressão, sozinhas ou combinadas com diferentes seqüên-cias IRES para construir vetores bicistrônicos, tricistrôni-cos e tetracistrônicos. A eficiência da expressão do genemediado por 2A em animais foi demonstrada por Furler (2001)usando vetores virais adenoassociados recombinantes (AAV)codificando uma α-sin-nucleína e EGFP ou Cu/Zn superóxidodesmutase (SOD-I) e EGFP ligado através da seqüência 2A deFMDV. EGFP e α-sin-nucleína foram expressos em niveis subs-tancialmente mais altos a partir de vetores os quais incluiram uma seqüência 2A em relação aos correspondentes vetoresbaseados em IRES, enquanto que SOD-I foi expresso em niveiscomparáveis ou levemente mais elevados.
A seqüência de DNA que codifica um sitio de cliva-gem autoprocessador é exemplificada por seqüências viraisderivadas de um picornavirus incluindo, mas sem se limitar,a um virus da febre aftosa (FMDV) ou entero-, rino-, cardio-ou aftovirus. Numa modalidade preferida, a seqüência que co-difica o sitio de clivagem autoprocessador é derivada de umFMDV. Os sítios de clivagem autoprocessadores incluem, masnão estão limitados, aos domínios 2A e tipo 2A (Donnelly etal. 2001. J. Gen. Virol. 82: 1027-1041, incorporados por re-ferência na sua totalidade).
Alternativamente, um sítio de reconhecimento daprotease pode ser substituído pelo sítio autoprocessador.
Sítios de reconhecimento cognatos e de protease adequadosincluem, sem limitação, furina, RXR/K-R (SEQ ID N0:1); VP4de IPNV, S/TXA-S/AG (SEQ ID NO:2); protease do virus etch detabaco (TEV), EXXYXQ-G (SEQ ID N0:3); 3C protease de rinoví-rus, LEVLFQ-GP (SEQ ID NO:4); PC5/6 protease; PACE protease,LPC/PC7 protease; enteroquinase; DDDDK-X (SEQ ID N0:5); pro-tease do fator Xa IE/DGR-X (SEQ ID NO:6); trombina, LVPR-GS(SEQ ID NO:7); genenase I, PGAAH-Y (SEQ ID NO:8); e MMP pro-tease; um peptídeo de sinal internamente clivável, um exem-plo o qual é o peptideo de sinal internamente clivável dovirus de influenza C (Pekosz A. 1998. Proc. Natl. Acad. Sei.USA 95: I 13233-13238) (MGRMAMKWLVVIICFSITSQPASA, SEQ IDNO:11). A protease pode ser fornecida na trans ou na eis co-mo parte da poliproteina, de forma que ela é codificada coma mesma transcrição e separada do restante do produto detradução primário, por exemplo, por um sitio autoprocessadorou sitio de reconhecimento da protease.
Conforme mais e mais medicamentos de anticorpo sãoaprovados para aplicações clinicas, tem ocorrido uma melho-ria constante nos métodos para produzir essas proteínas te-rapêuticas durante os últimos 20 anos (Wurm, FM, 2004, "Pro-duetion of recombinant protein therapeuties in cultivatedmammalian cells," Nat. Biotechnol. 22 (11) : 1393) . Entretan-to, métodos de produção ainda mais eficientes e confiáveissão desejados pela indústria. Algumas características dese-jáveis incluem níveis mais altos de secreção de anticorpo nomeio de cultura, estabilidade genética melhorada da produçãode linhagens celulares e maior velocidade na geração de li-nhagens celulares.
Na nossa busca por métodos mais eficientes paraproduzir anticorpos terapêuticos, nós desenvolvemos métodospara expressar cadeia pesada e cadeia leve de anticorpo apartir de uma única estrutura de leitura aberta. Em tal mé-todo, uma seqüência codificadora de inteina é usada para se-parar os genes da cadeia pesada e da cadeia leve de anticor-po numa única estrutura de leitura aberta (sORF). Vantagensoferecidas por tal tecnologia de expressão de anticorpo sORFincluem a capacidade de manipular proporções de dosagem degene para cadeias pesada e leve, a proximidade dos polipep-tideos de cadeia pesada e leve para a montagem com múltiplassubunidades em ER, e o potencial para a secreção de proteínacom alta eficiência.
Outra tecnologia para expressar anticorpos mono-clonais em células de mamíferos envolve a introdução dos ge-nes da cadeia pesada e da leve em duas ORFs separadas, cadauma com seu próprio promotor e seqüências regulatórias. Ainterferência do promotor é uma preocupação associada comesse método. Um método alternativo para introduzir as se-qüências codificadoras de cadeia pesada e leve do anticorponas linhagens celulares de expressão é usar o sítio de en-trada ribossomal interno (IRES) para separar as seqüênciascodificadoras da cadeia pesada e leve do anticorpo. Esse mé-todo não tem sido amplamente usado devido à eficiência dimi-nuída na tradução da seqüência codificante à jusante da se-qüência IRES. Recentemente, um método que uma seqüência aqual codifica o peptídeo do vírus da febre aftosa (peptídeo2A) para separar as seqüências codificadoras para a cadeiapesada e leve de anticorpo foi descrito (Fang et.al. 2005.Nat. Biotechnol. 23(5): 584-90). Nesse método, a cadeia pe-sada e leve do anticorpo e o peptídeo 2A são transcritos co-mo um único RNAm. Entretanto, os polipeptideos de cadeia pe-sada e leve do anticorpo são clivados antes deles entraremno reticulo endoplasmático (ER). Além disso, dois aminoáci-dos naturais são deixados no C-terminal da cadeia pesada de-pois da clivagem/separação das cadeias leve e pesada. 0 sis-tema de expressão de inteina da presente invenção é funda-mentalmente diferente. Ele difere do método 2A pelo fato deque os polipeptideos de cadeia pesada e leve são traduzidose levados para dentro da ER como uma única poliproteina.Vantajosamente, não é necessário que aminoácidos não-naturais sejam incluídos nas moléculas de anticorpo maduras.
As seguintes descrições estão todas no contextodos vetores de produção de anticorpo compreendendo os casse-tes de expressão como se segue: Promotor - Sinal de Secreção- cadeia pesada - inteina wt tal como inteina Pol I de P.horikoshii - sinal de secreção - cadeia leve - poli A; Pro-motor - Sinal de Secreção - cadeia pesada - inteina modifi-cada tal como inteina Pol I de P. horikoshii - cadeia leve -poli A; Promotor - Sinal de Secreção - cadeia pesada - inte-ina modificada Pol tal como inteina Pol I de P. horikoshii -sinal de secreção - cadeia leve - inteina modificada Pol talcomo inteina Pol I de P. horikoshii - sinal de secreção -cadeia leve - poli A; Promotor - Sinal de Secreção - cadeiapesada - inteina wt ou modificada tal como inteina Pol I deP. horikoshii - sinal de secreção modificado - cadeia leve -poli A; Promotor - Sinal de Secreção - cadeia leve - inteinawt ou modificada tal como inteina Pol I de P. horikoshii -sinal de secreção modificado - cadeia pesada - poli A; Pro-motor - Sinal de Secreção - cadeia pesada - inteina wt oumodificada tal como inteina Pol I de P. horikoshii - sinalde secreção modificado - cadeia leve - inteina wt ou modifi-cada tal como inteina Pol I de P. horikoshii - sinal de se-creção modificado - cadeia leve - poli A; Promotor - Sinalde Secreção - cadeia pesada - sitio de clivagem de furina -inteina modificada tal como inteina Pol I de P. horikoshii -sitio de clivagem de furina - sinal de secreção - cadeia le-ve - poli A; e Promotor - cadeia pesada - sitio de clivagemde furina - inteina modificada tal como inteina Pol I de P.horikoshii - sitio de clivagem de furina - cadeia leve - si-tio de clivagem de furina - inteina modificada tal como in-teina Pol I de P. horikoshii - sitio de clivagem de furina -cadeia leve - poli A. Em outros constructos, uma inteina PolPsp-GBD modificada é usada.
A poliproteina especificamente exemplificada aquidescrita faz uso da inteina Pol I de P. horikoshii que foifundida com a estrutura com a cadeia pesada e com a cadeialeve de D2E7 antes e depois dela, respectivamente. O aminoá-cido que estava na posição -1 era uma lisina e o aminoácidoque estava na posição +1 era uma metionina, o primeiro ami-noácido do peptideo de sinal de cadeia leve. 0 uso da metio-nina na posição +1 permitiu a abolição da união, a junçãodas cadeias pesada e leve, conforme nós demonstramos nas úl-timas seções, com um entendimento de que um resíduo de ami-noácido nucleofílico tal como serina, cisteína ou treonina énecessário na posição +1 para permitir a união. Além das in-ternas wt, mutações que alteram o último aminoácido aspara-gina e a segunda para a última histidina podem ser usadasuma vez que essas mutações geralmente abolem a união e pre-servam a clivagem na junção de união N-terminal (Mills,2004; Xu, 1996, Chong, 1997). Alternativamente, mutações quealteram o Io aminoácido da inteina também podem ser usadas,uma vez que tais mutações geralmente eliminam a união, pre-servam a clivagem na junção de união C-terminal e ou abolemou conservam a clivagem atenuada na junção de união N-terminal (Nichols, 2004; Evans, 1999 e Xu, 1996) . Por exem-plo, essa foi demonstrada para "completamente bloquear a u-nião e inibir a formação do intermediário ramificado, resul-tando na clivagem em ambas as junções de união" (Xu, M.Q.,EMBO vol. 15: 5146-5153).
Numa versão alternativa do polipeptideo, a inclu-são do sitio de clivagem de furina permite a alteração daseqüência da junção com a subseqüente excisão através daclivagem da furina durante a secreção. A seqüência do tiposelvagem para a inteina é dada na Tabela 9. Na DNA polimera-se I de GB-D de Pyrococcus ssp., as junções de cliva-gem/união são RQRAIKILAN/S (SEQ ID NO: 138) (N terminal) eHN/SYYGYYGYAK (SEQ ID NO: 139) (C terminal). Desejavelmente,a região codificadora de endonuclease é cortada pela cliva-gem de HindIII. As funções de clivagem, união e endonucleasesão dissociadas umas das outras e essa região de endonuclea-se pode ser substituída com um pequeno ligante para criarmini-inteínas que ainda são capazes de clivar e unir (Telen-ti et al. 1997. J. Bacteriol. 179: 6378-6382). É notado quepelo menos uma inteína de levedura funciona em células demamíferos (Mootz et al. 2003. J. Am. Chem. Soe. 125: 10561-10569). Ver Tabelas 8A e 8B para as seqüências codificantese de aminoácidos de um constructo de inteína D2E7 (imunoglo-bulina). Tabela 8C proporciona a seqüência de nucleotídeocompleta de um vetor de expressão de constructo de inteínaD2E7. Uma construção de fusão é descrita que codifica a ca-deia pesada da D2E7 (Humira - marca registrada para adalimu-mab) fundida com a inteína Psp Pol 1 modificada a qual é elamesma fundida com a região codificadora para a cadeia levede D2E7. A seqüência da cadeia leve pode ser duplicada comuma inteína, peptídeo de sinal ou sítio(s) de clivagem deprotease separando ela do restante da poliproteína. Nessamodalidade, a cadeia pesada madura é precedida pelo sinal desecreção da cadeia pesada. A inteína foi alterada como des-crito acima, a serina 1 sendo alterada para uma treonina e ofragmento Hind III interno cortado para remover a atividadeda endonuclease. A inteína é fundida na estrutura na regiãode cadeia leve D2E7 madura. Uma modalidade alternativa pode-ria incluir o sinal 5' de secreção da cadeia leve da cadeialeve madura. Ver Figs. 10 e 11 para representação esquemáti-ca do constructo de inteína D2E7 e vetor de expressão e Ta-belas 8A-8C para as seqüências de nucleotídeo do constructode expressão e o vetor de expressão completo e a seqüênciade aminoácido do constructo de inteína D2E7.
Peptideos de sinal e peptidases de sinal
A hipótese do sinal, em que as proteínas contêminformação nas suas seqüências de aminoácidos para o alveja-mento de proteína para a membrana, tem sido conhecida pormais de trinta anos. Milstein e colaboradores descobriramque a cadeia leve da IgG de células de mieloma foi sinteti-zada numa forma de peso molecular mais alto e foi convertidapara sua forma madura quando vesículas do retículo endoplas-mático (microssomas) foram adicionados ao sistema de tradu-ção, e propôs um modelo baseado nesses resultados nos quaisos microssomas contêm uma protease que converte a forma daproteína precursora na forma madura pela remoção do peptídeode extensão aminoterminal. A hipótese de sinal foi logo ex-pandida para incluir seqüências de alvejamento distintas nasproteínas localizadas para diferentes membranas intracelula-res, tais como a mitocôndria e o cloroplasto. Essas seqüên-cias de alvejamento distintas foram depois descobertas comosendo clivadas da proteína exportada por peptidases de sinalespecíficas (SPases).
Existe pelo menos três SPases distintas envolvidasna clivagem de peptídeos de sinal em bactérias. SPase I podeprocessar substratos que não são de lipoproteína que são ex-portados pela via SecYEG ou a via de translocação da duplaarginina (Tat). Lipoproteinas que são exportadas pela viaSec são clivadas pela SPase II. Spase IV cliva prepilinas dotipo IV e proteínas tipo prepilina que são componentes doaparelho de secreção tipo II.
Em eucariotos, as proteínas que são alvejadas namembrana do retículo endoplasmático (ER) são mediadas porpeptídeos de sinal que alvejam a proteína ou co-traducionalmente ou pós-traducionalmente para a maquinariade translocação Sec61. Os peptideos de sinal ER têm caracte-rísticas similares com aquelas de suas contrapartes bacteri-anas. Os peptideos de sinal ER são clivados da proteína ex-portada depois de exportar no lúmen do ER pelo complexo pep-tidase de sinal (SPC). Os peptideos de sinal que classificamproteínas para diferentes locais na célula eucariótica têmque ser distintos porque essas células contêm muitos dife-rentes compartimentos membranosos e aquosos. Proteínas quesão alvejadas para o ER geralmente contêm seqüências de si-nal cliváveis. Surpreendentemente, muitos peptideos artifi-ciais podem funcionar como sinais de translocação. Acredita-se que a característica chave mais importante seja a hidro-fobicidade acima de certo limiar. Os peptideos de sinal ERtêm um conteúdo mais elevado de resíduos de leucina que ospeptideos de sinal bacterianos. A partícula de reconhecimen-to de sinal (SRP) se liga aos peptideos de sinal cliváveisdepois de eles emergirem do ribossomo. A SRP é requerida pa-ra alvejar a proteína nascente para a membrana ER. Depois datranslocação da proteína para o lúmen do ER, a proteína ex-portada é processada pelo SPC. Outra modalidade toma vanta-gem das enzimas processadoras de peptídeo de sinal (líder)as quais ocorrem naturalmente em células eucarióticas. Emeucariotos, as proteínas que são alvejadas para a membranado retículo endoplasmático (ER) são mediadas por peptideosde sinal que alvejam a proteína ou co-traducionalmente oupós-traducionalmente para a maquinaria de translocaçãoSecôl. Os peptideos de sinal do ER são clivados a partir daproteína exportada depois de exportar para o lúmen do ER pe-lo complexo de peptidase de sinal (SPC). A maioria dos pep-tídeos de sinal do ER conhecidos são ou N-terminalmente cli-váveis ou internamente não-cliváveis. Recentemente, uma va-riedade de poliproteínas virais, tais como aquelas encontra-das no vírus da hepatite C, hantavírus, flavivírus, vírus darubéola e vírus de influenza C foram descobertas por conterpeptídeos de sinal internos que são mais provavelmente cli-vados pelo SPC do ER. Esses estudos na maturação das poli-proteínas virais mostram que o SPC pode clivar não somenteos peptídeos de sinal aminoterminalmente localizados, mastambém depois dos peptídeos de sinal internos.
A peptidase do peptídeo de sinal (SPP) da proteaseaspártica tipo presenilina cliva os peptídeos de sinal nassuas regiões de transmembrana. SPP é essencial para a gera-ção de epítopos HLA-E derivados de peptídeo de sinal em hu-manos. Recentemente, uma variedade de poliproteínas virais,tais como aquelas encontradas no vírus da hepatite C, hanta-vírus, flavivírus, vírus da rubéola e vírus influenza C fo-ram descobertas por conter peptídeos de sinal internos quesão mais provavelmente clivados pelo SPC do ER. A mutagênesedos elementos de especificidade do substrato da peptidase desinal prevista pode, dessa forma, bloquear a infectividadeviral. Esses estudos na maturação das poliproteínas são tam-bém muito interessantes porque eles mostram que o SPC podeclivar não somente peptídeos de sinal localizados aminoter-minalmente, mas também depois dos peptídeos de sinal inter-nos. Peptidases de sinal são bem conhecidas na técnica. Ver,por exemplo, Paetzel Μ. 2002. Chem. Rev. 102(12): 4549; Pe-kosz A. 1998. Proc. Natl. Acad. Sei. USA. 95: 13233-13238;Marius K. 2002. Molecular Cell 10: 735- 744; Okamoto K.2004. J. Virol. 78: 6370-6380, Vol. 78; Martoglio B. 2003.Human Molecular Genetics 12: R201 -R206; e Xia W. 2003. J.Cell Sei. 116: 2839-2844.
Proteínas que são alvejadas para a membrana do re-ticulo endoplasmático (ER) são mediadas por peptídeos de si-nal que alvejam a proteína ou co-traducionalmente ou pós-traducionalmente para a maquinaria de translocação Sec61. Ospeptídeos de sinal do ER são clivados a partir da proteínaexportada depois de exportar para dentro do lúmen do ER pelocomplexo de peptidase de sinal (SPC). A maioria dos peptí-deos de sinal do ER são ou N-terminalmente cliváveis ou in-ternamente não-cliváveis. Recentemente, uma variedade de po-liproteínas virais, tais como aquelas encontradas no vírusda hepatite C, hantavírus, flavivírus, vírus da rubéola evírus de influenza C foram descobertas por conter peptídeosde sinal internos que são mais provavelmente clivados peloSPC do ER. Esses estudos na maturação de poliproteínas vi-rais mostram que o SPC pode clivar não somente peptídeos desinal localizados aminoterminalmente, mas também depois dospeptídeos de sinal internos.
Essa invenção utiliza peptídeos de sinal cliváveisinternos para expressão de um polipeptídeo. num transcritoindividual. 0 polipeptídeo transcrito individual é, a se-guir, clivado pelo SPC, deixando peptídeos individuais sepa-radamente ou peptídeos individuais estando montados numaproteína. Os métodos da presente invenção são aplicáveis àexpressão de cadeia pesada e de cadeia leve de imunoglobuli-na num único polipeptídeo transcrito, seguido por clivagem,a seguir montado numa imunoglobulina madura. Essa tecnologiaé aplicável a citocinas de polipeptídeo, fatores de cresci-mento ou a uma variedade de outras proteínas, por exemplo,IL-12p40 e IL-12p35 num único polipeptídeo transcrito e, aseguir, montagem na IL-12 ou IL-12p40 e IL-23pl9 num únicopolipeptídeo transcrito e, a seguir, montagem na IL-23.
A abordagem da peptidase de sinal é aplicável avetores de expressão de mamíferos a qual resulta na expres-são do anticorpo funcional ou outro produto processado apartir de um precursor ou poliproteína. No caso do anticor-po, ele é produzido a partir do vetor como uma poliproteínacontendo ambas as cadeias pesada e leve, com uma seqüênciaintereveniente entre a cadeia pesada e a cadeia leve sendoum peptídeo de sinal clivável interno. Esse peptídeo de si-nal clivável interno pode ser clivado pelas proteases resi-dindo no ER, principalmente pelas peptidases de sinal, pro-teases de presenilina ou tipo presenilina, deixando cadeiaspesadas e leves para se dobrar e montar para produzir umamolécula funcional, e desejavelmente ela é secretada. Alémdo peptídeo de sinal clivável interno derivado do vírus dahepatite C, outras seqüências cliváveis internas as quaispodem ser clivadas por proteases residindo em ER podem sersubstituídas daí. Semelhantemente, a prática da invenção nãoprecisa estar limitada às células hospedeiras nas quais apeptidase de sinal efetua a clivagem, mas ela também incluiproteases incluindo, mas sem se limitar, a presenilina, pro-tease tipo presenilina e outras proteases para o processa-mento de polipeptideos. Aquelas proteases foram revisadasnos artigos citados, dentre outros.
Além disso, a presente invenção não está limitadaà expressão de cadeias pesada e leve de imunoglobulina, masela também inclui outros polipeptideos e poliproteinas ex-pressos em transcritos individuais seguido pela clivagem dopeptideo de sinal interno para liberar cada peptideo ou pro-teina individual. Essas proteínas podem ou não se montarjuntas na proteína madura.
Também dentro do escopo da presente invenção estãoos constructos de expressão nos quais os polipeptideos indi-viduais estão presentes em ordens alternadas, isto é, "pep-tídeo 1 - peptideo de sinal clivável interno - peptideo 2"ou "peptideo 2 - peptideo de sinal clivável interno - pepti-deo 1". Essa invenção ainda inclui a expressão de mais dedois peptideos ligados por peptídeos de sinal cliváveis in-ternos, tais como "peptideo 1 - peptideo de sinal clivávelinterno - peptideo 2 - peptideo de sinal clivável interno -peptideo 3" e assim por diante.
Além disso, a invenção se aplica à expressão dasproteínas de transmembrana tanto do tipo I quanto do tipo IIe à adição de outros sítios de clivagem da protease ao redordos constructos de expressão. Um exemplo é adicionar uma fu-rina ou sítio de clivagem PC5/6 depois de uma cadeia pesadade imunoglobulina pára facilitar a retirada por clivagem deresíduos de aminoácidos adicionais no carbóxi-terminal dopeptídeo de cadeia pesada, por exemplo, "cadeia pesada - si-tio de clivagem de furina - peptideo de sinal clivável in-terno - cadeia leve". A presente invenção também inclui maisde um peptideo de sinal clivável interno separadamente ou emtandem, por exemplo, "cadeia pesada - sitio de clivagem defurina - peptideo de sinal clivável interno - peptideo desinal clivável interno - cadeia leve". Ainda, essa invençãoinclui situações onde existe manutenção ou remoção de peptí-deos de auto-sinalização de cadeia pesada e de cadeia leve,tais como "peptideo de sinal HC - cadeia pesada - sitio declivagem de furina - peptideo de sinal clivável interno -peptideo de sinal LC - cadeia leve".
As seguintes descrições estão no contexto de anti-corpo-vetores de produção, algumas das quais são descritasaqui em outros lugares. Projetos de vetor incluem, mas nãoestão limitados, aos seguintes.
Tabela de projetos de vetores.
<table>table see original document page 110</column></row><table><table>table see original document page 111</column></row><table>
Um exemplo especifico de um constructo de fusãocodifica a cadeia pesada de D2E7 (Humira/adalimumab) fundidacom o peptideo de sinal clivável interno o qual é ele mesmofundido com a região codificadora para a cadeia leve deD2E7. Nessa modalidade, a cadeia pesada madura é precedidapelo sinal de secreção de cadeia pesada. A seqüência de pep-tideo de sinal clivável interna é derivada do virus influen-za C. Um sitio de clivagem de furina é incluído no terminalcarboxil da cadeia pesada. Para minimizar o efeito no anti-corpo maduro, do terceiro até o último resíduo amino da ca-deia pesada é modificado de prolina até arginina para criarum sítio de clivagem de furina. Uma modalidade alternativapoderia incluir o sinal 5' de secreção de cadeia leve da ca-deia leve madura. Ver Tabelas 9A - 9C-. A seqüência de peptí-deo de sinal clivável interna mínima do vírus influenza C(MGRMAMKWLVVIICFSITSQPASA, SEQ ID NO: 11) é usada no exem-plo. Uma seqüência mais longa também pode ser usada para au-mentar a eficiência da clivagem. Ver número de acesso Gen-Bank AB126196. Uma variedade de seqüências de nucleotídeoscodificando a mesma seqüência de aminoácidos também pode serusada.Essa invenção pode ainda utilizar peptideos de si-nal cliváveis internos para a maturação de um ou mais poli-peptideos numa poliproteina codificada num único transcrito.O polipeptideo transcrito individual é, então, clivado peloSPC, deixando peptideos individuais separadamente ou pepti-deos individuais sendo montados numa proteína. Essa invençãoé aplicável pra expressar a cadeia pesada e a cadeia leve deimunoglobulina num polipeptideo transcrito individual e, aseguir, a montagem numa imunoglobulina madura. Essa invençãoé aplicável para expressar citocinas de polipeptideo, fato-res de crescimento ou uma variedade de outras proteínas, porexemplo, para expressar a IL^12p40 e a IL-12p35 num únicopolipeptideo transcrito e, a seguir, a montagem na IL-12, ouIL-12p40 e IL-23pl9 num único polipeptideo transcrito e, aseguir, montagem na IL-23.
A subclonagem posicionai de uma seqüência 2A ououtra protease ou sítio de clivagem (reconhecimento) de pep-tidase de sinal entre duas ou mais seqüências de DNA heteró-logas para o constructo do vetor inventivo permite a distri-buição e a expressão de dois ou mais genes através de um ú-nico vetor de expressão. Preferivelmente, sítios de clivagemautoprocessadores, tais como seqüências 2A de FMDV ou se-qüências de reconhecimento de protease proporcionam uma for-ma única de expressão e distribuição de um único vetor vi-ral, duas ou múltiplas proteínas, polipeptídeos ou peptideosos quais podem ser partes individuais de, por exemplo, umanticorpo, receptor heterodimérico ou proteína heterodimérica.2Α de FMDV é uma região de poliproteina a qualfunciona no genoma FMDV para direcionar uma única clivagemem seu próprio C-terminal, funcionando dessa forma em eis. 0domínio 2Δ de FMDV é tipicamente reportado como sendo decerca de dezenove aminoácidos de comprimento(LLNFDLLKLAGDVESNPGP, SEQ ID NO: 12; TLNFDLLKLAGDVESNPGP,SEQ ID NO: 13; Ryan et al. 1991. J. Gen. Virol. 72: 2727-2732), entretanto oligopeptídeos de tão poucos quanto cator-ze resíduos de aminoácidos (LLKLAGDVESNPGP, SEQ ID NO: 14)têm demonstrado mediar a clivagem no C-terminal de 2A de umaforma similar ao seu papel no processamento de poliproteinade FMDV natural.
Variações da seqüência 2A têm sido estudadas quan-to à sua capacidade de mediar o processamento eficiente daspoliproteínas (Donnelly et al. 2001). Homólogos e variantesda seqüência 2A estão incluídos dentro do escopo da invençãoe incluem, mas não estão limitados, às seguintes seqüências:
QLLNFDLLKLAGDVESNPGP, SEQ ID NO: 15; NFDLLKLAGDVESNPGPFF,SEQ ID NO: 16; LLKLAGDVESNPGP, SEQ ID NO: 17;NFDLLKLAGDVESNPGP, SEQ ID NO: 18; APVKQTLNFDLLKLAGDVESNPGP,SEQ ID NO: 19;
VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQ ID NO: 20; LLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP, SEQID NO: 141 ; e EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP, SEQ IDNO:142.
Seqüências 2A e suas variantes podem ser usadaspara fazer vetores expressando poliproteínas autoprocessado-ras, incluindo qualquer vetor (baseado em plasmídeo ou emvírus) o qual inclui as seqüências codificantes para proteí-nas ou polipeptídeos ligados através de sítios de clivagemautoprocessadores ou outros sítios de clivagem de proteasede forma que as proteínas individuais são expressas nas pro-porções e/ou quantidades molares apropriadas que seguem aclivagem da poliproteína devido à presença do sítio autopro-cessador ou outro de clivagem. Essas proteínas podem ser he-terólogas para o vetor em si, umas com as outras ou para osítio de clivagem autoprocessador, por exemplo, FMDV, dessaforma os sítios de clivagem autoprocessadores para uso naprática da invenção não discriminam entre proteínas heteró-logas e seqüências codificantes derivadas da mesma fonte queo sítio de clivagem autoprocessador, na capacidade de fun-cionar ou mediar a clivagem.
Numa modalidade, a seqüência 2A de FMDV incluídano vetor de acordo com a invenção codifica resíduos de ami-noácidos compreendendo (LLNFDLLKLAGDVESNPGP, SEQ ID NO: 12) .
Alternativamente, um vetor de acordo com a invenção pode co-dificar resíduos de aminoácidos para outras regiões tipo 2Aconforme discutido em Donnelly et al. 2001. J. Gen. Virol.82: 1027-1041 e incluindo, porém sem se limitar, a um domí-nio tipo 2A de picornavírus, vírus de inseto, rotavírus tipoC, seqüências repetidas de tripanossoma ou a bactéria,Thermatoga marítima.
A invenção contempla o uso de variantes de seqüên-cia de ácido nucléico que codificam a seqüência de peptídeo2A ou tipo 2A, tal como uma seqüência que codifica ácido nu-cléico para um polipeptídeo de 2A ou tipo 2A, a qual tem umcódon diferente de um ou mais dos aminoácidos em relação à-queles do nucleotideo de origem. Tais variantes são especi-ficamente contempladas e englobadas pela presente invenção.
Variantes de seqüência de peptideos e polipeptideos 2A estãoincluídas no escopo da invenção da mesma forma. Semelhante-mente, proteases fornecidas em eis ou em trans podem mediaro processamento proteolítico através de sítios de reconheci-mento (clivagem) de protease cognata entre as regiões da po-liproteína.
Em outros experimentos com constructos de expres-são inteína-anticorpo, nós demonstramos que a reação de uni-ão da proteína mediada por inteína Pol I de Pyrococcushorikoshii pode ocorrer em células de mamíferos (293E), noER, e no contexto de seqüências de aminoácidos de cadeia pe-sada e leve de um anticorpo (D2E7). Para o propósito do usodesse tipo de reação na expressão de um anticorpo num forma-to de estrutura de leitura aberta individual (sORF), nós de-monstramos que essa reação pode ocorrer em células de mamí-feros (293E), no ER e no contexto de seqüências de aminoáci-dos de cadeia pesada de anticorpo e leve de anticorpo usandodois constructos, pTT3-HcintLClaa-p.hori e pTT3-HcintLC3aa-p.hori. Ver Tabelas IlA e 12A.
Esses constructos foram feitos na estrutura do ve-tor PTT3. Esse vetor tem uma origem de replicação de vírusEpstein Barr (EBV), a qual permite a sua amplificação epis-somal em células 293E transfectadas (células que expressam oantígeno 1 nuclear do vírus Epstein-Barr) em cultura de sus-pensão (Durocher, 2002, "High levei and high-throughput re-combinant protein production by transient transfection ofsuspension-growing human 293-EBNA1 cells, Nucleic Acids Re-search 30(2) : E9) . Cada vetor tinha um ORF, expressa trans-cricionalmente sob o controle regulatório de um promotor deCMV. No ORF, uma inteina Poll de P. horikoshii foi inseridana estrutura entre as cadeias pesada e leve de D2E7, cadauma tendo um peptideo de sinal (SP) . Os constructos pTT3-HcintLClaa-p.hori e pTT3- HcintLC3aa-p.hori tinham 1 aminoá-cido de exteina natural, ou 3 aminoácidos de exteina natu-rais em cada lado da inteina, separando as seqüências de ca-deia pesada e leve do anticorpo D2E7 da seqüência de intei-na. Esses constructos foram introduzidos nas células 293Eatravés da transfecção transiente. Tanto o sobrenadante dacultura quanto as amostras de péletes celulares foram anali-sados.
Amostras de pélete de célula foram lisadas sobcondições que permitem a separação das frações de membranacitosólica e intracelular. TVmbas essas frações foram anali-sadas usando western blots (WB) ou com o anticorpo de cadeialeve anti-capa ou de cadeia anti-pesada. Nesses blots nósvimos a expressão de 4 espécies de proteína correspondendo auma forma tripartite como no ORF do constructo (130 KDa),uma fusão de H e L, a qual foi derivada de um evento de uni-ão (80 KDa), uma cadeia pesada de anticorpo (50 KDa) e umacadeia leve de anticorpo (25 KDa) . As primeiras 2 espéciesde proteína foram detectadas tanto pelos anticorpos de ca-deia anti-leve quanto de cadeia anti-pesada, a cadeia pesadafoi detectada somente pelo anticorpo de cadeia anti-pesada,e a cadeia leve foi detectada somente pelo anticorpo de ca-deia anti-leve. A presença das espécies de proteína de 80KDa, a qual foi detectada tanto pelos anticorpos de cadeialeve quanto de cadeia pesada em ambos esses constructos, de-monstrou que um evento de união de proteína tinha ocorrido.
Além disso, todas as quatro espécies de proteína foram pre-dominantemente presentes na fração de membrana subcelular, aqual continha retículo endoplasmático (ER). Isso indicou queo peptídeo de sinal de cadeia pesada (codificado no iníciodo ORF) tinha direcionado o polipeptídeo inteiro no ER, ondea reação de união tinha ocorrido. Sem desejar estar ligadopor qualquer teoria particular, acredita-se que os polipep-tídeos de cadeia leve e pesada livres foram prováveis a se-rem os resultados das clivagens nas junções de união N-terminal e C-terminal, resultando da união incompleta.
Amostras de pélete celular também foram usadas pa-ra a extração de RNA total e análise de Northern blot usandotanto uma sonda de cadeia pesada de anticorpo quanto umasonda de cadeia leve de anticorpo. Análise de Northern blotrevelou um RNAm tripartite (3,4 Kb) nesses constructos desORF, o qual foi hibridizado tanto com a sonda de cadeia pe-sada quanto com a sonda de cadeia leve, mas não o RNAm parauma cadeia pesada ou uma cadeia leve separada. Ao contrário,nas amostras de pélete celular que expressaram o anticorpoD2E7 usando a tentativa convencional, isto é, introdução dascadeias pesada e leve no anticorpo a partir de duas ORFs se-paradas carregadas em dois vetores pTT3, RNAms para a cadeiapesada (1,4 Kb) e L (0,7 Kb) foram detectados usando as son-das de cadeia pesada ou de cadeia leve, respectivamente. Ne-nhum RNAm tripartite foi detectado nesses péletes de célulasde controle.
Os dados acima descritos demonstram que o uso deconstructos contendo um ORF individual (cadeia pesada deD2E7 - inteina de P. horikoshi - cadeia leve de D2E7), umúnico RNAm contendo todas as 3 proteínas foi transcrito. Es-sa mensagem tripartite foi traduzida num polipeptídeo tri-partite e importada de forma co-traducional no ER, direcio-nada pelo peptídeo de sinal de cadeia pesada presente no N-terminal da poliproteína tripartite. Com esse constructo, areação de união de proteína mediada por inteina ocorreu den-tro do ER. Isso sugeriu que reações mediadas por inteina po-deriam ser usadas na expressão de anticorpos, assim como deoutras proteínas secretadas com múltiplas subunidades, istoé, aquelas proteínas que precisam passar através da via se-cretória para serem dobradas e propriamente modificadas pós-traducionalmente.
Sobrenadantes de cultura também foram analisados.Tanto Western Blot quanto ELISA permitem a detecção de anti-corpo secretado da expressão do constructo pTT3-HcintLClaa-p.hori. Esses estudos são discutidos em maiores detalhes a-qui abaixo; a quantidade de expressão de anticorpo secretadoaumentou através tanto dos pontos de mutação quanto da muta-ção na seqüência codificando o peptídeo de sinal de cadeialeve.
Mutações designadas para inibir a ligação mediadapor inteina, porém preservar as reações de clivagem em qual-quer uma das junções de união N-terminal ou C-terminal, re-sultou em níveis aumentados de secreção de anticorpo.
Com a meta de eficiência e secreção de anticorpoaumentada, três tipos de mutações pontuais foram designadase testadas. 0 primeiro tipo de mutação estava no códon doprimeiro resíduo de serina da exteína C-terminal; essesconstructos tinham alterações de Ser para Met (S>M) (cons-tructo pTT3-HcintLC-p.hori, constructo E e constructo A). 0segundo tipo de mutação foi na codificação para o primeiroresíduo de serina da inteína; tal constructo tinha uma alte-ração Ser para Thr (S>T) (constructo E). O terceiro tipo demutação estava no códon para o resíduo de histidina que foio segundo para o último (penúltimo) aminoácido da inteína;esses constructos tinham uma mutação de substituição de Hispara Ala (H>A) (constructo A e constructo B). Essas mutaçõesforam introduzidas ou sozinhas ou em combinação. Todos osconstructos mutantes foram designados para preservar a cli-vagem nas junções de união ou N- ou C-terminais e para redu-zir a união das exteínas liberadas, ou ambos, de acordo commecanismos reacionais descritos na literatura. Conforme es-boçado abaixo, a secreção do anticorpo D2E7 é alcançada u-sando uma variedade desses constructos.
Num experimento, esses constructos foram introdu-zidos em células 299E através de transfecção transiente, edepois de 7 dias, os sobrenadantes cultivados foram analisa-dos para títulos de anticorpo IgG por análise de ELISA. Ostítulos de anticorpo para os constructos pTT3-HcintLC3aa-p.hori, pTT3-HcintLClaa-p.hori, pTT3-HcintLC-p.hori, Ε, A eB foram 17, 0 + 0,6, 113, 8 + 2,6, 225, 8 + 10, 0, 9,3 + 0, 5,161,7 + 4,4, e 48,2 + 1,0 ng/ml (média + desv. pad. ) , res-pectivamente .
Essas amostras de sobrenadante também foram anali-sadas em gel SDS-PAGE sob condições de desnaturação, e cora-das com um anticorpo contra a cadeia pesada de IgG humana eum anticorpo contra a cadeia leve capa humana. Nesses wes-tern blots a cadeia pesada de anticorpo 50 KDa) e a ca-deia leve de anticorpo 25 KDa) são claramente visíveisnos sobrenadantes gerados a partir dos constructos pTT3-HcintLC-p.hori e A, consistente com a ordem de classificaçãodos níveis de IgG medidos por ELISA.
Amostras de pélete celular dessas transfecções fo-ram também caracterizadas usando análise de western blot. Umpolipeptídeo tripartite 130 KDa) juntamente com as bandasde cadeia pesada 50 KDa) e de cadeia leve 25 KDa) doanticorpo são vistas nos péletes celulares contendo todos osconstructos acima descritos. Dentre esses os constructospTT3-HcintLC-p.hori e o constructo A produziram as bandas decadeia pesada e de cadeia leve mais fortes; conseqüentemen-te, foi concluído que houve uma correlação entre o nível decadeias pesada e leve intracelulares livres e os anticorposmontados e secretados. O produto unido 80 KDa), que é afusão entre a cadeia pesada e a cadeia leve do anticorpo,estava presente nos péletes celulares gerados usando o cons-tructo pTT3-HcintLC3aa-p.hori e, numa extensão menor, nospéletes celulares gerados a partir do constructo pTT3-HcintLClaa-p.hori; ele estava ausente no constructo pTT3-HcintLC-p.hori e nos constructos A, BeE. Isso indicou queo nivel de união de proteína foi inversamente correlacionadocom a eficiência de secreção de anticorpo, consistente com aexpectativa de que a junção das cadeias pesada e leve do an-ticorpo poderia resultar no mau dobramento, baseando-se noconhecimento geral acerca da estrutura do anticorpo, e essemau dobramento poderia conseqüentemente prevenir a secreçãodevido aos mecanismos celulares para a degradação de proteí-nas mal dobradas. Outra espécie de proteína nesses "blots"foi a fusão de inteína-cadeia leve (80 KDa, reconhecido peloanticorpo de cadeia leve mas não pelo anticorpo de cadeiapesada), a qual resultou de uma clivagem na junção de uniãoN-terminal na ausência de quaisquer clivagens adicionais.
Essa banda estava presente nos constructos A, Β, E, pTT3-HcintLC3aa-p.hori, .pTT3-HcintLClaa-p.hori e na maior parteausente nos constructos pTT3-HcintLC-p.hori e H, aqui des-critos. Dessa forma, a presença dessa espécie de proteínatambém foi inversamente relacionada com a quantidade, de se-creção de anticorpo. Finalmente, uma banda de inteína tambémfoi detectada nesses lisatos celulares usando antissoro po-liclonal de coelho gerado contra um peptídeo de P.horikoshii, conjugado ao KLH.
Nós demonstramos que o anticorpo D2E7 secretadousando o constructo de sORF pTT3-HcintLC-p.hori tinha ascorretas seqüências N-terminais das cadeias pesada e leve,os corretos pesos moleculares da cadeia pesada e leve e ospesos moleculares intactos.
0 anticorpo D2E7 secretado usando um do constructosORF pTT3-HcintLC-p.hori foi purificado por cromatografia deafinidade de Proteína A e analisado em relação às seqüênciasN-terminais de ambas as suas cadeias pesadas e cadeias le-ves . Os resultados claros indicaram que a seqüência de pep-tídeo N-terminal da cadeia pesada foi a EVQLVESGGG (SEQ IDNO: 21) e a seqüência N-terminal da cadeia leve foiDIQMTQSPSS (SEQ ID NO: 22) . Dessa forma, usando esse cons-tructo, os sítios de clivagem usados pela peptidase de sinalDIQMTQSPSS foram os mesmos que aqueles utilizados na aborda-gem de duas ORF/dois vetores convencional para a expressãodo anticorpo DE27.
Esses dados forneceram importantes discernimentoscientíficos para o projeto da próxima geração de construc-tos: a peptidase do ER de mamífero poderia reconhecer e cli-var precisamente um peptídeo de sinal numa poliproteína re-centemente sintetizada, embora houvesse alguns requerimentosaparentes para a sua apresentação (ver aqui abaixo).
Esse anticorpo purificado foi analisado por espec-trometria de massa, juntamente com o D2E7 produzido peloprocesso de produção convencional. Sob condições de desnatu-ração, a cadeia leve D2E7 produzida a partir do constructopTT3-HcintLC-p.hori produziu um único pico no espectro demassa e seu peso molecular (PM) foi 23408,8, enquanto que opeso molecular (PM) da cadeia leve de D2E7 produzida a par-tir do processo de produção padrão foi de 23409,7, em íntimaconcordância. Também sob condições de desnaturação, a cadeiapesada D2E7 produzida a partir do constructo pTT3-HcintLC-p.hori produziu um pico principal e 2 picos menores no es-pectro de massa e seus pesos moleculares (PM) foram de50640,6, 50768,2 e 50802,4, respectivamente, onde - conformeos pesos moleculares (PM) da cadeia pesada D2E7 produzida apartir de processos de produção padrões foram 50641,7,50768,6 e 50804,1, respectivamente, novamente em estreitaconcordância. Os 3 picos correspondem às variações padrõesda cadeia pesada de D2E7.
Os pesos moleculares intactos (PM) sob condiçõesnaturais para esse anticorpo D2E7 produzido a partir doconstructo pTT3-HcintLC-p.hori, juntamente com o anticorpoD2E7 produzido a partir do processo de produção, também fo-ram determinados usando espectrometria de massa. 0 anticorpoD2E7 produzido a partir do constructo pTT3-HcintLC-p.horiteve 3 picos, com PM de 148097,6, 148246,9 e 148413,1, res-pectivamente; o anticorpo D2E7 produzido a partir do proces-so de produção também teve 3 picos, com PM de 148096, 0,148252,3 e 148412,8, respectivamente.
Esses dados demonstraram claramente que o anticor-po D2E7 produzido a partir do constructo pTT3-HcintLC-p.horifoi idêntico em tamanho com o anticorpo D2E7 produzido apartir do processo de produção convencional, tanto sob ascondições de desnaturação quanto as condições naturais. Acapacidade de produzir anticorpos com seqüências de aminoá-cidos completamente autênticas em comparação com o método deprodução convencional é uma das vantagens do sistema de ex-pressão de anticorpo da presente invenção. Usando o sistema2A conforme descrito por Fang et.al. em Nature Biotechno-logy, 2005, por exemplo, o anticorpo produzido tinha 2 ami-noácidos extras não-naturais extras no C-terminal de sua ca-deia pesada, e isso poderia não ser evitado devido à nature-za da clivagem.
Nós também demonstramos que o anticorpo D2E7 pro-duzido usando o constructo de sORF pTT3-HcintLC-p.hori tinhaa mesma afinidade para ligação ao TNF como o anticorpo D2E7produzido a partir do processo de produção. Interações deligação em tempo real entre os antagonistas de rhTNFa captu-rados através de um circuito integrado de biossensor atravésde uma IgG anti-humana de cabra imobilizada, e rhTNFa forammedidas usando um instrumento Biacore 3000 (Pharmacia LKBBiotechnology, Uppsala, Suécia) de acordo com as instruçõesdo fabricante e procedimentos padrões. Resumidamente, alí-quotas de rhTNFa foram diluídas num tampão HBS-EP (Biacore),e alíquotas de 150 μΐϋ foram injetadas através das matrizesde proteína imobilizadas numa taxa de fluxo de 25 mL/min. Aconcentração equivalente do analito foi simultaneamente in-jetada numa superfície de referência não-tratada para servircomo sensogramas de branco para subtração do fundo do índicede refração da massa. A superfície do circuito integrado dosensor foi gerada entre os ciclos com duas injeções de 5 minde glicina 10 mM, a 25 mL/min. Os sensogramas de ligação ex-perimentais resultantes foram, a seguir, avaliados usando oprograma de computador de avaliação BIA 4.0.1 para determi-nar os parâmetros da taxa cinética. Grupos de dados para ca-da antagonista foram ajustados no modelo de Langmuir 1:1.
Para esses estudos, os dados de ligação e de dissociação fo-ram analisados sob o protocolo de análise de ajuste globalenquanto selecionando o ajuste localmente para a máxima ca-pacidade de ligação do analito (RU) ou atributo Rmax. Nessecaso, o programa de computador calculou uma constante dedissociação individual (kd), uma constante de associação(ka) e uma constante de afinidade (Kd) . A constante de dis-sociação de equilíbrio é Kd = kd/ka. A cinética no índice(on-rate) a cinética fora do índice (off-rate) e as afinida-des globais foram determinadas pelo uso de diferentes con-centrações de TNFa na faixa de 1 - 100 nM. A cinética no ín-dice, a cinética fora do índice e a afinidade global para oanticorpo D2E7 produzido a partir do constructo pTT3-HcintLC-p. hori foram 1,61 E + 6 (M_1s_1) , 5,69 E-5 (s"1) e 3,54E-Il (M), respectivamente; a cinética no índice, a cinéticafora do índice e a afinidade global para o anticorpo D2E7produzido a partir do processo de produção foram de 1,73 E+6(M-1S"1), 6,72 E-5 (s_1) e 3,89 E-Il (M), respectivamente. A-nálise de Biacore indicou que o anticorpo D2E7 produzido u-sando esse constructo sORF. tinha afinidade similar ao TRFDcomo o anticorpo D2E7 produzido pelo processo de produçãoconvencional.
Modificação do peptídeo de sinal
Nós demonstramos que no projeto de constructosORF, cadeia pesada - int - cadeia leve, o nível de secreçãodo anticorpo foi aumentado em cerca de 10 vezes quando a hi-drofobicidade da seqüência de peptídeo de sinal da cadeialeve foi reduzida através da mutagênese direcionada a sítio.
Nós projetamos o constructo H, no qual após o aseqüência de inteína de P. horikoshi, a seqüência de peptí-deo de sinal da cadeia leve foi alterada de"MDMRVPAQLLGLLLLWFPGSRC" (SEQ ID NO: 23) para "MDMRVPAQLLGDE WFPGSRC" (SEQ ID NO: 24) . No mesmo tipo de experimento detransfecção, conforme descrito acima, o sobrenadante das cé-lulas as quais exprimiram esse constructo continham 2047 +116 ng/mL de anticorpo conforme medido por análise de ELISA.Esse nivel de secreção de anticorpo é semelhante àquele des-crito usando a tecnologia 2A (1,6 μg/mL). Análise de Westernblot desse sobrenadante mostrou fortes bandas correspondendoà cadeia pesada do anticorpo e à cadeia leve do anticorpo.
Num experimento de controle, essa mesma mutação depeptideo de sinal de cadeia leve foi introduzida num vetorpara a expressão desse anticorpo usando a abordagem conven-cional (expressando as cadeias pesada e leve do anticorpo apartir de duas estruturas de leitura abertas separadas emdois vetores separados). Nesse constructo, a alteração naSEQ ID NO: 23 para proporcionar a SEQ ID NO: 24 aboliu a se-creção de anticorpo conforme esperado porque a região hidro-fóbica é importante para o alvejamento para o complexo departícula de reconhecimento de sinal (SRP) no ER e para odirecionamento da entrada no translocon, no projeto do cons-tructo convencional. Isso verificou que no projeto do cons-tructo sORF, a função de alvejamento do peptideo de sinal decadeia leve é dispensável, embora ele possa ser reconhecidoe clivado pela peptidase de sinal do ER, consistente com ahipótese de que o ORF inteiro entrou no ER conforme direcio-nado pelo peptideo de sinal da cadeia pesada no início doORF.O anticorpo D2E7 secretado usando constructo desORF H foi purificado por cromatografia de afinidade da pro-teína A e analisado em relação à seqüência N-terminal de suacadeia leve. Ά seqüência de peptídeo N-terminal da cadeialeve foi MDMRVPAQLL (SEQ ID NO: 26) (sem ambigüidade), aqual representou o peptídeo de sinal não-clivado. Embora aliteratura sugira que a região H de um peptídeo de sinal ERde mamífero funcione primariamente no alvejamento do comple-xo (SRP) e no direcionamento da translocação através dotranslocon, nossos dados sugeriram que a região hidrofóbica(H) do peptídeo de sinal também desempenha um papel no reco-nhecimento e clivagem pela peptidase de sinal.
Nós demonstramos que anticorpos D2E7 secretadosusando tanto o constructo pTT3-HcintLC-p.hori quanto o cons-tructo H foram biologicamente ativos em ensaios baseados emcélulas. O anticorpo D2E7 produzido usando o constructopTT3-HcintLC-p.hori e o constructo H foram purificados etestados quanto às suas capacidades de neutralizar a citoto-xicidade induzida por TNFa em células L929. Esse ensaio foiexecutado essencialmente conforme descrito na US 6090382(ver Exemplo 4 ali). O TNFa recombinante humano causa cito-toxicidade em células L929 de murino e foi usado nesse en-saio. Como a D2E7, um anticorpo anti-TNFa pode neutralizaressa citotoxicidade, o ensaio L929 é um dos ensaios baseadosem célula que pode ser usado para avaliar a atividade bioló-gica de uma preparação de anticorpo D2E7 particular. Quandoanalisado usando esse ensaio, D2E7 produzido a partir tantodo constructo pTT3-HcintLC-p.hori quanto do constructo Hneutralizou a citotoxicidade induzida por TNFa. Seus valo-res de IC50 foram similares àqueles por D2E7 produzidos apartir de processos de produção padrões.
Nós investigamos constructos adicionais com dife-rentes projetos na área de peptideo de sinal de cadeia leve.
Para identificar o projeto do constructo sORF ótimo que po-deria permitir uma alta eficiência de secreção de anticorpo,nós projetamos vários constructos adicionais que variaram aregião ao redor do sitio de união C-terminal e o seguintepeptideo de sinal. O constructo J determinou"MDMRVPAQWFPGSRC" (SEQ ID NO: 25) após o último N da inteinaao invés da "MDMRVPAQLLG DE WFPGSRC" (SEQ ID NO:24) do cons-tructo Η, o qual adicionalmente removeu a região hidrofóbicadentro desse peptideo de sinal enquanto preservando a regiãoC-terminal assim como o sitio de clivagem de peptidase desinal. O constructo K direcionou a expressão da seqüência decadeia leve madura diretamente após o último N da inteina. Oconstructo L direcionou a expressão da"MDMRVPAQLLGLLLLWFPGSGG" (SEQ ID NO: 27) após o último N aoinvés da "MDMRVPAQLLGLLLLWFPGSRC" (SEQ ID NO: 23) como noconstructo pTT3-HcintLC-p.hori, o qual alterou os aminoáci-dos -1 e -2 antes do sitio de clivagem pela peptidase de sinal.
Num experimento, esses constructos foram introdu-zidos nas células 293E através de transfecções temporárias,e depois de 7 dias, os sobrenadantes cultivados foram anali-sados para os titulos de anticorpo IgG por análise de ELISA.
Os titulos de anticorpo para os constructos H, J, KeL fo-ram 2328, 5 + 79, 9, 1289, 7 + 129,6, 139, 3 + 4, 7 e 625, 0 +20,6 ng/mL (média + desv. pad.), respectivamente.
As amostras de pélete celular dessas transfecçõesforam também analisadas por análise de Western blot. Todosos constructos tinham a banda de polipeptideo tripartite (~130 KDa), a banda de cadeia pesada (~ 50 KDa) e a banda decadeia leve 25 KDa) descritas anteriormente, e nenhumatinha produto unido detectável (80 KDa e reconhecido tantopelo anticorpo de cadeia pesada quanto pelo de cadeia leve).
Dentre esse grupo de constructos, o constructo K produziu opadrão de western blot (WB) mais distinto pelo fato de queele produziu somente uma pequena quantidade de cadeia leveintracelular e, ao contrário, ele produziu as espécies deproteína correspondentes à fusão de inteína-cadeia leve, umproduto de um evento de clivagem na junção da união N-terminal. Essa espécie de proteína estava ausente com os ou-tros constructos nesse grupo. O constructo K diferiu dos ou-tros constructos em dois aspectos: ele não tinha um sítio declivagem pela peptidase de sinal, e ele tinha um ácido as-pártico, ao invés de uma metionina ou uma serina, como o Ioresíduo de aminoácido da exteína C-terminal. Qualquer uma ouambas dessas características poderia ter prevenido a cliva-gem na área entre a inteína e a cadeia leve de anticorpo,resultando na secreção de anticorpo diminuída.
O anticorpo D2E7 secretado usando o constructosORF JeL foram purificados por cromatografia de afinidadeda proteína A e analisados para as seqüências N-terminais desuas cadeias leves. Essa análise indicou que a seqüência depeptídeo N-terminal da cadeia leve produzida pelo constructoJ foi MDMRVPAQLL, a qual representou o peptideo de sinalnão-clivado; enquanto a seqüência de peptídeo N-terminal dacadeia leve produzida pelo constructo L foi DIQMTQSPSS, aqual representou a cadeia leve madura depois da correta cli-vagem do peptídeo de sinal. Conseqüentemente, o constructo Lrepresenta um projeto que produziu secreção de anticorpo au-mentada (0,6 a 1 ug/mL em diferentes transfecções temporá-rias) em comparação com o constructo pTT3-HcintLC-p.hori, esua cadeia leve tinha a correta seqüência N-terminal ao mes-mo tempo.
Nós exploramos mecanismos de expressão do anticor-po montado a partir de constructos sORF usando inteínas emétodos para aumentar adicionalmente os níveis de secreçãode anticorpo. Amostras intracelulares de células transfecta-das com a maioria dos constructos sORF descritos continhamduas espécies de cadeia leve de anticorpo correspondendo àscadeias leves não-processadas e processadas. Em célulastransfectadas ou com os constructos de controle positivos oucom o constructo pTT3-HcintLC-p.hori somente a cadeia leveprocessada foi secretada, indicando que cadeias leves não-processadas que tinham peptídeos de sinal de cadeia leve dotipo selvagem ligadas poderiam não ser montadas e secreta-das; Ao contrário, as cadeias leves não-processadas não po-deriam ser montadas e secretadas. Ao contrário, as cadeiasleves não-processadas dos constructos HeJ foram capazes deserem montadas e secretadas; ambas tinham peptídeos de sinalmodificados. A extensão do processamento do peptídeo de si-nal da cadeia leve, conforme visto nas distribuições do po-lipeptideo de cadeia leve intracelular entre as formas não-processada e processada, varia dependendo do constructo. Emcomparação com o constructo pTT3-HcintLC-p.hori, o construc-to L tinha uma quantidade aumentada de cadeia leve processa-da, e essa foi traduzida na secreção de anticorpo aumentada.
Baseando-se nos dados experimentais acima, umaforma de aumentar a secreção de anticorpo a partir dos cons-tructos sORF é melhorar a eficiência do processamento dopeptideo de sinal de cadeia leve. Isso é efetuado pela tes-tagem sistemática das mutações tanto na região hidrofóbicaquanto na área ao redor do sitio de clivagem, e pela testa-gem dos peptideos de sinal de comprimento diferente. Issopode ser feito pela varredura na levedura por seqüências depeptideo que possam ser clivadas de forma eficiente nessaapresentação, e fazendo varreduras similares em células CHO.
Outro método que pode ser usado para aumentar onivel de secreção de anticorpo a partir dos constructos sORFé testar diferentes regiões não-traduzidas 5' e 3' (UTRs)para aumentar a estabilidade do RNAm tripartite, uma vez queesses RNAms são maiores do que os RNAms tradicionais codifi-cando para as cadeias pesada e leve do anticorpo, separada-mente.
Outro método para aumentar o nivel de secreção doanticorpo a partir dos constructos sORF é gerar e selecionaruma linhagem celular CHO ou NSO estável e amplificar usandoou DHFR ou GS para aumentar as quantidades de cópias de ge-nes recombinantes. 0 nivel de secreção do anticorpo é inde-pendentemente aumentado pela alteração do local dos genesrecombinantes do epissomal (transitório) para o genômico(estável). Ele também é aumentado pelo aumento do número decópias, e/ou pela manipulação de seqüências promotoras, in-tensificadoras e UTRs 5' e 3'. Vetores expressando a diidro-folato redutase (dhfr) são transfectados em linhagens celu-lares deficientes de dhfr. Linhagens celulares com quantida-des de cópia de vetor mais elevadas são selecionadas usandometotrexato, um inibidor competitivo da dhfr (Kaufman, RJ. eSharp, P.A. J Mol. Biol. (1982) 159: 601-621). Como outraalternativa independente, vetores de expressão carregando ointensificador do promotor de citomegalovirus juntamente comum marcador selecionável da glutamina sintetase são emprega-dos para aumentar a expressão (Bebbington, C.R. (1991) Me-thods 2: 138-145). Além de aumentar as quantidades de cópiasde genes recombinantes, as linhagens celulares que são par-ticularmente responsáveis pelo processamento dos projetos deconstructo sORF também são selecionadas nesse processo.
Usando inteinas modificadas contendo inserções
Para o propósito de rastrear as proteínas de inte-ína intracelulares que foram separadas dos polipeptídeos decadeia leve e de cadeia pesada D2E7, nós fizemos 4 construc-tos que introduziram uma etiqueta de histidina nas posiçõesde seqüência de aminoácidos FRKVR I RGRG (I representa sí-tios de inserção, -HTl) e EGKR I IPEF (-HT2), em ambos osconstructos pTT3-LcintHC-p.hori e no constructo H. Essas du-as posições na inteína de P. horikoshi foram imaginadas comosendo voltas (Ioops) que podem tolerar inserções enquantomantendo sua estrutura tridimensional e, conseqüentemente,sua função. Num experimento, depois de 4 dias de incubaçãoapós a transfecção das células 293E, os sobrenadantes dacultura foram analisados para títulos de anticorpo IgG poranálise de ELISA. Os títulos de anticorpo para os construc-tos pTT3-LcintHC-p.hori-HTl, pTT3-LcintHC-p.hori-HT2, para oconstructo H-HT1, para o constructo H-HT2 e para o construc-to H foram de 78,3 + 3,2, 67,3 + 0,6, 663,0 + 15,5, 402,7 +5,5, 747,0 + 22,5 ng/ml (média + desv. pad.), respectivamen-te. 0 uso da inteína de P. horikoshii com inserções em ambosos 2 locais permitiram a secreção do anticorpo montado. Par-ticularmente, o uso da inteína com uma etiqueta inserida in-terna na Ia posição produziu um nível de secreção de anti-corpo similar em comparação com o uso de inteína sem qual-quer inserção.
Os dados acima demonstram que os projetos de cons-tructo sORF da presente invenção incluem o uso de inteínasmodificadas que contêm uma etiqueta interna. Uma variedadede etiquetas é conhecida na técnica. Etiquetas da presenteinvenção incluem, mas não estão limitadas, a etiquetas fluo-rescentes e etiquetas quimiluminescentes. Usando tais cons-tructos, a quantidade de poliproteína expressa pode ser mo-nitorada usando detecção fluorescente em células individu-ais. Além disso, essas células podem ser classificadas deacordo com o nível de expressão de proteína usando FACS. 0uso de tais etiquetas é particularmente útil na geração delinhagens celulares estáveis, uma vez que isso permite a se-leção de células de alta produtividade ou de linhagens celu-lares através de análise FACS. Conforme ensinado na presenteinvenção, inteinas de comprimento total foram observadas nolisato celular depois delas serem autoclivadas a partir dascadeias pesada e leve dos anticorpos flanqueadores. Issoproporciona bases para as detecções de inteinas marcadasfluorescentes e seus usos na geração de linhagens celularesestáveis. Etiquetas também podem ser usadas na purificaçãodas proteínas.
A partir dos dados apresentados acima, nós apren-demos que a reação de união de proteína mediada por inteínaPol I de P. horikoshii pode ocorrer em células 293E, no ER,e no contexto das seqüências de aminoácidos de cadeia pesadae leve do anticorpo (conforme especificamente exemplificadopor D2E7). Mutações de substituição pontuais, tais como S>Mno primeiro aminoácido da exteína C-terminal e H>A no penúl-timo aminoácido da inteína aumentou os níveis de anticorposecretado. A redução da hidrofobicidade da região H do pep-tídeo de sinal de cadeia leve, tal como nos constructos H eJ, produziu níveis ainda mais altos de secreção do anticor-po. 0 nível de secreção do anticorpo num constructo que nãotem o peptídeo de sinal da cadeia leve é relativamente bai-xo, e isso aparenta ser devido á clivagem menos eficiente najunção de união C-terminal. Duas abordagens são usadas paraaumentar a eficiência dessa clivagem. A primeira usa um ami-noácido diferente do ácido aspártico na posição +1. Tambémvários constructos aqui descritos usaram metionina na posi-ção +1 e produziram clivagem eficiente na junção de união C-terminal. Uma segunda abordagem para aumentar a eficiênciadessa clivagem é alterar o espaçamento entre o sítio de cli-vagem C-terminal e a estrutura globular da cadeia leve com ouso de um ligante, opcionalmente seguido por um tipo dife-rente de sítio de clivagem, tais como aqueles descritos nes-sa descoberta.
Enquanto vários constructos compreendendo a inter-na de P. horikoshii e o anticorpo DE27 foram descritos etestados, outras inteínas e proteínas tipo inteína (incluin-do hedgehog e a família relacionada) são usadas em projetossORF da invenção, por exemplo, incorporadas entre as cadeiasleve e pesada de anticorpo. Outras proteínas de múltiplassubunidades (incluindo proteínas de duas subunidades e pro-teínas com mais de duas subunidades) são substituídas paraas proteínas pesada e leve do anticorpo da mesma forma.
Além dos constructos de inteína de P. horikoshiidescritos aqui acima, nós designamos constructos análogosusando a inteína Sce.VMA e a inteína Ssp.dnaE mini: pTT3-Hc-VMAint-LC-Oaa, pTT3-Hc-VMAint-LC-laa, pTT3-Hc-VMAint-LC-3aa,pTT3-Hc-Ssp-GA-int-LC-0aa, pTT3-Hc-Ssp-GA-int-LC-laa e pTT3-Hc-Ssp-GA-int-LC-3aa. Esses constructos foram transfectadosem células 293E, e as amostras de sobrenadante e de péletecelular foram analisadas.
Num experimento, depois de 7 dias de incubação a-pós a transfecção das células 293E, os sobrenadantes da cul-tura foram analisados para os títulos de anticorpo IgG poranálise de ELISA. Os títulos de anticorpo para os construc-tos pTT 3-Hc-VMAint-LC-Oaa, pTT3-Hc-VMAint-LC-laa, pTT3-Hc-VMAint-LC-3aa, pTT3-HC-Ssp-GA-int-LC-0aa, pTT3-Hc-Ssp-GA-int-LC-laa e pTT3-HC-Ssp-GA-int-LC-3aa foram 9,0 ± 3,5, 12,0± 0.0, 39,7 ± 1,2, 90,0 ± 2,0, 38,7 ± 1,5 e 32 í 2,6 ng/mL(média ± desv. pad.)/ respectivamente.
Amostras de pélete celular dessas transfecçõestambém foram analisadas por análise de western blot. Os po-lipeptideos tripartites foram observados em todas essas a-mostras. Além disso, o polipeptideo de cadeia pesada foi ob-servado nos constructos pTT3-Hc-VMAint-LC-0aa, pTT3-HC-Ssp-GA-int-LC-Oaa, pTT3-Hc-Ssp-GA-int-LC-laa e pTT3-Hc-Ssp-GA-int-LC-3aa; e o polipeptideo de cadeia leve foi observado nopTT3-HC-Ssp-GA-int-LC-0aa, pTT3-Hc-Ssp-GA-int-LC-laa e nopT.T3-He-Ssp-GA-int-LC-3aa .
Os resultados daqueles experimentos indicaram queas inteinas, como uma classe de proteínas, podem ser usadascom sucesso em estratégias de expressão de proteína sORFconforme nós descrevemos. Além disso, domínios tipo inteínabacteriana (BIL) e domínios autoprocessadores hedgehog(Hog), os outros 2 membros da superfamília de Hog/inteína(HINT) além da inteína, são aplicáveis em projetos de cons-tructo similares para aqueles aqui descritos.
Adicionalmente, devido ao fato das regiões de en-donuclease que estão presentes em muitas inteinas, incluindoa inteína PolII de P. horikoshii e a inteína Sce.VMA, nãosão úteis na presente estratégia de expressão de gene, o do-mínio de endonuclease pode ser anulado e substituído com umligante pequeno para criar "mini-inteínas".
Essas mini-inteínas projetadas também são úteisnos projetos de constructo descritos, e elas apresentam avantagem de que a região codificadora de inteina é signifi-cativamente menor, permitindo dessa forma uma seqüência mai-or codificando os polipeptideos de interesse e/ou maior fa-cilidade de manuseio das moléculas de DNA recombinante.
Uma preocupação associada com o uso de peptideosautoprocessadores, tais como seqüências 2A ou tipo 2A ou se-qüências de reconhecimento da protease é que o C ou N termi-nal de uma ou mais das cadeias polipeptidicas contenha(m)aminoácido(s) derivado(s) do peptideo autoprocessador, istoé, resíduos de aminoácidos derivados de 2A, ou seqüência dereconhecimento de protease, dependendo da posição clivada eda posição relativa da cadeia particular dentro do produtode tradução primário. Esses resíduos de aminoácidos são "ex-ternos" ao hospedeiro e podem eliciar uma resposta auto-imune quando a proteína recombinante é expressa ou distribu-ída in vivo (isto é, expressa de um vetor viral ou não-viralno contexto da terapia gênica ou administrada como uma pro-teína recombinante produzida in vitro). Além disso, se nãoremovidos, os resíduos de aminoácidos derivados de sítio deprotease ou derivados de 2A podem interferir com a secreçãode proteína em células produtoras e/ou alterar a conformaçãode proteína, resultando num nível de expressão menor do queo ótimo e/ou na atividade biológica reduzida da proteína re-combinante .
Constructos de expressão de gene, projetados taiscomo um sítio de clivagem proteolítica adicional, são forne-cidos entre uma seqüência codificadora de polipeptídeo e osítio de clivagem autoprocessador (isto é, uma seqüência 2A)ou outro sitio de clivagem da protease como uma forma de re-moção do restante do sitio de clivagem autoprocessador deri-vado de residuos de aminoácidos após a clivagem podem serusados na prática da presente invenção.
Exemplos de sítios de clivagem proteolítica adi-cionais são sítios de clivagem de furina com a seqüência deconsenso RXK(R)R (SEQ ID NO: 1), a qual pode ser clivada porproteases tipo subtilisina endógenas, tais como furina e ou-tras proteases de serina na via de secreção da proteína. APublicação da Patente Americana 2005/0042721 mostra que osresíduos 2A no N terminal da primeira proteína podem ser e-ficientemente removidos pela introdução de um sítio de cli-vagem de furina RAKR entre o primeiro polipeptídeo e a se-qüência 2A. Além disso, o uso de um plasmídeo contendo umaseqüência 2A e um sítio de clivagem de furina adjacente aosítio 2A foi mostrado por resultar num nível mais alto deexpressão de proteína do que um plasmídeo contendo a seqüên-cia 2A sozinha. Essa melhoria proporciona outra.vantagem nofato de que resíduos 2A são removidos do N-terminal da pro-teína, seqüências 2A ou tipo 2A mais longas ou outras se-qüências autoprocessadoras podem ser usadas. Tais seqüênciasautoprocessadoras mais longas, tais como seqüências tipo 2Aou 2A, podem facilitar uma melhor expressão equimolar dedois ou mais polipeptídeos através de um único promotor. Au-mentos ainda maiores na expressão da imunoglobulina são al-cançados quando a seqüência codificadora de cadeia leve deimunoglobulina está presente duas vezes e a seqüência codi-ficadora da cadeia pesada está presente somente uma vez napoliproteina.
É vantajoso empregar anticorpos ou análogos seuscom características completamente humanas. Esses reagentesevitam as respostas imunes indesejadas induzidas pelos anti-corpos ou análogos se originando de espécies não-humanas.Para endereçar possíveis respostas imunes do hospedeiro pararesíduos de aminoácidos derivados de peptídeos autoprocessa-dores, a seqüência codificadora para um sítio de clivagemproteolítico pode ser inserida (usando a metodologia padrãoconhecida na técnica) entre a seqüência codificadora para aprimeira proteína e a seqüência codificadora para o peptídeoautoprocessador de forma a remover a seqüência de peptídeoautoprocessador do polipeptídeo expresso, isto é, do anti-corpo. Isso encontra utilidade particular em anticorpos te-rapêuticos ou de diagnóstico para uso in vivo.
Qualquer sítio de clivagem proteolítica adicionalconhecido na técnica, o qual poderia ser expresso usando ve-tores de tecnologia de DNA recombinante, pode ser empregadona prática da invenção. Sítios de clivagem proteolítica adi-cionais exemplares, os quais podem ser inseridos entre umaseqüência codificadora de polipeptídeo ou proteína e uma se-qüência de clivagem autoprocessadora (tal como uma seqüência2A) incluem, mas não estão limitados, a um sítio de clivagemde furina, RXK(R)R (SEQ ID N0:1); a um sítio de clivagem defator Xa, IE(D)GR (SEQ ID NO:6); a um sítio de clivagem depeptidase I de sinal, por exemplo, LAG FAT VAQ A (SEQ ID NO:28); e um sítio de clivagem de trombina, LVPRGS (SEQ IDNO:7).Como uma alternativa às abordagens de IRES, furi-na, 2A e inteina para a expressão de mais de uma proteínamadura de uma única estrutura de leitura aberta, a presenteinvenção também proporciona para o processamento de uma pro-teína usando um domínio de proteína hedgehog posicionado umapoliproteína entre a primeira e a segunda porção de proteí-na. Nós projetamos uma única estrutura de leitura aberta pa-ra expressar a cadeia pesada e a cadeia leve do anticorpocom um domínio autoprocessador hedgehog para separar os ge-nes da cadeia pesada e leve do anticorpo. Em células quecarregam tal ORF, um único RNAm que consiste de pelo menosuma cadeia pesada de anticorpo, uma cadeia leve de anticorpoe um domínio autoprocessador hedgehog é transcrito e usadopara gerar uma poliproteína correspondente. Pós-traducionalmente, o domínio autoprocessador hedgehog medeiaa separação das cadeias pesada e leve do anticorpo.
A família hedgehog de proteínas contém moléculasde sinalização conservadas que agem como morfogenes em dife-rentes sistemas de desenvolvimento, e estão envolvidas numaampla faixa de doenças humanas (Kalderon, D. 2005. BiochemSoc Trans. Dec; 33 (Pt 6): 1509-12). Proteínas hedgehog têm2 domínios estruturais, um domínio N-terminal (Hh-N) quefunciona na sinalização celular, e um domínio C-terminal(Hh-C) que catalisa um evento autoprocessador pós-traducional que cliva esses 2 domínios, adiciona uma porçãode colesterol ao domínio C-terminal do N-terminal, e dessaforma ativa a molécula de sinalização (Traci et al. 1997.Cell, 91, 85-97) .Vantagens oferecidas por tal tecnologia de expres-são de anticorpo sORF incluem a capacidade de manipular pro-porções de dosagem de gene para as cadeias pesada e leve, aproximidade dos polipeptideos de cadeia pesada e leve para amontagem de múltiplas subunidades no ER, e o potencial paraa secreção de proteína com alta eficiência.
Os domínios da proteína Hh-C podem ser usados paracatalisar uma reação autoprocessadora no ER que resulta numaclivagem pós-traducional entre o polipeptídeo da cadeia pe-sada do anticorpo e o polipeptídeo Hh-C no projeto do cons-tructo de estrutura de leitura aberta individual descritoabaixo.
A família hedgehog das proteínas tem um domínio desinalização N-terminal e um domínio autoprocessador C-terminal. Seus domínios autoprocessadores C-terminais seclivam a partir dos domínios N-terminais, e adicionam aosseus C-terminais uma porção de colesterol através de um me-canismo reacional de 2 passos .(Porter et al. 1996. Science.274(5285) : 255-9) . Além do colesterol, outros nucleófilostais como DTT ou glutationa também estimulam o autoprocessa-mento (Lee et al. 1994. Science, 266, 1528- 1537). Uma vezque a reação de clivagem é catalisada pelo domínio autopro-cessador C-terminal, uma reação de clivagem similar ocorrequando o domínio de sinalização N-terminal da proteína hed-gehog é substituído por um polipeptídeo de cadeia pesada oude cadeia leve do anticorpo. Essa reação pode ser usada paraseparar as cadeias pesada e leve do anticorpo contidas numapoliproteína codificada por estrutura de leitura aberta in-dividual.
Primeiro a expressão do anticorpo é testada numsistema de expressão transiente e, para esse propósito, osconstructos são feitos numa estrutura de vetor PTT3. Essevetor tem origem de replicação EBV, a qual permite para asua amplificação epissomal em células 293E transiectadas(células que expressam o antigeno 1 nuclear.do virus Epste-in-Barr) na cultura em suspensão (Durocher et al. 2002). Ca-da vetor tem uma única estrutura de leitura aberta individu-al, direcionada por um promotor CMV. Num projeto de cons-tructo, pTT3-HC-Hh-C25-LC, o domínio C-terminal inteiro daproteína hedgehog sônica de Drosophila melanogaster foi in-serido na estrutura entre as cadeias pesada e leve de D2E7,cada uma das quais tinha um peptídeo de sinal (SP) . Essesconstructos são introduzidos nas células 293E através datransfecção transiente. Tanto os sobrenadantes cultivadosquanto a amostra de pélete celular foram analisados.
Amostras de pélete celular são lisadas sob condi-ções que permitem a separação das frações de membrana cito-sólica e intracelular. Ambas essas frações são analisadasusando técnicas de imunocoloração ou com o anticorpo de ca-deia leve anti-capa ou com a cadeia anti-pesada. Nessas"blots", espécies de proteínas que são observadas incluem apoliproteína (HC-Hh-C25-LC), Hh-C25-LC, e as cadeias pesada(HC) e leve (LC) separadas. A presença das últimas 3 espé-cies de proteína confirmam que a reação autoprocessadora o-correu. A cadeia pesada livre é gerada a partir da clivagemcatalisada pelo domínio de proteína Hh-C; os polipeptídeosde cadeia leve livres são os resultados de uma clivagem pelapeptidase de sinal. A segregação das espécies de proteína nafração da membrana subcelular que continha o retículo endo-plasmático (ER) sugere que o peptídeo de sinal da cadeia pe-sada no início de nosso ORF direcionou o ORF inteira para oER, onde a reação de clivagem ocorre.
Essas amostras de péletes celulares também estãosujeitas à extração de RNA total e à análise de Northernblot usando tanto uma sonda específica de cadeia pesada deanticorpo quanto uma sonda específica de cadeia leve de an-ticorpo. Nesses northern blots, observações de um RNAm tri-partite que hibridiza tanto para a sonda de cadeia pesadaquanto para a sonda de cadeia leve confirma a natureza sORFdo projeto do constructo. Ao contrário, nas amostras de pé-Iete celular que expressaram o anticorpo D2E7 usando a abor-dagem convencional, isto é, introduzindo as cadeias pesada eleve do anticorpo a partir de dois ORFs separados carregadosem dois vetores pTT3, RNAms para a cadeia pesada (1,4 Kb) eL (0,7 Kb) foram detectados usando as sondas de cadeia pesa-da e de cadeia leve, respectivamente.
Esses experimentos demonstraram que o uso de cons-tructos contendo um único ORF (cadeia pesada de D2E7-Hh-C25-cadeia leve de D2E7), um único RNAm contendo todas as trêsproteínas é transcrito. Essa mensagem tripartite é traduzidanum polipeptídeo tripartite, e co-traducionalmente importadano ER, direcionada pelo peptídeo de sinal da cadeia pesadano início do 0RF. Isso indica que o domínio da proteína Hh-Cé útil para a expressão dos anticorpos, assim como de outrasproteínas secretadas de múltiplas subunidades e/ou outrasproteínas que precisam passar pelas vias secretórias paraserem dobradas e propriamente modificadas pós-traducionalmente.
Além dos péletes celulares, os sobrenadantes cul-tivados são analisados, usando tanto western blots quantoELISA, para anticorpos secretados, conforme aqui discutido.
Constructos usando hh-C25 anulados podem ser testados paracomparar as eficiências do processamento da poliproteína edo nível de secreção de anticorpo.
Foi demonstrado que a anulação do aminoácido 63 C-terminal do domínio da proteína Hh-C25 produziu um domíniode proteína, Hh-C17, o qual pode catalisar o processamentoda proteína, mas não a adição de colesterol. Hh-C17 expres-sou bem como uma proteína recombinante e sua estrutura cris-talina foi determinada (Traci et al. 1997 acima). Conseqüen-temente, em outro projeto de constructo, pTT3-HC-C17-LC, es-se domínio .de proteína cortado foi inserido entre as cadeiaspesada e leve do anticorpo D2E7.
No alinhamento da homologia de inteínas e proteí-nas hedgehog, as quais nós testamos em projetos de construc-to similares conforme descrito aqui em detalhes, os últimos8 aminoácidos são extensões além da última estrutura secun-dária de folha β prevista, e eles podem ou não contribuirpara a eficiência do autoprocessamento. Conseqüentemente, umconstructo adicional, pTT3-HC-C17sc-LC, também é testado.
Esses constructos são introduzidos em células 293Eatravés de transfecção transiente, e depois de 7 dias, ossobrenadantes cultivados podem ser analisados para os títu-los de anticorpo IgG por análise de ELISA. Os títulos de an-ticorpo para pTT3-HC-C25-LC, pTT3-HC-C17-LC, pTT3-HC-C17sc-LC e pTT3-HC-C17hn-LC são 0,038, 0,042, 0,040 e 0,046 ug/mL,respectivamente.
Essas amostras de sobrenadantes também são anali-sadas em géis de SDS-PAGE (condições desnaturantes) e man-chados com anticorpos específicos para a cadeia pesada deIgG humana e um anticorpo específico para a cadeia leve capahumana. Nesses Western blots, as proteínas da cadeia pesadado anticorpo (~ 50 KDa) e da cadeia leve do anticorpo 25KDa) podem ser observadas e correlacionadas com os níveis deIgG medidos por ELISA.
As amostras de pélete celular dessas transfecçõestambém são analisadas por análise de western blot. A presen-ça e a densidade relativa das quatro espécies de proteínadescritas podem ser comparadas dentre os diferentes cons-truct.os para determinar as eficiências de processamento deproteína produzidas por cada um dos projetos de constructo.
Em outra classe de proteínas autoprocessadoras,inteínas, os últimos dois aminoácidos tendem a ser HisAsn.
No processo da união de proteína catalisado por inteínas, aAsn sofre uma ciclização, auxiliada pela His, o que resultana clivagem de uma ligação peptídica entre a inteína e seupolipeptídeo flanqueador C-terminal. Ao contrário das inteí-nas, proteínas autoprocessadoras hedgehog não têm natural-mente um polipeptídeo flanqueador C-terminal e elas não têmuma Asn conservada nessa posição do polipeptídeo. Num proje-to do constructo, pTT3-HC-C17hn-LC, nós introduzimos His-Asnnessa posição, substituindo Ser-Cys. Sem desejar estar liga-do à teoria, o sitio de clivagem projetado nessa posição faza separação entre a proteína autoprocessadora hedgehog e acadeia leve de anticorpo nesse projeto de constructo parti-cular mais eficiente. A eficiência da secreção do anticorpoé testada conforme descrito acima.
Anticorpos produzidos através dos constructos sORFcontendo proteína autoprocessadora hedgehog são caracteriza-dos. O anticorpo D2E7 secretado usando o constructo sORF a-cima é purificado por cromatografia de afinidade de proteína
A e analisado para as seqüências N-terminais tanto da suacadeia pesada quanto da sua cadeia leve. Esses anticorpospurificados são analisados por espectrometria de massa con-forme anteriormente descrito, juntamente com o D2E7 produzi-do a partir do processo de produção padrão, sob as condiçõesde desnaturação. Usando espectrometria de massa, os pesosmoleculares intactos (PM) sob condições naturais são deter-minados para o anticorpo D2E7 produzido a partir dessesconstructos, juntamente com o anticorpo D2E7 produzido apartir do processo de produção.
A ligação entre o anticorpo D2E7 e o TNFa humano éanalisada usando Biacore conforme descrito anteriormente. Acinética no índice, a cinética fora do índice e as afinida-des globais são determinadas pelo uso de diferentes concen-trações de TNFa na faixa de 1 a 100 nM.
A presente invenção contempla o uso de qualqueruma de uma variedade de vetores para a introdução de cons-tructos compreendendo a seqüência codificadora para dois oumais polipeptideos ou proteínas e uma seqüência de clivagemautoprocessadora nas células. Numerosos exemplos de vetoresde expressão de gene são conhecidos na técnica e podem serde origem viral ou não-viral. Métodos de distribuição de ge-ne não-viral, os quais podem ser empregados na prática dainvenção, incluem, mas não estão limitados, a plasmídeos,lipossomas, complexos de ácido nucléico/lipossoma, lipideoscatiônicos e semelhantes.
Vetores virais
Vetores virais e outros podem transduzir eficien-temente células e introduzir seu próprio DNA numa célulahospedeira. Na geração de vetores virais recombinantes, ge-nes não-essenciais são substituídos com seqüências exprimí-veis codificando proteínas ou polipeptideos de interesse.
Vetores exemplares incluem, mas não estão limitados, a veto-res virais e não-virais, tal como um vetor retroviral (in-cluindo vetores lentivirais), vetores adenovirais (Ad) in-cluindo formas de replicação competentes, de replicação de-ficiente e formas sem significado, vetores de vírus adenoas-sociado (AAV), vetores de vírus símio 40 (SV-40), vetores depapiloma bovino, vetores de Epstein-Barr, vetores de herpes,vetores de vaccinia, vetores de leucemia de murino Monoley,vetores do vírus de sarcoma de murino Harvey, vetores de ví-rus de tumor de mama de murino, vetores de vírus de sarcomaRous e plasmídeos não-virais. Vetores de baculovírus são bemconhecidos e são adequados para a expressão em células deinseto. Um excesso de vetores adequados para a expressão emcélulas de mamíferos ou outras eucarióticas são bem conheci-dos na técnica, e muitos são comercialmente disponíveis.Fontes comerciais incluem, sem limitação, Stratagene, LaJolla, CA; Invitrogen, Carlsbad, CA; Promega, Madison, WI eSigma-Aldrich, St. Louis, MO. Muitas seqüências de vetoressão disponíveis através do GenBank, e informação adicionalenvolvendo os vetores está disponível na internet através doRiken BioSource Center.
O vetor tipicamente compreende uma origem de re-plicação e o vetor pode ou não, além disso, compreender umafunção de "marcador" ou "marcador selecionável" pela qual ovetor pode ser identificado e selecionado. Enquanto qualquermarcador selecionável pode ser usado, marcadores selecioná-veis para uso em vetores recombinantes são geralmente conhe-cidos na técnica e a escolha do marcador selecionável pró-prio irá depender da célula hospedeira. Exemplos de genesmarcadores selecionáveis os quais codificam proteínas queconferem resistência a antibióticos ou outras toxinas inclu-em, mas não estão limitados, a ampicilina, metotrexato, te-traciclina, neomicina (Southern et al. 1982. J Mol Appl Ge-net. 1: 327-41), ácido micofenólico (Mulligan et al. 1980.Science 209: 1422-7), puromicina, zeomicina, higromicina(Sugden et al. 1985. Mol Cell Biol. 5: 410-3), diidrofolatoredutase, glutamina sintetase e G418. Conforme será entendi-do por aqueles indivíduos versados na técnica, vetores deexpressão tipicamente incluem uma origem de replicação, umpromotor operativamente ligado à seqüência codificadora ouàs seqüências a serem expressas, assim como sítios de liga-ção de ribossomo, sítios de união de RNA, um sítio de polia-denilação e seqüências terminadoras transcricionais, confor-me apropriado para a(s) seqüência(s) codificadora(s) sendoexpressas.
Referência a um vetor ou outras seqüências de DNAcomo "recombinante" meramente confirmam a ligação operávelde seqüências de DNA, as quais não são tipicamente operati-vamente ligadas como isoladas ou encontradas na natureza.
Seqüências regulatórias (expressão e/ou controle) são opera-tivamente ligadas a uma seqüência codificadora de ácido nu-cléico quando as seqüências de controle e/ou expressão regu-lam a transcrição e, conforme apropriado, a tradução da se-qüência de ácido nucléico. Dessa forma, as seqüências de ex-pressão e/ou controle podem incluir promotores, intensifica-dores, terminadores de transcrição, um códon de partida (is-to é, ATG) 5' em relação à seqüência codificadora, sinais deunião para íntrons e códons de parada.
Vetores de terapia de gene de adenovírus são co-nhecidos por exibir uma forte expressão transiente, excelen-te título e a capacidade de transduzir células em divisão eque não estão em divisão in vivo (Hitt et al. 2000. Adv in
Virus Res 55: 479-505). Os vetores Ad recombinantes da pre-sente invenção compreendem um sítio de empacotamento capaci-tando o vetor a ser incorporado em virions Ad defeituosos dereplicação; a seqüência codificadora para dois ou mais poli-peptídeos ou proteínas de interesse, por exemplo, cadeiaspesada e leve de uma imunoglobulina de interesse; e uma se-qüência codificando um sítio de clivagem autoprocessador so-zinho ou em combinação com um sitio de clivagem proteoliticoadicional. Outros elementos necessários ou que ajudam a in-corporação em virions infecciosos incluem os Ad ITRs 5' e3', os genes E2, porções do gene E4 e opcionalmente o gene E3.
Virions Ad defeituosos de replicação encapsulandoos vetores Ad recombinantes são feitos por técnicas padrõesconhecidas na técnica usando células de empacotamento Ad etecnologia de empacotamento. Exemplos desses métodos podemser encontrados, por exemplo, na Patente Americana No.5.872.005. A seqüência codificadora para dois ou mais poli-peptideos ou proteínas de interesse é comumente inserida emadenovírus na região E3 anulada do genoma do vírus. Vetoresadenovirais preferidos para uso na prática da invenção nãoexpressam um ou mais produtos de gene Ad to tipo selvagem,por exemplo, Ela, Elb, E2, E3 e E4. Modalidades preferidassão virions que são tipicamente usados juntos com linhagensde células de empacotamento que complementam as funções deEl, E2A, E4 e opcionalmente as regiões do gene E3. Ver, porexemplo, as Patentes Americanas Nos. 5.872.005, 5.994.106,6.133.028 e 6.127.175.
Dessa forma, conforme aqui utilizado, "adenovírus"e "partícula de adenovírus" se referem ao vírus em si ou de-rivados seus e cobrem todos os sorotipos e subtipos e tantoas formas de ocorrência natural quanto as recombinantes, ex-ceto onde indicado de outra forma. Tais adenovírus podem serdo tipo selvagem ou podem ser modificados de várias formasconhecidas na técnica ou conforme aqui revelado. Tais modi-ficações incluem modificações ao genoma de adenovirus que éempacotado na partícula para tornar um vírus infeccioso.
Tais modificações incluem anulações conhecidas na técnica,tais como anulações em uma ou mais das regiões codificadorasde Ela, Elb, E2a, E2b, E3 ou E4. Células produtoras e de em-pacotamento exemplares são derivadas de células HeLa, 293 ouA54 9. Vetores de adenovirus são purificados e formulados u-sando técnicas padrões conhecidas na técnica.
Vírus adenoassociado (AAV) é um parvovírus humanodependente de auxiliadora (helper) o qual é capaz de infec-tar células de forma latente por integração cromossomal. Porcausa de sua capacidade de integrar cromossomicamente e desua natureza não-patogênica, AAV tem um potencial significa-tivo como um vetor de terapia gênica humana. Para uso naprática da presente invenção, virions rAAV podem ser produ-zidos usando a metodologia padrão, conhecida por aquelaspessoas normalmente versadas na técnica e são construídos deforma que eles incluem, como componentes operativamente li-gados na direção da transcrição, seqüências de controle in-cluindo seqüências de iniciação e de terminação transcricio-nais, e a(s) seqüência(s) codificadora(s) de interesse. Maisespecificamente, os vetores AAV recombinantes da presenteinvenção compreendem um sítio de empacotamento capacitando ovetor a ser incorporado em virions de AAV defeituosos de re-plicação; a seqüência codificadora para dois ou mais poli-peptídeos ou proteínas de interesse, por exemplo, cadeiaspesada e leve de uma imunoglobulina de interesse; uma se-qüência codificando um sítio de clivagem autoprocessador so-zinho ou em combinação com um ou mais sítios de clivagemproteoliticos adicionais. Vetores AAV para uso na prática dainvenção são construídos de forma que eles também incluam,como componentes operativamente ligados na direção da trans-crição, seqüências de controle incluindo seqüências de ter-minação e de iniciação transcricionais. Esses componentessão flanqueados na extremidade 5' e 3' por seqüências ITRAAV funcionais. Por "seqüências ITR AAV funcionais" se en-tende que as seqüências ITR funcionam conforme tencionadopara o resgate, replicação e empacotamento do virion AAV.
Vetores AAV recombinantes também são caracteriza-dos pelo fato de que eles são capazes de direcionar a ex-pressão e a produção de produtos de polipeptídeo ou de pro-teína recombinantes selecionados nas células alvo. Dessaforma, os vetores recombinantes compreendem pelo menos todasas seqüências do AAV essenciais para a encapsidação e as es-truturas físicas para a infecção dos virions de AAV recombi-nantes (rAAV). Dessa forma, ITRs AAV para uso nos vetores deexpressão não precisam ter uma seqüência de nucleotídeo dotipo selvagem (por exemplo, conforme descrito em Kotin.1994. Hum. Gene Ther. 5: 793-801), e podem ser alterados pe-la inserção, anulação ou substituição dos nucleotídeos ou osITRs AAV podem ser distribuídos a partir de qualquer um dosvários sorotipos AAV. Geralmente, um vetor AAV pode serqualquer vetor derivado de um sorotipo de vírus adenoassoci-ado conhecido na técnica.
Tipicamente, um vetor de expressão AAV é introdu-zido numa célula produtora, seguido pela introdução de umconstructo auxiliar AAV, onde o constructo auxiliar incluiregiões codificadoras de AAV capazes de serem expressas nacélula produtora e as quais complementam as funções auxilia-doras de AAV ausentes no vetor AAV. 0 constructo auxiliadorpode ser designado para infra-regular a expressão das prote-ínas Rep grandes (Rep78 e Rep68), tipicamente pela modifica-ção do códon de partida após o p5 de ATG para ACG, conformedescrito na Patente Americana No. 6.548.286, aqui incorpora-da por referência. Isso é seguido pela introdução do vírusauxiliador e/ou vetores adicionais na célula produtora, emque o vírus auxiliador e/ou vetores adicionais proporcionamfunções acessórias capazes de suportar a produção viral derAAV eficiente. As células produtoras são, a seguir, culti-vadas para produzir rAAV. Esses passos são executados usandoa metodologia padrão. Os virions AAV defeituosos de replica-ção encapsulando os vetores AAV recombinantes da presenteinvenção são feitos por técnicas padrões conhecidas na téc-nica usando células de empacotamento AAV e tecnologia de em-pacotamento. Exemplos desses métodos podem ser encontrados,por exemplo, nas Patentes Americanas Nos. 5.436.146;5.753.500, 6.040.183, 6.093.570 e 6.548.286, aqui incorpora-das por referência nas suas totalidades. Outras composiçõese métodos para empacotamento estão descritos em Wang et al.
(Publicação de Patente Americana 2002/0168342), também in-corporada aqui por referência na sua totalidade, e incluiaquelas técnicas dentro do conhecimento daqueles indivíduosversados na técnica.
Na prática da invenção, células hospedeiras para aprodução de rAAV ou outros virions de vetor de expressão devetores incluem células de mamíferos, células de insetos,microrganismos e levedura. Células hospedeiras podem tambémser células de empacotamento nas quais os genes rep e cap deAAV (ou outro) são estavelmente mantidos na célula hospedei-ra ou nas células produtoras nas quais o genoma do vetor AAVé estavelmente mantido e empacotado. Células produtoras e deempacotamento exemplares são derivadas de células 293, A549ou HeLa. Vetores AAV são purificados e formulados usandotécnicas padrões conhecidas na técnica. Células de hospedei-ro adequadas adicionais (dependendo do vetor) incluem célu-las de ovário de hamster chinês (CHO), variantes deficientesde diidrofolato redutase de CHO tais como células CHO DX Bllou CHO DG44 (ver, por exemplo, Urlaub e Chasin. 1980. Proc.Natl. Acad. Sei. 77: 4216-4220), células PerC.6 (Jones etal. 2003. Biotechnol. Prog. 19: 163-168) ou células de mie-Ioma de camundongo Sp/20 (Coney et al. 1994. Câncer Res. 54:2448-2455).
Vetores retrovirais
Vetores retrovirais são uma ferramenta comum paraa distribuição de genes (Miller. 1992. Nature 357: 455-460).
Vetores retrovirais e, mais particularmente, vetores lenti-virais podem ser usados na prática da presente invenção.
Concordantemente, o termo "retrovírus" ou "vetor retrovi-ral", conforme aqui utilizado, significa incluir "lentiví-rus" e "vetores lentivirais", respectivamente. Vetores re-trovirais foram testados e descobertos como sendo veículosde distribuição adequados para a introdução estável de genesde interesse no genoma de uma ampla faixa de células alvo. Acapacidade dos vetores retrovirais de distribuir transgenesde cópia individual não-arranjados em células torna os veto-res retrovirais bem adequados para transferir genes paradentro das células. Além disso, os retrovirus entram nas cé-lulas hospedeiras pela ligação de glicoproteinas de enveloperetroviral para receptores de superfície celular específicosnas células hospedeiras. Conseqüentemente, vetores retrovi-rais pseudotipados nos quais a proteína do envelope naturalcodificada é substituída por uma proteína de envelope hete-róloga que tem uma especificidade celular diferente do que aproteína envelope natural (por exemplo, se liga a um recep-tor de superfície celular diferente em comparação com a pro-teína envelope natural) podem também encontrar utilidade naprática da presente invenção. A capacidade de direcionar adistribuição de vetores retrovirais codificando uma ou maisseqüências codificadoras de proteína alvo para células alvoespecíficas é desejável na prática da presente, invenção.
A presente invenção proporciona vetores retrovi-rais os quais incluem, por exemplo, vetores de transferênciaretroviral compreendendo uma ou mais seqüências de transgenee vetores de empacotamento retroviral compreendendo um oumais elementos de empacotamento. Particularmente, a presenteinvenção proporciona vetores retrovirais pseudotipados codi-ficando uma proteína heteróloga ou de envelope funcionalmen-te modificada para a produção de retrovirus pseudotipado.
A seqüência núcleo dos vetores retrovirais da pre-sente invenção pode ser prontamente derivada de uma amplavariedade de retrovirus incluindo, por exemplo, os retroví-rus do tipo B, CeD, assim como spumavirus e lentivirus(ver RNA Tumor Viruses, Segunda Edição, Cold Spring HarborLaboratory, 1985). Um exemplo de um retrovirus adequado parauso nas composições e métodos da presente invenção inclui,mas não está limitado, ao lentivirus. Outros retrovirus ade-quados para uso nas composições e métodos da presente inven-ção incluem, mas não estão limitados, ao virus da leucoseaviária, ao virus da leucemia bovina, ao virus da leucemiade murino, ao virus indutor de foco (focus) de células mar-ta, virus do sarcoma de murino, virus da reticuloendoteliosee virus do sarcoma de Rous. Virus de leucemia de murino par-ticularmente preferidos incluem o 4070A e o 1504A (Hartley eRowe. 1976. J. Virol. 19: 19-25), Abelson (No. ATCC VR-999),Friend (ATCC No. VR-245), Graffi, Gross (ATCC No. VR-590),virus do sarcoma de Kirsteni Harvey e Rauscher (No. ATCC VR-998) e o virus da leucemia de murino Monoley (ATCC No. VR-190). Tais retrovirus podem ser prontamente obtidos de depó-sitos ou coleções tais como da American Type Culture Collec-tion (ATCC; Manassas, VA), ou isolados de fontes conhecidasusando técnicas comumente disponíveis. Outros são disponí-veis comercialmente.
Uma seqüência de vetor retroviral da presente in-venção pode ser derivada a partir de um lentivirus. Um Ien-tivírus preferido é um vírus da imunodeficiência humana, porexemplo, do tipo 1 ou 2 (isto é, HIV-I ou HIV-2, em que HIV-1 foi anteriormente chamado de vírus associado com a linfa-denopatia 3 (HTLV-III) e vírus relacionado com a síndrome daimunodeficiência adquirida (AIDS) (ARV)), ou outro vírus re-lacionado com o HIV-I ou com o HIV-2 que tenha sido identi-ficado e associado com a doença AIDS ou tipo AIDS. Outroslentivírus incluem um vírus Visna/maedi de ovelha, um vírusda imunodeficiência de felino (FIV), um lentivírus de bovi-no, um vírus da imunodeficiência de símio (SIV), um vírus daanemia infecciosa de eqüino (EIAV) e um vírus da artrite-encefalite de caprino (CAEV).
Gêneros e cepas adequados de retrovírus são bemconhecidos na técnica (ver, por exemplo, Fields Virology,Terceira Edição, editado por B. N. Fields et al. 1996. Lip-pincott-Raven Publishers, ver por exemplo, capítulo 58, Re-troviridae: The Viruses and Their Replication, Classificati-on, páginas 1768-1771, incluindo a Tabela 1, aqui incorpora-da por referência). Sistemas de empacotamento retroviraispara gerar células produtoras e linhagens de células produ-toras que produzem retrovírus, e métodos para fazer taissistemas de empacotamento são também conhecidos na técnica.
Sistemas de empacotamento típicos compreendem pelomenos dois vetores de empacotamento: um primeiro vetor deempacotamento o qual compreende uma primeira seqüência denucleotídeo compreendendo um gene gag, um gene pol ou genesgag e pol; e um segundo vetor de empacotamento o qual com-preende uma segunda seqüência de nucleotídeos compreendendoum gene envelope heterólogo ou funcionalmente modificado. Oselementos retrovirais podem ser derivados de um lentivírus,tal como HIV. Os vetores podem não ter um gene tat funcionale/ou genes acessórios funcionais (vif, vpr, vpu, vpx, nef).O sistema pode ainda compreender um terceiro vetor de empa-cotamento com uma seqüência de nucleotideo compreendendo umgene rev. 0 sistema de empacotamento pode ser fornecido naforma de uma célula de empacotamento que contém a primeira,a segunda e, opcionalmente, a terceira seqüência de nucleo-tideos.
A invenção é aplicável a uma variedade de sistemasde expressão, especialmente aquelas com as células eucarió-ticas, e vantajosamente células de mamíferos. Onde proteínasnaturais são glicosiladas, é preferível que o sistema de ex-pressão seja um o qual fornecerá glicosilação tipo naturalpara as proteínas expressas.
Lentivírus compartilham várias proteínas de virionestruturais em comum, incluindo as glicoproteínas de envelo-pe SU (gpl20) e TM (gp41), as quais são codificadas pelo ge-ne env; CA (p24), MA (pl7) e NC (p7-ll), as quais são codi-ficadas pelo gene gag; e RT, PR e IN codificadas pelo genepol. HIV-I e HIV-2 contêm proteínas acessórias e outras en-volvidas na regulação da síntese e no processamento de vírusde RNA e outras funções replicativas. As proteínas acessó-rias, codificadas pelos genes vif, vpr, vpu/vpx e nef, podemser omitidas (ou inativadas) a partir do sistema recombinan-te. Além disso, tat e rev podem ser omitidos ou inativados,por exemplo, por mutação ou anulação.
A primeira geração de sistemas de empacotamento devetor lentiviral proporciona constructos de empacotamentoseparados para gag/pol e env, e tipicamente empregam umaproteína envelope funcionalmente modificada ou heterólogapor questões de segurança. Em sistemas de vetor lentiviralde segunda geração, os genes acessórios, vif, vpr, vpu e nefsão anulados ou inativados. Sistemas de vetor lentiviral deterceira geração são aqueles a partir dos quais o gene tatfoi anulado ou, de outra forma, inativado (por exemplo, a-través de mutação).
A compensação para a regulação da transcrição nor-malmente fornecida por tat pode ser proporcionada pelo usode um forte promotor constitutivo, tal como o intensifica-dor/promotor inicial imediato de citomegalovirus humano(HCAAV-IE). Outros promotores/intensificadores podem ser se-lecionados baseando-se na força da atividade do promotorconstitutivo, na especificidade pelo tecido alvo (por exem-plo, um promotor figado-especifico) ou outros fatores rela-cionados com o controle desejado sobre a expressão, conformeé entendido na técnica. Por exemplo, em algumas modalidades,é desejável empregar um promotor induzivel, tal como tet,para alcançar a expressão controlada. O gene que codificarev pode ser fornecido num constructo de expressão separado,de forma que um vetor lentiviral de terceira geração típicoirá envolver quatro plasmídeos: um de cada para o gagpol,rev, envelope e o vetor de transferência. Independentementeda geração do sistema de empacotamento empregado, gag e polpodem ser fornecidos num único constructo ou em constructosseparados.
Tipicamente, os vetores de empacotamento estão in-cluídos numa célula de empacotamento, e são introduzidos nacélula através de transfecção, transdução ou infecção. Méto-dos para transfecção, transdução ou infecção são bem conhe-cidos pelas pessoas versadas na técnica. Um vetor de trans-ferência retroviral da presente invenção pode ser introduzi-do numa linhagem celular de empacotamento, através de trans-fecção, transdução ou infecção, para gerar uma célula ou umalinhagem celular produtora. Os vetores de empacotamento dapresente invenção podem ser introduzidos nas células ou li-nhagens celulares humanas por métodos padrões incluindo, porexemplo, transfecção com fosfato de cálcio, lipofecção oueletroporação. Em algumas modalidades, os vetores de empaco-tamento são introduzidos nas células juntamente com um mar-cador selecionável dominante, tal como neo, diidrofolato re-dutase (DHFR) , glutamina sintetase ou ADA, seguido pela se-leção na presença do fármaco apropriado e do isolamento declones. Um gene marcador selecionável pode estar ligado fi-sicamente aos genes codificados pelo vetor de empacotamento.
Linhagens celulares estáveis, em que as funções doempacotamento .estão configuradas para serem expressas poruma célula de empacotamento adequada, são conhecidas. Porexemplo, ver a Patente Americana No. 5.686.279; e Ory et al.1996 Proc. Natl. Acad. Sei. 93: 11400-11406, os quais des-crevem células de empacotamento. A descrição adicional daprodução de linhagem celular estável pode ser encontrada emDull et al. 1998. J. Virol. 72(11): 8463-8471; e em Zuffereyet al. 1998. J. Virol. 72: 9873-9880.
Zufferey et al. 1997. Nat. Biotechnol. 15: 871-75ensina um plasmideo de empacotamento lentiviral em que asseqüências 3' de pol, incluindo o gene do envelope de HIV-Isão anuladas. O constructo contém as seqüências tat e rev ea LTR 3' é substituída com as seqüências poli A. As seqüên-cias LTR 5' e psi são substituídas por outro promotor, talcomo um o qual é induzível. Por exemplo, um promotor CMV ouum derivado seu podem ser usados.
Os vetores de empacotamento podem conter altera-ções adicionais nas funções de empacotamento para aumentar aexpressão de proteína lentiviral e para aumentar a seguran-ça. Por exemplo, todas as seqüências de HIV à montante degag podem ser removidas. Também, as seqüências à jusante doenvelope podem ser removidas. Além disso, os passos podemser tomados para modificar o vetor para aumentar a união e atradução do RNA.
Opcionalmente, um sistema de empacotamento condi-cional é usado, tal como aquele descrito por Dull et al.1998, acima. Também preferido é o uso de um vetor de auto-inativação (SIN), o qual melhora a biossegurança do vetorpela anulação da repetição terminal longa de HIV-I (LTR)conforme descrito, por exemplo, por Zufferey et al. 1998. J.Virol. 72: 9873-9880. Vetores induzíveis podem também serusados, tais como através de uma LTR induzível por tetraci-clina.
Promotores
Os vetores da invenção tipicamente incluem seqüên-cias de controle heterólogas, as quais incluem, mas não es-tão limitadas, a promotores constitutivos, tais como o pro-motor inicial imediato de citomegalovírus (CMV), o LTR RSV,o LTR MOMLV e o promotor PGK; promotores específicos de te-cido ou tipo celular incluindo mTTR, TK, HBV, hAAT, promoto-res reguláveis ou induziveis, intensificadores, etc.
Promotores úteis incluem o promotor LSP (111 etal. 1997. Blood Coagul. Fibrinolysis 8S2: 23-30), o promotoralfa EFl (Kim et al. 1990. Gene 91(2): 217-23) e Guo et al.1996. Gene Ther. 3(9): 802-10). A maioria dos promotorespreferidos inclui o promotor 1-alfa do fator de alongamento(EFla), um promotor da fosfoglicerato quinase-1 (PGK), umpromotor do gene inicial imediato de citomegalovirus (CMV),promotores figado-éspecificos quiméricos (LSPs), um promotorintensificador de citomegalovirus/beta-actina de galinha(CAG), um promotor responsivo à tetraciclina (TRE), um pro-motor de transtiretina (TTR), um promotor do virus simio 40(SV40) e um promotor CK6. Um promotor vantajoso útil na prá-tica da presente invenção é o promotor tardio principal deadenovirus (Berkner e Sharp. 1985. Nucl. Acids Res. 13: 841-857) . A seqüência de um vetor de expressão especificamenteexemplificado empregando o promotor tardio principal de ade-novirus é fornecida aqui embaixo. As seqüências desses e denumerosos promotores adicionais são conhecidas na técnica.As seqüências relevantes podem ser prontamente obteniveis apartir de bancos de dados públicos e incorporadas em vetorespara uso na prática da presente invenção.
Um promotor particular preferido na prática dapresente invenção é o promotor tardio principal de Adenovi-rus. Um cassete de expressão pode compreender, na direção 5'para a 3', um promotor tardio principal de adenovirus, umaseqüência lider tripartite operativamente para uma primeiraseqüência codificadora para uma proteína de interesse ou umacadeia de proteína de interesse, uma seqüência codificandouma seqüência autoprocessadora ou uma seqüência de clivagemde protease, uma segunda seqüência codificadora para umaproteína ou uma cadeia de proteína de interesse, e opcional-mente uma seqüência codificando uma seqüência autoprocessa-dora ou seqüência de clivagem de protease, seguido por umaterceira seqüência codificadora para uma proteína ou uma ca-deia de proteína de interesse. Todas essas três seqüênciascodificadoras são covalentemente unidas e na mesma estruturade leitura de forma que a tradução não é terminada na se-qüência codificadora de poliproteína. Durante a síntese deproteína ou depois do completamento da síntese do polipeptí-deo, o processamento autoprocessador ou proteolítico cliva apoliproteína nas cadeias de proteína ou nas proteínas apro-priadas. No caso da síntese de imunoglobulina, a seqüênciacodificadora para a cadeia leve está presente duas vezes naseqüência codificadora de poliproteína. Vantajosamente, asregiões que codificam a seqüência líder podem estar associa-das com as seqüências de proteína ou da cadeia de proteína;o processamento por peptidases de sinal pode ter o benefícioadicionado de remover certos resíduos de aminoácidos adicio-nais no N-terminal de proteínas à jusante dos sítios de pro-cessamento. Componentes para a cadeia pesada de imunoglobu-Iina são Met, metionina de iniciação de proteína; HC, cadeiapesada; LC, cadeia leve, SPPC, sítio de clivagem de proteaseou autoprocessador. Constructos de expressão para a síntesede imunoglobulina podem incluir os seguintes: Met-protease-SPPC-seqüência líder HC-HC-SPPC-seqüência líder LC-LC-SPPC-seqüêncía líder LC-LC; Met-protease-SPPC-seqüêncía líder LC-LC-SPPC-seqüência líder LC-LC-SPPC-seqüência líder HC-HC;Met-protease-SPPC-seqüência líder LC-LC-SPPC-seqüência líderHC-HC-SPPC-seqüência líder LC-LC; seqüência líder HC-HC-SPPC-seqüência líder LC-LC-SPPC-seqüência líder LC-LC; se-qüência líder LC-LC-SPPC-seqüência líder HC-HC-SPPC-seqüência líder LC-LC; seqüência líder LC-LC-SPPC-seqüêncialíder LC-LC-SPPC-seqüência líder HC-HC; Met-protease-SPPC-líder HC-HC-SPPC-líder LC-LC.
Uma seqüência codificadora de poliproteína especi-ficamente exemplificada (produto Met - líder HC-HC - sítiode furina projetado - sítio de clivagem TEV - protease NiaTEV - sítio de clivagem TEV - líder LC - LC é esquematica-mente mostrada na Fig. 1, e o esquema do vetor de expressãopara a expressão desse constructo é mostrado na Fig. 2. An-ti-TNFa (D2E7) é um anticorpo exemplar em relação às suasseqüências HC e LC. A seqüência líder LC pode não ser neces-sária para a produção de um anticorpo terapêutico. O SPPS éum sítio de reconhecimento de protease TEV, e há um sítio defurina codificado 5' para o sítio TEV. A clivagem da furinadepois da clivagem TEV restaura o resíduo de lisina C termi-nal "correto" à cadeia pesada. A seqüência de DNA completado vetor de expressão D2E7-TEV é mostrada na Tabela 1.
Um constructo de expressão de poliproteína D2E7especificamente exemplificado (D2E7-Lc-LC-HC) codificandouma repetição em tandem da LC e clivado usando a seqüênciada protease 2A uma vez que sítios de clivagem foram designa-dos. 0 terminal C da cadeia leve de D2E7 foi modificado paraadicionar os sítios de clivagem de furina. Isso resulta numaalteração de Glu para Arg no (normalmente) penúltimo aminoá-cido e a adição de uma lisina ao C-terminal. Pela colocaçãode duas seqüências LC 5' em relação à HC, as duas cópias deLC mantêm a mesma seqüência de aminoácidos. A seqüência denucleotídeos completa do vetor de expressão está mostrada naTabela 6C, e a seqüência de aminoácido e a seqüência codifi-cadora da poliproteína estão mostradas nas Tabelas 6B e 6A,respectivamente. Ver também as SEQ ID Nos: 29 - 31. Um mapade vetor de expressão esquemático é mostrado na Fig. 7.
Outra poliproteína especificamente exemplificada(e sua seqüência codificante) é aquela de ABT-007-TEV; veras Tabelas 2B e 2A, respectivamente. Ver as SEQ ID Nos: 33 e32. Esse anticorpo recombinante especificamente se liga aoreceptor de eritropoietina (EpoR). A seqüência completa dovetor de expressão codificando a poliproteína ABT-007-TEVprojetada é mostrada na Tabela 2C (SEQ ID NO: 35. Ver tambéma SEQ ID NO: 34. A representação esquemática do vetor é mos-trada na Fig. 3.
Uma poliproteína especificamente exemplificada a-dicional e sua seqüência codificadora é aquela da ABT-874-TEV. Ver as Tabelas 3B e 3A, respectivamente. Esse anticorpoespecificamente se liga à interleucina-12. A representaçãoesquemática do vetor de expressão é mostrada na Fig. 4. Vertambém as SEQ ID Nos: 35 - 37.
Ainda outra poliproteína especificamente exempli-ficada (e sua seqüência codificadora) é aquela da EL246-GG-TEV; ver Tabelas 4B e 4A. O anticorpo codificado ali especi-ficamente se liga à E/L selectina. 0 vetor de expressão éfornecido numa forma esquemática na Fig. 5. Ver também asSEQ ID Nos: 38 a 40.
ABT-325-TEV é um anticorpo projetado com especifi-cidade de ligação pela interleucina-18. As seqüências de a-minoácidos e codificantes da poliproteina são dadas nas Ta-belas 5A e 5B, respectivamente, e a seqüência do vetor deexpressão completa é fornecida na Tabela 5C. 0 vetor de ex-pressão para a sua síntese é mostrado na Fig. 6. Ver tambémas SEQ ID Nos: 41- 43.
Também fornecida é uma TEV protease com seu sinalde localização nuclear (NLS) removido (TEV NLS-). A TEV ouTEV (NLS-) protease pode também ser expressa na célula tran-sientemente ou estavelmente como parte de um vetor separadoou transcrito separado. A proteína TEV (NLS-) pode ser anco-rada ao ER ou ao ribossomo pela inclusão de uma seqüênciaâncora ER ou pela fusão a uma pequena proteína de ligação aoribossomo, respectivamente na porção NLS anterior.
Enquanto o presente pedido contém discussão daclivagem proteolítica de proteínas e poliproteínas precurso-ras durante a síntese ou na célula depois da síntese, é en-tendido que as poliproteínas e as proteínas precursoras(proproteínas) podem ser obtidas depois da coleta daquelasproteínas com o uso de protease (s) apropriada(s) ín vitro.
Dentro do escopo da presente invenção, anticorposexpressos particulares (imunoglobulinas) podem incluir, in-ter alia, aqueles os quais especificamente se ligam ao fatorde necrose tumoral (anticorpo projetado correspondendo ae/ou derivado de HUMIRA/D2E7; marca comercial para adalimu-mab da Abbott Biotechnology Ltd., Hamilton, Bermuda); inter-leucina-12 (anticorpo projetado derivado de ABT-874); inter-leucina-18 (anticorpo projetado derivado de ABT-325); recep-tor de eritropoietina recombinante (anticorpo projetado de-rivado de ABT-007); interleucina-18 (anticorpo projetado de-rivado de ABT-325); ou E/L selectina (anticorpo projetadoderivado de EL246-GG). Seqüências de aminoácido e codifican-tes das poliproteinas projetadas são mostradas nas Tabelas 1- 5. Outros anticorpos os quais são adequados para a presen-te invenção incluem, por exemplo, Remicade (infliximab); Ri-tuxan/Mabthera (rituximab); Herceptin (trastuzumab); Avastin(bevacizumab); Synagis (palivizumab); Erbitux (cetuximab);Reopro (abciximab); Orthoclone 0KT3 (muromonab-CD3) ; Zenapax(daclizumab); Simulect (basiliximab); Mylotarg (gemtuzumab);Campath (alemtuzumab); Zevalin (ibritumomab); Xolair (omali-zumab); Bexxar (tositumomab); e Raptiva (efalizumab); em quegeralmente um nome de marca comercial é seguido por um res-pectivo nome genérico entre parênteses. Proteínas adicionaisadequadas incluem, por exemplo, uma ou mais da alfa epoeti-na, beta epoetina, etanercept, alfa darbepoetina, filgras-tim, interferon beta la, interferon beta lb, interferon al-fa-2b, insulina glargina, somatropina, teriparatide, foli-tropina alfa, dornase, Fator VIII, Fator VII, fator IX, imi-glucerase, nesiritide, lenograstim e fator de Von Wille-brand; em que uma ou mais designações genéricas podem cadauma corresponder a um ou mais nomes de marcas comerciais deprodutos. Outros anticorpos e proteínas são adequados para apresente invenção conforme poderia ser entendido na técnica.
A presente invenção também contempla a expressãocontrolada da seqüência codificadora para dois ou mais poli-peptídeos ou proteínas ou proproteínas de interesse. Siste-mas de regulação de gene são úteis na expressão modulada deum gene ou de genes particulares. Numa abordagem exemplar,um sistema de regulação de gene ou desvio inclui um fator detranscrição quimérico que tenha um domínio de ligação a Ii-gante, um domínio de ativação transcricional e um domínio deligação a DNA. Os domínios podem ser obtidos a partir devirtualmente qualquer fonte e podem ser combinados em qual-quer uma de uma variedade de formas para obter uma nova pro-teína. Um sistema de gene regulável também inclui um elemen-to de resposta ao DNA o qual interage com o fator de trans-crição quimérico. Esse elemento regulatório de transcrição élocalizado adjacente ao gene a ser regulado.
Sistemas de regulação de transcrição exemplaresque podem ser empregados na prática da presente invenção in-cluem, por exemplo, o sistema de ecdisona Drosophila (Yao etal. 1996. Proc. Natl. Acad. Sei. 93: 3346), o sistema de ec-disona Bombyx (Suhr et al. 1998. Proc. Natl. Acad. Sei. 95:7999), o sistema de receptor de progesterona sintético Ge-neSwitch (marca registrada da Valentis, The Woodlands, TX),o qual emprega RU486 como o indutor (Osterwalder et al.2001. Proc. Natl. Acad. Sei. USA 98(22): 12596-601); os sis-temas Tet e RevTet (sistemas de expressão regulados por te-traciclina, marcas registradas da BD Biosciences Clontech,Mountain View, CA) , os quais empregam pequenas moléculas,tais como tetraciclina (Tc) ou análogos, por exemplo, doxi-ciclina, para regular (desligar ou ligar) a transcrição doalvo (Knott et al. 2002. Biotechniques 32(4): 796, 798,800); Tecnologia de Regulação ARIAD (Ariad, Cambridge, MA),a qual é baseada no uso de uma pequena molécula para manterjuntas duas moléculas intracelulares, cada uma das quais éligada ou a um ativador transcricional ou a uma proteína deligação a DNA. Quando esses componentes ficam juntos, atranscrição do gene de interesse é ativada. Ariad tem umsistema baseado na homodimerização e um sistema baseado naheterodimerização (Rivera et al. 1996. Nature Med. 2(9) :1028- 1032; Ye et al. 2000. Science 283: 88-91).
Os constructos do vetor de expressão da invençãocompreendendo seqüências de ácido nucléico codificando anti-corpos ou fragmentos seus ou outras proteínas heterólogas ouproproteínas na forma de polipeptídeos autoprocessadores ourecombinantes clivados por protease podem ser introduzidosem células in vitro, ex vivo ou in vivo para a distribuiçãode estrangeiros, terapêuticos ou transgenes para células,por exemplo, células somáticas, ou na produção de polipeptí-deos recombinantes por células transduzidas por vetor.
Células hospedeiras e distribuição de vetoresOs constructos de vetor da presente invenção podemser introduzidos em células adequadas in vivo ou ex vivo u-sando a metodologia padrão conhecida na técnica. Tais técni-cas incluem, por exemplo, transfecção usando fosfato de cál-cio, microinjeção em células cultivadas (Capecchi. 1980.Cell 22: 479-488), eletroporação (Shigekawa et al. 1988. Bi-oTechnology 6: 742-751), transferência de gene mediada porlipossomo (Mannino et al. 1988. BioTechnology 6: 682-690),transdução mediada por lipideo (Feigner et al. 1987. Proc.Natl. Acad. Sei. USA 84: 7413-7417), e a distribuição de á-cidos nucléicos usando microprojéteis de alta velocidade(Klein et al. 1987. Nature 327: 70-73).
Para a expressão in vitro ou ex vivo, qualquer cé-lula eficaz para expressar um produto de proteína funcionalpode ser empregada. Numerosos exemplos de células e de li-nhagens celulares usadas para a expressão de proteína sãoconhecidos na técnica. Por exemplo, células procarióticas ecélulas de insetos podem ser usadas para expressão. Alémdisso, microrganismos eucarióticos, tais como leveduras, po-dem ser usados. A expressão de proteínas recombinantes emsistemas procarióticos, de inseto e de levedura são geral-mente conhecidas na técnica e podem ser adaptados para a ex-pressão de anticorpo ou outra proteína usando as composiçõese métodos da presente invenção.
Exemplos de células úteis para a expressão aindaincluem células de mamíferos, tais como células de fibro-blasto, células de mamíferos não-humanos tais como célulasde ovinos, suínos, murinos e bovinos, células de insetos esemelhantes. Exemplos específicos de células de mamíferosincluem, sem limitação células COS, células VERO, célulasHeLa, células de ovário de hamster chinês (CHO), células CHODX Bl1, células CHO DG44, células PerC.6, células Sp2/0, cé-lulas 293, células NSO, células de fibroblasto 3T3, célulasW138, células BHK, células HEPG2, e células MDCK.
Células hospedeiras são cultivadas em meio nutri-ente convencional, modificadas conforme apropriado para in-duzir promotores, selecionar transformantes ou amplificar osgenes codificando as seqüências desejadas. Células hospedei-ras de mamíferos podem ser cultivadas numa variedade de mei-os. Meios comercialmente disponíveis, tais como Ham's FlO(Sigma), Meio Essencial Mínimo (MEM), Sigma), RPMI 1640(Sigma) e Meio Eagle Modificado da Dulbecco (DMEM), Sigma)são tipicamente adequados para o cultivo de células hospe-deiras. Um dado meio é geralmente suplementado conforme ne-cessário com hormônios e/ou outros fatores de crescimento(tais como insulina, transferrina ou fator de crescimentoepidermal), sais (tais como cloreto de. sódio, cálcio, magné-sio e fosfato), tampões (tais como HEPES), nucleosídeos(tais como adenosina e timidina), antibióticos, elementos detraço e glicose ou uma fonte de energia equivalente. Quais-quer outros suplementos necessários podem também ser incluí-dos em concentrações apropriadas conforme é bem conhecidopelas pessoas versadas na técnica. As condições de cultivoapropriadas para uma linhagem celular particular, tal comotemperatura, pH e semelhantes, são geralmente conhecidas natécnica, com condições de cultivo sugeridas para o cultivode várias linhagens celulares, por exemplo, no catálogo ATCC(disponível na internet em"atcc.org/SearchCatalogs/AHCollections.cfm" ou conformeinstruído pelos fornecedores comerciais.
Os vetores de expressão podem ser administrados invivo através de várias vias (por exemplo, intradermicamente,intravenosamente, intratumoralmente, no cérebro, intrapor-talmente, intraperitonealmente, intramuscularmente, na bexi-ga, etc.) para distribuir múltipos genes conectados atravésde uma seqüência de clivagem autoprocessadora para expressarduas ou mais proteínas ou polipeptídeos em modelos animaisou em indivíduos humanos. Dependentes da via de administra-ção, as proteínas terapêuticas eliciam seus efeitos local-mente (no cérebro ou na bexiga) ou sistemicamente (outrasvias de administração). 0 uso de promotores 5' específicosde tecido para a(s) estrutura(s) de leitura aberta(s) resul-ta na expressão específica de tecido das proteínas ou poli-peptídeos codificados pela estrutura de leitura aberta inteira.
Vários métodos que introduzem um vetor de expres-são recombinante executando um transgene nas células alvo invitro, ex vivo ou in vivo foram anteriormente descritos, esão bem conhecidos na técnica. A presente invenção propor-ciona para métodos terapêuticos, vacinas e terapias de cân-cer pela infecção de células alvejadas com os vetores recom-binantes contendo a seqüência codificadora para duas ou maisproteínas ou polipeptídeos de interesse, e expressando asproteínas ou polipeptídeos na célula alvejada.
Por exemplo, a distribuição in vivo dos vetoresrecombinantes da invenção pode ser alvejada para uma amplavariedade de tipos de órgãos incluindo, mas sem se limitar,ao cérebro, fígado, vasos sangüíneos, músculo, coração, pul-mão e pele.No caso da transferência de gene ex vivo, as célu-las alvo são removidas do hospedeiro e geneticamente modifi-cadas no laboratório usando vetores recombinantes da presen-te invenção e métodos bem conhecidos na técnica.
Os vetores recombinantes da invenção podem ser ad-ministrados usando modos convencionais de administração in-cluindo, mas sem se limitar, aos modos descritos acima. Osvetores recombinantes da invenção podem estar numa variedadede formulações as quais incluem, mas não estão limitadas, asoluções e suspensões líquidas, microvesicuias, lipossomas esoluções de infusão ou injetáveis. A forma preferida dependedo modo de administração e da aplicação terapêutica.
Vantagens dos presentes constructos de vetor deexpressão recombinantes inventivos da invenção na produçãode imunoglobulina ou outra proteína biologicamente ativa invivo incluem a administração de um único vetor para a ex-pressão de anticorpo sustentada e de longa duração nos paci-entes; a expressão in vivo de um anticorpo ou fragmento seu(ou outra proteína biologicamente ativa) com atividades bio-lógicas completas; e as modificações pós-traducionais natu-rais do anticorpo gerado em células humanas. Desejavelmente,a proteína expressa é idêntica a ou suficientemente idênticaa uma proteína de ocorrência natural de forma que as respos-tas imunológicas não são disparadas onde a proteína expressaé administrada a em múltiplas ocasiões ou expressa continua-mente num paciente necessitado da referida proteína.
Os constructos de vetor recombinante da presenteinvenção encontram utilidade adicional na produção in vitrode anticorpos recombinantes e outras proteínas biologicamen-te ativas para uso na terapia ou na pesquisa. Métodos para aprodução de proteína recombinante são bem conhecidos na téc-nica e podem ser utilizados para a expressão de anticorposrecombinantes usando o sítio de clivagem autoprocessador ououtros constructos de vetor contendo sítio de clivagem deprotease aqui descritos.
Num aspecto, a invenção proporciona métodos para aprodução de uma imunoglobulina recombinante ou um fragmentoseu, pela introdução de um vetor de expressão, tal como des-crito acima numa célula para obter uma célula transfectada,em que o vetor compreende na direção de 5' para 3': um pro-motor operativamente ligado às seqüências codificadoras paraas cadeias pesada e as duas leves de imunoglobulina ou frag-mento seu, uma seqüência autoprocessadora tal como uma se-qüência 2A ou tipo 2A ou sítio de clivagem de protease entrecada uma das referidas cadeias. É percebido que a seqüênciacodificadora ou para a cadeia pesada de imunoglobulina oupara a seqüência codificadora para a cadeia leve de imuno-globulina pode ser 5' em relação à seqüência 2A (isto é,primeira) num dado constructo de vetor. Alternativamente, ocognato de protease em relação ao sítio de clivagem da pro-tease pode ser expresso como parte da poliproteína de formaque ele é ou autoprocessado a partir do restante da polipro-teína ou proteoliticamente clivado por uma protease separada(ou a mesma). Outras proteínas de múltiplas cadeias ou ou-tras proteínas (tais como aquelas dos sistemas de dois outrês híbridos) podem ser expressas na forma ativa, processa-da pela substituição das seqüências codificantes relevantes,interespaçadas por sítios autoprocessadores ou por sítios dereconhecimento de protease corretamente dimensionados, pro-teínas separadas são produzidas.
A abordagem do sistema de dois (e outros) híbridostem sido usada para fazer a triagem de bibliotecas de DNAcpara parceiros de ligação anteriormente não-reconhecidos pa-ra um ligante conhecido ou subunidade de um complexo de pro-teína. Com variações apropriadas para esse sistema, proteí-nas ou subunidades as quais inibem, competem ou rompem a li-gação num complexo conhecido podem também ser identificadas.
Embora os sistemas de dois (e outros) híbridos tenham sidoaplicados a uma variedade de questionamentos científicos,esses sistemas podem ser ineficientes devido à freqüência designificância de resultados falso positivos ou falso negati-vos. Aqueles falsos sinais têm sido, pelo menos em algunsexemplos, atribuídos a um desequilíbrio na expressão relati-va da proteína isca em relação às proteínas parceiras de li-gação candidatas ou às proteínas rompedoras candidatas. Umavantagem adicional da estratégia da presente invenção é quesomente um plasmídeo é transfectado ou transformado na célu-la hospedeira, e somente uma única seleção é necessária paraaquele plasmídeo, ao invés de duas seleções nos esquemas dedois híbridos de vetor binário. A tentativa também pode seradaptada para uso em sistemas de três híbridos. Para discus-sões dos sistemas de dois híbridos, ver Toby e Golemis.2001. Methods 24: 201-217; Vidal e Legrain. 1999. Nucl. Ac-ids Res. 27: 919-929; Drees, B. 1999. Curr. 0p. Chem. Biol.3: 64-70; e Fields e Song. 1989. Nature 340: 245-246. Fig. 9mostra uma representação esquemática de uma estratégia deexpressão de clivagem de protease ou poliproteí-na/autoprocessadora para proteínas iscas (bait) e vítimas(prey) (ou proteínas vítimas candidatas), e Fig. 8 mostra umvetor contendo um cassete de expressão para a produção deproteínas iscas e vítimas usando essa abordagem. 0 cassetede expressão do vetor é estruturado para traduzir a proteínaisca primeiro como uma fusão de GAL4::isca::peptídeo 2A, aqual é autoprocessada depois da tradução do peptídeo 2A. Asegunda estrutura de leitura aberta (ORF) é uma proteína defusão NfcapaB::biblioteca. A projeção da proteína isca emMCSl requer uma tradição na estrutura na seqüência de peptí-deo autoprocessadora 2A. A projeção de uma biblioteca de ex-pressão no MCS2 à jusante é menos crítica.
A estratégia aqui fornecida pode ser semelhante-mente adaptada à expressão de proteínas que são expressascomo proformas que são processadas na forma madura e ativapor clivagem proteolítica, proporcionando dessa forma compo-sições e métodos para a expressão recombinante. Exemplos detais proteínas incluem, mas não estão limitados, às inter-leucinas 1 e 18 (IL-1 e IL-18), insulina, dentre outros. IL-1 e IL-18 são produzidas no citoplasma de células inflamató-rias. Essas moléculas não têm um sinal de secreção tradicio-nal e devem ser clivadas por uma protease para serem secre-tadas como a forma biologicamente ativa. IL-I é processadapara a forma madura pela enzima conversora de interleucina(ICE) . Pro-IL-18 é convertida na IL-18 madura por caspases.A produção dessas moléculas na forma recombinante é difícilporque as células freqüentemente usadas como hospedeiros nãoexpressam as proteases necessárias para produzir formas ma-duras biologicamente ativas dessas proteínas. A expressãodessas citocinas sem os domínios pro leva a moléculas inati-vas e/ou a baixos níveis de produção. A presente invençãoproporciona produtos de tradução primários os quais contêmum sítio autoprocessador projetado (por exemplo, uma seqüên-cia 2A) ou um sítio de clivagem de protease inserido entre odomínio pro e o aminoácido do polipeptídeo maduro, sem a ne-cessidade de expressar uma protease potencialmente tóxicajuntamente com a proteína de interesse.
Num aspecto relacionado, a invenção proporciona ummétodo para a produção de uma imunoglobulina recombinante ouum fragmento seu, pela introdução de um vetor de expressãotal como descrito acima numa célula, em que o vetor aindacompreende um sítio de clivagem proteolítico adicional entrea primeira e a segunda seqüências codificadoras de imunoglo-bulina. Um sítio de clivagem proteolítico adicional é um sí-tio de clivagem de furina com a seqüência de consenso RXK/R-R (SEQ ID NO: 1). Para uma discussão, ver a Publicação daPatente Americana 2005/0003482A1.
Num aspecto exemplar da invenção, a introdução ouadministração do vetor para uma célula é seguida por um oumais dos seguintes passos: cultivo da célula transfectadasob condições para a seleção de uma célula e a expressão dapoliproteína ou proproteína; a medição da expressão da imu-noglobulina ou do fragmento seu ou outra(s) proteína(s); e acoleta da imunoglobulina ou de seu fragmento ou outra(s)proteínas(s).
Outro aspecto da invenção proporciona uma célulapara expressar uma imunoglobulina recombinante ou um frag-mento seu ou outra (s) proteína(s) ou proteína de interesse,em que a célula compreende um vetor de expressão para a ex-pressão de duas ou mais cadeias de imunoglobulina ou frag-mentos seus ou outra proproteína ou proteínas, um promotoroperativamente ligado a uma primeira seqüência codificantepara uma imunoglobulina ou outra cadeia ou fragmento seu,uma seqüência autoprocessadora ou outra codificante de cli-vagem, tal como uma seqüência 2A ou tipo 2A ou um sítio dereconhecimento da protease, e uma segunda seqüência codifi-cadora para uma imunoglobulina ou outra cadeia ou fragmentoseu, em que a seqüencia de clivagem autoprocessadora ou se-qüência codificadora do sítio de reconhecimento da proteaseé inserida entre a primeira e a segunda seqüências codifica-doras. Num aspecto relacionado, a célula compreende um vetorde expressão conforme descrito acima, em que o vetor de ex-pressão ainda compreende um sítio de clivagem proteolíticoadicional entre a primeira e a segunda imunoglobulina ou ou-tras seqüências codificadoras de interesse. Um sítio de cli-vagem proteolítico adicional preferido é um sítio de cliva-gem de furina com a seqüência de consenso RXR/K-R (SEQ IDNO:1).
Conforme aqui utilizado, "a seqüência codificadorapara uma primeira cadeia de uma molécula de imunoglobulinaou um fragmento seu" se refere a uma seqüência de ácido nu-cléico codificando uma molécula de proteína incluindo, massem se limitar, a uma cadeia leve ou a uma cadeia pesada pa-ra um anticorpo ou imunoglobulina, ou um fragmento seu.
Conforme aqui utilizado, uma "seqüência codifica-dora para uma segunda cadeia de uma molécula de imunoglobu-lina ou um fragmento seu" se refere a uma seqüência de ácidonucléico codificando uma molécula de proteína incluindo, massem se limitar, a uma cadeia leve ou a uma cadeia pesada pa-ra um anticorpo ou imunoglobulina, ou um fragmento seu. Éentendido, num aspecto da presente invenção, que a expressãomelhorada resulta quando há duas cópias da seqüência da ca-deia leve de imunoglobulina por cópia da seqüência codifica-dora da cadeia pesada.
A seqüência codificando a primeira ou a segundacadeia para um anticorpo ou imunoglobulina ou um fragmentoseu inclui uma cadeia pesada ou um fragmento seu derivado deuma IgG, IgM, IgD, IgE ou IgA. Conforme amplamente estabele-cido, a seqüência codificando a cadeia para um anticorpo ouimunoglobulina ou um fragmento seu também inclui a cadeialeve ou um fragmento seu de uma IgG, IgM, IgD, IgE ou IgA.Genes para moléculas de anticorpo inteiras, assim como for-mas modificadas ou derivadas delas incluem, por exemplo, ou-tros fragmentos de moléculas de reconhecimento de antígenocomo Fab, Fv de cadeia única (scFv) e F(ab')2- Os anticorpose fragmentos podem ser derivados de animais, quiméricos hu-mano-camundongo, humanizados, alterados por Deimmunisation™(Biovation Ltd), alterados para mudar a afinidade pelos re-ceptores Fc ou completamente humanos. Desejavelmente, o an-ticorpo ou outra proteína recombinante não elicia uma res-posta imune num humano ou animal ao qual ele é administrado.
Os anticorpos podem ser biespecíficos e incluem,mas não estão limitados, a dianticorpos, quadroma, minianti-corpos, anticorpos ScBs e anticorpos "saliências-nos-orifícios" (knob-into-holes).
A produção e recuperação dos próprios anticorpospode ser alcançada de várias formas bem conhecidas na técni-ca (Harlow et al. 1988. Antibodies, A Laboratory Manual,Cold Spring Harbor Laboratory. Outras proteínas de interessesão coletadas e/ou purificadas e/ou usadas de acordo com osmétodos bem conhecidos na técnica.
Na prática da invenção, a produção de um anticorpoou variante sua (análogo) usando tecnologia de DNA recombi-nante pode ser alcançada pelo cultivo de uma célula hospe-deira recombinante modificada sob condições de cultivo apro-priadas para o crescimento da célula hospedeira e a expres-são das seqüências codificantes. Para monitorar o sucesso daexpressão, os níveis de anticorpo em relação ao antígeno po-dem ser monitorados usando técnicas padronizadas tais comoELISA, RIA e semelhantes. Os anticorpos são recuperados apartir do sobrenadante da cultura usando técnicas padrõesconhecidas na técnica. Formas purificadas desses anticorpospodem, é claro, ser prontamente preparadas por técnicas depurificação padronizadas incluindo, mas sem se limitar, acromatografia de afinidade através de colunas de proteína A,proteína G ou proteína L, ou em relação ao antígeno particu-lar, ou mesmo em relação ao epítopo particular do antígenopara o qual é desejada especialidade. Anticorpos podem tam-bém ser purificados com cromatografia convencional, tal comouma coluna de exclusão de tamanho ou troca iônica, juntamen-te com outras tecnologias, tais como precipitação com sulfa-to de amônia e filtração em membrana limitada por tamanho.Onde os sistemas de expressão são designados para incluirpeptideos de sinal, os anticorpos resultantes são secretadosno meio de cultura ou sobrenadante; entretanto, a produçãointracelular também é possível.
A produção e seleção de anticorpos monoclonaiscompletamente humanos, antígeno-específicos de camundongosprojetados com locais de IgG humana, foi previamente descri-ta (Jakobovits et al. 1998. Advanced Drug Delivery Reviews31: 33-42; Mendez et al. 1997. Nature Genetics 15: 146-156;Jakobovits et al. 1995. Curr Opin Biotechnol 6: 561-566;Green et al. 1994. Nature Genetics Vol. 7: 13-21).
O alto nível de expressão de anticorpos monoclo-nais terapêuticos foi alcançado no leite de cabras transgê-nicas, e foi demonstrado que os níveis de ligação a antígenosão equivalentes àqueles dos anticorpos monoclonais produzi-dos usando a tecnologia de cultura de células convencional.Esse método é baseado no desenvolvimento de proteínas tera-pêuticas humanas no leite de animais transgênicos, os quaiscarregam informação genética permitindo que eles expressemproteínas terapêuticas humanas nos seus leites. Uma vez elassão produzidas, essas proteínas recombinantes podem ser efi-cientemente purificadas do leite usando tecnologia padrão.Ver, por exemplo, Pollock et al. 1999. J. Immunol. Meth.231: 147-157 e Young et al. 1998. Res. Immunol. 149(6): 609-610. 0 leite animal, a clara de ovo, sangue, urina, plasmaseminal e casulos do bicho da seda de animais transgênicosdemonstraram potencial como fontes para a produção de prote-inas recombinantes em escala industrial (Houdebine L M.2002. Curr Opin Biotechnol 13: 625-629; Little et al. 2000.Immunol Today, 21 (8): 364-70; e Gura T. 2002. Nature, 417:584-5860. A invenção contempla o uso de sistemas de expres-são de animais transgênicos para a expressão de um recombi-nante de um anticorpo ou variante (análogo) ou outra(s) pro-teína (s) de interesse seu usando os vetores do sítio de re-conhecimento de protease e/ou codificadores de sítio de di-va gem autoprocessadores da invenção.
A produção de proteínas recombinantes nas plantastambém foi demonstrada com sucesso incluindo, mas sem se li-mitar, a batatas, tomates, tabaco, arroz e outras plantastransformadas por infecção com Agrobacterium, transformaçãobiolística, transformação com protoplasto e semelhantes. Aexpressão de GM-CSF humana recombinante nas sementes deplantas de tabaco transgênicas e a expressão de anticorposincluindo anticorpos de cadeia individual em plantas foi de-monstrada. Ver, por exemplo, Streaffield e Howard. 2003.Int. J. Parasitol. 33: 479-93; Schillberg et al. 2003. CellMol Life Sei. 60: 433A5; Pogue et al. 2002. Annu. Rev. Phy-topathol. 40: 45-74; e McCormick et al. 2003. J Immunologi-cal Methods, 278: 95-104. A invenção contempla o uso de sis-temas de expressão vegetal transgênicos para a expressão deuma imunoglobulina recombinante ou fragmento seu ou outra(s)proteína (s) de interesse usando o sitio de clivagem da pro-tease ou os vetores que codificam o sitio de clivagem auto-processador da invenção.
Sistemas de expressão de vetor de baculovirus jun-tamente com células de inseto estão também ganhando terrenocomo uma plataforma viável para a produção de proteína re-combinante. Sistemas de expressão de vetor de baculovirusforam reportados por proporcionar vantagens em relação àcultura de células de mamíferos tais como facilidade de cul-tivo e níveis de expressão mais elevados. Ver, por exemplo,Ghosh et al. 2002. Mol Ther. 6: 5-11, e Ikonomou et al.2003. Appl Microbiol Biotechnol. 62: 1-20. A invenção aindacontempla o uso de sistemas de expressão de vetor de baculo-virus para a expressão de uma imunoglobulina recombinante oufragmento seu usando os vetores codificadores de sítio declivagem autoprocessador da invenção. Vetores de baculoviruse células hospedeiras adequadas são bem conhecidas na técni-ca e são comercialmente disponíveis.
Sistemas baseados em levedura também podem ser em-pregados para expressão de uma imunoglobulina recombinanteou fragmento seu ou outra (s) proteína (s) de interesse, in-cluindo sistemas de dois ou três-híbridos, usando os vetorescodificadores de sítio de clivagem autoprocessador da inven-ção. Ver, por exemplo, Patente Americana No. 5.643.745, aquiincorporada por referência.
É entendido que os vetores e cassetes de expressãoe as células hospedeiras recombinantes da presente invenção,as quais compreendem as seqüências codificadoras para umpeptideo autoprocessador sozinho ou em combinação com se-qüências codificadoras adicionais para um sitio de clivagemproteolitico encontram utilidade na expressão de imunoglobu-linas recombinantes ou fragmentos seus, proproteinas, prote-inas biologicamente ativas e componentes de proteína de sis-temas de dois e três híbridos, em qualquer sistema de ex-pressão de proteína, uma variedade dos quais são conhecidosna técnica e exemplos dos quais são aqui descritos. Uma pes-soa versada na técnica pode facilmente adaptar os vetores dainvenção para uso em qualquer sistema de expressão de proteína.
Quando um composto, constructo ou composição éreivindicado, deve ser entendido que compostos, constructose composições conhecidas na técnica, incluindo aqueles ensi-nados nas referências aqui reveladas, não são tencionadospara serem incluídos. Quando um grupo Markush ou outro agru-pamento é aqui utilizado, todos os membros individuais dogrupo e todas as combinações e subcombinações possíveis dedentro do grupo são tencionadas para serem individualmenteincluídas na descoberta.
Exemplo 1. Expressão de imunoglobulinas com pro-cessamento mediado por inteína
Uma estratégia para a eficiente expressão de molé-culas de anticorpo é através da expressão de poliproteínas,em que uma inteína está localizada entre as cadeias pesada eleve, com modificação da seqüência de inteína e/ou seqüên-cias de junção de forma que haja a liberação das proteínascomponentes sem ligação das proteínas N-terminais e C-terminais. Dentro de tais constructos, pode haver uma cópiade cada uma das cadeias pesada e leve relevantes, ou a ca-deia leve pode ser duplicada, ou pode haver múltiplas cópiastanto da cadeia pesada quanto da leve, com a condição de quea seqüência de clivagem funcional é fornecida para promovera separação de cada proteína derivada de imunoglobulina napoliproteina. A estratégia da inteína pode ser empregadamais de uma vez ou uma seqüência ou enzima de processamentoproteolítico diferente pode ser posicionada pelo menos numterminal de uma proteína derivada de imunoglobulina.
A inteína de Pyrococcus horikoshii foi aqui incor-porada num constructo conforme resumidamente descrito acimae foi demonstrada como produzindo com sucesso anticorpo D2E7completamente funcional e corretamente processado. Inteínasadicionais testadas são de Saceharomyces eerevisiae e da ce-pa PCC6803 de Synechoeystis spp. e foram demonstradas comoprodutoras de anticorpo secretado por ELISA.
Amplificação por PCR e subclonagem da inteína PhoPol I de Pyroeoeeus horikoshii:
Os seguintes oligonucleotídeos foram usados para aamplificação da inteína Pho Pol I de P. hor ikoshii (# de a-cesso da proteína NCBI 059610, o # de aceso GenBank para aseqüência de DNA da. DNA polimerase I inteira éBA000001.2:1686361..1690068 conforme tomado da seqüência ge-nômica inteira para P. hor ikoshii) usando DNA genômico comomolde e Platinum Taq Hi Fidelity DNA Polymerase Supermix(Invitrogen, Carlsbad, CA) . DNA genômico foi comprado daATCC.int-5' de Ρ. horikoshii AGCATTTTACCAGATGAATGGCTCCC (SEQ IDNO:52)
int-3' de P. horikoshii AACGAGGAAGTTCTCATTATCCTCAAC (SEQ IDNO:53)
O PCR correu de acordo com o seguinte programa:Passo 12345 678
Temp 94°C 94°C 55°C 72°C Ir para o passo 272°C 4°C Fim(34 vezes)
Teitpo 2 min 1 min 1 min 2 min 5 min Esperar
O produto de PCR foi subclonado no pCR2.I-TOPO(Invitrogen) e a inserção foi seqüenciada e provada correta.Nesse momento, foi constatado que havia seqüência faltandoda extremidade 3' da inteina devido a um erro de listagem docomputador. A seqüência faltando foi, a seguir, preenchidadurante as reações de PCR subseqüentes para ligar a inteinaà cadeia pesada e leve de D2E7.
Os iniciadores de oligonucleotideo foram projeta-dos para. gerar a fusão da cadeia pesada de D2E7 - inteina -cadeia leve de D2Ee7. Os iniciadores foram designados deforma que o produto de PCR pudesse ser usado como iniciado-res em reações de PCR subseqüentes.
Item Seqüência SEQ ID NO:HC-inteína-5' AGCCTCTCCCTGTCTCCGGGTAAA- AGCATTTTACCAGATGAATG 54LC revisada- inteina-3' GGGCGGGCACGCGCATGTCCAT- GTTGTGTGCGTAAAGTAGTC 55<table>table see original document page 187</column></row><table>
Código para as seqüências para ilustrar os componentes:
Seqüência de cadeia pesada (vermelho em negrito) -Seqüência de cadeia leve (sublinhada) - Seqüência de inteinade P. horikoshi (Arial plana) - Seqüência de exteina de P.horikoshi (azul sublinhado em negrito) - Seqüência de reco-nhecimento Srfl GCCCGGGC verde (duplo sublinhado) - Seqüênjcia__de_ J_econh_ecim_ento_J3amH_I _GGATCC__(_sublinh_ado_ t_race_j_ado__vi-olet_a)_ - Códon de parada, TCA (Times New Roman, Oliva)Kozak
Amplificação por PCR e montagem da fusão cadeiapesada de D2E7 - inteina - cadeia leve de D2E7: usando oclone pCR2.1 - TOPO - inteina de p. horikoshii gerado acimacomo molde, PCR foi efetuado usando os iniciadores int-5' deP. horikoshii e 3' de P. hori revisado para restaurar a pró-pria extremidade 3' à inteina. A polimerase usada foi a DNApolimerase Pful para evitar o resíduo A que ocorre com a e-tiqueta de platina.
PCR correu de acordo com o seguinte programa:Passo 123 4 5 67 8
Temp 94°C 94°C 55°C 72°C Ir para o passo 72°C 4 °C Fim2 (34 vezes)
Tenpo 2 min 1 min 1 min 2 min 5 min Esperar
O produto de amplificação de PCR foi purificadocom gel usando o kit de extração Qiaquick Gel (Qiagen, Va-lencia, CA) . Esse produto foi usado como molde no próximogrupo de reações.
Três grupos de reações de PCR foram efetuados paragerar seqüências que codificam inteina com números variadosde resíduos de exteína 5' e 3' da seqüência codificadora deinteina. Os códons de exteína vêm do gene da DNA polimerasenatural em P. horikoshii, do qual essa inteina faz natural-mente parte. Os iniciadores foram usados como se segue: Gru-po 1 introduz zero seqüências de exteína (HC-inteína-LC re-visada e 5' - inteina - 3'), Grupo 2 introduz um aminoácido(3 pares de base) em ambas as extremidades da inteina (HC -inteina (Iaa) - LC revisada e 5' - inteina (Iaa) -3') e oGrupo 3 introduz três aminoácidos (9 pares de base) em ambasas extremidades da inteina (HC - inteina (3aa) - LC revisadae 5' - inteina (3aa) - 3').O programa de PCR foi o mesmo que o dado acima. Osprodutos de PCR foram purificados com gel usando o kit deextração de gel Qiaquick (Qiagen). Esses produtos foram usa-dos como iniciadores no próximo grupo de reações.
Três grupos de reações de PCR foram executadas pa-ra gerar a fusão da cadeia pesada de D2E7 na inteina, com 0,1 ou 3 aminoácidos de exteina no meio. 0 molde para as rea-ções é o DNA de Cadeia Pesada D2E7. Os produtos de PCR des-critos acima foram usados como os iniciadores 3', respecti-vãmente, e HC-Srfl-5' foi usado como o iniciador 5' em todasas reações. DNA polimerase Pful foi usada.
PCR correu de acordo com o seguinte programa:Passo 12345 67 8
Tertp 94°C 94°C 50°C 72°C Ir para o passo 72°C 4°C Fim2 (39 vezes)
Tempo 2 min 1 min 1 min 3 min 5 min Esperar
O produto de PCR foi purificado com gel usando okit de extração de gel Qiaquick (Qiagen) . Esse produto foiusado como iniciadores no próximo grupo de reações.
Três grupos de reações de PCR foram efetuadas paragerar a fusão da cadeia pesada de D2E7 - inteina para a ca-deia leve de D2E7, com 0, 1 ou 3 aminoácidos de exteina nomeio. O molde para as reações é o DNA da cadeia leve deD2E7. Os produtos de PCR descritos diretamente acima foramusados como iniciadores 5', respectivamente, e LC-BamHI-3'foi usado como o iniciador 3' em todas as reações. DNA poli-merase Pful foi usada.
PCR correu de acordo com o seguinte programa:<table>table see original document page 190</column></row><table>
0 produto de PCR produzido foi difuso e esparsoquando corrido num gel. Essas reações foram diretamente usa-das como molde no ciclo final de PCR, usando HC-Srfl-5' eLC-BamHI-3' como iniciadores. DNA polimerase Pful foi usada.
0 mesmo programa de PCR foi usado conforme estabelecido aci-ma. Produtos de PCR foram purificados com gel usando o kitde extração em gel Qiaquick (Qiagen).
Os produtos de PCR purificados descritos acima fo-ram subclonados em pCR-Bluntll-TOPO (Invitrogen) usando okit de clonagem de PCR Zero Blunt TOPO (Invitrogen). Os clo-nes foram seqüenciados para verificar que os constructos e-xibiram as seqüências de ácido nucléico esperadas. Os clonescorretos foram encontrados para cada tipo de produto. 0 cas-sete cadeia pesada de D2E7 - inteina - cadeia leve de D2E7foi cortado do pCR - Bluntll - TOPO usando Srfl e Notl esubclonado no pTT3 restrito com as mesmas enzimas e purifi-cado com gel.
Três constructos de expressão para a cadeia pesadaD2E7 - inteina - cadeia leve D2E7, utilizando a inteina P.horikoshii foram designados: pTT3-HcintLC-p.hori (Ver Fig.14 para mapa de plasmideo); pTT3-HcintLClaa-p.hori; e pTT3-HcintLC3aa-p.hori.
Tabela 10A. Seqüência de nucleotideo da pTT3-HcintLC-p.hori (SEQ ID NO: 62)gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaa
tagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatc
tctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagt
gcatgtaatcccttcagttggttggtacaacítgccaactgggccctgttccacatgtgacacggggggggaccaaac
acaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctgg
agcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctg
ggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgta
gctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagc
atatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttaca
tggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagt
gaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgt
atgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcatt
gtgGtatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatct
ttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggc
aacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccat
gttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacac
ccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgt
ggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggct
gattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgc
ataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctga
gcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagc
atatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggt
agcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatc
tgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaata
gagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatccta
atctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgct
atcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcat
atgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtc
aaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttct
tagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatcc
gctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtc
gcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagat
cagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaa
cgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggçaagagcaactc
ggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatga
cagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcgga
ggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctg
aatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactatta
actggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccactt
ctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgca
gcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacg
aaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatacttta
gattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacg
tgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatct
gctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaa
ggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaac
tctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttacc
gggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagccc
agcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaa
gggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggg
ggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg
gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttc
ctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgacc
gagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggc
cgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagt
tagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatt
tcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttát
catcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctat
atcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatc
aattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgac
cgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgac
gtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctatt
gacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtaca
tctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcac
ggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgt
cgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgttt
agtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaac
tcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgag
cgagtecgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgag
caccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggc
ggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaa
aagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggcc
atacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccacc
atggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctgg
attcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcactt
ggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactc
cctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcacc
gcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttcc
ccçtggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcGtggtcaaggactacttccccga
accggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcag
gactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatc
acaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccg
tgcccagcacctgaactoctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcc
cggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtgg
acggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcag
cgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctccca
gcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatc
ccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtg
gagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttc
ttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatga
ggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctçagggatgtagtgagcttaatgccaatagaagaactíaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatg
acccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcaga
aattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcag
gggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgt
tgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtac
ggtggctgcaccatctgtcttcatcttoccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctg
aataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggaga
gtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagacta
cgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacag
gggagagtgt -3'
Tabela IOB: Seqüência de aminoácidos da estrutura
de leitura aberta no pTT3-HcintLC-p.hori (SEQ ID NO: 63)
Mefglswlflvailkgvqcevqlvesggglvqpgrslrlscaasgftfddyamhwvrqapgkglewvsaitwnsghid
yadsvegrftlsrdnaknslylqmnslraedtavyycakvsylstassldywgqgtlvtvssastkgpsvfplapsskst
sggtaalgclvkdyfpepvtvswnsgaltsgvhtfpavlqssglyslssvvtvpssslgtqtyicnvnhkpsntkvdkkv
epkscdkthtcppcpapellggpsvflfppkpkdtlmísrtpevtcwvdvshedpevkfnwyvdgvevhnaktkpr
eeqynstyrwsvltvlhqdwlngkeykckvsnkalpapiektiskakgqprepqvytlppsrdeltkriqvsltclvkgfy
psdíavewesngqpennykttppvldsdgsfflyskltvdksrwqqgnvfscsvmhealhnhytqkslslspgk-
silpdewlpivenelwrfvkigdfidreieenaervkrdgeteilevkdl^
ksgrrikitsghslfsvkngklvkvrgdelkpgdl\^pgriklpeskqvlnlveniklpeeetsnivmmipvkgrknffkg
mlktlywifgegerprtagryíkhlerigyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefn
pieèlkewiigeprgpkigtfidvddsfaklIgyyissgdvekdrvkfhskdqnvIediaklaeWfgkvrrgrgyievsgki
shaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyi
divldsvesievekyegyvydlsvednenflvgfgllyahn-
mdmrvpaqllgllllwfpgsrcdiqmtqspsslsasvgdrvtitcrasqgirnylawyqqkpgkapklliyaastlqsgvpsrfsgsgsgtdftltísslqpedvatyycqrynrapytfgqgtkveikrtvaapsvfifppsdeqlksgtasvvcllnnfypreakvqwkvdnalqsgnsqesvteqdskdstyslsstltlskadyekhkvyacevthqglsspvtksfnrgec
Texto/Simbolo de fonte para as seqüências:
Vetor pTT3 - Cadeia pesada - inteina - Cadeia leve
Nos 2 constructos a seguir, a única diferença doconstructo acima é a inclusão das seqüências de exteina na-turais para P. horikoshii (sublinhado). As seqüências mos-tradas são de uma extremidade da região codificadora da ca-deia pesada D2E7 (últimos 9 pares de base conforme mostradosem vermelho) até a extremidade 5' da região codificadora dacadeia leve de D2E7 (primeiros 9 pares de base conforme mos-trados em rossa, numa linha separada).Tabela 11A. Seqüência codificadora parcial de
pTT3-HcintLClaa-p.hori (SEQ ID NO: 64)5'-ccgggtaaa-
aaçagcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatag
atagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaa
agccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattca
gggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaa
aaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaact
tccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgta
atgatgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggaggga
gaaaggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggc
tgtgaagttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataac
ggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaagg
agtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggtt
actacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatat
agcgaaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagc
catgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagc
cttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatcct
tctcctgaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaag
gaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatct
aagtgttgaqgataatgagaacttcctcgttqgcttcggactactttacgcacacaacacrt-
atggacatg-3'
Tabela 11B. Seqüência de aminoácidos parcial depTT3-HcintLClaa-p.hori mostrando 4 aminoácidos à montante dacadeia pesada e quatro aminoácidos à jusante da inteina (SEQID NO: 65).
Pgknsilpdewlpivenekvrfvldgdfidreieenaeivkrdgeteilevkdlkalsfnretkkselkkvkaltr
ysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgríklpeskqvlnlvelllklpeeetsnivmmipvkgrk
nffkgmlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdv
vslmpieelkewilgeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyie
vsgkishaifivlaegkripefiftspmdikvaflkgingnaeeltfst^
essngdivldsvesievekyegyvydlsvednenflvgfgllyahn-s-mdm
Seqüência 3' da cadeia pesada - inteina - exteina- seqüência 5' da cadeia leve
Tabela 12A. Seqüência codificadora parcial depTT3-HcintLC3aa-p.hori (SEQ ID NO: 66)5'- ccgggtaaa-ttagcaaac-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaatlctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaactlcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-agttattac-atggacatg-3'
Tabela 12B. Seqüência de aminoácidos parcial de
pTT3-HcintLC3aa-p.hori mostrando seqüências de flanqueamento
e inteina (SEQ ID NO: 67)Pgk-Ian-
silpdewlpivenekvrfvkigdfidreieenaervkrdgetete^
ksgrrikitsghsIfsvkngklvkvrgdelkpgdlvwpgHklpeskqvInlvelllWpeeetsnivmmipvkgrknffk^
mlktlywifgegerprtagrylkhlerigyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnsl^
pleelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgki
shaifrvlaegkripefiftspmdilwaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyi
dlvldsvesievekyegyvydlsvednenflvgfgllyahn-syy-mdm
5 Seqüência 3' da cadeia pesada - inteina - exteina
- seqüência 5' da cadeia leve
Iniciadores usados para os constructos A, Β, Ε, H,I, J, KeL foram:
YKFl:GGACTACTTTACGCAGCCAACATGGACATGC (SEQ ID N°:68)10 YKRl:GCATGTCCATGTTGGCTGCGTAAAGTAGTCC (SEQ ID N°:69)
YKF2:GGACTACTTTACGCAGCCAACAGTATGGACATGC (SEQ ID N°:70)YKR2:GCATGTCCATACTGTTGGCTGCGTAAAGTAGTCC (SEQ ID N°:71)YKF3:GGTGAGGAGAGGAAGAGG (SEQ ID N°:72)YKR3:CCAGAGGTCGAGGTCG (SEQ ID N°:73:YKF4:CGGCGTGGAGGTGC (SEQ ID N°: 74)
YKR4:CAACAATTGGGAGCCATTCATCTGGTAAAATGGTTTTACCCGGAG (SEQ IDN0:75)
YKF5:CCGCCCAGCTGCTGGGCGACGAGTGGTTCCCCGGCTCGCG (SEQ ID N°:76)YKR5:Cgcgagccggggaaccactcgtcgcccagcagctgggcgg (SEQ ID N°:77)YKF6:tgagcggccgctcga (SEQ ID N°:78)YKR6:gttgtgtgcgtaaag (SEQ ID N°:79)YKF7:agcattttaccagat (SEQ ID N°:80)YKR7:ggtggcgcccaaact (SEQ ID N°:81)YKF8:ctttacgcacacaacatggacatgcgcgtg (SEQ ID N°:82)YKR8:tcgagcggccgctcaacactctcccct (SEQ ID N°:83)YKF9:agtttgggcgccaccatggagtttgggctg (SEQ ID N°:84)YKR9:atctggtaaaatgcttttacccggagacag (SEQ ID N°:85)YKFlO:agtttgggcgccaccatggacatgcgcgtg (SEQ ID N°:86)YKRlO:atctggtaaaatgctacactctcccctgttg (SEQ ID N°:87)YKFll:ctttacgcacacaacatggagtttgggctg (SEQ ID N°:88)YKRll:tcgageggccgctcatttacccggagaeag (SEQ ID N°:89)YKF12:cgecaagctctage (SEQ ID N°:90)
Para preparar o eonstrueto A, o plasmídeo pTT3 HC-int-LC P.hori foi usado como o molde 2 e os fragmentos deDNA que se sobrepõem foram amplificados usando o iniciadorde mutagênese YKFl e o iniciador YKR3, e o iniciador de mu-tagênese YKRl com o iniciador YKF3, respectivamente. Umfragmento de DNA ligando os 2 fragmentos acima foram geradospor amplificação de PCR usando a mistura dos 2 fragmentos dePCR acima como molde, e os iniciadores YKF3 e YKR3. Essefragmento de PCR é, a seguir, cortado com as enzimas de res-trição EcoR I e Not I, e clonado no pTT3 HC-int-LC P.horicortado com as mesmas enzimas de restrição.
0 constructo B foi gerado de um modo similar quepara o constructo A, exceto que os iniciadores de mutagêneseYKF2 e YKR2 foram usados no lugar de YKFl e YKRl, e o plas-mídeo pTT3 HC-int-LC-laa P.hori foi usado como o molde dePCR no lugar do plasmideo pTT3 HC-int-LC P.hori, e o vetorpTT3 HC-int-LC P.hori foi usado como a estrutura para clonagem.
Para preparar o constructo E, um fragmento de DNAfoi amplificado usando o pia smideo pTT3 HC-int—LC-laa P.horicomo molde, e o iniciador YKF4 e o iniciador de mutagêneseYKR4. Esse fragmento de PCR foi cortado com Sac II e Mfe I,e clonado no pTT3 HC- int-LC P.hori com as mesmas enzimas derestrição.
Para o constructo H, pTT3 HC-int-LC P.hori foi u-sado como. molde 2, e os fragmentos sobrepostos foram ampli-ficados usando o iniciador de mutagênese YKF5 e o iniciadorYKR3 para um fragmento e o iniciador F3 e o iniciador de mu-tagênese R5 para o outro. Um segundo ciclo de amplificaçãode PCR foi executado usando os 2 fragmentos acima como mol-des e os iniciadores YKF3 e YKR3. Esse fragmento foi digeri-do com as enzimas de restrição EcoR I e Not I, e clonados nopTT3 HC-int-LC P.hori cortado com as mesmas enzimas.
Para preparar o constructo J, pTT3 HC-int-LCP.hori foi usado como o molde 2, e os fragmentos sobrepostosforam amplificados usando iniciador de mutagênese YKF13 e oiniciador YKR3 para um fragmento e o iniciador F3 e o inici-ador de mutagênese R13 para o outro. Um segundo ciclo de am-plificação de PCR foi executado usando os 2 fragmentos acimacomo moldes e os iniciadores YKF3 e YKR3. Esse fragmento foicortado com as enzimas de restrição EcoR I e Not I e clonadono pTT3 HC-int-LC P.hori cortado com as mesmas enzimas.
Para o constructo K, pTT3 HC-int-LC P.hori serviucomo o molde 2. Fragmentos sobrepostos foram amplificadosusando iniciador de mutagênese YKF14 e o iniciador YKR3 paraum fragmento e o iniciador F3 e o iniciador de mutagêneseR14 para o outro. Um segundo ciclo de amplificação de PCRfoi executado usando os 2 fragmentos acima como moldes e osiniciadores YKF3 e YKR3. Esse fragmento foi digerido com asenzimas de restrição EcoR I e Not I e clonado no pTT3 HC-int-LC P.hori cortado com as mesmas enzimas.
Para fazer os constructos L, usando pTT3 HC-int-LCP.hori, foi usado como molde 2, e os fragmentos sobrepostosforam amplificados usando o iniciador de mutagênese YKF15 eo iniciador YKR3 para um fragmento e o iniciador F3 e o ini-ciador de mutagênese R15 para o outro. Um segundo ciclo deamplificação de PCR foi executado usando os 2 fragmentos a-cima como moldes e os iniciadores YKF3 e YKR3. Esse fragmen-to foi digerido com as enzimas de restrição EcoR I e Not I eclonado no pTT3 HC-int-LC P.hori cortado com as mesmas enzi-mas.
As seqüências de nucleotideos de todos os cons-tructos foram verificadas. Todos os constructos têm a mesmaseqüência que pTT3 HC-int-LC P.hori, exceto para as seqüên-cias entre os últimos códons da cadeia pesada D2E7 (codifi-cando PGK) e os primeiros códons da seqüência madura da ca-deia leve de D2E7 (codificando DIQ) . Seqüências nessa regi-ão, a qual inclui wt ou uma inteina mutante juntamente comwt ou com um sinal de seqüência de cadeia leve mutante, sãofornecidas para todos os constructos conforme abaixo.
Tabela 13A. Seqüência codificante parcial do cons-tructo A (SEQ ID NO: 98)Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aágggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcagccaacatggacatgcgcgtgcccgcccagct
gctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
Tabela 13B. Seqüência de aminoácidos parcial mos-trando seqüências flanqueadoras e inteina no constructo A
(SEQ ID NO: 99).Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrd^
ksgrrikitsghslfsvkngklvkvrgdel^gdlvwpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkg
mlktlywifgegeφrtagι7lkhlerlgyvklkrrgcevldweslkιy^Wyetliknlkyngnsraymve
pieelkewilgeprgpkigtfidvddsfakllgyyissgdvekdivkfhskdqnvlediaklaekjfgkvrrgrgyievsgki
shaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlffl
divldsvesievekyegyvydlsvednenflvgfgllyaanmdmrvpaqllgllllwfpgsrc-díq
10 Tabela 14A. Seqüência codificante parcial no cons-
tructo B (SEQ ID NO: 100).Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcàgtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttafflggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcagccaacagtatggacatgcgcgtgcccgccca
gctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
Tabela 14B. Seqüência de aminoácidos parcial no
constructo B (SEQ ID NO: 101).Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgetèilevkdlkalsfnretkkselkkvkalirhrys^
ksgrrikitsghslfsvkngklvkvrgdelkpgdl\ΛΛφgrlklpeskqvlnlvellIklpeeetsni^m1mipvkgrknffkg
mltòlywifgegerprtagiylkhlerigyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdwslm
pieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgki
shaifrvlaegkripefiftspmdikvaflkglngnaeeltfstkse^
divldsvesievekyegyvydlsvednenf Ivgfgllyaansmdmrvpaqllgllllwfpgsrc-diq
Tabela 15A. Seqüência codificante parcial no cons-tructo E (SEQ ID NO: 102).Ccgggtaaa-
accattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaáaacttcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacagtatggacatgcgcgtgcccgccca
gctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag
Tabela 15B. Seqüência de aminoácidos parcial no
constructo E (SEQ ID NO: 103).Pgk-
tilpdewlpivenekvrfvtógdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalir^
sgrrikitsghslfsvkngklvkvrgdelkpgdlvwpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkg
mlktlywifgegeφrtagι7Ikhlerlgyvklkrrgcevldweslkryridyetliknlkyngnsraymvefnslrdwslm
pieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaekifgkvrrgrgyievsgki
shaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyivyinkkess
divldsvesievekyegyvydlsvednenflvgfgllyahnsmdmrvpaqllgllllwfpgsrc-diq
Tabela 16A. Seqüência codificante parcial no cons-tructo H (SEQ ID NO: 104)
Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatocttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagct
gctgggcgacgagtggttccccggctcgcgatgc-gacatccag
Tabela 16B. Seqüência de aminoácidos parcial no
constructo H (SEQ ID NO: 105).Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlto^ksgrrikitsghslfsvkngklvkvrgdelkpgdlwvpgrlklpesk^
mlktlywifgegeφrtagIylkhlΘrlgyvklkrrgcevldweslkryrklyetlikπlkyngnsraymvθfnslrdwslmpieelkewiigeprgpkígtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgkishaifrvlaegkrípefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyivyinkdivldsvesievekyegyvydlsvednenflvgfgllyahnmdmrvpaqllgdewfpgsrc-diq
Tabela 17A. Seqüência codificante parcial no cons-tructo J (SEQ ID NO: 106).Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaiaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatogaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagtg
gttccccggctcgcgatgc-gacatccagTabela 17B. Seqüência de aminoácidos parcial no
constructo J (SEQ ID NO: 107).Pgk-
silpdewlpivenelwrfvkigdfidreieenaervkrdgetete^
ksgrrikitsghslfsvkngklvkvrgdelkpgdlvwpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkg
mlktlywifgegeφrtagrylkhlθrlgyvklkrrgcevldweslkryrklyetlikn^kyngnsraymvefnslrdwslm
pieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgki
shaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyin
divldsvesievekyegyvydlsvednenflvgfgllyahnmdmrvpaqwfpgsrc-diq
Tabela 18A. Seqüência codificante parcial no cons-tructo K (SEQ ID NO: 108).Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-gacatccag
5 Tabela 18B. Seqüência de aminoácido parcial no
constructo K (SEQ ID NO: 109).Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghsIfsvkngklvkvrgdelkpgdlw^gM
mlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrklyetliknlkyngnsraymvefnslrdwslmpieelkewiigeprgpkigtfidvddsfakllgyyissgdvekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgklshaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlffldivldsvesievekyegyvydlsvednenflvgfgllyahn-diq
Tabela 19A. Seqüência codificante parcial no cons-tructo L (SEQ ID NO: 110).Ccgggtaaa-
agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatag
ggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagc
cctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggg
aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacctcaggtcatagtctgttctcagtaaaaaat
ggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttcca
gaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgat
gatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatcttcggggagggagaaa
ggccaagaaccgcagggcgctatctcaagcatcttgaaagattaggatacgttaagctcaagagaagaggctgtga
agttctcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaa
tagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtgg
ataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactac
ataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcga
aacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgc
catatttagagttttagcggaaggtaagagaattccagagttcatcttcacatccccaatggatattaaggtagccttcctt
aagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcct
gaactccattggagtttcggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatc
ctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtg
ttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagct
gctgggcctgctgctgctgtggttccccggctcgggaggc-gacatccag
Tabela 19B. Seqüência de aminoácidos parcial no
constructo L (SEQ ID NO: 111).Pgk-
silpdewlpivenekvrfvkigdfidreieenaervkrdgeteite^
ksgrrikitsghslfsvkngklvkvrgdelkpgdlvwpgrlklpeskqvlnlveillklpeeetsnivmmipvkgrknffkg
mlktlywifgegerprtagrylkhlerlgyvklkrrgcevldweslkryrt<lyetliknlkyngnsraymvefnslrdwslm
pieelkewiigeprgpkigtfidvddsfakllgyyissgch/ekdrvkfhskdqnvlediaklaeklfgkvrrgrgyievsgki
shaifrvlaegkripefiftspmdikvaflkglngnaeeltfstksellvnqlilllnsigvsdikiehekgvyrvyinkke
dívldsvesievekyegyvydlsvednenflvgfgllyahnmdmrvpaqllgllllwfpgsgg-diq
Seqüência 3' de cadeia pesada - inteina + seqüên-cia de peptideo de sinal de cadeia leve - seqüência madurade cadeia leve.
Os seguintes oligonucleotideos foram usados para aamplificação da inteina VMA de Saccharomyces cerevisiae (#de acesso GenBank AB093499) usando DNA genômico como molde ea DNA polimerase Pfu-I Hi Fidelity (Stratagene). DNA genômi-co foi preparado a partir de uma cultura de Saccharomycescerevisiae usando o kit Yeast-Geno-DNA-Template (G Bioscien-ces, # cat. 786-134).
Inteina 5' VMA Sce: TGCTTTGCCAAGGGTACCAATGTTTT(SEQ ID NO:112).
Inteina 3' VMA Sce: ATTATGGACGACAACCTGGTTGGCAA(SEQ ID NO:113) .
PCR correu de acordo com o seguinte programa:Passo 12345 67 8
Temp 94 0C 94 0C 55 0C 72 0C Ir para o passo 72 0C 4 0C Fim
2 (39 vezes)
Tertpo 2 min 1 min 1 min 2 min 5 min Esperar
0 produto de PCR foi usado como molde usando osseguintes pares de iniciadores para produzir versões de Oaa,Iaa ou 3aa da inteina como para os constructos de inteina deP. horikoshii. Foi usada a DNA polimerase Pfu^I Hi Fidelity(Stratagene).
Sce-5'-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCTTTGCCAAGGGTACCAATGTTTT (SEQ ID N°:114)
Sce-5'-Iaa-Sap
CCGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGGGTGCTTTGCCAAGGGTACCAATGTTTT (SEQ ID N°:115)
Sce-3'-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATTATGGACGACAACCTGGTTGGCAA (SEQ ID N0:117)
Sce-3'-Iaa-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAATTATGGACGACAACCTGGTTGGCAA (SEQ ID N°:118)
Sce-3'-3aa-Van911
CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATTTCTCCGCAATTATGGACGACAACCTGGTTGGCAA (SEQ ID N°:119)PCR correu usando o mesmo programa fornecido aci-ma. O produto de PCR de cada tipo reacional foi subclonadono pCR-Bluntll-TOPO (Invitrogen) e a inserção de cada tipofoi seqüenciada e provada como sendo correta.
Iniciadores de oligonucleotideo foram designadospara gerar a fusão da Cadeia Pesada D2E7 - Inteina - CadeiaLeve D2E7 através da recombinação homóloga no constructopTT3-HcintLC p. horikoshii em E. coli. Pelo projeto de umaprojeção de 40 pares de base entre o vetor gerado por PRC(contendo o vetor pTT3, as regiões de cadeia pesada e de ca-deia leve nas não a inteina de P. horikoshii) e a inserçãode inteina VMA, os dois DNAs podem ser misturados e trans-formados na E. coli sem o beneficio da ligação, resultandona recombinação homóloga de E. coli dos dois fragmentos nopTT3-HC-VMAint-LC nas versões de Oaa, Iaa e 3aa.
Iniciadores de recombinação homólogos de VMA:
VMA-HR5':
CCACTACACGCGAAAGAGCCTCTCCCTGTCTCCGGGTAA (SEQ IDN0:120)
VMA-HR3':
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCAT (SEQ IDN0:121)
Iniciadores de recombinação homólogos pTT3-HcintLC:
Ptt3int-HR5':
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC (SEQ IDN0 :122)
pTT3int-HR3':TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT (SEQ IDN0:123)
PCR para inteína correu no seguinte programa: DNApolimerase Pfu-I Hi Fidelity (Stratagene) usada.
<table>table see original document page 208</column></row><table>
PCR para o vetor correu pelo seguinte programa:
Platinum Taq Hi Fidelity Supermix (Invitrogen) usado.
<table>table see original document page 208</column></row><table>
Para efetuar a recombinação homóloga da inteinaVMA no pTT3-HcintLC a seguinte estratégia foi empregada. Osprodutos de PCR foram purificados com gel, e cada um foi e-luido em 50 μΐϋ de tampão de eluição usando um kit de extra-ção de gel Qiaquick (Qiagen) . 3 μΐ do produto PCR do vetorfoi misturado num tubo eppendorf, e 3 μΙ; do produto de PCRda inteina VMA desejada foram adicionados (ou de Oaa, Iaa ou3aa em tubos separados). Cada mistura foi transformada em E.coli, e as células foram, a seguir, plaqueadas em placas LB+ ampicilina e incubadas a 37 0C de um dia para o outro. Ascolônias cresceram para culturas de 2 mL, DNA de plasmideofoi preparado usando kits de preparação Wizard (Promega) eanalisados pela digestão com endonuclease de restrição e e-letroforese em gel de agarose. Os clones que produziram opadrão de restrição correto foram analisados em relação àseqüência de DNA.
Três constructos de expressão para a cadeia pesadade D2E7 - inteina - cadeia leve de D2E7, utilizando a intei-na VMA de S. cerevisiae, foram criados: pTT3-Hc-VMAint-LC-0aa; pTT3-Hc-VMAint-LC-laa; e pTT3-Hc-VMAint-LC-3aa. Vertambém a Fig. 15 para um mapa de plasmideo.
Tabela 20. Seqüência do plasmideo inteiro pTT3 -cadeia pesada de D2E7 - inteina - cadeia leve de D2E7 (SEQID NO: 124).gcggccgctcgaggccggcaaggccggatcccccgacctcgàcctctggctaataaaggaaatttattttcattgcaa
tagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatc
tctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttçgcggggcagt
gcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaac
acaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctgg
àgcagactttgcagtctgtggactgcaacacaacattgcctttátgtgtaactcttggctgaagctcttacaccaatgctg
ggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgta
gctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagc
atatgcttcccgggtagtagtatatactatccagaetaaccctaattcaatagcatatgttacccaacgggaagcatatg
ctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttaca
tggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagt
gaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgt
atgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcatt
gtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatct
ttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggc
aacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccat
gttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacac
ccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgt
ggagtgggggGacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggct
gattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgc
ataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctga
gcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagc
atatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggt
agcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatc
tgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaata
gagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatccta
atctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgct
atcctaatctatatctgggtagtatatgctatcctaaWatatctgggtagcataggctatcctaatctatatctgggtagcat
atgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtc
aaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttct
tagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatcc
gctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtc
gcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagat
cagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaa
cgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactc
ggtcgccgcatacactattçtcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatga
cagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcgga
ggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctg
aatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactatta
actggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccactt
ctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgca
gcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacg
aaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatacttta
gattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacg
tgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaa
ggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaac
tctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttacc
gggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagccc
agcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaa
gggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggg
ggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg
gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttc
ctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgacc
gagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggc
cgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagt
tagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatt
tcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttat
catcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctátacattgaatc
aatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatetat
atcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatc
aattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgac
cgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgac
gtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctatt
gacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtaca
tctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcac
ggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgt
cgtaataaccccgccccgttgacgcaaatgggeggtaggcgtgtacggtgggaggtctatataagcagagctcgttt
agtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaac
tcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgag
cgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgag
caccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggc
ggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaa
aagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggcc
atacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccacc
atggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctgg
attcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcactt
ggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactc
cctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcacc
gcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttcc
ccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccga
accggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcag
gactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatc
acaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccg
tgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcc
cggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtgg
acggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcag
cgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctccca
gcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatc
ccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtg
gagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttc
ttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatga
ggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcatgggtaaagatggcagaectcgtgaggtaattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaa
aagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgaccc
atgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattactttt
gagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacceaatat
ctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggacta
ttgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaat
gaccactttttcgactacatgcaaaaaagtaagrttcatctcaccattgaaggtccaaaagtacttgcttatttacttggttt
atggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaat
atgctgaaaagttgaatttgtgcgccgagtãtaaggacagaaaagaaccacaagttgccaaaactgttaatttgtaet
ctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggettaggatt
cttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtetaat
tgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttg
gtttcccttgctcgttctttaggcttagtagtctcggttaacgcagáacctgctaaggttgacatgaatggcaccaaaeata
aaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaaaaaattcagge
ctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagaegattattatg
ggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtceataat-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatg
acccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcaettgtcgggcaagtcagggcatcaga
aattacttagcctggtatcagcaaaaaccagggaaageccctaagctcctgatctatgctgcatccactttgcaatcag
gggtcccatctcggttcagtggeagtggatctgggacagatttcactctcaccatcagcagcctacagectgaagatgt
tgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtac
ggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctg
aataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggaga
gtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcâccctgacgctgagcaaageagaeta
cgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcaeaaagagettcaacag
gggagagtgt -3'
Vetor pTT3 - cadeia pesada - inteina - cadeia leve
Nos seguintes constructos, a única diferença doconstructo acima é a inclusão das seqüências de exteina na-turais para a S. cerevisiae (mostradas em azul). As seqüên-cias mostradas são de uma extremidade da região codificanteda cadeia pesada de D2E7 (últimos 9 pares de base conformemostrado em vermelho) até a extremidade 5' da região codifi-cadora da cadeia leve de D2E7 (primeiros 9 pares de baseconforme mostrado em rosa).
Tabela 21. Seqüência codificadora parcial no pTT3-HC-VMAint-LC-Iaa (SEQ ID NO: 125)5'-ccgggtaaa-ggg-
tgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtca
tgggtaaagatggcagacctcgtgaggtãattaaattgcccagaggaagagaaactatgtacagcgtcgtgcagaa
aagtcagcacagagcGcacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgaccc
atgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaatattttgaagttattactttt
gagatgggccaaaagaaagcccccgacggtagaattgttgagcttgtcaaggaagtttcaaagagctacccaatat
ctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggacta
ttgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaat
gaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagtacttgcttatttacttggttt
atggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaat
atgctgaaaagttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactgttaatttgtact
ctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggatt
cttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaat
tgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaattcatacttctgtcagagatggtttg
gtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacata
aaattagttatgctatttatatgtetggtggagatgttttgcttaacgttctttcgaagtgtgccggetctaaaaaattcaggc
ctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttacaagaattgaaggaagacgattattatg
ggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtccataat-tgc-atggacatg-3'
Seqüência 3' da cadeia pesada - inteina - exteina- seqüência 5' da cadeia leve
Tabela 22. pTT3-HC-VMAint-LC-3aa (SEQ ID NO:126)
ccgggtaaatatgtcgggtgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacatt
gaggttggtaataaggtcatgggtaaagatggcagacctcgtgaggtaattaaattgcccagaggaagagaaactat
gtaeagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgacteaagtcgtgaagtgccagaattactcaa
gtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgte
gaatattttgaagttattacttttgagatgggccaaaagaaagcccccgacggtagaattgttgagcttgteaaggaagt
ttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaata
aagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttegtaaagctacctaccagaettac
gctccaattctttatgagaatgaccactttttcgactacatgeaaaaaagtaagtttcatctcaccattgaaggtccaaaa
gtacttgcttatttacttggtttatggattggtgatggàttgtctgacagggcaactttttcggttgattccagagatacttctttg
atggaacgtgttactgaatatgctgaaaagttgaatttgtgcgcegagtataaggacagaaaagaaccacaagttge
caaaactgttaatttgtaetctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatceattatgggac
getattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtaetcgtgaa
acatttcttgctggtctaattgattctgatggctatgttactgatgagcatggtattaaagcaacaataaagacaatteata
cttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgaea
tgaatggcaecaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgceg
gctctaaaaaattcaggcctgctcccgccgctgcttttgcacgtgagtgccgcggattttatttcgagttaeaagaattga
aggaagacgattattatgggattactttatctgatgattctgatcatcagtttttgcttgccaaccaggttgtcgtceataattg
cggagaaatggacatg
Seqüência 3' da cadeia pesada - inteina - exteina5 - seqüência 5' da cadeia leve
Inteina DnaE da cepa PCC6803 de Synechocystis spp:
síntese, amplificaçâo por PCR e clonagemA Inteina DnaE da cepa PCC6803 de Synechocystisspp é uma inteína naturalmente partida (#s de acesso NCBIS76958 e S75328) . Nós ligamos as porções N-terminal e C-terminal dessa inteina como uma estrutura de leitura abertatendo ela sinteticamente sintetizada. A seqüência codifica-dora para a seqüência de proteína desejada foi códon-otimizada para a expressão em células CHO (www.geneart.com).A seqüência de nucleotídeo resultante é dada na Tabela 23.
Tabela 23. SSp-Di (seqüência codificadora otimiza-da para a expressão em Cricetulus griseus) (Ver também asSEQ ID Nos: 127 e 128).KpnI EcoRI
GGGCGAATTGGGTACCGAATTCTGCCTGTCCTTCGGCACCGAGATCCTGACCGTGGAGTA
1---------+---------+---------+---------+---------+---------+
CCCGCTTAACCCATGGCTTAAGACGGACAGGAAGCCGTGGCTCTAGGACTGGCACCTCATC- _L_ S FQTE I LTVBY
CGGCCCTCTGCCTATCGGCAAGATCGTGTCCGAAGAGATCAACTGCTCCGTGTACTCCGT
61 ---------+---------+---------+---------+---------+---------+
GCCGGGAGACGGATAGCCGTTCTAGCACAGGCTTCTCTAGTTGACGAGGCACATGAGGCA
_G_P_L_P_I_G__K_IVS_E_E_INC_SVY_3 V
AccI
GGACCCTGAGGGCCGGGTGTATACTCAGGCCATCGCCCAGTGGCACGACCGGGGCGAGCA
121------;---+---------+---------+---------+---------+---------+
CCTGGGACTCCCGGCCCACATATGAGTCCGGTAGCGGGTCACCGTGCTGGCCCCGCTCGT
_P_E_G_R_V_Y_T_Q_JV_I_A_Q_W_JI_D_R__G_E_Q_
AgeI
GGAGGTGCTGGAGTACGAGCTGGAGGACGGCTCCGTGATCCGGGCCACCTCCGACCACCG
181----;-----+---------+---------+- —------+---------+--------- +
CCTCCACGACCTCATGCTCGACCTCCTGCCGAGGCACTAGGCCCGGTGGAGGCTGGTGGC
_E__V__L_E_Y_B .Ii E D G_3 V I R A T S_D_H_A_
PvuII BglII PvuII BspMI
GTTTCTGACCACCGACTATCAGCTGCTGGCCATCGAGGAGATCTTCGCCCGGCAGCTGGA
241----—---+---------+---------+---------+---------+---------+
CAAAGACTGGTGGCTGATAGTCGACGACCGGTAGCTCCTCTAGAAGCGGGCCGTC GACCT
BstNI BStNI ~A °
CCTGCTGACCCTGGAGAACATCAAGCAGACCGAGGAGGCCCTGGACAACCACCGGCTGCC
301---------+---------+-------—+---------+—-------+---------+
GGACGACTGGGACCTCTTGTAGTTCGTCTGGCTCCTCCGGGACCTGTTGGTGGCCGACGG
_L_L_T_L_J3_N__I__K:_Q_T_E_E_D__N__H__R__Ii_P_
BstZJ BStNI
TTTCCCTCTGCTGGACGCCGGCACCATCAAGATGGTGAAGGTGATCGGCAGGCGGTCCCT
361---------+---------+---------+-----^ — — +---------+---------+
AAAGGGAGACGACCTGCGGCCGTGGTAGTTCTACCACTTCCACTAGCCGTCCGCCAGGGA
_F_P_LLDAGTI_K MVKVI GRRS_L_
GGGCGTGCAGCGGATCTTCGACATCGGCCTGCCTCAGGACCACAACTTTCTGCTGGCCAA
421---------+---------+---------+--------:-+---------+---------+
CCCGCACGTCGCCTAGAAGCTGTAGCCGGACGGAGTCCTGGTGTTGAAAGACGACCGGTT
NarI
KasI SacIHaeII HindIII
CGGCGCCATCGCCGCCAACAAGCTTGAGCTCCAGCTTTTGTTCCC
481---------+---------+---------+:---------+-----
GCCGCGGTAGCGGCGGTTGTTCGAACTCGAGGTCGAAAACAAGGG
ΐ A A~A_N_
Os seguintes oligonucleotideos foram usados para aamplificação da Inteina DnaE da cepa PCC6803 de Synechocys-tis spp usando o DNA sintético acima como molde e PlatinumTaq Hi Fidelity Supermix (Invitrogen). Esses iniciadores
5 também introduziram as seqüências de exteina para gerar asversões de Oaa, Iaa e 3aa, assim como as seqüências para arecombinação homóloga do produto de PCR no vetor pTT3-HcintLC conforme feito com a inteina VMA de S. cerevisiae:Ssp-geneart-5' HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCCTGTCCTTCGGCACCGAG (SEQ ID N0:129)Ssp-geneart-3'-HR:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGTTGGCGGCGATGGCGCCGTTGGCC (SEQ ID N°:130)Ssp-GA-Iaa-5-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATATTGCCTGTCCTTCGGCACCGAG (SEQ ID N°:131)Ssp-GA-laa-3'-HR:
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATACAGTTGGCGGCGATGGCGCCGT (SEQ ID N°:132)Ssp-GA-3aa-5'-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG (SEQ ID N°:133)Ssp-GA-3aa-3'-HR:
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG (SEQ ID N°:134)
PCR correu no seguinte programa:Passo 12 345 6 7 8
Tenp 94 0C 94 0C 60 0C 68 0C Ir para o passo 2 68 0C 4 0C Fim(34 vezes)
Tertpo 2 min 30 seg 30 seg 1 min 5 min Esperar
Para obter a recombinação homóloga da Inteina DnaEda cepa PCC6803 de Synechocystis spp códon-otimizada nopTT3-HcintLC, a seguinte estratégia foi usada. Os produtosde PCR foram purificados com gel e cada um eluiu em 50 μΐ, detampão de eluição (Kit de extração em gel Qiaquick (Qiagen).2 μΙ, do vetor produto de PCR (o mesmo que usado na recombi-nação homóloga com a inteina VMA) foram misturados num tubode Eppendorf com 2 μΙ, do produto de PCR da Inteina DnaE dacepa PCC6803 de Synechocystis spp (ou Oaa, Iaa ou 3aa em tu-bos separados). Os ácidos nucléicos são, a seguir, transfor-mados em E. coli e plaqueados em placas LB + ampicilina e, aseguir, incubados a 37 0C de um dia para o outro. As colô-nias cresceram para culturas de 2 mL, preparadas para DNAusando o kit de preparação Wizard (Promega) e ensaiadas pordigestão da endonuclease de restrição e eletroforese em gelde agarose. Os clones que produziram o padrão de restriçãocorreto são analisados em relação à seqüência de DNA paraconfirmar que as seqüências desejadas estão presentes.
Três constructos de expressão para a cadeia pesadade D2E.7 - inteina - cadeia leve de D2E7, utilizando a intei-na DnaE da cepa PCC6803 de Synechocystis spp foram designa-das: pTT3-Hc-Ssp-GA-int-LC-0aa (ver Fig. 16 para o mapa deplasmideo); pTT3-Hc-Ssp-GA-int-LC-laa; e pTT3-Hc-Ssp-GA-int-LC-3aa.
Tabela 24. Seqüência do plasmideo inteiro pTT3-cadeia pesada de D2E7-Ssp-Ga-inteína-Cadeia leve de D2E7(SEQ ID NO: 135).5'-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaa
tagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatc
tctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagt
gcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaãac
acaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctgg
agcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctg
ggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgta
gctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggtagc
atatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatg
ctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttaca
tggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagt
gaactctcctgaatcttcgcctgcttcttcatlctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgt
atgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcatt
gtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatct
ttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggc
aacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccat
gttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacac
ccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgt
ggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggct
gattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgc
ataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctga
gcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagc
atatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggt
agcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatc
tgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctaícctaata
gagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatccta
atctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgct
atcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcat
atgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctçatgataagctgtc
aaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttct
tagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatcc
gctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtc
gcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaa
cgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactc
ggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatga
cagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcgga
ggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctg
aatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactatta
actggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccactt
ctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgca
gcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacg
aaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatacttta
gattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacg
tgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatct
gctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaa
ggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaac
tctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttacc
gggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagccc
agcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaa
gggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggg
ggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttítgtgatgctcgtcaggggg
gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggcxttttgctcacatgttctttc
ctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataçcgctcgccgcagccgaacgacc
gagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggc
cgattcaítaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagt
tagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatt
tcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttat
catcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatc
aatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctat
atcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatc
aattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgac
cgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgac
gtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctatt
gacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtaca
tctacgtattagtcatcgctaitaccatggtgatgcggttttggcagtacaccaatgggçgtggatagcggtttgactcac
ggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgt
cgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgttt
agtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaac
tcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgag
cgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgag
caccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggc
ggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaa
aagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggcc
atacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccacc
atggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctgg
attcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcactt
ggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactc
cctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcacc
gcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttcc
ccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccga
accggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcx;cggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatc
acaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccg
tgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcc
cggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtgg
acggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcag
cgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctccca
gcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatc
ccgggatgagctgaccaagaaccaggtcagcctgacctgcçtggtcaaaggcttctatcccagcgacatcgccgtg
gagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttc
ttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatga
ggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatc
aactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcg
agcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccac
cgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcag
accgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtga
tcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaac
ggcgccatcgccgccaac-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatg
acccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcaga
aattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcag
gggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgt
tgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtac
ggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctg
aataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggaga
gtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagacta
cgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacag
gggagagtgt -3'
Vetor pTT3 - Cadeia pesada - Inteina - Cadeia leve
Nos seguintes constructos, a única diferença doconstructo acima é a inclusão de seqüências de exteina natu-rais da cepa PCC6803 de Synechocystis spp. (mostrada em a-zul). As seqüências mostradas são de uma extremidade da re-gião codificadora da cadeia pesada de D2E7 (últimos 9 paresde base conforme mostrado em vermelho) até a extremidade 5'da região codificadora da cadeia leve de D2E7 (primeiros 9pares de base conforme mostrados em rosa).
Tabela 25. pTT3-HC-Ssp-GA-int-LC-laa, porção rele-vante da seqüência codificadora (SEQ ID NO: 136).Ccgggtaaa-tatt-
gcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatcaactgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcagaccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacggcgccatcgccgccaac-tgt-atggacatg
Vetor pTT3 - cadeia pesada - inteina - cadeia leve
Tabela 26. pTT3-HC-Ssp-GA-int-LC-3aa, porção rele-vante da seqüência codificadora (SEQ ID NO: 137).
Ccgggtaaa-gccgagtatt-
gcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatcggcaagatcgtgtccgaagagatca
actgctccgtgtactccgtggaccctgagggccgggtgtatactcaggccatcgcccagtggcacgaccggggcga
gcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccacc
gactatcagctgctggccatcgaggagatcttcgcccggcagctggacctgctgaccctggagaacatcaagcaga
ccgaggaggccctggacaaccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgat
cggcaggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggaccacaactttctgctggccaacg
gcgccatcgccgccaac-tgtttcaac-atggacatg
Vetor pTT3 - cadeia pesada - inteina - cadeia leve
Além disso, as Tabelas 8A - 8C fornecem seqüênciasrelevantes para um vetor de expressão, seqüência codificado-ra e proteína de fusão de inteina D2E7 usando a inteina GBDPol Pyrococcus Ssp. modificada (serina para treonina).
Tabela 8A. Seqüência codificadora da proteína defusão de inteina D2E7 (SEQ ID NO: 48).ATGGAGTTTGGGCTGAGCTGGCI I 11ICTTGTCGCGATTTTAAAAGQTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGG
GGGAGGGTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGC
ACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCG
GACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACQCCAAGAACTCCCTGTATCTQCAAATGAACAGTCTGAGAGC
TQAGGATACGGCCGTATATTACTGTGCGAMGTCTCGTACCTTAGCACCGCGTCXÍTCCCTTGACTATTGGGGCCAAGGTAC
CCTGGTCACX;GTCTCGAGTGCX3TCGACCMGGGCCXÍATCGGTCTTCCCXXTGGCACCXDTCCTCCMGAGCACCTCTGG^
GGCACAGCGGCCCTGGGCTGCCTGGTCMGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGQCGCCCTGA
CCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCQTGCCCTC
CAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGC
CCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGMCTCCTGGGGGGACCGTCAGTCTTCCTCTTC
CCCCCAAAACCCAAGGACACCCTCATGATCTCCCXàGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAG
ACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTA
CAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAG
GTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTA
CACCCTGCCCCCATCCCGGGATGAGCTGACCMGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGC
GACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACG
GCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATG
CATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAACCATTTTACCGGAAGAATGGGTT
CCACTAATTAAAMCGGTAMGTTMGATATTCCGCATTGGGGACTTCGTTGATGGACTTATGAAGGCGAACCAAGGAAAA
GTGAAGAAAACGGGGGATACAGAAGTTTTAGMGTTGCAGGMTTCATGCGTTTTCCTTTGACAGGAAGTCCAAGAAGGCC
CGTGTAATGGCAGTGAAAGCCGTGATAAGACACCGTTATTCCGGAAATGTTTATAGAATAGTCTTAAACTCTGGTAGAAAAA
TAACAATAACAGAAGGGCATAGCCTATTTGTCTATAGGAACGGGGATCTCGTTGAGGCAACTGGGGAGGATGTCAAAATTG
GGGATCnTCTTGCAGTTCCAAGATCAGTAAACCTACCAGAGMMGGGMCGCTTGAATATTGTTGAACTTCTTCTGAATCT
CTCACCGGAAGAGACAG^GATATAATACTTACGATTCCAGTTAAAGGCAGAAAGAACTTCTTCAAGGGAATGTTG AGAAC
ATTACGTTGGATTTTTGGTGAGGAAAAGAGAGTAAGGACAGCGAGCCGCTATCTAAGACACCTTGAAAATCTCGGATACAT
AAGGTrGAGGAAAATTGGATACGACATCATTGATAAGGAGGGGCTTGAGAAATATAGAACGTTGTACGAGA AACTTGTTGA
TGTTGTCCGCTATAATGGCAACAAGAGAGAGTATrTAGTTGAATTTAATGCTGTCCGGGACGTTATCTCACTAATGCCAGAG
GAAGAACTGMGGAATGGCGTATTGGAACTAGAAATGGATTCAGMTGGGTACGTTCX3TAGATATTGATGAAGATTTTGCC
AAGCTTGGATACGATAGCGGAGTCTACAGGGTTTATGTAAACGAGGAACTTAAGTTTACGGAATACAGAAAGAAAAAGAAT
GTATATCACTCTCACATTGTTCCAAAGGATATTCTCAAAGAMCTTrTGGTAAGGTCTTCCAGAAAAATATAAGTTACAAGAA
ATTTAGAGAGCTTGTAGAAMTGGAAAACTTGACAGGGAGAAAGCCAAACGCATTGAGTGGTTACTTAACGGAGATATAGT
CCTAGATAGAGTCGTAGAGATTAAGAGAGAGTACTATGATGGTOCGTTTACGATCTAAGTGTCGATGAAGATGAGAATTTC
CTTGCTGGCTTTGGATTCCTCTATGCACATAATGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGG
GACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGQTATCAGCAAAAACCAGGGAAAGC
CCCTAAGCTCCTGATCTATGCTGCATíXACmGCAATCAGGGGTCXJCATCTCGGTTCAGTGGCAGTGGATCTGGGACAG
ATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTrGCMCTTATTACTGTCAAAGGTATAACCGTGCACCGTATAC
TTTTGGCCAGGGGACCAAGGTGGAMTCAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGC
AGTTGAAATCTGGAACTGCCTCTQTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGG
ATMCGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAG
CACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGC
CCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
Tabela 8B. Seqüência de aminoácidos do constructode fusão da inteina D2E7 (SEQ ID NO: 49).
MEFGL5WLJ=LVA1LKGVQCEVQLVESGGGLVQPGRSLRLSCMSGFTFDDYAMHVVVRQAPGKGLJBAA/SAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRA EDTA VYYC^ KVSYLSTASSLDYWGQGTLVTVSSASTCCLVKDYFPEPVTVSWNSGALTSGWTFPAVLQSSGLYSL£SWTVPSSSLGTQTYICNVNHKPS^PCPAPEUjQGPSVFLFPPKPKDTU^ISRTPE\n"CVWDVSHEDPEVKFNWYVDGVEWDWLNGKEYKCKVSNKAIJWMEKTISKAKGCffREPQVYT^
PVUDSDGSFTLYSKLTVDKSRWQQGNVFSCSVMHEAUHNHYTQKSLSLSPGKTIU^EEVWPLIKNGM
QQKVKKTGDTEVL^AGlHAFSFDRKSKKARVMAVKAVIRHRYSGNVYRIVL^SGRKrT^
LLAVP RSVNU®EKRERLNIVElJJJ^LSPEETH31tLTPVKGRKNFFKGMLRTUW
IDKEGLEKYRTLYEKLVDWRYI^NKREYLVERvJAVRDVlSLMPEEElXBWRIGTRNGFRMGTFVDLDEDFA
NEELKFTEYRKKKNWHSHIVPKDILKETFGKVTOKNISYKKFRELVENGKLD^
DISVDEDENFLAGFGFLYAHNDIQMTQSPSSI^ASVGDRVTITCRASQGIRNYLAWY^
GSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTH3QGTKVEIKRTVMPSVRFPPSDEQU<SGTASWCLXNNFYPREAKVQ^KVDNALQSGNSCESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*Tabela 8C. Seqüência de nucleotideos completa dovetor de expressão para o constructo de fusão da inteínaD2E7 (SEQ ID NO: 50)
GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACQTTACATAACTTACGGTAAATGGCCCGCCTG
GCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCC
AATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTAC
ATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTG
GCATTATGCCCAGTACATGACCTTATGGGACnTCCTACTTGGCAGTACATCTACGTATT AGTCAT
CGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCA
CGGGGATTTCCMGTCTCCACCCCATTGACGTCMTGGGAGTTTGTTTTGGCACCAAAATCAACG
GGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTC
GGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGC
TCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGG
GGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGG
TTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGC
GCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGA
GGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTA
CTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTG
GGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACG
AGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTC
AGAAAAGACAATCI I 11 IGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTT
GAGTGACAATGACATCCAGTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATtgtacccgcggccagagcttgcccgggcgccaccatggagtttgggctgagctggctttttctt
gtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggcttggta
gagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgcca
tgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaata
gtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaa
gaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcga
aagtctcgt acctt agcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgt
ctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctct
gggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtc
gtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcagg
actctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacct acatc
tgcaacgtgaatcacaagcccagcaacaccmggtggacaagaaagttgagcccaaatcttgtg
acaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcct
cttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtg
gtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtg
cataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtc
ctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaag
ccctcccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacagg
tgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctgg
tcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaaca
actacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcac
cgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctct
gcacaaccactacacgcagaagagcctctccctgtctccgggtaaaaccattttaccggaagaa
tgggttccactaattaaaaacggtaaagttaagatattccgcattggggacttcgttgatggact
tatgaaggcgaaccaaggaaaagtgaagaaaacgggggatacagaagttttagaagttgcagga
attcatgcgttttcctttgacaggaagtccaagaaggcccgtgtaatggcagtgaaagccgtgat
aagacaccgttattccggaaatgtttatagaatagtcttaaactctggtagaaaaataacaataac
agaagggcatagcctatttgtctataggaacggggatctcgttgaggcaactggggaggatgtc
aaaattggggatcttcttgcagttccaagatcagtaaacctaccagagaaaagggaacgcttgaa
tattgttgaacttcttctgaatctctcaccggaagagacagaagatataatacttacgattccagt
taaaggcagaaagmcttcttcaaggg^tgttgagaacattacgttggatttttggtgaggaaa
agagagtaaggacagcgagccgctatctaagacaccttgaaaatctcggatacataaggttgag
gaaaattggatacgacatcattgatmggaggggcttgagaaatatagaacgttgtacgagaaac
ttgttgatgttgtccgctataatggcaacaagagagagtatttagttgaatttaatgctgtccgg
gacgtt atctcactaatgccagaggaagaactgaaggaatggcgtattggaactagaaatggatt
cagaatgggtacgttcgtagatattgatgaagattttgccaagcttggatacgatagcggagtct
acagggtttatgtaaacgaggaacttaagtttacggaatacagaaagaaaaagaatgtatatcact
ctcacattgttccamggatattctcaaagaaacttttggtaaggtcttccagaaaaatatAagttacaagaaatttagagagcttgtagaaaatggaaaacttgacagggagaaagccaaacgcattgag
tggttacttaacggagatatagtcctagatagagtcgtagagattaagagagagtactatgatgg
ttacgtttacgatctmgtgtcgatgaagatgagmtttccttgctggctttggattcctctatgc
acataatgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtca
ccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagg
gaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttca
gtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgc
aacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaa
tcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatct
ggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtgga
aggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaagg
acagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagamcacaaagt
ctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaácagggg
agagtgttgagcggccgcgtttaaactgaatgagcgcgtccatccagacatgatmgatacatt
gatgagtttggacamccacmctagaatgcagtgaamamtgctttatttgtgaaatttgtgat
gctattgctttatttgtaaccattataagctgcaataaacmgttaacaacaacaattgcattcatt
ttatgtttcaggttcagggggaggtgtgggaggttttttaaagcaagtaaaacctctacaaatgt
ggtatggctgattatgatccggctgcctcgcgcgtttcggtgatgacggtgaaaacctctgaca
catgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccg
tcagggcgcgtcagcgggtgttggcgggtgtcggggcgcagccatgaccggtcgacggcgcg
cci i 11 i i 11 iaai1111attttatttta11 i 11gacgcgccgaaggcgcgatctgagctcggtaca
gcttggctgtggaatgtgtgtcagttagggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatqcatctcaattagtcagcaaccaggtgtqgaaagtccccaggctccccag
caggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatagtcccgcccct aactcc
gcccatcccgcccctaactccgcccagttccgcccattctccgccccatggctgactaatttttt
ttatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggctt
ttttg g ag g cctaggcttttg c aaa aag ctcctcg agg aactg aa aaacc ag aaagtt aactggt
mgtttagtctttttgtcttttatttcaggtcccggatccggtggtggtgcaaatcaaagaactgc
tcctcagtggatgttgcctttacttctaggcctgtacggaagtgttacttctgctctaaaagctg
cggaattgtacccgcggcctaatacgactcactatagggactagtatggttcgaccattgaactg
catcgtcgccgtgtcccaaaatatggggattggcaagaacggagacctaccctggcctccgctc
aggaacgagttcaagtacttccaaagaatgaccacaacctcttcagtggaaggtaaacagaatct
ggtgattatgggtaggaaaacctggttctccattcctgagaagaatcgacctttaaaggacagaa
ttaatatagttctcagtagagmctcaaagaaccaccacgaggagctcattttcttgccaaaagtt
tagatgatgccttaagacttattgaacaaccggaattggcaagtaaagtagacatggtttggata
gtcggaggcagttctgtttaccaggaagccatgmtcaaccaggccacctcagactctttgtga
cmggatcatgcaggmtttgaaagtgacacgtttttcccagaaattgatttggggaaatataaa
cttctcccagaatacccaggcgtcctctctgaggtccaggaggaaaaaggcatcaagtataagt
ttgaagtctacgagaagaaagactaagcggccgagcgcgcggatctggaaacgggagatgggg
gaggctaactgaagcacggaaggagacaataccggaaggaacccgcgctatgacggcaataaa
aagacagaataaaacgcacgggtgttgggtcgtttgttcataaacgcggggttcggtcccaggg
ctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttccttt
tccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggc
aggccctgccatagccactggccccgtgggttagggacggggtcccccatggggaatggttta
tggttcgtgggggttattattttgggcgttgcgtggggtctggagatcccccgggctgcagga
attccgttacattacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccatt
gacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatggg
tggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccc
cctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatggg
actttcctacttggcagtacatctacgtattagtcatcgctatt accatggtgatgcggttttggc
agtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccgcattga
cgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccg
ccccattgacgcaaaagggcgggaattcgagctcggtactcgagcggtgttccgcggtcctcc
tcgtatagaaactcggaccactctgagacgaaggctcgcgtccaggccagcacgaaggaggct
aagtgggaggggtagcggtcgttgtccactagggggtccactcgctccagggtgtgaagacac
atgtcgccctcttcggcatcaaggaaggtgattggtttataggtgtaggccacgtgaccgggtg
ttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctcttccgcatcgc
tgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtac
tcttggatcggaaacccgtcggcctccgmcggtactccgccaccgagggacctgagcgagtc
cgcatcgaccggatcggaaaacctctcgactgttggggtgagtactccctctcaaaagcgggca
tgacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgcg
gtgatgcctttgagggtggccgcgtccatctggtcagaamgacmtctttttgttgtcaagctt
gaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctttct
ctccacaggtgtccactcccaggtccaaccggaattgtacccgcggccagagcttgcgggcgc
caccgcggccgcggggatccagacatgataagatacattgatgagtttggacaaaccacaacta
GMTGCAGTGAAAAAMTGCTTTAmGTGAMTTTGTGATGCTATTGCTTTATTTGTAACCATTAT
mgctgcmtamcmgttmcmcmcmttgcattcattttatgtttcaggttcagggggaggt
gtgggaggiiiiiicggatcctcttggcgtmtcatggtcatagctgtttcctgtgtgamttgt
tatccgctcacmttccacacmcatacgagccggmgcatamgtgtamgcctggggtgcct
mtgagtgagctmctcacattmttgcgttgcgctcactgcccgctttccagtcgggamcctg
tcgtgccagctgcattmtgmtcggccmcgcgcggggamggcggtttgcgtattgggcgc
tcttccgcttcctcgctcactgactcgctgcgctcggtcgttcggctgcggcgagcggtatcag
ctcactcamggcggtmtacggttatccacagmtcaggggatmcgcaggamgaacatgtg
agcaamggccagcaamggccaggaaccgtammggccgcgttgctggcgttcttccatag
gctccgcccccctgacgagcatcacaaamtcgacgctcmgtcagaggtggcgmacccgac
aggact atamgataccaggcgtttccccctggmgctccctcgtgcgctctcctgttccgacc
ctgccgcttaccggatacctgtccgcctttctcccttcgggmgcgtggcgctttctcatagct
cacgctgtaggtatctcagttcggtgtaggtcgttcgctccmgctgggctgtgtgcacgmcc
ccccgttcagcccgaccgctgcgccttatccggtmctatcgtcttgagtccmcccggtmga
cacgacttatcgccactggcagcagccactggtmcaggattagcagagcgaggtatgtaggc
ggtgctacagagttcttgmgtggtggcctmctacggctacactagmgmcagtatttggtat
ctgcgctctgctgmgccagttaccttcggaaamgagttggtagctcttgatccggcamcmACCACCGCTGGTAGCGGTGGI Illll IGTTTGCMGCAGCAGATTACGCGCAGAAAAAAAGGAT
CTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAA
GGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGT
TTT AAATCAATCTAAAGT ATAT ATGAGTAAACTTGGTCTGACAGTTACCAATGCTTMTCAGTGAG
GCACCT ATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGT AGAT
AACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACG
CTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGG
TCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTT
CGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTC
GTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGT
TGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGT
GTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTT
TTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCT
CTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATT
GGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTA
ACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAA
AAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAAT ACTCAT
ACTCTTCC Illll CAAT ATT ATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTT
GMTGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGA
CGTCT AAGAAACCATTATTATCATGACATTAACCTATAAAAAT AGGCGT ATCACGAGGCCCTTTCG
TCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACA
GCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGG
CGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATG
CGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCA
GGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGA
AAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTG
TAAAACG ACGGCCAGTGAATT
Tabela 9. Seqüência de aminoácidos da seqüência deinteina Psp-GBD Pol natural com informação de seqüênciaflanqueadora limitada (No. de Acesso NCBI AAA67132.1) (SEQID NO: 51).
N/SILPEEWVPL1KNGKVKIFRIGDFVDGLMKANQGKVKKTGDTEVLEVAGIHAFSFD
RKSKKARVMAVKAVIRHRYSGNVYR1VLNSGRK1TITEGHSLFVYRNGDLVEATGED
VK1GDLLAVPRSVNLPEKRERLNIVELLLNLSPEETEDIILT1PVKGRKNFFKGMLRTL
RWIFGEEKRVRTASRYLRHLENLGYIRLRKIGYDIIDKEGLEKYRTLYEKLVDWRYN
GNKREYLVEFNAVRDVISLMPEEELKEWRIGTRNGFRMGTFVDIDEDFAKLLGYYV
SEGSARKWKNQTGGWSYTVRLYNENDEVLDDMEHLAKKFFGKVKRGKNYVEIPK
KMAY1IFESLCGTLAENKRVPEVIFTSSKGVRWAFLEGYFIGDGDVHPSKRVRLSTK
SELLVNGLVLLLNSLGVSAIKLGYDSGVYRVYVNEELKFTEYRKKKNVYHSmVPKDI
LKETFGKVFQKNISYKKFRELVENGKLDREKAKRIEWLLNGDIVLDRWE1KREYYD
GYVYDLSVDEDENFLAGFGFLYAHN/SYYGYYGYA
5 / representa a junção da união, e aminoácidos sublinhadosrepresentam seqüências de inteina, o restante representa in-formação de seqüência de exteina.
Exemplo 2, Construção das seqüências de poliprote-ina de imunoglobulina e vetores com domínio autoprocessador10 hedgehog de Drosophila melanogaster, seqüências C17 e C25Uma outra estratégia para a expressão eficiente demoléculas de anticorpo é a expressão de poliproteina, em queum dominio hedgehog é localizado entre as cadeias pesada eleve, com modificação da seqüência de dominio hedgehog e/ouseqüências de junção de forma que haja a liberação das pro-teínas componentes sem adição de colesterol à proteína N-terminal. Em tais constructos, pode haver uma cópia de cadauma das cadeias pesada e leve relevantes, ou a cadeia levepode ser duplicada para proporcionar pelo menos duas cadeiasleves, ou pode haver múltiplas cópias tanto das cadeias pe-sada quanto leve, com a condição de que uma seqüência declivagem funcional é fornecida para promover a separação decada proteína derivada de imunoglobulina na poliproteina.
Uma estratégia de sítio de clivagem particular (por exemplo,o domínio hedgehog) pode ser empregada mais de uma vez, oupara múltiplos sítios de clivagem, cada uma podendo ser in-dependente. Dessa forma, uma enzima ou seqüência de proces-samento proteolítico diferente pode ser posicionada em rela-ção a pelo menos um terminal de uma imunoglobulina ou de umaproteína derivada de imunoglobulina.
Os seguintes oligonucleotídeos foram usados para aamplificação do domínio autoprocessador C-terminal hedgehogde Drosophila melanogaster (Hh-C), seqüências Hh-C17, muti-lações de Hh-C17 (e uma com mutação) e Hh-C25 (# de acessoGenBank L02793.1) usando DNA genômico como molde e PlatinumTaq Hi Fidelity PCR Supermix (Invitrogen). DNA genômico foipreparado a partir de um fraco congelado de células D.Mel-2de Drosophila (Invitrogen, # cat. 10831-014).5' C17: TGCTTCACGCCGGAGAGCAC (SEQ ID NO: 141)
3' completo C17: ATTATGGACGACAACCTGGTTGGCAA (SEQ ID NO:142)
3' efetivo C25: ATCGTGGCGCCAGCTCTGCG (SEQ ID NO:143)
3' C17: GCAACTGGCGGCCACCGAGT (SEQ ID NO: 144)
3' - scya - C17: CGCATAGCAACTGGCGGCCA (SEQ ID NO:145)
3' - sc/hn - C17: GTTGTGGGCGGCCACCGAGT (SEQ ID NO:146)
PCR correu no seguinte programa:Passo 12345 6 7 8
Temp 94 0C 94 0C 55 0C 68 0C Ir para o passo 2 68 0C 4 0C Fim(34 vezes)
Terrpo 2 min 1 min 1 min 2,5 min 5 min Esperar
Iniciadores de oligonucleotideos foram designadospara gerar a fusão da Cadeia pesada de D2E7 - Hh-C - Cadeialeve de D2E7 através da recombinação homóloga no constructopTT3-HcintLC p. horikoshii em E. coli. Pelo projeto de umaprojeção de 40 pares de base entre o vetor gerado por PCR(contendo o vetor pTT3, as regiões de cadeia pesada e de ca-deia leve, mas não a inteina de P. horikoshii) e as inser-ções de domínio Hh-C, os dois fragmentos de DNA são mistura-dos e transformados em E. coli sem o benefício da ligação,resultando na recombinação homóloga de E. coli dos doisfragmentos em pTT3-HC-Hh-C-LC (em várias versões conforme osprodutos de PCR iniciais declaram).
Iniciadores de recombinação de homólogos do domí-nio Hh-C:
C17-HR5':
CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATGCTTCACGCCGGAGCGCAC (SEQ ID N°: 147)C17-completo-HR-3':GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCACTGGCTGTTGATCACCG (SEQ ID N°: 148)C25-efetivo-HR-3':
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATCGTGGCGCCAGCTCTGCG (SEQ ID N°: 149)
C17-HR3':
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAACTGGCGGCCACCGAGT (SEQ ID N°: 150)Cl7-scya-HR-3':
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATCGCATAGCAACTGGCGGCCA (SEQ ID N°: 151)C17-sc/hn-HR-3':
GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGTTGTGGGCGGCCACCGAGT (SEQ ID N°: 152)
Iniciadores de recombinação de homólogos pTT3-HcintLC:
pTT3int-HR5':
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC (SEQ IDN°: 153)
pTT3int-HR3' :
TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT (SEQ IDN°: 154)
PCR para o domínio Hh-C correu no seguinte progra-ma: Pfu-I Hi Fidelity DNA Polymerase (Stratagene) usado.
<table>table see original document page 229</column></row><table>
PCR para o vetor correu no seguinte programa: Pla-tinum Taq Hi Fidelity Supermix (Invitrogen) usado.Passo 1234 5 67 8
Teitp 94 0C 94 0C 60 0C 68 0C Ir para o passo 2 68 0C 4 0C Fim(24 vezes)
Terrpo 2 min 30 seg 30 seg 10 min 5 min Esperar
Para obter a recombinação homóloga dos domíniosHh-C no pTT3-HcintLC, a seguinte estratégia foi empregada.Produtos de PCR foram purificados em gel e cada um foi eluí-do em 50 μl; de tampão de eluição (kit de extração em gel Qi-aquick, Qiagen) . 3 μί do vetor do produto de PCR foram mis-turados num tubo eppendorf com 3 μΐϋ do produto de PCR de do-mínio Hint desejado (várias versões). Os produtos de ampli-ficação por PCR foram transformados em E. coli e plaqueadosem placas LB + ampicilina, incubados a 37 0C de um dia parao outro e as colônias crescerem para culturas de 2 mL, DNAde plasmídeo foi extraído usando o kit preparatório Wizard(Promega) e as amostras de DNA foram ensaiadas por digestãoda endonuclease de restrição e eletroforese em gel de agaro-se. Os clones que produziram o padrão de restrição corretoforam analisados em relação à seqüência de DNA para confir-mar que a seqüência desejada tinha sido produzida.
Cinco constructos de expressão para a Cadeia Pesa-da de D2E7 - Hh-C - Cadeia Leve de D2E7, utilizando o domí-nio autoprocessador C-terminal hedgehog de Drosophilamelanogaster foram designados: pTT3-HC-Hh-C17-LC; pTT3-HC-Hh-C17-SC-LC; pTT3-HC-Hh-C17-HN-LC; e pTT3-HC-Hh-C25-LC.
Tabela 27. Seqüência do plasmídeo inteiro pTT3 -Cadeia Pesada de D2E7 -Hh- C17 - Cadeia leve de D2E7 (SEQID NO: 155) .5'-
gcggccgctcgaggccggcaaggccggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaa
tagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatc
tctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagt
gcatgtaatcccttcagttggttggtacaacttgccaactgggccctgttccacatgtgacacggggggggaccaaac
acaaaggggttctctgactgtagttgacatccttataaatggatgtgcacatttgccaacactgagtggctttcatcctgg
agcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctg
ggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgta
gctaccgataagcggaccctcaagagggcattagcaatagtgWataaggcccccttgttaaccctaaacgggtagc
atatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatg
ctatcgaattagggttagtaaaagggtcctaaggaacagcgatatctcccaccccatgagctgtcacggttttatttaca
tggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagatcaaggagcgggcagt
gaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgt
atgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacggggggttcagtggtggcatt
gtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatct
ttaacaatagaaatccatggggtggggacaagccgtaaagactggatgtccatctcacacgaatttatggctatgggc
aacacataatcctagtgcaatatgatactggggttattaagatgtgtcccaggcagggaccaagacaggtgaaccat
gttgttacactctatttgtaacaaggggaaagagagtggacgccgacagcagcggactccactggttgtctctaacac
ccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactcttttttttgaaattgt
ggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggct
gattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgc
ataagtaggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacacacttgcgcctga
gcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagc
atatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggt
agcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatc
tgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaata
gagattagggtagtatatgctatcctaatttatatctgggtagcatatactacccaaatatctggatagcatatgctatccta
atctatatctgggtagcatatgctatccíaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgct
atcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcat
atgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtc
aaacatgagaattttcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttct
tagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatcc
gctcatgagacaataaccctgataaatgcttcaaiaatattgaaaaaggaagagtatgagtattcaacatttccgtgtc
gcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagat
cagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaa
cgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactc
ggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatga
cagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcgga
ggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctg
aatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactatta
actggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccactt
ctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgca
gcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgàacg
aaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatacttta
gattgatttaaaacttcatttttaaíttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacg
tgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatct
gctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaa
ggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaac
tctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttacc
gggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaa
gggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggg
ggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggg
gcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttc
ctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgacc
gagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggc
cgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagt
tagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatt
tcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgaccaattctcatgtttgacagcttat
catcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatc
aatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctat
atcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatc
aattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgac
cgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgac
gtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctatt
gacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtaca
tctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcac
ggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgt
cgtaataaccccgccccgttgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcgttt
agtgaaccgtcagatcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaac
tcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgag
cgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgag
caccgtggcgggcggcagcgggtggcggtcggggttgtttctggcggaggtgctgctgatgatgtaattaaagtaggc
ggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaa
aagcgggcattacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggcc
atacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccacc
atggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-
gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctgg
attcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcactt
ggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactc
cctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcacc
gcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttcc
ccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccga
accggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcag
gactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaatc
acaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaáaactcacacatgcccaccg
tgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcc
cggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtgg
acggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcag
cgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctccca
gcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatc
ccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtg
gagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttc
ttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatga
ggctctgcacaaccactacacgcagaagagcctctccctgtctccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatc
gtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcag
atgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttgg
cagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatg
tggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgctatgcggtgatcaacagccagtcg-
atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatg
acccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcaga
aattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcag
gggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgt
tgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggtggaaatcaaacgtac
ggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctg
aataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggaga
gtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagacta
cgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacag
gggagagtgt -3'
Vetor pTT3 - cadeia pesada -Hh- C17 - Cadeia le-ve
Nos seguintes constructos, a única diferença doconstructo acima é a mutilação da região C17, com o resulta-do de que a atividade transferida de colesterol é removida.As seqüências mostradas são de uma extremidade da região co-dificadora da cadeia pesada de D2E7 (últimos 9 pares de baseda seqüência codificadora HC, primeira linha da tabela) atéa extremidade 5' da região codificadora da cadeia leve deD2E7 (primeiros 9 pares de base da seqüência codificadora daLC, última linha da tabela) .
Tabela 28. Seqüência codificante parcial do plas-mideo pTT3-HC-C17-sc-LC (SEQ ID NO: 156)
Ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgc-atggacatg
Seqüência 3' da cadeia pesada -Hh- C17 - seqüên-cia 5' da cadeia leve
No seguinte constructo, a única diferença do cons-tructo pTT3-HC-C17-sc-LC acima é a mutação dos últimos doisaminoácidos na região C17 hedgehog de SC para HN (sublinha-do). As seqüências mostradas são de uma extremidade da regi-ão codificadora da cadeia pesada de D2E7 (últimos 9 pares debase da seqüência codificadora HC, primeira linha da tabela)até a extremidade 5' da região codificadora da cadeia levede D2E7 (última linha da tabela).
Tabela 29. Seqüência codificadora parcial do plas-mideo pTT3-HC-C17-hn-LC (SEQ ID NO:157)
ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatcgtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagatgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttggcagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaactcggtggccgccçaçaaç:atggacatg
Seqüencia 3' da cadeia pesada -Hh- C17 - mutação- seqüência 5' da cadeia leve
No seguinte constructo, a região C25 completa dodomínio Hint é usada, ao invés da C17. As seqüências mostra-das são de uma extremidade da região codificadora da cadeiapesada D2E7 (últimos 9 pares de base da seqüência codifica-dora HC, primeira linha da tabela) até a extremidade 5' daregião codificadora da cadeia leve de D2E7 (primeiros 9 pa-res de base da seqüência codificadora LC, última linha databela).
Tabela 29B. Seqüência codificadora parcial dapTT3-HC-C25-Hint-LC (SEQ ID NO: 158)ccgggtaaa-
tgcttcacgccggagagcacagcgctgctggagagtggagtccggaagccgctcggcgagctctctatcggagatc
gtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcag
atgcaaaactttgtgcagctgcacacggacggtggagcagtgctcacggtgacgccggctcacctggttagcgtttgg
cagccggagagccagaagctcacgtttgtgtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatg
tggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccg
ctgacccgcgagggcaccattgtggtcaactcggtggccgccagttgctatgcggtgatcaacagccagtcgctggc
ccactggggactggctcccatgcgcctgctgtccacgctggaggcgtggctgcccgccaaggagcagttgcacagtt
cgccgaaggtggtgagctcggcgcagcagcagaatggcatccattggtatgccaatgcgctctacaaggtcaagga
ctacgttctgccgcagagctggcgccacgat-
atggacatg
[seqüência 3' da cadeia pesada -Hh- domínio C25 - seqüên-cia 5' da cadeia leve]
(SEQ ID NO: 140)
A seqüência de aminoácidos de Hh-C25 e de cons-tructos relacionados (seta para baixo indica o sítio de cli-vagem; i: hh-C17 i: Hh-C17sc):
cftpestãllesgvrkplgelsigdrvlsmtangqav^sevilfmdmleqmqnfvqlhtdggavltvtpahlvsvwqpesqkltfvfadrieeknqvlvrdvetgelrpqrwkvgsvrskgwapltregtiwnsvaasc i yavinsqsilahwglapmrllstleawlpakeqlhsspkwssaqqqngihwyanalykvkdyvlpqswrhd
Exemplo 3: Expressão de anticorpo com a seqüênciade reconhecimento TEV para o processamento proteolítico.
Os constructos e os vetores de expressão são gera-dos para direcionar a expressão de anticorpos específicospara o fator α de necrose tumoral, interleucina-12, inter-leucina-18 e receptor de eritropoietina, com uma seqüênciade reconhecimento TEV entre os segmentos de seqüência de ca-deia pesada e leve de imunoglobulina que compreendem o anti-corpo de interesse. Preferivelmente, constructos incluem ve-tores de expressão compreendendo um promotor tardio princi-pal de adenovírus e o intensificador de citomegalovírus di-recionando a transcrição da cadeia pesada do anticorpo deinteresse a qual é precedida por uma seqüência líder na es-trutura. A seqüência codificadora da cadeia pesada é ligadaa um sitio de clivagem de furina na estrutura e a um sitiode reconhecimento TEV (E-P-V-Y-F-Q-G) seguido pela regiãocodificadora para a protease TEV anulada da região de loca-lização nuclear (Ceriani et al. (1998) Plant Molec Biol. 36:239), seguido por uma segunda seqüência de reconhecimentoTEV. A segunda seqüência de reconhecimento TEV é ligada naestrutura à seqüência lider para a cadeia leve do anticorpoligada para a região codificadora para a cadeia leve do an-ticorpo de interesse e o códon de parada. A região codifica-dora é seguida por um sinal de poliadenilação. São forneci-das seqüências relevantes aqui abaixo.
Tabela 1. Seqüência de DNA completa do vetor deexpressão TEV de D2E7 (Humira/adalimumab) (SEQ ID NO: 44)GAAGTTCCTAITCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGOCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATCKjGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACITn:CTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATC AATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCAITGACGTCAATGGGAGTTrGITITGGCACCAAAATCAACGGGACTTrCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACn^GGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCCKZGGTTGAGGACAAACTCITCGCGGTCITTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTCK:GCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCITITTGTTGTCA^TGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACITTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTITITCTrGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCITTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCCGTATAITACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTCKjTCACCGTCTCGAGTGCGTCGACCAACKjGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCÀCAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTCAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAG
CGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACA
AAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAG
GTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTC
AAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTA
CAAGACCACGCCTCCCGTGCrGGACTCCGACGGCTC(^CriTCCTCrrACAGCAAGCTCACCGTGGA
CAAGAGCAGGTGGCAGCAGGGGAACGTCITCTCATGCTCCGTGATGCATGAGGCTCTGCACAACC
ACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCT
TGTlTAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTrGTCATCTAACGAATGAATCTG
ATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTT
TAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCAC
AACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCC
ACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAA
CCAAÇTTCCAAACTAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTG
ATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAA
CTAGAGATGGGTTTATTGTrGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTA
CAAGTGTGCCGA7VAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGT
TGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGA
ACCCnTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGG
ACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACA
TCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTC
GGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAG
CTCCrGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTG
GGACAGATTrCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAA
GGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGGTGGCT
GCACCATCTGTCITCATCTrcCCGCCATCTGATGAGCAGTTGAAATCTGGAACrGCCTCTG
GCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAA
TCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAG
CACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATC
AGK3GCCTGAGCTCGCCCGTCACAAAGAGCTTCAAC^GGGGAGAGTGTrGAGCGGCCGCGTTTAAA
CTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAG
AATGCAGTGAAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCITrAriTGTAACCA
AGCTGCAATAAACAAGITAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTG
TGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCC
TCGCCTCGTITCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTT
GTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGT
GCGCCGAAGGCGCGATCTCAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGG
AAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCA
GGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCA
GCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTC
CGCCCCATGGCTGACTAAIlIlTll^ATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCrATT
CCAGAAGTAGTGAGGAGGCTITITrGGAGGCCTAGGCTTITGCAAAAAGCrCCTCGAGGAACT
AAAACCAGAAAGTTAACTGGTAAGTTTAGTCTTITrGTCITITATTTCAGGTCCCGGA
GGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTITACTTCTAGGCCTGTACGGAAGTGTT
ACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTAT
GGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACC
TACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACITCCAAAGAATGACCACAACCTCTTCAGTGG
AAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGA
CCTTTAAAGGACAGAAITAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCA
llli^liGCCAAAAGTTTAGATGATGCCTTAAGACTITATTGAACAACCGGAATTGGCAAGTAAAGT
AGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACC
TCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAAGTGACACGTITrrCCCAGAAATTGATr
TGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGC
ATC AAGT ATAAGTTTGAAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAAC
GGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGA
CGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCG
GTCCCAGGGCTGGCACTCTGTCGATACCCXIACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTC
TTCCITTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGC
GGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAAT
TCCGTT ACATTACITACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACG
TCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACrTTCCAITGACGTCAATGGGTGGAG
TATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATT
GACGTCAATGACGGTAAATGGCCCGCCTG<XrATTATGCCCAGTACATGACCTTATGGGACTTTCCT
ACTTGGCAGTACATCT ACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATC
AATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGG
AGTTTGTT1TGGCACC AAAATC AACGGGACTTTCCAAAATGTCGTAACAACTíXGCCCCATTGACG
CAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTC
GGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAG
CGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCA
TCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATA
AAAGGGGGTGGGGGCGCGTTCGTCCTCACTCrCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTG
GGCTCGCGGTTGAGGACAAACTCTTCGCGGTCITrCCAGTACTCTTGGATCGGAAACCCGTCGGCC
TCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCT
CGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTC
CAAAAACGAGGAGGATTTGATAITCACCTGGCCCGCGGTGATGCCnTGAGGGTGGCCGCGTCCAT
CTGGTCAGAAAAGACAATCTTITrGTTGTCAAGCTIOAGGTGTGGCAGGCTTGAGATCTGGCCATA
CACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCG
GAAITGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGA
TACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTTGTCAAATT
TGTGATCCTATIXKITITAlTrGTAACCAITATAAGCTGCAATAAACAAGTTAACAACAAC
ATTCATTTTATGITrCAGGTTCAGGCKjGAGGTGTGGGAGGTITTTrCGGATC
TGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTXXACACAAC
AGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCA
CTGCCCGCrTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGG
AAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCrGCGCTC
GGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGAT
AACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGT
TGCTGGCGITCrrCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGA
GGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGC
TCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGC
TTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGT
GCACGAACCCCCCGTTCAGíXCGACCGCTGCGCCTTATCCGGTAACTATCGTCTrGAGTCCAACCC
GGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATG
TAGGCGGTGCTACAGAGTTCITGAAGTGGTGGCCrAACTACGGCTACACTAGAAGAACAGTATTTG
GTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTA
AAACCACCGCTGGTAGCGGTGGTTITTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGA
TCTCAAGAAGATCCITTGATCITITCrACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAA
GGGATTITGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCCTTTTAATTAAAAATG^
ΤΤΓAAATC AATCTAAAGTATATATGAGTAAACnTGGTCTGACAGTTACCAATGCTTAATCAGTGAG
GCACCTATCTCAGCGATCTGTCTATTTCGTrCATCCATAGTrGCCTGACrCCCCGTCGTGTAGATAA
CTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCA
CCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGC
AACTTTATCCGCCTCCATCCAGTCTATrAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGT
TAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATG
GCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGC AAAAAA
GCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATG
GTTATGGCAGCACTGCATAATTCTCITACTGTCATGCCATCCGTAAGATGCTTrTCTGTGACTGGTG
AGTACTC AACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAA
TACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGG
GCTCGAAAACrCrCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCA
ACTGATCTTCAGCATCTTTTACTITCA(XAGCGTITCTGGGTGAGCAAAAACAGGAAGGCAAAATG
CCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTITCAATATr
AITGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATA
AACAAATAGGGGTTCCGCGCACAITTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTA
TCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCmCGTCTCGCGCGTTTCGGTGATG
ACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCC
GGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTA
TGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCITCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
Tabela 2A: Constructo TEV ABT-007: Seqüência codi-ficadora para a poliproteina (SEQ ID NO: 32).
ATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGCAGQAGTCGGG
CCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGCCTCCATCAGTAGTTACTACTGGA
GCTGGATCCGGCAGCCCCCAGGGAAGGGACTGGAGTGGATTGGGTATATCGGGGGGGAGGGGAGCACCAACTACAACC
CCTCCCTCMGAGTCGAGTCACCATATCAGTAGACACGTCCAAGAACCAGTTCTCCCTGAAGCTGAGGTCTGTGACCGCT
GCGGACACGGCCQTGTATTACTQTGCGAGAGAGCGACTGGGGATCGGGGACTACTGGGGCCAGGGAACCCTGGTCACC
GTCTCCTCAGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCQCCCTGCTCTAQAAGCACCTCCGAGAGCACAGCGG
CCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCTCTGACCAGCGGCGT
QCACACCTTCCCAGCTGTCCTGCAGTCCTCAGGACTCTACTCCCTCAGCAGCQTGGTGACCGTGCCCTCCAGCAACTTCQ
GCACCCAGACCTACACATGCAACGTAGATCACAAGCCCAGCAACACCAAGGTGGACAAGACAGTTGAGCGCAAATGTTGT
GTCGAGTGCCCACCGTGCCCAGCACCACCTGTGGCAGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCT
CATGATCTCCCGGACCCCTGAGGTCACGTGCGTGGTGGTGGACGTGAGCCACGAAGACCCCGAGGTCCAGTTCAACTGG
TACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCACGGGAGGAGCAGTTCAACAGCACGTTCCGTGTGGTCA
GCQTCCTCACCGTTGTGCACCAGGACTGGCTGAACGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGGCCTCCCAGC
CCCCATCGAGAAAACCATCTCCAAAACCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCX2ATCCCGGGAG
GAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTACCCCAGCGACATCGCCGTGGAGTGGGAGA
GCAATGGGCAGCCGGAGAACAACTACAAGACCACACCTCCCATGCTGGACTCCGAC^GCTCCTTCTTCCTCTACAGCAAG
CTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCnTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTA
CACGCAQAAGAGCXTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATrTCCAGGGGAQarTGTTTAAGGGGCCGCGTG
ATTATAACCCMTATCGAGTGCCATTTGTCATCTMCGAATGMTCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTT
GGCCCTTTCATCATCACAAACMGCATTTGTTTAGMGAAATMTGGTACACTGTTAGTTCAATCACTACATGGTGTGTTCAA
GGTAAAGAATACCACAACnTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATrCGCATGCCTAAGGATTTCCC
ACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACMAGGGMGAGCGCATATGTCTTGTGACAACCAACTTCCAAACTAA
GAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACC
AAGGATGGGCACTGTGGTAGCCCGTTGGTQTCAACTAGAQATGGGTrTATTGTTGGTATACACTCAGCATCAAATTTCACC
AACACAAACMTTArrrTACAAGTGTGCCGAMGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTG
GTTGGCGATTGAATGCTGACTCAGTGTTATGGGGAGGCCACAMGTTTTCATGAGCAMCCTQMGAACCCTTTCAGCCAG
TCAAAQAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTG
CTGCTGTGGTTCX3CCGGCTCGCGATGCGACATCCAGCTGACCCAATCTCCATCCTCCCTGTCTGCATCTGTAGGAGACAG
AGTCACCATCACTTGCCGGGCAAGTCAGGGCATTAGAAATGATTTAGGCTGGTATCAGCAGAAACCAGGGAAAGCCCCTA
AGCGCCTGATCTATGCTGCATCCAGTTTGCAAAGTGGGGTCCCATCAAGGTTCAGCXàGCAGTGGATCTGGGACAGAATTC
ACTCTCACMTCAGCAGCCTGCAGCCTGAAGATTrTGCMCTTATTACTGTCTACAGCATAATACTTACCCTCCGACGTTCG
GCCMGGGACCMGGTGGAMTCAMCGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTQATGAGCAGTTG
AAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTQGATAAC
GCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCAíXC
TGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTC
ACAAAGAGCTTCAACAGGGGAGAGTGTTGA
Tabela 2B. Seqüência de aminoácido da poliproteinaTEV ABT-007 (SEQ ID NO: 33).
MEFGLSWLFLVA1LKGVQCQVQLQESGPGLVKPSETLSLTCTVSGASISSYYWSW1RQPPGKGLEWIGYIQGEGSTN YNPSLKSRVTISVDTSKNQFSLKLRSVTAADTAVYYCARERLGIGDYWGQGTLVTVSSASTKGPSVFPLAPCSRSTSESTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSWTVPSSNFGTQTYTCNVDHKPSNTKVDKTVERKCCVECPPCPAPPVAGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTFRWSVLTVVHQDWLNGKEYKCKVSNKGLPAPIEKTISKTKGQPREPQNATLPPSREEIVrrKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPMLDSDGSFFLYSK
LTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKREPVYFQGSLFKGPRDYNPISSAICHLTNESD
GHTTSLYGIGFGPRITNKHLFRRNNGTll.VQSmGVFKVKNTTTLQQHLIDGRDMMLIRMPKDFPPFPCaL
KFREPQREERICLVTTNFQTKSMSSMVSDTSCTFPSSDGIFWKHWIQTKDGHCGSPLVSTRDGFIVGIHSA
SNFTNTNNYFTSVPKDFMDLLTNQEAQQWVSGWRLNADSVLWGGHKVFMSKPEEPFQPVKEATQLMSE
LVYSQGMRVPAQLLGLLLLWFPGSRCDIQLTQSPSSLSASVGDRVTITCRASQGIRNOLGWYQQKPGKAP
KRUYAASSLQSGVPSRFSGSGSGTEFTLTISSLQPEDFATYYCLQHNTYPPTFGQGTKVEIKRTV AAPSVR
FPPSDEQLKSGTASWCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYE
KHKVYACEVTHQGLSSPVTKSFNRGEC*
Tabela 2C. Seqüência do vetor de expressão doconstructo TEV ABT-007 completa (SEQ ID NO: 34).
G AAGTtCCT ATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTG
GCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCC
AATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTAC
ATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTG
GCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATT AGTCAT
CGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCA
CGGGGATTTCCMGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACG
GGACTTTCCAAAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTC
GGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACG AAGGC
TCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCG7TGTCCACTAGGG
GGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGG
TTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGC
GCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGA
GGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTA
CTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTG
GGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACG
AGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTC
AGAAMGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTT
GAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAAT
TGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCI I I I ICTT
GTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTG
AAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGCCTCCATCAGTAGTT ACT ACTG
GAGCTGGATCCGGCAGCCCCCAGGGAAGGGACTGGAGTGGATTGGGTATATCGGGGGGGAGG
GGAGCACCAACTACAACCCCTCCCTCAAGAGTCGAGTCACCATATCAGTAGACACGTCCAAGAA
CCAGTTCTCCCTGAAGCTGAGGTCTGTGACCGCTGCGGACACGGCCGTGTATTACTGTGCGAGA
GAGCGACTGGGGATCGGGGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGCGTC
GACCAAGGGCCCATCGGTCTTCCCCCTGGCGCCCTGCTCTAGAAGCACCTCCGAGAGCACAGC
GGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGG
CGCTCTGACCAGCGGCGTGCACACCTTCCCAGCTGTCCTGCAGTCCTCAGGACTCTACTCCCTC
AGCAGCGTGGTGACCGTGCCCTCCAGCAACTTCGGCACCCAGACCTACACATGCAACGTAGATC
ACAAGCCCAGCAACACCAAGGTGGACAAGACAGTTGAGCGCAAATGTTGTGTCGAGTGCCCACC
GTGCCCAGCACCACCTGTGGCAGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACC
CTCATGATCTCCCGGACCCCTGAGGTCACGTGCGTGGTGGTGGACGTGAGCCACGAAGACCCC
GAGGTCCAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCACGG
GAGGAGCAGTTCAACAGCACGTTCCGTGTGGTCAGCGTCCTCACCGTTGTGCACCAGGACTGG
CTGAACGGCAAGGAGTACMGTGCAAGGTCTCCAACAAAGGCCTCCCAGCCCCCATCGAGAAAA
CCATCTCCAAAACCAMGGGCAGCCCCGAGMCCACAGGTGTACACCCTGCCCCCATCCCGGG
AGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTACCCCAGCGACAT
CGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACACCTCCCATGCT
GGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCA
GGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGC
CTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGCGTGATT ATAACCC AATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACAT
CGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATTTGTTTAGAAGAAATAATG
GT ACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGT AAAGAAT ACCACAACTTTGCAACAAC
ACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGATTTCCCACCATTTCCTCAA
AAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAAC
TAAGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTG
GAAACATTGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGG
TTTATTGTTGGTATACACTCAGCATCAMTTTCACCMCACMACMTTATTTTACAAGTGTGCCGA
AAGACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAAT
GCTGACTCAGTGTTATGGGGAGGCCACAAAGTTTTCATGAGCAAACCTGAAGAACCCTTTCAGC
CAGTCAAAGAAGCAACTCAACTCATGAGTGAATT AGTCT ACTCGCAAGGGATGCGCGTGCCCGC
CCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGCTGACCCA
ATCTCCATCCTCCCTGTCTGCATCTGTAGGAGACAGAGTCACCATCACTTGCCGGGCAAGTCAG
GGCATTAGAAATGATTTAGGCTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAGCGCCTGATCT
ATGCTGCATCCAGTTTGCAAAGTGGGGTCCCATCAAGGTTCAGCGGCAGTGGATCTGGGACAGA
ATTCACTCTCACAATCAGCAGCCTGCAGCCTGAAGATTTTGCAACTTATTACTGTCTACAGCATAA
TACTT ACCCTCCGACGTTCGGCCAAGGGACCAAGGTGGAAATCAAACGTACGGTGGCTGCACCA
TCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCT
GCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCG
GGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGC
ACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATC
AGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGAGCGGCCGCGTTTA
AACTGAATGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACT
AGAATGCAGTGAAAAMATGCTTTATTTGTGAAAmGTGATGCTATTGCTTTATTTGTAACCATTA
TAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGG
TGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCT
GCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCA
CAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTG
GCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCI I I I I I I I IAAI I I I IATTTTATT
TTATTTTTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCA
GTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAAT
TAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATG
CATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGC
CCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAAI Illlll IATTTATGCAGAGGCCGAGGCC
GCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCI Illl IGGAGGCCTAGGCTTTTGCA
AAAAGCTCCTCGAGGAACTGAAAAACCAGAAAGTTAACTGGTAAGTTTAGTCI I I I IGTCTTTTAT
TTCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTA
CTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAA
TACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGCATCGTCGCCGTGTCCCAAAAT
ATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTACTTCC
AAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAATCTGGTGATTATGGGTAGGAAAACC
TGGTTCTCCATTCCTGAGAAGAATCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAA
CTCAMGMCCACCACGAGGAGCTCATTTTCTTGCCAAAAGTTTAGATGATGCCTTAAGACTTATT
GAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTCTGTTTACCA
GGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGAATTTGAAA
GTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTTCTCCCAGAATACCCAGGCGTC
CTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGAAAGACTA
AGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGA
GACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGT
TGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCG
AGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGG
GTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCC
GTGGGTT AGGGACGGGGTCCCCCATGGGGMTGGTTTATGGTTCGTGGGGGTTATTATTTTGGG
CGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGT AAATG
GCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCAT
AGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACT
TGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGG
CCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGT
ATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGT
TTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGT7TGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATT
CGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGA
CGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCC
ACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAG
GTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGG
GTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCT
CGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTC
CGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCT
CGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTT
CCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTC
CATCTGGTCAGAAAAGACAATCI I I I IGTTGTCMGCTTGAGGTGTGGCAGGCTTGAGATCTGGC
CATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCC
AACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACA
TGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTATTT
GTGAMTTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAA
CAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGI Illl ICGGATCCTCTTG
GCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATA
CGAGCCGGAAGCAT AAAGTGT AAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATT AATTG
CGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGG
CCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTC
GCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAAT ACGGTT
ATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAG
GAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCCCGTGACGAGCATCAC
AAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTC
CCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGC
CTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGT
AGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCT
TATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGC
CACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTGTTGAAGTGGTGG
CCT AACT ACGGCTACACT AGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTT
CGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAMCAAACCACCGCTGGTAGCGGTGGTTTTTTT
GTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTAC
GGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAA
GGATCTTCACCTAGATCCCTTTTAATT AAAAATGAAGTTTTAAATCAATCTAAAGT ATATATGAGTA
AACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTC
GTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCT
GGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAA
ACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACJTTATCCGCCTCCATCCAGT
CTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTT
GCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTT
CCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGtTAGCTCCTTCGG
TCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGC
ATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGT
CATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATAC
CGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCT
CAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCMCTGATCTTCA
GCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAA
GGGMTMGGGCGACACGGAMTGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCAT
TTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGG
GGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACAT
TAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAA
AACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGC
AGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGC
GGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTA
AGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGA
TCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTA
AGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
Tabela 3A. Seqüência codificadora para a polipro-teina TEV ABT-874 (J695) (SEQ ID NO: 35).ATGGAQTTTGGGCTGAGCTGGCTrrTTCTTGTCGCGATTTTMAAGGTGTCCAGTGTCAGGTGCAGCTGGTGGAGTCTGQ
GGGAGGCGTGGTCCAGCCTGGGAGGTCCCTGAGACTCTCCTGTGCAGCQTCTGGATTCACCTTCAGTAGCTATGGCATG
CACTGGGTCCGCCAGGCTCCAGGCAAGGQGCTGGAGTGGGTGGCATTTATACGGTATGATGGAAGTAATAAATACTATGC
AGACTCCGTGAAGGGCCGATTCACCATCTGCAGAGACAATTCCAAGAACACGCTGTATCTGCAGATGAACAGCCTGAGAG
CTGAGGACACGGCTGTGTATTACTGTAAGACCCATGGTAGCCATGACAACTGGGGCCAAGGGACAATGGTCACCGTCTCT
TCAGCGTCGACCMGGGIXCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGG
GCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACAC
CTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCC
AGACCTACATCTGCAACGTGAATCACAAGCXCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAA
CTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGAC
ACCXTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGMGACXXTGAGGTCAAGTTCAA
CTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTG
GTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACMGTGCAAGGTCTCCAACAAAGCCCTCCC
AGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGC
GAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGG
AGAGCMTGGGCAGCCGGAGAACAACTACAAGACCACQCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGC
AAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACC
ACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCG
CGTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTG
GTTTTGGCCCTTTCATCATCACAMCAAGCATTTGTTTAGAAGAAATAATGGTACACTGTTAGTTCAATCACTACATGGTGTG
TTCAAGGTAAAGMTACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGAT
TTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAA
ACTMGAGCATGTCTAGCATGGTTTCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTC
AGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATT
TCACCAACACAAACAATTATTTTACMGTGTGCCGAAAGACrrTCATGGWTTTATTGACAAATCAAGAGGCGCAGCAATGGGT
TAGTGGTTGGCGATTGMTGCTGACTCAGTGTTATGGGGAGGCCACAMGTTTTCATGAGCAMCCTGMGMCCCTTTCA
GCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGACTTGGACCCCACTCCTCTTCCTCAC
CCTCCTCCTCCACTGCACAGGAAGCTTATCCCAGTCTGTGCTGACTCAGCCCCCCTCAGTGTCTGGGGCCCCCGGGCAGA
GAGTCACCATCTCTTGTTCTGGAAGCAGATCCAACATCGGCAGTAATACTQTAAAGTGGTATCAGCAGCTCCCAGGAACGG
CCCCC AAACTCCTCATCTATTACAATGATCAGCGGCCCTCAGGGGTCCCTGACCGATTCTCTGGATCCAAGTCTGGCACCT
CAGCCTCCCTCGCCATCACTGGGCTCCAGGCTGAAGACGAGGCTGACTATTACTGCCAGTCATATGACAGATACACCCAC
CCCGCCCTGCTCTTCGGMCTGGGACCAAGGTCACAGTACTAGGTCAGCCCMGGCTGCCCCCXTCGGTCACTCTGTTCC.C
GCCCTCCTCTGAGGAGCTTCAAGCCAACAAGGCCACACTGGTGTGTCTCATAAGTGACTTCTACCCGGGAGCCGTGACAG
TGGCCTGGAAGGCAGATAGCAGCCCCGTCAAGGCGGGAGTGGAGACCACCACACCCTCCAAACAAAGCAACAACAAGTA
CGCGGCCAGCAGCTACCTGAGCCTGACGCCTGAGCAGTGGAAGTCCCACAGAAGCTACAGCTGCCAGGTCACGCATGAA
GGGAGCACCGTGGAGAAGACAGTGGCCCCTACAGAATGTTCATGA
Tabela 3B. Seqüência de aminoácidos da poliprotei-na TEV ABT-874 (J695) (SEQ ID NO: 36).
METGLS Wm.VAnJCGVQCQVQLVESGGGWQPGRSLRLSCAASGFn^SYGMHWRQAPGKGLEWVAFIRYDGSNKYYADSVKGRraSRDNSKNTLYLQMNSLRAEDTAVYYCKraGSHDWSSASTKGPSVFPLAPSSKSTSGGTAALGCXVKDYFPEPVTVSWNSGALTSGVHIWAVLQSSGLYSLSSVVTVPSSSLGTQTYIClWNHKPS>rrKVDKKVEPK5CDKTOTIPEWCVVVI)VSHEDPEVKFNWYVDGVEVHNAKTKPREEQ YNST^
KVSNKAIPAPIEKTISKAKGQPREPQVY^1PPSREEMTKNQVSLTCLVKGFYPSDIA\ΈWESNGQPE^W
YKTTTFVIJDSIXjSFFLYSKLTVDKSRWQQGNVFSC^^
KGPRD YNPISSAICHLTNESDGHTTSLYGIGFGPFinmHLFRI^^
LmGRDMMLIRMPKDFPPFPQKLKFREPQREERICLVTTWQTKSMSSMVSD
TKDGHCGSPLVSTRDGFIV GIHS ASNFTOTNNYFTS WKDFMDIiTNQEAQQX^
GHKVmSKPEEPFQPVKEATQI^ELVYSQGMITVTPLX^^
VTISCSGSRSMGSNTVKWYQQIJPGTAPK11JYYNDQRPSGVPDRFSGSKSGTSASLAITGLQAEDEADY
YCQSYDRYTHPAIXFGTGTKVTVLGQPKAAPSVTLFPPSSEELQANKATLVCUSDFYPGAVTV
DSSPVKAGVETTTPSKQSNNKYAASSYI^LTTEQWKSHRSYSCQVTHEGST^KTVAPTECS*
Tabela 3C. Seqüência de nucleotideos completa dovetor de expressão TEV ABT-874 (J695) (SEQ ID NO: 37).GAAGTTCCTATTCCGAAGTTCCTATTCTCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGG
CTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAAT
AGGGACTTTCCATTGACGTCAATGGGTGGAGTATITACGGTAAACTGCCCACTTGGCAGTACATCA
AGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTA
TGCCCAGTACATGACCTTATGGGACTITrCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATT
ACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTCACTCACGGGGATTT
CCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGGACCAAAATGAACGGGACTTTCCA
AAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGC
GGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCC
AGCACGAAGGAGGCTAAGTCK3GAGK3GGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAG
GGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCAC
GTGACCGGGTGTTCCTGAAGGGCHjGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTC
CGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCnTrc
CAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCG
AGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGG
GCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAAÇGAGGAGGATTTGATArrCACCTGGCCCG
CGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCT
TGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTrGAGTGACAATGACATCCACTTTGCCTTrCT
CTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCC
ACCATGGAGITTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTCAGGTG
CAGCTGGTGGAGTCTGGGGGAGGCGTGGTCCAGCCTGGGAGGTCCCTGAGACTCTCCTGTGCAGC
GTCTGGATTCACCTTCAGTAGCTATGGCATGCACTGGGTCCGCCAGGCTCCAGGCAAGGGGCTGGA
GTGK3GTGGCATTTATACGGTATGATGGAAGTAATAAATACTATGCAGACTCCGTGAAGGGCCGAT
TCACCATCTCCAGAGACAATTCCAAGAACACGCTGTATCTGCAGATGAACAGCCTGAGAGCTGAG
GACACGG CTGTGTATTACTGTAAGACCCATGGTAGCCATGACAACTGGGGCCAAGGGACAATGGT.
CACCGTCTCTrCAGCGTCGACCAAGGGCCCATCGGTCTrCCCCCTGGCACCCTCCrCCAAGAGCAC
CTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTC
GTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACT
CTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAA
CGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAA
CTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCC
CAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTG
AGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAA
GACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGC
ACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCC
ATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCC
ATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCA
GCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCC
CGTGCTGGACTCCGACGGCTCCITCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCA
GCAGGGGAACGTCITCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGA
GCCTCTCCCTGTCTAGGGGTAAACGCGAACCAGTTTATTTCCAGGGGAGCTTGTTTAAGGGGCCGC
GTGATTATAACCCAATATCGAGTGCCATTTGTCATCTAACGAATGAATCTGATGGGCACACAACAT
CGTTGTATGGTATTGGTTTTGGCCCTTTCATCATCACAAACAAGCATITGTTTAGAAGAAATAATG
GTACACTGTTAGTTCAATCACTACATGGTGTGTTCAAGGTAAAGAATACCACAACTTTGCAACAAC
ACCTCATTGATGGGAGGGACATGATGCTCATTCGCATGCCTAAGGAITrCCCACCATTTCCTCAAA
AGCTGAAATTCAGAGAGCCACAAAGGGAAGAGCGCATATGTCTTGTGACAACCAACTTCCAAACT
AAGAGCATGTCTAGCATGGTTrCAGATACTAGTTGCACATTCCCTTCATCTGATGGTATATTCTGGA
AACAITGGATTCAGACCAAGGATGGGCACTGTGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTT
ATTGTTGGTATACACTCAGCATCAAATTTCACCAACACAAACAATTATTTTACAAGTGTGCCGAAA
GACTTCATGGATTTATTGACAAATCAAGAGGCGCAGCAATGGGTTAGTGGTTGGCGATTGAATGCT
GACTCAGTGTTATGGGGAGGCCACAAAGTITrcATGAGCAAACCTGAAGAACCCTTrCAGCCAGTC
AAAGAAGCAACTCAACTCATGAGTGAATTAGTCTACTCGCAAGGGATGACTTGGACCCCACTCCTC
TTCCTCACCCTCCTCCTCCACTGCACAGGAAGCTTATCCCAGTCTGTGCTGACTCAGCCCXrCCTCAG
TGTCTGGGGCCCCCGGGCAGAGAGTCACCATCTCTTGTTCTGGAAGCAGATCCAACATCGGCAGTA
ATACTGT AAAGTGGTATCAGCAGCTCCCAGGAACGGCCCCCAAACTCCTCATCTATTACAATGATCAGCGGCCCTCAGGGGTCCCTGACCGATTCTCTGGATCCAAGTCTGGCACCTCAGCCTCCCTCGCCA
TCACTGGGCTCCAGGCTGAAGACGAGGCTGACTATTACTGCCAGTCATATGACAGATACACCCACC
CCGCCCTGCTCTTCGGAACTGGGACCAAGGTCACAGTACTAGGTCAGCCCAAGGCTGCCCCCTCGG
TCACTCTGTTCCCGCCCTCCTCTGAGGAGCTTCAAGCCAACAAGGCCACACTGGTGTGTCTCATAA
GTGACTTCTACCCGGGAGCCGTGACAGTGGCCTGGAAGGCAGATAGCAGCCCCGTCAAGGCGGGA
GTGGAGACCACCACACCCTCCAAACAAAGCAACAACAAGTACGCGGCCAGCAGCTACCTGAGCCT
GACGCCTGAGCAGTGGAAGTCCCACAGAAGCTACAGCTGCCAGGTCACGCATGAAGGGAGCACCG
TGGAGAAGACAGTGGCCCCTACAGAATGTTCATGAGCGGCCGCGTTTAAACTGAATGAGCGCGTC
CATCCAGACATGAT AAGAT ACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTGAAAAAA
ATGCTTTATTTGTGAAATTTCTGATGCTATTGCTITA
GTTAACAACAACAATTGCAirCATTTrATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCGGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGC GCGCCTTITITITrΑΑΤΤΤΤΤΑΊΤΙΤΑΤΤΓ^
GATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCT
CCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCC
CCAGGCrccCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCC
GCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGA
CTAATTIlilllATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCC AGAAGTAGTGA
GGAGGCllllllGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGAACTGAAAAACC AGAAAGT
TAACTGGTAAGTTTAGTClilllGTCTTTTATITCAGGTCCCGGATCCGGTGGTGGTGCAAATCAAA
GAACTGCTCCTCAGTGGATGTTGCCirrACTTCTAGGCCTGTACGGAAGTGTrACTTCTGCT
AGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGA
ACTGCATCGTCGCCGTGTCCCAAAATATGGGGATTGGCAAGAACGGAGACCTACCCTGGCCTCCG
CTCAGGAACGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAAACAGAA
TCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCATTCCTGAGAAGAATCGACCITTAAAGGACAG
AATTAATATAGTTCrCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCAl-rrrCT-rGCCAAAAG
TITAGATGATGCCTTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGAT
AGTCGGAGGCAGTTCTGTITACCAGGAAGCCATGAATCAACCAGGCCACCrCAGACTCrTTGTGAC
AAGGATCATGCAGGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACT
TCTCCCAGAATACCCAGGK]GTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTG
AAGTCTACGAGAAGAAAGACTAAGCGGCCGAGCGCGCGGATCTGGAAACGGGAGATGGGGGAGG
CTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGAC
AGAATAAAACGCACGGGTGTTGGGTCGITrGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCA
CTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGITrCITCCTTTTCCCCACCC
CACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCAT
AGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCATGGGGAATGGTTTATGGTTCGTGGGGGTT
AITAITlTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCrGCAGGAATTCCGTTACATTACTrA
CGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATG
TTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTG
CCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTA
AATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCT
ACGTATTAGTCATCGCTAITACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGC
GGTITGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACC
AAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAAT
TCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGAC
GAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTA
GGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATT
GGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGC
GCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGG
ACAAACTCITCGCGGTCTTTCCAGTACTCrrGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCC
GCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGA
GTACTCCCTCTCAAAAGCGGGCATGACITCTGCGCTAAGAITGTCAGTTTCCAAAAACGAGGAGGA
TTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGAC
AATClllllGTTGTCAAGCrTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAAT
GACATCCACTTrGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGG
CCAGAGCTTGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTT
GGACAAACCACAACTAGAATGCAGTGAAAAAAATGCTTTAITTGTGAAATTrGTGATGCTATTGCT
TTATTTGTAACCArTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGmAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTCGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTT
CCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAA
GCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCITrCCAG
TCGGG AAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCG
TATTGGGCGCrCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCG
GTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGG AAAGAA
CATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCCK:GTTGCTGGCGTTCTTCC
ATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCG
ACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCrCGTGCGCTCTCCTGTTCCGACC
CTGCCGCTTACCGGATACCTGTCCGCCTITCTCCCXrc
GCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCG
TTCAGCCCGACCGCTGCGCCITATCCGGTAACTATCGTCITGAGTCCAACCCGGTAAGACACGACT
TATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACA
GAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTG
CTGAAGCCAGTTACCITCGGAAAAAGAGTTGGTAG<mrOGATCCGGCAAACAAACCACCGCTGG
TAGCGGTGGTTITITTGTITGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCrCAAGAAGATC
CTITGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCA
TGAGATTATCAAAAAGGATCTTCACCTAGATCCCT^
AAAGTATATATGAGTAAACTTGGTCrGACAGTTACCAATGCITAATCAGTGAGGCACCTATCTCAG
CGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGA
GGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTT
ATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCT
CCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCA
ACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTrCATTCAGCTC
CGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTT
CGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACT
GCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCITITCTGTGACTGGTGAGTACTCAACCAAG
TCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACC
GCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGITCTTCGGGGCGAAAACTCTCA
AGGATCTTACCGCTGTTGAGATCCAGITCGATCTAACCCACTCGTGCACCCAACTGATCTTCAGCA
TClll^ACTTTCACCAGCGTTrCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGG
AATAAGGGCGACACGGAAATGTTGAATACTCATACrCTTCCITTTrCAATATTATrGAAG^
CAGGGTTAITGTCTCATGAGCGGATACATATTrGAATGTATTTAGAAAAATAAACAT^ATAGGGGirr
CCGCGCACATITCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACC
TATAAAAATAGGCGTATCACGAGGCCCrTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTC
TGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGC
CCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGC
AGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATAC
CGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCT
TCGCTATTACGCCACK:TGGCGAAAGGGGGAIX3TCCTGCAAGGCGATTAAGTTGGGTAACGCCAGG
GTnTCCCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
Tabela 4A. Seqüência de ácido nucléico codificandoa poliproteina TEV EL246 GG (Anti-E/L selectina) (SEQ ID NO:38) .
ATGGAQTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGCGAGGTGCA
GCTGGTGCAGTCTGGAGCAGAGGTGAAAAAGCCCGGGGAGTCTGTGAAGATCTCCTGT AAGGG
GTCCGGATACGCATTCAGTAGTTCCTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCT
GGAGTGGATGGGGCGGATTTATCCTGGAGATGGAGATACTAACTACAATGGGAAGTTCAAGGGC
CAGGTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGAGCAGCCTGAAG
GCTAGCGACACCGCCATGTATTACTGTGCGAGAGCGCGCGTGGGATCCACGGTCTATGATGGTT
ACCTCTATGCAATGGACTACTGGGGTCAAGGTACCTCAGTCACCGTCTCCTCAGCGTCGACCAA
GGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCT
GGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCT
GACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGC
GTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGC
CCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCaccgtgcccagcacctgaagccgcggggggaccgtcagtcttcctcttcxccccaaaacccaa
ggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacga
agaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaag
ccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccag
gactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcg
agaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatg
ccgcgaggagatgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccag
cgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcc
cgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtgg
cagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcaga
agagcctctccctgtctaggggtaaacgcgaaccagtttatttccaggggagcttgtttaaggg
gccgcgtgattataacccaatatcgagtgccatttgtcatctaacgaatgaatctgatgggcaca
caacatcgttgt atggt attggttttggccctttcatcatcacaaacaagcatttgtttagaagaa
at aatggt acactgttagttcaatcactacatggtgtgttcaaggtaaagmtaccacaactttgc
aacaacacctcattgatgggagggacatgatgctcatrcgcatgcctaaggatttcccaccattt
cctcaaaagctgaaattcagagagccacaaagggaagagcgcatatgtcttgtgacaaccaactt
ccaaact aagagcatgtctagcatggtttcagatactagttgcacattcccttcatctgatggtat
attctggaaacattggattcagaccaaggatgggcactgtggtagcccgttggtgtcaactaga
gatgggtttattgttggtatacactcagcatcaaatttcaccmcacmacmttattttacaagt
gtgccgaaagacttcatggatttattgacaaatcaagaggcgcagcaatgggttagtggttggc
gattgaatgctgactcagtgttatggggaggccacaaagttttcatgagcaaacctgaagaaccc
tttcagccagtcaaagaagcaactcaactcatgagtgaattagtctactcgcaagggatggacat
gcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacat
cgtgatgacccagtctccagactccctggctgtgtctctgggcgagagggccaccatcaactg
caagtccagtcagagcctttcatatagaagcaatcaaaagmctcgttggcctggtaccagcaga
aaccaggacagcctcctaagctgctcatttactgggctagcactagggaatctggggtccctga
ccgattcagtggatccgggtctgggacagatttcactctcaccatcagcagcctgcaggctgaa
gatgtggcagtttattactgtcaccaatattatagctatccgtacacgttcggaggggggaccaa
ggtggaaatt aaacgt acggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagt
tgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagta
cagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggac
agcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaa
cacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttca
acaggggagagtgttga
Tabela 4B. Seqüência de aminoácidos da poliproteí-na TEV EL246 (Anti-E/L selectina)
Mefglswlfi-Vailxgvqcevqlvqsgaevkkpgeslkisckgsgyafssswigwvrqmpgkglew
mgriypgdgdtnyngkfkgqvtisadksistaylqwsslkasdtamyycararvgstvydgylyam
dywgqgtsvtvssastkgpsvfplapsskstsggtaalgclvkdyfpepvtvswnsgaltsgvhtf
pa\^qssglyslssv\nvpssslgtqt\1cnvnhkpsntkvdkkvepkscdkthtcppcpapeaagg
psvflpppkpkdtlmisrtpevtcvwdvshedpevkfnwyvdgvevhnaktkpreeqynstyrws
vltvlhqdwlngkeykckvsnkalpapiektiskakgqprepqvytlppsreemtknqvsltclvkg
fypsdiavewesngqpennykttppvldsdgsfflyskltvdksrwqqgnvfscsvmhealhnhyt
qkslslsrgkrepvyfqgslfkgprdynpissaichltnesdghttslygigfgpfiitnkhlfrrnng
tllvqslhgvfkvkntttlqqhudgrdmmlirmpkdfppfpqklkfrepqreericlvttnfqtksm
ssmvsdtsctfpssdgifwkhwiqtkdghcgsplvstrdgfivgihsasnftntnnyftsvpkdfmd
lltnqeaqqwvsgwrlnadsvlwgghkvfmskpeepfqpvkeatqlmselvysqgmdmrvpaql
lgllllwfpgsrcdivmtqspdslavslgeratinckssqslsyrsnqknslawyqqkpgqppklli
ywastresgvpdrfsgsgsgtdftltisslqaedvavyychqyysypytfgggtkveikrtvaapsv
fifppsdeqlksgtaswcllnnfypreakvqwkvdnalqsgnsqesvteqdskdstyslsstltls
kadyekhkvyacevthqglsspvtksfnrgec*
Tabela 4C. Seqüência de nucleotideo completa parao vetor de expressão de poliproteina TEV EL246 GG (anti-E/Lselectina) (SEQ ID NO: 40).
GAAGTTCCTATTCCGAAGITCCTATTCrCTAGACGTTACATAACTTACGGTAAATGGCCCGCCTGG
CTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAAT
AGGGACTTTCCAITGACGTCAATGGGTGGAGTAITrACGGTAAACTGCCCACTTGGCAGTACATCA
AGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTA
TGCCCAGTACATGACCTTATGGGACITTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATT
ACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGK^GGTTTGACTCACGGGGATTT
CCAAGTCnXXACCCeATTGACGTCAATGGGAGTTrGTTTTGGCACCAAAATCAACGGGACTTrCCA
AAATGTCGTAACAACTCCGCCCCAATGACGCAAATGGGCAGGGAATTCGAGCTCGGTACTCGAGC
GGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCC
AGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAG
GGTGTGAAGACACATGTCGCCCTCTTCGGCATC AAGGAAGGTGATTGGTTTATAGCirGTAGGCCAC
GTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTC
CGCATCGCIOTCTGCGAGGGCCAGCTGTTGGGCrcGCGGTTGAGGACAAACTOT
CAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCG
AGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGG
GCATGACITCTGCGCrAAGATTGTCAGTTrCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCG
CGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTITITGTr
TGAGGTGTGGCAGGCITGAGATCTGGCCATACACITGAGTGACAATGACATCCACTITGCCTITCT
CTCCACAGGTGTCCACTCCCAGGTCC AACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCC
ACCATGGAGITTGGGCTGAGCTGGC rTlllCIlGTCGCGAITrrAAAAGGTGTCCAGTGCGAGGTG
CAGCTGGTGCAGTCTGGAGCAGAGGTGAAAAAGCCCGGGGAGTCTCTGAAGATCTCCTGTAAGGG
GTCCGGATACGCATTCAGTAGTTCCTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCTGG
AGTGGATGGGGCGGATTTATCCTGGAGATGGAGATACTAACTACAATGGGAAGTTCAAGGGCCAG
GTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGAGCAGCCTGAAGGCTAG
CGACACCGCCATGTATTACTGTGCGAGAGCGCGCGTGGGATCCACGGTCTATGATGGTTACCTCTA
TGCAATGGACTACTGGGGTC AAGGTACCTCAGTCACCGTCTCCTCAGCGTCGACCAAGGGCCCATC
GGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGT
CAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGC
ACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCT
CCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTG
GACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTGCCCAGCACCTGA
AGCCGCGGGGGGACCGTCAGTCITCCICTTCCCCCCAAAACCX^AAGGACACCCTCATGATCTCCCG
GACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACT
GGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAG
CACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACA
AGTGC AAGGTCTCCAACAAAGCCCICCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGG
CAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGT
CAGCCTGACCTGC CTGGTC AAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGC AATG
GGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCX71TCITCCTCT
ACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATG
CATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTAGGGGTAAACGCGAACC
AGITTAITTCCAGGGGAGCTTGTTrAAGGGGCCGCGTGATTATAACCCAATATCGAGTGCCATTTG
TCATCTAACGAATGAATCTGATGGGCACACAACATCGTTGTATGGTATTGGTTTTGGCCCTTTCATC
ATCACAAACAAGCATITGTITAGAAGAAATAATGGTACACTGITAGTTCAATCACTACATGGTGTG
TTCAAGGTAAAGAATACCACAACTTTGCAACAACACCTCATTGATGGGAGGGACATGATGCTCATT
CGCATGCCTAAGGATTTCCCACCATTTCCTCAAAAGCTGAAATTCAGAGAGCCACAAAGGGAAGA
GCGCATATGTCITGTGACAACCAACITCCAAACrAAGAGCATGTCTAGCATGGTTTCAGATACTAG
TTGCACATTCCCTTCATCTGATGGTATATTCTGGAAACATTGGATTCAGACCAAGGATGGGCACTG
TGGTAGCCCGTTGGTGTCAACTAGAGATGGGTTTATTGTTGGTATACACTCAGCATCAAATTTCAC
CAACACAAACAATTATTTTACAAGTGTGCCGAAAGACTTCATGGATTTATTGACAAATCAAGAGGC
GCAGCAATGGGTTAGTGGITGGCGATTGAATGCTGACTCAGTG1TATGGGGAGGCCACAAAGrTTT
CATGAGCAAACCTGAAGAACCCTTTCAGCCAGTCAAAGAAGCAACTCAACTCATGAGTGAATTAG
TCTACTCGCAAGGGATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCC
CCGGCTCGCGATGCGACATCGTGATGACCCAGTCTCCAGACTCCCTGGCTGTGTCTCTGGGCGAGA
GGGCCACCATCAACTGCAAGTCCAGTCAGAGCCTTTCATATAGAAGCAATCAAAAGAACTCGTTG
GCCTGGTACCAGCAGAAACCAGGACAGCCTCCTAAGCTGCTCATTTACTGGGCT AGCACT AGGGA
ATCTGGGGTCCCTGACCGATTCAGTGGATCCGGGTCTGGGACAGATTTCACTCTCACCATCAGCAG
CCTGCAGGCTGAAGATGTGGCAGTTTATTACTGTCACCAATATTATAGCTATCCGTACACGTTCGG
AGGGGGGACCAAGGTGG AAATTAAACGTACGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATC
TGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAggccaaagtacagtgg aaggtggataacgccctccaatcgggtaactcccaggagagtgtcacag
agcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagacta
cgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaaga
gcttcaacaggggagagtgttgagcggccgcgtttaaactgaatgagcgcgtccatccagacatg
ataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgt
GAAATTTGTGATGCTATTGCTTTATTTGTAACCATTATAAGCTGC AATAAACAAGTTAACAACAAC
aattgcattcatitratgtttcaggttcagggggaggtgtgggaggtttritaaagcaagtaaaac
ctctacaaatgtggtatggctgattatgatccggctgcctcgcgcgtttcggtgatgacggtgaaa
acctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcaga
caagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggcgcagccatgaccggtcgacg
GCGCGCCTTITITITTAATITITATTTrATTTr^
tacagcttggctgtggaatgtgtgtcagttagggtgtggaaagtccccaggctccccagcaggca
gaagtatgcaaagcatgcatctcaattagtcagcaaccaggtgtggaaagtccccaggctcccca
gcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatagtcccgcccctaactcc
GCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAA'i"iTTTT'iT'
atttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggctttitt
ggaggcctaggcttitgcaaaaagcixx^cgaggaactgaaaaaccagaaagttaactggtaagt
ttagtctttttgtctititattrcaggtcccggatccggtggtggtgcaaatcaaagaact
agtggatgttgcctttacttctaggcctgtacggaagtgttacntctgctct
gtacccgcggcctaatacgactcactatagggactagtatggttcgaccattgaactgcatcgtcg
ccgtgtcccaaaatatggggattgcktaagaacgkjagacctaccctggcctccgctcaggaacgag
ttcaagtacttccaaagaatgaccacaaccrcttcagtggaaggtaaacagaatctggtgattatg
ggtagg aaaacctggttctccattcctgagaagaatcgaccntaaaggacagaattaatatagtt
ctcagtagagaactcaaagaaccaccacgaggagctcattttcitgccaaaagtttagatgatgcc
TTAAGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAG
ttctgtttaccaggaagccatgaatcaaccaggccacctcagactctttgtgacaaggatcatgca
GGAATTTGAAAGTGACACGTTTTTCCCAGAAATTGATTTGGGGAAATATAAACTrCTCCCAGAA
CCCAGGCGTCCTCTCTGAGGTCCAGGAGGAAAAAGGCATCAAGTATAAGTTTGAAGTCTACGAGA
agaaagactaagcggccgagcgcgcggatctggaaacgggagatgggggaggctaactg aagca
cggaaggagacaataccggaaggaacccgcgctatgacggcaataaaaagacagaataaaacgc
ACGGGTGTTGGGTCGrrrGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACC
ccaccgagaccccattggggk:caatacgcccgcgtttcttccttttccccaccccaccccccaagtt
cgggtg aaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagccactggcccc
gtgggitagggacggggtcccccatggggaatggtttatggttcgtgggggttattattttgggcg
TTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCC
gcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaac
GCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTAITTACGGTAAACTGCCCACTTGGCAGT
acatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctg
gcattatgcccagtacatgaccttatgggactitcctacttggcagtacatctacgtattagtcatc
GCTATTAÍXATGGTGATGCGGTTITGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGG
GGATTrCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGAC
TTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTC
gagcggtgttccgcggtcctcctcgtatagaaactcggaccactctgagacgaaggctcgcgtcca
ggccagcacgaaggaggctaagtgggaggggtagcggtcgttgtccactagggggtccactcgct
CCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGG
ccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactc
tcttccgkratcgctgtctgcgagggccagctgrrgggktcgcggttoaggacaaactcrtcgcggt
ctitccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctg
agcgagtccgcatcgaccggatcggaaaacctctcgactgttggggtgagtactccctctcaaaa
gcgggcatgacttctgcgctaagattgtcagtitccaaaaacgaggaggatitgatattcacctgg
CCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCITTTTGTTGTCA
agcttgaggtgtggcaggctrgagatctggccatacactrgagtgacaatgacatccacntgcct
TTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCG
CCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTA
gaatgcagtgaaaaaaatgcitrattrgtgaaatttgtgatgctaitgctttatttgtaaccattà
aagctcc aataaacaagttaacaacaacaairgcattcattttatgtttcaggttcag
GTGGGAGGTTTTITCGGATCCrCrTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTA
tccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaat
GAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCITTCCAGTCGGGAAACCTGTCGT
GCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCA
AAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGC AAAAG
GCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGGCTCCGCCCC
CCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAG
ATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTCKXGCTTACCGGA
TACCTGTCCGCCmCTCCCTTCGGGAAGCGTGGCGCITrCrcATAGCTCACGCTGTAGGTATCT
GTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCT
GCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAG
CAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGG
TGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCIX3 AAGCCA
TTCGGAAAAAGAGTrGGTAGCTCTrGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGlT^rrrrr
GTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCnTTGATCTTrTCTACG
GGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATC AAAAAG
GATCTTCACCTAGATCCCTTTTAATTAAAAATGAAGTTITAAATCAATCTAAAGTATATATGAGTA
AACTTGGTCTGACAGTTACCAATGCITAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGT
TCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGC
CCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCA
GCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAA
TTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGC
TACAGGCATCGTGGTGTCACGCTCGTCGTITGGTATGGCTTCATTCAGCrCCGGTTCCCAACGATCA
AGGCGAGITACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTT
GTCAGAAGTAAGTTGGCCGCAGTGITATCACTCATGGTTATGGCAGCACTGCATAATTCTCrTACT
GTCATGCCATCCGTAAGATGCHTITCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAG
TGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAG
AACirrAAAAGTGCTCATCATTGGAAAACGTrCITCGGGGCGAAAACTC
GTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCAIXnTTrACTTrCACC
AGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACAC
GGAAATGITGAATACTCATACTCnCCriTTrCAATATTATTGAAGCAlTlATCAGGGTTATT
CATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCC
CCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGC
GTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTCAAAACCTCTGACACATGCAGC
TCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCG
TCAGCGGGTGTTCKX:GGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAG
AGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCC
ATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCC
AGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTTA
CGACGTTGTAAAACGACGGCCAGTGAATT
Tabela 5A. Seqüência codificadora para a polipro-teina TEV ABT-325 (SEQ ID NO: 41).
ATGQAGTTTGGGCTGAGCTGGCTTTTCCTTGTCGCGATTTTAAAAGQTGTCCAGTGTGAGGTGCAQCTGGTGCAGTCTGG
AACAQAGGTGAAAAMCCCQGGGAGTCTCTGAAGATCTCGTGTAAGGGTTCTQGATACACTGTTACCAQTTACTQGATCGG
CTGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGATTCATCTATCCTGGTGACTCTGAAACCAGATACAGTC
CGACCTTCCAAGGCCAGGTCACCATCTCAGCCGACAAGTCCTTCAATACCGCCTTCCTGCAGTGGAGCAGTCTAAAGGCC
TCGGACACCGCCATGTATTACTGTGCGCGAGTCGGCAGTGGCTGGTACCCTTATACTTTTGATATCTGGGGCCAAGGGAC
MTGGTCACC«TCTCTTCAGCGTCGACCAAGGGCCCATCGGTCTTC«CCCTGGCACCCTCCTCCMGAGCAC^
GCACAGCX3GCCCTGGGCTGCCTGGTCMGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGAC
CAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCA
GCAGCTTGGGCACCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCC
AAATCTTGTGACAAMCTCACACATGCCCACXJGTGCCCAGCACCTGMGCCGCGGGGGGACXJGTCAGTCTTCCTCTTCCC
CCCAAAACCCAAGGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGAC
CCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACA
ACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGT
CTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACA
CCCTGCCCCCATCCCGCGAGGAGATGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGA
CATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCC GACGG
CTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCatgaggctctqcacmccactacacgcagmgagcctctccctgtcta6gggtaaacgcgaaccagtttatttccaggggagcttgtttaaggggccgcgtgattataacccaatatcgagtgccatttgtcatctaacgaatgaatctgatgggcacaca
acatcgttgtatggtattggttttggcxíctttcatcatcacaaacaagcatttgtttagmgamtaatggtacactgttagt
tcmtcactacatggtgtgttcaaggtaaagaataccacaactttgcaacaacacctcattgatgggagggacatgatgct
cattcgcatgcctaaggatttcccaccatttcctcaamgctgaaattcagagagccacaaagggaagagcgcatatgtct
tgtgacaaccaacttccaaactaagagcatgtctagcatggtttcagatactagttgcacattcccttcatctgatggtata
ttctggamcattggattcagaccaaggatgggcactgtggtagcccgttggtgtcaactagagatgggtttattgttggt
atacactcagcatcamtttcaccmcacaaacmttattttacmgtgtgccgamgacttcatggatttattgacaaatca
agaggcgcagcmtgggttagtggttggcgattgaatgctgactcagtgttatggggaggccacamgttttcatgagca
mcctgaagmccctttcagccagtcaaagaagcaactcaactcatgagtgaattagtctactcgcaagggatggaagccc
cagcgcagcttctcttcctcctgctactctggctcccagataccactggagaaatagtgatgacgcagtctccagccacc
ctgtctgtgtctccaggggaaagagccaccctctcctgcagggccagtgagagtattagcagcaacttagcctggtacca
gcagaaacctggccaggctcccaggctcttcatctatactgcatccaccagggccactgatatcccagccaggttcagtg
gcagtgggtctgggacagagttcactctcaccatcagcagcctgcagtctgaagattttgcagtttattactgtcagcagt
atmtaactggccttcgatcaccttcggccmgggacacgactggagattamcgmctgtggctgcaccatctgtcttca
TCrrTCCCGCCATCTGATGAGCAGTTGMATCTGGMCrrGCTAGCGTTGTGTGCCTGCTGAATMCTTCTATCCCAGACCMAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCC7TGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGTTGA
Tabela 5B. Seqüência de aminoácido de poliproteinaTEV ABT-325 (SEQ ID NO: 42).
MEFGLSWLR-VAIU<GVQCEVQLVQSGTEVKKPGESLKISCKGSGYTVrSYWIGWVRQMPGKGLBA/MGFIYPGDSErRYSPTFQGQVTISADKSFNTAFLQWSSLKASDTAMYYCARVGSGWYPYTFDW^CLVKDYFPEPNfiA/SWNSGALTSGVHTFPAVLQSSGLYSLSSWTVPSSSLGTQTYIC^PCPAPEAAGGPSVFWPKPKDTUV»SRTPEVTCWVDVSHÊD^
QDWLNGKEYKCKVSNKAU^APIEKTISKAKGQPREPQNATIPPSREEMTKNQVSLTCLVKGFYPSDIAV
PPVLDSDGSFFLYSKLTVDKSFtWCMGNVFSCSVMHEALHNHYTQKSLS LsRGKREpwFQGsUrKGPRDYNPiss AICH
DGHrrSLYGIGFGPFIITNKHLFRRNNQTU.VQSL^GVFKVKNTrrLQQHUDGR
vttnfqtksmssmvsdtsctfpssdgifwkhwiqtkdghcxssplvstrdgfiv^
QQWVSGWRU^DSVLWGGHKVFMSKPEEPFQPVKEATQLMSELVYSQGMEAPAQUJTJXLW
PGERATLSCRASESISSNUWQQKPGCWPRlPIYTASTmTDIPARFSGSGSGTERlTISSLQSm
GQGTRLEIKRTVAAPSVFIFPPSDEQLKSGTASWCLUvJNFYPREAKVQWKVDI^LQSGNSQESVTEQOSKDSTYSLSST^
KADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
Tabela 5C. Seqüência de nucleotideo do vetor deexpressão da poliproteina TEV ABT-325 completo (SEQ ID NO:43) .
gaagttcctattccgaagttcctattctctagacgttacataacttacggtaaatggcccgcctggctgaccgcccaacga
CCCCCGCCCAirrGACGTCAATMTGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGA
GTATTTACGGTAAACTGCCCACrrTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTArrGACGTCAATGACGG
TAMTGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTAC^GGCAGTACATCTACGTATTAGTCATC
GCTATTACCATGGTGATGCGG7TTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTC
catcccattgacgtcaatgggagtttgttttggcaccaaaatcmcgggactttccaaaatgtcgtaacaactccgcccca
ATGACGCAMTGGGCAGGGAATTCGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCAC
TCTGAGACGAAGGCTCGCGTÇCAGGCCAGCACGAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGG
TCCACTCGCTCCAGGGTGTQAAGACACATGTCGCCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCAC
GTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCT
GCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCnTCGCGGTCrTTCCAGTACTCTTGGATCGGAAACCCGTCG
GCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCGACTGTTGGG
GTGAGTACTCCCTCTCAAMGCGGGCATGACTTCTGCGCTMGATTGTCAGTTTCCAAAMCGAGGAGGATTTGATATTCA
CCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCI1111GTTGTCAAGCTTGAGG
TGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACMTGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCC
AGGTCCMCCGGAATTGTACCCGCGGCCAGAGCrrTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTTTCCTr
GTCGCGATTTTAAMGGTGTCCAGTGTGAGGTGCAGCTGGTGCAGTCTGGAACAGAGGTGAAAAAACCCGGGGAGTCTCT
GAAGATCTCCTGTAAGGGTTCTGGATACACTGTTACCAGTTACTGGATCGGCTGGGTGCGCCAGATGCCCGGGAAAGGCCtgqagtqgatgggattcatctatcctggtgactctqaaaccagatacagtccgaccttccaaggccaggtcaccatctcag
ccgacaagtccttcaataccgccttcctgcagtggagcagtctaaaggcctcggacaccgccatgtattactgtgcgcga
gtcggcagtggctggtacccttatacttttgatatctggggccaagggacaatggtcaccgtctcttcagcgtcgaccaa
gggcccatcqgtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaag
gactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcc
tacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgc
mcgtgmtcacmgcccagcmcaccaaggtgg^cmgaaagttgagcxcaaatcngtgacaaaactcacacatgccca
ccgtgcccaggacctgaagccgcggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctc
ccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtqgac
ggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctca
ccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcga
gaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgcgaggagatgacc
aagaaccaggtcagcctgacctgcctggtcmaggcttctatcccagcgacatcgccgtggagtgggagagcmtgggc
agccggagaacmctacmgaccaascctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtg
gacaaqagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaa
gagtxtctccctgtctaggggtamcgcgmccagtttatttcxíaggggagcttgtttaaggggccgcgtgattataacc
caatatcgagtgccatttgtcatctaacgmtgmtctgatgggcacacmcatcgttgtatggtattggttttggcccttt
catcatcacamcmgcatttgtttagaagaaataatggtacactgttagttcaatcactacatggtgtgttcaagqtaaaga
ataccacaactttgcaacmcacctcattgatgggagggacatgatgctcattcgcatgcctaaggatrrcccaccatttcc
tcaaaagctgaaattcagagagccacaaagggmgagcgcatatgtcttgtgacaaccmcttccaaactaagagcatgtc
tagcatggtttcagatactagttgcacattcccttcatctgatggtatattctggaaacattggattcagaccaaggatggg
cactgtggtagcccgttggtgtcaactagagatgggtttattgttggtatacactcagcatcaaatttcaccaacacaaaca
attattttacaagtgtgccgamgacttcatggatttattgacaaatcaagaggcgcagcaatgggttagtggttggcgatt
gaatgctgactcagtgttatggggaggccacaaagttttcatgagcaaacctgaagaaccctttcagccagtcaaagaagc
mctcmctcatgagtgaattagtctactcgcmgggatggmgccccagcgcagcttctcntcctcctgctactctggct
cccagataccactggagaaatagtgatgacgcagtctccagccacfxtgtctgtgtctcxdaggggaaagaqccaccctct
cctgcagggccagtgagagtattagcagcaacttagcctggtaccagcagaaacctggccaggctcccaqgctcttcatc
tatactgcatccaccagggccactgatatcccagccaggttcagtqgcagtgggtctgggacagagttcactctcaccat
cagcagcxjtgcagtctgaagattttgcagtttattactgtcagcagtatmtmctisgccttcgatcaccttcggccaagg
gacacgactggagattaaacgaactgtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctgg
mctgctagcgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctcc
aatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgct
gagcmagcagactacgagamcacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaaga
gcttcaacaggggagagtgttgagcggccgcqtttaaactgaatgagcgcgtccatccagacatgataagatacattgat
gagtttggacamccacaactagaatgcagtgaaaaamtgctttatttgtgamtttgtgatgctattgctttatttgtaac
cattataagctgcaataaacmgttaacmcmcaattgcattcattttatgtttcaggttcagggggaggtgtgggaggtt
ttttamgcaagtaaaacctctacaaatgtggtatggctgattatgatccggctgcctcgcgcgtttcggtgatgacggtg
aamcctctgacacatgcagctcccggagacggtcacagcttgtctgtmgcggatgccgggagcagacaagcccgtca
qggcgcgtcagcgggtgttggcgggtgtcggggcgcagccatgaccggtcgacggcgcgcct il i 11 11 iaaii i i iatt
ttattttai i i iigacgcgccgaaggcgcgatctgagctcggtacagcttggctgtggaatgtgtgtcagttagggtgtgg
aaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccaggtgtggaaagtccc
caggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatagtcccgcccctaactccgccc
atcccgcccctaactccgcccagttccgcccattctccgccccatggctgactaai illlll iatttatgcagaggccgag
gccgcctcggcctctgagctattccagmgtagtgaggaggcntntggaggcctaggcttrrgcaaamgctcctto
ggmctgmamccagaaagttaactggtaagtttagtctttttgtcttttatttcaggtcccggat(xggtggtggtgcaa
atcamgaactgctcctcagtggatgttgcctttacttctaggcctgtacggaagtgttacttctgctctaaaagctgcgg
aattgtacccgcggcctaatacgactcactatagggactagtatggttcgaccattgaactgcatcgtcgccgtgtcccaa
aatatggggattggcaagaacggagacctaccctggcctccgctcaggaacgagttcaagtacttccaaagaatgaccac
aacctcttcagtggaaggtaaacagaatctggtgattatgggtaggaaaacctggttctccattcctgagaagaatcgacc
tttamggacagmttaatatagttctcagtagagmctcaaagmccaccacgaggagctcattttcttgccaaaagttta
gatgatgccttaagacttattgaacaaccggmttggcmgtaaagtagacatggtttggatagtcggaggcagttctgtt
taccaggaagccatgaatcaaccaggccacctcagactctttgtgacaaggatcatgcaggaatttgaaagtgacacgttt
ttcccagaaattgatttggggaaatataaacttctcccagaatacccaggcgtcctctctgaggtccaggaggaaaaaggc
atcaagtataagtttgaagtctacgagaagaaagactaagcggccgagcgcgcggatctggaaacgggagatgggggag.
gctaactgaagcacggaaggagacaataccggmggmcccgcgctatgacggcaatamaagacagaataamcgcacg
ggtgttgggtcgtttgttcataaacgcgggqttcggtcccagggctggcactctgtcgataccccaccgagaccccattg
gggccaatacgccxgcgtttcttccttttccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaac
gtcggggcggcaggccctgccatagccactggccccgtgggttagggacggggtcccccatggggaatggtttatggt
tcgtgggggttattatrttgggcgtrgcgtggggtctggagatcccccgggctgcaggaattccgtracattacttacgg
taaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaAT AGGGACTTTCCATTGACGTCAATGGQTQGAQTATTTACGGTAAACTGCCCACTTGGCAQTACATCAAQTQTATCATATG
CCMGTACGCCCCCTArrGACGTCAATGACGGTAMTGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTT
CCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGA
TAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCMTGGGAGTTTGTTTTGGCACCAAAATCAACGG
GACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGTACTCGAGCGGTGTTC
CGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGAAGGAGGCTAAGTG
GGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCGCCCTCTTCGGCATCA
AGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGC
GTTCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTrGAGGACAAACTCTTCGCGGT
CTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCTGAGCGAGTCCGCAT
CGACCGGATCGGMMCCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGT
CAGTTTCCAAAAACGAGGAGGATTTGATATTCAGCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCA
GAMAGACAATCTTTTTGTTGTCAAGCrrTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCC
ACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCGGGCGCCACC
GCGGCCGCGGGGATCCAGACATGATAAGATACA7TGATGAGTTTGGACAAACCACMCTAGAATGCAGTGAAAAAMTGCT
TTATTTGTGAAATTTGTGATGCTATTGCTTrATTTGTMCCATTATMGCTGCMTAMCMGTTMCMCMCMTrGCATTC
ATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGG11111ICGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCT
GTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGA
GTGAGCTMCTCACATTMTTGCGTTGCGCTCACTGCCC^CTrTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGA
ATCGGCCMCGCGCGGGGAAAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGG
TCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGA
AAGMCATGTGAGCAAMGGCCAGCAMAGGCCAGGAACCGTAAAMGGCX^CraTrGCTGGCGTTCTTCCATAGGCTCCG
CCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGT
TTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCT^
GGAAGCGTGQCGCTTTCTCATAGCTCACGCTGTAGGTATCrrCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGT
GCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAQTCCAACCCGGTAAGACACGACT
TATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGG
TGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTT
GGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTnTrTTGTTTGCAAGCAGCAGATTACGCGCAGAAAA
AMGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACX3AAAA
GTCATGAGATTATCAAAAAGGATCTTCACX^AGATCCXJTTTTMTTAAAMTGAAGTTTTAAATCAATCTAAAGTATATATGAG
TAMCTTGGTCTGACAGTTACCAATGCTTMTCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTG
CCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGAC
CCACGCTCACCGGCTCCAGATTTATCAGCMTAAACCAGCCAGCCGGAAGGGCCGAQCGCAGAAGTGGTCCTGCAACTTT
ATCCG CXITCXiATCCAGTCTATTMTTGTTQCCGGGMGCTAGAGTMQTAGTTCGCXDAGTTMTAGTTTGCGCMCGTTGTT
GCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCG
AGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGC
AGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGU Illl CTGTGACTGGT
GAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACC
GCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAMCGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTG
TTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCMCTGATCTTCAGCATCTTTTACnTTCACCAGCGTTTCTGGGTGAG
CAAAMCAGGAAGQCAAMTGCCGCAAAAMGGGMTMGGGCGACACGGAAATGTTGMTACTCATACTCTTCXTTTTTC
AATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGG
GTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGC
GTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTC
ACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGC
TGGCTT AACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAG
GAGAAMTACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGMGGGCXSATCGGTGCX3GGCCTCTTCG
CTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCMGGCGATTMGTTGGGTAACGCCAGGGTTTTCCCAGTTACGACG
TTGTAAAACGACGGCCAGTGAATT
Tabela 6A. Seqüência codificadora para o construc-to de poliproteina LC-LC-HC de D2E7 (SEQ ID NO: 29).
ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCACCATCACTTGTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCAAAAACCAGGGMAGCCCCTAAGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGQAAATCAAACGTACGGTGGCTGCA
CCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCT
ATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCA
GQACAGCAAGGACAGCACCTACAQCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTAC
GCCTGCGMGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCMCAGGGGAAGGTGTAAGAGACTTCTCAA
GTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTG
TGGTTCCCCGGCTCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAGTCAC
CATCACTTGTCGGGCAAGTCAGGGCATCAGAMTTACTTAGCCTGGTATCAGCAAAAACCAGGGAAAGCCCCTAAGC3TCCT
GATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCAC
CATCAGCAGCCTACAGCCTGMGATGTTGCMCTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGG
GACCAAGGTGGAMTCAMCGTACGGTGGCTGCA(XATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGG
AACTGCCTCTGTTGTGTGCCTGCTGAATAÁCTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCA
ATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTG
AGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAG
CTTCAACAGGGGAAGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCTGGGCCCATGGAGTTTGGQC
TGAGCTGGCTTTTTCTTGTCGCGATTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTA
CAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCA
AGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGG
GCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACGGCC
GTATATTACTGTGCGAAAGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTC
TCGAGTGCGTCGACCAAGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCC
TGGGCTGCCTGGTCAAGGACTACTTCCCCGAACCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCA
CACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCXIAGCAGCTTGGGCA
CCCAGACCTACATCTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGAC
AAAACTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAA
GGACACCCTCATGATCTCCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAG
TTÇAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACC
GTGTGGTCAGCGTCCTCACCGTCCTGCACCAGGACTGGCTGMTGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCC
CTCCCAGCCCCCATCGAGAAAACCATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATC
CCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGÁCATCGCCGTGGAG
TGGGAGAGCAATGGGCAGCCGGAGAACMCTACAAGACCACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTA
CAGCAAGCTCACCGTGGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCAC
AACCACTACACGCAGAAGAGCCTCTCÇCTGTCTCCGGGTAAATGA
Tabela 6B. Seqüência de aminoácidos da poliprotei-na LC-LC-HC de D2E7 (SEQ ID NO: 30).
MDMRVPAQU-GLUXWFPGSRCDIQMTQSPSSLSASVGDRVTTTCRASQGIRNYLAW^
SGSGSGTDFTLTISSLQPEDVATYVCQRYNRAPYTFGQGTKVaKRWMPSVFIFPPSDEQLKSGTASWCUJ^NFYPREAKVQ
WKVDf\LALQSGNSQESVTCQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGL£SPVTK^
MDMRVPAQU/3UU_WFPGSRCDIQ^QSPSSLSASVGDR^
SGSGSGTDFrLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVBKRTVMPSVRFPPSDEQÜ<SGTASWCU^NFYPREAKVQWKVDNALQSGNSQES\raQDSKDSTYSLSSTLTLSKADYEKHKWACEVTHQGL5SPVTKSFNRGMEFGLSWLFLVAIÜ<GVQCEVQLVESGGGLVQPGRSLflL^CAASGFTFDDYAMHWVRCWPGKGI^WVSAnWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLflAEDTA VYYCAKVSYl^TASSLDYWGQGTL\nVSSASTKGPSVFPLAPSSKSTSGGTAALGCL VKDYFP EP\m/SWNSGALTSGVHTFPAVLQSSGLYSLSSWTWSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCPCPAPELLGGPSVFU^PKPKDTT^ISRTPEVTCWVDVSHEDPEVKFNWWDGVEVH
DWLNGKEYKCKVSNKALPAPIEKnSKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSPGK*
Tabela 6C. Seqüencia de nucleotideo completa daseqüência de DNA do vetor de expressão da poliproteina LC-LC-HC de D2E7 (SEQ ID NO: 31).
GAAGTTCCTATTCCQAAGTTCCTATTCTCTAGACGTOCATAACTTACGGTAMTGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGA(XàTCMTAATGACGTATGTTCCCATAGTMCGCCMTAGGGÀCTrTCCATrGACGTCAATGGGTGGAGtATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAMTGGC(XGCCTGQCATTATGCCCAGTACATGACCTTATGGQACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATC
gctattaccatggtgatgcggttttggcagtacatcmtgggcgtggatagcggtttgactcacggggatttccaagtctc
caccccattgacgtcmtgggagtttgttttggcaccaaaatcmcgggactttccaaaatgtcgtaacaactccqcccca
atgacgcaaatgggcagggmttcgagctcggtactcgagcggtgttccgcggtcctcxtrcgtatagaaactcggaccac
tctgagacgaaggctcgcgtccaggccagcacgaaggaggctaagtgggaggggtagcggtcgttgtccactaggggq
tccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggtttataggtgtaggccac
GTGACCGGGTGTTCCTGMGGGGGGCTATAAMGGGGGTGGGGGCGCGTTCGTCCTCACTCTCTTCCGCATCGCTGTCT
gcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggamcccgtcg
gcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgactgttggg
GTGAGT ACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTMGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCA
CCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCI1111GTTGTCAAGCTTGAGG
TGTGGCAGGCnTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCX;TTTCTCTCCACAGGTGTCCACTCCC
AGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGACATGCGCGTGCCCGCCCAGCTGCT
GGGCCTGCTGCTGCTGTGGTTCCCCGGCrrCGCGATGCGACATCCAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTG
taggggacagagtcaccatcacttgtcgggcmgtcagggcatcagaaattacttagcctggtatcagcaaaaaccaggg
AMGCCCCTMGCTCCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTCCCATCTCGGTTCAGTGGCAGTQGATCTGG
GACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGMGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACC
gtatacttttggccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctga
TGAGCAGTTGAAATCTGGMCTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAA
GGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTC
agcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctga
GCTCGCCC^TCACAAAGAGCTTCAACAGGGGMGGTGTAAGAGACTTCTCAAGTTGGCAGGAGACGTTGAGTCCAACCCT
GGGCCCATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGCTGCTGTGGTTCCCCGGCTCX3CGATGCGACATC
CAGATGACCCAGTCTCCATCCTCCCTGTCTGCATCTGTAGGGGACAGAQTCACCATCACTTGTCGGGCAAGTCAGGGCAT
cagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatc
AGGGGTCCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATG
TTGCMCTTATTACTGTCAAAGGTATAACCGTGCACCGTATACTTTTGGCCAGGGGACCAAGGTGGAAATCAAACGTACGG
TGGCTGCACCATCTQTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGMCTGCCTCTGTTGTGTGCCTGCTGA
ATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTC
ACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACA
AAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAAGGTGTAAGAG
ACTTCTCAAGTTGGCA<MAGACGTTGAGTCCMCCCTGGGCCCATGGAGTTTGGGCTGAGCTGGCTTTTTCTTGTCGCGA
TTTTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACT
CTCCTGTGCXàGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAAT
GGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGAC
MCGCCAAGAACTCCCTGTATCTGCAAATGAACAGTCTGAGAGCTGAGGATACG GCCGTATATTACTGTGCGAAAGTCTCG
TACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCAAGGGCCC
ΑΤ£Χ3ΘΤΟΤΓσίΧ:σθΤαθΟΑΟΟΟΤΟ£Π·ΟΟΜΟΑ60ΑΟΟΤΟΤ6βααθΟΑΟΑαθΟβ(ΧΟΤβΟβΟΤαθθπ30ΤΟΑΑ66ΑΟΤΑΟ
TTCCCCGAACXÍGGTGACGGTGTCGTGGMCTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGT
(XTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAACGTG
AATCACAAGCCCAGCAACACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAAACTCACACATGCCCACCGTG
CCCAGCACXJTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTCCCGGA
CCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGT
GGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTCCTCACCGTC
CTGCACCAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAAAC
CATCTCCAAAGCCAAAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAAC
CAGGTCAGCCTGACCTGCCTGGTCAAAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGG
AGAACMCTACAAGACCAOTCCTCCCGTGCTGGACTCCGACGGCTTCTrCTTCCTCTACAGCAAGCTCACCGTGGACAAG
AGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCT
CTCCCTGTCTCCGGGTAAATGAGAATTAGTCTACTCGCMGGGGCGGCCGCGTTTAAACTGAATGAGCGCGTCCATCCAG
ACATGATAAGATACATTGATGAGTTrGGACAAACCACMCTAGAATGCAGrrGAAAAAAATGCTTTATTTGTGAMTTTGTGAT
GCTArrGCrmAmGTMCCATTATMGCTGCAATAAACMGTTAACAACMCMTrGCATTC^TmATGmCAGGTTCAG
GGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCCTCGCG
CGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGG
GAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCG
TGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAA11 Illll'TATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGC'1 Illl IGGAGGCCTAGGCTmGCMAMQCTCCTCCWGGAACTGAAAMCCAGM
GATCCGGTGGTGGTGCAMTCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGMGTGTTACTT
CTGCTCTAAAAGCTGCGGAATTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGAACTGC
ATCGTCGCCGTGTCCCAMATATGGGGATTGGCAAGAACG GAGACCTACCCTGGCCTCCGCTCAGGAACGAGTTCAAGTA
C7TCCAMGAATGACCACMCCTCTTCAGTGGMGGTAMCAGAATCTGGTGATTATGGGTAGGAAAACCTGGTTCTCCAT
TCCTGAGMGAATaSACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGAACTCAAAGAACCACCACGAGGAGCTCA
TTTTCTTGCCAMAGTTTAGATGATGCCTTMGACTTATTGAACAACCGGAATTGGCAAGTAAAGTAGACATGGTTTGGATA
GTCGGAGGCAGTTCTGTTTACCAGGAAGCCATGAATCAACCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGA
ATTTGAAAGTGACACG1111ICCCAGAAATTGATTTGGGSAAATATAAACTTCTCCCAGAATACCCAGGCGTCCTCTCTGAG
GTCCAGGAGGMAMGGCATCMGTATAAGTTTGMGTCTACGAGAAGAMGACTAAGCGGCCGAGCGCGCGGATCTGGA
AACGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAA
GACAGMTAAMCGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATAC
CXJCACCGAGACCXJCATrGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCC
CAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTAGGGACGGGGTCCCCCAT
GGGGMTGGTTTATGGTTCGTGGGGGTTATTATTTTGGGCGTTGCGTGGGGTCTGGAGATCCCCCGGGCTGCAGGAATTC
CGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGT ATGT
TCCCATAGTAAC^CCAATAGGGACTTTCCATTGACGTCMTGGGTGGAGTATTTACQGTAAACTGCCCACTTGGCAGTACA
TCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACAT
GACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTAC
ATCMTGGGCGTGQATAGCGGTrTGACTCACGGGGATrTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGQ
CACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAAAGGGCGGGAATTCGAGCTCGGT
ACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCAC
QAAGGAGGCTAAGTGGGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGAAGACACATGTCG
CCCTCTTCGGCATCAAGGAAGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTOCTGAAGGGGGGCTATAAAA
GGGGGTGGGGGCGCGTrCGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGA
CAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCACCGAGGGACCT
GAGCGAGTCCGCATCGACCGGATCGGAAAACCTCTCX3ACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTC
TGCGCTMGATrGTCAGTTrCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCG
CGTÍXATCTGGTCAGAAAAGACMTCTTTTTGTTGTCMGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAG
TGACMTGWCATOCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCMCCGGMTTGTACCCGCGGCCAGAGCT
TGCGGGCGCCACCGCGGCCGCGGGGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCA
GTGAAAAAAATGCTTrATTTGTGAMTrTGTGATGCTATrGCTTTATTTGTMCCATTATMGCTGCAATAAACMGTTM
CAACMTTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGI Illl ICGGATCCTCTTGGCGTMTCATGGTC
ATAGCTGTTTCCTGTGTGAMTTGTTATCCGCTCACMTTCCACACAACATACGAGCCGGMGCATAMGTGTMAGCCTG
GGGTGCCTMTGAGTGAGCTMCTCACATTMTTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAMCCTGTCGTGCC
AGCTGCATTMTGMTCGGCCMCGCXSCGGGGAMGGCGGTTTGCGTATTGGGCGCTCrrCCGCTrCCTCGCTCACTGAC
TCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAMGGCGGTMTACGGTTATCCACAGMTCAGG
GGATMCGCAGOAMGMCATGTGAGCAAMGGCCAGCAAMGGCCAGGMCCGTAAAMGGCCGCGTTGCTGGCGTTC
TTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAMTCGACGCTCMGTCAGAGGTGGCGAMCCCGACAGGACTATA
MGATACCAGGCGTTTCCCCCTGGMGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCG
CCrmCTCCCTrCGGGMGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCA
AGCTGGGCTGTGTGCACGMCCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTMCTATCGTCTTGAGTCCMCCCG
GTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTMCAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGA
GTrCTTGMGTGGTGGCCTMCTACGGCTACACTAGMQMCAGTATTTGGTATCTGCGCTCTGCTGMGCCAGTTACCTT
CGGAAAMGAGTTGGTAGCTCTTGATCCGGCAMCAMCCACCGCTGGTAGCGGTGGI Illll IGTTTGCMGCAGCAGAT
TACGCGCAGAAAAAMGGATCTCMGMGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGMCGAMACTCACG
TTMGGGATTTTGGTCATGAGATTATCAAAMGGATCTTCA<XTAGATCCCTTTTMTTAAAMTGMGTJTTAMTC
AAGTATATATGAGTAMCTrGGTCTGACAGTTACCMTGCTTMTCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGT
TCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATMCTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCMT
GATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATMACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGT
GGTCCTGCMCTTTATCCGCCTCCATCCAGTCTATTMTTGTTGrcGGGMGCTAGAGTMGTAGTTCGCCAGTTMTAGTT
TGCGCMCGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCC
MCGATCMGGCGAGTTACATGATCCCXCATGTTGTGCAAAMAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAA
GTMGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATMTTCTCTTACTGTCATGCCATCCGTMGATGCTT
TTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGMTAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAAT
ACGGGATMTACCGCGCCACATAGCAGMCTTTAAAAGTGCTCATCATTGGAAMCGTTCTTCGGGGCGAAAACTCTCAAG
GATCTTACCGCTGTTGAGATCCAGTTCGATGTMCCCACTCGTGCACCCMCTGATCTTCAGCATC1111ACTTTCACCAGC
GTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAMGGGAATAAGGGCGACACGGAAATGTTGAATACTCAT
ACTCTTCCI I [ IICMTATTATTGMGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGMTGTATTTAGAAAM
TAMCAMTAGGGGTTCCGCGCACATTTCCCCGAAMGTGCCACCTGACGTCTMGAMCCATTATTATCATGACATTMCCTATAAAAATAGGCGTATCACGAGQCCCTTTCQTCTCGCGCQTTTCGGTGATQACGGTGAAAACCTCTGACACATGCAQCTC
CCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGC
GGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCA
CAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTG
CGGGCCTCTTCGCTAmCGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTC
CCAGTTACGACGTTGTAAAACGACGGCCAGTGAATT
Exemplo 4. Expressão do anticorpo como poliprotei-na com constructo de peptídeo de sitio de clivagem interno
Outras modalidades são criadas de seqüências codi-ficadoras, vetores de expressão e métodos para a expressãode um anticorpo. Um constructo de expressão primário compre-ende uma poliproteina com um peptideo de sinal clivável in-terno, de forma que a expressão e a subseqüente clivagem re-sultam na formação de uma molécula de anticorpo de múltiplascadeias (por exemplo, de duas cadeias).
Tabela 7A. Seqüência codificadora para o constructodo peptideo de sinal clivável interno de D2E7 (SEQ ID NO: 45).
atggagmgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggcttg
gtacagcccggcaggtccctgagactctcctgtgcggcxtctggattcacctttgatgattatgccatgcactgggtccggcaagctcc
agggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatct
ccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctc
gtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtct
tccccctggcaccctcctocaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtg
acggtgtcgtggaactcaggcgccctgacxagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagca
gcgtggtgaccgtgccctccagcagcttgggcacccagacctacatctgcaacgtgaaícacaagcccagcaacaccaaggtggac
aagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcc
tcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagacc
ctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcac
gtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccct
cccagcccccatcgagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggat
gagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgg
gcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaa
gagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccct
gtctaggggtaaacgcatgggacgaatggcaatgaaatggttagttgttataatatgtttctctataacaagtcaacctgcttctgctatgg
acatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatc
ctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaa
aaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctggg
acagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttgg
ccaggggaccaaggtggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaa
ctgcctctgttgt gtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaact
cccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacg
agaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgttgaTabela 7B. Seqüência de aminoácidos da poliproteína de
peptídeo de sinal clivável interna D2E7 (SEQ ID NO: 4 6) .MEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAI7WNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLST ASSLD YWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSWTVPSSSLGTQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTUVllSRTPE\n"C\AA/DVSHEDPEVKFNWWDGVEVHNAKTkPREEQYNSTYRWSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKTISKAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKRMGRMAMKWLWIICFSITSQPASAMDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQGIRNYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLUSSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVAAPSVFIFPPSDEQLKSGTASWCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*
Tabela 7C. Seqüência de DNA do vetor da expressãoda poliproteína de peptídeo de sinal clivável interno (SEQID NO: 47).
gaagttcctattccgaagttcctattctctagacgttacataacttacggtaaatggcccgcctggctgaccgcccaacg
acccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggt
ggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatg
acggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattag
tcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaa
gtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactcc
gccccaatgacgcaaatgggcagggaattcgagctcggtactcgagcggtgttccgcggtcctcctcgtatagaaac
tcggaccactctgagacgaaggctcgcgtccaggccagcacgaaggaggctaagtgggaggggtagcggtcgtt
gtccactagggggtccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggttta
taggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctct
tccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttgg
atcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcgg
aaaacctctcgactgttggggtgagtactccctctcaaaagcgggcatgaçttctgcgctaagattgtcagtttccaaaa
acgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagaca
atctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgccttt
ctctccacaggtgtccactcccaggtccaaccggaattgtacccgcggccagagcttgcccgggcgccaccatgga
gtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggagg
cttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggt
ccggcaagctccãgggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggact
ctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagct
gaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggta
ccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctg
ggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgc
cctgaccagcggcgtgcacacctícccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgt
gccctccagcagcttgggcacccagacctacatctgcaacgtgaatcacaagcccagcaacaccaaggtggaca
agaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggacc
gtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtg
gacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagaca
aagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctg
aatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatcgagaaaaccatctccaaagc
caaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtc
agcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaa
gagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaag
agcctctccctgtctaggggtaaacgcatgggacgaatggcaatgaaatggttagttgttataatatgtttctctataaca
agtcaacctgcttctgctatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcg
atgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggca
agtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgc
atccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcc
tacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaaggt
ggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcct
ctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgg
gtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctg
agcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcac
aaagagcttcaacaggggagagtgttgagcggccgcgtttaaactgaatgagcgcgtccatccagacatgataaga
tacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgcttt
atttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggt
gtgggaggttttttaaagcaagtaaaacctctacaaatgtggtatggctgattatgatccggctgcctcgcgcgtttcggt
gatgacggtgaaaácctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagca
gacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggcgcagccatgaccggtcgacggcgcgcc
tttttttttaatttttattttattttatttttgacgcgccgaaggcgcgatctgagctcggtacagcttggctgtggaatgtgtgtca
gttagggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaacc
aggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatag
tcc^gcccctaactccgcccatcccgcccctaactccgcccagttccgcccattctccgccccatggctgactaattttttt
tatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttttttggaggcctaggc
ttttgcaaaaagctcctcgaggaactgaaaaaccagaaagttaactggtaagtttagtctttttgtcttttatttcaggtccc
ggatccggtggtggtgcaaatcaaagaactgctcctcagtggatgttgcctttacttctaggcctgtacggaagtgttact
tctgctctaaaagctgcggaattgtacccgcggcctaatacgactcactatagggactagtatggttcgaccattgaact
gcatcgtcgccgtgtcccaaaatatggggattggcaagaacggagacctaccctggcctccgctcaggaacgagtt
caagtacttccaaagaatgaccacaacctcttcagtggaaggtaaacagaatctggtgattatgggtaggaaaacct
ggttctccattcctgagaagaatcgacctttaaaggacagaattaatatagttctcagtagagaactcaaagaaccac
cacgaggagctcattttcttgccaaaagtttagatgatgccttaagacttattgaacaaccggaattggcaagtaaagta
gacatggtttggatagtcggaggcagttctgtttaccaggaagccatgaatcaaccaggccacctcagactctttgtga
caaggatcatgcaggaatttgaaagtgacacgtttttcccagaaattgatttggggaaatataaacttctcccagaatac
ccaggcgtcctctctgaggtccaggaggaaaaaggcatcaagtataagtttgaagtctacgagaagaaagactaag
cggccgagcgcgcggatctggaaacgggagatgggggaggctaactgaagcacggaaggagacaataccgga
aggaacccgcgctatgacggcaataaaaagacagaataaaacgcacgggtgttgggtcgtttgttcataaacgcgg
ggttcggtcccagggctggcactctgtcgataccccaccgagaccccattggggccaatacgcccgcgtttcttcctttt
ccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccata
gccactggccccgtgggttagggacggggtcccccatggggaatggtttatggttcgtgggggttattattttgggcgttg
cgtggggtctggagatcccccgggctgcaggaattccgttacattacttacggtaaatggcccgcctggctgaccgcc
caacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaa
tgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgt
caatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacg
tattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatt
tccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaaca
actccgccccattgacgcaaaagggcgggaattcgagctcggtactcgagcggtgttccgcggtcctcctcgtataga
aactcggaccactctgagacgaaggctcgcgtccaggccagcacgaaggaggctaagtgggaggggtagcggtc
gttgtccactagggggtccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggt
ttataggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactc
tcttccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttg
gatcggaaacccgtcggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgactgttggggtgagtactccctctcaaaagcgggcatgacttctgcgctaagattgtcagtttccaaa
aacgaggaggatttgatattcacctggcccgcggtgatgcctttgagggtggccgcgtccatctggtcagaaaagac
aatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatccactttgcctt
tctctccacaggtgtccactcccaggtccaaccggaattgtacccgcggccagagcttgcgggcgccaccgcggcc
gcggggatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgcttt
atttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcat
tttatgtttcaggttcagggggaggtgtgggaggttttttcggatcctcttggcgtaatcatggtcatagctgtttcctgtgtga
aattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagt
gagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaa
tcggccaacgcgcggggaaaggcggtttgcgtattgggcgctcttccgcttcctcgctcactgactcgctgcgctcggt
cgttcggctgcggcgagcggtatcagctcactcaaaggcggtaatacggttatccacagaatcaggggataacgca
ggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgttcttcca
taggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtcagaggtggcgaaacccgacaggactata
aagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccg
cctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgttcgctccaag
ctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatccggtaactatcgtcttgagtccaacccgg
taagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctac
agagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagtta
ccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcag
cagattacgcgcagaaaaaaaggatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaa
aactcacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatcccttttaattaaaaatgaagtttta
aatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatct
gtctatttcgttcatccatagttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggcccca
gtgctgcaatgataccgcgagacccacgctcaccggctccagatttatcagcaataaaccagccagccggaaggg
ccgagcgcagaagtggtcctgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagt
tcgccagttaatagtttgcgcaacgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattc
agctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctc
cgatcgttgtcagaagtaagttggccgcagtgttatcactcatggttatggcagcactgcataattctcttactgtcatgcc
atccgtaagatgcttttctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctc
ttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatcattggaaaacgttcttcg
gggcgaaaactctcaaggatcttaccgctgttgagatccagttcgatgtaacccactcgtgcacccaactgatcttcag
catcttttactttcaccagcgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggc
gacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttattgtctcatgagcggata
catatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaa
gaaaccattattatcatgacattaacctataaaaataggcgtatcacgaggccctttcgtctcgcgcgtttcggtgatgac
ggtgaaaacctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaa
gcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggctggcttaactatgcggcatcagagcagattgtact
gagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgccattcgcc
attcaggctgcgcaactgttgggaagggcgatcggtgcgggcctcttcgctattacgccagctggcgaaagggggat
gtgctgcaaggcgattaagttgggtaacgccagggttttcccagttacgacgttgtaaaacgacggccagtgaatt
Materiais e métodos:
Transfecção dos constructos descritos nas células293-6E é executada como se segue. As células usadas são ascélulas HEK293-6E na fase de crescimento exponencial (0,8 a1,5 χ IO6 células/mL), cujas células tendo passado em cultu-ra menos de 30 vezes; as culturas são inoculadas em meio decrescimento fresco até uma concentração de 3 χ IO5 célu-las/mL, a cada três ou quatro dias. O meio de crescimento éo meio de expressão FreeStyle™ 293 (GIBCO™ No. Cat. 12338-018, Invitrogen, Carlsbad, CA) suplementado com Geneticin(g418) 25 ug/mL (GIBCO™, No. Cat. 10131 - 027) e Pluronic F-68 0,1% (tensoativo, GIBCO™, No. Cat. 24040-032). O meio detransfecção é o meio de expressão FreeStyle™ 293 (GIBCO™,No. Cat. 12338 - 018) com uma concentração final de soluçãotampão HEPES 10 mM (GIBCO™, No. Cat. 15630-080). Para trans-fecção, o DNA do vetor de escolha é adicionado para alcançaruma concentração de 1 μg (cadeia pesada + cadeia leve)/mL.Sujeito a alteração baseando-se em experimentos de otimiza-ção. PEI (polietilenimina), linear, 25 KDa, 1 mg/mL de solu-ção estoque estéril, pH 7,0 (Polysciences, Inc., Warrington,PA) é adicionada como mediadora de transfecção, com uma pro-porção de DNAtPEI de 1:2. 0 meio de alimentação (Feeding Mé-dium) usado é o meio de triptona Nl (pó TNl da OrganotechnieFrance, No. Cat 19554, disponível através da TekniScienceInc. # Tel 1-800-267-9799) . Solução estoque 5% p/v em meiode expressão FreeStyle™ 293 é adicionada a uma concentraçãofinal de 0,5%. Equipamento de laboratório padrão é geralmen-te usado. Um sistema de contagem de células Cedex é emprega-do (Innovatis, Bielefeld, Alemanha).
Cada transfecção em pequena escala é executada numfrasco de erlenmeyer de 125 mL como se segue. Uma alíquotade 20 mL de meio de cultura fresco é inoculada com 1 χ IO6células/mL de células viáveis. (Nota: para volumes maiores,a cultura deveria ser 20 - 25% da capacidade nominal do va-so, por exemplo, 100 mL de cultura num frasco de 500 mL). Asculturas são, a seguir, colocadas numa incubadora a 37 0Ccom uma atmosfera umidificada de 5% de CO2 com velocidade derotação de 130 rpm.
A preparação do complexo DNA-PEI é feita pelo a-quecimento do meio de transfecção até 37 0C num banho-maria,descongelando em temperatura ambiente estoque de PEI e solu-ções de DNA congelados (estocados a -20 °C). As quantidadesde DNA e PEI usadas são baseadas no volume total da culturasendo transfectado. Uma cultura de 20 mL com 2,5 mL de com-plexo DNA/PEI e 2,5 mL de Tnl requer um total de 25 μg deDNA e 50 μg de PEI. Os complexos DNA:PEI (por exemplo, paradez transfecções) são formados pela combinação de 12,5 mL demeio de transfecção ao tubo A, ao qual foi adicionada umasolução contendo o vetor de DNA de escolha até uma concen-tração final de 10 μg/mL e 12,5 mL de meio de transfecçãopara PEI foi adicionado (20 μg/mL, conc. final). A misturaPEI é misturada submetendo ao vórtex durante cerca de 10 se-gundos antes da mistura com a solução de DNA. Depois de com-binar as misturas PEI e DNA, a combinação é misturada subme-tendo ao vórtex por 10 segundos. A seguir, a mistura é dei-xada em repouso em temperatura ambiente por 15 minutos (masnão mais do que 20 minutos) . 2,5 mL da solução de complexoDNArPEI são adicionados por 20 mL de células HEK-6E. 0 su-plemento de TNl a 5% é adicionado até uma concentração finalde 0,5% para cada frasco em cerca de 20 a 24 horas depois datransfecção.
A densidade e a viabilidade celular são determina-das no dia 4 e no dia 7. Os péletes celulares são coletadosa partir de alíquotas de 2 mL de cultura) para análise deWestern e análise de Northern Blot no dia 4. Os péletes sãocongelados a -80 0C até serem analisados. As células são co-letadas por centrifugação a 1000 rpm (10 min) 7 dias depoisda transfecção, e os sobrenadantes são filtrados usando pa-péis de pré-filtro e um sistema de filtração Corning 0,22 μτηCA. As amostras de sobrenadante também são estocadas a 80 0Caté serem analisadas, por exemplo, usando ensaios de ELISA.
Para análise de Northern Blot, o RNA total é iso-lado a partir de células 292-6E transientemente transfecta-das como se segue. Péletes de células congeladas são descon-geladas em gelo. RNA é purificado usando o mini kit QiagenRNeasy (Qiagen, # cat. 74104), de acordo com as instruçõesdo fabricante.
Preparação de formaldeído/gel de agarose é como sesegue. 2 gramas de agarose (Ambion, # cat. 9040) são ebuli-das em 161,3 mL de água destilada. 4 mL de MOPS 1 M (ácidomorfolinopropanossulfônico) , pH 7,0, 1 mL de NaOAc 1 M, 0,4mL de EDTA 0,5 M são adicionados e a mistura é esfriada até60 °C. A seguir, 33,3 mL de formaldeído 37% (J. T. Baker, #cat. 2106 - 01) são adicionados, e a solução de agarose fun-dida é misturada gentilmente. O gel é vertido e deixado so-lidificar numa capela de laboratório.
O tampão de corrida é preparado pela mistura de 30mL de MOPS 1 M, pH 7,0, 7 mL de NaOAc 1 M, 3 mL de EDTA 0,5M e dH20 tratado com DEPC (dietilpirocarbonato) até 1,5.
Amostras de RNA são preparadas pela mistura de 3partes de corante carregado com formaldeido (Ambion, # cat.8552) com 1 parte de RNA. De 3 a 5 μς de RNA correm por rai-a. Os marcadores de peso molecular de RNA usados são de RNALadder 0,5 - 10 Kb (Invitrogen, # cat. 15623 - 200). As a-mostras são aquecidas a 65 0C por 5 minutos para desnaturare esfriar em gelo. A seguir, 0,5 μΙ, de brometo de etidio 10μg/μL (Pierce, # cat. 17898) é adicionado a cada amostra.Cada amostra é girada brevemente para peletizar o liquido.
A eletroforese em gel é executada como se segue. Ogel de formaldeido/agarose é coberto com tampão de corrida,as amostras são carregadas e, a seguir, corridas a 150 V por2 horas numa capela de laboratório. As bandas são visualiza-das usando transluminação ultravioleta e fotografadas paraum registro permanente.
A transferência capilar é feita pelo encharcamentodo gel em várias alterações de dH20 tratado com DEPC porcinco minutos para remover o formaldeido. 0 gel é, a seguir,encharcado em NaOH 5.0 mM, NaCl 10 mL por 20 minutos em tem-peratura ambiente para desnaturar adicionalmente qualquerRNA de filamento duplo. O gel é rinsado uma vez em dH20 tra-tado com DEPC e, a seguir, encharcado em SSC 20x (175,3 g deNaCl; 88,2 g de citrato de sódio; pH até -7,0 com NaOH 10M, volume ajustado para 1 L) por 20 minutos em temperaturaambiente para neutralizar. A membrana Hybond-N+ (AmershamBiosciences, # cat RPN303B) é encharcada e cortada até omesmo tamanho que o gel, em dH20 tratado com DEPC para ume-decer. Papel de filtro 3M (Whatman # cat 3030917) é cortadoaté o mesmo tamanho que o gel e a membrana. 0 sistema detransferência é montado pela colocação de uma camada do pa-pel 3M num suporte sólido sobre um reservatório de SSC 20Xde forma que o papel sugue por capilaridade a SSC 20X atra-vés das camadas a serem montadas no topo. 0 gel é colocadonessa mecha, a membrana Hybond-N+, 3 folhas de papel 3M cor-tados para o tamanho, e uma pilha espessa de papel de Blotem gel (Gel Blot Paper) (Schleicher & Schuell, # cat.10427920). Um suporte plano é colocado no topo da pilha, e éadicionado peso (geralmente uma garrafa de um litro de á-gua), caso necessário, para assegurar a eficiente transfe-rência por capilaridade. É usado um envoltório plástico paracobrir qualquer parte do reservatório exposta ao ar paraprevenir a evaporação. A transferência é permitida procederde um dia para o outro em temperatura ambiente. A seguir, osistema de transferência é desmontado e o blot é embebido emSSC 6X para remover qualquer agarose. A membrana é deixadasecar ao ar e exposta à UV pra ligar de forma cruzada oblot.
Moldes de sonda de DNA são a região codificadorapara a cadeia pesada e leve de D2E7. 100 ng do molde deseja-do são marcados com fosfatase alcalina usando o kit de rea-gentes de marcação direta AlkPhos (sistema de marcação comfosfatase alcalina, Amersham Biosciences, # cat. RPN3680) deacordo com as instruções do fabricante. Os passos de pré-hibridização e hibridização foram efetuados usando o mesmokit que para a marcação (contém tampão de hibridização) . Asmembranas foram pré-hibridizadas por pelo menos 1 hora a 650C num forno de hibridização, a sonda foi ebulida e adicio-nada diretamente ao tampão/blot de pré-hibridização. A hi-bridização ocorreu de um dia para o outro a 65 0C num fornode hibridização. A solução de hibridização foi decantada e amembrana foi lavada brevemente com SSC 2X para remover a so-lução de hibridização, a seguir lavada duas vezes com SSC2X, SDS 0,1% a 65 0C por 15 minutos cada, e finalmente lava-da duas vezes com SSC 0,1X, SDS 0,1% a 65 0C por 15 minutosem cada vez. Para visualizar as bandas na membrana, foi usa-da quimiluminescência. As manchas foram superdepositadas como Reagente de Detecção CDP-Star (produção dependente de fos-fatase alcalina de um fotopo de um substrato de 1,2-dioxetano, Amersham Biosciences, # cat. RPN3682), por 5 mi-nutos em temperatura ambiente. 0 excesso de reagente foidrenado dos blots e elas foram, então, revestido em folhasplásticas protetoras. Os blots foram expostos ao filme Bio-max MR da Kodak (filme de raio X, Kodak, # cat. 8952855),começando para 10 segundos para até 10 minutos, os filmesforam desenvolvidos usando o Processador M35A X-OMAT da Ko-dak (desenvolvedor/processador de raio X).
Amostras de pélete celular para western blottingforam preparadas como se segue. Para a análise da expressãode anticorpo intracelular, as células foram lisadas em tam-pão de Iise NP 40 (Tris-HCl 50 mM, pH 7,5, NaCl 150 mM, NP401% (octilfenolpoli(etilenoglicoléter)), BME 5 mM e coquetelde inibidores da protease III) com incubação em gelo por 10min. As frações para as membranas e as proteínas insolúveissão coletadas por centrifugação a 16.000 rpm por 30 min u-sando uma microcentrifuga. O sobrenadante, designado o in-tracelular solúvel, ou a fração citosólica, foi usado paraanálise de gel, com a adição de tampão de carregamento SDScom DTT. Os péletes foram ressuspensos com volume igual detampão de lise, e o tampão de carregamento em gel SDS comDTT foi adicionado. As amostras de sobrenadante de culturaforam preparadas para western blotting como se segue. Os so-brenadantes de cultura foram ou concentrados usando Centri-con Ultra (dispositivo de ultrafiltração, Millipore) com umcorte de peso molecular de 30.000 Daltons, ou usado direta-mente para o western blotting. Para o imunoblotting (análisewestern), as amostras foram separadas em géis NUPAGE 4 - 12%de géis Bis-Tris(poliacrilamida) e transferidas para a mem-brana PVDF usando métodos padrões. As membranas foram incu-badas por 1 h em solução de bloqueio (PBS com 0,05% de Tween20 (monolaurato de polioxietilenossorbitan) e 5% de leite empó), lavadas, incubadas com IgG anti-humana de coelho poli-clonal/HRP ou com cadeia leve capa anti-humana de coelho po-liclonal/HRP, da DakoCytomation (Dinamarca), numa diluição1:1000 em tampão PBST, e foram a seguir novamente lavadas emtrês alterações de PBST em temperatura ambiente. 0 Sistemade Detecção ECL Plus Western blotting (detecção quimilumi-nescente e quimifluorescente) da GE/Amersham Biosceiences(Piscataway, NJ) foi usado para detecção.
Ensaios de ELISA foram executados usando métodospadrões, usando IgG anti-humana de cabra, UNLB e Ig-G anti-humana de cabra/HRP da Southern Biotech (Birmingham, AL), 2%de leite em PBS como tampão de coloração, K-Blue (3,3',5,5'-tetrametilbenzidina e peróxido de hidrogênio (H2O2, Neogen,Lansing, MI) como substrato. As placas foram lidas com oleitor de microplacas Spectramax no comprimento de onda pri-mário de 650 nM e no comprimento de onda de referência de490 nm.
O anticorpo secretado foi purificado por afinidadecom métodos padrões usando contas de Proteína A de agaroseda Invitrogen (Carlsbad, CA), Tampão de ligação de IgG imu-nopuro (A) da Pierce, PBS, pH 7,4 como tampão de lavagem, eácido acético 0,1 M/NaCl 150 mM, pH 3,5 como tampão de elui-ção (neutralizado usando Tris 1 M pH 9,5).
Determinação do peso molecular intacto. Os pesosmoleculares intactos das amostras D2E7 produzidas do cons-tructo pTT3 HC-int-LC P.hori foram analisados por CL-EM. Umsistema de HPLC capilar 1100 (Agilent SN DE 14900659) comuma micro armadilha de proteína (Michrom Bioresources, Inc.cat. 004/25109/03) foi usado para dessalinizar e introduziramostras no espectrômetro de massa Q Star Pulsar i (AppliedBiosystems, SN K1820202). Para eluir as amostras, um gradi-ente correu com tampão A (FA 0,08%, TFA 0,02% em água paraHPLC) e tampão B (FA 0,08% e TFA 0,02% em acetonitrila), nu-ma taxa de fluxo de 50 μL/min, por 15 minutos.
Determinação do peso molecular da cadeia leve e dacadeia pesada. Amostras de D2E7 naturais produzidas a partirdo constructo pTT3 HC-int-LC P.hori foram analisadas por CL-EM. A redução das pontes dissulfeto que ligavam as cadeiasleves e as cadeias pesadas foi efetuada em DTT 20 mM a 37 0Cpor 30 minutos. Um sistema de HPLC capilar 1100 (Agilent SNDE 14900659) com uma coluna PLRP-S (Michrom Bioresources,Inc. 8 μm, 4000 Â, 1.0 χ 150 mm, P/N 901-00911-00) foi usadopara separar as cadeias leves das cadeias pesadas e introdu-zi-las no espectrômetro de massa Q Star Pulsar i (AppliedBiosystems, SN K1820202). A coluna foi aquecida a 60 °C. Umgradiente de HPLC, o qual correu com tampão A (FA 0,08%, TFA0,02% em água para HPLC) e tampão B (FA 0,08% e TFA 0,02% emacetonitrila) , numa taxa de fluxo de 50 μl/u.m, correu por60 minutos para eluir as amostras.
Endonucleases de restrição foram da New EnglandBiolabs (Beverly, MA) . Oligonucleotideos, DNA polimerase,DNA ligases e cepas de E. coli sob encomenda usados paraclonagem foram da Invitrogen (Carlsbad, CA). 0 coquetel ini-bidor da protease III foi da Calbiochem (La Jolla, CA) . Osprodutos Qiagen (Valencia, CA) foram usados para o isolamen-to e purificação de DNA.
DECLARAÇÕES CONSIDERANDO A INCORPORAÇÃO POR REFERÊNCIA E VARIAÇÕES
Todas as referências mencionadas através desse pe-dido, por exemplo, documentos de patente incluindo patentesou equivalentes emitidos ou outorgados; publicações de pedi-do de patente; pedidos de patentes não-publicados; e docu-mentos da literatura que não são patentes ou outro materialde fonte; são por meio disto incorporados por referência a-qui nas suas totalidades, como se individualmente incorpora-dos por referência. No evento de qualquer inconsistência en-tre as referências citadas e a descoberta do presente pedi-do, a descoberta aqui toma precedência. Algumas referênciasaqui fornecidas são incorporadas por referência para propor-cionar informação, por exemplo, detalhes envolvendo fontesde materiais de partida, materiais de partida adicionais,reagentes adicionais, métodos de síntese adicionais, métodosde análise adicionais, materiais biológicos adicionais, cé-lulas adicionais e usos adicionais da invenção.
Todas as patentes e publicações aqui mencionadassão indicativas dos níveis de habilidade das pessoas versa-das na técnica para as quais a invenção pertence. Referên-cias citadas aqui podem indicar o estado da técnica como desuas publicações da data de preenchimento, e é tencionadoque essa informação possa ser aqui empregada, caso necessá-rio, para excluir modalidades específicas que estão na téc-nica anterior qualificante. Por exemplo, quando as composi-ções da matéria são aqui reivindicadas, deve ser entendidoque os compostos conhecidos e disponíveis como técnica ante-rior qualificante se referem à invenção do peticionário, in-cluindo os compostos para os quais uma descoberta habilitan-te é fornecida nas referências aqui citadas, não são tencio-nadas para serem incluídas na composição das reivindicaçõesda matéria aqui.
Qualquer apêndice ou apêndices até aqui são incor-porados por referência como parte da especificação e/ou de-senhos.
Onde os termos "compreende" (comprise), "compreen-de" (comprises), "compreendido" ou "compreendendo" são aquiutilizados, eles têm que ser interpretados como especifican-do a presença das características, números inteiros, passosou componentes estabelecidos referidos, mas não para impedira presença ou adição de uma ou mais outras características,números inteiros, passos, componentes ou grupos seus. Dessaforma, conforme aqui utilizado, compreendendo é sinônimo comincluindo, contendo, tendo ou caracterizado por, e é inclu-sivo ou ilimitado. Conforme aqui utilizado, "consistindo de"exclui qualquer elemento, passo ou ingrediente, etc. não es-pecificado na descrição da reivindicação. Conforme aqui uti-lizado, "consistindo essencialmente de" não exclui materiaisou passos que não afetam materialmente as característicasbásicas e novas da reivindicação (por exemplo, em relação aoingrediente ativo). Em cada exemplo aqui, qualquer um dostermos "compreendendo", "consistindo essencialmente de" e"consistindo de" pode ser substituído com qualquer um dosoutros dois termos, revelando dessa forma modalidades e/ouescopos separados os quais não são necessariamente co-extensivos. A invenção descrita de forma ilustrativa aquiadequadamente pode ser praticada na ausência de qualquer e-lemento ou elementos ou limitação ou limitações não especi-ficamente aqui revelados.
Sempre que uma faixa é aqui revelada, por exemplo,uma faixa de temperatura, faixa de tempo, faixa de composi-ção ou concentração ou outra faixa de valor, etc., todas asfaixas e subfaixas intermediárias, assim como os valores in-dividuais incluídos nas faixas dadas são tencionados paraserem incluídas na descoberta. Essa invenção não é para serlimitada pelas modalidades reveladas, incluindo qualquer umamostrada nos desenhos ou exemplificada na especificação, asquais são dadas a título de exemplo ou ilustração e não delimitação. Será entendido que quaisquer subfaixas ou valoresindividuais numa faixa ou subfaixa que são incluídos na des-crição aqui podem ser excluídos das reivindicações aqui.
A invenção foi descrita com referência a váriasmodalidades e técnicas específicas e/ou preferidas. Entre-tanto, deve ser entendido que muitas variações e modifica-ções podem ser feitas enquanto permanecendo dentro do espí-rito e escopo da invenção. Será aparente para uma pessoanormalmente versada na técnica que composições, métodos,dispositivos, elementos de dispositivo, materiais, procedi-mentos e técnicas diferentes daquelas especificamente aquidescritas podem ser empregadas na prática da invenção comoamplamente descobertas aqui sem se dirigir à experimentaçãoinadequada; isso pode se estender, por exemplo, a materiaisde partida, materiais biológicos, reagentes, métodos sinté-ticos, métodos de purificação, métodos analíticos, métodosde ensaio e métodos biológicos diferentes daqueles especifi-camente exemplificados. Todos os equivalentes funcionais co-nhecidos na técnica antecedente (por exemplo, composições,métodos, dispositivos, elementos de dispositivo, materiais,procedimentos e técnicas, etc.) aqui descritos são tenciona-dos para serem englobados por essa invenção. Os termos e ex-pressões os quais foram empregados são usados como termos dadescrição e não de limitação, e não há intenção no uso detais termos e expressões de excluir quaisquer equivalentesdas características mostradas e descritas ou porções suas,mas é reconhecido que várias modificações são possíveis den-tro do escopo da invenção reivindicada. Dessa forma, deveser entendido que embora a presente invenção tenha sido es-pecificamente revelada pelas modalidades, modalidades prefe-ridas e características opcionais, pode-se lançar mão da mo-dificação e a variação dos conceitos aqui revelados pelaspessoas versadas na técnica, e que tais modificações e vari-ações são consideradas como estando dentro do escopo dessainvenção conforme definido pelas reivindicações em anexo.
REFERÊNCIAS ADICIONAIS
US 6258562, US 6090382; US 6455275; EP1080206B1 ;WO 9960135; US 5912167; US 5162601 ; WO 199521249A1 ; US514 97 83; US 595507 2; US 5532142; US 2004 0224391 ; US6537806; US 5846767; US 20030099932; WO 9958663; US20030157641 ; US 2003048306A2; US 6114146; US 6060273; US5925565; US 20040241821 ; WO 2003100021A2; WO 2003100022A2;US 20040265955; US 20050003482; US 20050042721 ; WO2005017149; WO 2004113493; US 20050136035; WO 2004108893; US6692736; US 20050147962; US 6331415; US 6632637; US20040063186; US 7026526; US 6365377; WO 2005123915; US5665567; WO 9741241A1 ; EP 0701616B1 ; US 20060010506; WO2006048459; US 6852510; WO 2005072129; US 5648254; US6908751 ; US 20050221429; WO 2005071088; WO 2005108585; WO2005085456; US 7029876; US 6638762; US 6544780; US 5519164;WO 2003031630; US 6294353; WO 2005047512; US 7052905; US7018833; US 20020034814; US 20040126883; US 20050002907; US20050112095; US 20050214258; EP 0598029.
Mathys S et al., 1999, Gene 231 (1-2): 1-13, Ca-racterização de auto-splicing mini-inteína e a sua conversãoautocatalitica ' em elementos de clivagens das porções N eCterminal: produção facilitada de blocos de estruturasproteína para proteína de ligação.Listagem de seqüências
<110> (Peticionário) Abbott Laboratories
Agente) Greenlee, Winner and Sullivanl P.c.
CARSON1 Gerald r.
gion, wendy
salfeld, Jochen g.
GU, Jijie
REGIER1 Dean A.
KUNES, Yune
<12o> Expressão múltipla de gene incluindo constructos sorf emétodos com poliproteínas, pró-proteínas e proteólise
<130> 74-05_WO
Έΐΐ^^ξί-(a ser designada)
<141> 2006-07-21 v 6 '
<150> US 60/701,855<151> 2005-07-21
<160> 158
<170> Patentln version 3.3
<210> 1
<211> 4
<212> PRT
<213> Artificial
<220>
<223> Sintético: sítio de reconhecimento de clivagem para furina<220>
<221> Característica MISC
<222> Ç2)..(3) .
<223> ]\a posição 2, Xaa pode ser aminoácido e na posição 3, Xaa
pode ser Arg ou Lys
<400> 1
Arg Xaa Xaa Arg1
<210> 2
<211> 5
<212> prt
<213> Artificial
<220>
<223> Seqüência de reconhecimento para VP4 de BPNV
<220>
<221> Característica MISC<222> (1)..(4)
<223> Na posição 1, Xaa pode ser Ser ou Thr, e na posição 4, Xaapode ser Ser ou Ala
<400> 2
Xaa Xaa Ala Xaa Gly15<210> 3
<211> 7
<212> PRT
<213> Artificial
<220>
<223> Seqüência de reconhecimento para TEV protease
<220>
<221> Característica MISC<222> (2)..(3)
<223> Xaa pode ser qualquer ocorrência natural de aminoácido<220>
<223> Característica MISC<222> (5)..(5)
<223> Xaa pode ser qualquer ocorrência natural de aminoácido<400> 3
Glu Xaa Xaa Tyr Xaa Gln Gly1 5
<210> 4
<211> 8
<212> PRT
<213> Artificial
<220>
<22 3> Sítio de reconhecimento para a protease 3C de rinovírus
<400> 4
Leu Glu Val Leu Phe Gln Gly Pro1 5
<210> 5
<211> 6
<212> PRT
<213> Artificial
<220>
<223> Seqüência de reconhecimento da PC5/6 protease, LPC/PC7protease e enteroquinase
<220>
<221> Característica MISC<222> (6)..C6)
<22 3> Xaa pode ser qualquer aminoácido<400> 5
Asp Asp Asp Asp Lys Xaa
<210> 6
<211> 5
<212> PRT
<213> Artificial
<220>
<223> Seqüência de reconhecimento para a protease do Fator Xa<220>
<221> Característica MISC<222> (2)..(5)
<223> Na posição 2 Xaa έ Glu ou Asp, e na posição S Xaa pode
ser qualquer aminoácido<400> 6
lie Xaa Gly Arg Xaa1 5
<210> 7
<211> 7<212> PRT<213> Artificial
<220> β . . , .
<22 3> Sequencias de reconhecimento para trombuia
<400> 7
Leu Val Gly Pro Arg Gly Ser
<21Q> 8
<211> 6
<212> PRT
<213> Artificial
<220>
<223> Seqüência de reconhecimento para a genenase I<400> 8
Pro Gly Ala Ala His Tyr15
<210> 9
<211> 7
<212> PRT
<213> Artificial
<220>
<223> Seqüência de reconhecimento para MMP protease, Nla de potivírus mosaico denabo e KEX2 protease
<400> 9
Met Tyr Lys Arg Glu Ala Asp
<210> 10
<211> 4
<212> PRT
<213> Artificial
<220>
<223> Seqüência de aminoácido de furina a qual almeja a proteína para a rede deGolgi trans
<400> 10Glu Glu Asp Glu<210> 11
<211> 24
<212> PRT
<213> Artificial
<220>
<223> Peptídeo de sinal internamente clivável do vírus de influenza C<400> 11
Met Gly Arg Met Ala Met Lys Trp Leu Val Val Ile Ile Cys Phe ser15 10 15
Ile Thr ser Gln Pro Ala ser Ala20
<210> 12<211> 19<212> PRT<213> Artificial
<220>
<22 3> Seqüência 2A FMDV<400> 12
Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn1 5 10 15
Pro Gly Pro
<210> 13
<211> 19
<212> PRT
<213> Artificial
<22 0>
<223> Seqüência 2A FMDV<400> 13
Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp vai Glu ser Asn1 5 10 15
Pro Gly Pro
<210> 14
<211> 14
<212> PRT
<213> Artificial
<220>
<223> Seqüência 2A FMDV
<400> 14
Leu Leu Lys Leu Ala Gly Asp Val Glu ser Asn Pro Gly Pro1 5 10
<210> 15
<211> 20
<212> PRT
<213> Artificial
<220>
<223> Variante da seqüência 2Α<400> 15
Gln Leu Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu ser1 5 10 15
Asn Pro Gly Pro20
<210> 16<211> 19<212> PRT<213> Artificial
<220>
<223> Variante da seqüência 2A<400> 16
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly15 10 15
Pro Phe Phe
<210> 17
<211> 14
<212> PRT
<213> Artificial
<220>
<223> Variante da seqüência 2A
<400> 17
Leu Leu Lys Leu Ala Gly Asp Val Glu ser Asn Pro Gly Pro
1 5 10
<210> 18<211> 17<212> PRT<213> Artificial
<220>
<223> Variante da seqüência 2A<400> 18
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val Glu Ser Asn Pro Gly
1 5 10 15
Pro<210> 19
<211> 24
<212> PRT
<213> Artificial
<220>
<223> Variante da seqüência 2A<400> 19
Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly1 5 10 15
Asp Val Glu ser Asn Prò Gly Pro20
<210> 20<211> 58<212> PRT<213> Artificial
<220>
<223> Variante da seqüência 2A<400> 20
vai Thr Glu Leu Leu Tyr Arg Met Lys Arg Ala Glu Thr Tyr Cys Pro1 5 10 15
Arg Pro Leu Leu Ala Ile His Pro Thr Glu Ala Árg His Lys Gln Lys20 25 30
Ile Val Ala Pro Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu35 40 45
Ala Gly Asp Val Glu ser Asn Pro Gly Pro50 55
<210> 21
<211> 10
<212> PRT
<213> Artificial
<220>
<223> Seqüência N-terminal da cadeia pesada de imunoglobulina de D2E7<400> 21
Glu Val Gln Leu vai Glu ser Gly Gly Gly1 5 10
<210> 22
<211> 10
<212> PRT
<213> Artificial
<220>
<223> Seqüência N-terminal da cadeia leve de imunoglobulina de D2E7<400> 22
Asp Ile Gln Met Thr Gln Ser Pro ser Ser1 5 10
<210> 23
<211> 22
<212> PRT
<213> Artificial
<220>
<223> Seqüência de sinal da cadeia leve D23E7
<400> 23
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp1 5 10 15
Phe Pro Gly ser Arg Cys20
<210> 24
<211> 20
<212> PRT<213> Arti fi ci al
<220>
<223> Seqüência de peptídeo de sinal de D2E7 no constructo H
<400> 24
Met Asp Met Arg vai Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro1 5 10 15
Gly ser Arg Cys20
<210> 25
<211> 15
<212> PRT
<213> Arti fi ci al
<220>
<223> Seqüência de aminoácidos no final da inteína e no início da proteína decadeia leve no constructo J
<400> 25
Met Asp Met Arg vai Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys1 5 10 15
<210> 26
<211> 10
<212> PRT
<213> Artificial
<220>
<223> Seqüência N-terminal da cadeia leve no constructo H
<400> 26Met Asp Met Arg Val Pro Ala Gln Leu Leu1 5 10
<210> 27
<211> 22
<212> PRT
<213> Artificial
<220>
<2 2 3> Seqüência de aminoácidos após a inteína no constrncto L<400> 27
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp1 5 10 15
Phe Pro Gly ser Gly Gly20
<210> 28<211> 10<212> PRT<213> Artificial
<220>
<223> Seqüência de sítio de clivagem da peptidase de sinal<400> 28
Leu Ala Gly Phe Ala Thr Val Ala Gln Ala1 5 10
<210> 29
<211> 2925
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, seqüência codificadora da poliproteína LC-LC-HC de D2E7<220>
<221> CDS<222> (1)..(2922)
<400> 29
atg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg 48
Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp
1 5 10 15
ttc ccc ggc tcg cga tgc gac ate cag atg acc cag tet cca tcc tcc 96
Phe Pro Gly ser Arg Cys Asp lie Gln Met Thr Gln Ser Pro ser ser20 25 30
ctg tet gea tet gtã ggg gac aga gtc acc ate act tgt cgg gea agt 144Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser35 40 45
cag ggc ate aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa 192Gln Gly lie Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys50 55 60
gcc cct aag ctc ctg ate tat gct gea tcc act ttg caa tca ggg gtc 240Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly Val65 70 75 80
cca tct cgg ttc agt ggc agt gga tct ggg aca gat ttc act ctc acc 288
Pro ser Arg Phe ser Gly ser Gly ser Giy Thr Asp Phe Thr Leu Thr
85 90 95
ate age age cta cag cct gaa gat gtt gea act tat tac tgt caa agg 336
lie ser Ser Leu Gln Pro Glu Asp vai Ala Thr Tyr Tyr Cys Gln Arg100 105 110
tat aac cgt gea ccg tat act ttt ggc cag ggg acc aag gtg gaa atTyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys vai Glu Il115 120 125
ate 384e
aaa cgt acg gtg gct gea cca tct gtc ttc ate ttc ccg cca tct gat 432Lys Arg Thr VaT Ala Ala Pro Ser Val Phe Ile Phe Pro Pro ser Asp130 135 140
gag cag ttg aaa tct gga act gcc tct gtt gtg tgc ctg ctg aat aac 480Glu Gln Leu Lys Ser Gly Thr Ala ser Val Val Cys Leu Leu Asn Asn145 150 155 160
ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc 528Phe Tyr Pro Arg Glu Ala Lys vai Gln Trp Lys Val Asp Asn Ala Leu165 170 175
caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac age aag gac 576Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp180 185 190
age acc tac age ctc age age acc ctg acg ctg age aaa gea gac tac 624ser Thr Tyr Ser Leu ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr195 200 205
gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg age 672Glu Lys His Lys Val Tyr Ala Cys Glu vai Thr His Gln Gly Leu Ser210 215 220
tcg ccc gtc aca aag age ttc aac agg gga agg tgt aag aga ctt ctc 720ser Pro vai Thr Lys ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu225 230 235 240
aag ttg gea gga gac gtt gag tcc aac cct ggg ccc atg gac atg cgc 768Lys Leu Ala Gly Asp Val Glu ser Asn Pro Gly Pro Met Asp Met Arg245 250 255
gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc ccc ggc tcg 816Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly ser260 265 270
cga tgc gac ate cag atg acc cag tct cca tcc tcc ctg tct gea tct 864Arg cys Asp Ile Gln Met Thr Gln Ser Pro ser ser Leu Ser Ala ser275 280 285
912
gta ggg gac aga gtc acc ate act tgt cgg gea agt cag ggc ate aga
vai Gly Asp Arg Val Thr Ile Thr cys Arg Ala Ser Gln Gly Ile Arg290 295 300
aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc cct aag ctc 960
Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu305 310 315 320
ctg ate tat gct gea tcc act ttg caa tca ggg gtc cca tct cgg ttc 1008
Leu Ile Tyr Ala Ala Ser Thr Leu Gln Ser Gly vai Pro ser Arg Phe
325 330 335
agt ggc agt gga tct ggg aca gat ttc act ctc acc ate age age cta 1056
Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu340 345 350
cag cct gaa gat gtt gca act tat tac tgt caa agg tat aac cgt gca 1104Gln Pro Glu Asp vai Ala Thr Tyr Tyr Cys Gln Arg Tyr Asn Arg Ala355 360 365
ccg tat act ttt ggc cag ggg acc aag gtg gaa ate aaa cgt acg gtg 1152Pro Tyr Thr Phe Gly Gln Gly Thr Lys VaT Glu Ile Lys Arg Thr vai370 375 380
gct gca cca tet gtc ttc ate ttc ccg cca tet gat gag cag ttg aaa 1200Ala Ala Pro Ser Val Phe Ile Phe Pro Pro ser Asp Glu Gln Leu Lys385 390 395 400
tet gga act gcc tet gtt gtg tgc ctg ctg aat aac ttc tat ccc aga 1248Ser Gly Thr Ala ser vai vai Cys Leu Leu Asn Asn Phe Tyr Pro Arg405 410 415
gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac 1296Glu Ala Lys Val Gln Trp Lys VaT Asp Asn Ala Leu Gln ser. Giy Asn420 425 430
tcc cag gag agt gtc aca gag cag gac age aag gac age acc tac age 1344ser Gln Glu ser Val Thr Glu Gln Asp ser Lys Asp Ser Thr Tyr ser435 440 445
ctc age age acc ctg acg ctg age aaa gca gac tac gag aaa cac aaa 1392Leu ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys450 455 460
gtc tac gcc tgc gaa gtc acc cat cag ggc ctg age tcg ccc gtc aca 1440Val Tyr Ala Cys Glu vai Ttir His Gln GTy Leu ser Ser Pro vai Thr465 470 475 480
aag age ttc aac agg gga agg tgt aag aga ctt ctc aag ttg gca gga 1488Lys Ser Phe Asn Arg GTy Arg cys Lys Arg Leu Leu Lys Leu Ala GTy485 490 495
gac gtt gag tcc aac cct ggg ccc atg gag ttt ggg ctg age tgg ctt 1536Asp Val Glu Ser Asn Pro GTy Pro Met Glu Phe Giy Leu Ser Trp Leu500 505 510
ttt ctt gtc gcg att tta aaa ggt gtc cag tgt gag gtg cag ctg gtg 1584Phe Leu Val Ala Ile Leu Lys GTy Val Gln Cys Glu VaT Gln Leu VaT515 520 525
gag tet ggg gga ggc ttg gta cag ccc ggc agg tcc ctg aga ctc tcc 1632Glu Ser GTy GTy GTy Leu vai Gln Pro GTy Arg ser Leu Arg Leu Ser530 535 540
tgt gcg gcc tet gga ttc acc ttt gat gat tat gcc atg cac tgg gtc 1680Cys Ala Ala ser GTy Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val545 550 555 560
cgg caa gct cca ggg aag ggc ctg gaa tgg gtc tca gct ate act tggArg Gln Ala Pro GTy Lys GTy Leu Glu Trp Val Ser Ala Ile Thr Trp565 570 575
1728
aat agt ggt cac ata gac tat gcg gac tet gtg gag ggc cga ttc acc 1776Asn Ser Gly His Ile Asp Tyr Ala Asp Ser VaT Glu GTy Arg Phe Thr580 585 590
ate tcc aga gac aac gcc aag aac tcc ctg tat ctg caa atg aac agt 1824
Ile ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn Ser595 600 605
ctg aga gct gag gat acg gcc gta tat tac tgt gcg aaa gtc tcg tac 1872
Leu Arg Ala Glu Asp Thr Ala vai Tyr Tyr cys Ala Lys Val Ser Tyr610 615 620
ctt age acc gcg tcc tcc ctt gac tat tgg ggc caa ggt acc ctg gtcLeu ser Thr Ala ser ser Leu Asp Tyr Trp Gly Gln Giy Thr Leu vai625 630 635 640
gag gtc aca tgc gtg gtg gtg gac gtg age cac gaa gac cct gag gtcGlu vai Thr Cys VaT VaT VaT Asp VaT Ser His Glu Asp Pro Glu Val785 790 795 800
1920
acc gtc tcg agt gcg tcg acc aag ggc cca tcg gtc ttc ccc ctg gea 1968Thr vai ser ser Ala Ser Thr Lys GTy Pro ser Val Phe Pro Leu Ala645 650 655
ccc tcc tcc aag age acc tet ggg ggc aca gcg gcc ctg ggc tgc ctg 2016Pro ser ser Lys ser Thr ser GTy Giy Thr Ala Ala Leu Gly Cys Leu660 665 670
gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac tca ggc 2064vai Lys Asp Tyr Phe Pro Glu Pro VaT Thr VaT Ser Trp Asn Ser GTy675 680 685
gcc ctg acc age ggc gtg cac acc ttc ccg gct gtc cta cag tcc tca 2112Ala Leu Thr ser GTy VaT His Thr Phe Pro Ala Val Leu Gln Ser Ser690 695 700
gga ctc tac tcc ctc age age gtg gtg acc gtg ccc tcc age age ttg 2160GTy Leu Tyr ser Leu ser Ser VaT VaT Thr VaT Pro Ser Ser Ser Leu705 710 715 720
c acc cag acc tac ate tgc aac gtg aat cac aag ccc age aac acc 2208y Thr Gln Thr Tyr Ile Cys Asn VaT Asn His Lys Pro Ser Asn Thr725 730 735
aag gtg gac aag aaa gtt gag ccc aaa tet tgt gac aaa act cac aca 2256Lys VaT Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr740 745 750
tgc cca ccg tgc cca gea cct gaa ctc ctg ggg gga ccg tca gtc ttc 2304Cys Pro Pro cys Pro Ala Pro Glu Leu Leu GTy GTy Pro Ser Val Phe755 760 765
ctc ttc ccc cca aaa ccc aag gac acc ctc atg ate tcc cgg acc cct 2352Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro770 775 780
2400
aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc aag aca 2448Lys Phe Asn Trp Tyr VaT Asp GTy VaT Glu VaT His Asn Ala Lys Thr805 810 815
aag ccg cgg gag gag cag tac aac age acg tac cgt gtg gtc age gtc 2496Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg VaT Val Ser Val820 825 830
ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac aag tgc 2544Leu Thr Val Leu His Gln Asp Trp Leu Asn GTy Lys Glu Tyr Lys Cys835 840 845
aag gtc tcc aac aaa gcc ctc cca gcc ccc ate gag aaa acc ate tcc 2592Lys Val Ser Asn Lys Ala Leu pro Ala Pro Ile Glu Lys Thr Ile Ser850 855 860
aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca 2640Lys Ala Lys GTy Gln Pro Arg Glu Pro Gln VaT Tyr Thr Leu Pro Pro865 870 875 880
tcc cgg gat gag ctg acc aag aac cag gtc age ctg acc tgc ctg gtc 2688Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr cys Leu vai885 890 895
cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cacGln Gln Gly Asn vai Phe ser cys ser vai Met His Glu Ala Leu His945 950 955 960
2736
aaa ggc ttc tat ccc age gac ate gcc gtg gag tgg gag age aat gggLys Gly Phe Tyr Pro ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly900 905 910
cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac 2784Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro VaT Leu Asp Ser Asp915 920 925
ggc tcc ttc ttc ctc tac age aag ctc acc gtg gac aag age agg tgg 2832Gly ser Phe Phe Leu Tyr ser Lys Leu Thr vai Asp Lys Ser Arg Trp930 935 940
2880
aac cac tac acg cag aag age ctc tcc ctg tet ccg ggt aaa tga 2925
Asn His Tyr Thr Gln Lys Ser Leu ser Leu ser Pro Gly Lys965 970
<210> 30<211> 974<212> PRT<213> Artificial
<220>
<223> Sintético constructo<400> 30
Met Asp Met Arg vai Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp1 5 10 15
Phe Pro Gly Ser Arg cys Asp Ile Gln Met Thr Gln ser Pro Ser Ser20 25 30
Leu ser Ala ser Val Gly Asp Arg vai Thr Ile Thr cys Arg Ala Ser35 40 45
Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys50 55 60
Ala Pro Lys Leu Leu Ile Tyr Ala Ala ser Thr Leu Gln ser Gly vai65 70 75 80
Pro ser Arg Phe ser Gly ser Gly ser Gly Thr Asp Phe Thr Leu Thr85 90 95
Ile ser ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr cys Gln Arg100 105 110
Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile115 120 125
Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp130 135 140Glu Gln Leu Lys Ser Gly Thr Ala ser vai Val cys Leu Leu Asn Asn145 150 155 160
Phe Typ Pro Arg Glu Ala Lys Val Gln Trp Lys vai Asp Asn Ala Leu165 170 175
Gln Ser Gly Asn Ser Gln Glu ser vai Thr Glu Gln Asp ser Lys Asp180 185 190
Ser Thr Tyr Ser Leu ser Ser Thr Leu Thr Leu ser Lys Ala Asp Tyr195 200 205
Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu ser210 215 220
Ser Pro Val Thr Lys ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu225 230 23? 240
Lys Leu Ala Gly Asp vai Glu Ser Asn Pro Gly Pro Met Asp Met Arg245 250 255
vai Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe Pro Gly ser260 265 270
Arg Cys Asp Ile Gln Met Thr Gln Ser Pro ser Ser Leu Ser Ala ser275 280 285
vai Gly Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Gly Ile Arg290 295 300
Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu305 310 315 320
Leu Ile Tyr Ala Ala Ser Thr Leu Gln ser Gly Val Pro ser Arg Phe325 330 335
Ser Gly ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile ser Ser Leu340 345 350
Gln Pro Glu Asp vai Ala Thr Tyr Tyr cys Gln Arg Tyr Asn Arg Ala355 360 365
Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Arg Thr Val370 375 380
Ala Ala Pro Ser Val Phe Ile Phe Pro Pro ser Asp Glu Gln Leu Lys385 390 395 400
Ser Gly Thr Ala Ser Val Val cys Leu Leu Asn Asn Phe Tyr Pro Arg405 410 415Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn420 425 430
ser Gln Glu ser Val Thr Glu Gln Asp ser Lys Asp ser Thr Tyr ser435 440 445
Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys450 455 460
vai Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro vai Thr465 470 475 480
Lys Ser Phe Asn Arg Gly Arg Cys Lys Arg Leu Leu Lys Leu Ala Gly485 490 495
Asp Val Glu Ser Asn Pro Gly Pro Met Glu Phe Gly Leu ser Trp Leu500 505 510
Phe Leu vai Ala Ile Leu Lys Gly Val Gln Cys Glu Val Gln Leu Val515 520 525
Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Arg ser Leu Arg Leu ser530 535 540
Cys Ala Ala Ser Gly Phe Thr Phe Asp Asp Tyr Ala Met His Trp Val545 550 555 560
Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val ser Ala Ile Thr Trp565 570 575
Asn ser Gly His Ile Asp Tyr Ala Asp ser Val Glu Gly Arg Phe Thr580 585 590
Ile ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr Leu Gln Met Asn ser595 600 605
Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Ala Lys Val ser Tyr610 615 620
Leu ser Thr Ala ser ser Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val625 630 635 640
Thr vai ser ser Ala ser Thr Lys Gly Pro ser vai Phe Pro Leu Ala645 650 655
Pro Ser Ser Lys Ser Thr ser Gly Gly Thr Ala Ala Leu Gly Cys Leu660 665 670
Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly675 680 685Ala Leu Thr ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser ser690 695 700
Gly Leu Tyr ser Leu Ser ser Val vai Thr Val Pro ser ser Ser Leu705 710 715 720
Gly Thr Gln Thr Tyr Ile Cys Asn vai Asn His Lys Pro Ser Asn Thr725 730 735
Lys Val Asp Lys Lys Val Glu Pro Lys ser Cys Asp Lys Thr His Thr740 745 750
Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro ser Val Phe755 760 765
Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile ser Arg Thr Pro770 775 780
Glu Val Thr Cys vai Val Val Asp Val Ser His Glu Asp Pro Glu Val785 790 795 800
Lys Phe Asn Trp Tyr Val Asp Gly vai Glu Val His Asn Ala Lys Thr805 810 815
Lys Pro Arg Glu Glu Gln Tyr Asn ser Thr Tyr Arg Val Val Ser vai820 825 830
Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys835 840 845
Lys vai Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile ser850 855 860
Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro865 870 875 880
Ser Arg Asp Glu Leu Thr Lys Asn Gln Val ser Leu Thr Cys Leu vai885 890 895
Lys Gly Phe Tyr Pro ser Asp Ile Ala Val Glu Trp Glu ser Asn Gly900 905 910
Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro vai Leu Asp Ser Asp915 920 925
Gly ser Phe Phe Leu Tyr ser Lys Leu Thr Val Asp Lys ser Arg Trp930 935 940
Gln Gln Gly Asn Val Phe Ser Cys Ser vai Met His Glu Ala Leu His945 .950 955 960Asn His Tyr Thr Gln Lys Ser Leu Ser Leu ser Pro Gly Lys965 970
<210> 31<211> 10323<212> DNA<213> Artificial
<220>
<223> Constructo sintético, vetor de expressão da poliproteína LC-LC-HC de D2E7<400> 31
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggac 1260
atgcgcgtgc ccgcccagct gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc 1320
gacatccaga tgacccagtc tccatcctcc ctgtctgcat ctgtagggga cagagtcacc 1380
atcacttgtc gggcaagtca gggcatcaga aattacttag cctggtatca gcaaaaacca 1440
gggaaagccc ctaagctcct gatctatgct gcatccactt tgcaatcagg ggtcccatct 1500
cggttcagtg gcagtggatc tgggacagat ttcactctca ccatcagcag cctacagcct 1560
gaagatgttg caacttatta ctgtcaaagg tataaccgtg caccgtatac ttttggccag 1620gggaccaagg tggaaatcaa acgtacggtg gctgcaccat ctgtcttcat cttcccgcca 1680
tctgatgagc agttgaaatc tggaactgcc tctgttgtgt gcctgctgaa taacttctat 1740
cccagagagg ccaaagtaca gtggaaggtg gataacgccc tccaatcggg taactcccag 1800
gagagtgtca cagagcaggá cagcaaggac agcacctaca gcctcagcag caccctgacg 1860
ctgagcaaag cagactacga gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc 1920
ctgagctcgc ccgtcacaaa gagcttcaac aggggaaggt gtaagagact tctcaagttg 1980
gcaggagacg ttgagtccaa ccctgggccc atggacatgc gcgtgcccgc ccagctgctg 2040
ggcctgctgc tgctgtggtt ccccggctcg cgatgcgaca tccagatgac ccagtctcca 2100
tcctccctgt ctgcatctgt aggggacaga gtcaccatca cttgtcgggc aagtcagggc 2160
atcagaaatt acttagcctg gtatcagcaa aaaccaggga aagcccctaa gctcctgatc 2220
tatgctgcat ccactttgca atcaggggtc ccatctcggt tcagtggcag tggatctggg 2280
acagatttca ctctcaccat cagcagccta cagcctgaag atgttgcaac ttattactgt 2340
caaaggtata accgtgcacc gtatactttt ggccagggga ccaaggtgga aatcaaacgt 2400
acggtggctg caccatctgt cttcatcttc ccgccatctg atgagcagtt gaaatctgga 2460
actgcctctg ttgtgtgcct gctgaataac ttctatccca gagaggccaa agtacagtgg 2520
aaggtggata acgccctcca atcgggtaac tcccaggaga gtgtcacaga gcaggacagc 2580
aaggacagca cctacagcct cagcagcacc ctgacgctga gcaaagcaga ctacgagaaa 2640
cacaaagtct acgcctgcga agtcacccat cagggcctga gctcgcccgt cacaaagagc 2700
ttcaacaggg gaaggtgtaa gagacttctc aagttggcag gagacgttga gtccaaccct 2760
gggcccatgg agtttgggct gagctggctt tttcttgtcg cgattttaaa aggtgtccag 2820
tgtgaggtgc agctggtgga gtctggggga ggcttggtac agcccggcag gtccctgaga 2880
ctctcctgtg cggcctctgg attcaccttt gatgattatg ccatgcactg ggtccggcaa 2940
gctccaggga agggcctgga atgggtctca gctatcactt ggaatagtgg tcacatagac 3000
tatgcggact ctgtggaggg ccgattcacc atctccagag acaacgccaa gaactccctg 3060
tatctgcaaa tgaacagtct gagagctgag gatacggccg tatattactg tgcgaaagtc 3120
tcgtacctta gcaccgcgtc ctcccttgac tattggggcc aaggtaccct ggtcaccgtc 3180
tcgagtgcgt cgaccaaggg cccatcggtc ttccccctgg caccctcctc caagagcacc 3240
tctgggggca cagcggccct gggctgcctg gtcaaggact acttccccga accggtgacg 3300
gtgtcgtgga actcaggcgc cctgaccagc ggcgtgcaca ccttcccggc tgtcctacag 3360
tcctcaggac tctactccct cagcagcgtg gtgaccgtgc cctccagcag cttgggcacc 3420
cagacctaca tctgcaacgt gaatcacaag cccagcaaca ccaaggtgga caagaaagtt 3480
gagcccaaat cttgtgacaa aactcacaca tgcccaccgt gcccagcacc tgaactcctg 3540
gggggaccgt cagtcttcct cttcccccca aaacccaagg acaccctcat gatctcccgg 3600
acccctgagg tcacatgcgt ggtggtggac gtgagccacg aagaccctga ggtcaagttc 3660aactggtacg tggacggcgt ggaggtgcat aatgccaaga caaagccgcg ggaggagcag 3720
tácaacagca cgtaccgtgt ggtcagcgtc ctcaccgtcc tgcaccagga ctggctgaat 3780
ggcaaggagt acaagtgcaa ggtctccaac aaagccctcc cagcccccat cgagaaaacc 3840
atctccaaag ccaaagggca gccccgagaa ccacaggtgt acaccctgcc cccatcccgg 3900
gatgagctga ccaagaacca ggtcagcctg acctgcctgg tcaaaggctt ctatcccagc 3960
gacatcgccg tggagtggga gagcaatggg cagccggaga acaactacaa gaccacgcct 4020
cccgtgctgg actccgacgg ctccttcttc ctctacagca agctcaccgt ggacaagagc 4080
aggtggcagc aggggaacgt cttctcatgc tccgtgatgc atgaggctct gcacaaccac 4140
tacacgcaga agagcctctc cctgtctccg ggtaaatgag aattagtcta ctcgcaaggg 4200
gcggccgcgt ttaaactgaa tgagcgcgtc catccagaca tgataagata cattgatgag 4260
tttggacaaa ccacaactag aatgcagtga aaaaaatgct ttatttgtga aatttgtgat 4320
gctattgctt tatttgtaac cattataagc tgcaataaac aagttaacaa caacaattgc 4380
attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag caagtaaaac 4440
ctctacaaat gtggtatggc tgattatgat ccggctgcct cgcgcgtttc ggtgatgacg 4500
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 4560
ccgggagcag acaagcecgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 4620
ccatgaccgg tcgacggcgc gccttttttt ttaattttta ttttatttta tttttgacgc 4680
gccgaaggcg cgatctgagc tcggtacagc ttggctgtgg aatgtgtgtc agttagggtg 4740
tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcatc tcaattagtc 4800
agcaaccagg tgtggaaagt ccccaggctc cccagcaggc agaagtatgc aaagcatgca 4860
tctcaattág tcagcaacca tagtcccgcc cctaactccg cccatcccgc ccctaactcc 4920
gcccagttcc gcccattctc cgccccatgg ctgactaatt ttttttattt atgcagaggc 4980
cgaggccgcc tcggcctctg agctattcca gaagtagtga ggaggctttt ttggaggcct 5040
aggcttttgc aaaaagctcc tcgaggaact gaaaaaccag aaagttaact ggtaagttta 5100
gtctttttgt cttttatttc aggtcccgga tccggtggtg gtgcaaatca aagaactgct 5160
cctcagtgga tgttgccttt acttctaggc ctgtacggaa gtgttacttc tgctctaaaa 5220
gctgcggaat tgtacccgcg gcctaatacg actcactata gggactagta tggttcgacc 5280
attgaactgc atcgtcgccg tgtcccaaaa tatggggatt ggcaagaacg gagacctacc 5340
ctggcctccg ctcaggaacg agttcaagta cttccaaaga atgaccacaa cctcttcagt 5400
ggaaggtaaa cagaatctgg tgattatggg taggaaaacc tggttctcca ttcctgagaa 5460
gaatcgacct ttaaaggaca gaattaatat agttctcagt agagaactca aagaaccacc 5520
acgaggagct cattttcttg ccaaaagttt agatgatgcc ttaagactta ttgaacaacc 5580
ggaattggca agtaaagtag acatggtttg gatagtcgga ggcagttctg tttaccagga 5640
agccatgaat caaccaggcc acctcagact ctttgtgaca aggatcatgc aggaatttga 5700aagtgacacg tttttcccag aaattgattt ggggaaatat aaacttctcc cagaataccc 5760
aggcgtcctc tctgaggtcc aggaggaaaa aggcatcaag tataagtttg aagtctacga 5820
gaagaaagac taagcggccg agcgcgcgga tctggaaacg ggagàtgggg gaggctaact 5880
gaagcacgga aggagacaat accggaagga acccgcgcta tgacggcaat aaaaagacag 5940
aataaaacgc acgggtgttg ggtcgtttgt tcataaacgc ggggttcggt cccagggctg 6000
gcactctgtc gataccccac cgagacccca ttggggccaa tacgcccgcg tttcttcctt 6060
ttccccaccc caccccccaa gttcgggtga aggcccaggg ctcgcagcca acgtcggggc 6120
ggcaggccct gccatagcca ctggccccgt gggttaggga cggggtcccc catggggaat 6180
ggtttatggt tcgtgggggt tattattttg ggcgttgcgt ggggtctgga gatcccccgg 6240gctgcaggaa ttccgttaca ttacttacgg taaatggccc gcctggctga ccgcccaacg 6300
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 6360
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 6420
tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 6480
attatgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc tacgtattag 6540tcatcgctat taccatggtg atgcggtttt ggcagtacat caatgggcgt ggatagcggt 6600
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 6660
accaaaatca acgggacttt ccaaaatgtc gtaacaactc cgccccattg acgcaaaagg 6720
gcgggaattc gagctcggta ctçgagcggt gttccgcggt cctcctcgta tagaaactcg 6780
gaccactctg agacgaaggc tcgcgtccag gccagcacga aggaggctaa gtgggagggg 6840
tagcggtcgt tgtccactag ggggtccact cgctccaggg tgtgaagaca catgtcgccc 6900
tcttcggcat caaggaaggt gattggttta taggtgtagg ccacgtgacc gggtgttcct 6960
gaaggggggc tataaaaggg ggtgggggcg cgttcgtcct cactctcttc cgcatcgctg 7020
tctgcgaggg ccagctgttg ggctcgcggt tgaggacaaa ctcttcgcgg tctttccagt 708a.
actcttggat cggaaacccg tcggcctccg aacggtactc cgccaccgag ggacctgagc 7140
gagtccgcat cgaccggatc ggaaaacctc tcgactgttg gggtgagtac tccctctcaa 7200
aagcgggcat gacttctgcg ctaagattgt cagtttccaa aaacgaggag gatttgatat 7260
tcacctggcc cgcggtgatg cctttgaggg tggccgcgtc catctggtca gaaaagacaa 7320
tctttttgtt gtcaagcttg aggtgtggca ggcttgagat ctggccatàc acttgagtga 7380
caatgacatc cactttgcct ttctctccac aggtgtccac tcccaggtcc aaccggaatt 7440
gtacccgcgg ccagagcttg cgggcgccac cgcggccgcg gggatccaga catgataaga 7500
tacattgatg agtttggaca aaccacaact agaatgcagt gaaaaaaatg ctttatttgt 7560
gaaatttgtg atgctattgc tttatttgta accattataa gctgcaataa acaagttaac 7620
aacaacaatt gcattcattt tatgtttcag gttcaggggg aggtgtggga ggttttttcg 7680
gatcctcttg gcgtaatcat ggtcatagct gtttcctgtg tgaaattgtt atccgctcac 7740aattccacac aacatacgag ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt 7800
gagctaactc acattaattg cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc 7860
gtgccagctg cattaatgaa tcggccaacg cgcggggaaa ggcggtttgc gtattgggcg 7920
ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt 7980
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 8040
gaacatgtga gcaaaaggcc agcaaaaggç caggaaccgt aaaaaggccg cgttgctggc 8100
gttcttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 8160
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 8220
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 8280
aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg 8340
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 8400
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 8460
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 8520
gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt 8580
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 8640
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 8700
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 8760
ggtcatgaga ttatcaaaaa ggatcttcac ctagatccct tttaattaaa aatgaagttt 8820
taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag 8880
tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt 8940
cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc 9000
gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc 9060
cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg 9120
ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac 9180
aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg 9240
atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc 9300
tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact 9360
gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtactc 9420
aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat 9480
acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg gaaaacgttc 9540
ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga tgtaacccac 9600
tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg ggtgagcaaa 9660
aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat gttgaatact 9720
catactcttc ctttttcaat attattgaag catttatcag ggttattgtc tcatgagcgg 9780atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca catttccccg 9840
aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct ataaaaatag 9900
gcgtatcacg aggccctttc gtctcgcgcg tttcggtgat gacggtgaaa acctctgaca 9960
catgcagctc ccggagacgg tcacagcttg tctgtaagcg gatgccggga gcagacaagc 10020
ccgtcagggc gcgtcagcgg gtgttggcgg gtgtcggggc tggcttaact atgcggcatc 10080
agagcagatt gtactgagag tgcaccatat gcggtgtgaa ataccgcaca gatgcgtaag 10140
gagaaaatac cgcatcaggc gccattcgcc attcaggctg cgcaactgtt gggaagggcg 10200
atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 10260
attaagttgg gtaacgccag ggttttccca gttacgacgt tgtaaaacga cggccagtga 10320
att 10323
<210> 32
<211> 2835
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, seqüência codificadora para poliproteína ABT-007
<220>
<221> CDS
<222> (1)..(2832)
<400> 32
atg gag ttt ggg ctg age tgg ctt ttt ctt gtc gcg att tta aaa ggtMet Glu Phe Gly Leu ser Trp Leu Phe Leu vai Ala Ile Leu Lys Gly15 10 15
48
gtc cag tgt cag gtg cag ctg cag gag tcg ggc cca gga ctg gtg aag 96
Val Gln Cys Gln Val Gln Leu Gln Glu Ser Gly Pro Gly Leu Val Lys20 25 30
cct tcg gag acc ctg tcc ctc acc tgc act gtc tet ggt gcc tcc ate 144
Pro ser Glu Thr Leu ser Leu Thr Cys thr vai Ser GTy Ala ser Ile35 40 45
agt agt tac tac tgg age tgg ate cgg cag ccc cca ggg aag gga ctg 192
Ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu
50 55 60
gag tgg att ggg tat ate ggg ggg gag ggg age àcc aac tac aac ccc 240Glu Trp Ile GTy Tyr Ile GTy GTy Glu GTy ser Thr Asn Tyr Asn Pro65 70 75 80
tcc ctc aag agt cga gtc acc ata tca gta gac acg tcc aag aac cag 288
Ser Leu Lys ser Arg Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln85 90 95
ttc tcc ctg aag ctg agg tet gtg acc gct gcg gac acg gcc gtg tat 336
Phe Ser Leu Lys Leu Arg Ser VaT Thr Ala Ala Asp Thr Ala Val Tyr100 105 110
tac tgt gcg aga gag cga ctg ggg ate ggg gac tac tgg ggc cag gga 384Tyr Cys Ala Arg Glu Arg Leu GTy Ile GTy Asp Tyr Trp Gly Gln Gly115 120 125
acc ctg gtc acc gtc tcc tca gcg tcg acc aag ggc cca tcg gtc ttc 432Thr Leu Val Thr Val Ser ser Ala ser Thr Lys-Gly Pro ser Val Phe130 135 140
ccc ctg gcg ccc tgc tct aga age acc tcc gag age aca gcg gcc ctg 480pro Leu Ala Pro Cys ser Arg ser Thr ser Glu ser Thr Ala Ala Leu145 150 155 160
ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg 528Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro vai Thr Val ser Trp165 170 175
aac tca ggc gct ctg acc age ggc gtg cac acc ttc cca gct gtc ctg 576Asn ser Gly Ala Leu Thr ser Gly vai His Thr Phe Pro Ala vai Leu180 185 190
cag tcc tca gga ctc tac tcc ctc age age gtg gtg acc gtg ccc tcc 624Gln Ser Ser Giy Leu Tyr ser Leu Ser Ser Val vai Thr VaT Pro Ser195 200 205
age aac ttc ggc acc cag acc tac aca tgc aac gta gat cac aag ccc 672Ser Asn Phe GTy Thr Gln Thr Tyr Thr Cys Asn vai Asp His Lys Pro210 215 220
age aac acc aag gtg gac aag aca gtt gag cgc aaa tgt tgt gtc gag 720ser Asn Thr Lys VaT Asp Lys Thr vai Glu Arg Lys Cys Cys vai Glu225 230 235 240
tgc cca ccg tgc cca gea cca cct gtg gea gga ccg tca gtc ttc ctc 768
cys Pro Pro Cys Pro Ala Pro Pro vaT Ala GTy Pro Ser vai Phe Leu245 250 255
ttc ccc cca aaa ccc aag gac acc ctc atg ate tcc cgg acc cct gag 816Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile ser Arg Thr Pro Glu260 265 270
gtc acg tgc gtg gtg gtg gac gtg age cac gaa gac ccc gag gtc cag 864
Val Thr Cys VaT VaT VaT Asp VaT Ser His Glu Asp Pro Glu Val Gln275 280 285
ttc aac tgg tac gtg gac gac gtg gag gtg cat aat gcc aag aca aag 912Phe Asn Trp Tyr VaT Asp GTy VaT Glu VaT His Asn Ala Lys Thr Lys290 295 300
cca cgg gag gag cag ttc aac age acg ttc cgt gtg gtc age gtc ctc 960
Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg VaT Val ser vai Leu305 310 315 320
acc gtt gtg cac cag gac tgg ctg aac ggc aag gag tac aag tgc aag 1008Thr Val VaT His Gln Asp Trp Leu Asn GTy Lys Glu Tyr Lys Cys Lys325 330 335
gtc tcc aac aaa ggc ctc cca gcc ccc ate gag aaa acc ate tcc aaa 1056vai ser Asn Lys GTy Leu Pro Ala Pro Ile Glu Lys Thr Ile ser Lys340 345 350
acc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc 1104Thr Lys GTy Gln Pro Arg Glu Pro Gln VaT Tyr Thr Leu Pro Pro Ser355 360 365
cgg gag gag atg acc aag aac cag gtc age ctg acc tgc ctg gtc aaa 1152Arg Glu Glu Met Thr Lys Asn Gln Val ser Leu Thr cys Leu Val Lys370 375 380
ggc ttc tac ccc age gac ate gcc gtg gag tgg gag age aãt ggg cag 1200GTy Phe Tyr Pro Ser Asp Ile Ala VaT Glu Trp Glu ser Asn GTy Gln385 390 395 400
ccg gag aac aac tac aag acc aca cct ccc atg ctg gac tcc gac ggc 1248Pro Glu Asn Asn TVr Lys Thr Thr Pro Pro Met Leu Asp ser Asp Gly405 410 415
tcc ttc ttc ctc tac age aag ctc acc gtg gac aag age agg tgg cag 1296ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln420 425 4B0
cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac 1344Gln Gly Asn Val Phe ser Cys Ser VaT Met His Glu Ala Leu His Asn435 440 445
cac tac acg cag aag age ctc tcc ctg tet agg ggt aaa cgc gaa cca 1392His Tyr Thr Gln Lys ser Leu ser Leu ser Arg Gly Lys Arg Glu Pro450 455 460
gtt tat ttc cag ggg age ttg ttt aag ggg ccg cgt gat tat aac cca 1440Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro465 470 475 480
ata tcg agt gcc att tgt cat cta acg aat gaa tet gat ggg cac aca 1488Ile Ser ser Ala Ile Cys His Leu Thr Asn Glu ser Asp Giy His Thr485 490 495
aca tcg ttg tat ggt att ggt ttt ggc cct ttc ate ate aca aac aag 1536Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys500 505 510
cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat 1584His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His515 520 525
ggt gtg ttc aag gta aag aat acc aca act ttg caa caa cac ctc att 1632Giy Val Phe Lys vai Lys Asn Thr Thr Thr Leu Gln Gln His, Leu lie530 535 540
gat ggg agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca 1680Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro545 550 555 560
ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata 1728Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile565 570 575
tgt ctt gtg aca acc aac ttc caa act aag age atg tet age atg gtt 1776Cys Leu vai Thr Thr Asn Phe Gln Thr Lys Ser Met ser ser Met Val580 585 590
tca gat act agt tgc aca ttc cct tca tet gat ggt ata ttc tgg aaa 1824Ser Asp Thr Ser cys Thr Phe Pro ser ser Asp Gly Ile Phe Trp Lys595 600 605
cat tgg att cag acc aag gat ggg cac tgt ggt age ccg ttg gtg tca 1872His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser610 615 620
act aga gat ggg ttt att gtt ggt ata cac tca gea tca aat ttc acc 1920Thr Arg Asp Gly Phe Ile vai Gly Ile His ser Ala ser Asn Phe Thr625 630 635 640
aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta 1968Asn Thr Asn Asn Tyr Phe Thr Ser vai Pro Lys Asp Phe Met Asp Leu645 650 655
ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat 2016Leu Thr Asn Gln Glu Ala Gln Gln Trp vai Ser Gly Trp Arg Leu Asn660 665 670
gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg age aaa cct 2064Ala Asp ser vai Leu Trp Gly Giy Hls Lys vai Pne Met Ser Lys Pro675 680 685
gaa gaa ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa 2112Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met Ser Glu690 695 700
tta gtc tac tcg caa ggg atg cgc gtg ccc gcc cag ctg ctg ggc ctg 2160Leu Val Tyr Ser Gln Gly Met Arig Val Pro Ala Gln Leu Leu Gly Leu705 710 715 720
ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac ate cag ctg acc caa 2208Leu Leu Leu Trp Phe Pro Gly ser Arg Cys Asp lie Gln Leu Thr Gln725 730 735
tet cca tcc tcc ctg tet gca tet gta gga gac aga gtc acc ate act 2256Ser Pro ser ser Leu ser Ala ser vai Gly Asp Arg Val Thr Ile Thr740 745 750
tgc cgg gca agt cag ggc att aga aat gat tta ggc tgg tat cag cag 2304Cys Arg Ala ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln755 760 765
aaa cca ggg aaa gcc cct aag cgc ctg ate tat gct gca tcc agt ttg 2352Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala ser ser Leu770 775 780
caa agt ggg gtc cca tca agg ttc age ggc agt gga tet ggg aca gaa 2400Gln Ser Gly Val Pro Ser Arg Phe ser Gly Ser Gly Ser Gly Thr Glu785 790 795 800
ttc act ctc aca ate age age ctg cag cct gaa gat ttt gca act tat 2448Phe Thr Leu Thr Ile Ser ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr805 810 815
tac tgt cta cag cat aat act tac cct ccg acg ttc ggc caa ggg acc 2496TVr Cys Leu Gln His Asn Thr'Tyr Pro Pro Thr Phe Gly Gln Gly Thr820 825 830
aag gtg gaa ate aaa cgt acg gtg gct gca cca tet gtc ttc ate ttc 2544Lys vai Glu Ile Lys Arg Thr vai Ala Ala Pro Ser Val Phe Ile Phe835 840 845
ccg cca tet gat gag cag ttg aaa tet gga act gcc tet gtt gta tgc 2592Pro Pro ser Asp Glu Gln Leu Lys Ser Gly Thr Ala ser vai VaT cys850 855 860
ctg ctg aat aac ttc tat ccc aga gag gcc aaa gta cag tgg aag gtg 2640Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys VaT865 870 875 880
gat aac gcc ctc caa tcg ggt aac tcc cag gag agt gtc aca gag cag 2688Asp Asn Ala Leu Gln ser GTy Asn ser Gln Glu Ser Val Thr Glu Gln885 890 895
gac age aag gac age acc tac age ctc age age acc ctg acg ctg age 2736Asp Ser Lys Asp ser Thr Tyr ser Leu ser ser Thr Leu Thr Leu Ser900 905 910
aaa gca gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat 2784Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu vai Thr His915 920 925
cag ggc ctg age tcg ccc gtc aca aag age ttc aac agg gga gag tgt 2832Gln GTy Leu ser ser Pro Val Thr Lys ser Phe Asn Arg GTy Glu Cys930 935 940
tga 2835<210> 33
<211> 944
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético<400> 33
Met Glu Phe Gly Leu ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly1 5 10 15
vai Gln Cys Gln Val Gln Leu Gln Glu ser Gly Pro Gly Leu Val Lys20 25 30
Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Ala Ser Ile35 40 45
ser Ser Tyr Tyr Trp Ser Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu50 55 60
Glu Trp Ile Gly Tyr Ile Gly Gly Glu Gly Ser Thr Asn Tyr Asn Pro65 70 75 80
ser Leu Lys ser Arg vai Thr Ile Ser Val Asp Thr Ser Lys Asn Gln85 90 95
Phe ser Leu Lys Leu Arg ser vai Thr Ala Ala Asp Thr Ala Val Tyr100 105 110
Tyr Cys Ala Arg Glu Arg Leu Gly Ile Gly Asp Tyr Trp Gly Gln Gly115 120 125
Thr Leu Val Thr Val Ser ser Ala ser Thr Lys Gly pro ser vai Phe130 135 140
Pro Leu Ala Pro cys Ser Arg ser Thr Ser Glu Ser Thr Ala Ala Leu145 150 155 160
Gly cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val ser Trp165 170 175
Asn ser Gly Ala Leu Thr ser Gly vai His Thr Phe Pro Ala Val Leu180 185 190
Gln ser ser Gly Leu Tyr Ser Leu Ser ser vai Val Thr Val Pro ser195 200 205
ser Asn Phe Gly Thr Gln Thr Tyr Thr Cys Asn Val Asp His Lys Pro210 215 220ser Asn Thr Lys Val Asp Lys Thr Val Glu Arg Lys Cys Cys vai Glu225 230 235 240
Cys Pro Pro cys Pro Ala Pro Pro Val Ala Gly Pro Ser vai Phe Leu245 250 255
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile ser Arg Thr Pro Glu260 265 270
vai Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Gln275 280 285
Phe Asn Trp Tyr Val Asp Gly vai Glu Val His Asn Ala Lys Thr Lys290 295 300
Pro Arg Glu Glu Gln Phe Asn Ser Thr Phe Arg vai Val Ser Val Leu305 310 315 320
Thr Val Val His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys325 330 335
Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile ser Lys340 345 350
Thr Lys Gly Gln Pro Arg Glu Pro Gln vai Tyr Thr Leu Pro Pro Ser355 360 365
Arg Glu Glu Met Thr Lys Asn Gln vai Ser Leu Thr Cys Leu vai Lys370 375 380
Gly Phe Tyr Pro ser Asp Ile Ala vai Glu Trp Glu Ser Asn Gly Gln385 390 395 400
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Met Leu Asp ser Asp Gly405 410 415
ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln420 425 430
Gln Gly Asn Val Phe ser Cys ser Val Met His Glu Ala Leu His Asn435 440 445
His Tyr Thr Gln Lys Ser Leu ser Leu Ser Arg Gly Lys Arg Glu Pro450 455 460
Val Tyr Phe Gln Gly Ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro465 470 475 480
Ile Ser ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp Gly His Thr485 490 495Thr ser Leu Tyr Gly lie Gly phe Gly Pro Phe Ile Ile Thr Asn Lys500 505 510
His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu vai Gln ser Leu His515 520 525
Gly vai Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile530 535 540
Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro545 550 555 560
Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile565 570 575
Cys Leu vai Thr Thr Asn Phe Gln Thr Lys ser Met ser ser Met Val580 585 590
ser Asp Thr Ser Cys Thr Phe Pro ser Ser Asp Gly Ile Phe Trp Lys595 600 605
His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser610 615 620
Thr Arg Asp Gly Phe Ile Val Gly Ile His ser Ala Ser Asn Phe Thr625 630 635 640
Asn Thr Asn Asn Tyr Phe Thr ser vai Pro Lys Asp Phe Met Asp Leu645 650 655
Leu Thr Asn Gln Glu Ala Gln Gln Trp Val ser Gly Trp Arg Leu Asn660 665 670
Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro675 680 685
Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met ser Glu690 695 700
Leu Val Tyr ser Gln Gly Met Arg Val Pro Ala Gln Leu Leu Gly Leu705 710 715 720
Leu Leu Leu Trp Phe Pro Gly ser Arg cys Asp Ile Gln Leu Thr Gln725 730 735
Ser Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr740 745 750
Cys Arg Ala Ser Gln Gly Ile Arg Asn Asp Leu Gly Trp Tyr Gln Gln755 760 765Lys Pro Gly Lys Ala Pro Lys Arg Leu Ile Tyr Ala Ala Ser Ser Leu770 775 780
Gln ser Gly Val Pro ser Arg Phe ser Gly ser Gly ser Gly Thr Glu785 790 795 800
Phe Thr Leu Thr Ile ser ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr805 810 815
Tyr cys Leu Gln His Asn Thr Tyr pro Pro Thr Phe Gly Gln Gly Thr820 825 830
Lys Val Glu Ile Lys Arg Thr vai Ala Ala Pro ser vai Phe Ile Phe835 840 845
Pro Pro Ser Asp Glu Gln Leu Lys ser Gly Thr Ala Ser Val Val Cys850 855 860
Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val865 870 875 880
Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln885 890 895
Asp Ser Lys Asp Ser Thr Tyr Ser Leu ser ser Thr Leu Thr Leu Ser900. 905 910
Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His915 920 925
Gln Gly Leu Ser ser Pro vai Thr Lys Ser Phe Asn Arg Gly Glu Cys930 935 940
<210> 34
<211> 10212
<212> DNA
<213> Artificial
<220>
<22 3> Constructo sintético, vetor de expressão de poliproteína ABT-007.<400> 34
gaagttccta ttcçgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag 1320
ctgcaggagt cgggcccagg actggtgaag ccttcggaga ccctgtccct cacctgcact 1380
gtctctggtg cctccatcag tagttactac tggagctgga tccggcagcc cccagggaag 1440
ggactggagt ggattgggta tatcgggggg gaggggagca ccaactacaa cccctccctc 1500
aagagtcgag tcaccatatc agtagacacg tccaagaacc agttctccct gaagctgagg 1560
tctgtgaccg ctgcggacac ggccgtgtat tactgtgcga gagagcgact ggggatcggg 1620
gactactggg gccagggãac cctggtcacc gtctcctcag cgtcgaccaa gggcccatcg 1680
gtcttccccc tggcgccctg ctctagaagc acctccgaga gcacagcggc cctgggctgc 1740
ctggtcaagg actacttccc cgaaccggtg acggtgtcgt ggaactcagg cgctctgacc 1800
agcggcgtgc acaccttccc agctgtcctg cagtcctcag gactctactc cctcagcagc 1860
gtggtgaccg tgccctccag caacttcggc acccagacct acacatgcaa cgtagatcac 1920
aagcccagca acaccaaggt ggacaagaca gttgagcgca aatgttgtgt cgagtgccca 1980
ccgtgcccag caccacctgt ggcaggaccg tcagtcttcc tcttcccccc aaaacccaag 2040
gacaccctca tgatctcccg gacccctgag gtcacgtgcg tggtggtgga cgtgagccac 2100
gaagaccccg aggtccagtt caactggtac gtggacggcg tggaggtgca taatgccaag 2160
acaaagccac gggaggagca gttcaacagc acgttccgtg tggtcagcgt cctcaccgtt 2220
gtgcaccagg actggctgaa cggcaaggag tacaagtgca aggtctccaa caaaggcctc 2280
ccagccccca tcgagaaaac catctccaaa accaaagggc agccccgaga accacaggtg 2340
tacaccctgc ccccatcccg ggaggagatg accaagaacc aggtcagcct gacctgcctg 2400
gtcaaaggct tctaccccag cgacatcgcc gtggagtggg agagcaatgg gcagccggag 2460
aacàactaca agaccacacc tcccatgctg gactccgacg gctccttctt cctctacagc 2520aagctcaccg tggacaagag caggtggcag caggggaacg tcttctcatg ctccgtgatg 2580
catgaggctc tgcacaacca ctacacgcag aagagcctct ccctgtctag gggtaaacgc 2640
gaaccagttt atttccaggg gagcttgttt aaggggccgc gtgattataa cccaatatcg 2700
agtgccattt gtcatctaac gaatgaatct gatgggcaca caacatcgtt gtatggtatt 2760
ggttttggcc ctttcatcat cacaaacaag catttgttta gaagaaataa tggtacactg 2820
ttagttcaat cactacatgg tgtgttcaag gtaaagaata ccacaacttt gcaacaacac 2880
ctcattgatg ggagggacat gatgctcatt cgcatgccta aggatttccc accatttcct 2940
caaaagctga aattcagaga gccacaaagg gaagagcgca tatgtcttgt gacaaccaac 3000
ttccaaacta agagcatgtc tagcatggtt tcagatacta gttgcacatt cccttcatct 3060
gatggtatat tctggaaaca ttggattcag accaaggatg ggcactgtgg tagcccgttg 3120
gtgtcaacta gagatgggtt tattgttggt atacactcag catcaaattt caccaacaca 3180
aacaattatt ttacaagtgt gccgaaagac ttcatggatt tattgacaaa tcaagaggcg 3240
cagcaatggg ttagtggttg gcgattgaat gctgactcag tgttatgggg aggccacaaa 3300
gttttcatga gcaaacctga agaacccttt cagccagtca aagaagcaac tcaactcatg 3360
agtgaattag tctactcgca agggatgcgc gtgcccgccc agctgctggg cctgctgctg 3420
ctgtggttcc ccggctcgcg atgcgacatc cagctgaccc aatctccatc ctccctgtct 3480
gcatctgtag gagacagagt caccatcact tgccgggcaa gtcagggcat tagaaatgat 3540
ttaggctggt atcagcagaa accagggaaa gcccctaagc gcctgatcta tgctgcatcc 3600
agtttgcaaa gtggggtccc atcaaggttc agcggcagtg gatctgggac agaattcact 3660
ctcacaatca gcagcctgca gcctgaagat tttgcaactt attactgtct acagcataat 3720
acttaccctc cgacgttcgg ccaagggacc aaggtggaaa tcaaacgtac ggtggctgca 3780
ccatctgtct tcatcttccc gccatctgat gagcagttga aatctggaac tgcctctgtt 3840
gtgtgcctgc tgaataactt ctatcccaga gaggccaaag tacagtggaa ggtggataac 3900
gccctccaat cgggtaactc ccaggagagt gtcacagagc aggacagcaa ggacagcacc 3960
tacagcctca gcagcaccct gacgctgagc aaagcagact acgagaaaca caaagtctac 4020
gcctgcgaag tcacccatca gggcctgagc tcgcccgtca caaagagctt caacagggga 4080
gagtgttgag cggccgcgtt taaactgaat gagcgcgtcc atccagacat gataagatac 4140
attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 4200
atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 4260
aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc 4320
aagtaaaacc tctacaaatg tggtatggct gattatgatc cggctgcctc gcgcgtttcg 4380
gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt 4440
aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc 4500
ggggcgcagc catgaccggt cgacggcgcg cctttttttt taatttttat tttattttat 4560ttttgacgcg ccgaaggcgc gatctgagct cggtacagct tggctgtgga atgtgtgtca 4620
gttagggtgt ggaaagtccc caggctcccc agcaggcaga agtatgcaaa gcatgcatct 4680
caattagtca gcaaccaggt gtggaaagtc cccaggctcc ccagcaggca gaagtatgca 4740
aagcatgcat ctcaattagt cagcaaccat agtcccgccc ctaactccgc ccatcccgcc 4800
cctaactccg cccagttccg cccattctcc gccccatggc tgactaattt tttttattta 4860
tgcagaggcc gaggccgcct cggcctctga gctattccag aagtagtgag gaggcttttt 4920
tggaggccta ggcttttgca aaaagctcct cgaggaactg aaaaaccaga aagttaactg 4980
gtaagtttag tctttttgtc ttttatttca ggtcccggat ccggtggtgg tgcaaatcaa 5040
agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag tgttacttct 5100
gctctaaaag ctgcggaatt gtacccgcgg cctaatacga ctcactatag ggactagtat 5160
ggttcgacca ttgaactgca tcgtcgccgt gtcccaaaat atggggattg gcaagaacgg 5220
agacctaccc tggcctccgc tcaggaacga gttcaagtac ttccaaagaa tgaccacaac 5280
ctcttcagtg gaaggtaaac agaatctggt gattatgggt aggaaaacct ggttctccat 5340
tcctgagaag aatcgacctt taaaggacag aattaatata gttctcagta gagaactcaa 5400
agaaccacca cgaggagctc attttcttgc caaaagttta gatgatgcct taagacttat 5460
tgaacaaccg gaattggcaa gtaaagtaga catggtttgg atagtcggag gcagttctgt 5520
ttaccaggaa gccatgaatc aaccaggcca cctcagactc tttgtgacaa ggatcatgca 5580
ggaatttgaa agtgacacgt ttttcccaga aattgatttg gggaaatata aacttctccc 5640
agaataccca ggcgtcctct ctgaggtcca ggaggaaaaa ggcatcaagt ataagtttga 5700
agtctacgag aagaaagact aagcggccga gcgcgcggat ctggaaacgg gagatggggg 5760
aggctaactg aagcacggaa ggagacaata ccggaaggaa cccgcgctat gacggcaata 5820
aaaagacaga ataaaacgca cgggtgttgg gtcgtttgtt cataaacgcg gggttcggtc 5880
ccagggctgg cactctgtcg ataccccacc gagaccccat tggggccaat acgcccgcgt 5940
ttcttccttt tccccacccc accccccaag ttcgggtgaa ggcccagggc tcgcagccaa 6000
cgtcggggcg gcaggccctg ccatagccac tggccccgtg ggttagggac ggggtccccc 6060
atggggaatg gtttatggtt cgtgggggtt attattttgg gcgttgcgtg gggtctggag 6120
atcccccggg ctgcaggaat tccgttacat tacttacggt aaatggcccg cctggctgac 6180
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 6240
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 6300
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 6360
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 6420
acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc aatgggcgtg 6480
gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc aatgggagtt 6540
tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc gccccattga 6600cgcaaaaggg cgggaattcg agctcggtac tcgagcggtg ttccgcggtc ctcctcgtat 6660
agaaactcgg accactctga gacgaaggct cgcgtccagg ccagcacgaa ggaggctaag 6720
tgggaggggt agcggtcgtt gtccactagg gggtccactc gctccagggt gtgaagacac 6780
atgtcgccct cttcggcatc aaggaaggtg attggtttat aggtgtaggc cacgtgaccg 6840
ggtgttcctg aaggggggct ataaaagggg gtgggggcgc gttcgtcctc actctcttcc 6900
gcatcgctgt ctgcgagggc cagctgttgg gctcgcggtt gaggacaaac tcttcgcggt 6960
ctttccagta ctcttggatc ggaaacccgt cggcctccga acggtactcc gccaccgagg 7020
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgactgttgg ggtgagtact 7080
ccctctcaaa agcgggcatg acttctgcgc taagattgtc agtttccaaa aacgaggagg 7140
atttgatatt cacctggccc gcggtgatgc ctttgagggt ggccgcgtcc atctggtcag 7200
aaaagacaat ctttttgttg tcaagcttga ggtgtggcag gcttgagatc tggccataca 7260
cttgagtgac aatgacatcc actttgcctt tctctccaca ggtgtccact cccaggtcca 7320
accggaattg tacccgcggc cagagcttgc gggcgccacc gcggccgcgg ggatccagac 7380
atgataagat acattgatga gtttggacaa accacaacta gaatgcagtg aaaaaaatgc 7440
tttatttgtg aaatttgtga tgctattgct ttatttgtaa ccattataag ctgcaataaa 7500
caagttaaca acaacaattg cattcatttt atgtttcagg ttcaggggga ggtgtgggag 7560
gttttttcgg atcctcttgg cgtaatcatg gtcatàgctg tttcctgtgt gaaattgtta 7620
tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 7680
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 7740
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggaaag gcggtttgcg 7800
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 7860
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 7920
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 7980
gttgctggcg ttcttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 8040
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 8100
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 8160
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 8220
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 8280
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 8340
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 8400
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 8460
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 8520
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 8580
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 8640agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccctt ttaattaaaa 8700
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 8760
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 88·20
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 8880
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 8940
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 9000
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 9060
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 9120
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 9180
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 9240
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 9300
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 9360
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 9420
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 9480
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 9540
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 9600
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 9660
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 9720
atttccccga aaagtgccac ctgacgtcta agaaaccatt attatcatga cattaaccta 9780
taaaaatagg cgtatcacga ggccctttcg tctcgcgcgt ttcggtgatg acggtgaaaa 9840
cctctgacac atgcagctcc cggagacggt cacagcttgt ctgtaagcgg atgccgggag 9900
cagacaagcc cgtcagggcg cgtcagcggg tgttggcggg tgtcggggct ggcttaacta 9960
tgcggcatca gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag 10020
atgcgtaagg agaaaatacc gcatcaggcg ccattcgcca ttcaggctgc gcaactgttg 10080
ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 1Ô140
tgcaaggcga ttaagttggg taacgccagg gttttcccag ttacgacgtt gtaaaacgac 10200
ggccagtgaa tt 10212
<210> 35<211> 2853<212> DNA<213> Artificial
<220>
<223> Constructo sintético, seqüência de codificação de poliproteína ABT-874 (j695) TEV.
<220><221>
CDS<222> (1)..(2850)<400> 35
atg gag ttt ggg ctg age tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu ser Trp Leu Phe Leu vai Ala Ile Leu Lys Gly1 5 10 15
gtc cag tgt cag gtg cag ctg gtg gag tct ggg gga ggc gtg gtc cag 96
Val Gln Cys Gln VaT Gln Leu Val Glu ser Gly Gly Gly VaT Val Gln20 25 30
cct ggg agg tcc ctg aga ctc tcc tgt gea gcg tct gga ttc acc ttc 144Pro Giy Arg ser Leu Arg Leu ser cys Ala Ala ser Gly phe Thr Phe35 40 45
agt age tat ggc atg cac tgg gtc cgc cag gct cca ggc aag ggg ctgser ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu50 55 60
tca ggc gcc ctg acc age ggc gtg cac acc ttc ccg gct gtc cta cagser Gly Ala Leu Thr ser Gly vai His Thr Phe Pro Ala VaT Leu Gln180 185 190
192
gag tgg gtg gea ttt ata cgg tat gat gga agt aat aaa tac tat gea 240Glu Trp VaT Ala Phe Ile Arg Tyr Asp GTy Ser Asn Lys Tyr Tyr Ala65 70 75 80
gac tcc gtg aag ggc cga ttc acc ate tcc aga gac aat tcc aag aac 288
Asp ser VaT Lys GTy Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn85 90 95
acg ctg tat ctg cag atg aac age ctg aga gct gag gac acg gct gtg 336
Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala VaT100 105 110
tat tac tgt aag acc cat ggt age cat gac aac tgg ggc caa ggg aca 384Tyr Tyr Cys Lys Thr His GTy ser His Asp Asn Trp GTy Gln GTy Thr115 120 125
atg gtc acc gtc tct tca gcg tcg acc aag ggc cca tcg gtc ttc ccc 432Met vai Thr Val Ser ser Ala ser Thr Lys GTy Pro ser vai Phe Pro130 135 140
ctg gea ccc tcc tcc aag age acc tct ggg ggc aca gcg gcc ctg ggc 480Leu Ala Pro Ser ser Lys ser Thr ser GTy GTy Thr Ala Ala Leu GTy145 150 155 160
tgc ctg gtc aag gac tac ttc ccc gaa ccg gtg acg gtg tcg tgg aac 528cys Leu Val Lys Asp Tyr Phe Pro Glu Pro VaT Thr VaT Ser Trp Asn165 170 175
576
tcc tca gga ctc tac tcc ctc age age gtg gtg acc gtg ccc tcc age 624ser ser GTy Leu Tyr ser Leu ser ser VaT VaT Thr VaT Pro Ser ser195 200 205
age ttg ggc acc cag acc tac ate tgc aac gtg aat cac aag ccc age 672ser Leu GTy Thr Gln Thr Tyr Ile cys Asn VaT Asn His Lys Pro Ser210 215 220
aac acc aag gtg gac aag aaa gtt gag ccc aaa tct tgt gac aaa act 720Asn Thr Lys VaT Asp Lys Lys vai Glu Pro Lys ser cys Asp Lys Thr225 230 235 240
cac aca tgc cca ccg tgc cca gea cct gaa ctc ctg ggg gga ccg tca 768His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser245 250 255
gtc ttc ctc ttc ccc cca aaa ccc aag gac aec ctc atg ate tcc cgg 816Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile ser Arg260 265 270
acc cct gag gtc aca tgc gtg gtg gtg gac gtg age cac gaa gac cct 864Thr Pro Glu Val Thr Cys VaT Val VaT Asp VaT ser His Glu Asp Pro275 280 285
gag gtc aag ttc aac tgg tac gtg gac ggc gtg gag gtg cat aat gcc 912Glu vai Lys Phe Asn Trp Tyr VaT Asp GTy VaT Glu VaT His Asn Ala290 295 300
aag aca aag ccg cgg gag gag cag tac aac age acg tac cgt gtg gtc 960Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg VaT vai305 310 315 320
age gtc ctc acc gtc ctg cac cag gac tgg ctg aat ggc aag gag tac 1008ser vai Leu Thr Val Leu His Gln Asp Trp Leu Asn GTy Lys Glu Tyr325 330 335
aag tgc aag gtc tcc aac aaa gcc ctc cca gcc ccc ate gag aaa acc 1056Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr340 345 350
ate tcc aaa gcc aaa ggg cag ccc cga gaa cca cag gtg tac acc ctg 1104Ile Ser Lys Ala Lys GTy Gln Pro Arg Glu Pro Gln VaT Tyr Thr Leu355 360 365
ccc cca tcc cgc gag gag atg acc aag aac cag gtc age ctg acc tgc 1152Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys370 375 380
ctg gtc aaa ggc ttc tat ccc age gac ate gcc gtg gag tgg gag age 1200Leu vai Lys GTy Phe Tyr Pro Ser Asp Ile Ala VaT Glu Trp Glu ser385 390 395 400
aat ggg cag ccg gag aac aac tac aag acc acg cct ccc gtg ctg gac 1248Asn GTy Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro VaT Leu Asp405 410 415
tcc gac ggc tcc ttc ttc ctc tac age aag ctc acc gtg gac aag age 1296ser Asp GTy Ser Phe Phe Leu Tyr Ser Lys Leu Thr VaT Asp Lys Ser420 425 430
agg tgg cag cag ggg aac gtc ttc tca tgc tcc gtg atg cat gag gct 1344Arg Trp Gln Gln GTy Asn Val Phe ser Cys Ser VaT Met His Glu Ala435 440 445
ctg cac aac cac tac acg cag aag age ctc tcc ctg tet agg ggt aaa 1392Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Arg GTy Lys450 455 460
cgc gaa cca gtt tat ttc cag ggg age ttg ttt aag ggg ccg cgt gat 1440Arg Glu Pro Val Tyr Phe Gln GTy Ser Leu Phe Lys GTy Pro Arg Asp465 470 475 480
tat aac cca ata tcg agt gcc att tgt cat cta acg aat gaa tet gat 1488Tyr Asn Pro Ile Ser Ser Ala Ile Cys His Leu Thr Asn Glu Ser Asp485 490 495
ggg cac aca aca tcg ttg tat ggt att ggt ttt ggc cct ttc ate ate 1536GTy His Thr Thr ser Leu Tyr GTy Ile Gly Phe Gly Pro Phe Ile Ile500 505 510
aca aac aag cat ttg ttt aga aga aat aat ggt aca ctg tta gtt caa 1584Thr Asn Lys His Leu Phe Arg Arg Asn Asn GTy Thr Leu Leu vai Gln515 520 525
tca cta cat ggt gtg ttc aag gta aag aat acc aca act ttg caa caa 1632ser Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln530 535 540
cac ctc att gat ggg agg gac atg atg ctc att cgc atg cct aag gat 1680His Leu lie Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp545 550 555 560
ttc cca cca ttt cct caa aag ctg aaa ttc aga gag cca caa agg gaa 1728Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu565 570 575
gag cgc ata tgt ctt gtg aca acc aac ttc caa act aag age atg tet 1776Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser580 585 590
age atg gtt tca gat act agt tgc aca ttc cct tca tet gat ggt ata 1824ser Met Val ser Asp Thr Ser Cys Thr Phe Pro ser ser Asp Gly Ile595 600 605
ttc tgg aaa cat tgg att cag acc aag gat ggg cac tgt ggt age ccg 1872Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro610 615 620
ttg gtg tca act aga gat ggg ttt att gtt ggt ata cac tca gea tca 1920Leu VaT ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser625 630 635 640
aat ttc acc aac aca aac aat tat ttt aca agt gtg ccg aaa gac ttc 1968Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr ser Val Pro Lys Asp Phe645 650 655
atg gat tta ttg aca aat caa gag gcg cag caa tgg gtt agt ggt tgg 2016Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Giy Trp660 665 670
cga ttg aat gct gac tca gtg tta tgg gga ggc cac aaa gtt ttc atg 2064Arg Leu Asn Ala Asp Ser vai Leu Trp GTy GTy His Lys Val Phe Met675 680 685
age aaa cct gaa gaa ccc ttt cag cca gtc aaa gaa gea act caa ctc 2112Ser Lys Pro Glu Glu Pro Phe Gln Pro VaT Lys Glu Ala Thr Gln Leu690 695 700
atg agt gaa tta gtc tac tcg caa ggg atg act tgg acc cca ctc ctc 2160Met Ser Glu Leu vai Tyr Ser Gln GTy Met Thr Trp Thr Pro Leu Leu705 710 715 720
ttc ctc acc ctc ctc ctc cac tgc aca gga age tta tcc cag tet gtg 2208Phe Leu Thr Leu Leu Leu His Cys Thr GTy Ser Leu Ser Gln Ser VaT725 730 735
ctg act cag ccc ccc tca gtg tet ggg gcc ccc ggg cag aga gtc acc 2256Leu Thr Gln Pro Pro Ser VaT Ser GTy Ala Pro GTy Gln Arg Val Thr740 745 750
ate tet tgt tet gga age aga tcc aac ate ggc agt aat act gta aag 2304lie Ser cys ser GTy Ser Arg ser Asn Ile GTy ser Asn Thr vai Lys755 760 765
tgg tat cag cag ctc cca gga acg gcc ccc aaa ctc ctc ate tat tac 2352Trp Tyr Gln Gln Leu Pro GTy Thr Ala Pro Lys Leu Leu Ile Tyr Tyr770 775 780
aat gat cag cgg ccc tca ggg gtc cct gac cga ttc tet gga tcc aag 2400Asn Asp Gln Arg Pro Ser GTy Val Pro Asp Arg Phe Ser GTy Ser Lys785 790 795 800
tet ggc acc tca gcc tcc ctc gcc ate act ggg ctc cag gct gaa gac 2448Ser Gly Thr ser Ala ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asd805 810 815
gag gct gac tat tac tgc cag tca tat gac aga tac acc cac ccc gcc 2496Glu Ala Asp Tyr Tyr cys Gln ser Tyr Asp Arg Tyr Thr His Pro Ala820 825 830
ctg ctc ttc gga act ggg acc aag gtc aca gta cta ggt cag ccc aag 2544Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys835 840 845
gçt gçc ccc tcg gtc act ctg ttc ccg ccc tcc tct gag gag ctt caa 2592Ala Ala Pro Ser vai Thr Leu Phe Pro Pro ser ser Glu Glu Leu Gln850 855 860
gçc aac aag gcc aca ctg gtg tgt ctc ata agt gac ttc tac ccg ggaAla Asn Lys Ala Thr Leu VaT Cys Leu Ile ser Asp Phe Tyr Pro Gly865 870 875 880
2640
gçc gtg aca gtg gcc tgg aag gca gat age age ccc gtc aag gcg gga 2688Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro Val Lys Ala GTy885 890 895
gtg gag acc acc aca ccc tcc aaa caa age aac aac aag tac gcg gcc 2736vaT Glu Thr Thr Thr Pro Ser Lys Gln ser Asn Asn Lys Tyr Ala Ala900 905 910
age age tac ctg age ctg acg cct gag cag tgg aag tcc cac aga age 2784Ser Ser Tyr Leu ser Leu Thr Pro Glu Gln Trp Lys Ser His Arg Ser915 920 925
tac age tgc cag gtç acg cat gaa ggg age acc gtg gag aag aca gtg 2832Tyr ser Cys Gln Val Thr His Glu GTy ser Thr VaT Glu Lys Thr VaT930 935 940
gcc cct aca gaa tgt tca tga 2853
Ala Pro Thr Glu Cys ser945 950
<210> 36
<211> 950
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético<400> 36
Met Glu Phe Gly Leu ser Trp Leu Phe Leu vai Ala Ile Leu Lys Gly1 5 10 15
Val Gln Cys Gln vai Gln Leu Val Glu Ser Gly Gly Gly Val Val Gln20 25 30
Pro Gly Arg ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe35 40 45
Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu50 55 60
Glu Trp Val Ala Phe Ile Arg Tyr Asp Gly ser Asn Lys Tyr Tyr Ala65 70 75 80Asp Ser vai Lys Gly Arg Phe Thr Ile ser Arg Asp Asn ser Lys Asn85 90 95
Thr Leu Tyr Leu Gln Met Asn ser Leu Arg Ala Glu Asp Thr Ala Val100 105 110
Tyr Tyr Cys Lys Thr His Gly Ser His Asp Asn Trp Gly Gln Gly Thr115 120 125
Met Val Thr Val ser ser Ala ser Thr Lys Gly Pro ser Val Phe Pro130 135 140
Leu Ala Pro ser Ser Lys ser Thr Ser Gly Gly Thr Ala Ala Leu Gly145 150 155 160
Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro vai Thr vai ser Trp Asn165 170 175
ser Gly Ala Leu Thr ser Gly Val His Thr Phe Pro Ala Val Leu Gln180 185 190
Ser Ser Gly Leu Tyr Ser Leu ser ser vai Val Thr vai Pro Ser Ser195 200 205
ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser210 215 220
Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys ser Cys Asp Lys Thr225 230 235 240
His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser245 250 255
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg260 265 270
Thr Pro Glu Val Thr Cys vai Val Val Asp vai Ser His Glu Asp Pro275 280 285
Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala290 295 300
Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn ser Thr Tyr Arg Val Val305 310 315 320
ser vai Leu Thr vai Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr325 330 335
Lvs Cys Lys vai ser Asn Lys Ala Leu Prp Ala Pro lie Glu Lys Thr340 345 350Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu355 360 365
Pro Pro ser Arg Glu Glu Met Thr Lys Asn Gln vai ser Leu Thr Cys
370
375
380
Leu Val Lys Gly Phe Tyr Pro ser Asp Ile Ala Val Glu Trp Glu Ser
385
390
395
400
Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro vai Leu Asp405 410 415
ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr vai Asp Lys Ser420 425 430
Arg Trp Gln Gln Gly Asn Val Phe Ser Cys ser vai Met His Glu Ala435 440 445
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu ser Arg Gly Lys450 455 460
Arg Glu Pro Val Tyr Phe Gln Gly ser Leu Phe Lys Gly Pro Arg Asp465 470 475 480
Tyr Asn Pro Ile ser ser Ala íle Cys His Leu Thr Asn Glu ser Asp485 490 495
Gly His Thr Thr Ser Leu Tyr Gly íle Gly Phe Gly Pro Phe Ile Ile500 505 510
Thr Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln515 520 525
ser Leu His Gly vai Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln530 535 540
His Leu Ile Asp Gly Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp545 550 555 560
Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu565 570 575
Glu Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser580 585 590
Ser Met vai Ser Asp Thr ser Cys Thr Phe Pro Ser Ser Asp Gly Ile595 600 605
Phe Trp Lys His Trp Ile Gln Thr Lys Asp Gly His cys Gly ser Pro610 615 620Leu vai ser Thr Arg Asp Gly Phe Ile vai Gly Ile His ser Ala ser625 630 635 640
Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr ser vai Pro Lys Asp Phe645 650 655
Met Asp Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp vai Ser Gly Trp660 665 670
Arg Leu Asn Ala Asp ser Val Leu Trp Gly Gly His Lys vai Phe Met675 680 685
Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu690 695 700
Met ser Glu Leu Val Tyr ser Gln Gly Met Thr Trp Thr Pro Leu Leu705 710 715 720
Phe Leu Thr Leu Leu Leu His Cys Thr Gly Ser Leu Ser Gln Ser vai725 730 735
Leu Thr Gln Pro Pro Ser Val Ser Gly Ala Pro Gly Gln Arg vai Thr740 745 750
Ile Ser cys ser Gly Ser Arg ser Asn Ile Gly Ser Asn Thr Val Lys755 760 765
Trp Tyr Gln Gln Leu Pro Gly Thr Ala Pro Lys Leu Leu Ile Tyr Tyr770 775 780
Asn Asp Gln Arg Pro Ser Gly Val Pro Asp Arg Phe ser Gly Ser Lys785 790 795 800
Ser Gly Thr Ser Ala Ser Leu Ala Ile Thr Gly Leu Gln Ala Glu Asp805 810 815
Glu Ala Asp Tyr Tyr Cys Gln Ser Tyr Asp Arg Tyr Thr His Pro Ála820 825 830
Leu Leu Phe Gly Thr Gly Thr Lys Val Thr Val Leu Gly Gln Pro Lys835 840 845
Ala Ala Pro Ser Val Thr Leu Phe Pro Pro Ser Ser Glu Glu Leu Gln850 855 860
Ala Asn Lys Ala Thr Leu Val Cys Leu Ile Ser Asp Phe Tyr Pro Gly865 870 875 880
Ala Val Thr Val Ala Trp Lys Ala Asp Ser Ser Pro vai Lys Ala Gly885 890 895Val Glu Thr Thr Thr Pro Ser Lys Gln Ser Asn Asn Lys Tyr Ala Ala900 905 910
Pro Glu Gln Trp Lys Ser His Arg Ser920 925
Glu Gly Ser Thr Val Glu Lys Thr Val940
Ala Pro Thr Glu Cys Ser945 950
<210> 37<211> 10230<212> DNA<213> Artificial
<220>
<223> Constructo sintético, expressão de vetor de poliproteína ABT-874 TEV<400> 37
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc ■ 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
Ser Ser Tyr Leu Ser Leu Thr915
Tyr Ser Cys Gln Val Thr His930 935tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tcaggtgcag 1320
ctggtggagt ctgggggagg cgtggtccag cctgggaggt ccctgagact ctcctgtgca 1380
gcgtctggat tcaccttcag tagctatggc atgcactggg tccgccaggc tccaggcaag 1440
gggctggagt gggtggcatt tatacggtat gatggaagta ataaatacta tgcagactcc 1500
gtgaagggcc gattcaccat ctccagagac aattccaaga acacgctgta tctgcagatg 1560
aacagcctga gagctgagga cacggctgtg tattactgta agacccatgg tagccatgac 1620
aactggggcc aagggacaat ggtcaccgtc tcttcagcgt cgaccaaggg cccatcggtc 1680
ttccccctgg caccctcctc caagagcacc tctgggggca cagcggccct gggctgcctg 1740
gtcaaggact acttccccga accggtgacg gtgtcgtgga actcaggcgc cctgaccagc 1800
ggcgtgcaca ccttcccggc tgtcctacag tcctcaggac tctactccct cagcagcgtg 1860
gtgaccgtgc cctccagcag cttgggcacc cagacctaca tctgcaacgt gaatcacaag 1920
cccagcaaca ccaaggtgga caagaaagtt gagcccaaat cttgtgacaa aactcacaca 1980
tgcccaccgt gcccagcacc tgaactcctg gggggaccgt cagtcttcct cttcccccca 2040
aaacccaagg acaccctcat gatctcccgg acccctgagg tcacatgcgt ggtggtggac 2100
gtgagccacg aagaccctga ggtcaagttc aactggtacg tggacggcgt ggaggtgcat 2160
aatgccaaga caaagccgcg ggaggagcag tacaacagca cgtaccgtgt ggtcagcgtc 2220
ctcaccgtcc tgcaccagga ctggctgaat ggcaaggagt acaagtgcaa ggtctccaac 2280
aaagccctcc cagcccccat cgagaaaacc atctccaaag ccaaagggca gccccgagaa 2340
ccacaggtgt acaccctgcc cccatcccgc gaggagatga ccaagaacca ggtcagcctg 2400
acctgcctgg tcaaaggctt ctatcccagc gacatcgccg tggagtggga gagcaatggg 2460
cagccggaga acaactacaa gaccacgcct cccgtgctgg actccgacgg ctccttcttc 2520
ctctacagca agctcaccgt ggacaagagc aggtggcagc aggggaacgt cttctcatgc 2580
tccgtgatgc atgaggctct gcacaaccac tacacgcaga agagcctctc cctgtctagg 2640
ggtaaacgcg aaccagttta tttccagggg agcttgttta aggggccgcg tgattataac 2700
ccaatatcga gtgccatttg tcatctaacg aatgaatctg atgggcacac aacatcgttg 2760
tatggtattg gttttggccc tttcatcatc acaaacaagc atttgtttag aagaaataat 2820
ggtacactgt tagttcaatc actacatggt gtgttcaagg taaagaatac cacaactttg 2880
caacaacacc tcattgatgg gagggacatg atgctcattc gcatgcctaa ggatttccca 2940
ccatttcctc aaaagctgaa attcagagag ccacaaaggg aagagcgcat atgtcttgtg 3000
acaaccaact tccaaactaa gagcatgtct agcatggttt cagatactag ttgcacattc 3060
ccttcatctg atggtatatt ctggaaacat tggattcaga ccaaggatgg gcactgtggt 3120
agcccgttgg tgtcaactag agatgggttt attgttggta tacactcagc atcaaatttc 3180
accaacacaa acaattattt tacaagtgtg ccgaaagact tcatggattt attgacaaat 3240
caagaggcgc agcaatgggt tagtggttgg cgattgaatg ctgactcagt gttatgggga 3300ggccacaaag ttttcatgag caaacctgaacaactcatga gtgaattagt ctactcgcaaaccctcctcc tccactgcac aggaagcttagtgtctgggg cccccgggca gagagtcaccggcagtaata ctgtaaagtg gtatcagcagtattacaatg atcagcggcc ctcaggggtcacctcagcct ccctcgccat cactgggctccagtcatatg acagatacac ccaccccgccgtactaggtc agcccaaggc tgccccctcgcttcaagcca acaaggccac actggtgtgtacagtggcct ggaaggcaga tagcagcccctccaaacaaa gcaacaacaa gtacgcggcctggaagtccc acagaagcta cagctgccagacagtggccc ctacagaatg ttcatgagcgccagacatga taagatacat tgatgagtttaaatgcttta tttgtgaaat ttgtgátgctaataaacaag ttaacaacaa caattgcatttgggaggttt tttaaagcaa gtaaaacctcgctgcctcgc gcgtttcggt gatgacggtgcggtcacagc ttgtctgtaa gcggatgccgcgggtgttgg cgggtgtcgg ggcgcagccaatttttattt tattttattt ttgacgcgccgctgtggaat gtgtgtcagt tagggtgtggtatgcaaagc atgcatctca attagtcagcagcaggcaga agtatgcaaa gcatgcatctaactccgccc atcccgcccc taactccgccactaattttt tttatttatg cagaggccgagtagtgagga ggcttttttg gaggcctaggaaaccagaaa gttaactggt aagtttagtcggtggtggtg caaatcaaag aactgctccttacggaagtg ttacttctgc tctaaaagctcactataggg actagtatgg ttcgaccattggggattggc aagaacggag acctaccctgccaaagaatg accacaacct cttcagtgga
gaaccctttc agccagtcaa agaagcaact 3360
gggatgactt ggaccccact cctcttcctc 3420
tcccagtctg tgctgactca gcccccctca 3480
atctcttgtt ctggaagcag atccaacatc 3540
ctcccaggaa cggcccccaa actcctcatc 3600
cctgaccgat tctctggatc caagtctggc 3660
caggctgaag acgaggctga ctattactgc 3720
ctgctcttcg gaactgggac caaggtcaca 3780
gtcactctgt tcccgccctc ctctgaggag 3840
ctcataagtg acttctaccc gggagccgtg 3900
gtcaaggcgg gagtggagac caccacaccc 3960
agcagctacc tgagcctgac gcctgagcag 4020
gtcacgcatg aagggagcac cgtggagaag 4080
gccgcgttta aactgaatga gcgcgtccat 4140
ggacaaacca caactagàat gcagtgaaaa 4200
attgctttat ttgtaaccat tataagctgc 4260
cattttatgt ttcaggttca gggggaggtg 4320
tacaaatgtg gtatggctga ttatgatccg 4380
aaaacctctg acacatgcag ctcccggaga 4440
ggagcagaca agcccgtcag ggcgcgtcag 4500
tgaccggtcg acggcgcgcc ttttttttta 4560
gaaggcgcga tctgagctcg gtacagcttg 4620
aaagtcccca ggctccccag caggcagaag 4680
aaccaggtgt ggaaagtccc caggctcccc 4740
caattagtca gcaaccatag tcccgcccct 4800
cagttccgcc cattctccgc cccatggctg 4860
ggccgcctcg gcctctgagc tattccagaa 4920
cttttgcaaa aagctcctcg aggaactgaa 4980
tttttgtctt ttatttcagg tcccggatcc 5040
cagtggatgt tgcctttact tctaggcctg 5100
gcggaattgt acccgcggcc taatacgact 5160
gaactgcatc gtcgccgtgt cccaaaatat 5220
gcctccgctc aggaacgagt tcaagtactt 5280
aggtaaacag aatctggtga ttatgggtag 5340gaaaacctgg ttctccattc ctgagaagaa tcgaccttta aaggacagaa ttaatatagt 5400
tctcagtaga gaactcaaag aaccaccacg aggagctcat tttcttgcca aaagtttaga 5460
tgatgcctta agacttattg aacaaccgga attggcaagt aaagtagaca tggtttggat 5520
agtcggaggc agttctgttt accaggaagc catgaatcaa ccaggccacc tcagactctt 5580
tgtgacaagg atcatgcagg aatttgaaag tgacacgttt ttcccagaaa ttgatttggg 5640
gaaatataaa cttctcccag aatacccagg cgtcctctct gaggtccagg aggaaaaagg 5700
catcaagtat aagtttgaag tctacgagaa gaaagactaa gcggccgagc gcgcggatct 5760
ggaaacggga gatgggggag gctaactgaa gcacggaagg agacaatacc ggaaggaacc 5820
cgcgctatga cggcaataaa aagacagaat aaaacgcacg ggtgttgggt cgtttgttca 5880
taaacgcggg gttcggtccc agggctggca ctctgtcgat accccaccga gaccccattg 5940
gggccaatac gcccgcgttt cttccttttc cccaccccac cccccaagtt cgggtgaagg 6000
cccagggctc gcagccaacg tcggggcggc aggccctgcc atagccactg gccccgtggg 6060
ttagggacgg ggtcccccat ggggaatggt ttatggttcg tgggggttat tattttgggc 6120
gttgcgtggg gtctggagat cccccgggct gcaggaattc cgttacatta cttacggtaa 6180
atggcccgcc tggctgaccg cccaacgacc cccgcccatt gacgtcaata atgacgtatg 6240
ttcccatagt aacgccaata gggactttcc attgacgtca atgggtggag tatttacggt 6300
aaactgccca cttggcagta catcaagtgt atcatatgcc aagtacgccc cctattgacg 6360
tcaatgacgg taaatggccc gcctggcatt atgcccagta catgacctta tgggactttc 6420
ctacttggca gtacatctac gtattagtca tcgctattac catggtgatg cggttttggc 6480
agtacatcaa tgggcgtgga tagcggtttg actcacgggg atttccaagt ctccacccca 6540
ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg ggactttcca aaatgtcgta 6600
acaactccgc cccattgacg caaaagggcg ggaattcgag ctcggtactc gagcggtgtt 6660
ccgcggtcct cctcgtatag aaactcggac cactctgaga cgaaggctcg cgtccaggcc 6720
agcacgaagg aggctaagtg ggaggggtag cggtcgttgt ccactagggg gtccactcgc 6780
tccagggtgt gaagacacat gtcgccctct tcggcatcaa ggaaggtgat tggtttatag 6840
gtgtaggcca cgtgaccggg tgttcctgaa ggggggctat aaaagggggt gggggcgcgt 6900
tcgtcctcac tctcttccgc atcgctgtct gcgagggcca gctgttgggc tcgcggttga 6960
ggacaaactc ttcgcggtct ttccagtact cttggatcgg aaacccgtcg gcctccgaac 7020
ggtactccgc caccgaggga cctgagcgag tccgcatcga ccggatcgga aaacctctcg 7080
actgttgggg tgagtactcc ctctcaaaag cgggcatgac ttctgcgcta agattgtcag 7140
tttccaaaaa cgaggaggat ttgatattca cctggcccgc ggtgatgcct ttgagggtgg 7200
ccgcgtccat ctggtcagaa aagacaatct ttttgttgtc aagcttgagg tgtggcaggc 7260
ttgagatctg gccatacact tgagtgacaa tgacatccac tttgcctttc tctccacagg 7320
tgtccactcc caggtccaac cggaattgta cccgcggcca gagcttgcgg gcgccaccgc 7380ggccgcgggg atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 7440
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 7500
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 7560
cagggggagg tgtgggaggt tttttcggat cctcttggcg taatcatggt catagctgtt 7620
tcctgtgtga aattgttatc cgctcacaat tccacacaac atacgagccg gaagcataaa 7680
gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca ttaattgcgt tgcgctcact 7740
gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 7800
ggggaaaggc ggtttgcgta ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg 7860
ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 7920
cacagaatca ggggataacg caggaaagaa catgtgagca áaaggccagc aaaaggccag 7980
gaaccgtaaa aaggccgcgt tgctggcgtt cttccatagg ctccgccccc ctgacgagca 8040
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 8100
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 8160
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 8220
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 8280
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 8340
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 8400
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa gaacagtatt 8460
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 8520
cggcaaãcaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 8580
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 8640
gaacgaaaac tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta 8700
gatccctttt aattaaaaat gaagttttaa atcaatctaa agtatatatg agtaaacttg 8760
gtctgacagt taccaatgct taatcagtga ggcacctatc tcagcgatct gtctatttcg 8820
ttcatccata gttgcctgac tccccgtcgt gtagataact acgatacggg agggcttacc 8880
atctggcccc agtgctgcaa tgataccgcg agacccacgc tcaccggctc cagatttatc 8940
agcaataaac cagccagccg gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc 9000
ctccatccag tctattaatt gttgccggga agctagagta agtagttcgc cagttaatag 9060
tttgcgcaac gttgttgcca ttgctacagg catcgtggtg tcacgctcgt cgtttggtat 9120
ggcttcattc agctccggtt cccaacgatc aaggcgagtt acatgatccc ccatgttgtg 9180
caaaaaagcg gttagctcct tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt 9240
gttatcactc atggttatgg cagcactgca taattctctt actgtcatgc catccgtaag 9300
atgcttttct gtgactggtg agtactcaac caagtcattc tgagaatagt gtatgcggcg 9360
accgagttgc tcttgcccgg cgtcaatacg ggataatacc gcgccacata gcagaacttt 9420aaaagtgctc atcattggaa aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct 9480gttgagatcc agttcgatgt aacccactcg tgcacccaac tgatcttcag catcttttac 9540tttcaccagc gtttctgggt gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat 9600aagggcgaca cggaaatgtt gaatactcat actcttcctt tttcaatatt attgaagcat 9660ttatcagggt tattgtctca tgagcggata catatttgaa tgtatttaga aaaataaaca 9720aataggggtt ccgcgcacat ttccccgaaa agtgccacct gacgtctaag aaaccattat 9780tatcatgaca ttaacctata aaaataggcg tatcacgagg ccctttcgtc tcgcgcgttt 9840cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca cagcttgtct 9900gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg ttggcgggtg 9960tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc accatatgcg 10020gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc attcgccatt 10080caggctgcgc aactgttggg aagggcgatc ggtgcgggce.tcttcgctat tacgccagct 10140ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt tttcccagtt 10200acgacgttgt aaaacgacgg ccagtgaatt 10230
<210> 38
<211> 2901
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, seqüência de codificação de poliproteína EL246 GG TEV<220>
<221> CDS<222> Cl)■·(2898)
<400> 38
atg gag ttt ggg ctg age tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu vai Ala Ile Leu Lys Gly1 5 10 15
gtc cag tgc gag gtg cag ctg gtg cag tet gga gea gag gtg aaa aag 96
vai Gln Cys Glu Val Gln Leu vai Gln ser Gly Ala Glu vai Lys Lys20 25 30
ggg gag tet ctg aag ate tcc tgt aag ggg tcc gga tac gea ttc 144Gly Glu ser Leu Lys Ile ser Cys Lys Gly ser Gly Tyr Ala Phe
ccc
Pro _ , _ .
35 40 45
agt agt tcc tgg ate ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg 192
Ser Ser ser Trp Ile Gly Trp vai Arg Gln Met Pro Gly Lys Gly Leu50 55 60
gag tgg atg ggg cgg att tat cct gga gat gga gat act aac tac aat 240Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn65 70 75 80
ggg aag ttc aag ggc cág gtc acc ate tca gcc gac aag tcc ate ageGly Lys Phe Lys Gly Gln Val Thr Ile ser Ala Asp Lys ser Ile ser85 90 95
288acc gcc tac ctg cag tgg age age ctg aag gct ageThr Ala Tyr Leu Gln Trp Ser ser Leu Lys Ala ser100 105
gac acc gcc atgAsp Thr Ala Met110
336
tat tac tgtTyr Tyr Cys115
gcg aga gcg cgcAla Arg Ala Arg
gga
Val Gly120
tcc acg gtcSer Thr Val
tat gatTyr Asp125
t tacy Tyr
384
ctc tat geaLeu Tyr Ala130
atg gac tac tgg ggt caaMet Asp Tyr Trp Gly Gln135
ggt acc tcaGly Thr Ser140
gtc acc gtc tcc 432Val Thr Val Ser
tca gcg tcgser Ala ser145
acc aag ggc ccaThr Lys Gly Pro150
tcg gtcser vai
ttc ccc ctgPhe Pro Leu155
gea ccc tcc tccAla Pro ser ser160
480
aag age accLys ser Thr
tet
Ser GTy GTy Thr165
ggc acaT
gcg gccAla Ala
ctg gç|c tgc
Leu170
ctg gtc aag gacy Cys Leu Val Lys Asp175
528
tac ttc cccTyr Phe Pro
age ggc gtgSer GTy Val195
tcc ctc ageSer Leu ser210
acc tac ateThr Tyr Ile225
aag aaa gttLys Lys Val
tgc cca geaCys Pro Ala
cca aaa cccPro Lys Pro275
tgc gtg gtgCys VaT VaT290
tgg tac gtgTrp Tyr VaT305
gag gag cagGlu Glu Gln
gaa ccg gtg acgGlu Pro VaT Thr180
cac acc ttc ccgHis Thr Phe Pro
tcgVal ser185
gct gtcAla vai200
ageser Va
tgc aacCys Asn
gag cccGlu pro245
cct gaaPro Glu260
aag gacLys Asp
gtg acc gtgVaT Thr VaT215
cccVal Pro
tgg aac tcaTrp Asn Ser
cta cag tccLeu Gln Ser
tcc age ageSer Ser ser220
1?
c gcc ctg accGTy Ala Leu Thr190
99ser GT205
y Leu Tyr
ttg ggc acc cagLeu GTy Thr Gln
ctg cac cagLeu His Gln
gacVal Asp
gac ggcAsp GTy
tac aacTyr Asn325
gac tggAs p. Trp340
aatVal Asn230
aaa tetLys ser
gcc gcgAla Ala
acc ctcThr Leu
gtg ageVaT ser295
gtg gagVaT Glu310
age acgSer Thr
ctg aatLeu Asn
cac aagHis Lys
tgt gacCys Asp
ggg gg
GTy GT26
ccc age aac_____„
Pro Ser Asn Thr Lys235
acc aag gtg gacThr Lys VaT Asp240
atg ateMet Ile280
cac gaaHis Glu
catvai His
tac cgtTyr Arg
ggc aagGly Lys345
aaa act cacLys Thr His250
ccg tca gtcPro ser Val
tcc cgg accser Arg Thr
gac cct gagAsp Pro Glu300
aat gcc aagAsn Ala Lys315
gtg gtc ageVaT Val ser330
gag tac aagGlu Tyr Lys
aca tgc cca ccgThr Cys Pro Pro255
ttc ctc ttc CCCPhe Leu Phe Pro270
cct gag gtc acaPro Glu vai Thr285
gtc aag ttc aacVal Lys Phe Asn
aca aag ccg cggThr Lys Pro Arg320
gtc ctc acc gtcVal Leu Thr Val335
tgc aag gtc tcccys Lys vai ser350
576
624
672
720
768
816
864
912
960
1008
1056
aac aaa gccAsn Lys Ala355
ctc ccaLeu Pro
gcc cccAla Pro
ate gagIle Glu360
aaa acc ateLys Thr Ile
tcc aaa gcc aaaser Lys Ala Lys365
1104ggg cag ccc cga gaa cca cag gtg tac acc ctg ccc cca tcc cgc gag 1152Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro ser Arg Glu370 375 380
gag atg acc aag aac cag gtc age ctg acc tgc ctg gtc aaa ggc ttc 1200Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe385 390 395 400
tat ccc age gac ate gcc gtg gag tgg gag age aat ggg cag ccg gag 1248Tyr Pro ser Asp Ile Ala VaT Glu Trp Glu ser Asn GTy Gln Pro Glu405 410 415
aac aac tac aag acc acg cct ccc gtg ctg gac tcc gac ggc tcc ttc 1296Asn Asn Tyr Lys Thr Thr Pro Pro VaT Leu Asp ser Asp GTy Ser Phe420 425 430
ttc ctc tac age aag ctc acc gtg gac aag age agg tgg cag cag ggg 1344Phe Leu Tyr Ser Lys Leu Thr VaT Asp Lys Ser Arg Trp Gln Gln GTy435 440 445
aac gtc ttc tca tgc tcc gtg atg cat gag gct ctg cac aac cac tac 1392Asn Val Phe Ser Cys Ser VaT Met His Glu Ala Leu His Asn His Tyr450 455 460
acg cag aag age ctc tcc ctg tet agg ggt aaa cgc gaa cca gtt tat 1440Thr Gln Lys Ser Leu Ser Leu Ser Arg GTy Lys Arg Glu Pro Val Tyr465 470 475 480
ttc cag ggg age ttg ttt aag ggg ccg cgt gat tat aac cca ata tcg 1488Phe Gln GTy Ser Leu Phe Lys GTy Pro Arg Asp Tyr Asn Pro Ile ser485 490 495
agt gcc att tgt cat cta acg aat gaa tet gat ggg cac aca aca tcg 1536ser Ala Ile cys His Leu Thr Asn Glu ser Asp GTy His Thr Thr ser500 505 510
ttg tat ggt att ggt ttt ggc cct ttc ate ate aca aac aag cat ttg 1584Leu Tyr GTy Ile GTy Phe GTy Pro Phe Ile Il e Thr Asn Lys His Leu515 520 525
ttt aga aga aat aat ggt aca ctg tta gtt caa tca cta cat ggt gtg 1632Phe Arg Arg Asn Asn GTy Thr Leu Leu Val Gln ser Leu His GTy VaT530 535 540
ttc aag gta aag aat acc aca act ttg caa caa cac ctc att gat ggg 1680Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp GTy545 550 555 560
agg gac atg atg ctc att cgc atg cct aag gat ttc cca cca ttt cct 1728Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro565 570 575
caa aag ctg aaa ttc aga gag cca caa agg gaa gag cgc ata tgt ctt 1776Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile cys Leu580 585 590
gtg aca acc aac ttc caa act aag age atg tet age atg gtt tca gat 1824VaT Thr Thr Asn Phe Gln Thr Lys Ser Met ser ser Met Val ser Asp595 600 605
act agt tgc aca ttc cct tca tet gat ggt ata ttc tgg aaa cat tgg 1872Thr ser cys Thr Phe Pro Ser ser Asp GTy Ile Phe Trp Lys His Trp610 615 620
att cag acc aag gat ggg cac tgt ggt age ccg ttg gtg tca act aga 1920lie Gln Thr Lys Asp GTy His cys GTy ser Pro Leu VaT ser Thr Arg625 630 635 640gat ggg ttt att gtt ggt ata cac tca gca tca aat ttc acc aac aca 1968Asp Gly Phe lie VaT Giy He His ser Ala ser Asn Phe Thr Asn Thr645 650 655
aac aat tat ttt aca agt gtg ccg aaa gac ttc atg gat tta ttg aca 2016Asn Asn Tyr Phe Thr ser vai Pro Lys Asp Phe Met Asp Leu Leu Thr660 665 670
aat caa gag gcg cag caa tgg gtt agt ggt tgg cga ttg aat gct gac 2064Asn Gln Glu Ala Gln Gln Trp Val ser Giy Trp Arg Leu Asn Ala Asp675 680 685
tca gtg tta tgg gga ggc cac aaa gtt ttc atg age aaa cct gaa gaa 2112Ser vai Leu Trp Giy Gly His Lys Val Phe Met ser Lys Pro Glu Glu690 695 700
ccc ttt cag cca gtc aaa gaa gca act caa ctc atg agt gaa tta gtc 2160Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met ser Glu Leu Val705 710 715 720
tac tcg caa ggg àtg gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg 2208Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu725 730 735
ctg ctg ctg tgg ttc ccc ggc tcg cga tgc gac âtc gtg atg acc cag 2256Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln740 745 750
tet cca gac tcc ctg gct gtg tet ctg ggc gag agg gcc acc ate aac 2304ser Pro Asp ser Leu Ala Val ser Leu Gly Glu Arg Ala Thr Ile Asn755 760 765
tgc aag tcc agt cag age ctt tca tat aga age aat caa aag aac tcg 2352
Cys Lys ser ser Gln Ser Leu Ser Tyr Arg Ser Asn Gln Lys Asn Ser
770 775 780 ·
ttg gcc tgg tac cag cag aaa cca gga cag cct cct aag ctg ctc att 2400
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile
785 790 795 800
tac tgg gct age act agg gaa tet ggg gtc cct gac cga ttc agt gga 2448
Tyr Trp Ala ser Thr Arg Glu ser Gly vai Pro Asp Arg Phe ser Giy
805 810 815
tcc ggg tet ggg aca gat ttc act ctc acc ate age age ctg cag gct 2496
ser Gly ser Gly Thr Asp Phe Thr Leu Thr Ile ser ser Leu Gln Ala820 825 830
gaa gat gtg gca gtt tat tac tgt cac caa tat tat age tat ccg tac 2544
Glu Asp VaT Ala Val Tyr Tyr Cys His Gln Tyr Tyr Ser Tyr Pro Tyr835 840 845
acg ttc gga ggg ggg acc aag gtg gaa att aaa cgt acg gtg gct gcThr Phe Gly Gly Gly Thr Lys VaT Glu Ile Lys Arg Thr VaT Ala Al850 855 860
gct gca 2592"a
cca tet gtc ttc ate ttc ccg cca tet gat gag cag ttg aaa tet gga 2640
Pro ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser GTy865 870 875 880
act gcc tet gtt gtg tgc ctg ctg aat aac ttc tat ccc aga gag gcc 2688
Thr Ala Ser Val VaT Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala885 890 895
aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg ggt aac tcc cagLys Val Gln Trp Lys VaT Asp Asn Ala Leu Gln Ser GTy Asn ser Gln900 905 910
2736gag agt gtc aca gag cag gac age aag gac age acc tac age ctc age 2784Glu Ser Val Thr Glu Gln Asp ser Lys Asp ser Thr Tyr ser Leu ser915 920 925
age acc ctg acg ctg age aaa gea gac tac gag aaa cac aaa gtc tac 2832ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys vai Tyr930 935 940
gcc tgc gaa gtc acc cat cag ggc ctg age tcg ccc gtd aca aag ageAla Cys Glu Val Thr His Gln Gly Leu Ser ser Pro Val Thr Lys Ser945 950 955 960
2880
ttc aac agg gga gag tgt tga 2901
Phe Asn Arg Gly Glu Cys965
<210> 39<211> 966<212> PRT<213> Artificial
<220>
<22 3> Constructo sintético<400> 39
Met Glu Phe Gly Leu ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly1 5 10 15
Val Gln Cys Glu Val Gln Leu Val Gln Ser Gly Ala Glu vai Lys Lys20 25 30
Pro Gly Glu Ser Leu Lys Ile ser Cys Lys Gly Ser Gly Tyr Ala Phe35 40 45
ser ser Ser Trp Ile Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu50 55 60
Glu Trp Met Gly Arg Ile Tyr Pro Gly Asp Gly Asp Thr Asn Tyr Asn65 70 75 80
Gly Lys Phe Lys Gly Gln vai Thr Ile Ser Ala Asp Lys ser Ile ser85 90 95
Thr Ala Tyr Leu Gln Trp ser ser Leu Lys Ala ser Asp Thr Ala Met100 105 110
Tyr Tyr Cys Ala Arg Ala Arg Val Gly Ser Thr Val Tyr Asp Gly Tyr115 120 125
Leu Tyr Ala Met Asp Tyr Trp Gly Gln Gly Thr ser Val Thr vai ser130 135 140
Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser145 150 155 160
Lys ser Thr ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Vãl Lys AspTyr Phe Pro Glu Pro Val Thr vai ser Trp Asn ser Gly Ala Leu Thr180 185 190
Ser Gly vai His Thr Phe Pro Ala vai Leu Gln Ser ser Gly Leu Tyr195 200 205
Ser Leu ser ser vai Val Thr vai Pro ser ser ser Leu Gly Thr Gln210 215 220
Thr Tyr Ile Cys Asn Val Asn His Lys Pro ser Asn Thr Lys Val Asp225 230 235 240
Lys Lys vai Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro245 250 255
Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser vai Phe Leu Phe Pro260 265 270
Pro Lys Pro Lys Asp Thr Leu Met Ile ser Arg Thr Pro Glu Val Thr275 280 285
Cys Val vai vai Asp Val ser His Glu Asp Pro Glu vai Lys Phe Asn290 295 300
Tro Tyr Val Asp Gly Val Glu vai His Asn Ala Lys Thr Lys Pro Arg305 310 315 320
Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val325 330 335
Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val ser340 345 350
Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys355 360 365
Glv Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu370 375 380
Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe385 390 395 400
Tvr Pro Ser Asp lie Ala Val Glu Trp Glu ser Asn Gly Gln Pro Glu* 405 410 415
Asn Asn Tyr Lys Thr Thr Pro Pro vai Leu Asp Ser Asp Gly Ser Phe420 425 430
Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly435 440 445
Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr450 455 460
Thr Gln Lys ser Leu ser Leu ser Arg Gly Lys Arg Glu Pro vai Tyr465 470 475 480
Phe Gln Gly ser Leu Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile ser485 490 495
Ser Ala Ile Cys His Leu Thr Asn Glu ser Asp Gly His Thr Thr ser500 505 510
Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu515 520 525
Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly vai535 540
Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly545 550 555 560
Arg Asp Met Met Leu Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro565 570 575
Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu580 585 590
Val Thr Thr Asn Phe Gln Thr Lys Ser Met ser Ser Met Val Ser Asp595 600 605
Thr ser Cys Thr Phe Pro ser ser Asp Gly lie Phe Trp Lys His Trp610 615 620
Ile Gln Thr Lys Asp Gly His Cys Gly Ser Pro Leu Val Ser Thr Arg625 630 635 640
Asp Gly Phe Ile Val Gly Ile His Ser Ala ser Asn Phe Thr Asn Thr645 650 655
Asn Asn Tyr Phe Thr ser vai Pro Lys Asp Phe Met Asp Leu Leu Thr660 665 670
Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp675 680 685
ser vai Leu Trp Gly Gly His Lys Val Phe Met Ser Lys Pro Glu Glu690 695 700
Pro Phe Gln Pro vai Lys Glu Ala Thr Gln Leu Met ser Glu Leu vai705 710 715 720
Tyr Ser Gln Gly Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu725 730 735
Leu Leu Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Val Met Thr Gln740 745 750
ser Pro Asp ser Leu Ala Val Ser Leu Gly Glu Arg Ala Thr Ile Asn755 760 765
cys Lys Ser Ser Gln Ser Leu ser Tyr Arg Ser Asn Gln Lys Asn Ser770 775 780
Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile785 790 795 800
Tyr Trp Ala ser Thr Arg Glu Ser Gly Val Pro Asp Arg Phe Ser Gly805 810 815
Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala820 825 830
Glu Asp Val Ala Val Tyr Tyr Cys His Gln Tyr Tyr ser Tyr Pro Tyr835 840 845
Thr Phe Gly Gly Gly Thr Lys Val Glu Ile Lys Arg Thr Val Ala Ala850 855 860
Pro ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys ser Gly865 870 875 880
Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala885 890 895
Lys vai Gln Trp Lys vai Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln900 905 910
Glu Ser vai Thr Glu Gln Asp ser Lys Asp ser Thr Tyr ser Leu ser915 920 925
Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr930 935 940
Ala cys Glu Val Thr His Gln Gly Leu ser Ser Pro vai Thr Lys ser945 950 955 960
Phe Asn Arg Gly Glu Cys965
<210> 40<211> 10278<212> DNA<213> Artificial
<220>
<223> Constructo sintético, vetor de expressão de poliproteína de EL246 GG TEV<400> 40
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat. 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg cgaggtgcag 1320
ctggtgcagt ctggagcaga ggtgaaaaag cccggggagt ctctgaagat ctcctgtaag 1380
gggtccggat acgcattcag tagttcctgg atcggctggg tgcgccagat gcccgggaaa 1440
ggcctggagt ggatggggcg' gatttatcct ggagatggag atactaacta caatgggaag 1500
ttcaagggcc aggtcaccat ctcagccgac aagtccatca gcaccgccta cctgcagtgg 1560
agcagcctga aggctagcga caccgccatg tattactgtg cgagagcgcg cgtgggatcc 1620
acggtctatg atggttacct ctatgcaatg gactactggg gtcaaggtac ctcagtcacc 1680
gtctcctcag cgtcgaccaa gggcccatcg gtcttccccc tggcaccctc ctccaagagc 1740
acctctgggg gcacagcggc cctgggctgç ctggtcaagg actacttccc cgaaccggtg 1800acggtgtcgt ggaactcagg cgccctgacc agcggcgtgc acaccttccc ggctgtccta 1860
cagtcctcag gactctactc cctcagcagc gtggtgaccg tgccctccag cagcttgggc 1920
acccagacct acatctgcaa cgtgaatcac aagcccagca acaccaaggt ggacaagaaa 1980
gttgagccca aatcttgtga caaaactcac acatgcccac cgtgcccage-acctgaagcc 2040
gcggggggac cgtcagtctt cctcttcccc ccaaaaccca aggacaccct catgatctcc 2100
cggacccctg aggtcacatg cgtggtggtg gacgtgagcc acgaagaccc tgaggtcaag 2160
ttcaactggt acgtggacgg cgtggaggtg cataatgcca agacaaagcc gcgggaggag 2220
cagtacaaca gcacgtaccg tgtggtcagc gtcctcaccg tcctgcacca ggactggctg 2280
aatggcaagg agtacaagtg caaggtctcc aacaaagccc tcccagcccc catcgagaaa 2340
accatctcca aagccaaagg gcagccccga gaaccacagg tgtacaccct gcccccatcc 2400
cgcgaggaga tgaccaagaa ccaggtcagc ctgacctgcc tggtcaaagg cttctatccc 2460
agcgacatcg ccgtggagtg ggagagcaat gggcagccgg agaacaacta caagaccacg 2520
cctcccgtgc tggactccga cggctccttc ttcctctaca gcaagctcac cgtggacaag 2580
agcaggtggc agcaggggaa cgtcttctca tgctccgtga tgcatgaggc tctgcacaac 2640
cactacacgc agaagagcct ctccctgtct aggggtaaac gcgaaccagt ttatttccag 2700
gggagcttgt ttaaggggcc gcgtgattat aacccaatat cgagtgccat ttgtcatcta 2760
acgaatgaat ctgatgggca cacaacatcg ttgtatggta ttggttttgg ccctttcatc 2820
atcacaaaca agcatttgtt tagaagaaat aatggtacac tgttagttca atcactacat 2880
ggtgtgttca aggtaaagaa taccacaact ttgcaacaac acctcattga tgggagggac 2940
atgatgctca ttcgcatgcc taaggatttc ccaccatttc ctcaaaagct gaaattcaga 3000
gagccacaaâ gggaagagcg catatgtctt gtgacaacca acttccaaac taagagcatg 3060
tctagcatgg tttcagatac tagttgcaca ttcccttcat ctgatggtat attctggaaa 3120
cattggattc agaccaagga tgggcactgt ggtagcccgt tggtgtcaac tagagatggg 3180
tttattgttg gtatacactc agcatcaaat ttcaccaaca caaacaatta ttttacaagt 3240
gtgccgaaag acttcatgga tttattgaca aatcaagagg cgcagcaatg ggttagtggt 3300
tggcgattga atgctgactc agtgttatgg ggaggccaca aagttttcat gagcaaacct 3360
gaagaaccct ttcagccagt caaagaagca actcaactca tgagtgaatt agtctactcg 3420
caagggatgg acatgcgcgt gcccgcccag ctgctgggcc tgctgctgct gtggttcccc 3480
ggctcgcgat gcgacatcgt gatgacccag tctccagact ccctggctgt gtctctgggc 3540
gagagggcca ccatcaactg caagtccagt cagagccttt catatagaag caatcaaaag 3600
aactcgttgg cctggtacca gcagaaacca ggacagcctc ctaagctgct catttactgg 3660
gctagcacta gggaatctgg ggtccctgac cgattcagtg gatccgggtc tgggaçagat 3720
ttcactctca ccatcagcag cctgcaggct gaagatgtgg cagtttatta ctgtcaccaa 3780
tattatagct atccgtacac gttcggaggg gggaccaagg tggaaattaa acgtacggtg 3840gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc tggaactgcc 3900
tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca gtggaaggtg 3960
gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga cagcaaggac 4020
agcacctaca gcctcagcag caccctgacg ctgageaaag cagactacga gaaacacaaa 4080
gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa gagcttcaac 4140
aggggagagt gttgagcggc cgcgtttaaa ctgaatgagc gcgtccatcc agacatgata 4200
agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 4260
tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 4320
aacaacaaca attgcattca ttttatgttt caggttcagg gggaggtgtg ggaggttttt 4380
taaagcaagt aaaacctcta caaatgtggt atggctgatt atgatccggc tgcctcgcgc 4440
gtttcggtga tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt 4500
gtctgtaagc ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg 4560
ggtgtcgggg cgcagccatg accggtcgac ggcgcgcctt tttttttaat ttttatttta 4620
ttttattttt gacgcgccga aggcgcgatc tgagctcggt acagcttggc tgtggaatgt 4680
gtgtcagtta gggtgtggaa agtccccagg ctccccagca ggcagaagta tgcaaagcat 4740
gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag caggcagaag 4800
tatgcaaagc atgcatctca attagtcagc aaccatagtc ccgcccctaa ctccgcccat 4860
cccgccccta actccgccca gttccgccca ttctccgccc catggctgac taattttttt 4920
tatttatgca gaggccgagg ccgcctcggc ctctgagcta ttccagaagt agtgaggagg 4980
cttttttgga ggcctaggct tttgcaaaaa gctcctcgag gaactgaaaa accagaaagt 5040
tàactggtaa gtttagtctt tttgtctttt atttcaggtc ccggatccgg tggtggtgca 5100
aatcaaagaa ctgctcctca gtggatgttg cctttacttc taggcctgta cggaagtgtt 5160
acttctgctc taaaagctgc ggaattgtac ccgcggccta atacgactca ctatagggac 5220
tagtatggtt cgaccattga actgcatcgt cgccgtgtcc caaaatatgg ggattggcaa 5280
gaacggagac ctaccctggc ctccgctcag gaacgagttc aagtacttcc aaagaatgac 5340
cacaacctct tcagtggaag gtaaacagaa tctggtgatt atgggtagga aaacctggtt 5400
ctccattcct gagaagaatc gacctttaaa ggacagaatt aatatagttc tcagtagaga 5460
actcaaagaa ccaccacgag gagctcattt tcttgccaaa agtttagatg atgccttaag 5520
acttattgaa caaccggaat tggcaagtaa agtagacatg gtttggatag tcggaggcag 5580
ttctgtttac caggaagcca tgaatcaacc aggccacctc agactctttg tgacaaggat 5640
catgcaggaa tttgaaagtg acacgttttt cccagaaatt gatttgggga aatataaact 5700
tctcccagaa tacccaggcg tcctctctga ggtccaggag gaaaaaggca tcaagtataa 5760
gtttgaagtc tacgagaaga aagactaagc ggccgagcgc gcggatctgg aaacgggaga 5820
tgggggaggc taactgaagc acggaaggag acaataccgg aaggaacccg cgctatgacg 5880gcaataaaaa gacagaataa aacgcacggg tgttgggtcg tttgttcata aacgcggggt 5940
tcggtcccag ggctggcact ctgtcgatac cccaccgaga ccccattggg gccaatacgc 6000
ccgcgtttct tccttttccc caccccaccc cccaagttcg ggtgaaggcc cagggctcgc 6060
agccaacgtc ggggcggcag gccctgccat agccactggc cccgtgggtt agggacgggg 6120
tcccccatgg ggaatggttt atggttcgtg ggggttatta ttttgggcgt tgcgtggggt 6180
ctggagatcc cccgggctgc aggaattccg ttacattact tacggtaaat ggcccgcctg 6240
gctgaccgcc caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa 6300
cgccaatagg gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact 6360
tggcagtaca tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta 6420
aatggcccgc ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt 6480
acatctacgt attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg 6540
ggcgtggata gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg 6600
ggagtttgtt ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc 6660
cattgacgca aaagggcggg aattcgagct cggtactcga gcggtgttcc gcggtcctcc 6720
tcgtatagaa actcggacca ctctgagacg aaggctcgcg tccaggccag cacgaaggag 6780
gctaagtggg aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga 6840
agacacatgt cgccctcttc ggcatcaagg aaggtgattg gtttataggt gtaggccacg 6900
tgaccgggtg ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc 6960
tcttccgcat cgctgtctgc gagggccagc tgttgggctc gcggttgagg acaaactctt 7020
cgcggtcttt ccagtactct tggatcggaa acccgtcggc ctccgaacgg tactccgcca 7080
ccgagggacc tgagcgagtc cgcatcgacc ggatcggaaa acctctcgac tgttggggtg 7140
agtactccct ctcaaaagcg ggcatgactt ctgcgctaag attgtcagtt tccaaaaacg 7200
aggaggattt gatattcacc tggcccgcgg tgatgccttt gagggtggcc gcgtccatct 7260
ggtcagaaaa gacaatcttt ttgttgtcaa gcttgaggtg tggcaggctt gagatctggc 7320
catacacttg agtgacaatg acatccactt tgcctttctc tccacaggtg tccactccca 7380
ggtccaaccg gaattgtacc cgcggccaga gcttgcgggc gccaccgcgg ccgcggggat 7440
ccagacatga taagatacat tgatgagttt ggacaaacca caactagaat gcagtgaaaa 7500
aaatgcttta trttgtgaaat ttgtgatgct attgctttat ttgtaaccat tataagctgc 7560
aataaacaag ttaacaacaa caattgcatt cattttatgt ttcaggttca gggggaggtg 7620
tgggaggttt tttcggatcc tcttggcgta atcatggtca tagctgtttc ctgtgtgaaa 7680
ttgttatccg ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg 7740
gggtgcctaa tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca 7800
gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggaaaggcgg 7860
tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg 7920gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 7980
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 8040
ggccgcgttg ctggcgttct tccataggct ccgcccccct gacgagcatc acaaaaatcg 8100
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 8160
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 8220
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 8280
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8Β40
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8400
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8460
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8520
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8580
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8640
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8700
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tcccttttaa 8760
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 8820
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 8880
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 8940
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 9000
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 9060
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 9120
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 9180
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 9240
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9300
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9360
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9420
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9480
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9540
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9600
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9660
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9720
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 9780
gcgcacattt ccccgaaaag tgccacctga cgtctaagaa accattatta tcatgacatt 9840
aacctataaa aataggcgta tcacgaggcc ctttcgtctc gcgcgtttcg gtgatgacgg 9900tgaaaacctc tgacacatgc agctcccgga gacggtcaca gcttgtctgt aagcggatgc 9960cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt ggcgggtgtc ggggctggcttaactatgcg gcatcagagc agattgtact gagagtgcac catatgcggt gtgaaataccgcacagatgc gtaaggagaa aataccgcat caggcgccat tcgccattca ggctgcgcaactgttgggaa gggcgatcgg tgcgggcctc ttcgctatta cgccagctgg cgaaagggggatgtgctgca aggcgattaa gttgggtaac gccagggttt tcccagttac gacgttgtaaaacgacggcc agtgaatt
<210> 41
<211> 2865
<212> DNA
<213> Artificial
<220>
<22 3> Constructo sintético, seqüência codificadora da poliproteína ABT-325 TEV
<220>
<221> CDS<222> (1)..(2862)
<400> 41
atg gag ttt ggg ctg age tgg ctt ttc ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgt gag gtg cag ctg gtg cag tet gga aca gag gtg aaa aaa 96
Val Gln cys Glu Val Gln Leu vai Gln ser Gly Thr Glu VaT Lys Lys20 25 30
ccc ggg gag tet ctg aag ate tcc tgt aag ggt tet gga tac act gtt 144Pro Gly Glu ser Leu Lys Ile ser Cys Lys Gly ser Gly Tyr Thr vai35 40 45
acc agt tac tgg ate ggc tgg gtg cgc cag atg ccc ggg aaa ggc ctg 192Thr Ser Tyr Trp Ile Gly Trp VaT Arg Gln Met Pro GTy Lys GTy Leu50 55 60
gag tgg atg gga ttc ate tat cct ggt gac tet gaa acc aga tac agt 240Glu Trp Met GTy Phe Ile Tyr Pro GTy Asp Ser Glu Thr Arg Tyr Ser65 70 75 80
ccg acc ttc caa ggc cag gtc acc ate tca gcc gac aag tcc ttc aat 288Pro Thr Phe Gln GTy Gln Val Thr Ile ser Ala Asp Lys ser Phe Asn85 90 95
acc gcc ttc ctg cag tgg age agt cta aag gcc tcg gac acc gcc atg 336Thr Ala Phe Leu Gln Trp ser Ser Leu Lys Ala Ser Asp Thr Ala Met100 105 110
tat tac tgt gcg cga gtc ggc agt ggc tgg tac cct tat act ttt gat 384Tyr Tyr cys Ala Arg Val GTy ser GTy Trp Tyr Pro Tyr Thr Phe Asp115 120 125
ate tgg ggc caa ggg aca atg gtc acc gtc tet tca gcg tcg acc aag 432lie Trp Gly Gln GTy Thr Met Val Thr vai ser ser Ala Ser Thr Lys130 135 140
ggc cca tcg gtc ttc ccc ctg gea ccc tcc tcc aag age acc tet ggg 480GTy Pro ser Val Phe Pro Leu Ala Pro Ser Ser Lys ser Thr Ser GTy145 150 155 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528
100201008010140102001026010278Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro165 170 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc age ggc gtg cac acc 576vai Thr vai ser Trp Asn Ser Gly Ala Leu Thr Ser Gly vai His Thr180 185 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc age age gtg 624Phe Pro Ala vai Leu Gln Ser ser Giy Leu Tyr ser Leu ser ser Val195 200 205
gtg acc gtg cce tcc age age ttg ggc acc cag acc tac ate tgc aac 672vai Thr vai Pro Ser Ser ser Leu Gly Thr Gln Thr Tyr Ile cys Asn210 215 220
gtg aat cac aag ccc age aac acc aag gtg gac aag aaa gtt gag cce 720vai Asn His Lys Pro Ser Asn Thr Lys vai Asp Lys Lys vai Glu Pro225 230 235 240
aaa tet tgt gac aaa act cac aca tgc cca ccg tgc cca gea cct gaa 768Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu245 250 255
gcc gcg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac
Ala Ala Gly Gly Pro Ser vai Phe Leu Phe Pro Pro Lys Pro Lys Asp
260 265 270
acc etc atg ate tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gacThr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys vai vai Val Asp
275 280 285
gtg age cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc
VaT ser His Glu Asp Pro Glu vai Lys Phe Asn Trp Tyr vai Asp Giy
290 295 300
816
864
912
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960Val Glu VaT His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn305 310 315 320
age acg tac cgt gtg gtc age gtc ctc acc gtc ctg cac cag gac tgg 1008Ser Thr Tyr Arg VaT Val ser Val Leu Thr Val Leu His Gln Asp Trp325 330 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056Leu Asn GTy Lys Glu Tyr Lys Cys Lys Val ser Asn Lys Ala Leu Pro340 345 350
gcc ccc ate gag aaa acc ate tcc aaa gcc aaa ggg cag ccc cga gaa 1104Ala Pro Ile Glu Lys Thr Ile ser Lys Ala Lys Gly Gln Pro Arg Glu355 360 365
cca cag gtg tac acc ctg ccc cca tcc cgc gag gag atg acc aag aac 1152Pro Gln VaT Tyr Thr Leu Pro Pro ser Arg Glu Glu Met Thr Lys Asn370 375 380
cag gtc age ctg acc tgc ctg gtc aaa ggc ttc tat ccc age gac ate 1200Gln Val Ser Leu Thr Cys Leu vai Lys GTy Phe Tyr Pro ser Asp Ile385 390 395 400
gcc gtg gag tgg gag age aat ggg cag ccg gag aac aac tac aag acc 1248Ala VaT Glu Trp Glu Ser Asn GTy Gln Pro Glu Asn Asn Tyr Lys Thr405 410 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac age aag 1296Thr Pro Pro VaT Leu Asp Ser Asp GTy Ser Phe Phe Leu Tyr ser Lys420 425 ' 430
ctc acc gtg gac aag age agg tgg cag cag ggg aac gtc ttc tca tgc 1344Leu Thr vai Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys435 440 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag áag age ctc 1392ser vai Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu450 455 460
tcc ctg tet agg ggt aaa cgc gaa cca gtt tat ttc cag ggg age ttg 1440Ser Leu Ser Arg Gly Lys Arg Glu Pro Val Tyr Phe Gln Giy Ser Leu465 470 475 480
ttt aag ggg ccg cgt gat tat aac cca ata tcg agt gcc att tgt cat 1488Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile ser Ser Ala Ile Cys His485 490 495
cta acg aat gaa tet gat ggg cac aca aca tcg ttg tat ggt att ggt
Leu Thr Asn Glu ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly
500 505 510
ttt ggc cct ttc ate ate aca aac aag cat ttg ttt aga aga aat aat
Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn515 520 525
cct tca tet gat ggt ata ttc tgg aaa cat tgg att cag acc aag gatPro ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp610 615 620
ggg cac tgt ggt age ccg ttg gtg tca act aga gat ggg ttt att gttGly His Cys Gly Ser Pro Leu vai Ser Thr Arg Asp Gly Phe Ile vai625 630 635 640
ggc cac aaa gtt ttc atg age aaa cct gaa gaa ccc ttt cag cca gtcGly His Lys Val Phe Met ser Lys Pro Glu Glu Pro Phe Gln Pro Val690 695 700
1536
1584
ggt aca ctg tta gtt caa tca cta cat ggt gtg ttc aag gta aag aat 1632
Gly Thr Leu Leu Val Gln ser Leu His Gly VaT Phe Lys vai Lys Asn530 535 540
acc aca act ttg caa caa cac ctc att gat ggg agg gac atg atg ctc 1680
Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp Met Met Leu545 550 555 560
att cgc atg cct aag gat ttc cca cca ttt cct caa aag ctg aaa ttc 1728
lie Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe565 570 575
aga gag cca caa agg gaa gag cgc ata tgt ctt gtg aca acc aac ttc 1776
Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu VaT Thr Thr Asn Phe
580 585 590
caa act aag age atg tet age atg gtt tca gat act agt tgc aca ttc 1824
Gln Thr Lys Ser Met Ser ser Met Val Ser Asp Thr ser Cys Thr Phe
595 600 605
1872
1920
ggt ata cac tca gea tca aat ttc acc aac aca aac aat tat ttt aca 1968GTy Ile His Ser Ala ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr645 650 655
agt gtg ccg aaa gac ttc atg gat tta ttg aca aat caa gag gcg cag 2016ser VaT Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln660 665 670
caa tgg gtt agt ggt tgg cga ttg aat gct gac tca gtg tta tgg gga 2064Gln Trp vai Ser GTy Trp Arg Leu Asn Ala Asp Ser VaT Leu Trp Gly675 680 685
2112
aaa gaa gea act caa ctc atg agt gaa tta gtc tac tcg caa ggg atg 2160Lys Glu Ala Thr Gln Leu Met Ser Glu Leu Val Tyr ser Gln Gly Met705 710 715 720
gaa gcc cca gcg cag ctt ctc ttc ctc ctg cta ctc tgg ctc cca gat 2208Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp725 730 735
acc act gga gaa ata gtg atg acg cag tct cca gcc acc ctg tct gtg 2256Thr Thr Gly Glu Ile Val Met Thr Gln Ser Pro Ala Thr Leu Ser VaT740 745 750
tct cca ggg gaa aga gcc acc ctc tcc tgc agg gcc agt gag agt att 2304Ser Pro GTy Glu Arg Ala Thr Leu ser cys Arg Ala Ser Glu ser Ile755 760 765
age age aac tta gcc tgg tac cag cag aaa cct ggc cag gct ccc agg 2352Ser ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro GTy Gln Ala Pro Arg770 775 780
ctc ttc ate tat act gea tcc acc agg gcc act gat ate cca gcc agg 2400Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg785 790 795 800
ttc agt ggc agt ggg tct ggg aca gag ttc act ctc acc ate age age 2448Phe ser GTy ser GTy ser GTy Thr Glu Phe Thr Leu Thr Ile Ser ser.
805 810 815
ctg cag tct gaa gat ttt gea gtt tat tac tgt cag cag tat aat aac 2496Leu Gln Ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn820 825 830
tgg cct tcg ate acc ttc ggc caa ggg aca cga ctg gag att aaa cgaTrp Pro Ser Ile Thr phè GTy Gln GTy Thr Arg Leu Glu Ile Lys Arg835 840 845
2544
act gtg gct gea cca tct gtc ttc ate ttc ccg cca tct gat gag cag 2592Thr VaT Ala Ala Pro ser vai Phe Ile Phe Pro Pro Ser Asp Glu Gln850 855 860
ttg aaa tct gga act gct age gtt gtg tgc ctg ctg aat aac ttc tat 2640Leu Lys ser GTy Thr Ala Ser Val VaT Cys Leu Leu Asn Asn Phe Tyr865 870 875 880
ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc caa tcg 2688Pro Arg Glu Ala Lys Val Gln Trp Lys VaT Asp Asn Ala Leu Gln ser885 890 895
ggt aac tcc cag gag agt gtc aca gag cag gac age aag gac age acc 2736GTy Asn Ser Gln Glu Ser Val Thr Glu Gln Asp ser Lys Asp Ser Thr900 905 910
tac age ctc age age acc ctg acg ctg age aaa gea gac tac gag àaa 2784Tyr Ser Leu ser ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys915 920 925
cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg age tcg ccc 2832His Lys vai Tyr Ala cys Glu Val Thr His Gln GTy Leu ser Ser Pro930 935 940
gtc aca aag age ttc aac agg gga gag tgt tga 2865
Val Thr Lys Ser Phe Asn Arg GTy Glu Cys945 950
<210> 42
<211> 954
<212> PRT
<213> Artificial<220>
<223> Constructo sintético<400> 42
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly1 5 10 15
Val Gln Cys Glu Val Gln Leu Val Gln ser Gly Thr Glu Val Lys Lys20 25 30
Pro Gly Glu ser Leu Lys Ile ser Cys Lys Gly Ser Gly Tyr Thr vai35 40 45
Thr ser Tyr Trp lie Gly Trp Val Arg Gln Met Pro Gly Lys Gly Leu50 55 60
Glu Trp Met Gly Phe Xle Tyr Pro Gly Asp ser Glu Thr Arg Tyr Ser65 70 75 80
Pro Thr Phe Gln Gly Gln Val Thr Ile ser Ala Asp Lys ser Phe Asn85 90 95
Thr Ala Phe Leu Gln Trp Ser Ser Leu Lys Ala Ser Asp Thr Ala Met100 105 110
Tyr Tyr Cys Ala Arg Val Gly Ser Gly Trp Tyr Pro Tyr Thr Phe Asp115 120 125
lie Trp Gly Gln Gly Thr Met vai Thr vai ser ser Ala Ser Thr Lys130 135 140
Gly Pro ser Val Phe Pro Leu Ala Pro Ser ser Lys Ser Thr ser Gly145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro165 170 175
Val Thr vai Ser Trp Asn Ser Gly Ala Leu Thr ser Gly vai His Thr180 185 190
Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr ser Leu Ser ser Val195 200 205
vai Thr Val Pro ser ser ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn210 215 220
Val Asn His Lys Pro ser Asn Thr Lys vai Asp Lys Lys vai Glu Pro225 230 235 240
Lys ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu245 250 255Ala Ala Gly Gly Pro ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp260 265 270
Thr Leu Met Ile Ser Arg Thr Pro GlU Val Thr Cys Val Val Val Asp275 280 285
vai Ser His Glu Asp Pro Glu vai Lys Phe Asn Trp Tyr vai Asp Gly290 295 300
vai Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn305 310 315 320
ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro340 345 350
Ala Pro Ile Glu Lys Thr Ile ser Lys Ala Lys Gly Gln Pro Arg Glu355 360 365
Pro Gln vai Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn370 375 380
Gln vai Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile385 390 395 400
Ala vai Glu Trp Glu ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr405 410 415
Thr Pro Pro Val Leu Asp ser Asp Gly Ser Phe Phe Leu Tyr ser Lys420 425 430
Leu Thr vai Asp Lys ser Arg Trp Gln Gln Gly Asn Val Phe ser Cys435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys ser Leu450 455 460
ser Leu Ser Arg Gly Lys Arg Glu Pro vai Tyr Phe Gln Gly Ser Leu465 470 475 480
Phe Lys Gly Pro Arg Asp Tyr Asn Pro Ile ser ser Ala Ile Cys His485 490 . 495
Leu Thr Asn Glu ser Asp Gly His Thr Thr ser Leu Tyr Gly Ile Gly500 505 510
Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn Asn515 520 525Gly Thr Leu Leu vai Gln Ser Leu His Gly vai Phe Lys vai Lys Asn530 535 540
Thr Thr Thr Leu Gln Gln Hi s Leu Ile Asp Gly Arg Asp Met Met Leu545 550 555 560
Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln Lys Leu Lys Phe565 570 575
Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu Val Thr Thr Asn Phe580 585 590
Gln Thr Lys Ser Met ser Ser Met Val ser Asp Thr Ser Cys Thr Phe595 600 605
Pro ser Ser Asp Gly Ile Phe Trp Lys His Trp Ile Gln Thr Lys Asp610 615 620
Gly His Cys Gly ser Pro Leu vai ser Thr Arg Asp Gly Phe Ile Val625 630 635 640
Gly ile His ser Ala ser Asn Phe Thr Asn Thr Asn Asn Tyr Phe Thr645 650 655
Ser vai Pro Lys Asp Phe Met Asp Leu Leu Thr Asn Gln Glu Ala Gln660 665 670
Gln Trp Val Ser Gly Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly675 680 685
Gly His Lys Val Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val690 695 700
Lys Glu Ala Thr Gln Leu Met Ser Glu Leu vai Tyr Ser Gln Gly Met705 710 715 720
Glu Ala Pro Ala Gln Leu Leu Phe Leu Leu Leu Leu Trp Leu Pro Asp725 730 735
Thr Thr Gly Glu Ile vai Met Thr Gln Ser Pro Ala Thr Leu ser vai740 745 750
Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala ser Glu ser Ile755 760 765
ser Ser Asn Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg770 775 780
Leu Phe Ile Tyr Thr Ala Ser Thr Arg Ala Thr Asp Ile Pro Ala Arg785 790 795 800Phe ser Gly Ser Gly Ser Gly Thr Glu Phe Thr Leu Thr lie ser Ser
S05
810
815
Leu Gln ser Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Asn Asn
820
825
830
Trp Pro Ser Ile Thr Phe Gly Gln Gly Thr Arg Leu Glu Ile Lys Arg
835
840
845
Thr vai Ala Ala Pro ser Val Phe lie Phe Pro Pro ser Asp Glu Gln
850
855
860
Leu Lys Ser Gly Thr Ala Ser Val vai Cys Leu Leu Asn Asn Phe Tyr865 870 875 880
Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser885 890 895
Gly Asn Ser Gln Glu ser vai Thr Glu Gln Asp ser Lys Asp ser Thr900 905 910
Tyr ser Leu Ser ser Thr Leu Thr Leu ser Lys Ala Asp Tyr Glu Lys915 920 925
His Lys Val Tyr Ala cys Glu vai Thr His Gln Gly Leu Ser Ser Pro930 935 940
Val Thr Lys Ser Phe Asn Arg Gly Glu Cys945 950
<210> 43
<211> 10242
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: vetor de expressão de poliproteína ABT-325 TEV<400> 43
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt ccttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtgcagt ctggaacaga ggtgaaaaaa cccggggagt ctctgaagat ctcctgtaag 1380
ggttctggat acactgttac cagttactgg atcggctggg tgcgccagat gcccgggaaa 1440
ggcctggagt ggatgggatt catctatcct ggtgactctg aaaccagata cagtccgacc 1500
ttccaaggcc aggtcaccat ctcagccgac aagtccttca ataccgcctt cctgcagtgg 1560
agcagtctaa aggcctcgga caccgccatg tattactgtg cgcgagtcgg cagtggctgg 1620
tacccttata cttttgatat ctggggccaa gggacaatgg tcaccgtctc ttcagcgtcg 1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aagccgcggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccgcga ggagatgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccactá cacgcagaag 2640
agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag 2700
gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat 2760
gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat 2820
ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta 2880
aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc 2940
atgcctaagg atttcccaçc atttcctcaa aagctgaaat tcagagagcc acaaagggaa 3000
gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca 3060
gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc 3120
aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata 3180
cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc 3240
atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct 3300
gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag 3360
ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggaagcc 3420
ccagcgcagc ttctcttcct cctgctactc tggctcccag ataccactgg agaaatagtg 3480
atgacgcagt ctccagccac cctgtctgtg tctccagggg aaagagccac cctctcctgc 3540
agggccagtg agagtattag cagcaactta gcctggtacc agcagaaacc tggccaggct 3600
cccaggctct tcatctatac tgcatccacc agggccactg atatcccagc caggttcagt 3660
ggcagtgggt ctgggacaga gttcactctc accatcagca gcctgcagtc tgaagatttt 3720
gcagtttatt actgtcagca gtataataac tggccttcga tcaccttcgg ccaagggaca 3780
cgactggaga ttaaacgaac tgtggctgca ccatctgtct tcatcttccc gccatctgat 3840
gagcagttga aatctggaac tgctagcgtt gtgtgcctgc tgaataactt ctatcccaga 3900
gaggccaaag tacagtggaa ggtggataac gccctccaat cgggtaactc ccaggagagt 3960
gtcacagagc aggacagcaa ggacagcacc tacagcctca gcagcaccct gacgctgagc 4020
aaagcagact acgagaaaca caaagtctac gcctgcgaag tcacccatca gggcctgagc 4080
tcgcccgtca caaagagctt caacagggga gagtgttgãg cggccgcgtt taaactgaat 4140
gagcgcgtcc atccagacat gataagatac attgatgagt ttggacaaac cacaactaga 4200
atgcagtgaa aaaaatgctt tatttgtgaa atttgtgatg ctattgcttt atttgtaacc 4260
attataagct gcaataaaca agttaacaac aacaattgca ttcattttat gtttcaggtt 4320
cagggggagg tgtgggaggt tttttaaagc aagtaaaacc tctacaaatg tggtatggct 4380
gattatgatc cggctgcctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc 4440
agctcccgga gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc 4500
agggcgcgtc agcgggtgtt ggcgggtgtc ggggcgcagc catgaccggt cgacggcgcg 4560
cctttttttt taatttttat tttattttat ttttgacgcg ccgaaggcgc gatctgagct 4620cggtacagct tggctgtgga atgtgtgtca gttagggtgt ggaaagtccc caggctcccc 4680
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccaggt gtggaaagtc 4740
cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt cagcaaccat 4800
agtcccgccc ctaactccgc ccatcccgcc cctaactccg cccagttccg cccattctcc 4860
gccccatggc tgactaattt tttttattta tgcagaggcc gaggccgcct cggcctctga 4920
gctattccag aagtagtgag gaggcttttt tggaggccta ggcttttgca aaaagctcct 4980
cgaggaactg aaaaaccaga aagttaactg gtaagtttag tctttttgtc ttttatttca 5040
ggtcccggat ccggtggtgg tgcaaatcaa agaactgctc ctcagtggat gttgccttta 5100
cttctaggcc tgtacggaag tgttacttct gctctaaaag ctgcggaatt gtacccgcgg 5160
cctaatacga ctcactatag ggactagtat ggttcgacca ttgaactgca tcgtcgccgt 5220
gtcccaaaat atggggattg gcaagaacgg agacctaccc tggcctccgc tcaggaacga 5280
gttcaagtac ttccaaagaa tgaccacaac ctcttcagtg gaaggtaaac agaatctggt 5340
gattatgggt aggaaaacct ggttctccat tcctgagaag aatcgacctt taaaggacag 5400
aattaatata gttctcagta gagaactcaa agaaccacca cgaggagctc attttcttgc 5460
caaaagttta gatgatgcct taagacttat tgaacaaccg gaattggcaa gtaaagtaga 5520
catggtttgg atagtcggag gcagttctgt ttaccaggaa gccatgaatc aaccaggcca 5580
cctcagactc tttgtgacaa ggatcatgca ggaatttgaa agtgacacgt ttttcccaga 5640
aattgatttg gggaaatata aacttctccc agaataccca ggcgtcctct ctgaggtcca 5700
ggaggaaaaa ggcatcaagt ataagtttga agtctacgag aagaaagact aagcggccga 5760
gcgcgcggat ctggaaacgg gagatggggg aggctaactg aagcacggaa ggagacaata 5820
ccggaaggaa cccgcgctat gacggcaata aaaagacaga ataaaacgca cgggtgttgg 5880
gtcgtttgtt cataaacgcg gggttcggtc ccagggctgg cactctgtcg ataccccacc 5940
gagaccccat tggggccaat acgcccgcgt ttcttccttt tccccacccc accccccaag 6000
ttcgggtgaa ggcccagggc tcgcagccaa cgtcggggcg gcaggccctg ccatagccac 6060
tggccccgtg ggttagggac ggggtccccc atggggaatg gtttatggtt cgtgggggtt 6120
attattttgg gcgttgcgtg gggtctggag atcccccggg ctgcaggaat tccgttacat 6180
tacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa 6240
taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt caatgggtgg 6300
agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg ccaagtacgc 6360
cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag tacatgacct 6420
tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt accatggtga 6480
tgcggttttg gcagtacatc aatgggcgtg gatagcggtt tgactcacgg ggatttccaa 6540
gtctccaccc cattgacgtc aatgggagtt tgttttggca ccaaaatcaa cgggactttc 6600
caaaatgtcg taacaactcc gccccattga cgcaaaaggg cgggaattcg agctcggtac 6660tcgagcggtg ttccgcggtc ctcctcgtat agaaactcgg accactctga gacgaaggct 6720
cgcgtccagg ccagcacgaa ggaggctaag tgggaggggt agcggtcgtt gtccactagg 6780
gggtccactc gctccagggt gtgaagacac atgtcgccct cttcggcatc aaggaaggtg 6840
attggtttat aggtgtaggc cacgtgaccg ggtgttcctg aaggggggct ataaaagggg 6900
gtgggggcgc gttcgtcctc actctcttcc gcatcgctgt ctgcgagggc cagctgttgg 6960
gctcgcggtt gaggacaaac tcttcgcggt ctttccagta ctcttggatc ggaaacccgt 7020
cggcctccga acggtactcc gccaccgagg gacctgagcg agtccgcatc gaccggatcg 7080
gaaaacctct cgactgttgg ggtgagtact ccctctcaaa agcgggcatg acttctgcgc 7140
taagattgtc agtttccaaa aacgaggagg atttgatatt cacctggccc gcggtgatgc 7200
ctttgagggt ggccgcgtcc atctggtcag aaaagacaat ctttttgttg tcaagcttga 7260
ggtgtggcag gcttgagatc tggccataca cttgagtgac aatgacatcc actttgectt 7320
tctctccaca ggtgtccact cccaggtcca accggaattg tacccgcggc cagagcttgc 7380
gggcgccacc gcggccgcgg ggatccagac atgataagat acattgatga gtttggacaa 7440
accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 7500
ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 7560
atgtttcagg ttcaggggga ggtgtgggag gttttttcgg atcctcttgg cgtaatcatg 7620
gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 7680
cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 7740
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 7800
cggccaacgc gcggggaaag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 7860
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 7920
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 7980
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg ttcttccata ggctccgccc 8040
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 8100
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 8160
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 8220
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 8280
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 8340
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 8400
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 8460
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 8520
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 8580
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 8640
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 8700gatcttcacc tagatccctt ttaattaaaa atgaagtttt aaatcaatct aaagtatata 8760
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 8820
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 8880
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 8940
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 9000
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 9060
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 9120
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 9180
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 9240
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 9300
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 9360
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 9420
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 9480
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 9540
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 9600
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 9660
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 9720
gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 9780
agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 9840
tctcgcgcgt ttcggtgatg acggtgaaaa cctctgacac atgcagctcc cggagacggt 9900
cacagcttgt ctgtaagcgg atgccgggag cagacaagcc cgtcagggcg cgtcagcggg 9960
tgttggcggg tgtcggggct ggcttaacta tgcggcatca gagcagattg tactgagagt 10020
gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg 10080
ccattcgcca ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct 10140
attacgccag ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg 10200
gttttcccag ttacgacgtt gtaaaacgac ggccagtgaa tt 10242
<210> 44<211> 10245<212> DNA<213> Artificial
<220>
<223> Constructo sintético, expressão de vetor da poliproteína D2E7 TEV<400> 44
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcatàa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640
agcctctccc tgtctagggg taaacgcgaa ccagtttatt tccaggggag cttgtttaag 2700
gggccgcgtg attataaccc aatatcgagt gccatttgtc atctaacgaa tgaatctgat 2760
gggcacacaa catcgttgta tggtattggt tttggccctt tcatcatcac aaacaagcat 2820
ttgtttagaa gaaataatgg tacactgtta gttcaatcac tacatggtgt gttcaaggta 2880
aagaatacca caactttgca acaacacctc attgatggga gggacatgat gctcattcgc 2940
atgcctaagg atttcccacc atttcctcaa aagctgaaat tcagagagcc acaaagggaa 3000
gagcgcatat gtcttgtgac aaccaacttc caaactaaga gcatgtctag catggtttca 3060
gatactagtt gcacattccc ttcatctgat ggtatattct ggaaacattg gattcagacc 3120
aaggatgggc actgtggtag cccgttggtg tcaactagag atgggtttat tgttggtata 3180
cactcagcat caaatttcac caacacaaac aattatttta caagtgtgcc gaaagacttc 3240
atggatttat tgacaaatca agaggcgcag caatgggtta gtggttggcg attgaatgct 3300
gactcagtgt tatggggagg ccacaaagtt ttcatgagca aacctgaaga accctttcag 3360
ccagtcaaag aagcaactca actcatgagt gaattagtct actcgcaagg gatggacatg 3420
cgcgtgcccg cccagctgct gggcctgctg ctgctgtggt tccccggctc gcgatgcgac 3480
atccagatga cccagtctcc atcctccctg tctgcatctg taggggacag agtcaccatc 3540
acttgtcggg caagtcaggg catcagaaat tacttagcct ggtatcagca aaaaccaggg 3600
aaagccccta agctcctgat ctatgctgca tccactttgc aatcaggggt cccatctcgg 3660
ttcagtggca gtggatctgg gacagatttc actctcacca tcagcagcct acagcctgaa 3720
gatgttgcaa cttattactg tcaaaggtat aaccgtgcac cgtatacttt tggccagggg 3780
accaaggtgg aaatcaaacg tacggtggct gcaccatctg tcttcatctt cccgccatct 3840
gatgagcagt tgaaatctgg aactgcctct gttgtgtgcc tgçtgaataa cttctatccc 3900
agagaggcca aagtacagtg gaaggtggat aacgccctcc aatcgggtaa ctcccaggag 3960
agtgtcacag agcaggacag caaggacagc acctacagcc tcagcagcac cctgacgctg 4020
agcaaagcag actacgagaa acacaaagtc tacgcctgcg aagtcaccça tcagggcctg 4080
agctcgcccg tcacaaagag cttcaacagg ggagagtgtt gagcggccgc gtttaaactg 4140
aatgagcgcg tccatccaga catgataaga tacattgatg agtttggaca aaccacaact 4200
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 4260accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 4320
gttcaggggg aggtgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtatg 4380
gctgattatg atccggctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 4440
tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 4500
gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc agccatgacc ggtcgacggc 4560
gcgccttttt ttttaatttt tattttattt tatttttgac gcgccgaagg cgcgatctga 4620
gctcggtaca gcttggctgt ggaatgtgtg tcagttaggg tgtggaaagt ccccaggctc 4680
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca ggtgtggaaa 4740
gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt agtcagcaac 4800
catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt ccgcccattc 4860
tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg cctcggcctc 4920
tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt gcaaaaagct 4980
cctcgaggaa ctgaaaaacc agaaagttaa ctggtaagtt tagtcttttt gtcttttatt 5040
tcaggtcccg gatccggtgg tggtgcaaat caaagaactg ctcctcagtg gatgttgcct 5100
ttacttctag gcctgtacgg aagtgttact tctgctctaa aagctgcgga attgtacccg 5160
cggcctaata cgactcacta tagggactag tatggttcga ccattgaact gcatcgtcgc 5220
cgtgtcccaa aatatgggga ttggcaagaa cggagaccta ccctggcctc cgctcaggaa 5280
cgagttcaag tacttccaaa gaatgaccac aacctcttca gtggaaggta aacagaatct 5340
ggtgattatg ggtaggaaaa cctggttctc cattcctgag aagaatcgac ctttaaagga 5400
cagaattaat atagttctca gtagagaact caaagaacca ccacgaggag ctcattttct 5460
tgccaaaagt ttagatgatg ccttaagact tattgaacaa ccggaattgg caagtaaagt 5520
agacatggtt tggatagtcg gaggcagttc tgtttaccag gaagccatga atcaaccagg 5580
ccacctcaga ctctttgtga caaggatcat gcaggaattt gaaagtgaca cgtttttccc 5640
agaaattgat ttggggaaat ataaacttct cccagaatac ccaggcgtcc tctctgaggt 5700
ccaggaggaa aaaggcatca agtataagtt tgaagtctac gagaagaaag actaagcggc 5760
cgagcgcgcg gatctggaaa cgggagatgg gggaggctaa ctgaagcacg gaaggagaca 5820
ataccggaag gaacccgcgc tatgacggca ataaaaagac agaataaaac gcacgggtgt 5880
tgggtcgttt gttcataaac gcggggttcg gtcccagggc tggcactctg tcgatacccc 5940
accgagaccc cattggggcc aatacgcccg cgtttcttcc ttttccccac cccacccccc 6000
aagttcgggt gaaggcccag ggctcgcagc caacgtcggg gcggcaggcc ctgccatagc 6060
cactggcccc gtgggttagg gacggggtcc cccatgggga atggtttatg gttcgtgggg 6120
gttattattt tgggcgttgc gtggggtctg gagatccccc gggctgcagg aattccgtta 6180
cattacttac ggtaaatggc ccgcctggct gaccgcccaa cgacccccgc ccattgacgt 6240
caataatgac gtatgttccc atagtaacgc caatagggac tttccattga cgtcaatggg 6300tggagtattt acggtaaact gcccacttgg cagtacatca agtgtatcat atgccaagta 6360
cgccccctat tgacgtcaat gacggtaaat ggcccgcctg gcattatgcc cagtacatga 6420
ccttatggga ctttcctact tggcagtaca tctacgtatt agtcatcgct attaccatgg 6480
tgatgcggtt ttggcagtac atcaatgggc gtggatagcg gtttgactca cggggatttc 6540
caagtctcca ccccattgac gtcaatggga gtttgttttg gcaccaaaat caacgggact 6600
ttccaaaatg tcgtaacaac tccgccccat tgacgcaaaa gggcgggaat tcgagctcgg 6660
tactcgagcg gtgttccgcg gtcctcctcg tatagaaact cggaccactc tgagacgaag 6720
gctcgcgtcc aggccagcac gaaggaggct aagtgggagg ggtagcggtc gttgtccact 6780
agggggtcca ctcgctccag ggtgtgaaga cacatgtcgc cctcttcggc atcaaggaag 6840
gtgattggtt tataggtgta ggccacgtga ccgggtgttc ctgaaggggg gctataaaag 6900
ggggtggggg cgcgttcgtc ctcactctct tccgcatcgc tgtctgcgag ggccagctgt 6960
tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg atcggaaacc 7020
cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc atcgaccgga 7080
tcggaaaacc tctcgactgt tggggtgagt actccctctc aaaagcgggc atgacttctg 7140
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgcggtga 7200
tgcctttgag ggtggccgcg tccatctggt cagaaaagac aatctttttg ttgtcaagct 7260
tgaggtgtgg caggcttgag atctggccat acacttgagt gacaatgaca tccactttgc 7320
ctttctctcc acaggtgtcc actcccaggt ccaaccggaa ttgtacccgc ggccagagct 7380
tgcgggcgcc accgcggccg cggggatcca gacatgataa gatacattga tgagtttgga 7440
caaaccacaa ctagaatgca gtgaaaaaaa tgctttattt gtgaaatttg tgatgctatt 7500
gctttatttg taaccattat aagctgcaat aaacaagtta acaacaacaa ttgcattcat 7560
tttatgtttc aggttcaggg ggaggtgtgg gaggtttttt cggatcctct tggcgtaatc 7620
atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 7680
agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 7740
tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 7800
aatcggccaa cgcgcgggga aaggcggttt gcgtattggg cgctcttccg cttcctcgct 7860
cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 7920
ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 7980
ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgttcttcc ataggctccg 8040
cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 8100
actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 8160
cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 8220
tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 8280
gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 8340caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 8400
agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 8460
tagaagaaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 8520
tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 8580
gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 8640
gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 8700
aaggatcttc acctagatcc cttttaatta aaaatgaagt tttaaatcaa tctaaagtat 8760
atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 8820
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 8880
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 8940
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 9000
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 9060
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 9120
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 9180
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 9240
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 9300
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 9360
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 9420
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 9480
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 9540
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 9600
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 9660
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 9720
ttagaaaaac aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 9780
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 9840
tcgtctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc tcccggagac 9900
ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc 9960
gggtgttggc gggtgtcggg gctggcttaa ctatgcggca tcagagcaga ttgtactgag 10020
agtgcaccat atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag 10080
gcgccattcg ccattcaggc tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc 10140
gctattacgc cagctggcga aagggggatg tgctgcaagg cgattaagtt gggtaacgcc 10200
agggttttcc cagttacgac gttgtaaaac gacggccagt gaatt 10245
<210> 45<211> 2196<212> ONA<213> Artificial
<220>
<223> Constructo sintético, seqüência codificante D2E7 interna capaz de rachar aosinal da construção do peptídeo
<220>
<221> CDS
<222> (1)..(2193)
<400> 45
atg gag ttt ggg ctg age tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Giy Leu ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly1 5 10 15
gtc cag tgt gag gtg cag ctg gtg gag tet ggg gga ggc ttg gta cagVal Gln Cys Glu Val Gln Leu Val Glu ser Gly Gly Gly Leu vai Gln20 25 30
96
ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tet gga ttc acc ttt 144Pro Giy Arg Ser Leu Arg Leu ser Cys Ala Ala Ser Gly Phe Thr Phe35 40 45
gat gat tat gcc atg cac tgg gtc cgg caa gct cca ggg aag ggc ctg 192Asp Asp Tyr Ala Met His Trp vai Arg Gln Ala Pro Gly Lys Gly Leu50 55 60
gaa tgg gtc tca gct ate act tgg aat agt ggt cac ata gac tat gcg 240Glu Trp vai ser Ala Ile Thr Trp Asn Ser Giy His He Asp Tyr Ala65 70 75 80
gac tet gtg gag ggc cga ttc acc ate tcc aga gac aac gcc aag aac 288Asp ser VaT Glu Gly Arg Phe Thr Ile ser Arg Asp Asn Ala Lys Asn85 90 95
tcc ctg tat ctg caa atg aac agt ctg aga gct gag gat acg gcc gta 336ser Leu Tyr Leu Gln Met Asn ser Leu Arg Ala Glu Asp Thr Ala Val100 105 110
tat tac tgt gcg aaa gtc tcg tac ctt age acc gcg tcc tcc ctt gac 384Tyr Tyr Cys Ala Lys Val ser Tyr Leu ser Thr Ala ser ser Leu Asp115 120 125
tat tgg ggc caa ggt acc ctg gtc acc gtc tcg agt gcg tcg acc aag 432Tyr Trp Gly Gln Gly Thr Leu Val Thr Val ser Ser Ala ser Thr Lys130 135 140
ggc cca tcg gtc ttc ccc ctg gea ccc tcc tcc aag age acc tet ggg 480Gly Pro Ser Val Phe Pro Leu Ala Pro ser Ser Lys ser Thr Ser Giy145 150 155 160
ggc aca gcg gcc ctg ggc tgc ctg gtc aag gac tac ttc ccc gaa ccg 528Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro165 170 175
gtg acg gtg tcg tgg aac tca ggc gcc ctg acc age ggc gtg cac acc 576vai Thr Val Ser Trp Asn ser Gly Ala Leu Thr Ser Gly Val His Thr180 185 190
ttc ccg gct gtc cta cag tcc tca gga ctc tac tcc ctc age age gtg 624Phe Pro Ala vai Leu Gln Ser ser Gly Leu Tyr Ser Leu ser Ser VaT195 200 205
gtg acc gtg ccc tcc age age ttg ggc acc cag acc tac ate tgc aac 672VaT Thr VaT Pro ser ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn210 215 220gtg aat cac aag ccc age aac acc aag gtg gac aag aaa gtt gag ccc 720VaT Asn His Lys Pro Ser Asn Thr Lys vai Asp Lys Lys vai Glu Pro225 2B0 235 240
aaa tet tgt gac aaa act cac aca tgc cca ccg tgc cca gea cct gaa 768Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu245 250 255
ctc ctg ggg gga ccg tca gtc ttc ctc ttc ccc cca aaa ccc aag gac 816Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp260 265 270
acc ctc atg ate tcc cgg acc cct gag gtc aca tgc gtg gtg gtg gac 864Thr Leu Met Ile ser Arg Thr Pro Glu vai Thr cys Val Val VaT Asp275 280 285
gtg age cac gaa gac cct gag gtc aag ttc aac tgg tac gtg gac ggc 912VaT Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr VaT Asp GTy290 295 300
gtg gag gtg cat aat gcc aag aca aag ccg cgg gag gag cag tac aac 960VaT Glu VaT His Asn Ala Lys Thr Lys pro Arg Glu Glu Gln Tyr Asn305 310 315 320
age acg tac cgt gtg gtc age gtc ctc acc gtc ctg cac cag gac tgg 1008ser Thr Tyr Arg VaT vai Ser Val Leu Thr vai Leu His Gln Asp Trp325 330 335
ctg aat ggc aag gag tac aag tgc aag gtc tcc aac aaa gcc ctc cca 1056
Leu Asn GTy Lys Glu Tyr Lys Cys Lys vai Ser Asn Lys Ala Leu Pro340 345 350
gcc ccc ate gag aaa acc ate tcc aaa gcc aaa ggg cag ccc cga gaa 1104
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys GTy Gln Pro Arg Glu
355 360 365
cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac 1152Pro Gln VaT Tyr Thr Leu Pro Pro ser Arg Asp Glu Leu Thr Lys Asn370 375 380
cag gtc age ctg acc tgc ctg gtc aaa ggc ttc tat ccc age gac ate 1200
Gln vai ser Leu Thr cys Leu vai Lys GTy Phe Tyr Pro ser Asp Ile385 390 395 400
gcc gtg gag tgg gag age aat ggg cag ccg gag aac aac tac aag acc 1248
Ala VaT Glu Trp Glu Ser Asn GTy Gln Pro Glu Asn Asn Tyr Lys Thr405. 410 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac age aag 1296Thr Pro Pro VaT Leu Asp ser Asp GTy ser Phe Phe Leu Tyr ser Lys420 425 430
ctc acc gtg gac aag age agg tgg cag cag ggg aac gtc ttc tca tgc 1344
Leu Thr VaT Asp Lys ser Arg Trp Gln Gln GTy Asn Val Phe Ser cys
435 440 445
tcc gtg atg cat gag gct ctg cac aac cac tac acg cag aag age ctc 1392ser VaT Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu450 455 460
tcc ctg tet agg ggt aaa cgc atg gga cga atg gea atg aaa tgg tta 1440Ser Leu ser Arg GTy Lys Arg Met GTy Arg Met Ala Met Lys Trp Leu465 470 475 480
gtt gtt ata ata tgt ttc tet ata aca agt caa cct gct tet gct atg 1488vai vai Ile ile Cys Phe Ser Ile Thr ser Gln Pro Ala ser Ala Met485 490 495gac atg cgc gtg ccc gcc cag ctg ctg ggc ctg ctg ctg ctg tgg ttc 1536Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe500 505 510
ccç ggc tcg cga tgc gac ate cag atg acc cag tet cca tcc tcc ctg 1584Pro Gly ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro Ser ser Leu515 520 525
tet gea tet gta ggg gac aga gtc acc ate act tgt cgg gea agt cag 1632Ser Ala Ser Val Gly Asp Arg vai Thr Ile Thr Cys Arg Ala ser Gln530 535 540
ggc ate aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc 1680Gly He Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala545 550 555 560
cct aag ctc ctg ate tat gct gea tcc act ttg caa tca ggg gtc cca 1728Pro Lys Leu Leu Ile Tyr Ala Ala ser Thr Leu Gln ser Gly Val Pro565 570 575
tet cgg ttc agt ggc agt gga tet ggg aca gat ttc act etc acc ate 1776Ser Arg Phe ser Gly Ser Gly Ser Giy Thr Asp Phe Thr Leu Thr Ile580 585 590
age age cta cag cct gaa gat gtt gea act tat tac tgt caa agg tat 1824Ser Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr595 600 605
àac cgt gea ccg tat act ttt ggc cag ggg acc aag gtg gaa ate aaa 1872Asn Arg Ala Pro Tyr Thr Phe Gly Gln Giy Thr Lys VaT Glu Ile Lys610 615 620
cgt acg gtg gct gea cca tet gtc ttc ate ttc ccg cca tet gat gag 1920Arg Thr VaT Ala Ala Pro ser Val Phe Ile Phe Pro Pro Ser Asp Glu625 630 635 640
cag ttg aaa tet gga act gcc tet gtt gtg tgc ctg ctg aat aac ttc 1968Gln Leu Lys ser GTy Thr Ala Ser Val VaT Cys Leu Leu Asn Asn Phe645 650 655
tat ccc aga gag gcc aaa gta cag tgg aag gta gat aac gcc ctc caa 2016Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys VaT Asp Asn Ala Leu Gln660 665 670
tcg ggt aac tcc cag gag agt gtc aca gag cag gac age aag gac age 2064ser Gly Asn ser Gln Glu ser vai Thr Glu Gln Asp ser Lys Asp ser675 680 685
acc tac age ctc age age acc ctg acg ctg age aaa gea gac tac gag 2112Thr Tyr ser Leu ser Ser Thr Leu Thr Leu ser Lys Ala Asp Tyr Glu690 695 700
aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag ggc ctg age tcgLys His Lys Val Tyr Ala Cys Glu Val Thr His Gln GTy Leu Ser ser705 710 715 720
2160
ccc gtc aca aag age ttc aac agg gga gag tgt tga 2196
Pro Val Thr Lys ser Phe Asn Arg GTy Glu Cys725 730
<210> 46<211> 731<212> PRT<213> Artificial
<220><223> Constructo sintético<400> 46
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu vai Ala Ile Leu Lys Gly1 5 10 l!
vai Gln Cys Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln20 25 30
pro Gly Arg Ser Leu Arg Leu ser cys Ala Ala Ser Gly Phe Thr Phe35 40 45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu50 55 60
Glu Trp vai Ser Ala Ile Thr Trp Asn ser Gly His He Asp Tyr Ala65. 70 75 80
Asp Ser vai Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn85 90 95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala vai100 105 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu Ser Thr Ala Ser Ser Leu Asp115 120 125
Tyr Trp Gly Gln Gly Thr Leu vai Thr vai ser ser Ala ser Thr Lys130 135 140
Gly Pro ser vai Phe Pro Leu Ala Pro Ser ser Lys ser Thr ser Gly145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro165 170 175
vai Thr Val ser Trp Asn ser Gly Ala Leu Thr ser Gly vai His Thr180 185 190
Phe Pro Ala Val Leu Gln Ser ser Gly Leu Tyr ser Leu Ser ser vai195 200 205
vai Thr Val Pro ser ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn210 215 220
Val Asn His Lys Pro ser Asn Thr Lys vai Asp Lys Lys Val Glu Pro225 230 235 240
Lys ser Cys Asp Lys Thr His Thr cys Pro Pro cys Pro Ala Pro Glu245 250 255Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp260 265 270
Thr Leu Met Ile Ser Arg Thr Pro Glu vai Thr Cys Val vai Val Asp275 280 285
Val ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr vai Asp Gly290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn305 310 315 320
ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro340 345 350
Ala Pro lie Glu Lys Thr Ile ser Lys Ala Lys Gly Gln Pro Arg Glu355 360 365
pro Gln vai Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn370 375 380
Gln vai Ser Leu Thr Cys Leu vai Lys Gly Phe Tyr Pro Ser Asp Ile385 390 395 400
Ala vai Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr405 410 415
Thr pro Pro Val Leu Asp ser Asp Gly ser Phe Phe Leu Tyr ser Lys
420 425 430
Leu Thr vai Asp Lys Ser Arg Trp Gln Gln Gly Asn vai Phe ser Cys435 440 445
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu450 455 460
ser Leu ser Arg Gly Lys Arg Met Gly Arg Met Ala Met Lys Trp Leu465 470 475 480
Val vai Ile Ile Cys Phe ser Ile Thr ser Gln Pro Ala ser Ala Met485 490 495
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe500 505 510
Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln ser Pro ser ser Leu515 520 525ser Ala Ser vai Gly Asp Arg vai Thr Ile Thr cys Arg Ala ser Gln530 535 540
Gly lie Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala545 550 555 560
Pro Lys Leu Leu lie Tyr Ala Ala ser Thr Leu Gln Ser Gly Val Pro565 570 575
ser Arg Phe Ser Gly ser Gly ser Gly Thr Asp Phe Thr Leu Thr Ile580 585 590
ser ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr cys Gln Arg Tyr595 600 605
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys vai Glu Ile Lys610 615 620
Arg Thr vai Ala Ala Pro ser vai Phe Ile Phe Pro Pro ser Asp Glu625 630 635 640
Gln Leu Lys ser Gly Thr Ala Ser vai vai Cys Leu Leu Asn Asn Phe645 650 655
Tyr Pro Arg Glu Ala Lys vai Gln Trp Lys vai Asp Asn Ala Leu Gln660 665 670
ser Gly Asn ser Gln Glu ser vai Thr Glu Gln Asp ser Lys asρ ser675 680 685
Thr Tyr ser Leu Ser ser Thr Leu Thr Leu ser Lys Ala Asp Tyr Glu690 695 700
Lys His Lys vai Tyr Ala cys Glu vai Thr His Gln Gly Leu Ser ser705 710 715 720
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu cys725 730
<210> 47<211> 9573<212> DNA<213> Artificial
<220>
<223> Constructo sintético, D2E7 capaz de rachar internamente ao sinal dopeptídeo de vetor de expressão de poliproteína
<400> 47
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgcgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680
accaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctcâ gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aactcctggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctçccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640
agcctctccc tgtctagggg taaacgcatg ggacgaatgg caatgaaatg gttagttgtt 2700
ataatatgtt tctctataac aagtcaacct gcttctgcta tggacatgcg cgtgcccgcc 2760
cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat ccagatgacc 2820
cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac ttgtcgggca 2880
agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa agcccctaag 2940
ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt cagtggcagt 3000
ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga tgttgcaact 3060
tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac caaggtggaa 3120
atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga tgagcagttg 3180
aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag agaggccaaa 3240
gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag tgtcacagag 3300
caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag caaagcagac 3360
tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag ctcgcccgtc 3420
acaaagagct tcaacagggg agagtgttga gcggccgcgt ttaaactgaa tgagcgcgtc 3480
catccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 3540
aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 3600
tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 3660
gtgtgggagg ttttttaaag caagtaaaac ctctacaaat gtggtatggc tgattatgat 3720
ccggctgcct cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg 3780
agacggtcac agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt 3840
cagcgggtgt tggcgggtgt cggggcgcag ccatgaccgg tcgacggcgc gccttttttt 3900
ttaattttta ttttatttta tttttgacgc gccgaaggcg cgatctgagc tcggtacagc 3960
ttggctgtgg aatgtgtgtc agttagggtg tggaaagtcc ccaggctccc cagcaggcag 4020
aagtatgcaa agcatgcatc tcaattagtc agcaaccagg tgtggaaagt ccccaggctc 4080
cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca tagtcccgcc 4140
cctaactccg cccatcccgc ccctaactcc gcccagttcc gcccattctc cgccccatgg 4200
ctgactaatt ttttttattt atgcagaggc cgaggccgcc tcggcctctg agctattcca 4260gaagtagtga ggaggctttt ttggaggcct aggcttttgc aaaaagctcc tcgaggaact 4320
gaaaaaccag aaagttaact ggtaagttta gtctttttgt cttttatttc aggtcccgga 4380
tccggtggtg gtgcaaatca aagaactgct cctcagtgga tgttgccttt acttctaggc 4440
ctgtacggaa gtgttacttc tgctctaaaa gctgcggaat tgtacccgcg gcctaatacg 4500
actcactata gggactagta tggttcgacc attgaactgc atcgtcgccg tgtcccaaaa 4560
tatggggatt ggcaagaacg gagacctacc ctggcctccg ctcaggaacg agttcaagta 4620
cttccaaaga atgaccacaa cctcttcagt ggaaggtaaa cagaatctgg tgattatggg 4680
taggaaaacc tggttctcca ttcctgagaa gaatcgacct ttaaaggaca gaattaatat 4740
agttctcagt agagaactca aagaaccacc acgaggagct cattttcttg ccaaaagttt 4800
agatgatgcc ttaagactta ttgaacaacc ggaattggca agtaaagtag acatggtttg 4860
gatagtcgga ggcagttctg tttaccagga agccatgaat caaccaggcc acctcagact 4920
ctttgtgaca aggatcatgc aggaatttga aagtgacacg tttttcccag aaattgattt 4980
ggggaaatat aaacttctcc cagaataccc aggcgtcctc tctgaggtcc aggaggaaaa 5040
aggcatcaag tataagtttg aagtctacga gaagaaagac taagcggccg agcgcgcgga 5100
tctggaaacg ggagatgggg gaggctaact gaagcacgga aggagacaat accggaagga 5160
acccgcgcta tgacggcaat aaaaagacag aataaaacgc acgggtgttg ggtcgtttgt 5220
tcataaacgc ggggttcggt cccagggctg gcactctgtc gataccccac cgagacccca 5280
ttggggccaa tacgcccgcg tttcttcctt ttccccaccc caccccccaa gttcgggtga 5340
aggcccaggg ctcgcagcca acgtcggggcggcaggccct gccatagcca ctggccccgt 5400
gggttaggga cggggtcccc catggggaat ggtttatggt tcgtgggggt tattattttg 5460
ggcgttgcgt ggggtctgga gatcccccgg gctgcaggaa ttccgttaca ttacttacgg 5520
taaatggccc gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt 5580
atgttcccat agtaaçgcca atagggactt tccattgacg tcaatgggtg gagtatttac 5640
ggtaaactgc ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg 5700
ι
acgtcaatga cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact 5760
ttcctacttg gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt 5820
ggcagtacat caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc 5880
ccattgacgt caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc 5940
gtaacaactc cgccccattg acgcaaaagg gcgggaattc gagctcggta ctcgagcggt 6000
gttccgcggt cctcctcgta tagaaactcg gaccactctg agacgaaggc tcgcgtccag 6060
gçcagcacga aggaggctaa gtgggagggg tagcggtcgt tgtccactag ggggtccact 6120
cgctccaggg tgtgaagaca catgtcgccc tcttcggcat caaggaaggt gattggttta 6180
taggtgtagg ccacgtgacc gggtgttcct gaaggggggc tataaaaggg ggtgggggcg 6240
cgttcgtcct cactctcttc cgcatcgctg tctgcgaggg ccagctgttg ggctcgcggt 6300tgaggacaaa ctcttcgcgg tctttccagt actcttggat cggaaacccg tcggcctccg 6360
aacggtactc cgccaccgag ggacctgagc gagtccgcat cgaccggatc ggaaaacctc 6420
tcgactgttg gggtgagtac tccctctcaa aagcgggcat gacttctgcg ctaagattgt 6480
cagtttccaa aaacgaggag gatttgatat tcacctggcc cgcggtgatg cctttgaggg 6540
tggccgcgtc catctggtca gaaaagacaa tctttttgtt gtcaagcttg aggtgtggca 6600
ggcttgagat ctggccatac acttgagtga caatgacatc cactttgcct ttctctccac 6660
aggtgtccac tcccaggtcc aaccggaatt gtacccgcgg ccagagcttg cgggcgccac 6720
cgcggccgcg gggatccaga catgataaga tacattgatg agtttggaca aaccacaact 6780
agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatt^gta 6840
accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 6900
gttcaggggg aggtgtggga ggttttttcg gatcctcttg gcgtaatcat ggtcatagct 6960
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 7020
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc 7080
actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 7140
cgcggggaaa ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 7200
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 7260
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 7320
caggaaccgt aaaaaggccg cgttgctggc gttcttccat aggctccgcc cccctgacga 7380
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 7440
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 7500
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 7560
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 7620
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 7680
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 7740
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaagaacagt 7800
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 7860
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 7920
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 7980
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 8040
ctagatccct tttaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 8100
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 8160
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 8220
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 8280
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 8340cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 8400
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 8460
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 8520
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 8580
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 8640
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 8700
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 8760
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 8820
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 8880
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 8940
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 9000
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 9060
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 9120
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtctcgcgcg 9180
tttcggtgat gacggtgaaà acctctgaca catgcagctc ccggagacgg tcacagcttg 9240
tctgtaagcg gatgccggga gcagacaagc ccgtcagggc gcgtcagcgg gtgttggcgg 9300
gtgtcggggc tggcttaact atgcggcatc agagcagatt gtactgagag tgcaccatat 9360
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gccattcgcc 9420
attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca 9480
gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca 9540
gttacgacgt tgtaaaacga cggccagtga att 9573
<210> 48
<211> 3252
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, D2E7 seqüência codificante de poliproteína de fusãode inteína
<220>
<221> CDS<222> (1)..(3249)
<400> 48
atg gag ttt ggg ctg age tgg ctt ttt ctt gtc gcg att tta aaa ggt 48
Met Glu Phe Gly Leu ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly
1 5 10 15
gtc cag tgt gag gtg cag ctg gtg gag tet ggg gga ggc ttg gta cag 96
Val Gln cys Glu vai Gln Leu vai Glu Ser GJy Gly Gly Leu Val Gln20 25 30
ccc ggc agg tcc ctg aga ctc tcc tgt gcg gcc tet gga ttc acc ttt 144
Pro Gly Arg Ser Leu Arg Leu ser cys Ala Ala ser Gly Phe Thr Phegat gat tat gcc atg cac tggAsp Asp Tyr Ala Met His Trp50 55
gtc cgg caa gctvai Arg Gln Ala
cca gggPro Gly60
aagLys
ic ctgy Leu
192
gaa tgg gtc tca gct ate actGlu Trp vai Ser Ala Ile Thr65 70
gac tet gtg gag ggc cga ttcAsp Ser Val Glu Gly Arg Phe85
tcc ctg tat ctg caa atg aacSer Leu Tyr Leu Gln Met Asn100
tat tac tgt gcg aaa gtc tcgTyr Tyr Cys Ala Lys Val Ser115
tat tgg ggc caa ggt acc ctgTyr Trp Gly Gln Gly Thr Leu130 135
c cca tcg gtc ttc ccc ctgy Pro Ser Val Phe Pro Leu145 150
ιc aca gcg gcc ctg ggc tgcy Thr Ala Ala Leu Gly cys165
tgg aat agt ggtTrp Asn ser Gly75
acc ate tcc agaThr Ile Ser Arg90
agt ctg aga gctSer Leu Arg Ala105
tac ctt age accTyr Leu ser Thr120
gtc acc gtc tcgvai Thr Val ser
gea ccc tcc tccAla Pro ser ser155
ctg gtc aag gãcLeu Val Lys Asp170
gtg acg gtg tcg tgg aac tca ggVaT Thr Val ser Trp Asn Ser GT
180
ttc ccg gct gtc cta cag tccPhe Pro Ala Val Leu Gln ser195
gtg acc gtg ccc tcc age ageVaT Thr VaT Pro Ser Ser Ser210 215
gtg aat cac aag ccc age aacVaT Asn His Lys Pro Ser Asn225 230
aaa tet tgt gac aaa act cacLys Ser cys Asp Lys Thr His245
ctc ctg ggg gga ccg tca gtcLeu Leu GTy GTy Pro ser Val260
acc ctc atg ate tcc cgg accThr Leu Met Ile ser Arg Thr275
gtg age cac gaa gac cct gagVaT ser His Glu Asp Pro Glu290 295
gtg gag gtg cat aat gcc aagVaT Glu VaT His Asn Ala Lys
Íc gcc ctg accy Ala Leu Thr185
cac ataHis Ile
gac aacAsp Asn
gag gatGlu Asp
gcg tccAla Ser125
agt gcgSer Ala140
aag ageLys Ser
tac ttcTyr Phe
age ggcSer Gly
ggaGTv
ser GTy Leu Tyr200
ttg ggc acc cagLeu GTy Thr Gln
acc aag gtg gacThr Lys VaT Asp235
aca tgc cca ccgThr Cys Pro Pro250
ttc ctc ttc cccPhe Leu Phe Pro265
cct gag gtc acaPro Glu Val Thr280
gtc aag ttc aacvai Lys Phe Asn
aca aag ccg cggThr Lys Pro Arg
tcc ctcSer Leu205
acc tacThr Tyr220
aag aaaLys Lys
tgc ccaCys Pro
cca aaaPro Lys
tgc gtgCys vaT285
tgg tacTrp Tyr300
gag gagGlu Glu
gac tat gcgAsp Tyr Ala80
gcc aag aacAla Lys Asn95
acg gcc gtaThr Ala vai110
tcc ctt gacSer Leu Asp
tcg acc aagser Thr Lys
acc tet gggThr Ser GTy160
ccc gaa ccgPro Glu Pro175
gtg cac accVaT His Thr190
age age gtgser ser VaT
ate tgc aacIle cys Asn
gtt gag cccvai Glu Pro240
gea cct gaaAla Pro Glu255
ccc aag gacPro Lys Asp270
gtg gtg gacvaT VaT Asp
gtg gac ggcVaT Asp GTy
cag tac aacGln Tyr Asn
240
288
336
384
432
480
528
576
624
672
720
768
816
864
912
960305 310 315 320
age acg tac cgt gtg gtc age gtc ctc acc gtc ctg cac cag gac tggSer Thr Tyr Arg Val Val ser vai Leu Thr vai Leu His Gln Asp Trp325 330 335
1008
ctg aat ggc aag gag tac aag tgc aag gtc tcc. aac aaa gcc ctc cca 1056Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val ser Asn Lys Ala Leu Pro340 345 350
gcc ccc ate gag aaa acc ate tcc aaa gcc aaa ggg cag ccc cga gaa 1104Ala Pro Ile Glu Lys Thr Ile ser Lys Ala Lys Gly Gln Pro Arg Glu355 360 365
cca cag gtg tac acc ctg ccc cca tcc cgg gat gag ctg acc aag aac 1152Pro Gln VaT Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn370 375 380
cag gtc age ctg acc tgc ctg gtc aaa ggc ttc tat ccc age gac ate 1200Gln Val ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile385 390 395 400
gcc gtg gag tgg gag age aat ggg cag ccg gag aac aac tac aag acc 1248Ala Val Glu Trp Glu Ser Asn GTy Gln Pro Glu Asn Asn Tyr Lys Thr405 410 415
acg cct ccc gtg ctg gac tcc gac ggc tcc ttc ttc ctc tac age aag 1296Thr Pro pro VaT Leu Asp ser Asp GTy ser Phe Phe Leu Tyr ser Lys420 425 430
ctc acc gtg gac aag age agg tgg cag cag ggg aac gtc ttc tca tgc 1344Leu Thr VaT Asp Lys ser Arg Trp Gln Gln Giy Asn vai Phe ser cys435 440 445
tcc gtg atg cat gaggct ctg cac aac cac tac acg cag aàg age ctc 1392Ser VaT Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys ser Leu450 455 460
tcc ctg tet ccg ggt aaa acc att tta ccg gaa gaa tgg gtt cca cta 1440Ser Leu ser Pro GTy Lys Thr lie Leu Pro Glu Glu Trp Val Pro Leu465 470 475 480
att aaa aac ggt aaa gtt aag ata ttc cgc att ggg gac ttc gtt gat 1488Ile Lys Asn GTy Lys Val Lys Ile Phe Arg lie GTy Asp Phe Val Asp485 490 495
gga ctt atg aag gcg aac caa gga aaa gtg aag aaa acg ggg gat aca 1536Gly Leu Met Lys Ala Asn Gln GTy Lys VaT Lys Lys Thr GTy Asp Thr500 505 510
gaa gtt tta gaa gtt gea gga att cat gcg ttt tcc ttt gac agg aag 1584Glu vai Leu Glu Val Ala GTy Ile His Ala Phe ser Phe Asp Arg Lys515 520 525
tcc aag aag gcc cgt gta atg gea gtg aaa gcc gtg ata aga cac cgt 1632Ser Lys Lys Ala Arg Val Met Ala VaT Lys Ala VaT lie Arg His Arg530 535 540
tat tcc gga aat gtt tat aga ata gtc tta aac tet ggt aga aaa ata 1680Tyr Ser GTy Asn Val Tyr Arg Ile Val Leu Asn ser GTy Arg Lys Ile545 550 555 560
aca ata aca gaa ggg cat age cta ttt gtc tat agg aac ggg gat ctc 1728Thr He Thr Glu GTy His ser Leu Phe vai Tyr Arg Asn GTy Asp Leu565 570 575
gtt gag gea act ggg gag gat gtc aaa att ggg gat ctt ctt gea gtt 1776vai Glu Ala Thr cTy Glu Asp Val Lys lie GTy Asp Leu Leu Ala vaicca aga tcaPro Arg ser595
gta aac cta ccaVal Asn Leu Pro
gag aaa agg gaa cgc ttg aat att gttGlu Lys Arg Glu Arg Leu Asn Ile Val600 605
1824
gaa ctt cttGlu Leu Leu610
ctg aat ctc tcaLeu Asn Leu Ser615
ccg gaa gagPro Glu Glu
aca gaaThr Glu620
gat ata ata ctt 1872Asp lie He Leu
acg att ccaThr Ile Pro625
aca tta cgtThr Leu Arg
gtt aaa ggc agaVal Lys Gly Arg630
tgg att ttt ggtTrp lie Phe Gly645
aag aac ttc ttc aag gga atg ttg aga 1920Lys Asn Phe Phe Lys Gly Met Leu Arg635 640
gag gaa aag aga gta agg aca gcg age 1968Glu Glu Lys Arg Val Arg Thr Ala ser650 655
cgc tat ctaArg Tyr Leu
aga cac ctt gaaArg His Leu Glu Asn Leu660 665
gg«Glv
tac ataTyr Ile
agg ttg agg aaaArg Leu Arg Lys670
2016
att gga tacIle Gly T^r
gac ate att gatAsp Ile lie Asp
aag gagLys Glu GTy680
ctt gagLeu Glu
aaa tat aga acgLys Tyr Arg Thr685
2064
ttg tac gagLeu Tyr Glu690
aaa cttLys Leu
gtt gatvai Asp695
gtt gtc cgcvai Val Arg
tat aatTyr Asn700
c aac aag aga 2112Gly Asn Lys Arg
gag tat ttaGlu Tyr Leu705
cca gag gaaPro Glu Glu
gtt gaavai Glu
gaa ctgGlu Leu725
ttt aatPhe Asn710
aag gaaLys Glu
gct gtc cggAla Val Arg
tgg cgt attTrp Arg Ile730
gac gtt ate tca cta atg 2160Asp Val Ile Ser Leu Met715 720
gga act aga aat gga ttc 2208Gly Thr Arg Asn Gly Phe735
aga atg ggtArg Met Giy
tac gat ageTyr Asp ser755
acg gaa tacThr Glu Tyr770
aag gat att
Lys Asp Ile785
agt tac aag
Ser Tyr Lys
acg ttcThr Phe740
gga gtcGly Val
gta gatVal Asp
tac aggTyr Arg
aga aag aaa aagArg Lys Lys Lys775
ctc aaa gaa actLeu Lys Glu Thr790
aaa ttt aga gagLys Phe Arg Glu805
att gat gaaIle Asp Glu745
gtt tat gtaVal Tyr Val760
aat gta tatAsn vai Tyr
ttt ggt aagPhe Gly Lys
ctt gta gaaLeu Val Glu810
gat tttAsp Phe
aac gagAsn Glu
gcc aag cttAla Lys Leu750
cac tetHis Ser780
gtc ttcVal Phe795
gaa ctt aag tttGlu Leu Lys Phe765
cac att gtt ccaHis Ile vai Pro
Asn
ggé
gTv
cag aaa aat ataGln Lys Asn Ile800
aaa ctt gac aggLys Leu Asp Arg815
2256
2304
2352
2400
2448
gag aaa gccGlu Lys Ala
gat aga gtcAsp Arg vai835
aaa cgc att gagLys Arg Ile Glu820
gta gag att aagVal Glu Ile Lys
tgg tta cttTrp Leu Leu825
aga gag tacArg Glu Tyr840
gat ata gtc ctaAsn Gly Asp ile vai Leu830
aac ggaGl
tat gatTyr Asp
ggt tac gtt tacGly Tyr vai Tyr845
2496
2544
gat cta agtAsp Leu Ser
gtc gat gaa gatvai Asp Glu Asp
gag aat ttcGlu Asn Phe
ctt gctLeu Ala
c ttty Phe
a ttcy Phe
2592850 855 860
ctc tat gca cat aat gac ate cag atg acc cag tet cca tcc tcc ctg 2640Leu Tyr ATa His Asn Asp Ile Gln Met Thr Gln ser Pro ser Ser Leu865 870 875 880
tet gca tet gta ggg gac aga gtc acc ate act tgt cgg gca agt cag 2688ser Ala Ser Val Gly Asp Arg Val Thr lie Thr Cys Arg Ala Ser Gln885 890 895
ggc ate aga aat tac tta gcc tgg tat cag caa aaa cca ggg aaa gcc 2736Giy Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala900 905 910
cct aag ctc ctg ate tat gct gca tcc act ttg caa tca ggg gtc cca 2784Pro Lys Leu Leu Ile Tyr Ala Ala ser Thr Leu Gln Ser Gly Val Pro915 920 925
tet cgg ttc agt ggc agt gga tet ggg aca gat ttc act ctc acc ate 2832ser Arg Phe ser Giy Ser Giy ser Gly Thr Asp Phe Thr Leu Thr Ile930 935 940
age age cta cag cct gaa gat gtt gca act tat tac tgt caa agg tat 2880ser ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln Arg Tyr945 950 955 960
aac cgt gca ccg tat act ttt ggc cag ggg acc aag gtg gaa ate aaa 2928Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys965 970 975
cgt acg gtg gct gca cca tet gtc ttc ate ttc ccg cca tet gat gag 2976Arg Thr Val Ala Ala Pro ser vai Phe Ile Phe Pro Pro ser Asp Glu980 985 990
cag ttg aaa tet gga act gcc tet gtt gtg tgc ctg ctg aat aac ttc 3024Gln Leu Lys ser Gly Thr Ala ser vai Val cys Leu Leu Asn Asn Phe995 1000 1005
tat ccc aga gag gcc aaa gta cag tgg aag gtg gat aac gcc ctc 3069Tyr Pro Arg Glu Ala Lys vai Gln Trp Lys VaT Asp Asn Ala Leu1010 1015 1020
caa tcg ggt aac tcc cag gag agt gtc aca gag cag gac age aag 3114Gln ser GTy Asn ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys1025 1030 1035
gac age acc tac age ctc age age acc ctg acg ctg age aaa gca 3159Asp Ser Thr Tyr Ser Leu Ser ser Thr Leu Thr Leu ser Lys Ala1040 1045 1050
gac tac gag aaa cac aaa gtc tac gcc tgc gaa gtc acc cat cag 3204Asp Tyr Glu Lys His Lys vai Tyr Ala Cys Glu Val Thr His Gln1055 1060 1065
ggc ctg age tcg ccc gtc aca aag age ttc aac agg gga gag tgt 3249GTy Leu ser ser Pro vai Thr Lys ser Phe Asn Arg Gly Glu cys1070 1075 1080
tga 3252
<210> 49
<211> 1083
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético<4Ò0> 49
Met Glu Phe Gly Leu ser Trp Leu Phe Leu Val Ala Ile Leu Lys Gly1 5 10 15
vai Gln cys Glu vai Gln Leu Val Glu ser Gly Gly Gly Leu vai Gln20 25 30
Pro Gly Arg ser Leu Arg Leu Ser cys Ala Ala Ser Gly Phe Thr Phe35 40 45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu50 55 60
Glu Trp Val Ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala65 70 75 80
Asp Ser Val Glu Gly Arg Phe Thr Ile ser Arg Asp Asn Ala Lys Asn85 90 95
Ser Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val100 105 110
Tyr Tyr Cys Ala Lys Val Ser Tyr Leu ser Thr Ala Ser Ser Leu Asp115 120 125
Tyr Trp Gly Gln Gly Thr Leu vai Thr vai ser ser Ala ser Thr Lys130 135 140
Gly Pro ser Val Phe Pro Leu Ala Pro Ser Ser Lys ser Thr Ser Gly145 150 155 160
Gly Thr Ala Ala Leu Gly cys Leu vai Lys Asp Tyr Phe Pro Glu Pro165 170 175
Val Thr vai ser Trp Asn ser Gly Ala Leu Thr ser Gly Val His Thr180 185 190
Phe Pro Ala Val Leu Gln ser Ser Gly Leu Tyr ser Leu ser Ser vai195 200 205
Val Thr Val Pro Ser ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn210 215 220
Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro225 230 235 240
Lys ser cys Asp Lys Thr His Thr cys Pro Pro cys Pro Ala Pro Glu245 250 255
Leu Leu Gly Gly Pro ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp260
265
270
Thr Leu Met Ile ser Arg Thr Pro Glu vai Thr Cys Val vai Val Asp275 280 285
vai ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly290 295 300
vai Glu vai His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn305 310 315 320
ser Thr Tyr Arg vai vai ser Val Leu Thr Val Leu His Gln Asp Trp325 330 335
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val ser Asn Lys Ala Leu Pro340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn370 375 380
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro ser Asp Ile385 390 395 400
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr405 410 415
Thr Pro Pro vai Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys420 425 · 430
Leu Thr vai Asp Lys ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys435 440 445
Ser vai Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu450 455 460
ser Leu Ser Pro Gly Lys Thr Ile Leu Pro Glu Glu Trp Val Pro Leu465 470 475 480
Ile Lys Asn Gly Lys Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp485 490 495
Gly Leu Met Lys Ala Asn Gln Gly Lys vai Lys Lys Thr Gly Asp Thr500 505 510
Glu Val Leu Glu Val Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys515 520 525
Ser Lys Lys Ala Arg Val Met Ala Val Lys Ala vai Ile Arg His ArgTyr Ser Gly Asn vai Tyr Arg lie vai Leu Asn ser Gly Arg Lys lie545 550 555 560
Thr lie Thr Glu Gly His ser Leu Phe Val Tyr Arg Asn Gly Asp Leu565 570 575
Val Glu Ala Thr Gly Glu Asp Val Lys lie Gly Asp Leu Leu Ala Val580 585 590
Pro Arg ser Val Asn Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile Val595 600 605
Glu Leu Leu Leu Asn Leu ser Pro Glu Glu Thr Glu Asp Ile Ile Leu610 615 620
Thr lie Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg625 630 635 640
Thr Leu Arg Trp Ile Phe Gly Glu Glu Lys Arg Val Arg Thr Ala ser645 650 655
Arg Tyr Leu Arg His Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys660 665 670
Ile Gly Tyr Asp lie Ile Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr675 680 685
Leu Tyr Glu Lys Leu Val Asp vai Val Arg Tyr Asn Gly Asn Lys Arg690 695 700
Glu Tyr Leu Val Glu Phe Asn Ala Val Arg Asp Val Ile ser Leu Met705 710 715 720
Pro Glu Glu Glu Leu Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe725 730 735
Arg Met Gly Thr Phe Val Asp Ile Asp Glu Asp Phe Ala Lys Leu Gly740 745 750
Tyr Asp ser Gly Val Tyr Arg vai Tyr Val Asn Glu Glu Leu Lys Phe755 760 765
Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His ser His Il e Val Pro770 775 780
Lys Asp lie Leu Lys Glu Thr Phe Gly Lys vai Phe Gln Lys Asn Ile785 790 795 800
Ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn Gly Lys Leu Asp ArgGlu Lys Ala Lys Arg ile Glu Trp Leu Leu Asn Gly Asp Ile Val Leu820 825 830
Asp Arg vai Val Glu Ile Lys Arg Glu Tyr Tyr Asp Gly Tyr Val Tyr835 840 845
Asp Leu Ser Val Asp Glu Asp Glu Asn Phe Leu Ala Gly Phe Gly Phe850 855 860
Leu Tyr Ala His Asn Asp Ile Gln Met Thr Gln ser Pro ser ser Leu865 870 875 880
ser Ala Ser Val Gly Asp Arg vai Thr Ile Thr Cys Arg Ala ser Gln885 890 895
Gly lie Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala900 905 910
Pro Lys Leu Leu Ile Tyr Ala Ala Ser Thr Leu Gln ser Gly vai Pro915 920 925
Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile930 935 940
Ser ser Leu Gln Pro Glu Asp vai Ala Thr Tyr Tyr Cys Gln Arg Tyr945 950 955 960
Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys965 970 975
Arg Thr Val Ala Ala Pro ser Val Phe Ile Phe Pro Pro ser Asp Glu980 985 990
Gln Leu Lys Ser Gly Thr Ala ser Val Val Cys Leu Leu Asn Asn Phe995 1000 1005
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu1010 1015 1020
Gln ser Gly Asn ser Gln Glu ser Val Thr Glu Gln Asp ser Lys1025 1030 1035
Asp ser Thr Tyr ser Leu ser Ser Thr Leu Thr Leu Ser Lys Ala1040 1045 1050
Asp Tyr Glu Lys His Lys vai Tyr Ala cys Glu Val Thr His Gln1055 1060 1065
Gly Leu ser ser Pro vai Thr Lys ser Phe Asn Arg Gly Glu Cys<210> 50<211> 10629<212> DNA<213> Artificial
<220>
<223> Constructo sintético, D2E7 vetor de expressão de proteína de fusãode inteína
<400> 50
gaagttccta ttccgaagtt cctattctct agacgttaca taacttacgg taaatggccc 60
gcctggctga ccgcccaacg acccccgccc attgacgtca ataatgacgt atgttcccat 120
agtaacgcca atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc 180
ccacttggca gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga 240
cggtaaatgg cccgcctggc attatgccca gtacatgacc ttatgggact ttcctacttg 300
gcagtacatc tacgtattag tcatcgctat taccatggtg atgcggtttt ggcagtacat 360
caatgggcgt ggatagcggt ttgactcacg gggatttcca agtctccacc ccattgacgt 420
caatgggagt ttgttttggc accaaaatca acgggacttt ccaaaatgtc gtaacaactc 480
cgccccaatg acgcaaatgg gcagggaatt cgagctcggt actcgagcgg tgttccgcgg 540
tcctcctcgt atagaaactc ggaccactct gagacgaagg ctcgcgtcca ggccagcacg 600
aaggaggcta agtgggaggg gtagcggtcg ttgtccacta gggggtccac tcgctccagg 660
gtgtgaagac acatgtcgcc ctcttcggca tcaaggaagg tgattggttt ataggtgtag 720
gccacgtgac cgggtgttcc tgaagggggg ctataaaagg gggtgggggc gcgttcgtcc 780
tcactctctt ccgcatcgct gtctgcgagg gccagctgtt gggctcgcgg ttgaggacaa 840
actcttcgcg gtctttccag tactcttgga tcggaaaccc gtcggcctcc gaacggtact 900
ccgccaccga gggacctgag cgagtccgca tcgaccggat cggaaaacct ctcgactgtt 960
ggggtgagta ctccctctca aaagcgggca tgacttctgc gctaagattg tcagtttcca 1020
aaaacgagga ggatttgata ttcacctggc ccgcggtgat gcctttgagg gtggccgçgt 1080
ccatctggtc agaaaagaca atctttttgt tgtcaagctt gaggtgtggc aggcttgaga 1140
tctggccata cacttgagtg acaatgacat ccactttgcc tttctctcca caggtgtcca 1200
ctcccaggtc caaccggaat tgtacccgcg gccagagctt gcccgggcgc caccatggag 1260
tttgggctga gctggctttt tcttgtcgcg attttaaaag gtgtccagtg tgaggtgcag 1320
ctggtggagt ctgggggagg cttggtacag cccggcaggt ccctgagact ctcctgtgcg 1380
gcctctggat tcacctttga tgattatgcc atgcactggg tccggcaagc tccagggaag 1440
ggcctggaat gggtctcagc tatcacttgg aatagtggtc acatagacta tgcggactct 1500
gtggagggcc gattcaccat ctccagagac aacgccaaga actccctgta tctgcaaatg 1560
aacagtctga gagctgagga tacggccgta tattactgtg cgaaagtctc gtaccttagc 1620
accgcgtcct cccttgacta ttggggccaa ggtaccctgg tcaccgtctc gagtgcgtcg 1680açcaagggcc catcggtctt ccccctggca ccctcctcca agagcacctc tgggggcaca 1740
gcggccctgg gctgcctggt caaggactac ttccccgaac cggtgacggt gtcgtggaac 1800
tcaggcgccc tgaccagcgg cgtgcacacc ttcccggctg tcctacagtc ctcaggactc 1860
tactccctca gcagcgtggt gaccgtgccc tccagcagct tgggcaccca gacctacatc 1920
tgcaacgtga atcacaagcc cagcaacacc aaggtggaca agaaagttga gcccaaatct 1980
tgtgacaaaa ctcacacatg cccaccgtgc ccagcacctg aãctcctggg gggaccgtca 2040
gtcttcctct tccccccaaa acccaaggac accctcatga tctcccggac ccctgaggtc 2100
acatgcgtgg tggtggacgt gagccacgaa gaccctgagg tcaagttcaa ctggtacgtg 2160
gacggcgtgg aggtgcataa tgccaagaca aagccgcggg aggagcagta caacagcacg 2220
taccgtgtgg tcagcgtcct caccgtcctg caccaggact ggctgaatgg caaggagtac 2280
aagtgcaagg tctccaacaa agccctccca gcccccatcg agaaaaccat ctccaaagcc 2340
aaagggcagc cccgagaacc acaggtgtac accctgcccc catcccggga tgagctgacc 2400
aagaaccagg tcagcctgac ctgcctggtc aaaggcttct atcccagcga catcgccgtg 2460
gagtgggaga gcaatgggca gccggagaac aactacaaga ccacgcctcc cgtgctggac 2520
tccgacggct ccttcttcct ctacagcaag ctcaccgtgg acaagagcag gtggcagcag 2580
gggaacgtct tctcatgctc cgtgatgcat gaggctctgc acaaccacta cacgcagaag 2640
ι
agcctctccc tgtctccggg taaaaccatt ttaccggaag aatgggttcc actaattaaa 2700
aacggtaaag ttaagatatt ccgcattggg gacttcgttg atggacttat gaaggcgaac 2760
caaggaaaag tgaagaaaac gggggataca gaagttttag aagttgcagg aattcatgcg 2820
ttttcctttg acaggaagtc caagaaggcc cgtgtaatgg cagtgaaagc cgtgataaga 2880
caccgttatt ccggaaatgt ttatagaata gtcttaaact ctggtagaaa aataacaata 2940
acagaagggc atagcctatt tgtctatagg aacggggatc tcgttgaggc aactggggag 3000
gatgtcaaaa ttggggatct tcttgcagtt ccaagatcag taaacctacc agagaaaagg 3060
gaacgcttga atattgttga acttcttctg aatctctcac cggaagagac agaagatata 3120
atacttacga ttccagttaa aggcagaaag aacttcttca agggaatgtt gagaacatta 3180
cgttggattt ttggtgagga aaagagagta aggacagcga gccgctatct aagacacctt 3240
gaaaatctcg gatacataag gttgaggaaa attggatacg acatcattga taaggagggg 3300
cttgagaaat atagaacgtt gtacgagaaa cttgttgatg ttgtccgcta taatggcaac 3360
aagagagagt atttagttga atttaatgct gtccgggacg ttatctcact aatgccagag 3420
gaagaactga aggaatggcg tattggaact agaaatggat tcagaatggg tacgttcgta 3480
gatattgatg aagattttgc caagcttgga tacgatagcg gagtctacag ggtttatgta 3540
aacgaggaac ttaagtttac ggaatacaga aagaaaaaga atgtatatca ctctcacatt 3600
gttccaaagg atattctcaa agaaactttt ggtaaggtct tccagaaaaa tataagttac 3660
aagaaattta gagagcttgt agaaaatgga aaacttgaca gggagaaagc caaacgcatt 3720gagtggttac ttaacggaga tatagtccta gatagagtcg tagagattaa gagagagtac 3780
tatgatggtt acgtttacga tctaagtgtc gatgaagatg agaatttcct tgctggcttt 3840
ggattcctct atgcacataa tgacatccag atgacccagt ctccatcctc cctgtctgca 3900
tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag aaattactta 3960
gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc tgcatccact 4020
ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga tttcactctc 4080
accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag gtataaccgt 4140
gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt ggctgcacca 4200
tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc ctctgttgtg 4260
tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt ggataacgcc 4320
ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga cagcacctac 4380
agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa agtctacgcc 4440
tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa caggggagag 4500
tgttgagcgg ccgcgtttaa actgaatgag cgcgtccatc cagacatgat aagatacatt 4560
gatgagtttg gacaaaccac aactagaatg cagtgaaaaa aatgctttat ttgtgaaatt 4620
tgtgatgcta ttgctttatt tgtaaccatt ataagctgca ataaacaagt taacaacaac 4680
aattgcattc attttatgtt tcaggttcag ggggaggtgt gggaggtttt ttaaagcaag 4740
taaaacctct acaaatgtgg tatggctgat tatgatccgg ctgcctcgcg cgtttcggtg 4800
atgacggtga aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag 4860
cggatgccgg gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg 4920
gcgcagccat gaccggtcga cggcgcgcct ttttttttaa tttttatttt attttatttt 4980
tgacgcgccg aaggcgcgat ctgagctcgg tacagcttgg ctgtggaatg tgtgtcagtt 5040
agggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca tgcatctcaa 5100
ttagtcagca accaggtgtg gaaagtcccc aggctcccca gcaggcagaa gtatgcaaag 5160
catgcatctc aattagtcag caaccatagt cccgccccta actccgccca tcccgcccct 5220
aactccgccc agttccgccc attctccgcc ccatggctga ctaatttttt ttatttatgc 5280
agaggccgag gccgcctcgg cctctgagct attccagaag tagtgaggag gcttttttgg 5340
aggcctaggc ttttgcaaaa agctcctcga ggaactgaaa aaccagaaag ttaactggta 5400
agtttagtct ttttgtcttt tatttcaggt cccggatccg gtggtggtgc aaatcaaaga 5460
actgctcctc agtggatgtt gcctttactt ctaggcctgt acggaagtgt tacttctgct 5520
ctaaaagctg cggaattgta cccgcggcct aatacgactc actataggga ctagtatggt 5580
tcgaccattg aactgcatcg tcgccgtgtc ccaaaatatg gggattggca agaacggaga 5640
cctaccctgg cctccgctca ggaacgagtt caagtacttc caaagaatga ccacaacctc 5700
ttcagtggaa ggtaaacaga atctggtgat tatgggtagg aaaacctggt tctccattcc 5760tgagaagaat cgacctttaa aggacagaat taatatagtt ctcagtagag aactcaaaga 5820accaccacga ggagctcatt ttcttgccaa aagtttagat gatgccttaa gacttattga 5880acaaccggaa ttggcaagta aagtagacat ggtttggata gtcggaggca gttctgttta 5940ccaggaagcc atgaatcaac caggccacct cagactcttt gtgacaagga tcatgcagga 6000atttgaaagt gacacgtttt tcccagaaat tgatttgggg aaatataaac ttctcccaga 6060atacccaggc gtcctctctg aggtccagga ggaaaaaggc atcaagtata agtttgaagt 6120ctacgagaag aaagactaag cggccgagcg cgcggatctg gaaacgggag atgggggágg 6180ctaactgaag cacggaagga gacaataccg gaaggaaccc gcgctatgac ggcaataaaa 6240agacagaata aaacgcacgg gtgttgggtc gtttgttcat aaacgcgggg ttcggtccca 6300gggctggcac tctgtcgata ccccaccgag accccattgg ggccaatacg cccgcgtttc 6360ttccttttcc ccaccccacc ccccaagttc gggtgaaggc ccagggctcg cagccaacgt 6420cggggcggca ggccctgcca tagccactgg ccccgtgggt tagggacggg gtcccccatg 6480gggaatggtt tatggttcgt gggggttatt attttgggcg ttgcgtgggg tctggagatc 6540ccccgggctg caggaattcc gttacattac ttacggtaaa tggcccgcct ggctgaccgc 6600ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 6660ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 6720atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 6780cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 6840tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 6900agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 6960tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 7020aaaagggcgg gaattcgagc tcggtactcg agcggtgttc cgcggtcctc ctcgtataga 7080aactcggacc actctgagac gaaggctcgc gtccaggcca gcacgaagga ggctaagtgg 7140gaggggtagc ggtcgttgtc cactaggggg tccactcgct ccagggtgtg aagacacatg 7200tcgccctctt cggcatcaag gaaggtgatt ggtttatagg tgtaggccac gtgaccgggt 7260gttcctgaag gggggctata aaagggggtg ggggcgcgtt cgtcctcact ctcttccgca 7320tcgctgtctg cgagggccag ctgttgggct cgcggttgag gacaaactct tcgcggtctt 7380tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtactccgcc accgagggac 7440ctgagcgagt ccgcatcgac cggatcggaa aacctctcga ctgttggggt gagtactccc 7500tctcaaaagc gggcatgact tctgcgctaa gattgtcagt ttccaaaaac gaggaggatt 7560tgatattcac ctggcccgcg gtgatgcctt tgagggtggc cgcgtccatc tggtcagaaa 7620agacaatctt tttgttgtca agcttgaggt gtggcaggct tgagatctgg ccatacactt 7680gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc aggtccaacc 7740ggaattgtac ccgcggccag agcttgcggg cgccaccgcg gccgcgggga tccagacatg 7800ataagataca ttgatgagtt tggacaaacc acaactagaa tgcagtgaaa aaaatgcttt 7860
atttgtgaaa tttgtgatgc tattgcttta tttgtaaçca ttataagctg caataaacaa 7920
gttaacaaca acaattgcat tcattttatg tttcaggttc agggggaggt gtgggaggtt 7980
ttttcggatc ctcttggcgt aatcatggtc atagctgttt cctgtgtgaa attgttatcc 8040
gctcacaatt ccacacaaca tacgagccgg aagcataaag tgtaaagcct ggggtgccta 8100
atgagtgagc taactcacat taattgcgtt gçgctcactg cccgctttcc agtcgggaaa 8160
cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggaaaggcg gtttgcgtat 8220
tgggcgctct tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg 8280
agcggtatca gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc 8340
aggaaagaac atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt 8400
gctggcgttc ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag 8460
tcagaggtgg cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc 8520
cctcgtgcgc tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc 8580
ttcgggaagc gtggcgcttt ctcatagctc acgctgtagg tatctcagtt cggtgtaggt 8640
cgttcgctcc aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt 8700
atccggtaac tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc 8760
agccactggt aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa 8820
gtggtggcct aactacggct acactagaag aacagtattt ggtatctgcg ctctgctgaa 8880
gccagttacc ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg 8940
tagcggtggt ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga 9000
agatcctttg atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg 9060
gattttggtc atgagattat caaaaaggat cttcacctag atccctttta attaaaaatg 9120
aagttttaaa tcaatctaaa gtatatatga gtaaacttgg tctgacagtt accaatgctt 9180
aatcagtgag gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact 9240
ccccgtcgtg tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat 9300
gataccgcga gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg 9360
aagggccgag cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg 9420
ttgccgggaa gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat 9480
tgctacaggc atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc 9540
ccaacgatca aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt 9600
cggtcctccg atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc 9660
agcactgcat aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga 9720
gtactcaacc aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc 9780
gtcaatacgg gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa 9840acgttcttcg gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta 9900acccactcgt gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg 9960agcaaaaaca ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg 10020aatactcata CtCttCCttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat 10080gagcggatac atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt 10140tccccgaaaa gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa 10200aaataggcgt atcacgaggc cctttcgtct cgcgcgtttc ggtgatgacg gtgaaaacct 10260ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg ccgggagcag 10320acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggctggc ttaactatgc 10380ggcatcagag cagattgtac tgagagtgca ccatatgcgg tgtgaaatac cgcacagatg 10440cgtaaggaga aaataccgca tcaggcgcca ttcgccattc aggctgcgca actgttggga 10500agggcgatcg gtgcgggcct cttcgctatt acgccagctg gcgaaagggg gatgtgctgc 10560aaggcgatta agttgggtaa cgccagggtt ttcccagtta cgacgttgta aaacgacggc 10620cagtgaatt 10629
<210> 51
<211> 547
<212> PRT
<213> Pyrococcus Sp.
<400> 51
Asn Ser Ile Leu Pro Glu Glu Trp Val Pro Leu Ile Lys Asn Gly Lys1 5 10 15
Val Lys Ile Phe Arg Ile Gly Asp Phe Val Asp Gly Leu Met Lys Ala20 25 30
Asn Gln Gly Lys Val Lys Lys Thr Gly Asp Thr Glu Val Leu Glu Val35 40 45
Ala Gly Ile His Ala Phe Ser Phe Asp Arg Lys Ser Lys Lys Ala Arg50 55 60
Val Met Ala Val Lys Ala Val Ile Arg His Arg Tyr Ser Gly Asn Val65 70 75 80
Tyr Arg Ile Val Leu Asn Ser Gly Arg Lys Ile Thr Ile Thr Glu Gly85 90 95
His Ser Leu Phe Val Tyr Arg Asn Gly Asp Leu Val Glu Ala Thr Gly100 105 110
Glu Asp Val Lys Ile Gly Asp Leu Leu Ala Val Pro Arg Ser Val Asn115 120 125Leu Pro Glu Lys Arg Glu Arg Leu Asn Ile vai Glu Leu Leu Leu Asn130 135 140
Leu Ser Pro Glu Glu Thr Glu Asp Ile Ile Leu Thr Ile Pro Val Lys145 150 155 160
Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Arg Thr Leu Arg Trp Ile165 170 175
Phe Gly Glu Glu Lys Arg Val Arg Thr Ala ser Arg Tyr Leu Arg His180 185 190
Leu Glu Asn Leu Gly Tyr Ile Arg Leu Arg Lys lie Gly Tyr Asp Ile195 200 205
lie Asp Lys Glu Gly Leu Glu Lys Tyr Arg Thr Leu Tyr Glu Lys Leu210 215 220
vai Asp vai vai Arg Tyr Asn Gly Asn Lys Arg Glu Tyr Leu vai Glu225 230 235 240
Phe Asn Ala vai Arg Asp vai Ile Ser Leu Met Pro Glu Glu Glu Leu245 250 255
Lys Glu Trp Arg Ile Gly Thr Arg Asn Gly Phe Arg Met Gl^ Thr Phe
265
270
vai Asp Ile Asp Glu Asp Phe Ala Lys Leu Lèu Gly Tyr Tyr vai ser275 280 285
Glu Gly ser Ala Arg Lys Trp Lys Asn Gln Thr Gly Gly Trp Ser Tyr290 295 300
Thr Val Arg Leu Tyr Asn Glu Asn Asp Glu vai Leu Asp Asp Met Glu305 310 315 320
His Leu Ala Lys Lys Phe Phe Gly Lys vai Lys Arg Gly Lys Asn Tyr325 330 335
Val Glu lie Pro Lys Lys Met Ala Tyr Ile Ile Phe Glu Ser Leu Cys340 345 350
Gly Thr Leu Ala Glu Asn Lys Arg Val Pro Glu vai Ile Phe Thr ser355 360 365
Ser Lys Gly Val Arg Trp Ala Phe Leu Glu Gly Tyr Phe Ile Gly Asp370 375 380
Gly Asp vai His Pro Ser Lys Arg vai Arg Leu ser Thr Lys ser Glu385 390 395 400Leu Leu vai Asn Gly Leu vai Leu Leu Leu Asn ser Leu Gly Val ser405 410 415
Ala Ile Lys Leu Gly Tyr Asp ser Gly Val Tyr Arg Val Tyr Val Asn420 425 430
Glu Glu Leu Lys Phe Thr Glu Tyr Arg Lys Lys Lys Asn Val Tyr His435 440 445
Ser His Ile Val Pro Lys Asp Xle Leu Lys Glu Thr Phe Gly Lys Val450 455 460
Phe Gln Lys Asn Ile ser Tyr Lys Lys Phe Arg Glu Leu Val Glu Asn465 470 475 480
Gly Lys Leu Asp Arg Glu Lys Ala Lys Arg Ile Glu Trp Leu Leu Asn485 490 495
Gly Asp lie vai Leu Asp Arg Val Val Glu Ile Lys Arg Glu Tyr Tyr500 505 510
Asp Gly Tyr vai Tyr Asp Leu Ser vai Asp Glu Asp Glu Asn Phe Leu515 520 525
Ala Gly Phe Gly Phe Leu Tyr Ala His Asn ser Tyr Tyr Gly Tyr Tyr530 535 540
Gly Tyr Ala545
<210> 52<211> 26<212> DNA<213> Artificial
<220>
<223> Constructo sintético, oligonucleotídeo útil como primer.<400> 52
agcattttac cagatgaatg gctccc 26
<210> 53
<211> 27
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, oligonucleotídeo útil como primer.<400> 53
aacgaggaag ttctcattat cctcaac 27
<210> 54<211> 44<212> DNA<213> Arti fi ci ai<220>
<223> Constructo sintético, oligonucleotídeo útil como primer.<400> 54
agcctctccc tgtctccggg taaaagcatt ttaccagatg aatg
<210> 55
<211> 42
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, oligonucleotídeo útil como primer.<400> 55
gggcgggcac gcgcatgtcc atgttgtgtg cgtaaagtag tc
<210> 56
<211> 47
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, oligonucleotídeo útil como primer.
<400> 56
agcctctccc tgtctccggg taaaaacagc attttaccag atgaatg
<210> 57
<211> 45
<212> DNA
<213> Artificial
<220>
<22 3> Constructo sintético, oligonucleotídeo útil como primer.
<400> 57
gggcgggcac gcgcatgtcc atactgttgt gtgcgtaaag tagtc
<210> 58
<211> 53
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, oligonucleotídeo útil como primer.
<400> 58
agcctctccc tgtctccggg taaattagca aacagcattt taccagatga atg
<210> 59
<211> 51
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético, oligonucleotídeo útil como primer.
<400> 59
gggcgggcac gcgcatgtcc atgtaataac tgttgtgtgc gtaaagtagt c<210> 60
<211> 36
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo útil como primer.
<400> 60
tgcccgggcg ccaccatgga gtttgggctg agctgg 36
<210> 61
<211> 36
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo útil como primer.
<400> 61
tgcccgggcg ccaccatgga gtttgggctg agctgg 36
<210> 62<211> 9460<212> DNA<213> Artificial
<223> Constructo sintético: seqüência do plasmídeo pTT3-HcintLC-p.hori<400> 62
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctágctaga ggatcgatcc 180ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020tggcattgtg ctatgacacc aatataacccgtaggaatga aacattctga atatctttaagtaaagactg gatgtccatc tcacacgaatgcaatatgat actggggtta ttaagatgtgtgttgttaca ctctatttgt aacaaggggacactggttgt ctctaacacc cccgaaaattaacaaagaca agtggccact cttttttttgccacacgccg ccctgcggtt ttggactgtaaaccccgcta accactgcgg tcaaaccactgaatacctgc ataagtaggt gggcgggccagacaaattac acacacttgc gcctgagcgccgaggtcgct gagagcacgg tgggctaatgtctggatagc atatgctatc ctaatctata
ι
tctgggtagc atatgctatc ctaatctatátctgggtagc ataggctatc ctaatctatatctgggtagt atatgctatc ctaatctgtattagggtagt atatgctatc ctaatttatagatagcatat gctatcctaa tctatatctgggtagcatag gctatcctaa tctatatctgggtagtatat gctatcctaa tttatatctgggtagcatat gctatcctaa tctatatctgggtagcatat gctatcctca tgataagctggggcctcgtg atacgcctat ttttataggtgtcaggtggc acttttcggg gaaatgtgcgacattcaaat atgtatccgc tcatgagacaaaaaaggaag agtatgagta ttcaacatttattttgcctt cctgtttttg ctcacccagatcagttgggt gcacgagtgg gttacatcgagagttttcgc cccgaagaac gttttccaatcgcggtatta tcccgtgttg acgccgggcatcagaatgac ttggttgagt actcaccagtagtaagagaa ttatgcagtg ctgccataactctgacaacg atcggaggac cgaaggagcttgtaactcgc cttgatcgtt gggaaccgga
tcacaaaccc cttgggcaat aaatactagt 1080
caatagaaat ccatggggtg gggacaagcc 1140
ttatggctat gggcaacaca taatcctagt 1200
tcccaggcag ggaccaagac aggtgaacca 1260
aagagagtgg acgccgacag cagcggactc 1320
aaacggggct ccacgccaat ggggcccata 1380
aaattgtgga gtgggggcac gcgtcagccc 1440
aaataagggt gtaataactt ggctgattgt 1500
tgcccacaaa accactaatg gcaccccggg 1560
agataggggc gcgattgctg cgatctggag 1620caagcacagg gttgttggtc' ctcatattca 1680ttgccatggg tagcatatac tacccaaata 1740tctgggtagc ataggctatc ctaatctata 1800
tctgggtagt atatgctatc ctãatttata 1860
tctgggtagc atatgctatc ctaatctata 1920
tccgggtagc atatgctatc ctaatagaga 1980
tctgggtagc atatactacc caaatatctg 2040
ggtagcatat gctatcctaa tctatatctg 2100
ggtagcatat gctatcctaa tctatatctg 2160
ggtagcatag gctatcctaa tctatatctg 2220
ggtagtatat gctatcctaa tctgtatccg 2280
tcaaacatga gaattttctt gaagacgaaa 2340
taatgtcatg ataataatgg tttcttagac 2400
cggaacccct atttgtttat ttttctaaat 2460
ataaccctga taaatgcttc aataatattg 2520
ccgtgtcgcc cttattccct tttttgcggc 2580
aacgctggtg aaagtaaaag atgctgaaga 2640
actggatctc aacagcggta agatccttga 2700
gatgagcact tttaaagttc tgctatgtgg 2760
agagcaactc ggtcgccgca tacactattc 2820
cacagaaaag catcttacgg atggcatgac 2880
catgagtgat aacactgcgg ccaacttact 2940
aaccgctttt ttgcacaaca tgggggatca 3000
gctgaatgaa gccataccaa acgacgagcg 3060tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840
ctcaagacga tagttaccgg atáaggcgca gcggtcgggc tgaacggggg gttcgtgcac .3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5Ζ20
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280
attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240
cgccaagaac tccctgtatc tgcàaatgaa cagtctgaga gctgaggata cggccgtata 6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcçtgca 6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aaagcatttt 7380
accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt cgattcgtaa aaattggaga 7440
cttcatagat agggagattg aggaaaacgc tgagagagtg aagagggatg gtgaaactga 7500
aattctagag gttaaagatc ttaaagccct ttccttcaat agagaaacaa aaaagagcga 7560
gctcaagaag gtaaaggccc taattagaca ccgctattca gggaaggttt acagcattaa 7620
actaaagtca gggagaagga tcaaaataac ctcaggtcat agtctgttct cagtaaaaaa 7680
tggaaagcta gttaaggtca ggggagatga actcaagcct ggtgatctcg ttgtcgttcc 7740
aggaaggtta aaacttccag aaagcaagca agtgctaaat ctcgttgaac tactcctgaa 7800
attacccgaa gaggagacat cgaacatcgt aatgatgatc ccagttaaag gtagaaagaa 7860
tttcttcaaa gggatgctca aaacattata ctggatcttc ggggagggag aaaggccaag 7920
aaccgcaggg cgctatctca agcatcttga aagattagga tacgttaagc tcaagagaag 7980
aggctgtgaa gttctcgact gggagtcact taagaggtac aggaagcttt acgagaccct 8040
cattaagaac ctgaaatata acggtaatag cagggcatac atggttgaat ttaactctct 8100
cagggatgta gtgagcttaa tgccaataga agaacttaag gagtggataa ttggagaacc 8160
taggggtcct aagataggta ccttcattga tgtagatgat tcatttgcaa agctcctagg 8220
ttactacata agtagcggag atgtagagaa agatagggtg aagttccaca gtaaagatca 8280
aaacgttctc gaggatatag cgaaacttgc cgagaagtta tttggàaagg tgaggagagg 8340
aagaggatat attgaggtat cagggaaaat tagccatgcc atatttagag ttttagcgga 8400
aggtaagaga attccagagt tcatcttcac àtccccaatg gatattaagg tagccttcct 8460
taagggactc aacggtaatg ctgaagaatt aacgttctcc actaagagtg agctattagt 8520
taaccagctt atccttctcc tgaactccat tggagtttcg gatataaaga ttgaacatga 8580
gaaaggggtt tacagagttt acataaataa gaaggaatcc tccaatgggg atatagtact 8640
tgatagcgtc gaatctatcg aagttgaaaa atacgagggc tacgtttatg atctaagtgt 8700
tgaggataat gagaacttcc tcgttggctt cggactactt tacgcacaca acatggaçat 8760
gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg ttccccggct cgcgatgcga 8820
catccagatg acccagtctc catcctccct gtctgcatct gtaggggaca gagtcaccat 8880
cacttgtcgg gcaagtcagg gcatcagaaa ttacttagcc tggtatcagc aaaaaccagg 8940
gâaagcccct aagctcctga tctatgctgc atccactttg caatcagggg tcccatctcg 9000
gttcagtggc agtggatctg ggacagattt cactctcacc atcagcagcc tacagcctga 9060
agatgttgca acttattact gtcaaaggta taaccgtgca ccgtatactt ttggccaggg 9120
gaccaaggtg gaaatcaaac gtacggtggc tgcaccatct gtcttcatct tcccgccatc 9180tgatgagcag ttgaaatctg gaactgcctc tgttgtgtgc ctgctgaata acttctatcc 9240
cagagaggcc aaagtacagt ggaaggtgga taacgccctc caatcgggta actcccagga 9300
gagtgtcaca gagcaggaca gcaaggacag cacctacagc ctcagcagca ccctgacgct 9360
gagcaaagca gactacgaga aacacaaagt ctacgcctgc gaagtcaccc atcagggcct 9420
gagctcgccc gtcacaaaga gcttcaacag gggagagtgt 9460
<210> 63
<211> 1166
<212> PRT<213> Artificial
<220>
<223> Sintético: seqüência de aminoácido de abertura em pTT3-HcintLC-p.hori<400> 63
Met Glu Phe Gly Leu Ser Trp Leu Phe Leu vai Ala Ile Leu Lys Gly15 10 15
vai Gln Cys Glu Val Gln Leu vai Glu ser Gly Gly Gly Leu Val Gln20 25 30
Pro Gly Arg ser Leu Arg Leu ser cys Ala Ala Ser Gly Phe Thr Phe35 40 45
Asp Asp Tyr Ala Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu50 55 60
Glu Trp Val ser Ala Ile Thr Trp Asn Ser Gly His Ile Asp Tyr Ala65 70 75 80
Asp Ser vai Glu Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn85 90 95
ser Leu Tyr Leu Gln Met Asn ser Leu Arg Ala Glu Asp Thr Ala Val100 105 110
Tyr Tyr Cys Ala Lys Val ser Tyr Leu Ser Thr Ala ser ser Leu Asp115 120 125
Tyr Trp Gly Gln Gly Thr Leu Val Thr Val ser ser Ala ser Thr Lys130 135 140
Gly Pro Ser Val Phe Pro Leu Ala Pro Ser ser Lys ser Thr ser Gly145 150 155 160
Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro165 170 175
vai Thr vai ser Trp Asn Ser Gly Ala Leu Thr ser Gly Val His Thr180 185 190Phe Pro Ala Val Leu Gln Ser ser Gly Leu Tyr Ser Leu Ser ser Val195 200 205
Val Thr vai Pro Ser ser ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn210 215 220
Val Asn His Lys Pro ser Asn Thr Lys Val Asp Lys Lys vai Glu Pro225 230 235 240
Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu245 250 255
Leu Leu Gly Gly Pro ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp260 265 270
Thr Leu Met Ile ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp275 280 285
Val Ser His Glu Asp Pro GlU Val Lys Phe Asn Trp Tyr Val Asp Gly290 295 300
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn305 310 315 320
Ser Thr Tyr Arg vai vai Ser vai Leu Thr vai Leu His Gln As^ Trp
325
330
Leu Asn Gly Lys Glu Tyr Lys Cys Lys vai Ser Asn Lys Ala Leu Pro340 345 350
Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu355 360 365
Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn370 375 380
Gln Val ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile385 390 395 400
Ala vai Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr405 410 415
Thr Pro Pro vai Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys420 425 430
Leu Thr vai Asp Lys ser Arg Trp Gln Gln Gly Asn vai Phe Ser Cys435 440 445
Ser vai Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys ser Leu450 455 460Ser Leu ser Pro Gly Lys ser Ile Leu Pro Asp Glu Trp Leu Pro Ile465 470 475 480
vai Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp485 490 495
Arg Glu lie Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr500 505 510
Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu ser Phe Asn Arg Glu515 520 525
Thr Lys Lys ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg530 535 540
Tyr ser Gly Lys Val Tyr ser Ile Lys Leu Lys ser Gly Arg Arg Ile545 550 555 560
Lys Ile Thr Ser Gly His Ser Leu Phe ser Val Lys Asn Gly Lys Leu565 570 575
Val Lys Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val vai580 585 590
Pro Gly Arg Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu vai595 600 605
Glu Leu Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met610 615 620
Mét lie Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys625 630 635 640
Thr Leu Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly645 650 655
Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr vai Lys Leu Lys Arg660 665 670
Arg Gly Cys Glu vai Leu Asp Trp Glu ser Leu Lys Arg Tyr Arg Lys675 680 685
Leu Tyr Glu Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn ser Arg690 695 700
Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp vai Val ser Leu Met705 710 715 720
Pro Ile Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro725 730 735Lys Ile Gly Thr Phe Ile Asp vai Asp Asp ser Phe Ala Lys Leu Leu740 745 750
Gly Tyr Tyr Ile Ser ser Gly Asp Val Glu Lys Asp Arg vai Lys Phe755 760 765
His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu770 775 780
Lys Leu Phe Gly Lys vai Arg Arg Gly Arg Gly Tyr Ile Glu vai ser785 790 795 800
Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg805 810 815
Ile Pro Glu Phe Ile Phe Thr ser Pro Met Asp Ile Lys Val Ala Phe820 825 830
Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe ser Thr Lys835 840 845
ser Glu Leu Leu vai Asn Gln Leu Ile Leu Leu Leu Asn Ser lie Gly850 855 860
vai Ser Asp Ile Lys Ile Glu His Glu Lys Gly vai Tyr Arg Val Tyr865 870 875 880
Ile Asn Lys Lys Glu Ser Ser Asn Gly Asp Ile Val Leu Asp Ser Val885 890 895
Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser900 905 910
vai Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala915 920 925
His Asn Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu930 935 940
Leu Trp Phe Pro Gly Ser Arg Cys Asp Ile Gln Met Thr Gln Ser Pro945 950 955 960
ser Ser Leu ser Ala ser Val Gly Asp Arg Val Thr Ile Thr Cys Arg965 970 975
Ala Ser Gln Gly Ile Arg Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro980 985 990
Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala ser Thr Leu Gln Ser995 1000 1005Gly Val Pro Ser Arg Phe Ser Gly ser Gly Ser Gly Thr Asp Phe1010 1015 1020
Thr Leu Thr Ile ser Ser Leu Gln Pro Glu Asp vai Ala Thr Tyr1025 1030 1035
Tyr cys Gln Arg Tyr Asn Arg Ala Pro Tyr Thr Phe Gly Gln Gly1040 1045 1050
Thr Lys Val Glu lie Lys Arg Thr Val Ala Ala Pro Ser vai Phe1055 1060 1065
Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser1070 1075 1080
Val Val cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val1085 1090 1095
Gln Trp Lys Val Asp Asn Ala Leu Gln ser Gly Asn ser Gln Glu1100 1105 1110
ser vai Thr Glu Gln Asp ser Lys Asp ser Thr Tyr Ser Leu Ser1115 1120 1125
ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val1130 1135 1140
Tyr Ala Cys Glu Val Thr His Gln Gly Leu ser ser Pro Val Thr1145 1150 1155
Lys Ser Phe Asn Arg Gly Glu Cys1160 1165
<210> 64
<211> 1404
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial de pIT3-HcintLClaa-p.hori<400> 64
ccgggtaaaa acagcatttt accagatgaa tggctcccaa ttgttgaaaa tgaaaaagtt 60
cgattcgtaa aaattggaga cttcatagat agggagattg aggaaaacgc tgagagagtg 120
aagagggatg gtgaaactga aattctagag gttaaagatc ttaaagccct ttccttcaat 180
agagaaacaa aaaagagcga gctcaagaag gtaaaggccc taattagaca ccgctattca 240
gggaaggttt acagcattaa actaaagtca gggagaagga tcaaaataac ctcaggtcat 300
agtctgttct cagtaaaaaa tggaaagcta gttaaggtca ggggagatga actcaagcct 360ggtgatctcg ttgtcgttcc aggaaggtta aaacttccag aaagcaagca agtgctaaat 420
ctcgttgaac tactcctgaa attacccgaa gaggagacat cgaacatcgt aatgatgatc 480
ccagttaaag gtagaaagaa tttcttcaaa gggatgctca aaacattata ctggatcttc 540
ggggagggag aaaggccaag aaccgcaggg cgctatctca agcatcttga aagattagga 600
tacgttaagc tcaagagaag aggctgtgaa gttctcgact gggagtcact taagaggtac 660
aggaagcttt acgagaccct cattaagaac ctgaaatata acggtaatag cagggcatac 720
atggttgaat ttaactctct cagggatgta gtgagcttaa tgccaataga agaacttaag 780
gagtggataa ttggagaacc taggggtcct aagataggta ccttcattga tgtagatgat 840
tcatttgcaa agctcctagg ttactacata agtagcggag atgtagagaa agatagggtg 900
aagttccaca gtaaagatca aaacgttctc gaggatatag cgaaacttgc cgagaagtta 960tttggaaagg tgaggagagg aagaggatat attgaggtat cagggaaaat tagccatgcc 1020atatttagag ttttagcgga aggtaagaga attccagagt tcatcttcac atccccaatg 1080gatattaagg tagccttcct taagggactc aacggtaatg ctgaagaatt aacgttctcc 1140actaagagtg agctattagt taaccagctt atccttctcc tgaactccat tggagtttcg 1200gatataaaga ttgaacatga gaaaggggtt tacagagttt acataaataa gaaggaatcc 1260tccaatgggg atatagtact tgatagcgtc gaatctatcg aagttgaaaa atacgagggc 1320tacgtttatg atctaagtgt tgaggataat gagaacttcc tcgttggctt cggactactt 1380
tacgcacaca acagtatgga catg 1404
<210> 65
<211> 468
<212> PRT
<213> Artificial
<220>
<223> Sintético: seqüência codificante parcial de aminoácido pTT3-HcintLClaa-p.hori,demosntrando 4 aminoácidos acima da cadeia pesada e r aminoácidos abaixo dainteína<400> 65
Pro Gly Lys Asn ser Ile Leu Pro Asp Glu Trp Leu Pro Ile vai Glu1 5 10 15
Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu20 25 30
Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile
35
40
45
Leu Glu Val50
Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Tlir Lys55 60
60
Lys ser Glu65
Leu Lys Lys vai Lys Ala Leu Ile Arg His Arg Tyr70 75
75
Ser80Gly Lys Val Tyr ser lie Lys Leu Lys ser Gly Arg Arg Ile Lys Ile85 90 95
Thr ser Gly His ser Leu Phe ser vai Lys Asn Gly Lys Leu Val Lys100 105 110
Val Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly115 120 125
Arg Leu Lys Leu Pro Glu ser Lys Gln Val Leu Asn Leu Val Glu Leu130 135 140
Leu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile145 150 155 160
Pro Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu165 170 175
Tyr Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr180 185 190
Leu Lys His Leu Glu Arg Leu Gly Tyr vai Lys Leu Lys Arg Arg Gly195 200 205
Cys Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr210 215 220
Glu Thr Leu Ile Lys Asn Leu Lys Jyr Asn Gly Asn ser Arg Ala Tyr225 230 235 240
Met vai Glu Phe Asn ser Leu Arg Asp vai Val ser Leu Met Pro lie245 250 255
Glu Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile260 265 270
Gly Thr Phe Ile Asp Val Asp Asp ser Phe Ala Lys Leu Leu Gly Tyr275 280 285
Tyr lie ser ser Gly Asp vai Glu Lys Asp Arg vai Lys Phe His ser290 295 300
Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu305 310 315 320
Phe Gly Lys vai Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys325 330 335
lie Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro340 345 350Glu Phe Ile Phe Thr ser Pro Met Asp Ile Lys vai Ala Phe Leu Lys355 360 365
Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys ser Glu370 375 380
Leu Leu vai Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser385 390 395 400
Asp Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn405 410 415
Lys Lys Glu ser Ser Asn Gly Asp Ile Val Leu Asp ser Val Glu Ser420 425 430
ile Glu vai Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser vai Glu435 440 445
Asp Asn Glu Asn Phe Leu vai Gly Phe Gly Leu Leu Tyr Ala His Asn450 455 460
Ser Met Asp Met465
<210> 66
<211> 1416
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial pTT3-HcintLC3aa-p.hori<400> 66
ccgggtaaat tagcaaacag cattttacca gatgaatggc tcccaattgt tgaaaatgaa 60
aaagttcgat tcgtaaaaat tggagacttc atagataggg agattgagga aaacgctgag 120
agagtgaaga gggatggtga aactgaaatt ctagaggtta aagatcttaa agccctttcc 180
ttcaatagag aaacaaaaaa gagcgagctc aagaaggtaa aggccctaat tagacaccgc 240
tattcaggga aggtttacag cattaaacta aagtcaggga gaaggatcaa aataacctca 300
ggtcatagtc tgttctcagt aaaaaatgga aagctagtta aggtcagggg agatgaactc 360
aagcctggtg atctcgttgt cgttccagga aggttaaaac ttccagaaag caagcaagtg 420
ctaaatctcg ttgaactact cctgaaatta cccgaagagg agacatcgaa catcgtaatg 480
atgatcccag ttaaaggtag aaagaatttc ttcaaaggga tgctcaaaac attatactgg 540
j
atcttcgggg agggagaaag gccaagaacc gcagggcgct atctcaagca tcttgaaaga 600
ttaggatacg ttaagctcaa gagaagaggc tgtgaagttc tcgactggga gtcacttaag 660
aggtacagga àgctttacga gaccctcatt aagaacctga aatataacgg taatagcagg 720
gcatacatgg ttgaatttaa ctctctcagg gatgtagtga gcttaatgcc aatagaagaa 780cttaaggagt ggataattgg agaacctagg ggtcctaaga taggtacctt cattgatgta 840
gatgattcat ttgcaaagct cctaggttac tacataagta gcggagatgt agagaaagat 900
agggtgaagt tccacagtaa agatcaaaac gttctcgagg atatagcgaa acttgccgag 960
aagttatttg gaaaggtgag gagaggaaga ggatatattg aggtatcagg gaaaattagc 1020
catgccatat ttagagtttt agcggaaggt aagagaattc cagagttcat cttcacatcc 1080
ccaatggata ttaaggtagc cttccttaag ggactcaacg gtaatgctga agaattaacg 1140
ttctccacta agagtgagct attagttaac cagcttatcc ttctcctgaa ctccattgga 1200
gtttcggata taaagattga acatgagaaa ggggtttaca gagtttacat aaataagaag 1260
gaatcctcca atggggatat agtacttgat agcgtcgaat ctatcgaagt tgaaaaatac 1320
gagggctacg tttatgatct aagtgttgag gataatgaga acttcctcgt tggcttcgga 1380
ctactttacg cacacaacag ttattacatg gacatg 1416
<210> 67
<211> 472
<212> PRT
<213> Artificial
<220>
<223> Sintético: seqüência parcial de aminoácido mostrando inteína e seqüênciaslaterais pTT3-HcintLC3aa-p.hori
<400> 67
pro Gly Lys Leu Ala Asn Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile15 10 15
vai Glu Asn Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp20 25 30
Arg Glu Ile Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr35 40 45
Glu Ile Leu Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu50 55 60
Thr Lys Lys ser Glu Leu Lys Lys vai Lys Ala Leu Ile Arg His Arg65 70 75 80
Tyr ser Gly Lys Val Tyr Ser Ile Lys Leu Lys ser Gly Arg Arg Ile85 90 95
Lys Ile Thr ser Gly His ser Leu Phe ser vai Lys Asn Gly Lys Leu100 105 110
vai Lys vai Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu vai vai vai115 120 125
Pro Gly Arg
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val130
135
140
Glu Leu Lêu Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile vai Met145 150 155 160
Met Ile Pro vai Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys165 170 175
Thr Leu Tyr Trp Xle Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly180 185 190
Arg Tyr Leu Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg195 200 205
Arg Gly Cys Glu Val Leu Asp Trp Glu ser Leu Lys Arg Tyr Arg Lys210 215 220
Leu Tyr Glu Thr Leu lie Lys Asn Leu Lys Tyr Asn Gly Asn ser Arg225 230 235 240
Ala Tyr Met Val Glu Phe Asn Ser Leu Arg Asp vai Val Ser Leu Met245 250 255
Pro lie Glu Glu Leu Lys Glu Trp lie Ile Gly Glu Pro Arg Gly Pro260 265 270
Lys Ile Gly Thr Phe Ile Asp Val Asp Asp ser Phe Ala Lys Leu Leu275 280 285
Gly Tyr Tyr Ile ser ser Gly Asp vai Glu Lys Asp Arg Val Lys Phe290 295 300
His Ser Lys Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu305 310 315 320
Lys Leu Phe Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu vai Ser325 330 335
Gly Lys Ile Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg340 345 350
lie Pro Glu Phe Ile Phe Thr ser Pro Met Asp Ile Lys Val Ala Phe355 360 365
Leu Lys Gly Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe ser Thr Lys370 375 380
ser Glu Leu Leu Val Asn Gln Leu Ile Leu Leu Leu Asn ser Ile Gly385 390 395 400
Val ser Asp Ile Lys lie Glu His Glu Lys Gly Val Tyr Arg vai Tyr405 410" 415
Ile Asn Lys Lys Glu Ser ser Asn Gly Asp Ile Val Leu Asp Ser Val420 425 4B0
Glu Ser Ile Glu Val Glu Lys Tyr Glu Gly Tyr vai Tyr Asp Leu ser435 440 445
vai Glu Asp Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala450 455 460
His Asn Ser Tyr Tyr Met Asp Met465 470
<210> 68
<211> 31
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
• <400> 68ggactacttt acgcagccaa catggacatg c
<210> 69
<211> 31
<212> DNA
<213> Artificial
<220>
<22 3> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 69
gcatgtccat gttggctgcg taaagtagtc c
<210> 70
<211> 34
<212> DNA
<213> Arti fi ci al
<220>
<22 3> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 70
ggactacttt acgcagccaa cagtatggac atgc
<210> 71
<211> 34
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 71
gcatgtccat actgttggct gcgtaaagta gtcc
<210> 72<211> 18
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 72
ggtgaggaga ggaagagg
<210> 73
<211> 16
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 73ccagaggtcg aggtcg
<210> 74
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 74cggcgtggag gtgc
<210> 75
<211> 45
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 75
caacaattgg gagccattca tctggtaaaa tggttttacc cggag
<210> 76
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 76
ccgcccagct gctgggcgac gagtggttcc ccggctcgcg
<210> 77
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 77cgcgagccgg ggaaccactc gtcgcccagc agctgggcgg
<210> 78
<211> 15
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 78tgagcggccg ctcga
<210> 79
<211> 15
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 79gttgtgtgcg taaag
<210> 80
<211> 15
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 80agcattttac cagat
<210> 81
<211> 15
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 81ggtggcgccc aaact
<210> 82
<211> 30
<212> DNA
<213> Artificial
<220>
<22 3> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 82
ctttacgcac acaacatgga catgcgcgtg
<210> 83
<211> 27
<212> DNA
<213> Artificial<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 83
tcgagcggcc gctcaacact ctcccct
<210> 84
<211> 30
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 84
agtttgggcg ccaccatgga gtttgggctg
<210> 85
<211> 30
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 85
atctggtaaa atgcttttac ccggagacag
<210> 86
<211> 30
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 86
agtttgggcg ccaccatgga catgcgcgtg
<210> 87
<211> 31
<212> DNA
<2X3> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 87
atctggtaaa atgctacact ctcccctgtt g
<210> 88
<211> 30
<212> DNA<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 88
ctttacgcac acaacatgga gtttgggctg
<210> 89<211> 30
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 89
tcgagcggcc gctcatttac ccggagacag
<210> 90
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 90cgccaagctc tagc
<210> 91
<211> 14
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 91ggtcgaggtc gggg
<210> 92
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 92
acatgcgcgt gcccgcccag tggttccccg gctcgcgatg
<210> 93
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 93
catcgcgagc cggggaacca ctgggcgggc acgcgcatgt
<210> 94
<211> 30
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 94ctttacgcac acaacgacat ccagatgacc 30
<210> 95
<211> 30
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 95
ggtcatctgg atgtcgttgt gtgcgtaaag 30
<210> 96
<211> 36
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 96
tggttccccg gctcgggagg cgacatccag atgacc 36
<210> 97
<211> 36
<212> DNA
<213> Artificial<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 97
ggtcatctgg atgtcgcctc ccgagccggg gaacca 36
<210> 98
<211> 1464
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial do constructo A.<400> 98
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600gttaagctca agagaagagg ctgtgaagtt Gtcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacçtg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaággtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcagccaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc 1440
cccggctcgc gatgcgacat ccag 1464
<210> 99<211> 488<212> PRT<213> Artificial
<220>
<223> Sintético: seqüência parcial de aminoácidos do constructo A.<400> 99
Pro Gly Lys ser Ile Leu Pro Asp Glu Trp Leu Pro lie Val Glu Asn1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu
35
40
45
Glu Val50
Lys Asp Leu Lys Ala Leu Ser55
Phe Asn Arg Glu Thr Lys Lys60
Ser Glu65
Leu Lys Lys Val Lys Ala Leu Ile70
Arg75
His Arg Tyr Ser Gly80
Lys Val Tyr Ser Ile Lys Leu Lys85
Ser Gly90
Arg Arg Ile Lys Ile Thr95
Ser Gly His Ser Leu Phe Ser Val100
Gly Lys Leu Val Lys Val110Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg115 120 125
Leu Lys Leu Pro Glu ser Lys Gln vai Leu Asn Leu Val Glu Leu Leu130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr ser Asn Ile Val Met Met Ile Pro145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu210 215 220
Thr Leu lie Lys Asn Leu Lys Tyr Asn Gly Asn ser Arg Ala Tyr Met225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp vál vai ser Leu Met Pro Ile Glu245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly260 265 270
Thr. Phe Ile Asp vai Asp Asp ser Phe Ala Lys Leu Leu Gly Tyr Tyr275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His ser Lys290 295 300
Asp Gln Asn vai Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe305 310 315 320
Gly Lys vai Arg Arg Gly Arg Gly Tyr Ile Glu vai ser Gly Lys Ile325 330 335
ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu340 345 350
Phe lie Phe Thr ser Pro Met Asp Ile Lys vai Ala Phe Leu Lys Gly355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys ser Glu Leu370 375 380Leu vai Asn Gln Leu Ile Leu Leu Leu Asn Ser Ile Gly Val Ser Asp385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys405 410 415
Lys Glu Ser ser Asn Gly Asp lie vai Leu Asp ser Val Glu ser Ile420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu ser Val Glu Asp435 440 445
Asn Glu Asn Phe Leu vai Gly Phe Gly Leu Leu Tyr Ala Ala Asn Met450 455 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe465 470 475 480
Pro Gly ser Arg Cys Asp Ile Gln485
<210> 100<211> 1467<212> DNA<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial de constructo B.
<400> 100 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60ttcgtaaaaa ttggagactt catàgatagg gagattgagg aaaacgctgà gagagtgaag 120agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcagccaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg 1440
ttccccggct cgcgatgcga catccag 1467
<210> 101
<211> 489
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético: seqüência parcial de aminoácido do constructo B.<400> 101
Pro Gly Lys ser Xle Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn15 10 15
Glu Lys vai Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu35 40 45
Glu Val Lys Asp Leu Lys Ala Leu ser Phe Asn Arg Glu Thr Lys Lys50 55 60
Ser Glu Leu Lys Lys vai Lys Ala Leu lie Arg His Arg Tyr ser Gly65 70 75 80
Lys Val Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr85 90 95
Ser Gly His Ser Leu Phe Ser Val Lys Asn Gly Lys Leu Val Lys vai100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu vai vai vai Pro Gly Arg115 120 125
Leu Lys Leu Pro Glu ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr Ser Asn Ile Val Met Met Ile Pro145
150
155
160
VaT Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys195 200 205
Glu vai Leu Asp Trp Glu ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu245 250 255
Glu Leu Lys Glu Trp 11'e Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly260 265 270
Thr Phe Ile Asp Val Asp Asp ser Phe Ala Lys Leu Leu Gly Tyr Tyr275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg vai Lys Phe His ser Lys290 295 300
Asp Gln Asn vai Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile325 330 335
ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu340 345 350
Phe Ile Phe Thr ser Pro Met Asp Ile Lys vai Ala Phe Leu Lys Gly355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe ser Thr Lys ser Glu Leu370 375 380
Leu vai Asn Gln Leu Ile Leu Leu Leu Asn ser Ile Gly vai Ser Asp385 390 395 400
lie Lys He Glu His Glu Lys Gly vai Tyr Arg Val Tyr lie Asn Lys405 410 415
Lys Glu Ser ser Asn Gly Asp Ile Val Leu Asp Ser Val Glu Ser Ile420 425 430
Glu vai Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala Ala Asn Ser450 455 460
Met Asp Met Arg vai Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp465 470 475 480
Phe Pro Gly Ser Arg Cys Asp Ile Gln485
<210> 102<211> 1467<212> DNA<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial do constructo E.
<400> 102 ccgggtaaaa ccattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatágt 300ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggatàatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaaca gtatggacat gcgcgtgccc gcccagctgc tgggcctgct gctgctgtgg 1440
ttccccggct cgcgatgcga catccag 1467
<210> 103
<211> 489
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético: seqüência parcial de aminoácido para constructoE.
<400> 103
Pro Gly Lys Thr Ile Leu Pro Asp Glu Trp Leu Pro He Val Glu Asn15 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile20 25 30
Glu Glu Asn Ala Glu Arg vai Lys Arg Asp Gly Glu Thr Glu Ile Leu35 40 45
Glu Val Lys Asp Leu Lys Ala Leu Ser Phe Asn Arg Glu Thr Lys Lys50 55 60
ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr ser Gly65 70 75 80
Lys Val Tyr ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr85 90 95
Ser Gly His Ser Leu Phe Ser vai Lys Asn Gly Lys Leu Val Lys vai100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val vai Pro Gly Arg115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr ser Asn Ile Val Met Met Ile Pro145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu180 185 190Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arq Gly Cys195 200 205
Glu vai Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp Val vai ser Leu Met Pro Ile Glu245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly260 265 270
Thr Phe Ile Asp Val Asp Asp ser Phe Ala Lys Leu Leu Gly Tyr Tyr275 280 285
t
lie ser ser Gly Asp vai Glu Lys Asp Arg vai Lys Phe His ser Lys290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe305 310 315 320
Gly Lys vai Arg Arg Gly Arg Gly Tyr Il e Glu Val ser Gly Lys Ile325 330 335
Ser His Ala lie Phe Arg Val Leu Ala Glu Gly Lys Arg lie Pro Glu340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys ser Glu Leu370 375 380
Leu vai Asn Gln Leu Ile Leu Leu Leu Asn ser Ile Gly vai ser Asp385 390 395 400
Ile Lys lie Glu His Glu Lys Gly Val Tyr Arg vai Tyr Ile Asn Lys405 410 415
Lys Glu Ser ser Asn Gly Asp Ile Val Leu Asp ser Val Glu Ser Ile420 425 430
Glu vai Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu ser Val Glu Asp435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn ser450 455 460Met Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Tro465 470 475 480
Phe Pro Gly Ser Arg Cys Asp Ile Gln485
<210> 104<211> 1458<212> DNA<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial de constructo H.<400> 104
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420
gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaá ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
ãatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcgacgagtg gttccccggc 1440
tcgcgatgcg acatccag 1458<210> 105
<211> 486
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético: seqüência parcial de aminoácido de constructoH.
<400> 105
Pro Gly Lys Ser lie Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile20 25 30
Glu Glu Asn Ala Glu Arg vai Lys Arg Asp Gly Glu Thr Glu Ile Leu35 40 45
Glu Val Lys Asp Leu Lys Ala Leu ser Phe Asn Arg Glu Thr Lys Lys50 55 60
ser Glu Leu Lys Lys vai Lys Ala Leu Ile Arg His Arg Tyr ser Gly65 70 75 80
Lys vai Tyr ser Ile Lys Leu Lys ser Gly Arg Arg Ile Lys Ile Thr85 90 95
Ser Gly His ser Leu Phe Ser vai Lys Asn Gly Lys Leu vai Lys Val100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu vai vai vai Pro Gly Arg115 120 125
Leu Lys Leu Pro Glu ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr ser Asn Ile vai Met Met Ile Pro145 150 155 160
vai Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu180 185 190
Lys His Leu Glu Arg Leu Gly Tyr vai Lys Leu Lys Arg Arg Gly Cys195 200 205
Glu Val Leu Asp Trp Glu ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu210 215 220Thr Leu lie Lys Asn Leu Lys Tyr Asn Gly Asn ser Arg Ala Tyr Met225 230 235 240
vai Glu Phe Asn Ser Leu Arg Asp vai Val ser Leu Met Pro Ile Glu245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly260 265 270
Thr Phe Ile Asp Val Asp Asp ser Phe Ala Lys Leu Leu Gly Tyr Tyr275 280 285
Ile Ser Ser Gly Asp vai· Glu Lys Asp Arg vai Lys Phe His Ser Lys290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe305 310 315 320
Gly Lys vai Arg Arg Gly Arg Gly Tyr Ile Glu Val Ser Gly Lys Ile325 330 335
Ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu340 345 350
Phe Ile Phe Thr Ser Pro Met Asp Ile Lys vai Ala Phe Leu Lys Gly355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe ser Thr Lys Ser Glu Leu370 375 380
Leu vai Asn Gln Leu lie Leu Leu Leu Asn ser Ile Gly vai ser Asp385 390 395 400
Ile Lys lie Glu His Glu Lys Gly Val Tyr Arg vai Tyr Ile Asn Lys405 410 415
Lys Glu ser Ser Asn Gly Asp Ile Val Leu Asp Ser vai Glu Ser Ile420 425 430
Glu vai Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu ser vai Glu Asp435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Met450 455 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Asp Glu Trp Phe Pro Gly465 470 475 480
ser Arg Cys Asp Ile Gln485<210> 106
<211> 1443
<212> DNA
<213> Artificial
<220>
<22 3> Constracto sintético: seqüência codificante parcial de constructo J.
<400> 106 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660aagctttacg agaccctcat tâagaacctg aaatataacg gtaatagcag ggcatacatg 720gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380gcacacaaca tggacatgcg cgtgcccgcc cagtggttcc ccggctcgcg atgcgacatc 1440cag 1443<210> 107 <211> 481 <212> PRT <213> Artificial • <220> <223> Constructo sintético: seqüência parcial de aminoácido de constructoJ.
<400> 107
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn15 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile20 25 30
Glu Glu Asn Ala Glu Arg vai Lys Arg Asp Gly Glu Thr Glu Ile Leu35 40 45
Glu Val Lys Asp Leu Lys Ala Leu ser Phe Asn Arg Glu Thr Lys Lys50 55 60
ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Glv65 70 75 80
Lys vai Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg Ile Lys Ile Thr85 90 95
Ser Gly His ser Leu Phe Ser Val Lys Asn Gly Lys Leu vai Lys Val100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Ara115 120 125
Leu Lys Leu Pro Glu Ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr ser Asn Ile Val Met Met Ile Pro145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly Cys195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn ser Arg Ala Tyr Met225 230 235 240
Val Glu Phe Asn ser Leu Arg Asp Val Val ser Leu Met Pro Ile Glu245 250 255Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lvs ile Glv260 265 270
Thr Phe Ile Asp vai Asp Asp ser Phe Ala Lys Leu Leu Gly Tvr Tvr275 280 285
Ile ser Ser Gly Asp vai Glu Lys Asp Arg vai Lys Phe His ser Lys290 295 300
Asp Gln Asn vai Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu vai Ser Gly Lys Ile325 330 335
ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu340 345 350
Phe Ile Phe Thr ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe ser Thr Lys ser Glu Leu370 375 38Ò
Leu Val Asn Gln Leu Ile Leu Leu Leu Asn ser Ile Gly vai Ser Asp385 390 395 400
Ile Lys lie Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys405 410 415
Lys Glu ser ser Asn Gly Asp ile Val Leu Asp Ser Val Glu ser ilè420 425 430
Glu vai Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp435 440 445
Asn Glu Asn Phe Leu vai Gly Phe Gly Leu Leu Tyr Ala His Asn Met450 455 460
Asp Met Arg Val Pro Ala Gln Trp Phe Pro Gly Ser Arg Cys Asp lie465 470 475 480
Gln
<210> 108
<211> 1398
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial de constructo K.<400> 108 ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540gagggagaaa ggccaagáac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380gcacacaacg acatccag 1398
<210> 109
<211> 466
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético: seqfiência parcial de aminoácido de constructoK.
<400> 109
Pro Gly Lys Ser Ile Leu Pro Asp Glu Trp Leu Pro Ile Val Glu Asn1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile20 25 30Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu35 40 45
Glu Val Lys Asp Leu Lys Ala Leu ser Phe Asn Arg Glu Thr Lys Lys50 55 60
Ser Glu Leu Lys Lys Val Lys Ala Leu Ile Arg His Arg Tyr Ser Gly65 70 75 80
Lys vai Tyr Ser Ile Lys Leu Lys Ser Gly Arg Arg ile Lys Ile Thr85 90 95
ser Gly His ser Leu Phe ser vai Lys Asn Gly Lys Leu vai Lys Val100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg115 120 125
Leu Lys Leu Pro Glu ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu130 135 140
Leu Lys Leu Prb Glu Glu Glu Thr Ser Asn Ile vai Met Met Ile Pro145 150 155 160
Val Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu180 185 190
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly cys195 200 205
Glu vai Leu Asp Trp Glu ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu210 215 220
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn Ser Arg Ala Tyr Met225 230 235 240
Val Glu Phe Asn Ser Leu Arg Asp vai Val Ser Leu Met Pro Ile Glu245 250 255
Glu Lèu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys Ile Gly260 265 270
Thr Phe Ile Asp vai Asp Asp Ser Phe Ala Lys Leu Leu Gly Tyr Tyr275 280 285
Ile Ser ser Gly Asp vai Glu Lys Asp Arg Val Lys Phe His ser Lys290 295 300Asp Gln Asn Val Leu Glu Asp lie Ala Lys Leu Ala Glu Lys Leu Phe305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val ser Gly Lys Ile325 330 335
ser His Ala lie Phe Arg vai Leu Ala Glu Gly Lys Arg Ile Pro Glu340 345 350
Phe lie Phe Thr ser Pro Met Asp ile Lys vai Ala Phe Leu Lys Gly355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe ser Thr Lys Ser Glu Leu370 375 380
Leu Val Asn Gln Leu Ile Leu Leu Leu ASn ser Ile Gly Val ser Asp385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg vai Tyr Ile Asn Lys405 410 415
Lys Glu Ser ser Asn Gly Asp Ile vai Leu Asp Ser Val Glu Ser Ile420 425 430
Glu Val Glu Lys Tyr Glu Gly Tyr Val Tyr Asp Leu Ser Val Glu Asp435 440 445
Asn Glu Asn Phe Leu Val Gly Phe Gly Leu Leu Tyr Ala His Asn Asp450 455 460
Ile Gln465
<210> 110
<211> 1464
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial de constructo L.<400> 110
ccgggtaaaa gcattttacc agatgaatgg ctcccaattg ttgaaaatga aaaagttcga 60
ttcgtaaaaa ttggagactt catagatagg gagattgagg aaaacgctga gagagtgaag 120
agggatggtg aaactgaaat tctagaggtt aaagatctta aagccctttc cttcaataga 180
gaaacaaaaa agagcgagct caagaaggta aaggccctaa ttagacaccg ctattcaggg 240
aaggtttaca gcattaaact aaagtcaggg agaaggatca aaataacctc aggtcatagt 300
ctgttctcag taaaaaatgg aaagctagtt aaggtcaggg gagatgaact caagcctggt 360
gatctcgttg tcgttccagg aaggttaaaa cttccagaaa gcaagcaagt gctaaatctc 420gttgaactac tcctgaaatt acccgaagag gagacatcga acatcgtaat gatgatccca 480
gttaaaggta gaaagaattt cttcaaaggg atgctcaaaa cattatactg gatcttcggg 540
gagggagaaa ggccaagaac cgcagggcgc tatctcaagc atcttgaaag attaggatac 600
gttaagctca agagaagagg ctgtgaagtt ctcgactggg agtcacttaa gaggtacagg 660
aagctttacg agaccctcat taagaacctg aaatataacg gtaatagcag ggcatacatg 720
gttgaattta actctctcag ggatgtagtg agcttaatgc caatagaaga acttaaggag 780
tggataattg gagaacctag gggtcctaag ataggtacct tcattgatgt agatgattca 840
tttgcaaagc tcctaggtta ctacataagt agcggagatg tagagaaaga tagggtgaag 900
ttccacagta aagatcaaaa cgttctcgag gatatagcga aacttgccga gaagttattt 960
ggaaaggtga ggagaggaag aggatatatt gaggtatcag ggaaaattag ccatgccata 1020
tttagagttt tagcggaagg taagagaatt ccagagttca tcttcacatc cccaatggat 1080
attaaggtag ccttccttaa gggactcaac ggtaatgctg aagaattaac gttctccact 1140
aagagtgagc tattagttaa ccagcttatc cttctcctga actccattgg agtttcggat 1200
ataaagattg aacatgagaa aggggtttac agagtttaca taaataagaa ggaatcctcc 1260
aatggggata tagtacttga tagcgtcgaa tctatcgaag ttgaaaaata cgagggctac 1320
gtttatgatc taagtgttga ggataatgag aacttcctcg ttggcttcgg actactttac 1380
gcacacaaca tggacatgcg cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc 1440
cccggctcgg gaggcgacat ccag 1464
<210> 111
<211> 488
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético: seqüência parcial de aminoácido de constructo L.<400> 111
Pro Gly Lys ser Ile Leu Pro Asp Glu Trp Leu Pro Ile vai Glu Asn1 5 10 15
Glu Lys Val Arg Phe Val Lys Ile Gly Asp Phe Ile Asp Arg Glu Ile20 25 30
Glu Glu Asn Ala Glu Arg Val Lys Arg Asp Gly Glu Thr Glu Ile Leu35 40 45
Glu Val Lys Asp Leu Lys Ala Leu ser Phe Asn Arg Glu Thr Lys Lys
50
55
60
ser Glu Leu Lys Lys65
vai Lys Ala Leu Ile Arg His Arg Tyr70 75
Ser Gly80
Lys vai Tyr ser Ile Lys Leu Lys ser Gly Arg Arg Ile Lys Ile Thr85
90
95
Ser Gly His Ser Leu Phe Ser vai Lys Asn Gly Lys Leu Val Lys vai100 105 110
Arg Gly Asp Glu Leu Lys Pro Gly Asp Leu Val Val Val Pro Gly Arg115 120 125
Leu Lys Leu Pro Glu ser Lys Gln Val Leu Asn Leu Val Glu Leu Leu130 135 140
Leu Lys Leu Pro Glu Glu Glu Thr ser Asn Ile Val Met Met Ile Pro145 150 155 160
vai Lys Gly Arg Lys Asn Phe Phe Lys Gly Met Leu Lys Thr Leu Tyr165 170 175
Trp Ile Phe Gly Glu Gly Glu Arg Pro Arg Thr Ala Gly Arg Tyr Leu
180
185
Lys His Leu Glu Arg Leu Gly Tyr Val Lys Leu Lys Arg Arg Gly cys195 200 205
Glu Val Leu Asp Trp Glu Ser Leu Lys Arg Tyr Arg Lys Leu Tyr Glu
210
215
Thr Leu Ile Lys Asn Leu Lys Tyr Asn Gly Asn ser Arg Ala Tyr Met225 230 235 240
Val Glu Phe Asn ser Leu Arg Asp Val Val Ser Leu Met Pro Ile Glu245 250 255
Glu Leu Lys Glu Trp Ile Ile Gly Glu Pro Arg Gly Pro Lys lie Gly260 265 270
Thr Phe Ile Asp Val Asp Asp ser Phe Ala Lys Leu Leu Gly Tyr Tyr275 280 285
Ile Ser Ser Gly Asp Val Glu Lys Asp Arg Val Lys Phe His ser Lys290 295 300
Asp Gln Asn Val Leu Glu Asp Ile Ala Lys Leu Ala Glu Lys Leu Phe305 310 315 320
Gly Lys Val Arg Arg Gly Arg Gly Tyr Ile Glu Val ser Gly Lys lie325 330 335
ser His Ala Ile Phe Arg Val Leu Ala Glu Gly Lys Arg Ile Pro Glu340 345 350
Phe lie Phe Thr ser Pro Met Asp Ile Lys Val Ala Phe Leu Lys Gly355 360 365
Leu Asn Gly Asn Ala Glu Glu Leu Thr Phe Ser Thr Lys Ser Glu Leu370 375 380
Leu vai Asn Gln Leu lie Leu Leu Leu Asn Ser Ile Gly Val Ser Asp385 390 395 400
Ile Lys Ile Glu His Glu Lys Gly Val Tyr Arg Val Tyr Ile Asn Lys405 410 415
Lys Glu ser ser Asn Gly Asp Ile Val Leu Asp ser Val Glu Ser ile420 425 430
Glu vai Glu Lys Tyr Glu Gly Tyr vai Tyr Asp Leu ser Val Glu Asp435 440 445
Asn Glu Asn Phe Leu vai Gly Phe Gly Leu Leu Tyr Ala His Asn Met450 455 460
Asp Met Arg Val Pro Ala Gln Leu Leu Gly Leu Leu Leu Leu Trp Phe465 470 475 480
Pro Gly Ser Gly Gly Asp Ile Gln485
<210> 112<211> 26<212> DNA<213> Artificial
<220>
<223> Constracto sintético: oligonucleotídeo utilizado como um primer.<400> 112
tgctttgcca agggtaccaa tgtttt 26
<210> 113
<211> 26
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 113
attatggacg acaacctggt tggcaa 26
<210> 114
<211> 59
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 114ccgcagaaga gcctctccct gtctccgggt áaatgctttg ccaagggtac caatgtttt 59
<210> 115
<211> 62
<212> DNA
<213> Artificial
<220>
<223> Constrncto sintético: oligonucleotídeo utilizado como um primer.<400> 115
ccgcagaaga gcctctccct gtctccgggt aaagggtgct ttgccaaggg taccaatgtt 60tt 62
<210> 116
<211> 68
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 116
ccgcagaaga gcctctccct gtctccgggt aaatatgtcg ggtgctttgc caagggtacc 60aatgtttt 68
<210> 117
<211> 65
<212> DNA
<213> Arti fi ciai
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 117
cagcaggccc agcagctggg cgggcacgcg catgtccata ttatggacga caacctggtt 60ggcaa 65
<210> 118
<211> 68
<212> DNA<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 118
cagcaggccc agcagctggg cgggcacgcg catgtccatg caattatgga cgacaacctg 60gttggcaa 68
<210> 119
<211> 74
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 119cagcaggccc agcagctggg cgggcacgcg catgtccatt tctccgcaat tatggacgac 60aacctggttg gcaa 74
<210> 120
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer
<400> 120
ccactacacg cagaagagcc tctccctgtc tccgggtaaa 40
<210> 121
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer
<400> 121
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat 40
<210> 122
<211> 40
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer
<400> 122
atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc 40
<210> 123
<211> 41
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer
<400> 123
tttacccgga gacagggaga ggctcttctg cgtgtagtgg t 41
<210> 124
<211> 9442
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência de nucleotídeo do plasmídeo pTT3-D2E7 cadeia
pesada - inteína D2E7 cadeia leve<400> 124
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840
tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800
tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520
aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640
tcagttgggt gcactfagtgg gttacatcga actggatctc aacagcggta agatccttga 2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940
tctgacaacg atcggaggac cgaaggagct aacçgctttt ttgcacaaca tgggggatca 3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctácagc gtgagctatg 3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160cctacttggc agtacatcta cgtattagtç atcgctatta ccatggtgat gcggttttgg 5220cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgctttgc 7380
caagggtacc aatgttttaa tggcggatgg gtctattgaa tgtattgaaa acattgaggt 7440
tggtaataag gtcatgggta aagatggcag acctcgtgag gtaattaaat tgcccagagg 7500
aagagaaact atgtacagcg tcgtgcagaa aagtcagcac agagcccaca aaagtgactc 7560
aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat gcgacccatg agttggttgt 7620
tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt aagggtgtcg aatattttga 7680
agttattact tttgagatgg gccaaaagaa agcccccgac ggtagaattg ttgagcttgt 7740
caaggaagtt tcaaagagct acccaatatc tgaggggcct gagagagcca acgaattagt 7800
agaatcctat agaaaggctt caaataaagc ttattttgag tggactattg aggccagaga 7860
tctttctctg ttgggttccc atgttcgtaa agctacctac cagacttacg ctccaattct 7920
ttatgagaat gaccactttt tcgactacat gcaaaaaagt aagtttcatc tcaccattga 7980
aggtccaaaa gtacttgctt atttacttgg tttatggatt ggtgatggat tgtctgacag 8040
ggcaactttt tcggttgatt ccagagatac ttctttgatg gaacgtgtta ctgaatatgc 8100
tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa gaaccacaag ttgccaaaac 8160
tgttaatttg tactctaaag ttgtcagagg taatggtatt cgcaataatc ttaatactga 8220
gaatccatta tgggacgcta ttgttggctt aggattcttg aaggacggtg tcaaaaatat 8280
tccttctttc ttgtctacgg acaatatcgg tactcgtgaa acatttcttg ctggtctaat 8340tgattctgat ggctatgtta ctgatgagca tggtattaaa gcaacaataa agacaattca 8400
tacttctgtc agagatggtt tggtttccct tgctcgttct ttaggcttag tagtctcggt 8460
taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa cataaaatta gttatgctat 8520
ttatatgtct ggtggagatg ttttgcttaa cgttctttcg aagtgtgccg gctctaaaaa 8580
attcaggcct gctcccgccg ctgcttttgc acgtgagtgc cgcggatttt atttcgagtt 8640
acaagaattg aaggaagacg attattatgg gattacttta tctgatgatt ctgatcatca 8700
gtttttgctt gccaaccagg ttgtcgtcca taatatggac atgcgcgtgc ccgcccagct 8760
gctgggcctg ctgctgctgt ggttccccgg ctcgcgatgc gacatccaga tgacccagtc 8820
tccatcctcc ctgtctgcat ctgtagggga cagagtcacc atcacttgtc gggcaagtca 8880
gggcatcaga aattacttag cctggtatca gcaaaaacca gggaaagccc ctaagctcct 8940
gatctatgct gcatccactt tgcaatcagg ggtcccatct cggttcagtg gcagtggatc 9000
tgggacagat ttcactctca ccatcagcag cctacagcct gaagatgttg caacttatta 9060
ctgtcaaagg tataaccgtg caccgtatac ttttggccag gggaccaagg tggaaatcaa 9120
acgtacggtg gctgcaccat ctgtcttcat cttcccgcca tctgatgagc agttgaaatc 9180
tggaactgcc tctgttgtgt gcctgctgaa taacttctat cccagagagg ccaaagtaca 9240
gtggaaggtg gataacgccc tccaatcggg taactcccag gagagtgtca cagagcagga 9300
cagcaaggac agcacctaca gcctcagcag caccctgacg ctgagcaaag cagactacga 9360
gaaacacaaa gtctacgcct gcgaagtcac ccatcagggc ctgagctcgc ccgtcacaaa 9420
gagcttcaac aggggagagt gt 9442
<210> 125<211> 1386<212> DNA<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial empTT3-HC-VMAint-LC-laa.
<400> 125
ccgggtaaag ggtgctttgc caagggtacc aatgttttaa tggcggatgg gtctattgaa 60
tgtattgaaa acattgaggt tggtaataag gtcatgggta aagatggcag acctcgtgag 120
gtaattaaat tgcccagagg aagagaaact atgtacagcg tcgtgcagaa aagtcagcac 180
agagcccaca aaagtgactc aagtcgtgaa gtgccagaat tactcaagtt tacgtgtaat 240
gcgacccatg agttggttgt tagaacacct cgtagtgtcc gccgtttgtc tcgtaccatt 300
aagggtgtcg aatattttga agttattact tttgagatgg gccaaaagaa agcccccgac 360
ggtagaattg ttgagcttgt caaggaagtt tcaaagagct acccaatatc tgaggggcct 420
gagagagcca acgaattagt agaatcctat agaaaggctt caaataaagc ttattttgag 480
tggactattg aggccagaga tctttctctg ttgggttccc atgttcgtaa agctacctac 540cagacttacg ctccaattct ttatgagaat gaccactttt tcgactacat gcaaaaaagt 600aagtttcatc tcaccattga aggtccaaaa gtacttgctt atttacttgg tttatggatt 660ggtgatggat tgtctgacag ggcaactttt tcggttgatt ccagagatac ttctttgatg 720gaacgtgtta ctgaatatgc tgaaaagttg aatttgtgcg ccgagtataa ggacagaaaa 780gaaccacaag ttgccaaaac tgttaatttg tactctaaag ttgtcagagg taatggtatt 840cgcaataatc ttaatactga gaatccatta tgggacgcta ttgttggctt aggattcttg 900aaggacggtg tcaaaaatat tccttctttc ttgtctacgg acaatatcgg tactcgtgaa 960acatttcttg ctggtctaat tgattctgat ggctatgtta ctgatgagca tggtattaaa 1020gcaacaataa agacaattca tacttctgtc agagatggtt tggtttccct tgctcgttct 1080ttaggcttag tagtctcggt taacgcagaa cctgctaagg ttgacatgaa tggcaccaaa 1140cataaaatta gttatgctat ttatatgtct ggtggagatg ttttgcttaa cgttctttcg 1200aagtgtgccg gctctaaaaa attcaggcct gctcccgccg ctgcttttgc acgtgagtgc 1260cgcggatttt atttcgagtt acaagaattg aaggaagacg attattatgg gattacttta 1320tctgatgatt ctgatcatca gtttttgctt gccaaccagg ttgtcgtcca taattgcatg 1380gacatg 1386<210> 126 <211> 1398 <212> DNA <213> Artificial <220> <223> Constructo sintético: seqüência codificante parcial em pTT3-HC-VMAint-LC-3aa. <400> 126 ccgggtaaat atgtcgggtg ctttgccaag ggtaccaatg ttttaatggc ggatgggtct 60attgaatgta ttgaaaacat tgaggttggt aataaggtca tgggtaaaga tggcagacct 120cgtgaggtaa ttaaattgcc cagaggaaga gaaactatgt acagcgtcgt gcagaaaagt 180cagcacagag cccacaaaag tgactcaagt cgtgaagtgc cagaattact caagtttacg 240tgtaatgcga cccatgagtt ggttgttaga acacctcgta gtgtccgccg tttgtctcgt 300accattaagg gtgtcgaata ttttgaagtt attacttttg agatgggcca aaagaaagcc 360cccgacggta gaattgttga gcttgtcaag gaagtttcaa agagctaccc aatatctgag 420gggcctgaga gagccaacga attagtagaa tcctatagaa aggcttcaaa taaagcttat 480tttgagtgga ctattgaggc cagagatctt tctctgttgg gttcccatgt tcgtaaagct 540acctaccaga cttacgctcc aattctttat gagaatgacc actttttcga ctacatgcaa 600aaaagtaagt ttcatctcac cattgaaggt ccaaaagtac ttgcttattt acttggttta 660tggattggtg atggattgtc tgacagggca actttttcgg ttgattccag agatacttct 720ttgatggaac gtgttactga atatgctgaa aagttgaatt tgtgcgccga gtataaggac 780agaaaagaac cacaagttgc caaaactgtt aatttgtact ctaaagttgt cagaggtaat 840ggtattcgca ataatcttaa tactgagaat ccattatggg acgctattgt tggcttagga 900ttcttgaagg acggtgtcaa aaatattcct tctttcttgt ctacggacaa tatcggtact 960cgtgaaacat ttcttgctgg tctaattgat tctgatggct atgttactga tgagcatggt 1020attaaagcaa caataaagac aattcatact tctgtcagag atggtttggt ttcccttgct 1080cgttctttag gcttagtagt ctcggttaac gcagaacctg ctaaggttga catgaatggc 1140accaaacata aaattagtta tgctatttat atgtctggtg gagatgtttt gcttaacgtt 1200ctttcgaagt gtgccggctc taaaaaattc aggcctgctc ccgccgctgc ttttgcacgt 1260gagtgccgcg gattttattt cgagttacaa gaattgaagg aagacgatta ttatgggatt 1320actttatctg atgattctga tcatcagttt ttgcttgcca accaggttgt cgtccataat 1380tgcggagaaa tggacatg 1398
<210> 127<211> 1050<212> DNA<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante projetada de inteína de synechococcus<400> 127
gggcgaattg ggtaccgaat tctgcctgtc cttcggcacc gagatcctga ccgtggagta 60
cccgcttaac ccatggctta agacggacag gaagccgtgg ctctaggact ggcacctcat 120
cggccctctg cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt 180
gccgggagac ggatagccgt tctagcacag gcttctctag ttgacgaggc acatgaggca 240
ggaccctgag ggccgggtgt atactcaggc catcgcccag tggcacgacc ggggcgagca 300
cctgggactc ccggcccaca tatgagtccg gtagcgggtc accgtgctgg ccccgctcgt 360
ggaggtgctg gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg 420
cctccacgac ctcatgctcg acctcctgcc gaggcactag gcccggtgga ggctggtggc 480
gtttctgacc accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga 540
caaagactgg tggctgatag tcgacgaccg gtagctcctc tagaagcggg ccgtcgacct 600
cctgctgacc ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc 660
ggacgactgg gacctcttgt agttcgtctg gctcctccgg gacctgttgg tggccgacgg 720
tttccctctg ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct 780
aaagggagac gacctgcggc cgtggtagtt ctaccacttc cactagccgt ccgccaggga 840
gggcgtgcag cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa 900
cccgcacgtc gcctagaagc tgtagccgga cggagtcctg gtgttgaaag acgaccggtt 960
cggcgccatc gccgccaaca agcttgagct ccagcttttg ttcccgccgc ggtagcggcg 1020
gttgttcgaa ctcgaggtcg aaaacaaggg 1050<210> 128
<211> 159
<212> PRT
<213> Artificial
<220>
<223> Sintético: inteína codificada por seqüência synechococcus projetada<400> 128
Cys Leu ser Phe Gly Thr Glu Ile Leu Thr vai Glu Tyr Gly Pro Leu1 5 10 15
Pro Ile Gly Lys Ile Val Ser Glu Glu Ile Asn Cys ser vai Tyr ser20 25 30
vai Asp Pro Glu Gly Arg Val Tyr Thr Gln Ala Ile Ala Gln Trp His35 40 45
Asp Arg Gly Glu Gln Glu Val Leu Glu Tyr Glu Leu Glu Asp Gly ser50 55 60
Val He Arg Ala Thr Ser Asp His Arg Phe Leu Thr Thr Asp Tyr Gln65 70 75 80
Leu Leu Ala Ile Glu Glu Ile Phe Ala Arg Gln Leu Asp Leu Leu Thr85 90 95
Leu Glu Asn Ile Lys Gln Thr Glu Glu Ala Leu Asp Asn His Arg Leu100 105 110
Pro Phe Pro Leu Leu Asp Ala Gly Thr Ile Lys Met Val Lys Val Ile115 120 125
Gly Arg Arg Ser Leu Gly Val Gln Arg Ile Phe Asp Ile Gly Leu Pro130 135 140
Gln Asp His Asn Phe Leu Leu Ala Asn Gly Ala Ile Ala Ala Asn145 150 155
<210> 129
<211> 61
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 129
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tgcctgtcct tcggcaccga 609 61
<210> 130<211> 65<212> DNA<213> Artificial<2Ζ0>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 130
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttggcggcg atggcgccgttggcc
<210> 131
<211> 64
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 131
ccactacacg cagaagagcc tctccctgtc tccgggtaaa tattgcctgt ccttcggcaccgag
<210> 132
<211> 63
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 132
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat acagttggcg gcgatggcgccgt
<210> 133
<211> 70
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 133
ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtccttcggcaccgag
<210> 134
<211> 70
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 134
ccactacacg cagaagagcc tctccctgtc tccgggtaaa gccgagtatt gcctgtccttcggcaccgag
<210> 135<211> 8557<212> DNA<213> Artificial
<220>
<22 Β> Constructo sintético: seqüência de nucleotídeo do plasmídeo de cadeia pesadapTT3-D2E7 - Ssp-GA- inteína - D2E7 - cadeia leve
<400> 135
gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60
aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120
atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180
ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240
atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300
cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360
gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420
tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480
ggacatgtac ctcccagggg cccaggaaga ctacgggagg çtacaccaac gtcaatcaga 540
ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600
aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660
ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720
agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780
tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840
tggctgaaga tcaaggagcg ggcagtgaac tctcçtgaat cttcgcctgc ttcttcattc 900
tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960
ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020
tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080
gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140
gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200
gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260
tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320
cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380
aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440
ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500
aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560
gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620
gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680
cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740
tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860
tctgggtagc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920
tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980
ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040
gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100
ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160
ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220
ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280
ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340
gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400
gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460
acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520
aaaaaggáag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580
attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640
tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700
gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760
cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820
tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880
agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940
tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000
tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060
tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120
acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180
accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240
tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840ctcaagacga tagttaccgg ataaggcgcaacagcccagc ttggagcgaa cgacctacacagaaagcgcc acgcttcccg aagggagaaacggaacagga gagcgcacga gggagcttcctgtcgggttt cgccacctct gacttgagcggagcctatgg aaaaacgcca gcaacgcggcttttgctcac atgttctttc ctgcgttatcctttgagtga gctgataccg ctcgccgcagcgaggaagcg gaagagcgcc caatacgcaattaatgcagc tggcacgaca ggtttcccgataatgtgagt tagctcactc attaggcacctatgttgtgt ggaattgtga gcggataacattacgccaag ctctagctag aggtcgaccaatccgggcaa cgttgttgcc attgctgcagacattgaatc aatattggca attagccataattggctatt ggccattgca tacgttgtattcatgtccaa tatgaccgcc atgttgacatattacggggt cattagttca tagcccatataatggcccgc ctggctgacc gcccaacgacgttcccatag taacgccaat agggactttctaaactgccc acttggcagt acatcaagtggtcaatgacg gtaaatggcc cgcctggcatcctacttggc agtacatcta cgtattagtccagtacacca atgggcgtgg atagcggtttattgacgtca atgggagttt gttttggcacaataaccccg ccccgttgac gcaaatgggcagcagagctc gtttagtgaa ccgtcagatcggccagctgt tgggctcgcg gttgaggacaatcggaaacc cgtcggcctc cgaacggtacatcgaccgga tcggaaaacc tctcgagaaagctgagcacc gtggcgggcg gcagcgggtggctgatgatg taattaaagt aggcggtcttcaggcttgag atccagctgt tggggtgagtcgctaagatt gtcagtttcc aaaaacgagg
gcggtcgggc tgaacggggg gttcgtgcac 3900
cgaactgaga tacctacagc gtgagctatg 3960
ggcggacagg tatccggtaa gcggcagggt 4020
agggggaaac gcctggtatc tttatagtcc 4080
tcgatttttg tgatgctcgt caggggggcg 4140
ctttttacgg ttcctggcct tttgctggcc 4200
ccctgattct gtggataacc gtattaccgc 4260
ccgaacgacc gagcgcagcg agtcagtgag 4320
accgcctctc cccgcgcgtt ggccgattca 4380
ctggaaagcg ggcagtgagc gcaacgcaat 4440
ccaggcttta cactttatgc ttccggctcg 4500
atttcacaca ggaaacagct atgaccatga 4560
attctcatgt ttgacagctt atcatcgcag 4620
gcgcagaact ggtaggtatg gaagatctat 4680
ttagtcattg gttatatagc ataaatcaat 4740
ctatatcata atatgtacat ttatattggc 4800
tgattattga ctagttatta atagtaatca 4860
atggagttcc gcgttacata acttacggta 4920
ccccgcccat tgacgtcaat aatgacgtat 4980
cattgacgtc aatgggtgga gtatttacgg 5040
tatcatatgc caagtccgcc ccctattgac 5100
tatgcccagt acatgacctt acgggacttt 5160
atcgctatta ccatggtgat gcggttttgg 5220
gactcacggg gatttccaag tctccacccc 5280
caaaatcaac gggactttcc aaaatgtcgt 5340
ggtaggcgtg tacggtggga ggtctatata 5400
ctcactctct tccgcatcgc tgtctgcgag 5460
aactcttcgc ggtctttcca gtactcttgg 5520
tccgccaccg agggacctga gcgagtccgc 5580
ggcgtctaac cagtcacagt cgcaaggtag 5640
gcggtcgggg ttgtttctgg cggaggtgct 5700
gagacggcgg atggtcgagg tgaggtgtgg 5760
actccctctc aaaagcgggc attacttctg 5820
aggatttgat attcacctgg cccgatctgg 5880ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagç tggctttttc ttgtcgcgat 6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120
gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180
tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240
cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540
cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600
cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320
ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcctgtc 7380
cttcggcacc gagatcctga ccgtggagta cggccctctg cctatcggca agatcgtgtc 7440
cgaagagatc aactgctccg tgtactccgt ggaccctgag ggccgggtgt atactcaggc 7500
catcgcccag tggcacgacc ggggcgagca ggaggtgctg gagtacgagc tggaggacgg 7560
ctccgtgatc cgggccacct ccgaccaccg gtttctgacc accgactatc agctgctggc 7620
catcgaggag atcttcgccc ggcagctgga cctgctgacc ctggagaaca tcaagcagac 7680
cgaggaggcc ctggacaacc accggctgcc tttccctctg ctggacgccg gcaccatcaa 7740
gatggtgaag gtgatcggca ggcggtccct gggcgtgcag cggatcttcg acatcggcct 7800
gcctcaggac cacaactttc tgctggccaa cggcgccatc gccgccaaca tggacatgcg 7860
cgtgcccgcc cagctgctgg gcctgctgct gctgtggttc cccggctcgc gatgcgacat 7920ccagatgacc cagtctccat cctccctgtc tgcatctgta ggggacagag tcaccatcac 7980ttgtcgggca agtcagggca tcagaaatta cttagcctgg tatcagcaaa aaccagggaa 8040agcccctaag ctcctgatct atgctgcatc cactttgcaa tcaggggtcc catctcggtt 8100cagtggcagt ggatctggga cagatttcac tctcaccatc agcagcctac agcctgaaga 8160tgttgcaact tattactgtc aaaggtataa ccgtgcaccg tatacttttg gccaggggac 8220caaggtggaa atcaaacgta cggtggctgc accatctgtc ttcatcttcc cgccatctga 8280tgagcagttg aaatctggaa ctgcctctgt tgtgtgcctg ctgaataact tctatcccag 8340agaggccaaa gtacagtgga aggtggataa cgccctccaa tcgggtaact cccaggagag 8400tgtcacagag caggacagca aggacagcac ctacagcctc agcagcaccc tgacgctgag 8460caaagcagac tacgagaaac acaaagtcta cgcctgcgaa gtcacccatc agggcctgag 8520ctcgcccgtc acaaagagct tcaacagggg agagtgt 8557
<210> 136
<211> 501
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial de pTT3-HcinttLClaa-p.hori
<400> 136 ccgggtaaat attgcctgtc cttcggcacc gagatcctga ccgtggagta cggccctctg 60cctatcggca agatcgtgtc cgaagagatc aactgctccg tgtactccgt ggaccctgag 120ggccgggtgt atactcaggc catcgcccag. tggcacgacc ggggcgagca ggaggtgctg 180gagtacgagc tggaggacgg ctccgtgatc cgggccacct ccgaccaccg gtttctgacc 240accgactatc agctgctggc catcgaggag atcttcgccc ggcagctgga cctgctgacc 300ctggagaaca tcaagcagac cgaggaggcc ctggacaacc accggctgcc tttccctctg 360ctggacgccg gcaccatcaa gatggtgaag gtgatcggca ggcggtccct gggcgtgcag 420cggatcttcg acatcggcct gcctcaggac cacaactttc tgctggccaa cggcgccatc 480gccgccaact gtatggacat g 501
<210> 137
<211> 513
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: porção relevante da seqüência codificante do plasmídeopTT3-HC-Ssp-GA-int-LC-3aa.HC-ssp-GA-int-LC-3aa.
<400> 137
ccgggtaaag ccgagtattg cctgtccttc ggcaccgaga tcctgaccgt ggagtacggc 60
cctctgccta tcggcaagat cgtgtccgaa gagatcaact gctccgtgta ctccgtggac 120
cctgagggcc gggtgtatac tcaggccatc gcccagtggc acgaccgggg cgagcaggag 180gtgctggagt acgagctgga ggacggctcc gtgatccggg ccacctccga ccaccggttt 240
ctgaccaccg actatcagct gctggccatc gaggagatct tcgcccggca gctggacctg 300
ctgaccctgg agaacatcaa gcagaccgag gaggccctgg acaaccaccg gctgcctttc 360
cctctgctgg acgccggcac catcaagatg gtgaaggtga tcggcaggcg gtccctgggc 420
gtgcagcgga tcttcgacat cggcctgcct caggaccaca actttctgct ggccaacggc 480
gccatcgccg ccaactgttt caacatggac atg 513
<210> 138<211> 11<212> PRT
<213> Pyrococcus sp.<400> 138
Arg Gln Arg Ala Ile Lys Ile Leu Ala Asn Ser15 10
<210> 139
<211> 12
<212> PRT
<213> Pyrococcus sp.
<400> 139
His Asn Ser Tyr Tyr Gly Tyr Tyr Gly Tyr Ala Lys1 5 10
<210> 140
<211> 214
<212> PRT
<213> Artificial
<220>
<223> Constructo sintético: seqüência parcial de aminoácido que abrange sítiosde clivagem nos constructos de anticorpos de ouriço
<400> 140
cys Phe Thr Pro Glu ser Thr Ala Leu Leu Glu Ser Gly Val Arg Lys15 10 15
Pro Leu Gly Glu Leu ser Ile Gly Asp Arg Val Leu Ser Met Thr Ala20 25 30
Asn Gly Gln Ala Val Tyr ser Glu Val Ile Leu Phe Met Asp Arg Asn35 40 45
Leu Glu Gln Met Gln Asn Phe Val Gln Leu His Thr Asp Gly Gly Ala50 55 60
Val Leu Thr Val Thr Pro Ala His Leu vai ser Val Trp Gln Pro Glu65 70 75 80
Ser Gln Lys Leu Thr Phe vai Phe Ala Asp Arg ile Glu Glu Lys Asn85 90 95
Gln Val Leu Val Arg Asp vai Glu Thr Gly Glu Leu Arg pro Gln Arg100 105 110
vai vai Lys Val Gly Ser Val Arg Ser Lys Gly Val Val Ala Pro Leu115 120 125
Thr Arg Glu Gly Thr Ile Val Val Asn Ser Val Ala Ala Ser cys Tyr130 135 140
Ala Val Ile Asn ser Gln ser Leu Ala His Trp Gly Leu Ala Pro Met145 150 155 160
Arg Leu Leu Ser Thr Leu Glu Ala Trp Leu Pro Ala Lys Glu Gln Leu165 170 175
His Ser Ser Pro Lys Val Val ser Ser Ala Gln Gln Gln Asn Gly Ile180 185 190
His Trp Tyr Ala Asn Ala Leu Tyr Lys Val Lys Asp Tyr vai Leu Pro195 200 205
Gln Ser Trp Arg His Asp210
<210> 141
<211> 40
<212> PRT
<213> Artificial
<220>
<223> Seqüência variante de 2A<400> 141
Leu Leu Ala Ile His Pro Thr Glu Ala Arg His Lys Gln Lys Ile Val1 5 10 15
Ala Pro vai Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly20 25 30
Asp Val Glu ser Asn Pro Gly Pro35 40
<210> 142
<211> 33
<212> PRT
<213> Artificial
<220>
<223> Seqüência variante de 2A
<400> 142
Glu Ala Arg His Lys Gln Lys Ile Val Ala Pro Val Lys Gln Thr Leu1 5 10 15
Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp vai Glu ser Asn Pro Gly20 25 30
Pro
<210> 143
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 143
atcgtggcgc cagctctgcg
<210> 144
<211> 20
<212> DNA
<213> Artificial
<220>
<22 3> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 144
gcaactggcg gccaccgagt
<210> 145
<211> 20
<212> DNA
<213> Artificial
<220>
<22 3> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 145
cgcatagcaa ctggcggcca
<210> 146
<211> 20
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 146
gttgtgggcg gccaccgagt
<210> 147
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 147ccactacacg cagaagagçc tctccctgtc tccgggtaaa tgcttcacgc cggagagcac 60
<210> 148
<211> 60
<212> DNA
<213> Artificial
<220>
<22B> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 148
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcactggctg ttgatcaccg 60
<210> 149
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 149
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat atcgtggcgc cagctctgcg 60
<210> 150
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 150
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gcaactggcg gccaccgagt 60
<210> ,151
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 151
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat cgcatagcaa ctggcggcca 60
<210> 152
<211> 60
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 152
gcagcaggcc cagcagctgg gcgggcacgc gcatgtccat gttgtgggcg gccaccgagt 60
<210> 153
<211> 40
<212> DNA
<213> Artificial<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.<400> 153
atggacatgc gcgtgcccgc ccagctgctg ggcctgctgc 40
<210> 154
<211> 41
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: oligonucleotídeo utilizado como um primer.
<400> 154
tttacccgga gacagggaga ggctcttctg cgtgtagtgg t 41
<210> 155
<211> 8533
<212> DNA
<213> Artificial
<220>
<223> Constructo sintético: seqüência de nucleotídeo do plasmídeo de cadeia pesadapTT3-D2E7-Hh-C17- cadeia leve D2E7.
<400> 155 gcggccgctc gaggccggca aggccggatc ccccgacctc gacctctggc taataaagga 60aatttatttt cattgcaata gtgtgttgga attttttgtg tctctcactc ggaaggacat 120atgggagggc aaatcatttg gtcgagatcc ctcggagatc tctagctaga ggatcgatcc 180ccgccccgga cgaactaaac ctgactacga catctctgcc ccttcttcgc ggggcagtgc 240atgtaatccc ttcagttggt tggtacaact tgccaactgg gccctgttcc acatgtgaca 300cgggggggga ccaaacacaa aggggttctc tgactgtagt tgacatcctt ataaatggat 360gtgcacattt gccaacactg agtggctttc atcctggagc agactttgca gtctgtggac 420tgcaacacaa cattgccttt atgtgtaact cttggctgaa gctcttacac caatgctggg 480ggacatgtac ctcccagggg cccaggaaga ctacgggagg ctacaccaac gtcaatcaga 540ggggcctgtg tagctaccga taagcggacc ctcaagaggg cattagcaat agtgtttata 600aggccccctt gttaacccta aacgggtagc atatgcttcc cgggtagtag tatatactat 660ccagactaac cctaattcaa tagcatatgt tacccaacgg gaagcatatg ctatcgaatt 720agggttagta aaagggtcct aaggaacagc gatatctccc accccatgag ctgtcacggt 780tttatttaca tggggtcagg attccacgag ggtagtgaac cattttagtc acaagggcag 840tggctgaaga tcaaggagcg ggcagtgaac tctcctgaat cttcgcctgc ttcttcattc 900tccttcgttt agctaataga ataactgctg agttgtgaac agtaaggtgt atgtgaggtg 960ctcgaaaaca aggtttcagg tgacgccccc agaataaaat ttggacgggg ggttcagtgg 1020tggcattgtg ctatgacacc aatataaccc tcacaaaccc cttgggcaat aaatactagt 1080gtaggaatga aacattctga atatctttaa caatagaaat ccatggggtg gggacaagcc 1140gtaaagactg gatgtccatc tcacacgaat ttatggctat gggcaacaca taatcctagt 1200gcaatatgat actggggtta ttaagatgtg tcccaggcag ggaccaagac aggtgaacca 1260tgttgttaca ctctatttgt aacaagggga aagagagtgg acgccgacag cagcggactc 1320cactggttgt ctctaacacc cccgaaaatt aaacggggct ccacgccaat ggggcccata 1380aacaaagaca agtggccact cttttttttg aaattgtgga gtgggggcac gcgtcagccc 1440ccacacgccg ccctgcggtt ttggactgta aaataagggt gtaataactt ggctgattgt 1500aaccccgcta accactgcgg tcaaaccact tgcccacaaa accactaatg gcaccccggg 1560gaatacctgc ataagtaggt gggcgggcca agataggggc gcgattgctg cgatctggag 1620gacaaattac acacacttgc gcctgagcgc caagcacagg gttgttggtc ctcatattca 1680cgaggtcgct gagagcacgg tgggctaatg ttgccatggg tagcatatac tacccaaata 1740tctggatagc atatgctatc ctaatctata tctgggtagc ataggctatc ctaatctata 1800tctgggtagc atatgctatc ctaatctata tctgggtagt atatgctatc ctaatttata 1860tctgggtágc ataggctatc ctaatctata tctgggtagc atatgctatc ctaatctata 1920tctgggtagt atatgctatc ctaatctgta tccgggtagc atatgctatc ctaatagaga 1980ttagggtagt atatgctatc ctaatttata tctgggtagc atatactacc caaatatctg 2040gatagcatat gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2100ggtagcatag gctatcctaa tctatatctg ggtagcatat gctatcctaa tctatatctg 2160ggtagtatat gctatcctaa tttatatctg ggtagcatag gctatcctaa tctatatctg 2220ggtagcatat gctatcctaa tctatatctg ggtagtatat gctatcctaa tctgtatccg 2280ggtagcatat gctatcctca tgataagctg tcaaacatga gaattttctt gaagacgaaa 2340gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac 2400gtcaggtggc acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat 2460acattcaaat atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg 2520aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc 2580attttgcctt cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga 2640tcagttgggt gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga 2700gagttttcgc cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg 2760cgcggtatta tcccgtgttg acgccgggca agagcaactc ggtcgccgca tacactattc 2820tcagaatgac ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac 2880agtaagagaa ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact 2940tctgacaacg atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca 3000tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg 3060tgacaccacg atgcctgcag caatggcaac aacgttgcgc aaactattaa ctggcgaact 3120acttactcta gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg 3180accacttctg cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg 3240tgagcgtggg tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat 3300
cgtagttatc tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc 3360
tgagataggt gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat 3420
actttagatt gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt 3480
tgataatctc atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc 3540
cgtagaaaag atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt 3600
gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac 3660
tctttttccg aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt 3720
gtagccgtag ttaggccacc acttcaagaa ctctgtagca ccgectacat acctcgctct 3780
gctaatcctg ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga 3840
ctcaagacga tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac 3900
acagcccagc ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg 3960
agaaagcgcc acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt 4020
cggaacagga gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc 4080
tgtcgggttt cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg 4140
gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc 4200
ttttgctcac atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc 4260
ctttgagtga gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag 4320
cgaggaagcg gaagagcgcc caatacgcaa accgcctctc cccgcgcgtt ggccgattca 4380
ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 4440
taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 4500
tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 4560
ttacgccaag ctctagctag aggtcgacca attctcatgt ttgacagctt atcatcgcag 4620
atccgggcaa cgttgttgcc attgctgcag gcgcagaact ggtaggtatg gaagatctat 4680
acattgaatc aatattggca attagccata ttagtcattg gttatatagc ataaatcaat 4740
attggctatt ggccattgca tacgttgtat ctatatcata atatgtacat ttatattggc 4800
tcatgtccaa tatgaccgcc atgttgacat tgattattga ctagttatta atagtaatca 4860
attacggggt cattagttca tagcccatat atggagttcc gcgttacata acttacggta 4920
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat aatgacgtat 4980
gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga gtatttacgg 5040
taaactgccc acttggcagt acatcaagtg tatcatatgc caagtccgcc ccctattgac 5100
gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt acgggacttt 5160
cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtgat gcggttttgg 5220
cagtacacca atgggcgtgg atagcggttt gactcacggg gatttccaag tctccacccc 5280attgacgtca atgggagttt gttttggcac caaaatcaac gggactttcc aaaatgtcgt 5340
aataaccccg ccccgttgac gcaaatgggc ggtaggcgtg tacggtggga ggtctatata 5400
agcagagctc gtttagtgaa ccgtcagatc ctcactctct tccgcatcgc tgtctgcgag 5460
ggccagctgt tgggctcgcg gttgaggaca aactcttcgc ggtctttcca gtactcttgg 5520
atcggaaacc cgtcggcctc cgaacggtac tccgccaccg agggacctga gcgagtccgc 5580
atcgaccgga tcggaaaacc tctcgagaaa ggcgtctaac cagtcacagt cgcaaggtag 5640
gctgagcacc gtggcgggcg gcagcgggtg gcggtcgggg ttgtttctgg cggaggtgct 5700
gctgatgatg taattaaagt aggcggtctt gagacggcgg atggtcgagg tgaggtgtgg 5760
caggcttgag atccagctgt tggggtgagt actccctctc aaaagcgggc attacttctg 5820
cgctaagatt gtcagtttcc aaaaacgagg aggatttgat attcacctgg cccgatctgg 5880
ccatacactt gagtgacaat gacatccact ttgcctttct ctccacaggt gtccactccc 5940
aggtccaagt ttgggcgcca ccatggagtt tgggctgagc tggctttttc ttgtcgcgat 6000
tttaaaaggt gtccagtgtg aggtgcagct ggtggagtct gggggaggct tggtacagcc 6060
cggcaggtcc ctgagactct cctgtgcggc ctctggattc acctttgatg attatgccat 6120gcactgggtc cggcaagctc cagggaaggg cctggaatgg gtctcagcta tcacttggaa 6180tagtggtcac atagactatg cggactctgt ggagggccga ttcaccatct ccagagacaa 6240cgccaagaac tccctgtatc tgcaaatgaa cagtctgaga gctgaggata cggccgtata 6300
ttactgtgcg aaagtctcgt accttagcac cgcgtcctcc cttgactatt ggggccaagg 6360
taccctggtc accgtctcga gtgcgtcgac caagggccca tcggtcttcc ccctggcacc 6420
ctcctccaag agcacctctg ggggcacagc ggccctgggc tgcctggtca aggactactt 6480
ccccgaaccg gtgacggtgt cgtggaactc aggcgccctg accagcggcg tgcacacctt 6540cccggctgtc ctacagtcct caggactcta ctccctcagc agcgtggtga ccgtgccctc 6600cagcagcttg ggcacccaga cctacatctg caacgtgaat cacaagccca gcaacaccaa 6660
ggtggacaag aaagttgagc ccaaatcttg tgacaaaact cacacatgcc caccgtgccc 6720
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 6780
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 6840
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 6900
gccgcgggag gagcagtaca acagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 6960
ccággactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 7020
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 7080
cctgccccca tcccgggatg agctgaccaa gaaccaggtc agcctgacct gcctggtcaa 7140
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 7200
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct acagcaagct 7260
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 7320ggctctgcac aaccactaca cgcagaagag cctctccctg tctccgggta aatgcttcac 7380
gccggagagc acagcgctgc tggagagtgg agtccggaag ccgctcggcg agctctctat 7440
cggagatcgt gttttgagca tgaccgccaa cggacaggcc gtctacagcg aagtgatcct 7500
cttcatggac cgcaacctcg agcagatgca aaactttgtg cagctgcaca cggacggtgg 7560
agcagtgctc acggtgacgc cggctcacct ggttagcgtt tggcagccgg agagccagaa 7620
gctcacgttt gtgtttgcgg atcgcatcga ggagaagaac caggtgctcg tacgggatgt 7680
ggagacgggc gagctgaggc cccagcgagt cgtcaaggtg ggcagtgtgc gcagtaaggg 7740
cgtggtcgcg ccgctgaccc gcgagggcac cattgtggtc aactcggtgg ccgccagttg 7800
ctatgcggtg atcaacagcc agtcgatgga catgcgcgtg cccgcccagc tgctgggcct 7860
gctgctgctg tggttccccg gctcgcgatg cgacatccag atgacccagt ctccatcctc 7920
cctgtctgca tctgtagggg acagagtcac catcacttgt cgggcaagtc agggcatcag 7980
aaattactta gcctggtatc agcaaaaacc agggaaagcc cctaagctcc tgatctatgc 8040
tgcatccact ttgcaatcag gggtcccatc tcggttcagt ggcagtggat ctgggacaga 8100
tttcactctc accatcagca gcctacagcc tgaagatgtt gcaacttatt actgtcaaag 8160
gtataaccgt gcaccgtata cttttggcca ggggaccaag gtggaaatca aacgtacggt 8220
ggctgcacca tctgtcttca tcttcccgcc atctgatgag cagttgaaat ctggaactgc 8280
ctctgttgtg tgcctgctga ataacttcta tcccagagag gccaaagtac agtggaaggt 8340
ggataacgcc ctccaatcgg gtaactccca ggagagtgtc acagagcagg acagcaagga 8400
cagcacctac agcctcagca gcaccctgac gctgagcaaa gcagactacg agaaacacaa 8460
agtctacgcc tgcgaagtca cccatcaggg cctgagctcg cccgtcacaa agagcttcaa 8520
caggggagag tgt 8533
<210> 156<211> 447<212> DNA<213> Artificial
<220>
<223> Constructo sintético: seqüência codificante parcial do plasmídeopTT3-HC-C17-sc-LC
<400> 156
ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60
ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120
tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180
ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240
cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300
gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360
agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420tcggtggccg ccagttgcat ggacatg 447
<210> 157
<211> 447
<212> DNA
<213> Arti fi ci ai
<220>
<í223> Constrncto sintético: seqüência codificante parcial de plasmídeopTT3-HC-C17-hn-LC.
<400> 157 ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420tcggtggccg cccacaacat ggacatg 447<210> 158 c211> 660 <212> DNA <213> Artificial <220> <223> Constructo sintético: seqüência codificante parcial de pTT3-HC-C25-Hint-LC. <400> 158 ccgggtaaat gcttcacgcc ggagagcaca gcgctgctgg agagtggagt ccggaagccg 60ctcggcgagc tctctatcgg agatcgtgtt ttgagcatga ccgccaacgg acaggccgtc 120tacagcgaag tgatcctctt catggaccgc aacctcgagc agatgcaaaa ctttgtgcag 180ctgcacacgg acggtggagc agtgctcacg gtgacgccgg ctcacctggt tagcgtttgg 240cagccggaga gccagaagct cacgtttgtg tttgcggatc gcatcgagga gaagaaccag 300gtgctcgtac gggatgtgga gacgggcgag ctgaggcccc agcgagtcgt caaggtgggc 360agtgtgcgca gtaagggcgt ggtcgcgccg ctgacccgcg agggcaccat tgtggtcaac 420tcggtggccg ccagttgcta tgcggtgatc aacagccagt cgctggccca ctggggactg 480gctcccatgc gcctgctgtc cacgctggag gcgtggctgc ccgccaagga gcagttgcac 540agttcgccga aggtggtgag ctcggcgcag cagcagaatg gcatccattg gtatgccaat 600gcgctctaca aggtcaagga ctacgttctg ccgcagagct ggcgccacga tatggacatg 660

Claims (70)

1. Vetor de expressão para gerar um ou mais produ-tos. de proteína recombinante, CARACTERIZADO pelo fato decompreender uma inserção sORF; a referida inserção sORF com-preendendo uma primeira seqüência de ácido nucléico que co-difica um primeiro polipeptideo, uma primeira seqüência deácido nucléico interveniente que codifica um primeiro sítiode clivagem de proteína e uma segunda seqüência de ácido nu-cléico que codifica um segundo polipeptideo; em que a refe-rida seqüência de ácido nucléico interveniente codificando oreferido primeiro sítio de clivagem de proteína é operativa-mente posicionada entre a referida primeira seqüência de á-cido nucléico e a referida segunda seqüência de ácido nu-cléico; e em que o referido vetor de expressão é capaz deexpressar um polipeptideo sORF clivável no referido primeirosítio de clivagem de proteína.
2. Vetor de expressão, de acordo com a reivindica-ção 1, CARACTERIZADO pelo fato de que o referido primeirosítio de clivagem da proteína compreende um sítio de cliva-gem auto-processador.
3. Vetor de expressão, de acordo com a reivindica-ção 1 ou 2, CARACTERIZADO pelo fato de que o referido sítiode clivagem auto-processador compreende um segmento de inte-ína ou um segmento de inteína modificado, em que o segmentode inteína modificado permite a clivagem, mas não a ligaçãocompleta do referido primeiro polipeptideo com o referidosegundo polipeptideo.
4. Vetor de expressão, de acordo com a reivindica-ção 1 ou 2, CARACTERIZADO pelo fato de que o referido sítiode clivagem auto-processador compreende um segmento de por-co-espinho ou um segmento de porco-espinho modificado, emque o segmento de porco-espinho modificado permite a cliva-gem do referido primeiro polipeptídeo a partir do referidosegundo polipeptídeo.
5. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-4, CARACTERIZADO pelo fato de que oprimeiro polipeptídeo e o segundo polipeptídeo são capazesde uma montagem multimérica.
6. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-5, CARACTERIZADO pelo fato de que pe-lo menos um dos referidos primeiro polipeptídeo e segundopolipeptídeo são capazes de secreção extracelular.
7. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-6, CARACTERIZADO pelo fato de que pe-lo menos um dos referidos primeiro polipeptídeo e segundopolipeptídeo são de origem mamífera.
8. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-7, CARACTERIZADO pelo fato de que pe-lo menos um dos referidos primeiro polipeptídeo e segundopolipeptídeo compreende uma cadeia pesada de imunoglobulinaou fragmento funcional seu.
9. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-8, CARACTERIZADO pelo fato de que pe-lo menos um dos referidos primeiro polipeptídeo e segundopolipeptídeo compreende uma cadeia leve de imunoglobulina oufragmento funcional desta.
10. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-9, CARACTERIZADO pelo fato de que oreferido primeiro polipeptideo compreende uma cadeia pesadade imunoglobulina ou fragmento funcional desta e o referidosegundo polipeptideo compreende uma cadeia leve de imunoglo-bulina ou fragmento funcional desta; e em que os referidosprimeiro e segundo polipeptideos estão em qualquer ordem.
11. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-10, CARACTERIZADO pelo fato de que oreferido primeiro polipeptideo e o segundo polipeptideo, to-mados juntos, são capazes de se associar numa montagem mul-timérica para formar um anticorpo funcional ou outra molécu-la de reconhecimento de antigeno.
12. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 11, CARACTERIZADO pelo fato de que oreferido primeiro polipeptideo está à montante do referidosegundo polipeptideo.
13. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-12, CARACTERIZADO pelo fato de que oreferido segundo polipeptideo está à montante do referidoprimeiro polipeptideo.
14. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-13, CARACTERIZADO pelo fato de com-preender ainda uma terceira seqüência de ácido nucléico co-dificando um terceiro polipeptideo, em que a referida ter-ceira seqüência de ácido nucléico está operativamente posi-cionada depois da referida segunda seqüência de ácido nu-cléico; e em que a referida terceira seqüência pode ser in-dependentemente a mesma ou diferente de qualquer uma da pri-meira ou segunda seqüência de ácido nucléico.
15. Vetor de expressão, de acordo com a reivindi-cação 14, CARACTERIZADO pelo fato de que pelo menos dois dosreferidos primeiro, segundo e terceiro polipeptideos tomadosjuntos são capazes de se associar numa montagem multimérica.
16. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-15, CARACTERIZADO pelo fato de com-preender ainda uma segunda seqüência de ácido nucléico in-terveniente codificando um segundo sitio de clivagem de pro-teína, em que a referida segunda seqüência de ácido nucléicointerveniente é operativamente posicionada depois das refe-ridas primeira e segunda seqüências de ácido nucléico; e emque a referida segunda seqüência interveniente pode ser amesma ou diferente da referida primeira seqüência de ácidonucléico interveniente.
17. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 16, CARACTERIZADO pelo fato de com-preender ainda uma terceira seqüência de ácido nucléico co-dificando um terceiro polipeptídeo, e uma segunda seqüênciade ácido nucléico interveniente codificando um segundo sítiode clivagem de proteína; em que a segunda seqüência de ácidonucléico interveniente e a terceira seqüência de ácido nu-cléico, nessa ordem, são operativamente posicionadas depoisda referida segunda seqüência de ácido nucléico.
18. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-17, CARACTERIZADO pelo fato de que areferida terceira seqüência de ácido nucléico codifica umacadeia pesada, cadeia leve de imunoglobulina ou respectiva-mente um fragmento funcional destas.
19. Vetor de expressão, de acordo com qualquer umadas reivindicações 14 - 18, CARACTERIZADO pelo fato de que areferida terceira seqüência de ácido nucléico codifica umacadeia leve de imunoglobulina ou fragmento funcional desta.
20. Vetor de expressão, de acordo com qualquer umadas reivindicações 14 - 18, CARACTERIZADO pelo fato de que areferida terceira seqüência de ácido nucléico codifica umacadeia pesada de imunoglobulina ou fragmento funcional desta.
21. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 20, CARACTERIZADO pelo fato de que areferida primeira seqüência interveniente de ácido nucléicocodificando um primeiro sitio de clivagem de proteína com-preende um ácido nucléico de peptídeo de sinal codificandoum sítio de clivagem de peptídeo de sinal ou uma seqüênciade sítio de clivagem de peptídeo de sinal modificado.
22. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 21, CARACTERIZADO pelo fato de com-preender ainda uma seqüência de ácido nucléico de peptídeode sinal codificando um sítio de clivagem de peptídeo de si-nal, operativamente posicionado antes da referida primeiraseqüência de ácido nucléico ou da referida segunda seqüênciade ácido nucléico.
23. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-22, CARACTERIZADO pelo fato de com-preender ainda duas seqüências de ácido nucléico de peptídeode sinal, em que cada uma independentemente codifica um si-tio de clivagem de peptideo de sinal, em que uma seqüênciade ácido nucléico de peptideo de sinal é operativamente po-sicionada antes do referido primeiro ácido nucléico codifi-cando o referido primeiro polipeptideo e a outra seqüênciade ácido nucléico de peptideo de sinal é operativamente po-sicionada antes do referido segundo ácido nucléico que codi-fica o referido segundo polipeptideo.
24. Vetor de expressão, de acordo com as reivindi-cações 21 - 23, CARACTERIZADO pelo fato de que a referidaseqüência de ácido nucléico de peptideo de sinal codifica umsitio de clivagem de peptideo de sinal de cadeia leve de i-munoglobulina ou um sitio de clivagem de peptideo de sinalde cadeia leve de imunoglobulina modificado.
25. Vetor de expressão, de acordo com a reivindi-cação 24, CARACTERIZADO pelo fato de que a seqüência de áci-do nucléico de peptideo de sinal codifica um sitio de cliva-gem de peptideo de sinal de cadeia leve de imunoglobulinamodificado ou não-modifiçado, e em que o referido sitio mo-dificado é capaz de efetuar a clivagem e o aumento da secre-ção de pelo menos um dentre o referido primeiro polipepti-deo, o referido segundo polipeptideo e uma molécula constru-ída dos referidos primeiro e segundo polipeptídeos; e em queum nível de secreção na presença do referido sítio de peptí-deo de sinal é cerca de 10% maior até cerca de 100 vezesmaior do que o nível de secreção na ausência do referido sí-tio de peptideo de sinal.
26. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-3, CARACTERIZADO pelo fato de que areferida seqüência de ácido nucléico interveniente codifi-cando um primeiro sitio de clivagem de proteína compreendeuma seqüência de inteína modificada ou de inteína seleciona-da do grupo consistindo de: uma seqüência Pho Pol I dePyrococcus horikoshii, uma seqüência VMA de Saccharomyceseerevisiae, uma seqüência DnaE da cepa PCC6803 deSynechocystis spp, seqüência GyrA de Myeobaeterium xenopi,DNA polimerase GB-D da espécie de Pyroeoeeus, domínio tipointeína bacteriano tipo A (BIL) e BIL tipo B.
27. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 2 e 4, CARACTERIZADO pelo fato de quea referida seqüência de ácido nucléico interveniente codifi-cando um primeiro sítio de clivagem de proteína compreendede um domínio de auto-processamento C-terminal de um membrode família de porco-espinho, em que o membro da família deporco-espinho é de Drosophila, camundongo, humano ou outroinseto ou espécie de animal.
28. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 2 e 4, CARACTERIZADO pelo fato de quea referida seqüência de ácido nucléico interveniente codifi-cando um primeiro sítio de clivagem de proteína compreendeum domínio de auto-processamento C-terminal de um javali a-fricano, marmota dos E.U.A. ou outro porco contendo gene deum nematóide ou domínio "hoglet" de um coanoflagelado.
29. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-28, CARACTERIZADO pelo fato de que oreferido primeiro e o referido segundo polipeptídeo compre-endem um anticorpo funcional ou outra molécula de reconheci-mento de antígeno; com uma especificidade de antigeno dire-cionada para se ligar a um antigeno selecionado do grupoconsistindo de: fator α de necrose tumoral, receptor de eri-tropoietina, RSV, EL/selectina, interleucina-1, interleuci-na-12, interleucina-13, interleucina-18, interleucina-23,CXCL-13, GLP-IR e beta-amilóide.
30. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-28, CARACTERIZADO pelo fato de que oprimeiro e o segundo polipeptideos compreendem um par de ca-deias de imunoglobulina de um anticorpo de D2E7, ABT-007,ABT-325, EL246 ou ABT-874.
31. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-28, CARACTERIZADO pelo fato de que oprimeiro e o segundo polipeptideos são cada um independente-mente selecionados a partir de um segmento de cadeia pesadade imunoglobulina ou de um segmento de cadeia leve de imuno-globulina a partir de um segmento análogo de D2E7, ABT-007,ABT-325, EL246, ABT-874 ou outro anticorpo.
32. Vetor de expressão, de acordo com qualquer umadas reivindicações 1-31, CARACTERIZADO pelo fato de que oreferido vetor compreende ainda um elemento regulatório pro-motor para a referida inserção de sORF.
33. Vetor de expressão, de acordo com a reivindi-cação 32, CARACTERIZADO pelo fato de que o referido elementoregulatório promotor é induzivel ou constitutivo.
34. Vetor de expressão, de acordo com a reivindi-cação 32, CARACTERIZADO pelo fato de que o referido elementoregulatório promotor é tecido específico.
35. Vetor de expressão, de acordo com a reivindi-cação 32, CARACTERIZADO pelo fato de que o referido promotorcompreende um promotor tardio principal de adenovírus.
36. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 35, CARACTERIZADO pelo fato.de que oreferido vetor compreende ainda um ácido nucléico que codi-fica uma protease capaz de clivar o referido primeiro sítiode clivagem de proteína.
37. Vetor de expressão, de acordo com a reivindi-cação 36, CARACTERIZADO pelo fato de que o referido ácidonucléico que codifica uma protease é operativamente posicio-nado dentro da referida inserção de sORF; o referido vetorde expressão compreendendo ainda um ácido nucléico adicionalcodificando um segundo sítio de clivagem localizado entre oreferido ácido nucléico que codifica uma protease e pelo me-nos um dos referido primeiro ácido nucléico e referido se-gundo ácido nucléico.
38. Célula hospedeira, CARACTERIZADA pelo fato decompreender um vetor de acordo com qualquer uma das reivin-dicações 1-37.
39. Célula hospedeira, de acordo com a reivindica-ção 38, CARACTERIZADA pelo fato de que a referida célulahospedeira é uma célula procariótica.
40. Célula hospedeira, de acordo com a reivindica-ção 39, CARACTERIZADA pelo fato de que a referida célulahospedeira é Escherichia coli.
41. Célula hospedeira, de acordo com a reivindica-ção 38, CARACTERIZADA pelo fato de que a referida célulahospedeira é uma célula eucariótica.
42. Célula hospedeira, de acordo com a reivindica-ção 41, CARACTERIZADA pelo fato de que a referida célula eu-cariótica é selecionada do grupo consistindo de uma célulaprotista, célula animal, célula vegetal e célula fúngica.
43. Célula hospedeira, de acordo com a reivindica-ção 42, CARACTERIZADA pelo fato de que a referida célula eu-cariótica é uma célula animal selecionada do grupo consis-tindo de uma célula de mamífero, de uma célula aviária e deuma célula de inseto.
44. Célula hospedeira, de acordo com a reivindica-ção 43, CARACTERIZADA pelo fato de que a referida célulahospedeira é uma célula CHO ou uma célula CHO deficiente dediidrofolato redutase.
45. Célula hospedeira, de acordo com a reivindica-ção 43, CARACTERIZADA pelo fato de que a referida célulahospedeira é uma célula COS.
46. Célula hospedeira, de acordo com a reivindica-ção 42, CARACTERIZADA pelo fato de que a referida célulahospedeira é uma célula de levedura.
47. Célula hospedeira, de acordo com a reivindica-ção 4 6, CARACTERIZADA pelo fato de que a referida célula delevedura é Saccharomyces cerevisiae.
48. Célula hospedeira, de acordo com a reivindica-ção 43, CARACTERIZADA pelo fato de que a referida célulahospedeira é uma célula Sf9 de inseto Spodoptera frugiperda.
49. Célula hospedeira, de acordo com a reivindica-ção 43, CARACTERIZADA pelo fato de que a referida célulahospedeira é uma célula de rim embrionário humano.
50. Método para produzir uma poliproteina recombi-nante ou uma pluralidade de proteínas, CARACTERIZADO pelofato de cultivar uma célula hospedeira de acordo com a rei-vindicação 38 num meio de cultura sob condições suficientespara permitir a expressão de uma proteína de vetor.
51. Método, de acordo com a reivindicação 50,CARACTERIZADO pelo fato de compreender ainda a recuperaçãoe/ou purificação da referida proteína de vetor.
52. Método, de acordo com qualquer uma das reivin-dicações 50 - 51, CARACTERIZADO pelo fato de que a referidapluralidade de proteínas é capaz de montagem multimérica.
53. Método, de acordo com qualquer uma das reivin-dicações 50 - 52, CARACTERIZADO pelo fato de que a polipro-teina recombinante ou a pluralidade de proteínas são biolo-gicamente funcionais e/ou terapêuticas.
54. Método para produzir uma proteína de imunoglo-bulina ou um fragmento funcional desta, anticorpo construídoou outra molécula de reconhecimento de antígeno,CARACTERIZADO pelo fato de compreender o cultivo de uma cé-lula hospedeira de acordo com a reivindicação 38 num meio decultura sob condições suficientes para produzir uma proteínade imunoglobulina ou fragmento funcional desta, anticorpoconstruído ou outra molécula de reconhecimento de antígeno.
55. Proteína produzida, CARACTERIZADA pelo fato deser de acordo com o método de qualquer uma das reivindica-ções 50 - 54.
56. Poliproteína produzida, CARACTERIZADA pelo fa-to de ser de acordo com qualquer uma das reivindicações 50 - 55.
57. Imunoglobulina construída; outra molécula dereconhecimento de antígeno construída; ou cadeia de imuno-globulina individual ou fragmento funcional desta,CARACTERIZADA pelo fato de ser produzida de acordo com o mé-todo de qualquer uma das reivindicações 50 - 56.
58. Imunoglobulina; outra molécula de reconheci-mento de antígeno; ou cadeia de imunoglobulina individual oufragmento funcional desta, de acordo com a reivindicação 57,CARACTERIZADA pelo fato de que existe uma capacidade de efe-tuar ou contribuir para a ligação a antígeno específico aofator α de necrose tumoral, ao receptor de eritropoietina, àinterleucina-18, à EL/selectina ou à interleucina-12.
59. Imunoglobulina ou fragmento funcional desta,de acordo com a reivindicação 58, CARACTERIZADA pelo fato deque a imunoglobulina é D2E7 ou em que o fragmento funcionalé um fragmento de D2E7.
60. Composição farmacêutica, CARACTERIZADA pelofato de compreender uma proteína de acordo com qualquer umadas reivindicações 55 - 59, e um veículo farmaceuticamenteaceitável.
61. Vetor de expressão, de acordo com a reivindi-cação 1 ou 2, CARACTERIZADO pelo fato de que o primeiro sí-tio de clivagem da proteína compreende um sítio de clivagemde protease celular ou um sítio de clivagem de protease viral.
62. Vetor de expressão, de acordo com a reivindi-cação 1 ou 2, CARACTERIZADO pelo fato de que o referido pri-meiro sitio de clivagem da proteína compreende um sítio re-conhecido pela furina; VP4 ou IPNV; protease de vírus etchde tabaco (TEV); protease 3C do rinovírus; protease PC5/6;protease PACE; protease LPC/PC7; enteroquinase; protease doFator Xa; trombina; genenase I; protease MMP; proteína deinclusão nuclear a (Nla) do potivírus mosaico de nabo;NS2B/NS3 do flavivírus tipo 4 da dengue, protease NS3 do ví-rus da febre amarela; ORF V do vírus mosaico de couve-flor;protease KEX2; CB2; ou 2A.
63. Vetor de expressão, de acordo com a reivindi-cação 1 ou 2, CARACTERIZADO pelo fato de que o referido pri-meiro sítio de clivagem da proteína é um sítio de clivagemde peptídeo de sinal internamente clivável viral.
64. Vetor de expressão, de acordo com a reivindi-cação 63, CARACTERIZADO pelo fato de que o referido sítio declivagem do peptídeo de sinal internamente clivável viralcompreende um sítio do vírus de influenza C, vírus de hepa-tite C, hantavírus, flavivírus ou vírus de rubéola.
65. Método para a expressão de proteínas de umsistema de dois híbridos, CARACTERIZADO pelo fato de que oreferido sistema de dois híbridos compreende uma proteínaisca (bait) e uma proteína presa (prey) candidata, o referi-do método compreendendo as etapas de: proporcionar uma célu-la hospedeira na qual tenha sido introduzido um vetor de ex-pressão codificando uma poliproteína compreendendo uma por-ção de proteína isca e uma porção de proteína presa candida-ta, as referidas porções separadas por uma seqüência de cli-vagem auto-processadora, uma seqüência de peptideo de sinalou um sitio de clivagem da protease; e o cultivo da célulahospedeira sob condições as quais permitem a expressão dapoliproteina e a clivagem da auto-processadora ou da protea-se da poliproteina.
66. Método, de acordo com a reivindicação 65,CARACTERIZADO pelo fato de que a poliproteina compreende a-inda um componente clivável de um sistema de três híbridos.
67. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 37 e 61 - 64; CARACTERIZADO pelo fatode que o referido vetor não contém uma seqüência 2A.
68. Vetor de expressão, de acordo com a reivindi-cação 1 ou 2, CARACTERIZADO pelo fato de que o referido pri-meiro sítio de clivagem de proteína compreende uma seqüênciaFMDV 2A; ou um domínio tipo 2A de outro Picornaviridae, umvírus de inseto, um rotavírus tipo C, tripanossomo ouThermatoga marítima.
69. Vetor de expressão para expressar uma proteínarecombinante, CARACTERIZADO pelo fato de compreender uma se-qüência codificadora para uma poliproteina, em que a poli-proteina compreende pelo menos um primeiro e um segundo seg-mento de proteína, em que os referidos segmentos de proteínasão separados por um sítio de clivagem de proteína entre e-les, em que o sítio de clivagem de proteína compreende umaseqüência de clivagem de peptideo auto-processadora, uma se-qüência de clivagem de peptideo de sinal ou uma seqüência declivagem de protease; e em que a referida seqüência codifi-cadora é exprimível numa célula hospedeira e é clivada nacélula hospedeira.
70. Vetor de expressão, de acordo com qualquer umadas reivindicações 1 - 37, 61 - 64, 67 e 68; CARACTERIZADOpelo fato de que a referida seqüência de ácido nucléico in-terveniente adicionalmente codifica uma identificação.
BRPI0613784-9A 2005-07-21 2006-07-21 expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise BRPI0613784A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US70185505P 2005-07-21 2005-07-21
US60/701.855 2005-07-21
PCT/US2006/028691 WO2007014162A2 (en) 2005-07-21 2006-07-21 Multiple gene expression including sorf constructs and methods with polyproteins, pro-proteins, and proteolysis

Publications (1)

Publication Number Publication Date
BRPI0613784A2 true BRPI0613784A2 (pt) 2011-02-01

Family

ID=37683887

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0613784-9A BRPI0613784A2 (pt) 2005-07-21 2006-07-21 expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise

Country Status (16)

Country Link
US (3) US20070065912A1 (pt)
EP (4) EP2484774A3 (pt)
JP (2) JP2009508470A (pt)
KR (1) KR20080031024A (pt)
CN (1) CN101595228A (pt)
AU (1) AU2006272706A1 (pt)
BR (1) BRPI0613784A2 (pt)
CA (1) CA2615983A1 (pt)
IL (1) IL188841A0 (pt)
MX (1) MX2008000985A (pt)
NO (1) NO20080882L (pt)
RU (1) RU2478709C2 (pt)
SG (1) SG164383A1 (pt)
TW (1) TW200745332A (pt)
WO (1) WO2007014162A2 (pt)
ZA (1) ZA200800207B (pt)

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7709224B2 (en) * 2003-06-03 2010-05-04 Biosante Pharmaceuticals, Inc. Compositions and methods for enhanced expression of recombinant polypeptides from a single vector using a peptide cleavage site
US20050136035A1 (en) * 2003-06-03 2005-06-23 Derek Ko Cell specific replication-competent viral vectors comprising a self processing peptide cleavage site
JP2008506389A (ja) * 2004-07-13 2008-03-06 セル ジェネシス インコーポレイテッド Aavベクター組成物および免疫グロブリンの発現の増強のための方法ならびにその使用方法
CN100460508C (zh) * 2004-11-03 2009-02-11 马延高 人胰岛素基因在甲醇酵母中的分泌表达方法
SG159554A1 (en) 2004-11-16 2010-03-30 Crucell Holland Bv Multivalent vaccines comprising recombinant viral vectors
US7632509B2 (en) * 2005-07-19 2009-12-15 Biosante Pharmaceuticals, Inc. Methods to express recombinant proteins from lentiviral vectors
US20070292922A1 (en) * 2006-03-31 2007-12-20 Cell Genesys, Inc. Regulated expression of recombinant proteins from adeno-associated viral vectors
CN101512008B (zh) 2006-09-08 2015-04-01 艾伯维巴哈马有限公司 白介素-13结合蛋白
WO2008112226A2 (en) * 2007-03-13 2008-09-18 Massachusetts Institute Of Technology Cre-lox based gene knockdown constructs and methods of use thereof
WO2008121301A1 (en) 2007-03-29 2008-10-09 Abbott Laboratories Crystalline anti-human il-12 antibodies
JP2008307007A (ja) 2007-06-15 2008-12-25 Bayer Schering Pharma Ag 出生後のヒト組織由来未分化幹細胞から誘導したヒト多能性幹細胞
EP2047858A1 (en) * 2007-10-10 2009-04-15 Institut National De La Sante Et De La Recherche Medicale (Inserm) Combination products for treating cancer
BRPI0818674B1 (pt) 2007-10-15 2023-01-17 Chugai Seiyaku Kabushiki Kaisha Métodos para produção de um anticorpo inteiro ou de um fragmento do mesmo e para preparação de fármacos, bem como vetor recombinante
AU2015202051B2 (en) * 2007-10-15 2017-12-07 Chugai Seiyaku Kabushiki Kaisha Method for production of antibody
WO2009073805A2 (en) * 2007-12-04 2009-06-11 Verdezyne, Inc. Aglycosylated therapeutic antibodies and therapeutic antibody-encoding nucleotide sequences
WO2009082209A1 (en) * 2007-12-21 2009-07-02 Fujifilm Manufacturing Europe B.V. Improvement of the secretion yield of a protein of interest by in vivo proteolytic processing of a multimeric precursor
KR20100113112A (ko) * 2008-01-15 2010-10-20 아보트 러보러터리즈 개선된 포유동물 발현 벡터 및 이의 용도
US20110091495A1 (en) * 2008-04-22 2011-04-21 Rutgers, The State University Of New Jersey Hcv e2 construct compositions and methods
US9758794B2 (en) 2008-04-22 2017-09-12 Rutgers, The State University Of New Jersey HCV E2 construct compositions and methods
EP2268809B1 (en) 2008-05-02 2019-02-06 Kyoto University Method of nuclear reprogramming
EP2810654A1 (en) 2008-07-08 2014-12-10 AbbVie Inc. Prostaglandin E2 binding proteins and uses thereof
US8722860B2 (en) * 2009-04-16 2014-05-13 Abbvie Biotherapeutics Inc. Anti-TNF-α antibodies and their uses
US11512326B2 (en) * 2009-05-26 2022-11-29 University Of Florida Research Foundation, Incorporated Small angiotensin peptide expression system in mammalian cells
US20110045534A1 (en) * 2009-08-20 2011-02-24 Cell Signaling Technology, Inc. Nucleic Acid Cassette For Producing Recombinant Antibodies
US20110150861A1 (en) * 2009-10-30 2011-06-23 Abbott Laboratories Sorf constructs and multiple gene expression
US20130067616A1 (en) * 2010-03-12 2013-03-14 Svetlana Oard Plant Defensive Peptides
CN105821078A (zh) 2010-12-09 2016-08-03 巴斯德研究所 用于获得高产量重组蛋白表达的基于mgmt的方法
MX2014000531A (es) 2011-07-13 2014-12-05 Abbvie Inc Metodos y composiciones para el tratamiento del asma usando anticuerpos anti-il-13.
WO2013062029A1 (ja) * 2011-10-25 2013-05-02 味の素株式会社 タンパク質の分泌生産法
WO2013078433A1 (en) * 2011-11-23 2013-05-30 University Of Hawaii Auto-processing domains for polypeptide expression
JP6279466B2 (ja) * 2012-04-27 2018-02-14 Jcrファーマ株式会社 新規な発現ベクター
MX2015007575A (es) * 2012-12-13 2016-03-15 Univ Pennsylvania Construcciones de anticuerpos de adn y metodo para utilizarlas.
US9550986B2 (en) 2012-12-21 2017-01-24 Abbvie Inc. High-throughput antibody humanization
CN103898141B (zh) * 2012-12-27 2016-06-15 深圳先进技术研究院 人源化抗体表达载体及其构建方法
KR20160002713A (ko) * 2013-02-13 2016-01-08 라보라토이레 프란카이즈 듀 프락티온네먼트 에트 데스 바이오테크놀로지스 고도로 갈락토실화된 항-tnf-알파 항체 및 이의 용도
AU2014249045A1 (en) 2013-03-11 2015-10-29 University Of Florida Research Foundation, Inc. Delivery of CARD protein as therapy for occular inflammation
US10273520B2 (en) * 2013-04-03 2019-04-30 Wan Keung Raymond Wong Means and methods for hyper-production of authentic human basic fibroblast growth factor in Escherichia coli
JP6404901B2 (ja) * 2013-04-03 2018-10-17 ウォン,ワン ケウン レイモンドWONG, Wan Keung Raymond 大腸菌の細胞質および/または培地中の真正ヒト上皮成長因子および/または塩基性線維芽細胞成長因子の発現の手段および方法
US9719106B2 (en) 2013-04-29 2017-08-01 The Trustees Of The University Of Pennsylvania Tissue preferential codon modified expression cassettes, vectors containing same, and uses thereof
WO2015050959A1 (en) 2013-10-01 2015-04-09 Yale University Anti-kit antibodies and methods of use thereof
SG11201604719WA (en) * 2013-12-13 2016-07-28 Univ Pennsylvania Dna antibody constructs and method of using same
WO2015127094A1 (en) 2014-02-19 2015-08-27 University Of Florida Research Foundation, Inc. Delivery of nrf2 as therapy for protection against reactive oxygen species
AU2015229381B2 (en) 2014-03-11 2019-11-07 University Of Florida Research Foundation, Inc. Use of AAV-expressed M013 protein as an anti-inflammatory therapeutic
RU2601126C2 (ru) * 2014-09-17 2016-10-27 Федеральное государственное бюджетное учреждение "Государственный научный центр Институт иммунологии" Федерального медико-биологического агентства России Способ получения биологически активных пептидов
WO2016089862A1 (en) * 2014-12-01 2016-06-09 The Trustees Of The University Of Pennsylvania Dna antibody constructs and method of using same
GB201507108D0 (en) * 2015-04-27 2015-06-10 Ucl Business Plc Nucleic acid construct
GB201507104D0 (en) * 2015-04-27 2015-06-10 Ucl Business Plc Nucleic acid construct
SI3303395T1 (sl) 2015-05-29 2020-03-31 Abbvie Inc. Protitelesa proti CD40 in njihove uporabe
CN108290960B (zh) 2015-10-08 2023-06-09 艾伯塔大学理事会 丙型肝炎病毒e1/e2异二聚体及其生产方法
RU2727914C2 (ru) * 2015-11-17 2020-07-24 Сучжоу Санкадия Биофармасьютикалз Ко., Лтд. Антитело против лиганда 1 запрограммированной гибели клеток (pd-l1), его антигенсвязывающий фрагмент и их медицинское применение
RU2619217C1 (ru) * 2015-12-04 2017-05-12 Федеральное государственное бюджетное учреждение "Государственный научно-исследовательский институт генетики и селекции промышленных микроорганизмов" (ФГБУ "ГосНИИгенетика") Температурочувствительный мутантный интеин для нерастворимой экспрессии предшественника целевого белка
CA3011746A1 (en) 2016-02-06 2017-08-10 Epimab Biotherapeutics, Inc. Fabs-in-tandem immunoglobulin and uses thereof
EP3445396A4 (en) * 2016-04-22 2020-03-11 Integrated Research Associates, LLC IMPROVED PROCESS FOR PRODUCING VIRUS-LIKE PARTICLES
WO2017198562A1 (en) * 2016-05-19 2017-11-23 Siemens Healthcare Gmbh Method of producing domains of protein
US10493172B2 (en) 2016-06-02 2019-12-03 California Institute Of Technology Gas-filled structures and related compositions, methods and systems to image a target site
AU2017294772B2 (en) * 2016-07-14 2024-05-02 Scholar Rock, Inc. TGFB antibodies, methods, and uses
US11118210B2 (en) 2016-07-28 2021-09-14 California Institute Of Technology Genetically engineered gas vesicle gene clusters, genetic circuits, vectors, prokaryotic cells, compositions, methods and systems for contrast-enhanced imaging
US10955496B2 (en) 2016-07-28 2021-03-23 California Institute Of Technology Gas-filled structures and related compositions, methods and systems for magnetic resonance imaging
WO2018035084A1 (en) * 2016-08-16 2018-02-22 Epimab Biotherapeutics, Inc. Monovalent asymmetric tandem fab bispecific antibodies
KR101948390B1 (ko) * 2016-11-21 2019-02-15 충북대학교 산학협력단 자가절단 단백질을 이용한 목적단백질의 제조 방법
CN108367075B (zh) 2016-11-23 2022-08-09 免疫方舟医药技术股份有限公司 4-1bb结合蛋白及其用途
US11964006B2 (en) 2017-09-16 2024-04-23 City Of Hope Multivalent Epstein-Barr virus-like particles and uses thereof
JP7394752B2 (ja) * 2017-10-12 2023-12-08 ザ ジャクソン ラボラトリー トランスジェニック選択方法および組成物
US11904010B2 (en) * 2018-03-19 2024-02-20 Boehringer Ingelheim Vetmedica (China) Co., Ltd. Recombinant virus capable of stably expressing target proteins
CN112840031B (zh) 2018-08-13 2023-03-24 根路径基因组学公司 成对的二分免疫受体多核苷酸的高通量克隆及其应用
GB201816873D0 (en) * 2018-10-17 2018-11-28 Imperial Innovations Ltd Fusion protein
WO2020086408A1 (en) * 2018-10-26 2020-04-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services A high-yield perfusion-based transient gene expression bioprocess
WO2020146367A1 (en) 2019-01-07 2020-07-16 California Institute Of Technology Burst ultrasound reconstruction with signal templates and related methods and systems
WO2020146379A1 (en) 2019-01-07 2020-07-16 California Institute Of Technology Gas vesicle expression systems, gas vesicle constructs and related genetic circuits, vectors, mammalian cells, hosts, compositions, methods and systems
WO2020172522A1 (en) * 2019-02-22 2020-08-27 Ogembo Javier Gordon Multivalent kaposi sarcoma-associated herpesvirus-like particles and uses thereof
WO2020198728A1 (en) 2019-03-28 2020-10-01 California Institute Of Technology Compositions, methods and systems for gas vesicle based cavitation
KR20220004060A (ko) 2019-04-05 2022-01-11 루트패스 제노믹스, 인크. T-세포 수용체 유전자 어셈블리를 위한 조성물 및 방법
CN110714020B (zh) * 2019-05-22 2021-08-03 北京理工大学 一种高效简便纯化蛋白的方法
CN112175927B (zh) * 2019-07-02 2023-04-18 上海科技大学 一种碱基编辑工具及其用途
CN110669740B (zh) * 2019-07-16 2021-10-08 伍泽堂 溶瘤病毒及其应用和治疗癌症的药物
US20230061973A1 (en) 2020-02-05 2023-03-02 Larimar Therapeutics, Inc. Tat peptide binding proteins and uses thereof
EP4284936A1 (en) * 2021-01-26 2023-12-06 Kriya Therapeutics, Inc. Vector constructs for delivery of nucleic acids encoding therapeutic anti-tnf antibodies and methods of using the same
WO2024097763A1 (en) * 2022-11-01 2024-05-10 Memorial Sloan-Kettering Cancer Center Intein-based sorting system and modular chimeric polypeptides
CN115947830B (zh) * 2022-12-27 2023-09-12 优洛生物(上海)有限公司 一种经改造的抗体、其制备方法及其用途
CN116970631B (zh) * 2023-09-19 2024-01-05 江西赛基生物技术有限公司 一种重组蛋白的编码基因、载体、细胞及制备方法

Family Cites Families (102)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6455275B1 (en) * 1980-02-25 2002-09-24 The Trustees Of Columbia University In The City Of New York DNA construct for producing proteinaceous materials in eucaryotic cells
ZA811895B (en) 1980-04-07 1982-04-28 Univ California Expression of hormone genomic clones
NZ199391A (en) 1981-01-02 1985-12-13 Genentech Inc Chimeric polypeptides comprising a proinsulin sequence,and preparation by recombinant dna technique;production of human insulin
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
US4937190A (en) * 1987-10-15 1990-06-26 Wisconsin Alumni Research Foundation Translation enhancer
ES2059482T3 (es) * 1987-12-23 1994-11-16 Boehringer Ingelheim Int Expresion de la proteasa p2a de hrv2 codificada por virus.
US5648254A (en) 1988-01-15 1997-07-15 Zymogenetics, Inc. Co-expression in eukaryotic cells
US5436146A (en) 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
US5162601A (en) 1989-11-22 1992-11-10 The Upjohn Company Plant potyvirus expression vector with a gene for protease
US5519164A (en) 1990-02-01 1996-05-21 Hoechst Aktiengesellschaft Expression of a multigene RNA having self-splicing activity
US5633282A (en) * 1990-05-25 1997-05-27 British Technology Group Limited Inhibition of viral infection
US5637481A (en) 1993-02-01 1997-06-10 Bristol-Myers Squibb Company Expression vectors encoding bispecific fusion proteins and methods of producing biologically active bispecific fusion proteins in a mammalian cell
CA2114416C (en) 1991-08-07 1998-07-07 W. French Anderson Retroviral vectors containing internal ribosome entry sites
DE4228458A1 (de) 1992-08-27 1994-06-01 Beiersdorf Ag Multicistronische Expressionseinheiten und deren Verwendung
DE4228457A1 (de) 1992-08-27 1994-04-28 Beiersdorf Ag Herstellung von heterodimerem PDGF-AB mit Hilfe eines bicistronischen Vektorsystems in Säugerzellen
US5834247A (en) * 1992-12-09 1998-11-10 New England Biolabs, Inc. Modified proteins comprising controllable intervening protein sequences or their elements methods of producing same and methods for purification of a target protein comprised by a modified protein
US5496714A (en) * 1992-12-09 1996-03-05 New England Biolabs, Inc. Modification of protein by use of a controllable interveining protein sequence
DE69419721T2 (de) * 1993-01-12 2000-04-27 Biogen Inc Rekombinante anti-vla4 antikörpermoleküle
US5532142A (en) 1993-02-12 1996-07-02 Board Of Regents, The University Of Texas System Method of isolation and purification of fusion polypeptides
US6133028A (en) * 1993-05-28 2000-10-17 Transgene S.A. Defective adenoviruses and corresponding complementation lines
DE4319708A1 (de) 1993-06-10 1994-12-15 Beiersdorf Ag Multicistronische Expression rekombinanter Gene in Bakterienzellen
US5834256A (en) 1993-06-11 1998-11-10 Cell Genesys, Inc. Method for production of high titer virus and high efficiency retroviral mediated transduction of mammalian cells
GB9326271D0 (en) * 1993-12-23 1994-02-23 Zeneca Ltd Expression of self-processing polyprotein in transgenic plants
US5643745A (en) 1994-02-03 1997-07-01 University Of Hawaii Heterologous dimeric proteins produced in heterokaryons
AU1743795A (en) 1994-02-03 1995-08-21 Scripps Research Institute, The A cassette to accumulate multiple proteins through synthesis of a self-processing polypeptide
EP0784690B1 (en) * 1994-06-10 2006-08-16 Genvec, Inc. Complementary adenoviral vector systems and cell lines
FR2722208B1 (fr) 1994-07-05 1996-10-04 Inst Nat Sante Rech Med Nouveau site interne d'entree des ribosomes, vecteur le contenant et utilisation therapeutique
US5955072A (en) 1994-07-13 1999-09-21 Sankyo Company, Limited Expression systems utilizing autolyzing fusion proteins and a reducing polypeptide
WO1996013583A2 (en) * 1994-10-20 1996-05-09 Morphosys Gesellschaft Für Proteinoptimierung Mbh Targeted hetero-association of recombinant proteins to multi-functional complexes
US20020168342A1 (en) 1994-11-03 2002-11-14 Cell Genesys, Inc. Novel adenoviral vectors, packaging cell lines, recombinant adenoviruses and methods
US5872005A (en) 1994-11-03 1999-02-16 Cell Genesys Inc. Packaging cell lines for adeno-associated viral vectors
AT403167B (de) 1994-11-14 1997-11-25 Immuno Ag Selektion und expression von fremdproteinen mittels eines selektions-amplifikations-systems
US6638762B1 (en) 1994-11-28 2003-10-28 Genetic Therapy, Inc. Tissue-vectors specific replication and gene expression
US6281332B1 (en) * 1994-12-02 2001-08-28 The Johns Hopkins University School Of Medicine Hedgehog-derived polypeptides
IL116816A (en) 1995-01-20 2003-05-29 Rhone Poulenc Rorer Sa Cell for the production of a defective recombinant adenovirus or an adeno-associated virus and the various uses thereof
US5912167A (en) * 1995-06-06 1999-06-15 Wisconsin Alumni Research Foundation Autocatalytic cleavage site and use thereof in a protein expression vector
US6040183A (en) * 1995-06-07 2000-03-21 University Of North Carloina At Chapel Hill Helper virus-free AAV production
US6093570A (en) 1995-06-07 2000-07-25 The University Of North Carolina At Chapel Hill Helper virus-free AAV production
US6090382A (en) 1996-02-09 2000-07-18 Basf Aktiengesellschaft Human antibodies that bind human TNFα
HU228630B1 (en) * 1996-02-09 2013-04-29 Abbott Biotech Ltd Use of human anti bodies that bind human tnf-alpha and process for inhibiting of human tnf-alpha activity
EP0803573A1 (en) 1996-04-25 1997-10-29 Gesellschaft für Biotechnologische Forschung mbH (GBF) Polycistronic expression construct with cytokines for multivalent vaccines
AU734968B2 (en) 1996-07-22 2001-06-28 Government Of The United States Of America, As Represented By The Secretary Of The Department Of Health And Human Services, The Vectors for inhibiting HIV and tumor growth
US6962708B1 (en) * 1997-02-28 2005-11-08 Acambis, Inc. Chimeric flavivirus vaccines
US6849428B1 (en) * 1997-03-05 2005-02-01 New England Biolabs, Inc. Intein-mediated protein ligation of expressed proteins
CA2287478C (en) 1997-04-14 2007-06-19 Richard J. Samulski Methods for increasing the efficiency of recombinant aav product
US6933378B2 (en) * 1997-05-30 2005-08-23 Joseph Atabekov Methods for coexpression of more than one gene in eukaryotic cells
FR2782325B1 (fr) * 1998-08-12 2002-05-24 Proteus Procede d'identification de sequences polynucleotidiques et/ou des proteines correspondantes a partir d'un echantillon d'acides nucleiques
US7001733B1 (en) 1998-05-12 2006-02-21 Rigel Pharmaceuticals, Inc. Methods and compositions for screening for modulations of IgE synthesis, secretion and switch rearrangement
US20030099932A1 (en) 1998-05-12 2003-05-29 Lorens James B. Retroviral vectors with separation sequences
GB9810999D0 (en) 1998-05-21 1998-07-22 Goken Joop Materials and methods relating to the expression of genes
US6537806B1 (en) * 1998-06-02 2003-03-25 University Of Washington Compositions and methods for treating diabetes
US7001745B1 (en) * 1998-09-30 2006-02-21 New England Biolabs, Inc. Intein mediated peptide ligation
EP1133523A1 (en) * 1998-11-16 2001-09-19 Genway Biotech, Inc. Generation of antibodies using polynucleotide vaccination in avian species
AU3719500A (en) 1999-03-05 2000-09-21 Maxygen, Inc. Recombination of insertion modified nucleic acids
EP1165813A2 (en) 1999-03-24 2002-01-02 The Board Of Regents, The University Of Texas System Linear and circular expression elements
US6933362B1 (en) * 1999-08-17 2005-08-23 Rensselaer Polytechnic Institute Genetic system and self-cleaving inteins derived therefrom, bioseparations and protein purification employing same, and methods for determining critical, generalizable amino acid residues for varying intein activity
AU6781700A (en) * 1999-08-17 2001-03-13 Health Research Institute Genetic system and self-cleaving inteins derived therefrom, bioseparations and protein purification employing same, and methods for determining critical, generalizable amino acid residues for varying intein activity
IL148785A0 (en) 1999-10-13 2002-09-12 Immunex Corp Vectors and methods for recombinant protein expression
ES2283344T3 (es) * 1999-10-29 2007-11-01 Kosan Biosciences, Inc. Analogos de la rapamicina.
US6665567B2 (en) * 2000-01-14 2003-12-16 Rainer R. Iraschko Optical-ring integer linear program formulation
DE60140996D1 (de) * 2000-02-11 2010-02-25 Metabolix Inc Intein enthaltende multigen-expressionskonstrukte
AU2001247483A1 (en) 2000-03-17 2001-10-03 Incyte Genomics, Inc. Proteases
US6692736B2 (en) * 2000-03-24 2004-02-17 Cell Genesys, Inc. Cell-specific adenovirus vectors comprising an internal ribosome entry site
US6908751B2 (en) 2000-04-26 2005-06-21 Zymogenetics, Inc. Methods for enhancing the expression of a protein of interest by recombinant host cells
US6544780B1 (en) 2000-06-02 2003-04-08 Genphar, Inc. Adenovirus vector with multiple expression cassettes
US20040235173A1 (en) 2000-07-03 2004-11-25 Gala Design, Inc. Production of host cells containing multiple integrating vectors by serial transduction
US6852510B2 (en) 2000-07-03 2005-02-08 Gala Design Inc Host cells containing multiple integrating vectors
US7419829B2 (en) 2000-10-06 2008-09-02 Oxford Biomedica (Uk) Limited Vector system
US6551786B2 (en) * 2001-01-04 2003-04-22 Myriad Genetics, Inc. Screen assay for selecting protein-protein interaction modulators
US20040191786A1 (en) * 2001-02-16 2004-09-30 Yue David T. Three cube fret method (3-fret) for detecting fluorescence energy transfer
MXPA03008022A (es) 2001-03-09 2003-12-04 Genentech Inc Proceso para la produccion de polipeptidos.
FI116851B (fi) * 2001-05-03 2006-03-15 Fit Biotech Oyj Plc Ilmentämisvektori, sen käyttöjä ja menetelmä sen valmistamiseksi sekä sitä sisältäviä tuotteita
US7871814B2 (en) 2001-05-10 2011-01-18 The Regents Of The University Of California Recombinant bicistronic flaviviruses and methods of use thereof
US20040180415A1 (en) * 2001-05-15 2004-09-16 Tchaga Grigoriy S. Methods and compositions for protein purification
US7052905B1 (en) 2001-08-13 2006-05-30 University Of Kentucky Research Foundation Methods and composition for expressing multiple genes in plants by alternate splicing of a polycistronic message
EP1288891A1 (en) 2001-08-27 2003-03-05 Hewlett-Packard Company Process and apparatus for displaying data in a specific area of the display in a computer or in an interactive terminal under control of the LAN card and independently on the operating system
ITMI20012110A1 (it) 2001-10-12 2003-04-12 Keryos Spa Vettori multi-cistronici utilizzabili in protocolli di trsferimento genico
WO2003040168A2 (en) * 2001-11-06 2003-05-15 Enanta Pharmaceuticals, Inc. Methods and compositions for identifying peptide aptamers capable of altering a cell phenotype
US20030157641A1 (en) 2001-11-16 2003-08-21 Idec Pharmaceuticals Corporation Polycistronic expression of antibodies
CA2485835C (en) 2002-05-24 2018-03-06 Restoragen, Inc. Methods and dna constructs for high yield production of polypeptides
AU2003231862A1 (en) 2002-05-24 2003-12-12 Restoragen, Inc. Methods and dna constructs for high yield production of polypeptides
WO2004000220A2 (en) * 2002-06-21 2003-12-31 Genetix Pharmaceuticals, Inc. Methods for purifying viral particles for gene therapy
US20040235011A1 (en) * 2002-06-26 2004-11-25 Cooper Richard K. Production of multimeric proteins
US20050112095A1 (en) 2002-07-09 2005-05-26 Tsu-An Hsu Internal ribosome entry sites for recombinant protein expression
CN1263860C (zh) 2002-09-30 2006-07-12 华南农业大学 多基因载体的构建方法与应用
US20050147962A1 (en) * 2002-11-19 2005-07-07 Wagstrom Christopher R. Display of dimeric proteins on phage
ES2373549T3 (es) 2002-12-18 2012-02-06 Chromagenics B.V. Método para mejorar la producción de proteínas.
SI1613350T1 (sl) * 2003-04-09 2009-08-31 Genentech Inc Zdravljenje avtoimunske bolezni pri bolniku z neustreznim odzivom na inhibitor TNF-alfa
WO2004101598A2 (en) * 2003-05-09 2004-11-25 Research Development Foundation Insertion of furin protease cleavage sites in membrane proteins and uses thereof
US7485291B2 (en) 2003-06-03 2009-02-03 Cell Genesys, Inc. Compositions and methods for generating multiple polypeptides from a single vector using a virus derived peptide cleavage site, and uses thereof
US7709224B2 (en) 2003-06-03 2010-05-04 Biosante Pharmaceuticals, Inc. Compositions and methods for enhanced expression of recombinant polypeptides from a single vector using a peptide cleavage site
US20050136035A1 (en) 2003-06-03 2005-06-23 Derek Ko Cell specific replication-competent viral vectors comprising a self processing peptide cleavage site
CA2534520C (en) * 2003-08-05 2014-04-08 Css-Albachem Limited Oligopeptide ligation methods comprising an activated ester moiety or an aldehyde or ketone moiety
ATE514783T1 (de) 2003-11-12 2011-07-15 Schering Corp Plasmidsystem zur expression mehrerer gene
MXPA06007144A (es) 2003-12-24 2007-01-31 Cerus Corp Moleculas de acido nucleico recombinante que codifican proteinas de fusion que comprenden polipeptidos de senal secretoria bacterial y de antigenos, casetes de expresion y bacterias, y metodos para usar las mismas.
US20050221429A1 (en) 2004-01-16 2005-10-06 Cardinal Health Pts, Llc Host cells containing multiple integrating vectors comprising an amplifiable marker
EP1723246B1 (en) 2004-03-09 2009-09-09 Eidgenössische Technische Hochschule Zürich New expression tools for multiprotein applications
KR100484653B1 (ko) 2004-05-06 2005-04-20 주식회사 대웅 원핵세포에서 활성형의 가용성 단백질을 제조하는 방법 및 이를 위한 폴리시스트론 벡터
US20080044853A1 (en) 2004-06-21 2008-02-21 Novozymes A/S Stably Maintained Multiple Copies of at Least Two Orf in the Same Orientation
JP2008506389A (ja) * 2004-07-13 2008-03-06 セル ジェネシス インコーポレイテッド Aavベクター組成物および免疫グロブリンの発現の増強のための方法ならびにその使用方法
MX2007004595A (es) 2004-11-08 2007-08-15 Chromagenics Bv Seleccion de celulas hospederas que expresan proteinas en altas concentraciones.
US20130273553A9 (en) * 2007-01-10 2013-10-17 Ronald C. Geyer Stabilization of cyclic peptide structures

Also Published As

Publication number Publication date
RU2478709C2 (ru) 2013-04-10
NO20080882L (no) 2008-04-21
RU2008106611A (ru) 2009-08-27
US20070065912A1 (en) 2007-03-22
EP2468881A2 (en) 2012-06-27
KR20080031024A (ko) 2008-04-07
IL188841A0 (en) 2008-04-13
US20130243789A1 (en) 2013-09-19
EP2468768A2 (en) 2012-06-27
WO2007014162A3 (en) 2009-05-07
EP2468768A3 (en) 2012-10-31
JP2012235782A (ja) 2012-12-06
EP1910550A4 (en) 2009-11-04
EP2468881A3 (en) 2012-08-15
EP2484774A3 (en) 2012-11-14
CA2615983A1 (en) 2007-02-01
EP1910550A2 (en) 2008-04-16
EP2484774A2 (en) 2012-08-08
CN101595228A (zh) 2009-12-02
JP2009508470A (ja) 2009-03-05
ZA200800207B (en) 2009-01-28
US20110034368A1 (en) 2011-02-10
WO2007014162A2 (en) 2007-02-01
TW200745332A (en) 2007-12-16
AU2006272706A1 (en) 2007-02-01
MX2008000985A (es) 2008-04-07
SG164383A1 (en) 2010-09-29

Similar Documents

Publication Publication Date Title
BRPI0613784A2 (pt) expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise
CN101553506B (zh) Lingo结合分子及其制药用途
DK2692865T3 (en) Transponeringsmedieret identification of specific binding proteins, or functional
AU2022200903B2 (en) Engineered Cascade components and Cascade complexes
CN108495685B (zh) 针对艰难梭菌感染的基于酵母的免疫疗法
KR20210148154A (ko) 세이프 하버 좌위 내로의 항체 코딩 서열의 삽입을 위한 방법 및 조성물
KR20050044856A (ko) 항체의 폴리시스트론 발현
CN101287498A (zh) Psma抗体-药物缀合物
KR102584628B1 (ko) T-세포 수용체, t-세포 항원 및 이들의 기능성 상호작용의 식별 및 특징규명을 위한 조작된 다성분 시스템
KR20220038362A (ko) 재조합 ad35 벡터 및 관련 유전자 요법 개선
CN110023500A (zh) 作为选择标记的减毒谷氨酰胺合成酶
US20240207318A1 (en) Chimeric costimulatory receptors, chemokine receptors, and the use of same in cellular immunotherapies
JP2003534775A (ja) タンパク質を不安定化する方法とその使用
CN107207603A (zh) 趋化因子‑免疫球蛋白融合多肽,其组合物、制备方法以及用途
JP2023025182A (ja) T細胞レセプター及びt細胞抗原の同定及び特徴決定のための遺伝子操作された多成分システム
CN112877292A (zh) 产生人抗体的细胞
KR20230019156A (ko) 유전자 삽입을 위한 다수의 도크들이 있는 세포주
KR20230117327A (ko) 가용성 알칼리성 포스파타제 작제물 및 가용성 알칼리성 포스파타제 작제물을 인코딩하는 폴리뉴클레오티드를 포함하는 발현 벡터
CN117795066A (zh) 用于rna引导的效应器募集的系统、方法和组分

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 9A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2315 DE 19-05-2015 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.