PT1790660E - Expressão heteróloga de proteínas de neisseria - Google Patents

Expressão heteróloga de proteínas de neisseria Download PDF

Info

Publication number
PT1790660E
PT1790660E PT06076718T PT06076718T PT1790660E PT 1790660 E PT1790660 E PT 1790660E PT 06076718 T PT06076718 T PT 06076718T PT 06076718 T PT06076718 T PT 06076718T PT 1790660 E PT1790660 E PT 1790660E
Authority
PT
Portugal
Prior art keywords
protein
sequence
expression
proteins
expressed
Prior art date
Application number
PT06076718T
Other languages
English (en)
Inventor
Maurizio Comanducci
Maria B Arico
Cesira Galeotti
Vega Masignani
Marzia Monica Guiliani
Mariagrazia Pizza
Original Assignee
Novartis Vaccines & Diagnostic
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GB0004695A external-priority patent/GB0004695D0/en
Priority claimed from GB0027675A external-priority patent/GB0027675D0/en
Application filed by Novartis Vaccines & Diagnostic filed Critical Novartis Vaccines & Diagnostic
Publication of PT1790660E publication Critical patent/PT1790660E/pt

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K39/095Neisseria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/22Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Neisseriaceae (F)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55505Inorganic adjuvants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/572Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 cytotoxic response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Mycology (AREA)
  • Communicable Diseases (AREA)
  • Oncology (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

1 DESCRIÇÃO "EXPRESSÃO HETERÓLOGA DE PROTEÍNAS DE NEISSERIA"
CAMPO TÉCNICO
Esta invenção insere-se no campo da expressão proteica. Em particular, está relacionada com a expressão heteróloga de proteínas de Neisseria (por exemplo, N. gonorrhoeae ou, preferencialmente, N. meningitidis).
ARTE ANTECEDENTE
Os pedidos de patente internacionais W099/24578, W099/36544, WO99/57280 e WO00/22430 revelam proteínas de
Neisseria meningitidis e Neisseria gonorrhoeae. Estas proteínas são tipicamente descritas como sendo expressas em E. coli (isto é, expressão heteróloga) quer como fusões GST N-terminal ou fusões C-terminal com cauda de His, apesar de outros sistemas de expressão, incluindo a expressão em Neisseria nativa, serem também revelados. É um objeto da presente invenção providenciar abordagens alternativas e melhoradas para a expressão heteróloga destas proteínas. Estas abordagens afetarão tipicamente o nível de expressão, a facilidade de purificação, a localização celular da expressão, e/ou as propriedades imunológicas da proteína expressa. REVELAÇÃO DA INVENÇÃO Nomenclatura aqui utilizada
As sequências da proteína 2166 reveladas nos documentos W099/24578, W099/36544 e WO99/57280 são referidas aqui pelos seguintes números de SEQ#:
Documento Sequências proteicas SEQ# aqui W099/24578 Igual SEQ. ID 2-892 SEQ#s 1-446 2 W099/36544 Igual SEQ. ID 2-90 SEQ#s 447-491 WO99/57280 Igual SEQ. ID 2-3020 Igual SEQ. ID 3040-3114 SEQ. ID 3115-3241 SEQ#s 492-2001 SEQ#s 2002-2039 SEQ#s 2040-2166
Além desta numeração de SEQ#, as convenções de nomenclatura utilizadas nos documentos W099/24578, W099/36544 e WO99/57280 também são utilizadas (por exemplo, '0RFs4', ORF40', ORF40-1' etc. como utilizado nos documentos W099/24578 e W099/36544; 'm919', 'g919' e 'a919' etc. como utilizado no documento WO99/57280).
As proteínas NMB0001 a NMB2160 de 2160 de Tettelin et al. [Science (2000) 287:1809-1815] são referidas aqui como SEQ#s 2167-4326 [ver também documento WOOO/66791]. O termo 'proteína da invenção' como utilizado aqui refere-se a uma proteína imunogénica que compreende: a) pelo menos 90 aminoácidos consecutivos da sequência
MFERSVIAMACIFAI^ACGGGGGGSPDVKSADTLSKPAAPWAEKETEVKEDAPQAGSQGOGAPSTQQSQDMA a VSAENTGNGGAATTDKPKNEDEGPQNDMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGV LIDGPSQNITLTHCKGDSCNGDNLLDEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVIIYK DKS AS S S S ARFRRS ARS RRSLPAEMPLIPVNQADTLIVDGEAVS LTGHSGNIFAPEGNYRYLTYGAEKLPGGS YALR VQGEPAKGEMLAGTAVYNGEVLHFHTENGRÍYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKA
AIDGNGFKGTWTENGGGDVSGRFYGPAGEEVAGKYSYRPTDAEKGGFGWAGKKEQD J b) uma sequência de comprimento inteiro com pelo menos 70% de identidade com a sequência
MFPBSVFAMAriFArllArr.nfifiOr.SPDVICSADTLSKPAAPWAHKETEVKEDAPQAGSOGOGAPSTOGSQDMAA
VSAENTGNGGAATTDKPKNEDEGPQNDMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGV
LIDGPSQNITLTHCKGDSCNGDNLLDEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVHYK
DKSASSSSARFRRSASSRRSLPAHMPUPVNQADTLrVDGEAVSLTGHSGNIFAPEGNYRYLTYOAEfCLPGGSYALR
VQGEPAiCGEMLAGTAVYNGEVLHFHTENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKA AIDGNGFKGTWTENGGGDVSGRFYGPAGEEVAGKYSYRPTDAEKGOFOVFAGKKEQD. e em que ocorre a deleção do péptido líder da proteína. O grau de 'identidade de sequência' referido em (b) é preferencialmente superior a 50% (por exemplo, 60%, 70%, 3 80%, 90%, 95%, 99% ou mais). Isto inclui mutantes e variantes alélicos [por exemplo, ver documento WOOO/66741]. A identidade é preferencialmente determinada pelo algoritmo de pesquisa de homologia de Smith-Waterman como implementado no programa MPSRCH (Oxford Molecular), utilizando uma pesquisa de lacunas afim com parâmetros gap open penalty=12 e gap extension penalty=1. Tipicamente, 50% de identidade ou mais entre duas proteínas é considerada como uma indicação de equivalência funcional. O 'fragmento' referido em (a) deveria compreender pelo menos n aminoácidos consecutivos de uma das SEQ#s 1-4326 e, dependendo da sequência particular, n é 90 ou mais (por exemplo, 90, 100 ou mais). Preferencialmente o fragmento compreende um epítopo de uma das SEQ#s 1-4326. Fragmentos preferidos são aqueles revelados nos documentos WOOO/71574 e W001/04316.
Proteínas preferidas da invenção são encontradas no serogrupo B de N. meningitidis.
Proteínas preferidas para utilização de acordo com a invenção são aquelas da estirpe 2996 ou estirpe 394/98 (uma estirpe da Nova Zelândia) do serogrupo B de N. meningitidis. A menos que declarado em contrário, as proteínas mencionadas aqui são da estirpe 2996 de N. meningitidis. Será, contudo, apreciado que a invenção não está, em geral, limitada pela estirpe. As referências a uma proteína particular (por exemplo '287', '919' etc.) podem ser tomadas para incluir essa proteína de qualquer estirpe. Deleção do péptido líder
Numa abordagem à expressão heteróloga, o péptido líder nativo de uma proteína da invenção é deletado. Além disso, é preferido que não seja utilizado qualquer parceiro de 4 fusão .
Portanto a invenção providencia um método para a expressão heteróloga de uma proteína da invenção, na qual (a) o péptido líder da proteína é deletado e, opcionalmente, (b) não é utilizado parceiro de fusão. A invenção providencia um método para a expressão heteróloga de uma proteína imunogénica que compreeende a) pelo menos 90 aminoácidos consecutivos da sequência
MFERSVIAMACIFALSACGQGGGGSPDVKSADTLSKPAAPWAEKETEVKEDAPOAQSQGOQAPSTOGSODMAA
VSAENTGNGGAATTDKPBCNEDEGPQNDMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGV
LIDGPSQNITLTHCKGDSCNGDNLLDEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVIIYK
DKSASSSSARFRRSARSRRSLPAEMPUPVNQADTLIVDGEAVSLTGHSGNÍFAPEGNYS.YLTYGAEKLPGGSVALR
VQGEPAKGEMLAGTAVYNGEVLHFHTENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKA
AmGNGFKGTWTENGGGDVSGRFYGPAGEEVAGKYSYRPTDAEKGGFGVFAGKKEQD; ··.··· * ‘ b) uma sequência de comprimento inteiro com pelo menos 70% de identidade com a sequência
mpbwsvt a μ αγτρα r s ArnnfinfifiSPDVKS ADTLSKPAAPVVAEKETBVKEDAPQAGSQGQQAPSTQGSQDMAA
VSAENTGNGGAATTDKPKNEDEGPQNDMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGV
LIDGPSQNITLTHCKGDSCNGDNLLDEEAPSKSEFENLNESERIHCYKKDGKSDKFTNLYATAVQANGTNKYVnYK
DKSASSSSARFRRSARSRRSLPAEMPUPVNQADTUVDGEAVSLTGHSGNIFAPEGNYRYLTYGAEKUPGGSYALR
VQGEPAKGEMLAGTAVYNGEVUHFHTENGRPYPTRGRFAAKVDFGSKSVDGXIDSGDDLHMGTQKFKA AIDGNGFKGTWTENGGGDVSGRFYGPAGEEVAGKYSYRPTDAEKGGFGVFAGKKEQD. e em que o péptido líder da proteína é deletado. O método envolverá tipicamente as etapas de: obter o ácido nucleico que codifica uma proteína da invenção; manipular dito ácido nucleico para remover nucleotídeos que codificam o péptido líder da proteína. O ácido nucleico resultante pode ser inserido num vetor de expressão, ou pode já fazer parte de um vetor de expressão. O primeiro aminoácido da proteína expressa será o da proteína nativa matura.
Este método pode aumentar os níveis de expressão. Para a proteína 919, por exemplo, os níveis de expressão em E. coli são muito superiores quando ocorre a deleção do péptido líder. A expressão aumentada pode ser devida à 5 localização alterada na ausência do péptido líder. 0 método é utilizado para a expressão de 287.
Expressão baseada no domínio
Numa quarta abordagem à expressão heteróloga, a proteína é expressa como domínios. Isto pode ser utilizado em associação com sistemas de fusão (por exemplo, fusões GST ou com cauda de His).
Portanto, a invenção providencia um método para a expressão heteróloga de uma proteína da invenção, na qual (a) pelo menos um domínio na proteína é deletado e, opcionalmente, (b) não é utilizado parceiro de fusão. 0 método envolverá tipicamente as etapas de: obter o ácido nucleico que codifica uma proteína da invenção; manipular o dito ácido nucleico para remover pelo menos um domínio de dentro da proteína. 0 ácido nucleico resultante pode ser inserido num vetor de expressão, ou pode já fazer parte de um vetor de expressão. Onde não são utilizados parceiros de fusão, o primeiro aminoácido da proteína expressa será o de um domínio da proteína.
Uma proteína é tipicamente dividida em domínios teóricos alinhando-a com sequências conhecidas em bases de dados e depois determinando regiões da proteína que mostram padrões de alinhamento diferentes uns dos outros. 0 método é preferencialmente utilizado para a expressão da proteína 287. Esta proteína pode ser teoricamente dividida em três domínios, referidos como A, B e C (ver Figura 5) . 0 domínio B alinha fortemente com proteases IgA, o domínio C alinha fortemente com proteínas de ligação da transferrina, e o domínio A não mostra um alinhamento forte com as sequências das bases de dados. Um alinhamento de formas polimórficas da 287 é revelado no 6 documento WOOO/66741.
Após a proteína ter sido dividida em domínios, estes podem ser (a) expressos sozinhos (b) deletados da com a proteína, por exemplo, proteína ABC -► ABD, ACD, BCD etc. ou (c) rearranjados, por exemplo, proteína ABC -► ACB, CAB etc. Estas três estratégias podem ser combinadas com parceiros de fusão se desejado. ORF46 também foi teoricamente dividida em dois domínios - um primeiro domínio (aminoácidos 1-433) que está bem conservado entre espécies e serogrupos, e um segundo domínio (aminoácidos 433-608) que não está bem conservado. O segundo domínio é preferencialmente deletado. Um alinhamento de formas polimórficas da ORF46 é revelado no documento WOOO/66741. A proteína 564 também foi dividida em domínios (Figura 8), tal como o foram a proteína 961 (Figura 12) e a proteína 502 (aminoácidos 28-167 da proteína MC58).
Proteínas híbridas
Numa quinta abordagem à expressão heteróloga, duas ou mais (por exemplo, 3, 4, 5, 6 ou mais) proteínas da invenção são expressas como uma única proteína híbrida. É preferido que não seja utilizado parceiro de fusão não pertencente a Neisseria (por exemplo, GST ou poli-His).
Isto oferece duas vantagens. Primeiro, uma proteína que pode ser instável ou fracamente expressa por si só pode ser assitida adicionando um parceiro híbrido adequado que ultrapasse o problema. Em segundo lugar, o fabrico comercial é simplificado - apenas precisa de ser empregue uma expressão e purificação de maneira a produzir duas proteínas úteis separadamente. 7
Portanto, a invenção providencia um método para a expressão heteróloga simultânea de duas ou mais proteínas da invenção, na qual ditas duas ou mais proteínas da invenção são fundidas (isto é, são traduzidas como uma única cadeia polipeptídica). 0 método envolverá tipicamente as etapas de: obter um primeiro ácido nucleico que codifica uma primeira proteína da invenção; obter um segundo ácido nucleico que codifica uma segunda proteína da invenção; ligar o primeiro e segundo ácidos nucleicos. 0 ácido nucleico resultante pode ser inserido num vetor de expressão, ou pode já fazer parte de um vetor de expressão.
Preferencialmente, as proteínas constituintes de uma proteína híbrida de acordo com a invenção pertencerão à mesma estirpe.
As proteínas fundidas no híbrido podem ser unidas diretamente, ou podem ser unidas através de um péptido linker, por exemplo, através de uma poliglicina linker (isto é, Gn onde n = 3, 4, 5, 6, 7, 8, 9, 10 ou mais) ou através de uma sequência peptídica curta que facilita a clonagem. É evidentemente preferido não unir uma proteína AG à extremidade C de uma poliglicina linker.
As proteínas fundidas podem não ter péptidos líderes nativos ou podem incluir a sequência do péptido líder do parceiro de fusão N-terminal. O método é bem adequado à expressão de proteínas orfl, orf4, orf25, orf40, Orf46/46.1, orf83, 233, 287, 292L, 564, 687, 741, 907, 919, 953, 961 e 983.
Os 42 híbridos indicados por 'X' no quadro seguinte da forma NH2-A-B-COOH são preferidos:
|A B-> ORF46.1 287 741 919 953 961 983 ORF46.1 X X X X X X 287 X X X X X X 741 X X X X X X 919 X X X X X X 953 X X X X X X 961 X X X X X X 983 X X X X X X
As proteínas preferidas a serem expressas como híbridas são, portanto, ORF46.1, 287, 741, 919, 953, 961 e 983. Estas podem ser utilizadas essencialmente na sua forma de comprimento inteiro, ou formas de deleções de poliglicina (AG) podem ser utilizadas (por exemplo, AG-287, AGTbp2, AG741, AG983 etc.), ou formas truncadas podem ser utilizadas (por exemplo, Δ1-287, Δ2-287 etc.), ou versões de domínio deletado podem ser utilizadas (por exemplo, 287B, 287C, 287BC, ORF46i_433, ORF46433-608, ORF46, 961c etc.).
Particularmente preferidas são: (a) uma proteína híbrida que compreende 919 e 287; (b) uma proteína híbrida que compreende 953 e 2 8 7; (c) uma proteína híbrida que compreende 287 e ORF46.1; (d) uma proteína híbrida que compreende 0RF1 e ORF46.1; (e) i uma proteína híbrida que compreende 919 e ORF46.1; (f) uma proteína híbrida que compreende ORF46.1 e 919; (g) uma proteína híbrida que compreende ORF46.1, 287 e 919; (h) uma proteína híbrida que compreende 919 e 519; e (i) uma proteína híbrida que compreende ORF9 7 e 225. Modalidades adicionais são mostradas na Figura 14 . Onde 287 é utilizada, é-o preferencialmente na extremidade C-terminal de um híbrido; se é para ser utilizada na extremidade N, é preferido utilizar uma forma 9 AG da 287 é utilizada (por exemplo, como a extremidade N de um híbrido com ORF 46.1, 919, 953 ou 961). Onde 287 é utilizada, esta é preferencialmente da estirpe 2996 ou da estirpe 394/98. Onde 961 é utilizada, esta é preferencialmente na extremidade N. Formas de domínio de 961 podem ser utilizadas. Alinhamentos de formas polimórficas de ORF46, 287, 919 e 953 são revelados no documento WOOO/66741. Qualquer um destes polimorfos pode ser utilizado de acordo com a presente invenção.
Vetores alternativos pSM214 também pode ser utilizado com: AG287, Δ2-287, Δ3-287, Δ4-287, Orf46.1, 961L, 961, 961(MC58), 96 1 c, 961 c-L, 919, 953 e AG287-Orf46.1.
Outro vetor adequado é pET-24b (Novagen; utiliza a resistência à canamicina), de novo não utilizando parceiros de fusão. pET-24b é preferido para uso com: AG287K, Δ2- 287K, Δ3-287Κ, Δ4-287Κ, Orf46.1-K, Orf46A-K, 961-K (MC58), 961a-K, 961b-K, 961c-K, 961c-L-K, 961d-K, AG287-919-K, AG287-Orf46.1-K e AG287-961-K.
Forma multimérica
Uma proteína da invenção pode ser expressa ou purificada de tal maneira que adota uma forma multimérica particular.
As proteínas 287 e 919 podem ser purificadas em formas diméricas.
Lipidação
Uma proteína da invenção pode ser expressa como uma proteína lipidada.
Portanto, a invenção providencia um método para a 10 expressão heteróloga de uma proteína da invenção, na qual uma proteína é expressa como uma proteína lipidada.
Isto é particularmente útil para a expressão de 287. Formas polimórficas de 287 são reveladas no documento WOOO/66741 .
Deleção da poliglicina
Como revelado aqui, trechos de poliglicina em sequências de tipo selvagem podem ser mutados. Isto aumenta a expressão proteica. O trecho de poliglicina tem a sequência (Gly)n, onde n>4 (por exemplo, 5, 6, 7, 8, 9 ou mais) . Este trecho é mutado para interromper ou remover a (Gly)n. Isto pode ser feito por deleção (por exemplo, CGGGGS^ CGGGS, CGGS, CGS or CS), por substituição (por exemplo, CGGGGS^ CGXGGS, CGXXGS, CGXGXS etc.), e/ou por inserção (por exemplo, CGGGGS^ CGGXGGS, CGXGGGS, etc.).
Esta abordagem não está restrita às proteínas da Neisseria - pode ser utilizada para qualquer proteína (particularmente proteínas bacterianas) para aumentar a expressão heteróloga. Para as proteínas de Neisseria, contudo, é particularmente adequada para expressar a 287, 741, 983 e Tbp2. Um alinhamento de formas polimórficas da 287 é revelado no documento WOOO/66741.
Aqui descrito está um método para a expressão heteróloga de uma proteína, na qual (a) um trecho de poliglicina dentro da proteína é mutado. O método envolverá tipicamente as etapas de: obter o ácido nucleico que codifica uma proteína da invenção; e manipular dito ácido nucleico para mutar nucleotídeos que codificam um trecho de poliglicina dentro da sequência da proteína. O ácido nucleico resultante pode ser inserido num 11 vetor de expressão, ou já fazer parte de um vetor de expressão.
Contrariamente, a abordagem oposta (isto é, introdução de trechos de poliglicina) pode ser utilizada para suprimir ou diminuir a expressão de uma dada proteína heteróloga. Hospedeiro heterólogo
Enquanto a expressão das proteínas da invenção pode ocorrer no hospedeiro nativo (isto é, o organismo no qual a proteína é expressa na natureza), a presente invenção utiliza um hospedeiro heterólogo. 0 hospedeiro heterólogo pode ser procarionte ou eucarionte. É preferencialmente E. coli, mas outros hospedeiros adequados incluem Bacillus subtilis, Vibrio cholerae, Salmonella typhi, Salmonella typhimurium, Neisseria meningitidis, Neisseria gonorrhoeae, Neisseria lactamica, Neisseria cinerea, Mycobacteria (por exemplo, tuberculose), levedura, etc.
Vetores etc.
Tal como os métodos descritos anteriormente, a invenção providencia (a) ácido nucleico e vetores úteis nestes métodos (b) células hospedeiras contendo ditos vetores (c) proteínas expressas ou expressáveis pelos métodos (d) composições compreendendo estas proteínas, que podem ser adequados como vacinas, por exemplo, ou como reagentes de diagnóstico, ou como composições imunogénicas (e) estas composições para utilização como medicamentos (por exemplo, como vacinas) ou como reagentes de diagnóstico (f) a utilização destas composições no fabrico de (1) um medicamento para tratar ou prevenir infeção devido a bactérias Neisseria (2) um reagente de diagnóstico para detetar a presença de bactérias Neisseria ou de anticorpos criados contra bactérias Neisseria, e/ou (3) um 12 reagente que pode criar anticorpos contra bactérias Neisseria e (g) um método de tratar um paciente, compreendendo administrar ao paciente uma quantidade terapeuticamente eficaz destas composições.
Sequências A invenção também providencia uma proteína ou um ácido nucleico que tem qualquer uma das sequências expostas nos exemplos seguintes. Também providencia proteínas e ácido nucleico que têm uma identidade de sequência com estas. Como descrito anteriormente, o grau de 'identidade de sequência' é preferencialmente superior a 50% (por exemplo, 60%, 70%, 80%, 90%, 95%, 99% ou mais).
Além disso, a invenção providencia ácido nucleico que pode hibridizar com o ácido nucleico revelado nos exemplos, preferencialmente em condições de "condições de alta estringência" (por exemplo, 65°C numa solução 0,lxSSC, 0,5% SDS) . A invenção também providencia ácido nucleico que codifica proteínas de acordo com a invenção.
Também deveria ser apreciado que a invenção providencia ácido nucleico que compreende sequências complementares àquelas descritas anteriormente (por exemplo, para efeitos de sondas ou antissenso). Ácido nucleico de acordo com a invenção pode, claro, ser preparado de muitas maneiras (por exemplo, por síntese química, a partir de bibliotecas genómicas ou de ADNc, a partir do próprio organismo etc.) e pode tomar várias formas (por exemplo, cadeia simples, cadeia dupla, vetores, sondas, etc.).
Além disso, o termo "ácido nucleico" inclui ADN e ARN, e também os seus análogos, tais como aqueles que contêm 13 estruturas dorsais modificadas, e também péptido de ácidos nucleicos (PNA) etc.
BREVE DESCRIÇÃO DOS DESENHOS
As Figuras 1 e 2 mostram construções utilizadas para expressar proteínas utilizando péptidos líderes heterólogos. A Figura 3 mostra dados de expressão para 0RF1, e a Figura 4 mostra dados semelhantes para a proteína 961. A Figura 5 mostra domínios da proteína 287, e as Figuras 6 e 7 mostram deleções dentro do domínio A. A Figura 8 mostra domínios da proteína 564. A Figura 9 mostra o gene repórter PhoC conduzido pelo péptido líder 919, e a Figura 10 mostra os resultados obtidos utilizando mutantes do péptido líder. A Figura 11 mostra mutantes de inserção da proteína 730 (A: 730-C1; B: 730-C2). A Figura 12 mostra domínios da proteína 961. A Figura 13 mostra SDS-PAGE das proteínas AG. Os pontos mostram o principal produto recombinante. A Figura 14 mostra 26 proteínas híbridas de acordo com a invenção.
Exemplos e Exemplos Referência
Exemplo Referência 1- 919 e o seu péptido lider A proteína 919 da N. meningitidis (serogrupo B, estirpe 2996) tem a sequência seguinte: 1 MKKYLFRAAL YGIAAAILAA CQSKSIQTFP QPDTSVINGP DRPVGIPDPA 51 GTTVGGGGAV YTWPHLSLP HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV 101 CAQAFQTPVH SFQAKQFFER YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR 151 RTAQARFPIY GIPDDFISVP LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT 201 HTADLSRFPI TARTTAIKGR FEGSRFLPYH TRNQINGGAL DGKAPILGYA 251 EDPVELFFMH IQGSGRLKTP SGKYIRIGYA DKNEHPYVSI GRYMADKGYL 301 KLGQTSMQGI KAYMRQNPQR LAEVLGQNPS YIFFRELAGS SNDGPVGALG 351 TPLMGEYAGA VDRHYITLGA PLFVATAHPV TRKALNRLIM AQDTGSAIKG 401 AVRVDYFWGY GDEAGELAGK QKTTGYVWQL LPNGMKPEYR P* 14 0 péptido líder está sublinhado.
As sequências da 919 de outras estirpes podem ser encontradas nas Figuras 7 e 18 do documento WOOO/66741. 0 exemplo 2 do documento WO99/57280 revela a expressão da proteína 919 como uma fusão His na E. coli. A proteína é um bom imunogene exposto à superfície.
Três estratégias de expressão alternativas foram utilizadas para 919: 1) 919 sem o seu péptido líder (e sem a cisteína madura do terminal N) e sem qualquer parceiro de fusão ( r g i gdesmarcado, ^ .
1 QSKSIQTFP QPDTSVINGP DRPVGIPDPA GTTVGGGGAV YTWPHLSLP
50 HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV CAQAFQTPVH SFQAKQFFER
100 YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR RTAQARFPIY GIPDDFISVP
150 LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT HTADLSRFPI TARTTAIKGR
200 FEGSRFLPYH TRNQINGGAL DGKAPILGYA EDPVELFFMH IQGSGRLKTP
250 SGKYIRIGYA DKNEHPYVSI GRYMADKGYL KLGQTSMQGI KAYMRQNPQR
300 LAEVLGQNPS YIFFRELAGS SNDGPVGALG TPLMGEYAGA VDRHYITLGA
350 PLFVATAHPV TRKALNRLIM AQDTGSAIKG AVRVDYFWGY GDEAGELAGK 400 QKTTGYVWQL LPNGMKPEYR P* 0 péptido líder e cisteína foram omitidos ao desenhar o iniciador da amplificação em sentido descendente da extremidade 5' a partir da sequência líder prevista. 2) 919 com o seu próprio péptido lider mas sem qualquer parceiro de fusão ('919L'); e 3) 919 com o péptido líder (MKTFFKTL S AAAL ALIL AA) da ORF4 ('919LOrf4') .
1 MKTFFKTLS AAALALILAA CQSKSIQTFP QPDTSVINGP DRPVGIPDPA 50 GTTVGGGGAV YTWPHLSLP HWAAQDFAKS LQSFRLGCAN LKNRQGWQDV 100 CAQAFQTPVH SFQAKQFFER YFTPWQVAGN GSLAGTVTGY YEPVLKGDDR 150 RTAQARFPIY GIPDDFISVP LPAGLRSGKA LVRIRQTGKN SGTIDNTGGT 200 HTADLSRFPI TARTTAIKGR FEGSRFLPYH TRNQINGGAL DGKAPILGYA 250 EDPVELFFMH IQGSGRLKTP SGKYIRIGYA DKNEHPYVSI GRYMADKGYL 300 KLGQTSMQGI KSYMRQNPQR LAEVLGQNPS YIFFRELAGS SNDGPVGALG 15 350 TPLMGEYAGA VDRHYITLGA PLFVATAHPV TRKALNRLIM AQDTGSAIKG 400 AVRVDYFWGY GDEAGELAGK QKTTGYVWQL LPNGMKPEYR P*
Para fazer esta construção, a sequência inteira que codifica o péptido líder 0RF4 foi incluída no iniciador 5' como uma cauda (iniciador 919Lorf4 For). Um local de restrição Nhel foi qerado por uma alteração dupla de nucleotídeo na sequência que codifica o líder ORF4 (sem alterações de aminoácido), para permitir que genes diferentes fossem fundidos à sequência do péptido líder ORF4. Um codão de terminação foi incluído em todas as sequências do iniciador da extremidade 3'.
Todas as três formas da proteína foram expressas e poderiam ser purificadas.
Os produtos de expressão ' 919L' e '919LOrf4' foram ambos lipidados, como mostrado pela incorporação de rótulo [3H]-palmitato. 919desmarcado não incorporou o rótulo 3H e foi localizado intracelularmente. 919LOrf4 poderia ser purificado mais facilmente do que 919L. Foi purificado e utilizado para imunizar ratinhos. Os soros resultantes deram excelentes resultados em testes FACS e ELISA, e também no ensaio bactericida. Mostrou-se que a lipoproteína estava localizada na membrana exterior. 91 gdesmarcado deu excelentes títulos ELISA e elevada atividade bactericida no soro. FACS confirmou a sua localização superficial na célula.
Exemplo Referência 2 - 919 e temperatura de expressão 0 crescimento de E. coli que expressa a proteína 919LOrf4 a 37°C resultou na lise das bactérias. De maneira a ultrapassar este problema, as bactérias recombinantes foram crescidas a 30°C. A lise foi prevenida sem prevenir a expressão. 16
Exemplo Referência 3 - mutação de 907, 919 e 922
Foi conjeturado que as proteínas 907, 919 e 922 são mureínas hidrolases, e mais particularmente transglicosilases líticas. Mureínas hidrolases estão localizadas na membrana externa e participam na degradação do peptidoglicano.
As proteínas 9i9desmarcad0 purificadas, 919Lorf4, 919-His (isto é, com uma extremidade C com cauda de His) e 922-His foram, assim, testadas para a atividade da mureína hidrolase [Ursinus e Holtje (1994) J.Bact. 176:338-343]. Os diferentes ensaios foram utilizados, um determinando a degradação da camada de mureína insolúvel nos muropéptidos solúveis e o outra a medição da degradação de cadeias poli (MurNAc-GlcNAc) n>30 glicano. 0 primeiro ensaio utiliza camadas de mureína radiomarcadas com ácido meso-2,6-diamino-3,4,5-[3H]pimélico como substrato. A enzima (3-10 μρ total) foi incubada durante 45 minutos a 37 °C num volume total de 100 μΐ compreendendo lOmM Tris-maleato (pH 5,5), lOmM MgCl2, 0,2% v/v Triton X—100 e camada de mureína marcada com [3H]A2pm (cerca de 10000 cpm) . A mistura do ensaio foi colocada em gelo durante 15 minutos com 100 μΐ de 1% p/v de N-acetil-N,N,N-trimetilamonia durante 15 minutos e o material precipitado foi transformado em pellets por centrifugação a 10000 g durante 15 minutos. A radioatividade no sobrenadante foi medida por contagem de cintilação líquida. A transglicosilase lítica solúvel Slt70 de E. coli foi utilizada como um controlo positivo para o ensaio; o controlo negativo compreendeu a solução anterior do ensaio sem enzima.
Todas as proteínas exceto 919-His deram resultados 17 positivos no primeiro ensaio. 0 segundo ensaio monitoriza a hidrólise das cadeias de poli(MurNAc-GlcNAc)glicano. As cadeias purificadas, poli (Mur-NAc-GlcNAc) n>3o marcadas com N-acetil-D-1-[ 3H] glucosamina foram incubadas com 3 mg de 919L em 10 mM Tris-maleato (pH 5,5), 10 mM MgCl2 e 0,2% v/v Triton X-100 durante 30 min a 37°C. A reação foi parada por ebulição durante 5 minutos e o pH da amostra ajustado para cerca de
3,5 por adição de 10 μΐ de 20% v/v de ácido fosfórico. O substrato e produto foram separados por HPLC de fase reversa numa coluna Nucleosil 300 Cis como descrito por Harz et. al. [Anal. Biochem. (1990) 190:120-128]. A transglicosilase lítica Mlt A de E. coli foi utilizada como um controlo positivo no ensaio. O controlo negativo foi realizado na ausência de enzima.
Por este ensaio, a capacidade de 919LOrf4 em hidrolizar cadeias de glicano isoladas foi demonstrada quando as subunidades de anidrodissacarideo foram separadas do oligossacarideo por HPLC.
A proteina 919Lorf4 foi selecionada para análises cinéticas. A atividade da 919Lorf4 foi aumentada em 3,7 vezes pela adição de 0,2% v/v Triton X-100 no tampão de ensaio. A presença de Triton X-100 não teve efeito na atividade do 9i9desmarcado. o efeito do pH na atividade da enzima foi determinado em tampão Tris-Maleato ao longo de um intervalo de 5,0 a 8,0. O pH ótimo para a reação foi determinado ser 5,5. Ao longo do intervalo de temperatura de 18°C a 42°C, a atividade máxima foi observada aos 37°C. O efeito de vários iões na atividade da mureina hidrolase foi determinado realizando a reação na presença de uma variedade de iões numa concentração final de 10 mM. A 18 atividade máxima foi encontrada com Mg2+, que estimulou a atividade em 2,1 vezes. Mn2+ e Ca2+ também estimularam a atividade da enzima numa medida semelhante enquanto a adição de Ni2+ e EDTA não produziu um efeito significativo. Por oposição, tanto Fe2+ como Zn2+ inibiram significativamente a atividade da enzima. As estruturas dos produtos da reação resultantes da digestão de sáculo de mureina de E. coli não rotulados foram analisadas por HPLC de fase reversa como descrito por Glauner [Anal. Biochem. (1988) 172:451-464]. Os sáculos de mureina digeridos com a muramidase de Cellosyl foram utilizados para calibrar e padronizar a coluna ODS Hypersil. Os produtos da reação principais foram 1,6 anidrodissacarideo péptidos tetra e tri, demonstrando a formação da ligação intramolecular de ácido 1,6 anidromuraminico.
Estes resultados demonstram experimentalmente que 919 é uma mureina hidrolase e, em particular, um membro da família de enzimas transglicosilase lítica. Além disso, a capacidade da 922-His para hidrolizar sáculos de mureina sugere que esta proteína é também uma transglicosilase lítica. A atividade pode ajudar a explicar os efeitos tóxicos da 919 quando expressa em E. coli.
De maneira a eliminar a atividade enzimática, foi utilizada mutagénese racional. 907, 919 e 922 mostram homologia relativamente baixa em relação a três transglicosilases líticas de mureina lipidadas ligadas à membrana de E. coli: 919 (441 aminoácidos) é 27,3% idêntica sobre 440 aminoácidos sobreposta com MLTA (P46885) de E. coli; 922 (369 aminoácidos) é 38,7% idêntica sobre 310 19 aminoácidos sobreposta com MLTB (P41052) de E. coli; e 907-2 (207 aminoácidos) é 26,8% idêntica sobre 149 aminoácidos sobreposta com MLTC (P52066) de E. coli. 907-2 também partilha homologia com MLTD (P23931) e Slt70 (P03810) de E. coli, uma transglicosilase litica solúvel que está localizada no espaço periplásmico. Não pode ser detetada homologia de sequência significativa entre 919, 922 e 907-2, e o mesmo é verdade entre as proteínas MLTA, MLTB e MLTC correspondentes.
Estruturas cristais estão disponíveis para Slt70 [1QTEA; 1QTEB; Thunnissen et al. (1995) Biochemistry 34: 12729-12737] e para Slt35 [ 1LTM; 1QUS; 1QUT; van Asselt et al. (1999) Structure Fold Des 7:1167-80] que é uma forma solúvel da 40kDa MLTB. O resíduo catalítico (um ácido glutâmico) foi identificado para ambas Slt70 e MLTB.
No caso da Slt70, estudos de mutagénese demonstraram que mesmo uma substituição conservadora da Glu505 catalítica com uma glutamina (Gin) causa a perda completa da atividade enzimática. Apesar da Slt35 não ter uma semelhança de sequência óbvia com a Slt70, os seus domínios catalíticos mostram uma semelhança surpreendente. O resíduo catalítico correspondente em MLTB é Glul62.
Outro resíduo que se acredita desempenhar um papel importante na dobragem correta na fissura enzimática é uma glicina (Gly) bem conservada descendente do ácido glutâmico. Recentemente, Terrak et al. [Mol.Microbiol. (1999) 34:350-64] sugeriram a presença de outro resíduo importante que é um aminoácido aromático localizado cerca de 70-75 resíduos em sentido descendente do ácido glutâmico catalítico. 20
Os alinhamentos da sequência de Slt70 com 907-2 e de MLTB com 922 foram realizados de maneira a identificar os residuos catalíticos correspondentes nos antígenos MenB.
Os dois alinhamentos na região do domínio catalítico são reportados a seguir: 907-2/Slt70: 90 100 110 T120 130 140
907-2.pep ERRRLLVNIQYESSRAG—LDTQIVLGLIEVESAFRQYAISGVGAR6LMQVMPFWKNYIG II I I : : : I : :::::: I I | : : I Ml Tl I I : I I : : 3lty_ecoli ERFPLAYNDLFKRYTSGKEIPQSYAMAIARQESAWNPKVKSPVGASGLMQIMPGTATHTV 460 490 500 A 510 520 530 GLU505
922/MLTB 150 160 ▼ 170 180 190 200 922.pep mltb ecoli 922.pep mltb ecoli
VAQKYGVPAELIVAVIGIETNYGKNTGSFRVADALATLGFDYPRRAGFFQKELVELLKLA
: I I I I I 1:11::11:11 :T: T: I: II I I I I : I : I I I I I : I : II : I : I AWQVYGVPPEIIVGIIGVETRW6RVMGKTRILDALATLSFNYPRRAEYFSGELETFLLMA 150 160 A 170 180 190 200 GL0162 210 220 230 240 250 260 KEEGGDVFAFKGSYAGAMGMPQFMPSSYRKWAVDYDGDGHRDIWGNVGDVAASVANYMKQ : : I I : : I II : I I I I I : I I I I I I I : : : I I I : : I I I I : : I I I : :11111:1 RDEQDDPLNLKGSFAGAMGYGQFMPSSYKQYAVDFSGDGHINLWDPV-DAIGSVANYFKA 210 220 230 240 250 260
Destes alinhamentos, resulta que o glutamato catalítico correspondente em 907-2 é Glull7, ao passo que em 922 é Glul64. Ambos antígenos também partilham glicinas descendentes que poderiam ter um papel estrutural na dobragem da fissura enzimática (a negrito), e 922 tem um resíduo aromático conservado cerca de 70 aminoácidos em sentido descendente (a negrito).
No caso da proteína 919, não existe disponível estrutura 3D para o seu MLTA homólogo de E. coli, e nada é conhecido sobre um resíduo catalítico possível. Ainda assim, três aminoácidos em 919 estão previstos como resíduos catalíticos por alinhamento com MLTA: 21
919/MLTA 240 250 ▼ 260 □ □ 270 □ 280 290
919.pep ALDGKAPILGYAEDPVELFFMHIQGSGRLKTPSGKYIRI-GYADKNEHPYVSIGRYMADK II: I II:I::: :: I : I : I I I I : : I : : : : I I II I I I I I : : I :
mlta_ecoli.p ALSDKY-ILAYSNSLMDNFIMDVQGSGYIDFGDGSPLNFFSYAGKNGHAYRSIGKVLIDR 170 180 190 200 210 300 310 320 ▼ 330Π m 340 0350 0
919.pep GYLKLGQTSMQCIKSYMRQNPQ-RLAEVLGQNPSYIFFRELAGSSNDGPV-GALGTPLMG
I : I : | I I : I ::::::: |: | | I I I :: | | : : : I I II :: I I : I
rnlta ecoli.p GEVKKEDMSMQAIRHWGETHSEAEVRELLEQNPSFVFFKPQSFA----PVKGASAVPLVG 220 230 240 250 260 270 360 ▼ o 380 390 400 00410
919. pep EYAGAVDRHYITLGAPLFVATAHPVTRKALN-----RLIMAQDTGSAIKGAVRVDYFWGY
: : I I I I I : I : : : : : I I I : : I I : I : I I I I : I : I mlta_ecoli.p RASVASDRSIIPPGTTLLAEVPLLDNNGKFNGQYELRLMVALDVGGAIKGQ-HFDIYQGI 280 290 300 310 320 330 420 o
919.pep GDEAGELAGKQKTTGYVWQLLP
1111:11 : I I I I mlta_ecoli.p GPEAGHRAGWYNHYGRVWVLKT 340 350
Os três resíduos catalíticos possíveis estão representados pelo símbolo ▼: 1) Glu255 (Asp em MLTA), seguido de três glicinas conservadas (Gly263, Gly265 e Gly272) e três resíduos aromáticos conservados localizados aproximadamente 75-77 resíduos descendentes. Estes resíduos descendentes são representados por □. 2) Glu323 (conservado em MLTA), seguido de 2 glicinas conservadas (Gly347 e Gly355) e dois resíduos aromáticos conservados localizados 84-85 resíduos descendentes (Tyr406 ou Phe407). Estes resíduos descendentes são representados por 0. 3) Asp362 (em vez do esperado Glu), seguido de uma glicina (Gly 369) e um resíduo aromático conservado (Trp428). Estes resíduos descendentes são representados por o.
Alinhamentos de formas polimórficas da 919 são revelados no documento WOOO/66741.
Com base na previsão de resíduos catalíticos, três 22 mutantes da 919 e um mutante da 90 7, contendo cada uma única substituição de aminoácido, foram gerados. Os ácidos glutâmicos na posição 255 e 323 e os ácidos aspárticos na posição 362 da proteína 919 e o ácido glutâmico na posição 117 da proteina 907 foram substituídos com resíduos de glicina utilizando SDM baseado em PCR. Para isto, iniciadores internos contendo uma alteração de codão de Glu ou Asp para Gly foram desenhados:
Iniciadores Sequências Alteração do codão 919-E255 for 919-E255 rev CGAAGACCCCGTCGgtCTTTTTTTTATG GTGCATAAAAAAAAGacCGACGGGGTCT GAA - -> Ggt 919-E323 for 919-E323 rev AACGCCTCGCCGgtGTTTTGGGTCA TTTGACCCAAAACacCGGCGAGGCG GAA - Ggt 919-D362 for 919-D362 rev TGCCGGCGCAGTCGgtCGGCACTACA TAATGTAGTGCCGacCGACTGCGCCG GAC - Ggt Iniciadores Sequências Alteração do codão 907-E117 for 907-E117 rev TGATTGAGGTGGgtAGCGCGTTCCG GGCGGAACGCGCTacCCACCTCAAT GAA - *· Ggt
Os nucleotídeos sublinhados codificam a glicina; os nucleotídeos mutados estão em subscrito.
Para gerar os mutantes 919-E255, 919-E323 e 919-E362, foi realizada uma PCR utilizando 20 ng do ADN de pET 919-LOrf4 como molde, e os seguintes pares de iniciador: 1) Orf4L for / 919-E255 rev 2) 919-E255 for / 919L rev 3) Orf4L for / 919-E323 rev 4) 919-E323 for / 919L rev 5) Orf4L for / 919-D362 rev 23 6) 919-D362 for / 919L rev A segunda ronda de PCR foi realizada utilizando o produto da PCR 1-2, 3-4 ou 5-6 como molde, e como iniciadores forward e reverso a "0rf4L for" e "919L rev" respetivamente.
Para o mutante 907-E117, foi realizada uma PCR utilizando 200 ng de ADN cromossomal da estirpe 2996 como molde e os seguintes pares de iniciadores: 7) 907L for / 907-E117 rev 8) 907-E 117 for / 907L rev A segunda ronda de PCR foi realizada utilizando os produtos da PCR 7 e 8 como moldes e os oligos "907L for" e "907L rev" como iniciadores.
Os fragmentos de PCR contendo cada mutação foram processados seguindo o procedimento padrão, digeridos com as enzimas de restrição Ndel e Xhol e clonados no vetor pET-21b+. A presença de cada mutação foi confirmada por análise de sequência. A mutação de Glull7 para Gly em 907 é realizada de modo semelhante, tal como o é a mutação dos resíduos Glul64, Ser213 e Asn348 em 922. O mutante E255G da 919 mostra uma redução de 50% na atividade; o mutante E323G mostra uma redução de 70% na atividade; o mutante E362G não mostra redução na atividade. Exemplo Referência 4 - forma multimérica 287-GST, 91 Q^esmarcado e 953-His foram sujeitos a fitração em gel para análise de estrutura quaternária ou fins preparativos. O peso molecular das proteínas nativas foi estimado utilizando quer colunas de FPLC Superose 12 (H/R 10/30) ou Superdex 75 de filtração em gel (Pharmacia). Os tampões utilizados para a cromatografia para 287, 919 e 24 953 foram 50 mM Tris-HCl (pH 8,0), 20 mM Bicine (pH 8,5) e 50 mM Bicine (pH 8,0), respetivamente.
Além disso, cada tampão continha NaCl 150-200 mM e glicerol 10% v/v. As proteínas foram dialisadas contra o tampão apropriado e aplicadas num volume de 200 μΐ. A filtração em gel foi realizada com uma taxa de fluxo de 0,5 2,0 ml/min e o eluato monitorizado a 280nm. Foram colecionadas e analisadas frações por SDS-PAGE. Azul dextrano 2000 e padrões de peso molecular da ribonuclease A, quimotripsina A da ovalbumina, albumina (Pharmacia) foram utilizadas para calibrar a coluna. 0 peso molecular da amostra foi estimado a partir de uma curva de calibração de Kav vs. log Mr dos padrões. Antes da filtração em gel, a 287-GST foi digerida com trombina para dividir a fração GST.
Os pesos moleculares estimados para 287, 919 e 953-His foram 73 kDa, 47 kDa e 43 kDa respetivamente. Estes resultados sugerem que a 919 é monomérica enquanto ambas 287 e 953 são principalmente diméricas na sua natureza. No caso da 953-His, foram observados dois picos durante a filtração em gel. O maior pico (80%) representou uma conformação dimérica da 953 enquanto o pico menor (20%) tinha o tamanho esperado de um monómero. Verificou-se que a forma monomérica da 953 tinha atividade bactericida superior à do dímero.
Exemplo referência 5 - vetores pSM214 e pET 24b A proteína 953 com o seu péptido líder nativo e sem parceiros de fusão foi expressa a partir do vetor pET e também a partir de pSM214 [Velati Bellini et al. (1991) J. Biotechnol. 18, 177-192]. A sequência 953 foi clonada como um gene de 25 comprimento inteiro em pSM214 utilizando a estirpe MM294-1 da E. coli como um hospedeiro. Para fazer isto, a sequência de ADN inteira do gene 953 (do ATG ao codão de terminação) foi amplificada por PCR uilizando os seguintes iniciadores:
953L for/2 CCGGAATTCTTATGAAAAAAATCATCTTCGCCGC Eco RI
953L rev/2 GCCCAAGCTTTTATTGTTTGGCTGCCTCGATT Hind III que contêm locais de restrição para a EcoRI e HindIII, respetivamente. 0 fragmento amplificado foi digerido com EcoRI e HindIII e ligado com o vetor pSM214 digerido com as mesmas duas enzimas. 0 plasmídeo ligado foi transformado em células MM294-1 da E. coli (por incubação em gelo durante 65 minutos a 37° C) e as células bacterianas colocadas em placas de agar LB contendo 20 mg/ml de cloranfenicol.
As colónias recombinantes foram crescidas durante a noite a 37 °C em 4 ml de caldo LB contendo 20 mg/ml de cloranfenicol; as células bacterianas foram centrifugadas e o plasmídeo ADN extraído como e analisado por restrição com EcoRI e HindIII. Para analisar a capacidade das colónias recombinantes de expressar a proteína, foram inoculadas em caldo LB contendo 20 mg/ml de cloranfenicol e deixadas a crescer durante 16 horas a 37°C. As células bacterianas foram centrifugadas e ressuspensas em PBS. A expressão da proteína foi analisada por SDS-PAGE e coloração com azul de Coomassie.
Os níveis de expressão foram inesperadamente altos do plasmídeo pSM214.
Oligos utilizados para clonar as sequências em vetores pSM-214 foram como se segue:
AG2 8 7 CCGGAATTCTTATG- Fwd EcoRI (pSM-214) TCGCCCGATGTTAAATCGGCGGA 26 Rev Δ2 287 (pSM-214)
Fwd
Rev Δ3 287 (pSM-214)
Fwd
Rev Δ4287 (pSM-214)
Fwd
Rev
Fwd
Orf46.1 (pSM-214;
Rev AG287-Ορφ46.1 (πΣΜ-214) 919 (pSM-214) 961L (pSM-214) 961 (pSM-214) 961c L pSM-214 961c pSM-214 953 (pSM-214)
Fwd
Rev
Fwd
Rev
Fwd
Rev
Fwd
Rev
Fwd
Rev
Fwd
Rev
Fwd
Rev
GCCCAAGCTT-TCAATCCTGCTCTTTTTTGCCG CCGGAATTCTTATG-AGCCAAGATATGGCGGCAGT GCCCAAGCTT-TCAATCCTGCTCT ΊΤΙ'1TGCCG CCGGAATTCTTATG-TCCGCCGAATCCGCAAATCA GCCCAAGCTT-TCAATCCTGCTCTTTTTTGCCG CCGGAATTCTTATG-GGAAGGGTTGATTTGGCTAATG GCCCAAGCTT-TCAATCCTGCTCTTTTTTGCCG CCGGAATTCTTATG-TCAGATTTGGCAAACGATTCTT GCCCAAGCTT- TTACGTATCATATTTCACGTGCTTC CCGGAATTCTTATG- TCGCCCGATGTTAAATCGGCGGA GCCCAAGCTT- TTACGTATCATATTTCACGTGCTTC CCGGAATTCTTATG-CAAAGCAAGAGCATCCAAACCT GCCCAAGCTT-TTACGGGCGGTATTCGGGCT CCGGAATTCATATG-AAACACTTTCCATCC . GCCCAAGCTT-TTACCACTCGTAATTGAC CCGGAATTCATATG-GCCACAAGCGACGAC GCCCAAGCTT-TTACCACTCGTAATTGAC CCGGAATTCTTATG-AAACACTTTCCATCC GCCCAAGCTT-TCAACCCACGTTGTAAGGTTG CCGGAATTCTTATG-GCCACAAACGACGACG GCCCAAGCTT-TCAACCCACGTTGTAAGGTTG CCGGAATTCTTATG-GCCACCTACAAAGTGGACGA GCCCAAGCTT-TTATTGTTTGGCTGCCTCGATT
HindIII EcoRI HindIII EcoRI HindIII
EcoRI
HindIII
EcoRI
HindIII
EcoRI
HindIII
EcoRI
HindIII EcoRI HindIII EcoRI HindIII EcoRI HindIII EcoRI HindIII EcoRI HindIII
Estas sequências foram manipuladas, clonadas e expressas como descrito para 953L. 27
Para o vetor pET-24, as sequências foram clonadas e as proteínas expressas em pET-24 como descrito a seguir para pET21. pET2 tem a mesma sequência que a pET-21, mas com a cassete de resistência à canamicina em vez da cassete de ampicilina.
Os oligonucleotideos utilizados para clonar sequências no vetor pET-24b foram: AG 287 K Fwd CGCGGATCCGCTAGC-CCCGATGTTAAATCGGC § Nhel Rev CCCGCTCGAG-TCAATCCTGCTCTITITTGCC * Xhol Δ2 287 K Fwd CGCGGATCCGCTAGC-CAAGATATGGCGGCAGT § Nhel Δ3 287 K Fwd CGCGGATCCGCTAGC-GCCGAATCCGCAAATCA § Nhel Δ4 287 K Fwd CGCGCTAGC-GGAAGGGTTGATTTGGCTAATGG § Nhel Orf 46.1 K Fwd GGGAATTCCATATG-GGCATTTCCCGCAAAATATC Nhel Rev CCCGCTCGAG-TTACGTATCATATITCACGTGC Xhol Orf46A K Fwd GGGAATTCCATATG-GGCATTTCCCGCAAAATATC Nhel Rev CCCGCTCGAG-TTATTCTATGCCTTGTGCGGCAT Xhol 961 K Fwd CGCGGATCCCATATG-GCCACAAGCGACGACGA Nhel (MC5 8) Rev CCCGCTCGAG-TTACCACTCGTAATTGAC Xhol Fwd CGCGGATCCCATATG-GCCACAAACGACG Nhel 961a K Rev CCCGCTCGAG- TCATTTAGCAATATTATCTTTGTTC Xhol 961b K Fwd CGCGGATCCCATATG-AAAGCAAACAGTGCCGAC Nhel Rev CCCGCTCGAG-TTACCACTCGTAATTGAC Xhol 961c K Fwd CGCGGATCCCATATG-GCCACAAACGACG Nhel Rev CCCGCTCGAG-TTAACCCACGTTGTAAGGT Xhol 96lcL K Fwd CGCGGATCCCATATG-ATGAAACACTTTCCATCC Nhel Rev CCCGCTCGAG-TTAACCCACGTTGTAAGGT Xhol 961d K Fwd CGCGGATCCCATATG-GCCACAAACGACG Nhel Rev CCCGCTCGAG-TCAGTCTGACACTGTTTTATCC Xhol AG 287- Fwd CGCGGATCCGCTAGC-CCCGATGTTAAATCGGC Nhel 28 919 K Rev CCCGCTCGAG-TTACGGGCGGTATTCGG Xhol AG 287- Fwd CGCGGATCCGCTAGC-CCCGATGTTAAATCGGC Nhel Orf 46.1 K Rev CCCGCTCGAG-TTACGTATCATATTTCACGTGC Xhol AG 287- Fwd CGCGGATCCGCTAGC-CCCGATGTTAAATCGGC Nhel 961 K Rev CCCGCTCGAG-TTACCACTCGTAATTGAC Xhol * Este iniciador foi utilizado como um iniciador reverso para todas as formas da 287. Os iniciadores forward utilizados em combinação com o iniciador reverso AG278 K. Exemplo 6 - ORFl e o seu péptido líder
Prevê-se que ORFl de N. meningitidis (serogrupo B, estirpe MC58) seja uma proteína da membrana exterior ou secretada. Tem a sequência seguinte: 1 MKTTPKRTTE THRKAPKTGR IRFSPAYLAI CLSFGILPQA WAGHTYFGIN 51 YQYYRDFAEN KGKFAVGAKD IEVYNKKGEL VGKSMTKAPM IDFSVVSRNG 101 VAALVGDQYI VSVAHNGGYN NVDFGAEGRN PDQHRFTYKI VKRNNYKAGT 151 KGHPYGGDYH MPRLHKFVTD AEPVEMTSYM DGRKYIDQNN YPDRVRIGAG 201 RQYWRSDEDE PNNRESSYHI ASAYSWLVGG NTFAQNGSGG GTVNLGSEKI 251 KHSPYGFLPT GGSFGDSGSP MFIYDAQKQK WLINGVLQTG NPYIGKSNGF 301 QLVRKDWFYD EIFAGDTHSV FYEPRQNGKY SFNDDNNGTG KINAKHEHNS 351 LPNRLKTRTV QLFNVSLSET AREPVYHAAG GVNSYRPRLN NGENISFIDE 401 GKGELILTSN INQGAGGLYF QGDFTVSPEN NETWQGAGVH ISEDSTVTWK 451 VNGVANDRLS KIGKGTLHVQ AKGENQGSIS VGDGTVILDQ QADDKGKKQA 501 FSEIGLVSGR GTVQLNADNQ FNPDKLYFGF RGGRLDLNGH SLSFHRIQNT 551 DEGAMIVNHN QDKESTVTIT GNKDIATTGN NNSLDSKKEI AYNGWFGEKD 601 TTKTNGRLNL VYQPAAEDRT LLLSGGTNLN GNITQTNGKL FFSGRPTPHA 651 YNHLNDHWSQ KEGIPRGEIV WDNDWINRTF KAENFQIKGG QAVVSRNVAK 701 VKGDWHLSNH AQAVFGVAPH QSHTICTRSD WTGLTNCVEK TITDDKVIAS 751 LTKTDISGNV DLADHAHLNL TGLATLNGNL SANGDTRYTV SHNATQNGNL 801 SLVGNAQATF NQATLNGNTS ASGNASFNLS DHAVQNGSLT LSGNAKANVS 851 HSALNGNVSL ADKAVFHFES SRFTGQISGG KDTALHLKDS EWTLPSGTEL 901 GNLNLDNATI TLNSAYRHDA AGAQTGSATD APRRRSRRSR RSLLSVTPPT 951 SVESRFNTtT VNGKLNGQGT FRFMSELFGY RSDKLKLAES SEGTYTLAVN 1001 NTGNEPASLE QLTWEGKDN KPLSENLNFT LQNEHVDAGA WRYQLIRKDG 1051 EFRLHNPVKE QELSDKLGKA EAKKQAEKDN AQSLDALIAA GRDAVEKTES 1101 VAEPARQAGG ENVGIMQAEE EKKRVQADKD TALAKQREAE TRPATTAFPR 1151 ARRARRDLPQ LQPQPQPQPQ RDLISRYANS GLSEFSATLN SVFAVQDELD 1201 RVFAEDRRNA VWTSGIRDTK HYRSQDFRAY RQQTDLRQIG MQKNLGSGRV 1251 GILFSHNRTE NTFDDGIGNS ARLAHGAVFG QYGIDRFYIG ISAGAGFSSG 1301 SLSDGIGGKI RRRVLHYGIQ ARYRAGFGGF GIEPHIGATR YFVQKADYRY 1351 ENVNIATPGL AFNRYRAGIK ADYSFKPAQH ISITPYLSLS YTDAASGKVR 1401 TRVNTAVLAQ DFGKTRSAEW GVNAEIKGFT LSLHAAAAKG PQLEAQHSAG .1451 IKLGYRW* 29 0 péptido líder está sublinhado.
Uma forma polimórfica da 0RF1 é revelada no documento W099/558 73.
Três estratégias de expressão foram utilizadas para ORF 1: 1) 0RF1 utilizando um rótulo His, seguindo o documento W099/24578 (ORFl-His); 2) 0RF1 com o seu próprio péptido líder mas sem qualquer parceiro de fusão ('0RF1L'); e 3) 0RF1 com o péptido líder (MKKTAIAIAVALAGFATVAQA) da OmpA de E. coli ('OrfILOmpA'):
MKKTAIAIAVALAGFATVAQAASAGHTYFGINYQYYRDFAENKGKFAVGAKDIEVYNKKGELVGKSMTKAPMIDFSV vsrngvaalvgdqyivsvahnggynnvdfgaegrnpdqhrftykivkrnnykagtkghpyggdyhmprlhkfvtdae PVEMTSYMPGRKYIDQNNYPDRVRIGAGRQYWRSDEDEPNNRESSYHIASAYSWLVGGNTFAQNGSGGGTVNLGSEK IKHSPYGFLPTGGSFGDSGSPMFIYDAQKQKWLINGVLQTGNPYIGKSNGFQLVRKDWFYDEIFAGDTHSVFYEPRQ NGKYSFNDDNNGTGKINAKREHNSLPNRLKTRTVQLFNVSLSETAREPVYHAAGGVNSYRPRLNNGENISFIDEGKG ELILTSNINQGAGGLYFQGDFTVSPENNETWQGAGVHISEDSTVTWKVNGVANDRLSKIGKGTLHVQAKGENQGSIS VGDGTVILDQQADDKGKKQAFSEIGLVSGRGTVQLNADNQFNPDKLYFGFRGGRLDLNGHSLSFHRIQNTDEGAMIV NHNQDKESTVTITGNKDIATTGNNNSLDSKKEIAYNGWFGEKDTTKTNGRLNLVYQPAAEDRTLLLSGGTNLNGNIT QTNGKLFFSGRPTPHAYNHLNDHWSQKEGIPRGEIVWDNDWINRTFKAENFQIKGGQAWSRNVAKVKGDWHLSNHA QAVFGVAPHQSHTICTRSDWTGLTNCVEKTITDDKVIASLTKTDISGNVDLADHAHLNLTGLATLNGNLSANGDTRY TVSHNATQNGNLSLVGNAQATFNQATLNGNTSASGNASFNLSDHAVQNGSLTLSGNAKANVSHSALNGNVSLADKAV FHFESSRFTGQISGGKDTALHLKDSEWTLPSGTELGNLNLDNATITLNSAYRHDAAGAQTGSATDAPRRRSRRSRRS LLSVTPPTSVESRFNTLTVNGKLNGQGTFRFMSELFGYRSDKLKLAESSEGTYTLAVNNTGNEPASLEQLTVVEGKD NKPLSENLNFTLQNEHVDAGAWRYQLIRKDGEFRLHNPVKEQELSDKLGKAEAKKQAEKDNAQSLDALIAAGRDAVE KTESVAEPARQAGGENVGIMQAEEEKKRVQADKDTALAKQREAETRPATTAFPRARRARRDLPQLQPQPQPQPQRDL isryansglsefsatlnsvfavqdeldrvfaedrrnavwtsgirdtkhyrsqdfrayrqqtdlrqigmqknlgsgrv GILFSHNRTENTFDDGIGNSARLAHGAVFGQYGIDRFYIGISAGAGFSSGSLSDGIGGKIRRRVLHYGIQARYRAGF GGFGIEPHIGATRYFVQKADYRYENVNIATPGLAFNRYRAGIKADYSFKPAQHISITPYLSLSYTDAASGKVRTRVN TAVLAQDFGKTRSAEWGVNAEIKG FTL SLHAAAAKGPQLEAQH SAGIKLGYRW *
Para fazer esta construção, o clone pET911L0mpA (ver em baixo) foi digerido com as enzimas de restrição Nhel e Xhol e o fragmento correspondendo ao vetor que carrega a sequência líder OmpA foi purificado (pETLOmpA) . 0 gene da 0RF1 que codifica a proteína madura foi amplificado utilizando os oligonucleotídeos ORFl-For e ORFl-Rev (incluindo os locais de restrição da Nhel e Xhol, respetivamente), digeridos com Nhel e Xhol e ligados ao fragmento pETOmpA purificado (ver Figura 1). Um dipéptido 30 AS adicional foi introduzido pelo local da Nhel.
Todas as três formas da proteina foram expressas. A proteína rotulada com His poderia ser purificada e foi confirmada como exposta à superfície, e possivelmente secretada (ver Figura 3). A proteína foi utilizada para imunizar ratinhos, e os soros resultantes deram excelentes resultados no ensaio bactericida. ORFILOmpA foi purificada como membranas totais, e foi localizada em ambas membranas interior e exterior. Inesperadamente, os soros criados contra ORFILOmpA mostram ELISA e propriedades anti-bactericidas ainda melhores do que aqueles criados contra a proteína rotulada com His. ORF1L foi purificada como membranas exteriores, onde está localizada.
Exemplo Referência 7- proteína 911 e o seu péptido líder A proteina 911 da N. meningitidis (serogrupo B, estirpe MC58) tem a sequência seguinte: 1 MKKNILEFWV GLFVLIGAAA VAFLAFRVAG GAAFGGSDKT YAVYADFGDI 51 GGLKVNAPVK SAGVLVGRVG AIGLDPKSYQ ARVRLDLDGK YQFSSDVSAQ 101 ILTSGLLGEQ YIGLQQGGDT ENLAAGDTIS VTSSAMVLEN LIGKFMTSFA 151 EKNADGGNAE KAAE* O péptido líder está sublinhado.
Três estratégias de expressão foram utilizadas para 911: 1) 911 com o seu próprio péptido líder mas sem qualquer parceiro de fusão ('911L'); 2) 911 com o péptido líder da OmpA de E. coli ('911LOmpA'). Para fazer esta construção, a sequência inteira que codifica o péptido líder OmpA foi incluída no iniciador 5' como uma cauda (iniciador 911L0mpA Forward). Um local de restrição da Nhel foi inserido entre a sequência que codifica o péptido líder OmpA e o gene 911 que codifica a 31 proteína madura prevista (inserção de um aminoácido, uma serina), para permitir a utilização desta construção para clonar diferentes genes em sentido descendente a partir da sequência do péptido líder OmpA.
3) 911 com o péptido líder (MKYLLPTAAAGLLLAAQPAMA) da PelB da Erwinia carotovora ('91lLpelB').
Para fazer esta construção, o iniciador de PCR da extremidade 5' foi desenhado em sentido descendente da sequência líder e incluído o local de restrição da Ncol de maneira a ter 911 fundida diretamente com a sequência líder da PelB; o iniciador da extremidade 3' incluiu o codão de terminação. 0 vetor de expressão utilizado foi pET22b+ (Novagen), que transporta a sequência codificadora do péptido líder PelB. 0 local da Ncol introduz uma metionina adicional depois da sequência PelB.
Todas as três formas da proteína foram expressas. Os títulos de ELISA foram mais altos utilizando 911 L, com 919LOmpA a dar também bons resultados.
Exemplo Referência 8 - ORF46 A proteína ORF46 completa da N. meningitidis (serogrupo B, estirpe 2996) tem a sequência seguinte: 1 LGISRKISLI LSILAVCLPM HAHASDLAND SFIRQVLDRQ HFEPDGKYHL 51 FGSRGELAER SGHIGLGKIQ SHQLGNLMIQ QAAIKGNIGY IVRFSDHGHE 101 VHSPFDNHAS HSDSDEAGSP VDGFSLYRIH WDGYEHHPAD GYDGPQGGGY 151 PAPKGARDIY SYDIKGVAQN IRLNLTDNRS TGQRLADRFH NAGSMLTQGV 201 GDGFKRATRY SPELDRSGNA AEAFNGTADI VKNI1GAAGE IVGAGDAVQG 251 ISEGSNIAVM HGLGLLSTEN KMARINDLAD MAQLKDYAAA AIRDWAVQNP 301 NAAQGIEAVS NIFMAAIPIK GIGAVRGKYG LGGITAHPIK RSQMGAIALP 351 KGKSAVSDNF ADAAYAKYPS PYHSRNIRSN LEQRYGKENI TSSTVPPSNG 401 KNVKLADQRH PKTGVPFDGK GFPNFEKHVK YDTKLD1QEL SGGGIPKAKP 451 VSDAKPRWEV DRKLNKLTTR EQVEKNVQEI RNGNKNSNFS QHAQLEREIN 501 KLKSADEINF ADGMGKFTDS MNDKAFSRLV KSVKENGFTN PWEYVEING 551 KAYIVRGNNR VFAAEYLGRI HELKFKKVDF PVPNTSWKNP TDVLNESGNV 601 KRPRYRSK*· 0 péptido líder está sublinhado.
As sequências de ORF46 de outras estirpes podem ser 32 encontradas no documento WOOO/66741.
Três estratégias de expressão foram utilizadas para ORF46: 1) ORF46 com o seu próprio péptido líder mas sem qualquer parceiro de fusão ('ORF46-2L'); 2) ORF46 sem o seu péptido líder e sem qualquer parceiro de fusão ('ORF46-2') , com o péptido líder omitido desenhando o iniciador de amplificação da extremidade 5' em sentido descendente a partir da sequência líder prevista: 1 SDLANDSFIR QVLDRQHFEP DGKYHLFGSR GELAERSGHI GLGKIQSHQL 51 GNLMIQQAAI KGNIGYIVRF SDHGHEVHSP FDNHASHSDS DEAGSPVDGF 101 SLYRIHWDGY EHHPADGYDG PQGGGYPAPK GARDIYSYDI KGVAQNIRLN 151 LTDNRSTGQR LADRFHNAGS MLTQGVGDGF KRATRYSPEL DRSGNAAEAF 201 NGTADIVKNI IGAAGEIVGA GDAVQGISEG SNIAVMHGLG LLSTENKMAR 251 INDLADMAQL KDYAAAAIRD WAVQNPNAAQ GIEAVSNIFM AAIPIKGIGA 301 VRGKYGLGGI TAHPIKRSQM GAIALPKGKS AVSDNFADAA YAKYPSPYHS 351 RNIRSNLEQR YGKENITSST VPPSNGKNVK LADQRHPKTG VPFDGKGFPN 401 FEKHVKYDTK LDIQELSGGG IPKAKPVSDA KPRWEVDRKL NKLTTREQVE 451 KNVQEIRNGN KNSNFSQHAQ LEREINKLKS ADEINFADGM GKFTDSMNDK 501 AFSRLVKSVK ENGFTNPWE YVEINGKAYI VRGNNRVFAA EYLGRIHELK 551 FKKVDFPVPN TSWKNPTDVL NESGNVKRPR YRSK* 3) ORF46 como uma proteína truncada, consistindo dos primeiros 433 aminoácidos ('ORF46.1L'), construída desenhando os iniciadores da PCR para amplificar uma sequência parcial correspondendo aos aminoácidos 1-433.
Um codão de terminação foi incluído nas sequências do iniciador da extremidade 3'. ORF46-2L é expressa em muito baixo nível de E. coli. A remoção do seu péptido líder (ORF46-2) não resolve este problema. A forma truncada de ORF46.1L (primeiros 433 aminoácidos, que estão bem conservados entre serogrupos e espécies), contudo, está bem expressa e dá excelentes resultados no teste de ELISA e no ensaio bactericida. ORF46.1 também tem sido utilizada como a base de proteínas híbridas. Tem sido fundida com 287, 919, e ORF1. 33
As proteínas híbridas foram geralmente insolúveis, mas deram alguns bons resultados nos testes ELISA e bactericida (contra a estirpe 2996 homóloga):
Proteína ELISA Ac Bactericida Orfl-Orf46.1-His 850 256 919-Orf46.1-His 12900 512 919-287-Orf46-His n. d. n. d. Orf46.1-287HÍS 150 8192 Orf46.l-919His 2800 2048 Orf46.1-2 8 7-919His 3200 16384
Para comparação, híbridos 'triplos'' de ORF46.1, 287 (tanto como uma fusão GST, ou na forma AG287) e 919 foram construídos e testados contra várias estirpes (incluindo a estirpe 2996 homóloga) versus uma mistura simples dos três antígenos. FCA foi utilizado como adjuvante: 2996 BZ232 MC58 NGH38 F6124 BZ133 Mistura 8192 256 512 1024 >2048 >2048 ORF46.1-287-919his 16384 256 4096 8192 8192 8192 AG287—919— ORF46.lhis 8192 64 4096 8192 8192 16384 AG287-ORF46.1- 919his 4096 128 256 8192 512 1024 34
De novo, os híbridos mostram atividade imunológica equivalente ou superior. Híbridos de duas proteínas (estirpe 2996) foram comparados com as proteínas individuais contra várias estirpes heterólogas:
1000 MC58 F6124 (MenA) ORF46.1-His <4 4096 <4 ORFl-His 8 256 128 ORF1-ORF46.1- 1024 512 1024 HÍS
De novo, o híbrido mostra atividade imunológica equivalente ou superior.
Exemplo Referência 9 - proteína 961 A proteína 961 completa da N. meningitidis (serogrupo B, estirpe MC58) tem a sequência seguinte: 1 MSMKHFPAKV LTTAILATFC 5GALAAT5DD DVKKAATVAI VAAYNNGQEI 51 NGFKAGETIY DIGEDGTITQ KDATAADVEA DDFKGLGLKK WTNLTKTVN 101 ENKQNVDAKV KAAESEIEKL TTKLADTDAA LADTDAALDE TTNALNKLGE 151 NITTFAEETK TNIVKIDEKL EAVADTVDKH AEAFNDIADS LDETNTKADE 201 AVKTANEAKQ TAEETKQNVD AKVKAAETAA GKAEAAAGTA NTAADKAEAV 251 AAKVTDIKAD IATNKADIAK NSARIDSLDK NVANLRKETR QGLAEQAALS 301 GLFQPYNVGR FNVTAAVGGY KSESAVAIGT GFRFTENFAA KAGVAVGTSS 351 GSSAAYHVGV NYEW* O péptido líder está sublinhado.
Foram utilizadas três abordagens à expressão de 961: 1) 961 utilizando uma fusão GST, seguindo o documento WO99/57280 ('GST961'); 2) 961 com o seu próprio péptido líder mas sem qualquer parceiro de fusão ('961L'); e 3) 961 sem o seu péptido lider e sem qualquer parceiro de fusão ( ' 96idesmarcado, ^ com Q péptido líder omitido desenhando o iniciador de PCR da extremidade 5' em sentido 35 descendente a partir da sequência lider prevista.
Todas as três formas da proteína foram expressas. A proteína de fusão GST poderia ser purificada e os anticorpos contra ela confirmaram que a 961 está exposta à superfície (Figura 4). A proteína foi utilizada para imunizar ratinhos, e os soros resultantes deram excelentes resultados no ensaio bactericida. 961L também poderia ser purificada e deu títulos de ELISA muito elevados. A proteína 961 parece ser variável em função da fase. Além disso, não é encontrada em todas as estirpes de N. meningitidis.
Exemplo 10 - proteína 287 A proteína 287 da N. meningitidis (serogrupo B, estirpe 2996) tem a sequência seguinte:
1 MFERSVIAMA CIFALSACGG GGGGSPDVKS ADTLSKPAAP WAEKETEVK 51 EDAPQAGSQG QGAPSTQGSQ DMAAVSAENT GNGGAATTDK PKNEDEGPQN 101 DMPQNSAESA NQTGNNQPAD SSDSAPASNP APANGGSNFG RVDLANGVLI 151 DGPSQNITLT HCKGDSCNGD NLLDEEAPSK SEFENLNESE RIEKYKKDGK 201 SDKFTNLVAT AVQANGTNKY VIIYKDKSAS SSSARFRRSA RSRRSLPAEM 251 PLIPVNQADT LIVDGEAVSL TGHSGNIFAP EGNYRYLTYG AEKLPGGSYA 301 LRVQGEPAKG EMLAGTAVYN GEVLHFHTEN GRPYPTRGRF AAKVDFGSKS 351 VDGIIDSGDD LHMGTQKFKA AIDGNGFKGT WTENGGGDVS GRFYGPAGEE 401 VAGKYSYRPT DAEKGGFGVF AGKKEQD* 0 péptido líder é mostrado sublinhado.
As sequências de 287 de outras estirpes podem ser encontradas nas Figuras 5 e 15 do documento WOOO/66741. O Exemplo 9 do documento WO99/57280 revela a expressão da 287 com uma fusão GST na E. coli.
Um número de abordagens adicionais à expressão da 287 em E. coli foi utilizado, incluindo: 1) 287 como uma fusão rotulada com His ('287-His'); 36 2) 287 com o seu próprio péptido líder mas sem qualquer parceiro de fusão ('287L'); 3) 287 com o péptido líder da 0RF4 e sem qualquer parceiro de fusão ( ' 287L0rf4'); e 4) 287 sem o seu péptido líder e sem qualquer parceiro de fusão ('287 ): 1 CGGGGGGSPD VKSADTLSKP AAPWAEKET EVKEDAPQAG SQGQGAPSTQ 51 GSQDMAAVSA ENTGNGGAAT TDKPKNEDEG PQNDMPQNSA ESANQTGNNQ 101 PADSSDSAPA SNPAPANGGS NFGRVDLANG VL1DGPSQNI TLTHCKGDSC 151 NGDNLLDEEA PSKSEFENLN ESERIEKYKK DGKSDKFTNL VATAVQANGT 201 NKYVIIYKDK SASSSSARFR RSARSRRSLP AEMPLIPVNQ ADTLIVDGEA 251 VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP AKGEMLAGTA 301 VYNGEVLHFH TENGRPYPTR GRFAAKVOFG SKSVDGIIDS GDDLHMGTQK 351 FKAAIDGNGF KGTWTENGGG DVSGRFYGPA GEEVAGKYSY RPTDAEKGGF 401 GVFAGKKEQD *
Todas estas proteínas poderiam ser expressas e purificadas. '287L' e ,287LOrf4' foram confirmadas como lipoproteínas.
Como mostrado na Figura 2, '287LOrf4' foi construído digerindo 919LOrf4 com Nhel e Xhol. O péptido líder da ORF4 inteiro foi restaurado por adição de uma sequência de ADN que codifica os aminoácidos em falta, como uma cauda, no iniciador da extremidade 5' (287LOrf4 for), fundida com a sequência que codifica a 287. 0 gene da 287 que codifica a proteína madura foi amplificado utilizando os oligonucleotídeos 287LOrf4 For e Rev (incluindo os locais da Nhel e Xhol, respetivamente), digeridos com Nhel e Xhol e ligados ao fragmento pET0rf4 purificado.
Exemplo Referência 11 - mais proteínas de não fusão com/sem péptidos líderes nativos
Uma abordagem semelhante foi adotada para a expressão de E. coli de mais proteínas dos documentos W099/24578, 37 W099/36544 e WO99/57280.
As seguintes foram expressas sem um parceiro de fusão: 008, 105, 117-1, 121-1, 122-1, 128-1, 148, 216, 243, 308, 593, 652, 726, 982, e Orfl43-l. A proteína 117-1 foi confirmada como exposta à superfície por FACS e deu altos títulos de ELISA.
As seguintes foram expressas com o péptido líder nativo mas sem um parceiro de fusão: 111, 149, 206, 225-1, 235, 247-1, 274, 283, 286, 292, 401, 406, 502-1, 503, 519- 1, 525-1, 552, 556, 557, 570, 576-1, 580, 583, 664, 759, 907, 913, 920-1, 926, 936-1, 953, 961, 983, 989, 0rf4,
Orf7-l, Orf9-l, Orf23, Orf25, Orf37, Orf38, Orf40, Orf40.1, Orf40.2, Orf72-1, Orf76-l, Orf85-2, Orf91, Orf97-l, Orfll9, Orf143.1. A estas proteínas é-lhes atribuído o sufixo 'L'. A proteína 760 rotulada com His foi expressa com e sem o seu péptido líder. A deleção do péptido sinal aumentou grandemente os níveis de expressão. A proteína poderia ser purificada mais facilmente utilizando ureia 2M para solubilização. A proteína 264 rotulada com His foi bem expressa utilizando o seu próprio péptido sinal, e a proteína 30kDa deu resultados positivos no Western blot.
Todas as proteínas foram expressas com sucesso. A localização de 593, 121-1, 128-1, 593, 726, e 982 no citoplasma foi confirmada. A localização de 920-1L, 953L, ORF9-1L, ORF85-2L, ORF97-1L, 570L, 580L e 664L no periplasma foi confirmada. A localização de ORF40L na membrana exterior, e 008 e 519-1L na membrana interior foi confirmada. ORF25L, ORF4L, 406L, 576-1L foram todas confirmadas como estando localizadas na membrana. 38
Verificou-se que a proteína 206 não é uma lipoproteína. ORF25 e ORF40 expressas com os seus péptidos líderes nativos mas sem parceiros de fusão, e a proteína 593 expressa sem o seu péptido líder nativo e sem um parceiro de fusão, criaram bons soros anti-bactericidas. Surpreendentemente, as formas da ORF25 e ORF40 expressas sem parceiros de fusão e utilizando os seus próprios péptidos líderes (isto é, ,ORF25L' e ORF40L') deram melhores resultados no ensaio bactericida do que as proteínas de fusão.
As proteínas 920L e 953L foram sujeitas a sequenciação do terminal N, dando HRVWVETAH e ATYKVDEY-HANARFAF, respetivamente. Esta sequenciação confirma que os péptidos líderes previstos foram divididos e, quando combinados com a localização periplásmica, confirma que as proteínas são processadas corretamente e localizadas por E. coli quando expressas a partir dos seus péptidos líderes nativos. A sequência N-terminal da proteína 519.1L localizada na membrana interior foi MEFFIILLA, indicando que a sequência líder não é fracionada. Pode, assim, funcionar tanto como uma sequência líder não fracionada e uma âncora transmembranar de uma maneira semelhante ao péptido líder da PBP1 da N. gonorrhoeae [Ropp & Nicholas (1997) J. Bact. 179:2783-2787.]. De facto, a região N-terminal exibe um forte caráter hidrofóbico e é previsto pelo Program Tmpred. como sendo transmembranar.
Exemplo Referência 12 - lipoproteínas A incorporação de palmitato em lipoproteínas recombinantes foi demonstrada pelo método de Kraft et al. [J. Bact. (1998) 180:3441-3447.]. As colónias únicas que 39 albergam o plasmídeo de interesse foram crescidas durante a noite a 37°C em 20 ml de cultura líquida LB/Amp (100 mg/ml) . A cultura foi diluída para um OD55o de 0,1 em 5,0 ml de meio fresco LB/Amp contendo 5 mC/ml de [3H] palmitato (Amersham) . Quando o OD550 da cultura atingiu 0,4-0,8, a lipoproteína recombinante foi induzida durante 1 hora com IPTG (concentração final 1,0 mM). As bactérias foram colhidas por centrifugação numa centrífuga de bancada de alta velocidade a 2700 g durante 15 min e lavadas duas vezes com 1,0 ml de PBS frio. As células foram ressuspensas em 120 ml de Tris-HCl 20 mM (pH 8,0), EDTA 1 mM, SDS 1,0% p/v e lisadas fervendo durante 10 min. Depois da centrifugação a 13000 g durante 10 min o sobrenadante foi recolhido e as proteínas precipitadas por adição de 1,2 ml de acetona fria e deixado durante 1 hora a -20 °C. A proteína foi tornada em bolas por centrifugação a 13000 g durante 10 min e ressuspensa em 20-50 μΐ (calculados para padronizar a carga com respeito ao OD final da cultura) de SDS 1,0% p/v. Uma aliquota de 15 μΐ foi fervida com 5 μΐ de tampão de amostra SDS-PAGE e analisada por SDS-PAGE. Depois dos géis de eletroforese serem fixados durante 1 hora em ácido acético 10% v/v e encharcados durante 30 minutos em solução Amplify (Amersham) . O gel foi seco a vácuo sob calor e exposto a Hyperfilm (Kodak) durante a noite a -80 °C. A incorporação do rótulo [3H] palmitato, confirmando a lipidação, foi encontrada para as seguintes proteínas: Orf4L, Orf25L, 287L, 287LOrf4, 406.L, 576L, 926L, 919L e 919LOrf4 .
Exemplo 13 - domínios em 287
Com base na homologia de diferentes regiões da 287 40 para proteínas que pertencem a diferentes classes funcionais, foi dividido em três 'domínios', como mostrado na Figura 5. O segundo domínio mostra homologia com proteases IgA, e o terceiro domínio mostra homologia com proteínas de ligação da transferrina.
Cada um dos três 'domínios' mostra um grau diferente de conservação de sequência entre estirpes de N. meningitidis - o domínio C é 98% idêntico, o domínio A é 83% idêntico, enquanto o domínio B é apenas 71% idêntico. Notar que a proteína 287 na estirpe MC58 é mais longa 61 aminoácidos do que a da estirpe 2996. Um alinhamento das duas sequências é mostrado na Figura 7, e alinhamentos para várias estirpes são revelados no documento WOOO/66741 (ver Figuras 5 e 15 nesse documento).
Os três domínios foram expressos individualmente como proteínas C-terminal rotuladas com His. Isto foi feito para as estirpes MC58 e 2996, utilizando as seguintes construções: 287a-MC58 (aminoácidos 1-202), 287b-MC58 (aminoácidos 203- 288), 287c-MC58 (aminoácidos 311-488). 287a-2996 (aminoácidos 1-139), 287b-2996 (aminoácidos 140- 225), 287c-2996 (aminoácidos 250-427).
Para fazer estas construções, a sequência do codão de terminação foi omitida na sequência do iniciador da extremidade 3'. Os iniciadores 5' incluíram o local de restrição da Nhel, e os iniciadors 3' incluíram uma Xhol como uma cauda, de maneira a dirigir a clonagem de cada fragmento amplificado no vetor de expressão pET21b+ utilizando locais de restrição da Ndel-Xhol, Nhel-Xhol ou Ndel-Hindlll.
Todas as seis construções poderiam ser expressas, mas 41 287b-MC8 requereu desnaturação e redobragem para solubilização. A deleção do domínio A está descrita a seguir ('Δ4 287-His ') .
Dados imunológicos (ensaio bactericida do soro) foram também obtidos utilizando os vários domínios da estirpe 2996, contra estirpes MenB homólogas e heterólogas, bem como MenA (estirpe F6124) e MenC (estirpe BZ133): 2996 BZ232 MC58 NGH38 394/98 MenA MenC 287—His 32000 16 4096 4096 512 8000 16000 287(B)-His 256 - - - - 16 - 287 (O-His 256 - 32 512 32 2048 >2048 287(B-C)—His 64000 128 4096 64000 1024 64000 32000
Utilizando os domínios da estirpe MC58, foram obtidos os seguintes resultados: MC58 2996 BZ232 NGH38 394/98 MenA MenC 287-His 4096 32000 16 4096 512 8000 16000 287 (B)-His 128 128 - - - - 128 287 (O-His 16 - 1024 - 512 - 287(B-C)-His 16000 64000 128 64000 512 64000 >8000
Exemplo 14 - deleções em 287
Além de expressar domínios individuais, a 287 também foi expressa (como uma proteína C-terminal rotulada com His) fazendo deleções progressivas dentro do primeiro domínio. 42
Quatro mutantes de deleção da proteína 287 da estirpe 2996 foram utilizados (Figura 6): 1) '287-His', consistindo nos aminoácidos 18-427 (isto é, péptido líder deletado); 2) 'Δ1 287-His', consistindo nos aminoácidos 26-427; 3) 'Δ2 287-His', consistindo nos aminoácidos 70-427; 4) 'Δ3 287-His', consistindo nos aminoácidos 107-427; e 5) 'Δ4 287-His', consistindo nos aminoácidos 140-427 (=287- bc) . A proteína 'Δ4' também foi feita para a estirpe MC58 ('Δ4 287MC58-His'; aminoácidos 203-488).
As construções foram feitas da mesma maneira que 287a/b/c, como descrito anteriormente.
Todas as seis construções poderiam ser expressas e a proteína poderia ser purificada. A expressão da 287-His foi, contudo, bastante fraca. A expressão foi também alta quando os rótulos com His do C-terminal foram omitidos.
Dados imunológicos (ensaio bactericida do soro) foram também obtidos utilizando os mutantes de deleção, contra as estirpes MenB homólogas (2996) e heterólogas, bem como MenA (estirpe F6124) e MenC (estirpe BZ133) 2996 BZ232 MC58 MGH38 394/98 MenA MenC 287-his 32000 16 4096 4096 512 8000 16000 Δ1 287-His 16000 128 4096 4096 1024 8000 16000 Δ2 287-His 16000 128 4096 >2048 512 16000 >8000 Δ3 287-His 16000 128 4096 >2048 512 16000 >8000 Δ4 287- 64000 128 4096 64000 1024 64000 32000 43
His A mesma atividade elevada para a deleçao de Δ4 foi observada utilizando a sequência da estirpe MC58.
Além de mostrar caracteristicas de expressão superiores, portanto, os mutantes são imunologicamente equivalentes ou superiores.
Exemplo 15 - deleções de poliglicina A construção 'Δ1 287-His' do exemplo anterior difere da 2 8 7-His e do ' 2 8 7desmarcado' apenas por uma curta deleção no terminal N (GGGGGGS). Utilizando um vetor de expressão que substitui a serina deletada com um codão presente no local de clonagem da Nhe, contudo, isto implica numa deleção apenas de (Gly)6· Assim, verificou-se que a deleção desta sequência (Gly)6 tinha um efeito dramático na expressão proteica. A proteína que não tem aminoácidos no terminal N até GGGGGG é designada 'AG 287 ' . Na estirpe MC58, a sua ( LG2B1 1 MFKRSVIAMA CIFALSACGG GGGGSPDVKS ADTLSKPAAP WSEKETEAK 51 EDAPQAGSQG QGAPSAQGSQ DMAAVSEENT GNGGAVTADN PKNEDEVAQN 101 DMPQNAAGTD SSTPNHTPDP NMLAGNMENQ ATDAGESSQP ANQPDMANAA 151 DGMQGDDPSA GGQNAGNTAA QGANQAGNNQ AAGSSDPIPA SNPAPANGGS 201 NFGRVDLANG VLIDGPSQNI TLTHCKGDSC SGNNFLDEEV QLKSEFEKLS 251 DADKISNYKK DGKNDKFVGL VADSVQMKGI NQYIIFYKPK PTSFARFRRS 301 ARSRRSLPAE MPLIPVNQAD TLIVDGEAVS LTGHSGNIFA PEGNYRYLTY 351. GAEKLPGGSY ALRVQGEPAK GEMLAGAAVY NGEVLHFHTE NGRPYPTRGR 401 FAAKVDFGSK SVDGIIDSGD DLHMGTQKFK AAIDGNGFKG TWTENGSGDV 451 SGKFYGPAGE EVAGKYSYRP TDAEKGGFGV FAGKKEQD* sequência (péptido líder sublinhado) é: AG287, com ou sem rótulo His ('AG287-His' e 'AG287K', respetivamente) , são expressos em níveis muito bons em comparação com ' 2 8 7-His ' ou ' 2 8 7desmarcado ' m
Na base dos dados de variabilidade dos genes, as variantes de AG287-His foram expressas em E. coli de um número de estirpes MenB, em particular de estirpes 2996, 44 MC58, 1000, e BZ232. Os resultados também foram bons.
Foi colocado por hipótese que a deleção de poli-Gly pode ser uma estratégia geral para melhorar a expressão. Outras lipoproteinas MenB contendo motivos (Gly)n semelhantes (próximo do terminal N, no sentido descendente de uma cisteina) foram portanto identificados, nomeadamente Tbp2 (NMB0460), 741 (NMB 1870) e 983 (NMB 1969): TBP2 ( AGTbp2
1 MNNPLVNQAA MVLPVFLLSA CLGGGGSFDL DSVDTEAPRP APKYQDVFSE 51 KPQAQKDQGG YGFAMRLKRR NWYPQAKEDE VKLDESDWEA TGLPDEPKEL 101 PKRQKSVIEK VETDSDNNIY SSPYLKPSNH QNGNTGNGIN QPKNQAKDYE 151 NFKYVYSGWF YKHAKREFNL KVEPKSAKNG DDGYIFYHGK EPSRQLPASG 201 KITYKGVWHF ATDTKKGQKF REIIQPSKSQ GDRYSGFSGD DGEEYSNKNK 251 STLTDGQEGY GFTSNLEVDF HNKKLTGKLI RNNANTDNNQ ATTTQYYSLE 301 AQVTGNRFNG KATATDKPQQ NSETKEHPFV SDSSSLSGGF FGPQGEELGF 351 RFLSDDQKVA VVGSAKTKDK PANGNTAAAS GGTDAAASNG AAGTSSENGK 401 LTTVLDAVEL KLGDKEVQKL DNFSNAAQLV VDGIMIPLLP EASESGNNQA 45 451 NQGTNGGTAF TRKFDHTPES DKKDAQAGTQ TNGAQTASNT AGDTNGKTKT 501 YEVEVCCSNL NYLKYGMLTR KNSKSAMQAG ESSSQADAKT EQVEQSMFLQ 551 GERTDEKEIP SEQNIVYRGS WYGYIANDKS TSWSGNASNA TSGNRAEFTV 601 NFADKKITGT LTADNRQEAT FTIDGNIKDN.GFEGTAKTAE SGFDLDQSNT 651 TRTPKAYITD AKVQGGEYGP KAEELGGWFA YPGDKQTKNA TNASGNSSAT 701 WFGAKRQQP VR* 741 ( AG741
1 VNRTAFCCLS LTTALILTAC SSGGGGVAAD IGAGLADALT APLDHKDKGL 51 QSLTLDQSVR KNEKLKLAAQ GAEKTYGNGD SLNTGKLKND KVSRFDFIRQ 101 IEVDGQLITL ESGEFQVYKQ SHSALTAFQT EQIQDSEHSG KMVAKRQFRI
151 GDIAGEHTSF DKLPEGGRAT YRGTAFGSDD AGGKLTYTID FAAKQGNGKI
201 EHLKSPELNV DLAAADIKPD GKRHAVISGS VLYNQAEKGS YSLGIFGGKA 251 QEVAGSAEVK TVNGIRHIGL AAKQ* 983 ( AG983 1 MRTTPTFPTK TFKPTAMALA VATTLSACLG GGGGGTSAPD FNAGGTGIGS 51 NSRATTAKSA AVSYAGIKNE MCKDRSMLCA GRDDVAVTDR DAKINAPPPN 101 LHTGDFPNPN DAYKNLINLK PAIEAGYTGR GVEVGIVDTG ESVGSISFPE 151 LYGRKEHGYN ENYKNYTAYM RKEAPEDGGG KDIEASFDDE AVIETEAKPT 201 DIRHVKEIGH IDLVSHIIGG RSVDGRPAGG IAPDATLHIM NTNDETKNEM 251 MVAAIRNAWV KLGERGVRIV NNSFGTTSRA GTADLFQIAN SEEQYRQALL 301 DYSGGDKTDE GIRLMQQSDY GNLSYHIRNK NMLFIFSTGN DAQAQPNTYA 351 LLPFYEKDAQ KGIITVAGVD RSGEKFKREM YGEPGTEPLE YGSNHCGITA 401 MWCLSAPYEA SVRFTRTNPI QIAGTSFSAP IVTGTAALLL QKYPWMSNDN 451 LRTTLLTTAQ DIGAVGVDSK FGWGLLDAGK AMNGPASFPF GDFTADTKGT 501 SDIAYSFRND ISGTGGLIKK GGSQLQLHGN NTYTGKTIIE GGSLVLYGNN 551 ' KSDMRVETKG ALIYNGAASG GSLNSDGIVY LADTDQSGAN ETVHIKGSLQ 601 LDGKGTLYTR LGKLLKVDGT AIIGGKLYMS ARGKGAGYLN STGRRVPFLS 651 AAKIGQDYSF FTNIETDGGL LASLDSVEKT AGSEGDTLSY YVRRGNAART 701 ASAAAHSAPA GLKHAVEQGG SNLENLMVEL DASESSATPE TVETAAADRT 751 DMPGIRPYGA TFRAAAAVQH ANAADGVRIF NSLAATVYAD STAAHADMQG 801 RRLKAVSDGL DHNGTGLRVI AQTQQDGGTW EQGGVEGKMR GSTQTVGIAA 851 KTGENTTAAA TLGMGRSTWS ENSANAKTDS ISLFAGIRHD AGDIGYLKGL 901 FSYGRYKNSI SRSTGADEHA EGSVNGTLMQ LGALGGVNVP FAATGDLTVE 951 GGLRYDLLKQ DAFAEKGSAL GWSGNSLTEG TLVGLAGLKL SQPLSDKAVL 1001 FATAGVERDL NGRDYTVTGG FTGATAATGK TGARNMPHTR LVAGLGADVE 1051 FGNGWNGLAR YSYAGSKQYG NHSGRVGVGY RF*
Os genes Tbp2 e 741 foram da estirpe MC58; os genes 983 e 287 foram da estirpe 2996. Estes foram clonados no vetor pET e expressos em E. coli sem a sequência que codifica os seus péptidos lideres ou como "formas AG", ambos fundidos a um C-terminal rotulado com His. Em cada caso, foi observado o mesmo efeito - a expressão foi boa nos clones que transportavam a deleção do trecho de poliglicina, e fraca ou ausente se as glicinas estavam 46 presentes na proteína expressa: ORF Express. Purificação Atividade Bact. 287-His(2996) + /- + + ' 287aesmarcacl0' (2996) + /- nd nd AG287-HÍS(2996) + + + AG287K(2996) + + + AG287-HÍS(MC58) + + + AG287-HÍS(1000) + + + AG287-HÍS(BZ232) + + + Tbp2-His(MC58) + /- nd nd AGTbp2-His(MC58) + + 741—His(MC58) + /- nd nd AG741-HÍS(MC58) + + 983-His (2996) AG983-HÍS (2996) + + 0 SDS-PAGE das proteínas está representado na Figura 13. AG287 e híbridos
As proteínas AG287 foram feitas e purificadas para as estirpes MC58, 1000 e BZ232. Cada uma destas deu altos títulos de ELISA e também títulos bactericidas do soro >8192. AG287K, expressa a partir de pET-24b, deu excelentes títulos nos ensaios de ELISA e bactericidas do soro. AG287-ORF46.1K também pode ser expressa em pET-24b. AG287 também foi fundida diretamente in-frame ascendente da 919, 953, 961 (sequências mostradas em baixo) e ORF46.1: 47
47 AG2B7-919 1 ATGGCTAGCC 51 TCCTGTTGTT 101 CAGGTTCTCA 151 GCGGCAGTTT 201 CAAACCCAAA 251 CCGCCGAATC 301 GATTCCGCCC 351 TGGAAGGGTT 401 ATATAACGTT 451 TTGGATGAAG 501 TGAACGAATT 551 ATTTGGTTGC 601 ATTTATAAAG 651 TGCACGGTCG 701 ATCAGGCGGA 751 CATTCCGGCA 801 CGGGGCGGAA 851 AACCGGCAAA 901 GTGCTGCATT 951 GTTTGCCGCA 1001 ACAGCGGCGA
CCGATGTTAA ATCGGCGGAC GCTGAAAAAG AGACAGAGGT AGGACAGGGC GCGCCATCCA CGGCAGAAAA TACAGGCAAT AATGAAGACG AGGGACCGCA CGCAAATCAA ACAGGGAACA CCGCGTCAAA CCCTGCACCT GATTTGGCTA ATGGCGTTTT GACCCACTGT AAAGGCGATT AAGCACCGTC AAAATCAGAA GAGAAATATA AGAAAGATGG GACAGCAGTT CAAGCTAATG ACAAGTCCGC TTCATCTTCA AGGAGGTCGC TTCCTGCCGA TACGCTGATT GTCGATGGGG ATATCTTCGC GCCCGAAGGG AAATTGCCCG GCGGAfCGTA AGGCGAAATG CTTGCTGGCA TTCATACGGA AAACGGCCGT AAAGTCGATT TCGGCAGCAA TGATTTGCAT ATGGGTACGC
ACGCTGTCAA AACCGGCCGC AAAAGAAGAT GCGCCACAGG CACAAGGCAG CCAAGATATG GGCGGTGCGG CAACAACGGA AAATGATATG CCGCAAAATT ACCAACCCGC CGATTCTTCA GCGAATGGCG GTAGCAATTT GATTGATGGG CCGTCGCAAA CTTGTAATGG TGATAATTTA TTTGAAAATT TAAATGAGTC GAAAAGCGAT AAATTTACTA GAACTAACAA ATATGTCATC TCTGCGCGAT TCAGGCGTTC GATGCCGCTA ATCCCCGTCA AAGCGGTCAG CCTGACGGGG AATTACCGGT ATCTGACTTA TGCCCTCCGT GTGCAAGGCG CGGCCGTGTA CAACGGCGAA CCGTACCCGA CTAGAGGCAG ATCTGTGGAC GGCATTATCG AAAAATTCAA AGCCGCCATC 48
48 1051 GATGGAAACG 1101 TTCCGGAAGG 1151 GCTATCGCCC 1201 AAAAAAGAGC 1251 CCAAACCTTT 1301 CGGTCGGCAT 1351 GTCTATACCG 1401 TTTCGCCAAA 1451 ACCGCCAAGG 1501 CATTCCTTTC 1551 GGTTGCAGGC 1601 CGGTGCTGAA 1651 TACGGTATTC 1701 GAGCGGAAAA 1751 CAATCGACAA 1801 ATCACCGCGC 1851 CCTCCCCTAC 1901 AAGCCCCGAT 1951 CACATCCAAG 2001 CATCGGCTAT 2051 ATATGGCGGA 2101 ATCAAAGCCT 2151 TCAAAACCCC 2201 ACGGTÇCCGT 2251 GCAGTCGACC 2301 CGCCCATCCG 2351 ATACCGGCAG 2401 TACGGCGACG 2451 CGTCTGGCAG 2501 TCGAG 1 MASPDVKSAD 51 AAVSAENTGN 101 DSAPASNPAP 151 LDEEAPSKSE 201 IYKDKSASSS 251 HSGNIFAPEG 301 VLHFHTENGR 351 DGNGFKGTWT 401 KKEQDGSGGG 451 VYTWPHLSL 501 HSFQAKQFFE 551 YGIPDDFISV 601 ITARTTAIKG 651 HIQGSGRLKT 701 IKAYMRQNPQ 751 AVDRHYITLG 801 YGDEAGELAG
GCTTTAAGGG GACTTGGACG TTTTÃCGGCC CGGCCGGCGA GACAGATGCG GAAAAGGGCG AGGATGGATC CGGAGGAGGA CCGCAACCCG ACACATCCGT CCCCGACCCC GCCGGAACGA TTGTACCGCA CCTGTCCCTG AGCCTGCAAT CCTTCCGCCT CTGGCAGGAT GTGTGCGCCC AGGCAAAACA GTTTTTTGAA AACGGAAGCC TTGCCGGTAC GGGCGACGAC AGGCGGACGG CCGACGATTT TATCTCCGTC GCCCTTGTCC GCATCAGGCA TACCGGCGGC ACACATACCG GCACAACGGC AATCAAAGGC CACACGCGCA ACCAAATCAA ACTCGGTTAC GCCGAAGACC GCTCGGGCCG TCTGAAAACC GCCGACAAAA ACGAACATCC CAAAGGCTAC CTCAAGCTCG ATATGCGGCA AAATCCGCAA AGCTATATCT TTTTCCGCGA CGGCGCACTG GGCACGCCGT GGCACTACAT TACCTTGGGC GTTACCCGCA AAGCCCTCAA CGCGATTAAA GGCGCGGTGC AAGCCGGCGA ACTTGCCGGC CTCCTACCCA ACGGTATGAA
TLSKPAAPW AEKETEVKED GGAATTDKPK NEDEGPQNDM ANGGSNFGRV DLANGVLIDG FENLNESERI EKYKKDGKSD SARFRRSARS RRSLPAEMPL NYRYLTYGAE KLPGGSYALR PYPTRGRFAA KVDFGSKSVD ENGGGDVSGR FYGPAGEEVA GCQSKSIQTF PQPDTSVING PHWAAQDFAK SLQSFRLGCA RYFTPWQVAG NGSLAGTVTG PLPAGLRSGK ALVRIRQTGK RFEGSRFLPY HTRNQINGGA PSGKYIRIGY ADKNEHPYVS RLAEVLGQNP SYIFFRELAG APLFVATAHP VTRKALNRLI KQKTTGYVWQ LLPNGMKPEY
GAAAATGGCG GCGGGGATGT GGAAGTGGCG GGAAAATACA GATTCGGCGT GTTTGCCGGC GGATGCCAAA GCAAGAGCAT CATCAACGGC CCGGACCGGC CGGTCGGCGG CGGCGGGGCC CCCCACTGGG CGGCGCAGGA CGGCTGCGCC AATTTGAAAA AAGCCTTTCA AACCCCCGTC CGCTATTTCA CGCCGTGGCA GGTTACCGGC TATTACGAGC CACAAGCCCG CTTCCCGATT CCCCTGCCTG CCGGTTTGCG GACGGGAAAA AACAGCGGCA CCGACCTCTC CCGATTCCCC AGGTTTGAAG GAAGCCGCTT CGGCGGCGCG CTTGACGGCA CCGTCGAACT TTTTTTTATG CCGTCCGGCA AATACATCCG CTACGTTTCC ATCGGACGCT GGCAGACCTC GATGCAGGGC CGCCTCGCCG AAGTTTTGGG GCTTGCCGGA AGCAGCAATG TGATGGGGGA ATATGCCGGC GCGCCCTTAT TTGTCGCCAC CCGCCTCATT ATGGCGCAGG GCGTGGATTA TTTTTGGGGA AAACAGAAAA CCACGGGTTA GCCCGAATAC CGCCCGTAAC APQAGSQGQG APSTQGSQDM PQNSAESANQ TGNNQPADSS PSQNITLTHC KGDSCNGDNL KFTNLVATAV QANGTNKYVI IPVNQADTLI VDGEAVSLTG VQGEPAKGEM LAGTAVYNGE GIIDSGDDLH MGTQKFKAAI GKYSYRPTDA EKGGFGVFAG PDRPVGIPDP AGTTVGGGGA NLKNRQGWQD VCAQAFQTPV YYEPVLKGDD RRTAQARFPI NSGTIDNTGG THTADLSRFP LDGKAPILGY AEDPVELFFM IGRYMADKGY LKLGQTSMQG SSNDGPVGAL GTPLMGEYAG MAQDTGSAIK GAVRVDYFWG RP*
AG287- 953 1 ATGGCTAGCC 51 TCCTGTTGTT 101 CAGGTTCTCA 151 GCGGCAGTTT 201 CAAACCCAAA 251 CCGCCGAATC 301 GATTCCGCCC 351 TGGAAGGGTT 401 ATATAACGTT 451 TTGGATGAAG 501 TGAACGAATT 551 ATTTGGTTGC 601 ATTTATAAAG 651 TGCACGGTCG 701 ATCAGGCGGA 751 CATTCCGGCA
CCGATGTTAA ATCGGCGGAC GCTGAAAAAG AGACAGAGGT AGGACAGGGC GCGCCATCCA CGGCAGAAAA TACAGGCAAT AATGAAGACG AGGGACCGCA CGCAAATCAA ACAGGGAACA CCGCGTCAAA CCCTGCACCT GATTTGGCTA ATGGCGTTTT GACCCACTGT AAAGGCGATT AAGCACCGTC AAAATCAGAA GAGAAATATA AGAAAGATGG GACAGCAGTT CAAGCTAATG ACAAGTCCGC TTCATCTTCA AGGAGGTCGC TTCCTGCCGA TACGCTGATT GTCGATGGGG ATATCTTCGC GCCCGAAGGG
ACGCTGTCAA AACCGGCCGC AAAAGAAGAT GCGCCACAGG CACAAGGCAG CCAAGATATG GGCGGTGCGG CAACAACGGA AAATGATATG CCGCAAAATT ACCAACCCGC CGATTCTTCA GÇGAATGGCG GTAGCAATTT GATTGATGGG CCGTCGCAAA CTTGTAATGG TGATAATTTA TTTGAAAATT TAAATGAGTC GAAAAGCGAT AAATTTACTA GAACTAACAA ATATGTCATC TCTGCGCGAT TCAGGCGTTC GATGCCGCTA ATCCCCGTCA AAGCGGTCAG CCTGACGGGG AATTACCGGT ATCTGACTTA 49
49 801 CGGGGCGGAA 851 AACCGGCAAA 901 GTGCTGCATT 951 GTTTGCCGCA 1001 ACAGCGGCGA 1051 GATGGAAACG 1101 TTCCGGAAGG 1151 GCTATCGCCC 1201 AAAAAAGAGC 1251 CGAATATCAC 1301 CCAACGTCGG Í351 GCAAAACGCG 1401 AAGCGGTTCG 1451 ATGCCGCCCA 1501 AACGGCAAAA 1551 AACCGCCCCC 1601 CGATGGCGAA 1651 CGCACCAAAT 1701 CGTCCGCATC 1 MASPDVKSAD 51 AAVSAENTGN 101 DSAPASNPAP 151 LDEEAPSKSE 201 IYKDKSASSS 251 HSGNIFAPEG 301 VLHFHTENGR 351 DGNGFKGTWT 401 KKEQDGSGGG 451 AKRDGKIDIT 501 NGKKLVSVDG 551 RTKWGVDYLV
AAATTGCCCG GCGGATCGTA AGGCGAAATG CTTGCTGGCA TTCATACGGA AAACGGCCGT AAAGTCGATT TCGGCAGCAA TGATTTGCAT ATGGGTACGC GCTTTAAGGG GACTTGGACG TTTTACGGCC CGGCCGGCGA GACAGATGCG GAAAAGGGCG AGGATGGATC CGGAGGAGGA GCCAACGCCC GTTTCGCCAT CGGTTTTTAC GGTCTGACCG ACGGTAAAAT CGACATCACC CAACACTTTA CCGACCACCT ATATCCGGAC ATCCGCTTTG AACTGGTTTC CGTTGACGGC GTCAAACTCA AAGCCGAAAA AACCGAAGTT TGCGGCGGCG GGGGCGTGGA CTACCTCGTT GACATCCAAA TCGAGGCAGC TLSKPAAPW AEKETEVKED GGAATTDKPK NEDEGPQNDM ANGGSNFGRV DLANGVLIDG FENLNESERI EKYKKDGKSD SARFRRSARS RRSLPAEMPL NYRYLTYGAE KLPGGSYALR PYPTRGRFAA KVDFGSKSVD ENGGGDVSGR FYGPAGEEVA GATYKVDEYH ANARFAIDHF IPVANLQSGS QHFTDHLKSA NLTMHGKTAP VKLKAEKFNC NVGMTKSVRI DIQIEAAKQ*
TGCCCTCCGT GTGCAAGGCG CGGCCGTGTA CAACGGCGAA CCGTACCCGA CTAGAGGCAG ATCTGTGGAC GGCATTATCG AAAAATTCAA AGCCGCCATC GAAAATGGCG GCGGGGATGT. GGAAGTGGCG GGAAAATACA GATTCGGCGT GTTTGCCGGC GGAGCCACCT ACAAAGTGGA CGACCATTTC AACACCAGCA GTTCCGTCGA GTTCGACCAA ATCCCCGTTG CCAACCTGCA GAAATCAGCC GÀCATCTTCG TTTCCACCAA ATTCAACTTC AACCTGACCA TGCACGGCAA ATTCAACTGC TACCAAAGCC ACTTCAGCAC CACCATCGAC AACGTTGGTA TGACCAAAAG CAAACAATAA CTCGAG
APQAGSQGQG APSTQGSQDM PQNSAESANQ TGNNQPADSS PSQNITLTHC KGDSCNGDNL KFTNLVATAV QANGTNKYVI IPVNQADTLI VDGEAVSLTG VQGEPAKGEM LAGTAVYNGE GIIDSGDDLH MGTQKFKAAI GKYSYRPTDA EKGGFGVFAG NTSTNVGGFY GLTGSVEFDQ DIFDAAQYPD IRFVSTKFNF YQSPMAKTEV CGGDFSTTID
AG2B7-961 1 ATGGCTAGCC 51 TCCTGTTGTT 101 CAGGTTCTCA 151 GCGGCAGTTT 201 CAAACCCAAA 251 CCGCCGAATC 301 GATTCCGCCC 351 TGGAAGGGTT 401 ATATAACGTT 451 TTGGATGAAG 501 TGAACGAATT 551 ATTTGGTTGC 601 ATTTATAAAG 651 TGCACGGTCG 701 ATCAGGCGGA 751 CATTCCGGCA 801 CGGGGCGGAA 851 AACCGGCAAA 901 GTGCTGCATT 951 GTTTGCCGCA 1001 ACAGCGGCGA 1051 GATGGAAACG 1101 TTCCGGAAGG 1151 GCTATCGCCC 1201 AAAAAAGAGC 1251 TGTTAAAAAA 1301 AAGAAATCAA 1351 GACGGCACAA 1401 CGACTTTAAA 1451 CCGTCAATGA 1501 TCTGAAATAG 1551 AGCAGATACT
CCGATGTTAA ATCGGCGGAC GCTGAAAAAG AGACAGAGGT AGGACAGGGC GCGCCATCCA CGGCAGAAAA TACAGGCAAT AATGAAGACG AGGGACCGCA CGCAAATCAA ACAGGGAACA CCGCGTCAAA CCCTGCACCT GATTTGGCTA ATGGCGTTTT GACCCACTGT AAAGGCGATT AAGCACCGTC AAAATCAGAA GAGAAATATA AGAAAGATGG GACAGCAGTT CAAGCTAATG ACAAGTCCGC TTCATCTTCA AGGAGGTCGC TTCCTGCCGA TACGCTGATT GTCGATGGGG ATATCTTCGC GCCCGAAGGG AAATTGCCCG GCGGATCGTA AGGCGAAATG CTTGCTGGCA TTCATACGGA AAACGGCCGT AAAGTCGATT TCGGCAGCAA TGATTTGCAT ATGGGTACGC GCTTTAAGGG GACTTGGACG TTTTACGGCC CGGCCGGCGA GACAGATGCG GAAAAGGGCG AGGATGGATC CGGAGGAGGA GCTGCCACTG TGGCCATTGC CGGTTTCAAA GCTGGAGAGA TTACCAAAAA AGACGCAACT GGTCTGGGTC TGAAAAAAGT AAACAAACAA AACGTCGATG AAAAGTTAAC AACCAAGTTA GATGCCGCTC TGGATGCAAC
ACGCTGTCAA ÀACCGGCCGC AAAAGAAGAT GCGCCACAGG CACAAGGCAG CCAAGATATG GGCGGTGCGG CAACAACGGA AAATGATATG CCGCAAAATT ACCAACCCGC CGATTCTTCA GCGAATGGCG GTAGCAATTT GATTGATGGG CCGTCGCAAA CTTGTAATGG TGATAATTTA TTTGAAAATT TAAATGAGTC GAAAAGCGAT AAATTTACTA GAACTAACAA ATATGTCATC TCTGCGCGAT TCAGGCGTTC GATGCCGCTA ATCCCCGTCA AAGCGGTCAG CCTGACGGGG AATTACCGGT ATCTGACTTA TGCCCTCCGT GTGCAAGGCG CGGCCGTGTA CAACGGCGAA CCGTACCCGA CTAGAGGCAG ATCTGTGGAC GGCATTATCG AAAAATTCAA AGCCGCCATC GAAAATGGCG GCGGGGATGT GGAAGTGGCG GGAAAATACA GATTCGGCGT GTTTGCCGGC GGAGCCACAA ACGACGACGA TGCTGCCTAC AACAATGGCC CCATCTACGA CATTGATGAA GCAGCCGATG TTGAAGCCGA CGTGACTAAC CTGACCAAAA CCAAAGTAAA AGCTGCAGAA GCAGACACTG ATGCCGCTTT CACCAACGCC TTGAATAAAT 50
1601 TGGGAGAAAA TATAACGACA TTTGCTGAAG AGACTAAGAC AAATATCGTA
1651 AAAATTGATG AAAAATTAGA AGCCGTGGCT GATACCGTCG ACAAGCATGC
1701 CGAAGCATTC AACGATATCG CCGATTCATT GGATGAAACC AACACTAAGG
1751 CAGACGAAGC CGTCAAAACC GCCAATGAAG CCAAACAGAC GGCCGAAGAA
1801 ACCAAACAAA ACGTCGATGC CAAAGTAAAA GCTGCAGAAA CTGCAGCAGG
1851 CAAAGCCGAA GCTGCCGCTG GCACAGCTAA TACTGCAGCC GACAAGGCCG
1901 AAGCTGTCGC TGCAAAAGTT ACCGACATCA AAGCTGATAT CGCTACGAAC
1951 AAAGATAATA TTGCTAAAAA AGCAAACAGT GCCGACGTGT ACACCAGAGA
2001 AGAGTCTGAC AGCAAATTTG TCAGAATTGA TGGTCTGAAC GCTACTACCG
2051 AAAAATTGGA CACACGCTTG GCTTCTGCTG AAAAATCCAT TGCCGATCAC
2101 GATACTCGCC TGAACGGTTT GGATAAAACA GTGTCAGACC TGCGCAAAGA
2151 AACCCGCCAA GGCCTTGCAG AACAAGCCGC GCTCTCCGGT CTGTTCCAAC
2201 CTTACAACGT GGGTCGGTTC AATGTAACGG CTGCAGTCGG CGGCTACAAA
2251 TCCGAATCGG CAGTCGCCAT CGGTACCGGC TTCCGCTTTA CCGAAAACTT
2301 TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC TTCGTCCGGT TCTTCCGCAG
2351 CCTACCATGT CGGCGTCAAT TACGAGTGGT AACTCGAG
1 MASPDVKSAD TLSKPAAPW AEKETEVKED APQAGSQGQG APSTQGSQDM
51 AAVSAENTGN GGAATTDKPK NEDEGPQNDM PQNSAESANQ TGNNQPADSS
101 DSAPASNPAP ANGGSNFGRV DLANGVLIDG PSQNITLTHC KGDSCNGDNL
151 LDEEAPSKSE FENLNESERI EKYKKDGKSD KFTNLVÁTAV QANGTNKYVI
201 IYKDKSASSS SARFRRSARS RRSLPAEMPL IPVNQADTLI VDGEAVSLTG
251 HSGNIFAPEG NYRYLTYGAE KLPGGSYALR VQGEPAKGEM LAGTAVYNGE
301 VLHFHTENGR PYPTRGRFAA KVDFGSKSVD GIIDSGDDLH MGTQKFKAAI
351 DGNGFKGTWT ENGGGDVSGR FYGPAGEEVA GKYSYRPTDA EKGGFGVFAG
401 KKEQDGSGGG GATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE
4 51 DGTITKKDAT AADVEADDFK GLGLKKWTN LTKTVNENKQ NVDAKVKAAE
501 SEIEKLTTKL ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV
551 KIDEKLEAVA DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE
601 TKQNVDAKVK AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN
651 KDNIAKKANS ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH
701 DTRLNGLDKT VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK 751 SESAVAIGTG FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEW* ELISA Bactericida AG287—953—His 3834 65536 AG287—961—His 108627 65536 A eficácia bactericida (estirpe homóloga) dos anticorpos criados contra as proteínas híbridas foi comparada com anticorpos criados contra misturas simples dos antígenos componentes (utilizando 287-GST) para 919 e ORF46.1:
Mistura com 287 Hibrido com AG287 919 32000 128000 ORF46.1 128 16000 51
Os dados para a atividade bactericida contra estirpes MenB heterológas e contra os serotipos A e C também foram obtidos: 919 ORF46.1 Estirpe Mistura Híbrido Mistura Híbrido NGH38 1024 32000 - 16384 MC58 512 8192 - 512 BZ232 512 512 - - MenA (F6124) 512 32000 - 8192 MenC (Cll) >2048 >2048 - - MenC (BZ133) >4096 64000 - 8192
As proteínas híbridas com AG287 no terminal N são, portanto, imunologicamente superiores às misturas simples, com AG287-ORF46.1 sendo particularmente eficazes, mesmo contra estirpes heterólogas. AG287-ORF46.1K pode ser expressa em pET-24b.
As mesmas proteínas híbridas foram feitas utilizando estirpe 394/98 da Nova Zelândia em vez da 2996: 52
52 AG287NZ -919 1 ATGGCTAGCC 51 CCCTGTTGTT 101 CAGGTTCTCA 151 GCGGCGGTTT 201 CAAACCCAAA 251 CCGCCGATAC 301 CCGGCCGGAA 351 GCCGGCAAAC 401 ACGATCCGTC 451 ACAAATCAAG 501 TTCAACCAAT 551 ACGTGGGCAA 601 ACCCACTGTA 651 AGTACAGCTA 701 GTAATTACAA 751 GGTTTGGTTG 801 CTTTTATAAA 851 GGTCGAGGCG 901 GCGGATACGC 951 CGGCAATATG 1001 CGGAAAAATT 1051 TCAAAAGGCG 1101 GCATTTTCAT 1151 CCGCAAAAGT 1201 GGCGATGGTT 1251 AAACGGCTTT 1301 GAAAGTTTTA 1351 CGCCCAACAG 1401 AGAGCAGGAT 1451 CCTTTCCGCA 1501 GGCATCCCCG 1551 TACCGTTGTA 1601 CCAAAAGCCT 1651 CAAGGCTGGC 1701 CTTTCAGGCA 1751 CAGGCAACGG 1801 CTGAAGGGCG 1851 TATTCCCGAC 1901 GAAAAGCCCT 1951 GACAATACCG 2001 CGCGCGCACA
CCGATGTCAA GTCGGCGGAC TCTGAAAAAG AGACAGAGGC AGGACAGGGC GCGCCATCCG CGGAAGAAAA TACAGGCAAT AATGAAGACG AGGGGGCGCA AGATAGTTTG ACACCGAATC ATATGGAAAA CCAAGCACCG CAACCGGATA TGGCAAATAC GGCAGGCGGG GAAAATGCCG CCGAAAACAA TCAAACCGCC CCTAGCGCCA CGAATAGCGG TTCTGTTGTG ATTGACGGGC AAGGCGATTC TTGTAGTGGC AAATCAGAAT TTGAAAAATT GAAAGATGGG AAGAATGACG CCGATAGTGT GCAGATGAAG CCTAAACCCA CTTCATTTGC GTCGCTTCCG GCCGAGATGC TGATTGTCGA TGGGGAAGCG TTCGCGCCCG AAGGGAATTA GCCCGGCGGA TCGTATGCCC AAATGCTCGC GGGCACGGCA ACGGAAAACG GCCGTCCGTC CGATTTCGGC AGCAAATCTG TGCATATGGG TACGCAAAAA AAGGGGACTT GGACGGAAAA CGGCCCGGCC GGCGAGGAAG ATGCGGAAAA GGGCGGATTC GGATCCGGAG GAGGAGGATG ACCCGACACA TCCGTCATCA ACCCCGCCGG AACGACGGTC CCGCACCTGT CCCTGCCCCA GCAATCCTTC CGCCTCGGCT AGGATGTGTG CGCCCAAGCC AAACAGTTTT TTGAACGCTA AAGCCTTGCC GGTACGGTTA ACGACAGGCG GACGGCACAA GATTTTATCT CCGTCCCCCT TGTCCGCATC AGGCAGACGG GCGGCACACA TACCGCCGAC ACGGCAATCA AAGGCAGGTT
ACGCTGTCAA AACCTGCCGC AAAGGAAGAT GCGCCACAGG CACAAGGCGG TCAAGATATG GGCGGTGCGG CAGCAACGGA AAATGATATG CCGCAAAATG ACACCCCGGC TTCGAATATG GATGCCGGGG AATCGGAGCA GGCGGACGGA ATGCAGGGTG GCAATACGGC TGCCCAAGGT GGTTCTCAAA ATCCTGCCTC TGGTGATTTT GGAAGGACGA CGTCGCAAAA TATAACGTTG AATAATTTCT TGGATGAAGA AAGTGATGCA GACAAAATAA GGAAGAATGA TAAATTTGTC GGAATCAATC AATATATTAT GCGATTTAGG CGTTCTGCAC CGCTGATTCC CGTCAATCAG GTCAGCCTGA CGGGGCATTC CCGGTATCTG ACTTACGGGG TCCGTGTTCA AGGCGAACCT GTGTACAACG GCGAAGTGCT CCCGTCCAGA GGCAGGTTTG TGGACGGCAT TATCGACAGC TTCAAAGCCG CCATCGATGG TGGCGGCGGG GATGTTTCCG TGGCGGGAAA ATACAGCTAT GGCGTGTTTG CCGGCAAAAA CCAAAGCAAG AGCATCCAAA ACGGCCCGGA CCGGCCGGTC GGCGGCGGCG GGGCCGTCTA CTGGGCGGCG CAGGATTTCG GCGCCAATTT GAAAAACCGC TTTCAAACCC CCGTCCATTC TTTCACGCCG TGGCAGGTTG CCGGCTATTA CGAGCCGGTG GCCCGCTTCC CGATTTACGG GCCTGCCGGT TTGCGGAGCG GAAAAAACAG CGGCACAATC CTCTCCCGAT TCCCCATCAC TGAAGGAAGC CGCTTCCTCC 53
2051 CCTACCACAC GCGCAACCAA
2101 CCGATACTCG GTTACGCCGA
2151 CCAAGGCTCG GGCCGTCTGA
2201 GCTATGCCGA CAAAAACGAA
2251 GCGGACAAAG GCTACCTCAA
2301 AGCCTATATG CGGCAAAATC
2351 ACCCCAGCTA TATCTTTTTC
2401 CCCGTCGGCG CACTGGGCAC
2451 CGACCGGCAC TACATTACCT
2501 ATCCGGTTAC CCGCAAAGCC
2551 GGCAGCGCGA TTAAAGGCGC
2601 CGACGAAGCC GGCGAACTTG
2651 GGCAGCTCCT ACCCAACGGT
1 MASPDVKSAD TLSKPAAPW
51 AAVSEENTGN GGAAATDKPK
101 PAGNMENQAP DAGESEQPAN
151 TNQAENNQTA GSQNPASSTN
201 THCKGDSCSG NNFLDEEVQL
251 GLVADSVQMK GINQYIIFYK
301 ADTLIVDGEA VSLTGHSGNI
351 SKGEMLAGTA VYNGEVLHFH
401 GDGLHMGTQK FKAAIDGNGF
451 RPTDAEKGGF GVFAGKKEQD
501 GIPDPAGTTV GGGGAVYTW
551 QGWQDVCAQA FQTPVHSFQA
601 LKGDDRRTAQ ARFPIYGIPD
651 DNTGGTHTAD LSRFPITART
701 PILGYAEDPV ELFFMHIQGS
751 ADKGYLKLGQ TSMQGIKAYM
801 PVGALGTPLM GEYAGAVDRH
851 GSATKGAVRV DYFWGYGDEA
ATCAACGGCG GCGCGCTTGA CGGCAAAGCC AGACCCCGTC GAACTTTTTT TTATGCACAT AAACCCCGTC CGGCAAATAC ATCCGCATCG CATCCCTACG TTTCCATCGG ACGCTATATG GCTCGGGCAG ACCTCGATGC AGGGCATCAA CGCAACGCCT CGCCGAAGTT TTGGGTCAAA CGCGAGCTTG CCGGAAGCAG CAATGACGGT GCCGTTGATG GGGGAATATG CCGGCGCAGT TGGGCGCGCC CTTATTTGTC GCCACCGCCC CTCAACCGCC TGATTATGGC GCAGGATACC GGTGCGCGTG GATTATTTTT GGGGATACGG CCGGCAAACA GAAAACCACG GGTTACGTCT ATGAAGCCCG AATACCGCCC GTAAAAGCTT SEKETEAKED APQAGSQGQG APSAQGGQDM NEDEGAQNDM PQNAADTDSL TPNHTPASNM QPDMANTADG MQGDDPSAGG ENAGNTAAQG PSATNSGGDF GRTNVGNSW IDGPSQNITL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV PKPTSFARFR RSARSRRSLP AEMPLIPVNQ FAPEGNYRYL TYGAEKLPGG SYALRVQGEP TENGRPSPSR GRFAAKVDFG SKSVDGIIDS KGTWTENGGG DVSGKFYGPA GEEVAGKYSY GSGGGGCQSK SIQTFPQPDT SV1NGPDRPV PHLSLPHWAA QDFAKSLQSF RLGCANLKNR KQFFERYFTP WQVAGNGSLA GTVTGYYEPV DFISVPLPAG LRSGKALVRI RQTGKNSGTI TAIKGRFEGS RFLPYHTRNQ INGGALDGKA GRLKTPSGKY IRIGYADKNE HPYVSIGRYM RQNPQRLAEV LGQNPSYIFF RELAGSSNDG YITLGAPLFV ATAHPVTRKA LNRLIMAQDT GELAGKQKTT GYVWQLLPNG MKPEYRP* AG287NZ-953
1 ATGGCTAGCC CCGATGTCAA
51 CCCTGTTGTT TCTGAAAAAG
101 CAGGTTCTCA AGGACAGGGC
151 GCGGCGGTTT CGGAAGAAAA
201 CAAACCCAAA AATGAAGACG
251 CCGCCGATAC AGATAGTTTG
301 CCGGCCGGAA ATATGGAAAA
351 GCCGGCAAAC CAACCGGATA
401 ACGATCCGTC GGCAGGCGGG
451 ACAAATCAAG CCGAAAACAA
501 TTCAACCAAT CCTAGCGCCA
551 ACGTGGGCAA TTCTGTTGTG
601 ACCCACTGTA AAGGCGATTC
651 AGTACAGCTA AAATCAGAAT
701 GTAATTACAA GAAAGATGGG
751 GGTTTGGTTG CCGATAGTGT
801 CTTTTATAAA CCTAAACCCA
851 GGTCGAGGCG GTCGCTTCCG
901 GCGGATACGC TGATTGTCGA
951 CGGCAATATC TTCGCGCCCG
1001 CGGAAAAATT GCCCGGCGGA
1051 TCAAAAGGCG AAATGCTCGC
1101 GCATTTTCAT ACGGAAAACG
1151 CCGCAAAAGT CGATTTCGGC
1201 GGCGATGGTT TGCATATGGG
1251 AAACGGCTTT AAGGGGACTT
1301 GAAAGTTTTA CGGCCCGGCC
1351 CGCCCAACAG ATGCGGAAAA
1401 AGAGCAGGAT GGATCCGGAG
1451 ATCACGCCAA CGCCCGTTTC
1501 GTCGGCGGTT TTTACGGTCT
1551 ACGCGACGGT AAAATCGACA
GTCGGCGGAC ACGCTGTCAA AACCTGCCGC AGACAGAGGC AAAGGAAGAT GCGCCACAGG GCGCCATCCG CACAAGGCGG TCAAGATATG TACAGGCAAT GGCGGTGCGG CAGCAACGGA AGGGGGCGCA AAATGATATG CCGCAAAATG ACACCGAATC ACACCCCGGC TTCGAATATG CCAAGCACCG GATGCCGGGG AATCGGAGCA TGGCAAATAC GGCGGACGGA ATGCAGGGTG GAAAATGCCG GCAATACGGC TGCCCAAGGT TCAAACCGCC GGTTCTCAAA ATCCTGCCTC CGAATAGCGG TGGTGATTTT GGAAGGACGA ATTGACGGGC CGTCGCAAAA TATAACGTTG TTGTAGTGGC AATAATTTCT TGGATGAAGA TTGAAAAATT AAGTGATGCA GACAAAATAA AAGAATGACG GGAAGAATGA TAAATTTGTC GCAGATGAAG GGAATCAATC AATATATTAT CTTCATTTGC GCGATTTAGG CGTTCTGCAC GCCGAGATGC CGCTGATTCC CGTCAATCAG TGGGGAAGCG GTCAGCCTGA CGGGGCATTC AAGGGAATTA CCGGTATCTG ACTTACGGGG TCGTATGCCC TCCGTGTTCA AGGCGAACCT GGGCACGGCA GTGTACAACG GCGAAGTGCT GCCGTCCGTC CCCGTCCAGA GGCAGGTTTG AGCAAATCTG TGGACGGCAT TATCGACAGC TACGCAAAAA TTCAAAGCCG CCATCGATGG GGACGGAAAA TGGCGGCGGG GATGTTTCCG GGCGAGGAAG TGGCGGGAAA ATACAGCTAT GGGCGGATTC GGCGTGTTTG CCGGCAAAAA GAGGAGGAGC CACCTACAAA GTGGACGAAT GCCATCGACC ATTTCAACAC CAGCACCAAC GACCGGTTCC GTCGAGTTCG ACCAAGCAAA TCACCATCCC CGTTGCCAAC CTGCAAAGCG 54
54 1601 GTTCGCAACA 1651 GCCCAATATC 1701 CAAAAAACTG 1751 CCCCCGTCAA 1801 GCGAAAACCG 1851 CAAATGGGGC 1901 GCATCGACAT 1 MASPDVKSAD 51 AAVSEENTGN 101 PAGNMENQAP 151 TNQAENNQTA 201 THCKGDSCSG 251 GLVADSVQMK 301 ADTLIVDGEA 351 SKGEMLAGTA 401 GDGLHMGTQK 451 RPTDAEKGGF 501 VGGFYGLTGS 551 AQYPDIRFVS 601 AKTEVCGGDF
CTTTACCGAC CACCTGAAAT CGGACATCCG CTTTGTTTCC GTTTCCGTTG ACGGCAACCT ACTCAAAGCC GAAAAATTCA AAGTTTGCGG CGGCGACTTC GTGGACTACC TCGTTAACGT CCAAATCGAG GCAGCCAAAC
TLSKPAAPW SEKETEAKED GGAAATDKPK NEDEGAQNDM DAGESEQPAN QPDMANTADG GSQNPASSTN PSATNSGGDF NNFLDEEVQL KSEFEKLSDA GINQYIIFYK PKPTSFARFR VSLTGHSGNI FAPEGNYRYL VYNGEVLHFH TENGRPSPSR FKAAIDGNGF KGTWTENGGG GVFAGKKEQD GSGGGGATYK VEFDQAKRDG KIDITIPVAN TKFNFNGKKL VSVDGNLTMH STTIDRTKWG VDYLVNVGMT
CAGCCGACAT CTTCGATGCC ACCAAATTCA ACTTCAACGG GACCATGCAC GGCAAAACCG ACTGCTACCA AAGCCCGATG AGCACCACCA TCGACCGCAC TGGTATGACC AAAAGCGTCC AATAAAAGCT T APQAGSQGQG APSAQGGQDM PQNAADTDSL TPNHTPASNM MQGDDPSAGG ENAGNTAAQG GRTNVGNSVV IDGPSQNITL DKISNYKKDG KKDGKNDKFV RSARSRRSLP AEMPLIPVNQ TYGAEKLPGG SYALRVQGEP GRFAAKVDFG SKSVDGIIDS DVSGKFYGPA GEEVAGKYSY VDEYHANARF AIDHFNTSTN LQSGSQHFTD HLKSADIFDA GKTAPVKLKA EKFNCYQSPM KSVRIDIQIE AAKQ*
AG287HZ -961 1 ATGGCTAGCC 51 CCCTGTTGTT 101 CAGGTTCTCA 151 GCGGCGGTTT 201 CAAACCCAAA 251 CCGCCGATAC 301 CCGGCCGGAA 351 GCCGGCAAAC 401 ACGATCCGTC 451 ACAAATCAAG 501 TTCAACCAAT 551 ACGTGGGCAA 601 ACCCACTGTA 651 AGTACAGCTA 701 GTAATTACAA 751 GGTTTGGTTG 801 CTTTTATAAA 851 GGTCGAGGCG 901 GCGGATACGC 951 CGGCAATATC 1001 CGGAAAAATT 1051 . TCAAAAGGCG 1101 GCATTTTCAT 1151 CCGCAAAAGT 1201 GGCGATGGTT 1251 AAACGGCTTT 1301 GAAAGTTTTA 1351 CGCCCAACAG 1401 AGAGCAGGAT 1451 AAAAAGCTGC 1501 ATCAACGGTT 1551 CACAATTACC 1601 TTAAAGGTCT 1651 AATGAAAACA 1701 AATAGAAAAG 1751 ATACTGATGC 1801 GAAAATATAA 1851 TGATGAAAAA 1901 CATTCAACGA 1951 GAAGCCGTCA 2001 ACAAAACGTC 2051 CCGAAGCTGC 2101 GTCGCTGCAA
CCGATGTCAA GTCGGCGGAC TCTGAAAAAG AGACAGAGGC AGGACAGGGC GCGCCATCCG CGGAAGAAAA TACAGGCAAT AATGAAGACG AGGGGGCGCA AGATAGTTTG ACACCGAATC ATATGGAAAA CCAAGCACCG CAACCGGATA TGGCAAATAC GGCAGGCGGG GAAAATGCCG CCGAAAACAA TCAAACCGCC CCTAGCGCCA CGAATAGCGG TTCTGTTGTG ATTGACGGGC AAGGCGATTC TTGTAGTGGC AAATCAGAAT TTGAAAAATT GAAAGATGGG AAGAATGACG CCGATAGTGT GCAGATGAAG CCTAAACCCA CTTCATTTGC GTCGCTTCCG GCCGAGATGC TGATTGTCGA TGGGGAAGCG TTCGCGCCCG AAGGGAATTA GCCCGGCGGA TCGTATGCCC AAATGCTCGC GGGCACGGCA ACGGAAAACG GCCGTCCGTC CGATTTCGGC AGCAAATCTG TGCATATGGG TACGCAAAAA AAGGGGACTT GGACGGAAAA CGGCCCGGCC GGCGAGGAAG ATGCGGAAAA GGGCGGATTC GGATCCGGAG GAGGAGGAGC CACTGTGGCC ATTGCTGCTG TCAAAGCTGG AGAGACCATC AAAAAAGACG CAACTGCAGC GGGTCTGAAA-AAAGTCGTGA AACAAAACGT CGATGCCAAA TTAACAACCA AGTTAGCAGA CGCTCTGGAT GCAACCACCA CGACATTTGC TGAAGAGACT TTAGAAGCCG TGGCTGATAC tatcgccgat tcattggatg
AAACCGCCAA TGAAGCCAAA GATGCCAAAG TAAAAGCTGC CGCTGGCACA GCTAATACTG AAGTTACCGA CATCAAAGCT
ACGCTGTCAA AACCTGCCGC AAAGGAAGAT GCGCCACAGG CACAAGGCGG TCAAGATATG GGCGGTGCGG CAGCAACGGA AAATGATATG CCGCAAAATG ACACCCCGGC TTCGAATATG GATGCCGGGG AATCGGAGCA GGCGGACGGA ATGCAGGGTG GCAATACGGC TGCCCAAGGT GGTTCTCAAA ATCCTGCCTC TGGTGATTTT GGAAGGACGA CGTCGCAAAA TATAACGTTG AATAATTTCT TGGATGAAGA AAGTGATGCA GACAAAATAA GGAAGAATGA TAAATTTGTC GGAATCAATC AATATATTAT GCGATTTAGG CGTTCTGCAC CGCTGATTCC CGTCAATCAG GTCAGCCTGA CGGGGCATTC CCGGTATCTG ACTTACGGGG TCCGTGTTCA AGGCGAACCT GTGTACAACG GCGAAGTGCT CCCGTCCAGA GGCAGGTTTG TGGACGGCAT TATCGACAGC TTCAAAGCCG CCATCGATGG TGGCGGCGGG GATGTTTCCG TGGCGGGAAA ATACAGCTAT GGCGTGTTTG CCGGCAAAAA CACAAACGAC GACGATGTTA CCTACAACAA TGGCCAAGAA TACGACATTG ATGAAGACGG CGATGTTGAA GCCGACGACT CTAACCTGAC CAAAACÇGTC GTAAAAGCTG CAGAATCTGA CACTGATGCC GCTTTAGCAG ACGCCTTGAA TAAATTGGGA AAGACAAATA TCGTAAAAAT CGTCGACAAG CATGCCGAAG AAACCAACAC TAAGGCAGAC CAGACGGCCG AAGAAACCAA AGAAACTGCA GCAGGCAAAG CAGCCGACAA GGCCGAAGCT GATATCGCTA CGAACAAAGA 55
2151 TAATATTGCT AAAAAAGCAA ACAGTGCÇGA CGTGTACACC AGAGAAGAGT 2201 CTGACAGCAA ATTTGTCAGA ATTGATGGTC TGAACGCTAC TACCGAAAAA 2251 TTGGACACAC GCTTGGCTTC TGCTGAAAAA TCCATTGCCG ATCACGATAC 2301 TCGCCTGAAC GGTTTGGATA AAACAGTGTC AGACCTGCGC AAAGAAACCC 2351 GCCAAGGCCT TGCAGAACAA GCCGCGCTCT CCGGTCTGTT CCAACCTTAC 2401 AACGTGGGTC GGTTCAATGT AACGGCTGCA GTCGGCGGCT ACAAATCCGA 2451 ATCGGCAGTC GCCATCGGTA CCGGCTTCCG CTTTACCGAA AACTTTGCCG 2501 CCAAAGCAGG CGTGGCAGTC GGCACTTCGT CCGGTTCTTC CGCAGCCTAC
2551 CATGTCGGCG TCAATTACGA GTGGTAAAAG CTT 1 MASPDVKSAD TLSKPAAPW SEKETEAKED APQAGSQGQG APSAQGGQDM 51 AAVSEENTGN GGAAATDKPK NEDEGAQNDM PQNAADTDSL TPNHTPASNM 101 PAGNMENQAP DAGESEQPAN QPDMANTADG MQGDDPSAGG ENAGNTAAQG 151 TNQAENNQTA GSQNPASSTN PSATNSGGDF GRTNVGNSW IDGPSQNITL 201 THCKGDSCSG NNFLDEEVQL KSEFEKLSDA DKISNYKKDG KNDGKNDKFV 251 GLVADSVQMK GINQYIIFYK PKPTSFARFR RSARSRRSLP AEMPLIPVNQ 301 ADTLIVDGEA VSLTGHSGNI FAPEGNYRYL TYGAEKLPGG SYALRVQGEP 351 SKGEMLAGTA VYNGEVLHFH TENGRPSPSR GRFAAKVDFG SKSVDGIIDS 401 GDGLHMGTQK FKAAIDGNGF KGTWTENGGG DVSGKFYGPA GEEVAGKYSY 451 RPTDAEKGGF GVFAGKKEQD GSGGGGATND DDVKKAATVA IAAAYNNGQE 501 INGFKAGETI YDIDEDGTIT KKDATAADVE ADDFKGLGLK KWTNLTKTV 551 NENKQNVDAK VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG 601 ENITTFAEET KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD 651 EAVKTANEAK QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA 701 VAAKVTDIKA DIATNKDNIA KKANSADVYT REESDSKFVR IDGLNATTEK 751 LDTRLASAEK SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY 801 NVGRFNVTAA VGGYKSESAV AIGTGFRFTE NFAAKAGVAV GTSSGSSAAY 851 HVGVNYEW* AG983 e híbridos
Os títulos bactericidas gerados em resposta a AG983 (fusão His) foram medidos contra várias estirpes, incluindo a estirpe 2996 homóloga: 2996 NGH38 BZ133 AG983 512 128 128 AG983 também foi expressa como um híbrido, com ORF46.1, 741, 961 ou 961c no seu terminal C: 56
56 AG983-ORF46.1 1 ATGACTTCTG 51 CAGCAGAGCA 101 AGAACGAAAT 151 GTTGCGGTTA 201 GCATACCGGA 251 ACCTCAAACC 301 GGTATCGTCG 351 GTATGGCAGA 401 CGTATATGCG 451 GCTTCTTTCG 501 TATCCGCCAC 551 TTGGCGGGCG 601 GCGACGCTAC 651 GGTTGCAGCC 701 GCATCGTCAA 751 CTTTTCCAAA 801 CTATTCCGGC 851 GCGATTACGG 901 ATCTTTTCGA 951 ATTGCCATTT 1001 GCGTAGACCG 1051 GGTACAGAAC 1101 GTGGTGCCTG
CGCCCGACTT CAATGCAGGC ACAACAGCGA AATCAGCAGC GTGCAAAGAC AGAAGCATGC CAGACAGGGA TGCCAAAATC GACTTTCCAA ACCCAAATGA TGCAATTGAA GCAGGCTATA ACACAGGCGA ATCCGTCGGC AAAGAACACG GCTATAACGA GAAGGAAGCG CCTGAAGACG ACGATGAGGC CGTTATAGAG GTAAAAGAAA TCGGACACAT TTCCGTGGAC GGCAGACCTG ACATAATGAA TACGAATGAT ATCCGCAATG CATGGGTCAA TAACAGTTTT GGAACAACAT TAGCCAATTC GGAGGAGCAG GGTGATAAAA CAGACGAGGG CAACCTGTCC TACCACATCC CAGGCAATGA CGCACAAGCT TATGAAAAAG ACGCTCAAAA CAGTGGAGAA AAGTTCAAAC CGCTTGAGTA TGGCTCCAAC TCGGCACCCT ATGAAGCAAG
GGTACCGGTA TCGGCAGCAA AGTATCTTAC GCCGGTATCA TCTGTGCCGG TCGGGATGAC AATGCCCCCC CCCCGAATCT CGCATACAAG AATTTGATCA CAGGACGCGG GGTAGAGGTA AGCATATCCT TTCCCGAACT AAATTACAAA AACTATACGG GAGGCGGTAA AGACATTGAA ACTGAAGCAA AGCCGACGGA CGATTTGGTC TCCCATATTA CAGGCGGTAT TGCGCCCGAT GAAACCAAGA ACGAAATGAT GCTGGGCGAA CGTGGCGTGC CGAGGGCAGG CACTGCCGAC TACCGCCAAG CGTTGCTCGA TATCCGCCTG ATGCAACAGA GTAATAAAAA CATGCTTTTC CAGCCCAACA CATATGCCCT AGGCATTATC ACAGTCGCAG GGGAAATGTA TGGAGAACCG CATTGCGGAA TTACTGCCAT CGTCCGTTTC ACCCGTACAA 57
1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC 1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT 12 51 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG 1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA 1351 CCCGCGTCCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC 1401' CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA 1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG 1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA 1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG 1601 CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC 1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT 1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG 1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG 1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC 1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG 1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA 1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC 2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC 2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGÇCTCCGAA 2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA 2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG 2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC 2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG 2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC 2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT 2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA 2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGÇA 2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT 2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT 2601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG 2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG 2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG 2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA 2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA 2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT 2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA 2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC 3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT 3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC 3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAC 3151 GGTGGCGGAG GCACTGGATC CTCAGATTTG GCAAACGATT CTTTTATCCG 3201 GCAGGTTCTC GACCGTCAGC ATTTCGAACC CGACGGGAAA TACCACCTAT 3251 TCGGCAGCAG GGGGGAACTT GCCGAGCGCA GCGGCCATAT CGGATTGGGA 3301 AAAATACAAA GCCATCAGTT GGGCAACCTG ATGATTCAAC AGGCGGCCAT 3351 TAAAGGAAAT ATCGGCTACA TTGTCCGCTT TTCCGATCAC GGGCACGAAG 3401 TCCATTCCCC CTTCGACAAC CATGCCTCAC ATTCCGATTC TGATGAAGCC 3451 GGTAGTCCCG TTGACGGATT TAGCCTTTAC CGCATCCATT GGGACGGATA 3501 CGAACACCAT CCCGCCGACG GCTATGACGG GCCACAGGGC GGCGGCTATC 3551 CCGCTCCCAA AGGCGCGAGG GATATATACA GCTACGACAT AAAAGGCGTT 3601 GCCCAAAATA TCCGCCTCAA CCTGACCGAC AACCGCAGCA CCGGACAACG 3651 GCTTGCCGAC CGTTTCCACA ATGCCGGTAG TATGCTGACG CAAGGAGTAG 3701 GCGACGGATT CAAACGCGCC ACCCGATACA GCCCCGAGCT GGACAGATCG 3751 GGCAATGCCG CCGAAGCCTT CAACGGCACT GCAGATATCG TTAAAAACAT 3801 CATCGGCGCG GCAGGAGAAA TTGTCGGCGC AGGCGATGCC GTGCAGGGCA 3851 TAAGCGAAGG CTCAAACATT GCTGTCATGC ACGGCTTGGG TCTGCTTTCC 3901 ACCGAAAACA AGATGGCGCG CATCAACGAT TTGGCAGATA TGGCGCAACT 3951 CAAAGACTAT GCCGCAGCAG CCATCCGCGA TTGGGCAGTC CAAAACCCCA 4001 ATGCCGCACA AGGCATAGAA GCCGTCAGCA ATATCTTTAT GGCAGCCATC 4051 CCCATCAAAG GGATTGGAGC TGTTCGGGGA AAATACGGCT TGGGCGGCAT 4101 CACGGCACAT CCTATCAAGC GGTCGCAGAT GGGCGCGATC GCATTGCCGA 4151 AAGGGAAATC CGCCGTCAGC GACAATTTTG CCGATGCGGC ATACGCCAAA 4201 TACCCGTCCC CTTACCATTC CCGAAATATC CGTTCAAACT TGGAGCAGCG 4251 TTACGGCAAA GAAAACATCA CCTCCTCAAC CGTGCCGCCG TCAAACGGCA 4301 AAAATGTCAA ACTGGCAGAC CAACGCCACC CGAAGACAGG CGTACCGTTT 4351 GACGGTAAAG GGTTTCCGAA TTTTGAGAAG CACGTGAAAT ATGATACGCT 4401 CGAGCACCAC CACCACCACC ACTGA
1 MTSAPDFNAG 51 VAVTDRDAKI 101 GIVDTGESVG 151 ASFDDEAVIE 201 ATLHIMNTND 251 LFQIANSEEQ 301 IFSTGNDAQA 351 GTEPLEYGSN 401 TAALLLQKYP 451 PASFPFGDFT 501 GKTIIEGGSL 551 DQSGANETVH 601 GAGYLNSTGR 651 GDTLSYYVRR •701 SSATPETVET 751 ATVYADSTAA 801 VEGKMRGSTQ 851 AGIRHDAGDI 901 GGVNVPFAAT 951 LAGLKLSQPL 1001 NMPHTRLVAG 1051 GGGGTGSSDL 1101 KIQSHQLGNL 1151 GSPVDGFSLY 1201 AQNIRLNLTD 1251 GNAAEAFNGT 1301 TENKMARIND 1351 PIKGIGAVRG 1401 YPSPYHSRNI 1451 DGKGFPNFEK GTGIGSNSRA TTAKSAAVSY NAPPPNLHTG DFPNPNDAYK SISFPELYGR KEHGYNENYK TEAKPTDIRH VKEIGHIDLV ETKNEMMVAA IRNAWVKLGE YRQALLDYSG GDKTDEGIRL QPNTYALLPF YEKDAQKGII HCGITAMWCL SAPYEASVRF WMSNDNLRTT LLTTAQDIGA ADTKGTSDIA YSFRNDISGT VLYGNNKSDM RVETKGALIY IKGSLQLDGK GTLYTRLGKL RVPFLSAAKI GQDYSFFTNI GNAARTASAA AHSAPAGLKH AAADRTDMPG IRPYGATFRA HADMQGRRLK AVSDGLDHNG TVGIAAKTGE NTTAAATLGM GYLKGLFSYG RYKNSISRST GDLTVEGGLR YDLLKQDAFA SDKAVLFATA GVERDLNGRD LGADVEFGNG WNGLARYSYA ANDSFIRQVL DRQHFEPDGK MIQQAAIKGN IGYIVRFSDH RIHWDGYEHH PADGYDGPQG NRSTGQRLAD RFHNAGSMLT ADIVKNIIGA AGEIVGAGDA LADMAQLKDY AAAAIRDWAV KYGLGGITAH PIKRSQMGAI RSNLEQRYGK ENITSSTVPP HVKYDTLEHH HHHH+
AGIKNEMCKD RSMLCAGRDD NLINLKPAIE AGYTGRGVEV NYTAYMRKEA PEDGGGKDIE SHIIGGRSVD GRPAGGIAPD RGVRIVNNSF GTTSRAGTAD MQQSDYGNLS YHIRNKNMLF TVAGVDRSGE KFKREMYGEP TRTNPIQIAG TSFSAPIVTG VGVDSKFGWG LLDAGKAMNG GGLIKKGGSQ LQLHGNNTYT NGAASGGSLN SDGIVYLADT LKVDGTAIIG GKLYMSARGK ETDGGLLASL DSVEKTAGSE AVEQGGSNLE NLMVELDA5E AAAVQHANAA DGVRIFNSLA TGLRVIAQTQ QDGGTWEQGG GRSTWSENSA NAKTDSISLF GADEHAEGSV NGTLMQLGAL EKGSALGWSG NSLTEGTLVG YTVTGGFTGA TAATGKTGAR GSKQYGNHSG RVGVGYRFLD YHLFGSRGEL AERSGHIGLG GHEVHSPFDN HASHSDSDEA GGYPAPKGAR DIYSYDIKGV QGVGDGFKRA TRYSPELDRS VQGISEGSNI AVMHGLGLLS QNPNAAQGIE AVSNIFMAAI ALPKGKSAVS DNFADAAYAK SNGKNVKLAD QRHPKTGVPF
AG983- 741 1 ATGACTTCTG 51 CAGCAGAGCA 101 AGAACGAAAT 151 GTTGCGGTTA 201 GCATACCGGA 251 ACCTCAAACC 301 GGTATCGTCG 351 GTATGGCAGA 401 CGTATATGCG 451 GCTTCTTTCG 501 TATCCGCCAC 551 TTGGCGGGCG 601 GCGACGCTAC 651 GGTTGCAGCC 701 GCATCGTCAA 751 CTTTTCCAAA 801 CTATTCCGGC 851 GCGATTACGG 901 ATCTTTTCGA 951 ATTGCCATTT 1001 GCGTAGACCG 1051 GGTACAGAAC 1101 GTGGTGCCTG 1151 ACCCGATTCA 1201 ACGGCGGCTC 1251 GCGTACCACG 1301 ACAGCAAGTT 1351 CCCGCGTCCT 1401 CGATATTGCC 1451 TCAAAAAAGG 1501 GGCAAAACCA 1551 ATCGGATATG 1601 CATCCGGCGG 1651 GACCAATCCG
CGCCCGACTT CAATGCAGGC ACAACAGCGA AATCAGCAGC GTGCAAAGAC AGAAGCATGC CAGACAGGGA TGCCAAAATC GACTTTCCAA ACCCAAATGA TGCAATTGAA GCAGGCTATA ACACAGGCGA ATCCGTCGGC AAAGAACACG GCTATAACGA GAAGGAAGCG CCTGAAGACG ACGATGAGGC CGTTATAGAG GTAAAAGAAA TCGGACACAT TTCCGTGGAC GGCAGACCTG ACATAATGAA TACGAATGAT ATCCGCAATG CATGGGTCAA TAACAGTTTT GGAACAACAT TAGCCAATTC GGAGGAGCAG GGTGATAAAA CAGACGAGGG CAACCTGTCC TACCACATCC CAGGCAATGA CGCACAAGCT TATGAAAAAG ACGCTCAAAA CAGTGGAGAA AAGTTCAAAC CGCTTGAGTA TGGCTCCAAC TCGGCACCCT ATGAAGCAAG AATTGCCGGA ACATCCTTTT TGCTGCTGCA GAAATACCCG TTGCTGACGA CGGCTCAGGA CGGCTGGGGA CTGCTGGATG TTCCGTTCGG CGACTTTACC TACTCCTTCC GTAACGACAT CGGCAGCCAA CTGCAACTGC TTATCGAAGG CGGTTCGCTG CGCGTCGAAA CCAAAGGTGC CAGCCTGAAC AGCGACGGCA GCGCAAACGA AACCGTACAC
GGTACCGGTA TCGGCAGCAA AGTATCTTAC GCCGGTATCA TCTGTGCCGG TCGGGATGAC AATGCCCCCC CCCCGAATCT CGCATACAAG AATTTGATCA CAGGACGCGG GGTAGAGGTA AGCATATCCT TTCCCGAACT AAATTACAAA AACTATACGG GAGGCGGTAA AGACATTGAA ACTGAAGCAA AGCCGACGGA CGATTTGGTC TCCCATATTA CAGGCGGTAT TGCGCCCGAT GAAACCAAGA ACGAAATGAT GCTGGGCGAA CGTGGCGTGC CGAGGGCAGG CACTGCCGAC TACCGCCAAG CGTTGCTCGA TATCCGCCTG ATGCAACAGA GTAATAAAAA CATGCTTTTC CAGCCCAACA CATATGCCCT AGGCATTATC ACAGTCGCAG GGGAAATGTA TGGAGAACCG CATTGCGGAA TTACTGCCAT CGTCCGTTTC ACCCGTACAA CCGCACCCAT CGTAACCGGC TGGATGAGCA ACGACAACCT CATCGGTGCA GTCGGCGTGG CGGGTAAGGC CATGAACGGA GCCGATACGA AAGGTACATC TTCAGGCACG GGCGGCCTGA ACGGCAACAA CACCTATACG GTGTTGTACG GCAACAACAA GCTGATTTAT AACGGGGCGG TTGTCTATCT GGCAGATACC ATCAAAGGCA GTCTGCAGCT 59
GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG GGATCCGGAG GGGGTGGTGT CGCCGCCGAC ATCGGTGCGG GGCTTGCCGA TGCACTAACC GCACCGCTCG ACCATAAAGA CAAAGGTTTG CAGTCTTTGA CGCTGGATCA GTCCGTCAGG AAAAACGAGA AACTGAAGCT GGCGGCACAA GGTGCGGAAA AAACTTATGG AAACGGTGAC AGCCTCAATA CGGGCAAATT GAAGAACGAC AAGGTCAGCC GTTTCGACTT TATCCGCCAA ATCGAAGTGG ACGGGCAGCT CATTACCTTG GAGAGTGGAG AGTTCCAAGT ATACAAACAA AGCCATTCCG CCTTAACCGC CTTTCAGACC GAGCAAATAC AAGATTCGGA GCATTCCGGG AAGATGGTTG CGAAACGCCA GTTCAGAATC GGCtíACATAG CGGGCGAACA TACATCTTTT GACAAGCTTC CCGAAGGCGG CAGGGCGACA TATCGCGGGA CGGCGTTCGG TTCAGACGAT GCCGGCGGAA AACTGACCTA CACCATAGAT TTCGCCGCCA AGCAGGGAAA CGGCAAAATC GAACATTTGA AATCGCCAGA ACTCAATGTC GACCTGGCCG CCGCCGATAT CAAGCCGGAT GGAAAACGCC ATGCCGTCAT CAGCGGTTCC GTCCTTTACA ACCAAGCCGA GAAAGGCAGT TACTCCCTCG GTATCTTTGG CGGAAAAGCC CAGGAAGTTG CCGGCAGCGC GGAAGTGAAA ACCGTAAACG GCATACGCCA TATCGGCCTT GCCGCCAAGC AACTCGAGCA CCACCACCAC CACCACTGA
MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV GIVDTGESVG SISFPELYGR KEHGYNENYK NYTAYMRKEA PEDGGGKDIE ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHIIGGRSVD GRPAGGXAPD ATLHIMNTND ETKNEMMVAA IRNAWVKLGE RGVRIVNNSF GTTSRAGTAD LFQIANSEEQ YRQALLDYSG GDKTDEG1RL MQQSDYGNLS YHIRNKNMLF IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE GDTLSYYVRR GNAARTASAA AHSAPAGLKH AVEQGGSNLE NLMVELDASE SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF AGIRHDAGDI GYLKGLFSYG RYKNSISRST GADEHAEGSV NGTLMQLGAL , GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG LAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE 60
1051 GSGGGGVAAD IGAGLADALT 1101 GAEKTYGNGD SLNTGKLKND 1151 SHSALTAFQT EQIQDSEHSG 1201 YRGTAFGSDD AGGKLTYTID 1251 GKRHAVISGS VLYNQAEKGS 1301 AG983- AAKCLEHHHH 961 HH* 1 ATGACTTCTG CGCCCGACTT 51 CAGCAGAGCA ACAACAGCGA 101 AGAACGAAAT GTGCAAAGAC 151 GTTGCGGTTA CAGACAGGGA 201 GCATACCGGA GACTTTCCAA 251 ACCTCAAACC TGCAATTGAA 301 GGTATCGTCG ACACAGGCGA 351 GTATGGCAGA AAAGAACACG 401 CGTATATGCG GAAGGAAGCG 451 GCTTCTTTCG ACGATGAGGC 501 TATCCGCCAC GTAAAAGAAA 551 TTGGCGGGCG TTCCGTGGAC 601 GCGACGCTAC ACATAATGAA 651 GGTTGCAGCC ATCCGCAATG 701 GCATCGTCAA TAACAGTTTT 751 CTTTTCCAAA TAGCCAATTC 801 CTATTCCGGC GGTGATAAAA 851 GCGATTACGG CAACCTGTCC 901 ATCTTTTCGA· CAGGCAATGA 951 ATTGCCATTT TATGAAAAAG 1001 GCGTAGACCG CAGTGGAGAA 1051 GGTACAGAAC CGCTTGAGTA 1101 GTGGTGCCTG TCGGCACCCT 1151 ACCCGATTCA AATTGCCGGA 1201 ACGGCGGCTC TGCTGCTGCA 1251 GCGTACCACG TTGCTGACGA 1301 ACAGCAAGTT CGGCTGGGGA 1351 CCCGCGTCCT TTCCGTTCGG 1401 CGATATTGCC TACTCCTTCC 1451 TCAAAAAAGG CGGCAGCCAA 1501 GGCAAAACCA TTATCGAAGG 1551 ATCGGATATG CGCGTCGAAA 1601 CATCCGGCGG CAGCCTGAAC 1651 GACCAATCCG GCGCAAACGA 1701 GGACGGCAAA GGTACGCTGT 1751 ACGGTACGGC GATTATCGGC 1801 GGGGCAGGCT ATCTCAACAG 1851 CGCCAAAATC GGGCAGGATT 1901 GCGGCCTGCT GGCTTCCCTC 1951 GGCGACACGC TGTCCTATTA 2001 TTCGGCAGCG GCACATTCCG 2051 AGGGCGGCAG CAATCTGGAA 2101 TCATCCGCAA CACCCGAGAC 2151 TATGCCGGGC ATCCGCCCCT 2201 TACAGCATGC GAATGCCGCC 2251 GCTACCGTCT ATGCCGACAG 2301 CCGCCTGAAA GCCGTATCGG 2351 GCGTCATCGC GCAAACCCAA 2401 GTTGAAGGCA AAATGCGCGG 2451 AACCGGCGAA AATACGACAG 2501 . CATGGAGCGA AAACAGTGCA 2551 GCAGGCATAC GGCACGATGC 2601 CTCCTACGGA CGCTACAAAA 2651 AACATGCGGA AGGCAGCGTC 2701 • GGCGGTGTCA ACGTTCCGTT 2751 CGGTCTGCGC TACGACCTGC 2801 GTGCTTTGGG CTGGAGCGGC 2851 CTCGCGGGTC TGAAGCTGTC
APLDHKDKGL QSLTLDQSVR KNEKLKLAAQ KVSRFDFIRQ IEVDGQLITL ESGEFQVYKQ KMVAKRQFRI GDIAGEHTSF DKLPEGGRAT FAAKQGNGKI EHLKSPELNV DLAAADIKPD YSLGIFGGKA QEVAGSAEVK TVNGIRHIGL
ÇAATGCAGGC GGTACCGGTA TCGGCAGCAA AATCAGCAGC AGTATCTTAC GCCGGTATCA AGAAGCATGC TCTGTGCCGG TCGGGATGAC TGCCAAAATC AATGCCCCCC CCCCGAATCT ACCCAAATGA CGCATACAAG AATTTGATCA GCAGGCTATA CAGGACGCGG GGTAGAGGTA ATCCGTCGGC AGCATATCCT TTCCCGAACT GCTATAACGA AAATTACAAA AACTATACGG CCTGAAGACG GAGGCGGTAA AGACATTGAA CGTTATAGAG ACTGAAGCAA AGCCGACGGA TCGGACACAT CGATTTGGTC TCCCATATTA GGCAGACCTG CAGGCGGTAT TGCGCCCGAT TACGAATGAT GAAACCAAGA ACGAAATGAT CATGGGTCAA GCTGGGCGAA CGTGGCGTGC GGAACAACAT CGAGGGCAGG CACTGCCGAC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA CAGACGAGGG TATCCGCCTG ATGCAACAGA TACCACATCC GTAATAAAAA CATGCTTTTC CGCACAAGCT CAGCCCAACA CATATGCCCT ACGCTCAAAA AGGCATTATC ACAGTCGCAG AAGTTCAAAC GGGAAATGTA TGGAGAACCG TGGCTCCAAC CATTGCGGAA TTACTGCCAT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA ACATCCTTTT CCGCACCCAT CGTAACCGGC GAAATACCCG TGGATGAGCA ACGACAACCT CGGCTCAGGA CATCGGTGCA GTCGGCGTGG CTGCTGGATG CGGGTAAGGC CATGAACGGA CGACTTTACC GCCGATACGA AAGGTACATC GTAACGACAT TTCAGGCACG GGCGGCCTGA CTGCAACTGC ACGGCAACAA CACCTATACG CGGTTCGCTG GTGTTGTACG GCAACAACAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG AGCGACGGCA TTGTCTATCT GGCAGATACC AACCGTACAC ATCAAAGGCA GTCTGCAGCT ACACACGTTT GGGCAAACTG CTGAAAGTGG GGCAAGCTGT ACATGTCGGC ACGCGGCAAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC ATTCTTTCTT CACAAACATC GAAACCGACG GACAGCGTCG AAAAAACAGC GGGCAGTGAA TGTCCGTCGC GGCAATGCGG CACGGACTGC CGCCCGCCGG TCTGAAACAC GCCGTAGAAC AACCTGATGG TCGAACTGGA TGCCTCCGAA GGTTGAAACT GCGGCAGCCG ACCGCACAGA ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG GACGGTGTAC GCATCTTCAA CAGTCTCGCC TACCGCCGCC CATGCCGATA TGCAGGGACG ACGGGTTGGA CCACAACGGC ACGGGTCTGC CAGGACGGTG GAACGTGGGA ACAGGGCGGT CAGTACCCAA ACCGTCGGCA TTGCCGCGAA CAGCCGCCAC ACTGGGCATG GGACGCAGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT GGGCGATATC GGCTATCTCA AAGGCCTGTT ACAGCATCAG CCGCAGCACC GGTGCGGACG AACGGCACGC TGATGCAGCT GGGCGCACTG TGCCGCAACG GGAGATTTGA CGGTCGAAGG TCAAACAGGA TGCÂTTCGCC GAAAAAGGCA AACAGCCTCA CTGAAGGCAC GCTGGTCGGA GCAACCCTTG AGCGATAAAG CCGTCCTGTT 61
61 2901 TGCAACGGCG 2951 CGGGCGGCTT 3001 AATATGCCGC 3051 CGGCAACGGC 3101 AGTACGGCAA 3151 GGTGGCGGAG 3201 TGCCACTGTG 3251 GTTTCAAAGC 3301 ACCAAAAAAG 3351 TCTGGGTCTG 3401 ACAAACAAAA. 3451 AAGTTAACAA 3501 TGCCGCTCTG 3551 TAACGACATT 3601 AAATTAGAAG 3651 CGATATCGCC 3701 TCAAAACCGC 3751 GTCGATGCCA 3801 TGCCGCTGGC 3851 CAAAAGTTAC 3901 GCTAAAAAAG 3951 CAAATTTGTC 4001 CACGCTTGGC 4051 AACGGTTTGG 4101 CCTTGCAGAA 4151 GTCGGTTCAA 4201 GTCGCCATCG 4251 AGGCGTGGCA 4301 GCGTCAATTA 1 MTSAPDFNAG 51 VAVTDRDAKI 101 GIVDTGESVG 151 ASFDDEAVIE 201 ATLHIMNTND 251 LFQIANSEEQ 301 IFSTGNDAQA 351 GTEPLEYGSN 401 TAALLLQKYP 451 PASFPFGDFT 501 GKTIIEGGSL 551 DQSGANETVH 601 GAGYLNSTGR 651 GDTLSYYVRR 701 SSATPETVET 751 ATVYADSTAA 801 VEGKMRGSTQ 851 AGIRHDAGDI 901 GGVNVPFAAT 951 LAGLKLSQPL 1001 NMPHTRLVAG 1051 GGGGTGSATN 1101 TKKDATAADV 1151 KLTTKLADTD 1201 KLEAVADTVD 1251 VDAKVKAAET 1301 AKKANSADVY 1351 NGLDKTVSDL 1401 VAIGTGFRFT
GGCGTGGAAC GCGACCTGAA TACCGGCGCG ACTGCAGCAA ACACCCGTCT GGTTGCCGGC TGGAACGGCT TGGCACGTTA CCACAGCGGA CGAGTCGGCG GCACTGGATC CGCCACAAAC GCCATTGCTG CTGCCTACAA TGGAGAGACC ATCTACGACA ACGCAACTGC AGCCGATGTT AAAAAAGTCG TGACTAACCT CGTCGATGCC AAAGTAAAAG CCAAGTTAGC AGACACTGAT GATGCAACCA CCAACGCCTT TGCTGAAGAG ACTAAGACAA CCGTGGCTGA TACCGTCGAC GATTCATTGG ATGAAACCAA CAATGAAGCC AAACAGACGG AAGTAAAAGC TGCAGAAACT ACAGCTAATA CTGCAGCCGA CGACATCAAA GCTGATATCG CAAACAGTGC CGACGTGTAC AGAATTGATG GTCTGAACGC TTCTGCTGAA AAATCCATTG ATAAAACAGT GTCAGACCTG CAAGCCGCGC TCTCCGGTCT TGTAACGGCT GCAGTCGGCG GTACCGGCTT CCGCTTTACC GTCGGCACTT CGTCCGGTTC CGAGTGGCTC GAGCACCACC
GTGIGSNSRA TTAKSAAVSY NAPPPNLHTG DFPNPNDAYK SISFPELYGR KEHGYNENYK TEAKPTDIRH VKEIGHIDLV ETKNEMMVAA IRNAWVKLGE YRQALLDYSG GDKTDEGIRL QPNTYALLPF YEKDAQKGII HCGITAMWCL SAPYEASVRF WMSNDNLRTT LLTTAQDIGA ADTKGTSDIA YSFRNDISGT VLYGNNKSDM RVETKGALIY IKGSLQLDGK GTLYTRLGKL RVPFLSAAKI GQDYSFFTNI GNAARTASAA AHSAPAGLKH AAADRTDMPG IRPYGATFRA HADMQGRRLK AVSDGLDHNG TVGIAAKTGE NTTAAATLGM GYLKGLFSYG RYKNSISRST GDLTVEGGLR YDLLKQDAFA SDKAVLFATA GVERDLNGRD LGADVEFGNG WNGLARYSYA DDDVKKAATV AIAAAYNNGQ EADDFKGLGL KKWTNLTKT AALADTDAAL DATTNALNKL KHAEAFNDIA DSLDETNTKA AAGKAEAAAG TANTAADKAE TREESDSKFV RIDGLNATTE RKETRQGLAE QAALSGLFQP ENFAAKAGVA VGTSSGSSAA
CGGACGCGAC TACACGGTAA CCGGCAAGAC GGGGGCACGC CTGGGCGCGG ATGTCGAATT CAGCTACGCC GGTTCCAAAC TAGGCTACCG GTTCCTCGAG GACGACGATG TTAAAAAAGC CAATGGCCAA GAAATCAACG TTGATGAAGA CGGCACAATT GAAGCCGACG ACTTTAAAGG GACCAAAACC GTCAATGAAA CTGCAGAATC TGAAATAGAA GCCGCTTTAG CAGATACTGA GAATAAATTG GGAGAAAATA ATATCGTAAA AATTGATGAA AAGCATGCCG AAGCATTCAA CACTAAGGCA GACGAAGCCG CCGAAGAAAC CAAACAAAAC GCAGCAGGCA AAGCCGAAGC CAAGGCCGAA GCTGTCGCTG CTACGAACAA AGATAATATT ACCAGAGAAG AGTCTGACAG TACTACCGAA AAATTGGACA CCGATCACGA TACTCGCCTG CGCAAAGAAA CCCGCCAAGG GTTCCAACCT TACAACGTGG GCTACAAATC CGAATCGGCA GAAAACTTTG CCGCCAAAGC TTCCGCAGCC TACCATGTCG ACCACCACCA CTGA AGIKNEMCKD RSMLCAGRDD NLINLKPAIE AGYTGRGVEV NYTAYMRKEA PEDGGGKDIE SHIIGGRSVD GRPAGGIAPD RGVRIVNNSF GTTSRAGTAD MQQSDYGNLS YHIRNKNMLF TVAGVDRSGE KFKREMYGEP TRTNPIQIAG TSFSAPIVTG VGVDSKFGWG LLDAGKAMNG GGLIKKGGSQ LQLHGNNTYT NGAASGGSLN SDGIVYLADT LKVDGTAIIG GKLYMSARGK ETDGGLLASL DSVEKTAGSE AVEQGGSNLE NLMVELDASE AAAVQHANAA DGVRIFNSLA TGLRVIAQTQ QDGGTWEQGG GRSTWSENSA NAKTDSISLF GADEHAEGSV NGTLMQLGAL EKGSALGWSG NSLTEGTLVG YTVTGGFTGA TAATGKTGAR GSKQYGNHSG RVGVGYRFLE EINGFKAGET IYDIDEDGTI VNENKQNVDA KVKAAESEIE GENITTFAEE TKTNIVKIDE DEAVKTANEA KQTAEETKQN AVAAKVTDIK ADIATNKDNI KLDTRLASAE KSIADHDTRL YNVGRFNVTA AVGGYKSESA YHVGVNYEWL EHHHHHH* AG983-961e
1 ATGACTTCTG CGCCCGACTT CAATGCAGGC GGTACCGGTA TCGGCAGCAA 51 CAGCAGAGCA ACAACAGCGA AATCAGCAGC AGTATCTTAC GCCGGTATCA 101 AGAACGAAAT GTGCAAAGAC AGAAGCATGC TCTGTGCCGG TCGGGATGAC 151 GTTGCGGTTA CAGACAGGGA TGCCAAAATC AATGCCCCCC CCCCGAATCT 201 GCATACCGGA GACTTTCCAA ACCCAAATGA CGCATACAAG AATTTGATCA 62
251 ACCTCAAACC TGCAATTGAA GCAGGCTATA CAGGACGCGG GGTAGAGGTA 301 GGTATCGTCG ACACAGGCGA ATCCGTCGGC AGCATATCCT TTCCCGAACT 351 GTATGGCAGA AAAGAACACG GCTATAACGA AAATTACAAA AACTATACGG 401 CGTATATGCG GAAGGAAGCG CCTGAAGACG GAGGCGGTAA AGACATTGAA 451 GCTTCTTTCG ACGATGAGGC CGTTATAGAG ACTGAAGCAA AGCCGACGGA 501 TATCCGCCAC GTAAAAGAAA TCGGACACAT CGATTTGGTC TCCCATATTA 551 TTGGCGGGCG TTCCGTGGAC GGCAGACCTG CAGGCGGTAT TGCGCCCGAT 601 GCGACGCTAC ACATAATGAA TACGAATGAT GAAAGCAAGA ACGAAATGAT 651 GGTTGCAGCC ATCCGCAATG CATGGGTCAA GCTGGGCGAA CGTGGCGTGC 701 GCATCGTCAA TAACAGTTTT GGAACAACAT CGAGGGCAGG CACTGCCGAC 751 CTTTTCCAAA TAGCCAATTC GGAGGAGCAG TACCGCCAAG CGTTGCTCGA 801 CTATTCCGGC GGTGATAAAA CAGACGAGGG TATCCGCCTG ATGCAACAGA 851 GCGATTACGG CAACCTGTCC TACCACATCC GTAATAAAAA CATGCTTTTC 901 ATCTTTTCGA CAGGCAATGA CGCACAAGCT CAGCCCAACA CATATGCCCT 951 ATTGCCATTT TATGAAAAAG ACGCTCAAAA AGGCATTATC ACAGTCGCAG 1001 GCGTAGACCG CAGTGGAGAA AAGTTCAAAC GGGAAATGTA TGGAGAACCG 1051 GGTACAGAAC CGCTTGAGTA TGGCTCCAAC CATTGCGGAA TTACTGCCAT 1101 GTGGTGCCTG TCGGCACCCT ATGAAGCAAG CGTCCGTTTC ACCCGTACAA 1151 ACCCGATTCA AATTGCCGGA ACATCCTTTT CCGCACCCAT CGTAACCGGC 1201 ACGGCGGCTC TGCTGCTGCA GAAATACCCG TGGATGAGCA ACGACAACCT 1251 GCGTACCACG TTGCTGACGA CGGCTCAGGA CATCGGTGCA GTCGGCGTGG 1301 ACAGCAAGTT CGGCTGGGGA CTGCTGGATG CGGGTAAGGC CATGAACGGA 1351. CCCGCGTÇCT TTCCGTTCGG CGACTTTACC GCCGATACGA AAGGTACATC 1401 CGATATTGCC TACTCCTTCC GTAACGACAT TTCAGGCACG GGCGGCCTGA 1451 TCAAAAAAGG CGGCAGCCAA CTGCAACTGC ACGGCAACAA CACCTATACG 1501 GGCAAAACCA TTATCGAAGG CGGTTCGCTG GTGTTGTACG GCAACAACAA 1551 ATCGGATATG CGCGTCGAAA CCAAAGGTGC GCTGATTTAT AACGGGGCGG 1601' CATCCGGCGG CAGCCTGAAC AGCGACGGCA TTGTCTATCT GGCAGATACC 1651 GACCAATCCG GCGCAAACGA AACCGTACAC ATCAAAGGCA GTCTGCAGCT 1701 GGACGGCAAA GGTACGCTGT ACACACGTTT GGGCAAACTG CTGAAAGTGG 1751 ACGGTACGGC GATTATCGGC GGCAAGCTGT ACATGTCGGC ACGCGGCAAG 1801 GGGGCAGGCT ATCTCAACAG TACCGGACGA CGTGTTCCCT TCCTGAGTGC 1851 CGCCAAAATC GGGCAGGATT ATTCTTTCTT CACAAACATC GAAACCGACG 1901 GCGGCCTGCT GGCTTCCCTC GACAGCGTCG AAAAAACAGC GGGCAGTGAA 1951 GGCGACACGC TGTCCTATTA TGTCCGTCGC GGCAATGCGG CACGGACTGC 2001 TTCGGCAGCG GCACATTCCG CGCCCGCCGG TCTGAAACAC GCCGTAGAAC 2051 AGGGCGGCAG CAATCTGGAA AACCTGATGG TCGAACTGGA TGCCTCCGAA 2101 TCATCCGCAA CACCCGAGAC GGTTGAAACT GCGGCAGCCG ACCGCACAGA 2151 TATGCCGGGC ATCCGCCCCT ACGGCGCAAC TTTCCGCGCA GCGGCAGCCG 2201 TACAGCATGC GAATGCCGCC GACGGTGTAC GCATCTTCAA CAGTCTCGCC 2251 GCTACCGTCT ATGCCGACAG TACCGCCGCC CATGCCGATA TGCAGGGACG 2301 CCGCCTGAAA GCCGTATCGG ACGGGTTGGA CCACAACGGC ACGGGTCTGC 2351 GCGTCATCGC GCAAACCCAA CAGGACGGTG GAACGTGGGA ACAGGGCGGT 2401 GTTGAAGGCA AAATGCGCGG CAGTACCCAA ACCGTCGGCA TTGCCGCGAA 2451 AACCGGCGAA AATACGACAG CAGCCGCCAC ACTGGGCATG GGACGCAGCA 2501 CATGGAGCGA AAACAGTGCA AATGCAAAAA CCGACAGCAT TAGTCTGTTT 2551 GCAGGCATAC GGCACGATGC GGGCGATATC GGCTATCTCA AAGGCCTGTT 2 601 CTCCTACGGA CGCTACAAAA ACAGCATCAG CCGCAGCACC GGTGCGGACG
2651 AACATGCGGA AGGCAGCGTC AACGGCACGC TGATGCAGCT GGGCGCACTG 2701 GGCGGTGTCA ACGTTCCGTT TGCCGCAACG GGAGATTTGA CGGTCGAAGG 2751 CGGTCTGCGC TACGACCTGC TCAAACAGGA TGCATTCGCC GAAAAAGGCA 2801 GTGCTTTGGG CTGGAGCGGC AACAGCCTCA CTGAAGGCAC GCTGGTCGGA 2851 CTCGCGGGTC TGAAGCTGTC GCAACCCTTG AGCGATAAAG CCGTCCTGTT 2901 TGCAACGGCG GGCGTGGAAC GCGACCTGAA CGGACGCGAC TACACGGTAA 2951 CGGGCGGCTT TACCGGCGCG ACTGCAGCAA CCGGCAAGAC GGGGGCACGC 3001 AATATGCCGC ACACCCGTCT GGTTGCCGGC CTGGGCGCGG ATGTCGAATT 3051 CGGCAACGGC TGGAACGGCT TGGCACGTTA CAGCTACGCC GGTTCCAAAC 3101 AGTACGGCAA CCACAGCGGA CGAGTCGGCG TAGGCTACCG GTTCCTCGAG 3151 GGTGGCGGAG GCACTGGATC CGCCACAAAC GACGACGATG TTAAAAAAGC 3201 TGCCACTGTG GCCATTGCTG CTGCCTACAA CAATGGCCAA GAAATCAACG 3251 GTTTCAAAGC TGGAGAGACC ATCTACGACA TTGATGAAGA CGGCACAATT 3301 ACCAAAAAAG ACGCAACTGC AGCCGATGTT GAAGCCGACG ACTTTAAAGG 3351 TCTGGGTCTG AAAAAAGTCG TGACTAACCT GACCAAAACC GTCAATGAAA 3401 ACAAACAAAA CGTCGATGCC AAAGTAAAAG CTGCAGAATC TGAAATAGAA 3451 AAGTTAACAA CCAAGTTAGC ÁGACACTGAT GCCGCTTTAG CAGATACTGA 3501 TGCCGCTCTG GATGCAACCA CCAACGCCTT GAATAAATTG GGAGAAAATA 3551 TAACGACATT TGCTGAAGAG ACTAAGACAA ATATCGTAAA AATTGATGAA 63
3601 AAATTAGAAG CCGTGGCTGA TACCGTCGAC AAGCATGCCG AAGCATTCAA
3651 CGATATCGCC GATTCATTGG ATGAAACCAA CACTAAGGCA GACGAAGCCG
3701 TCAAAACCGC CAATGAAGCC AAACAGACGG CCGAAGAAAC CAAACAAAAC
3751 GTCGATGCCA AAGTAAAAGC TGCAGAAACT GCAGCAGGCA AAGCCGAAGC 3801 TGCCGCTGGC ACAGCTAATA CTGCAGCCGA CAAGGCCGAA GCTGTCGCTG'
3851 CAAAAGTTAC CGACATCAAA GCTGATATCG CTACGAACAA AGATAATATT
3901 GCTAAAAAAG CAAACAGTGC CGACGTGTAC ACCAGAGAAG AGTCTGACAG
3951 CAAATTTGTC AGAATTGATG GTCTGAACGC TACTACCGAA AAATTGGACA
4001 CACGCTTGGC TTCTGCTGAA AAATCCATTG CCGATCACGA TACTCGCCTG
4051 AACGGTTTGG ATAAAACAGT GTCAGACCTG CGCAAAGAAA CCCGCCAAGG
4101 CCTTGCAGAA CAAGCCGCGC TCTCCGGTCT GTTCCAACCT TACAACGTGG
4151 GTCTCGAGCA CCACCACCAC CACCACTGA
1 MTSAPDFNAG GTGIGSNSRA TTAKSAAVSY AGIKNEMCKD RSMLCAGRDD
51 VAVTDRDAKI NAPPPNLHTG DFPNPNDAYK NLINLKPAIE AGYTGRGVEV
101 GIVDTGESVG SISFPELYGR KEHGYNENYK NYTAYMRKEA PEDGGGKDIE
151 ASFDDEAVIE TEAKPTDIRH VKEIGHIDLV SHI1GGRSVD GRPAGGIAPD
201 ATLHIMNTND ETKNEMMVAA IRNAWVKLGE RGVRIVNNSF GTTSRAGTAD
251 LFQIANSEEQ YRQALLDYSG GDKTDEGIRL MQQSDYGNLS YHIRNKNMLF
301 IFSTGNDAQA QPNTYALLPF YEKDAQKGII TVAGVDRSGE KFKREMYGEP
351 GTEPLEYGSN HCGITAMWCL SAPYEASVRF TRTNPIQIAG TSFSAPIVTG
401 TAALLLQKYP WMSNDNLRTT LLTTAQDIGA VGVDSKFGWG LLDAGKAMNG
451 PASFPFGDFT ADTKGTSDIA YSFRNDISGT GGLIKKGGSQ LQLHGNNTYT
501 GKTIIEGGSL VLYGNNKSDM RVETKGALIY NGAASGGSLN SDGIVYLADT
551 DQSGANETVH IKGSLQLDGK GTLYTRLGKL LKVDGTAIIG GKLYMSARGK
601 GAGYLNSTGR RVPFLSAAKI GQDYSFFTNI ETDGGLLASL DSVEKTAGSE
651 GDTLSYYVRR GNAARTASAA AHSAFAGLKH AVEQGGSNLE NLMVELDASE
701 SSATPETVET AAADRTDMPG IRPYGATFRA AAAVQHANAA DGVRIFNSLA
751 ATVYADSTAA HADMQGRRLK AVSDGLDHNG TGLRVIAQTQ QDGGTWEQGG
801 VEGKMRGSTQ TVGIAAKTGE NTTAAATLGM GRSTWSENSA NAKTDSISLF
851 AGIRHDAGDI GYLKGLFSYG RYKNS1SRST GADEHAEGSV NGTLMQLGAL
901 GGVNVPFAAT GDLTVEGGLR YDLLKQDAFA EKGSALGWSG NSLTEGTLVG
951 LAGLKLSQPL SDKAVLFATA GVERDLNGRD YTVTGGFTGA TAATGKTGAR
1001 NMPHTRLVAG LGADVEFGNG WNGLARYSYA GSKQYGNHSG RVGVGYRFLE
1051 GGGGTGSATN DDDVKKAATV AIAAAYNNGQ EINGFKAGET IYDIDEDGTI
1101 TKKDATAADV EADDFKGLGL KKWTNLTKT VNENKQNVDA KVKAAESEIE
1151 KLTTKLADTD AALADTDAAL DATTNALNKL GENITTFAEE TKTNIVKIDE
1201 KLEAVADTVD KHAEAFNDIA DSLDETNTKA DEAVKTANEA KQTAEETKQN
1251 VDAKVKAAET AAGKAEAAAG TANTAADKAE AVAAKVTDIK ADIATNKDNI
1301 AKKANSADVY TREESDSKFV RIDGLNATTE KLDTRLASAE KSIADHDTRL 1351 NGLDKTVSDL RKETRQGLAE QAALSGLFQP YNVGLEHHHH HH* ÚG741 e híbridos
Os títulos bactericidas gerados em resposta a AG741 (fusão His) foram medidos contra várias estirpes, incluindo a estirpe 2996 homóloga: 2996 MC58 NGH38 F6124 BZ133 AG741 512 131072 >2048 16384 >2048
Como se pode observar, o título anti-bactericida induzido pela AG741 é particularmente elevado contra a estirpe MC58 heteróloga. AG741 também foi fundida diretamente in-frame ascendente das proteínas 961, 961c, 983 e OR46.1: AG741-961
1 ATGGTCGCCG CCGACATCGG TGCGGGGCTT GCCGATGCAC TAACCGCACC 51 GCTCGACCAT AAAGACAAAG GTTTGCAGTC TTTGACGCTG GATCAGTCCG 101 TCAGGAAAAA CGAGAAACTG AAGCTGGCGG CACAAGGTGC GGAAAAAACT 151 TATGGAAACG GTGACAGCCT CAATACGGGC AAATTGAAGA ACGACAAGGT 201 CAGCCGTTTC GACTTTATCC GCCAAATCGA AGTGGACGGG CAGCTCATTA 65
65 251 CCTTGGAGAG 301 ACCGCCTTTC 351 GGTTGCGAAA 401 CTTTTGACAA 451 TTCGGTTCAG 501 CGCCAAGCAG 551 ATGTCGACCT 601 GTCATCAGCG 651 CCTCGGTATC 7Ó1 TGAAAACCGT 751 GAGGGTGGCG 801 AGCTGCCACT 851 ACGGTTTCAA 901 ATTACCAAAA 951 AGGTCTGGGT 1001 AAAACAAACA 1051 GAAAAGTTAA 1101 TGATGCCGCT 1151 ATATAACGAC 1201 GAAAAATTAG 1251 CAACGATATC 1301 CCGTCAAAAC 1351 AACGTCGATG 1401 AGCTGCCGCT 1451 CTGCAAAAGT 1501 ATTGCTAAAA 1551 CAGCAAATTT 1601 ACACACGCTT 1651 CTGAACGGTT 1701 AGGCCTTGCA 1751 TGGGTCGGTT 1801 GCAGTCGCCA 1851 AGCAGGCGTG 1901 TCGGCGTCAA 1 MVAADIGAGL 51 YGNGDSLNTG 101 TAFQTEQIQD 151 FGSDDAGGKL 201 VISGSVLYNQ 251 EGGGGTGSAT 301 ITKKDATAAD 351 EKLTTKLADT 401 EKLEAVADTV 451 NVDAKVKAAE 501 IAKKANSADV 551 LNGLDKTVSD 601 AVAIGTGFRF
TGGAGAGTTC CAAGTATACA AGACCGAGCA AATACAAGAT CGCCAGTTCA GAATCGGCGA GCTTCCCGAA GGCGGCAGGG ACGATGCCGG CGGAAAACTG GGAAACGGCA AAATCGAACA GGCCGCCGCC GATATCAAGC GTTCCGTCCT TTACAACCAA TTTGGCGGAA AAGCCCAGGA AAACGGCATA CGCCATATCG GAGGCACTGG ATCCGCCACA GTGGCCATTG CTGCTGCCTA AGCTGGAGAG ACCATCTACG AAGACGCAAC TGCAGCCGAT CTGAAAAAAG TCGTGACTAA AAACGTCGAT GCCAAAGTAA CAACCAAGTT AGCAGACACT CTGGATGCAA CCACCAACGC ATTTGCTGAA GAGACTAAGA AAGCCGTGGC TGATACCGTC GCCGATTCAT TGGATGAAAC CGCCAATGAA GCCAAACAGA CCAAAGTAAA AGCTGCAGAA GGCACAGCTA ATACTGCAGC TACCGACATC AAAGCTGATA AAGCAAACAG TGCCGACGTG GTCAGAATTG ATGGTCTGAA GGCTTCTGCT GAAAAATCCA TGGATAAAAC AGTGTCAGAC GAACAAGCCG CGCTCTCCGG CAATGTAACG GCTGCAGTCG TCGGTACCGG CTTCCGCTTT GCAGTCGGCA CTTCGTCCGG TTACGAGTGG CTCGAGCACC
ADALTAPLDH KDKGLQSLTL KLKNDKVSRF DFIRQIEVDG SEHSGKMVAK RQFRIGDIAG TYTIDFÂAKQ GNGKIEHLKS AEKGSYSLGI FGGKAQEVAG NDDDVKKAAT VAIAAAYNNG VEADDFKGLG LKKWTNLTK DAALADTDAA LDATTNALNK DKHAEAFNDI ADSLDETNTK TAAGKAEÁAA GTANTAADKA YTREESDSKF VRIDGLNATT LRKETRQGLA EQAALSGLFQ TENFAAKAGV AVGTSSGSSA
AACAAAGCCA TTCCGCCTTA TCGGAGCATT CCGGGAAGAT CATAGCGGGC GAACATACAT CGACATATCG CGGGACGGCG ACCTACACCA TAGATTTCGC TTTGAAATCG CCAGAACTCA CGGATGGAAA ACGCCATGCC GCCGAGAAAG GCAGTTACTC AGTTGCCGGC AGCGCGGAAG GCCTTGCCGC CAAGCAACTC AACGACGACG ATGTTAAAAA CAACAATGGC CAAGAAATCA ACATTGATGA AGACGGCACA GTTGAAGCCG ACGACTTTAA CCTGACCAAA ACCGTCAATG AAGCTGCAGA ATCTGAAATA GATGCCGCTT TAGCAGATAC CTTGAATAAA TTGGGAGAAA CAAATATCGT AAAAATTGAT GACAAGCATG CCGAAGCATT CAACACTAAG GCAGACGAAG CGGCCGAAGA AACCAAACAA ACTGCAGCAG GCAAAGCCGA CGACAAGGCC GAAGCTGTCG TCGCTACGAA CAAAGATAAT TACACCAGAG AAGAGTCTGA CGCTACTACC GAAAAATTGG TTGCCGATCA CGATACTCGC CTGCGCAAAG AAACCCGCCA TCTGTTCCAA CCTTACAACG GCGGCTACAA ATCCGAATCG ACCGAAAACT TTGCCGCCAA TTCTTCCGCA GCCTACCATG ACCACCACCA CCACTGA DQSVRKNEKL KLAAQGAEKT QLITLESGEF QVYKQSHSAL EHTSFDKLPE GGRATYRGTA PELNVDLAAA DIKPDGKRHA SAEVKTVNGI RHIGLAAKQL QEINGFKAGE TIYDIDEDGT TVNENKQNVD AKVKAAESEI LGENITTFAE ETKTNIVKID ADEAVKTANE'AKQTAEETKQ EAVAAKVTDI KADIATNKDN EKLDTRLASA EKSIADHDTR PYNVGRFNVT AAVGGYKSES AYHVGVNYEW LEHHHHHH*
AG741- -961c 1 ATGGTCGCCG 51 GCTCGACCAT 101 TCAGGAAAAA 151 TATGGAAACG 201 CAGCCGTTTC 251 CCTTGGAGAG 301 ACCGCCTTTC 351 GGTTGCGAAA 401 CTTTTGACAA 451 TTCGGTTCAG 501 CGCCAAGCAG 551 ATGTCGACCT 601 GTCATCAGCG 651 CCTCGGTATC 701 TGAAAACCGT 751 GAGGGTGGCG
CCGACATCGG TGCGGGGCTT AAAGACAAAG GTTTGCAGTC CGAGAAACTG AAGCTGGCGG GTGACAGCCT CAATACGGGC GACTTTATCC GCCAAATCGA TGGAGAGTTC CAAGTATACA AGACCGAGCA AATACAAGAT CGCCAGTTCA GAATCGGCGA GCTTCCCGAA GGCGGCAGGG ACGATGCCGG CGGAAAACTG GGAAACGGCA AAATCGAACA GGCCGCCGCC GATATCAAGC GTTCCGTCCT TTACAACCAA TTTGGCGGAA AAGCCCAGGA AAACGGCATA CGCCATATCG GAGGCACTGG ATCCGCCACA
GCCGATGCAC TAACCGCACC TTTGACGCTG GATCAGTCCG CACAAGGTGC GGAAAAAACT AAATTGAAGA ACGACAAGGT AGTGGACGGG CAGCTCATTA AACAAAGCCA TTCCGCCTTA TCGGAGCATT CCGGGAAGAT CATAGCGGGC GAACATACAT CGACATATCG CGGGACGGCG ACCTACACCA TAGATTTCGC TTTGAAATCG CCAGAACTCA CGGATGGAAA ACGCCATGCC GCCGAGAAAG GCAGTTACTC AGTTGCCGGC AGCGCGGAAG GCCTTGCCGC CAAGCAACTC AACGACGACG ATGTTAAAAA 66
801 AGCTGCCACT GTGGCCATTG 851 ACGGTTTCAA AGCTGGAGAG 901 ATTACCAAAA AAGACGCAAC 951 AGGT.CTGGGT CTGAAAAAAG 1001 AAAACAAACA AAACGTCGAT 1051 GAAAAGTTAA CAACCAAGTT 1101 TGATGCCGCT CTGGATGCAA 1151 ATATAACGAC ATTTGCTGAA 1201 GAAAAATTAG AAGCCGTGGC 1251 CAACGATATC GCCGATTCAT 1301 CCGTCAAAAC CGCCAATGAA 1351 AACGTCGATG CCAAAGTAAA 1401- AGCTGCCGCT GGCACAGCTA 1451 CTGCAAAAGT TACCGACATC 1501 ATTGCTAAAA AAGCAAACAG 1551 CAGCAAATTT GTCAGAATTG 1601 ACACACGCTT GGCTTCTGCT 1651 CTGAACGGTT TGGATAAAAC 1701 AGGCCTTGCA GAACAAGCCG 1751 TGGGTCTCGA GCACCACCAC 1 MVAADIGAGL ADALTAPLDH 51 YGNGDSLNTG KLKNDKVSRF 101 TAFQTEQIQD SEHSGKMVAK 151 FGSDDAGGKL TYTIDFAAKQ 201 VISGSVLYNQ AEKGSYSLGI 251 EGGGGTGSAT NDDDVKKAAT 301 ITKKDATAAD VEADDFKGLG 351 EKLTTKLADT DAALADTDAA 401 EKLEAVADTV DKHAEAFNDI 451 NVDAKVKAAE TAAGKAEAAA 501 IAKKANSADV YTREESDSKF 551 LNGLDKTVSD LRKETRQGLA
CTGCTGCCTA CAACAATGGC CAAGAAATCA ACCATCTACG ACATTGATGA AGACGGCACA TGCAGCCGAT GTTGAAGCCG ACGACTTTAA TCGTGACTAA CCTGACCAAA ACCGTCAATG GCCAAAGTAA AAGCTGCAGA ATCTGAAATA AGCAGACACT GATGCCGCTT TAGCAGATAC CCACCAACGC CTTGAATAAA TTGGGAGAAA GAGACTAAGA CAAATATCGT AAAAATTGAT TGATACCGTC GACAAGCATG CCGAAGCATT TGGATGAAAC CAACACTAAG GCAGACGAAG GCCAAACAGA CGGCCGAAGA AACCAAACAA AGCTGCAGAA ACTGCAGCAG GCAAAGCCGA ATACTGCAGC CGACAAGGCC GAAGCTGTCG AAAGCTGATA TCGCTACGAA CAAAGATAAT TGCCGACGTG TACACCAGAG AAGAGTCTGA ATGGTCTGAA CGCTACTACC GAAAAATTGG GAAAAATCCA TTGCCGATCA CGATACTCGC AGTGTCAGAC CTGCGCAAAG AAACCCGCCA CGCTCTCCGG TCTGTTCCAA CCTTACAACG CACCACCACT GA KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT DFIRQIEVDG QLITLESGEF QVYKQSHSAL RQFRIGDIAG EHTSFDKLPE GGRATYRGTA GNGKIEHLKS PELKVDLAAA DIKPDGKRHA FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL VAIAAAYNNG QEINGFKAGE TIYDIDEDGT LKKVVTNLTK TVNENKQNVD AKVKAAESEI LDATTNALNK LGENITTFAE ETKTNIVKID ADSLDETNTK ADEAVKTANE AKQTAEETKQ GTANTAADKA EAVAAKVTDI KADIATNKDN VRIDGLNATT EKLDTRLASA EKSIADHDTR EQAALSGLFQ PYNVGLEHHH HHH* aG741—983
1 ATGGTCGCCG CCGACATCGG 51 GCTCGACCAT AAAGACAAAG 101 TCAGGAAAAA CGAGAAACTG 151 TATGGAAACG GTGACAGCCT 201 CAGCCGTTTC GACTTTATCC 251 CCTTGGAGAG TGGAGAGTTC 301 ACCGCCTTTC AGACCGAGCA 351 GGTTGCGAAA CGCCAGTTCA 401 CTTTTGACAA GCTTCCCGAA 451 TTCGGTTCAG ACGATGCCGG 501 CGCCAAGCAG GGAAACGGCA 551 ATGTCGACCT GGCCGCCGCC 601 GTCATCAGCG GTTCCGTCCT 651 CCTCGGTATC TTTGGCGGAA 701 TGAAAACCGT AAACGGCATA 751 GAGGGATCCG GCGGAGGCGG 801 TACCGGTATC GGCAGCAACA 851 TATCTTACGC CGGTATCAAG 901 TGTGCCGGTC GGGATGACGT 951 TGCCCCCCCC CCGAATCTGC 1001 CATACAAGAA TTTGATCAAC 1051 GGACGCGGGG TAGAGGTAGG 1101 CATATCCTTT CCCGAACTGT 1151 ATTACAAAAA CTATACGGCG 1201 GGCGGTAAAG ACATTGAAGC 1251 TGAAGCAAAG CCGACGGATA 1301 ATTTGGTCTC CCATATTATT 1351 GGCGGTATTG CGCCCGATGC 1401 AACCAAGAAC GAAATGATGG 1451 TGGGCGAACG TGGCGTGCGC 1501 AGGGCAGGCA CTGCCGACCT
TGCGGGGCTT GCCGATGCAC TAACCGCACC GTTTGCAGTC TTTGACGCTG GATCAGTCCG AAGCTGGCGG CACAAGGTGC GGAAAAAACT CAATACGGGC AAATTGAAGA ACGACAAGGT GCCAAATCGA AGTGGACGGG CAGCTCATTA CAAGTATACA AACAAAGCCA TTCCGCCTTA AATACAAGAT TCGGAGCATT CCGGGAAGAT GAATCGGCGA CATAGCGGGC GAACATACAT GGCGGCAGGG CGACATATCG CGGGACGGCG CGGAAAACTG ACCTACACCA TAGATTTCGC AAATCGAACA TTTGAAATCG CCAGAACTCA GATATCAAGC CGGATGGAAA ACGCCATGCC TTACAACCAA GCCGAGAAAG GCAGTTACTC AAGCCCAGGA AGTTGCCGGC AGCGCGGAAG CGCCATATCG GCCTTGCCGC CAAGCAACTC CACTTCTGCG CCCGACTTCA ATGCAGGCGG GCAGAGCAAC AACAGCGAAA TCAGCAGCAG AACGAAATGT GCAAAGACAG AAGCATGCTC TGCGGTTACA GACAGGGATG CCAAAATCAA ATACCGGAGA CTTTCCAAAC CCAAATGACG CTCAAACCTG CAATTGAAGC AGGCTATACA TATCGTCGAC ACAGGCGAAT CCGTCGGCAG ATGGCAGAAA AGAACACGGC TATAACGAAA TATATGCGGA AGGAAGCGCC TGAAGACGGA TTCTTTCGAC GATGAGGCCG TTATAGAGAC TCCGCCACGT AAAAGAAATC GGACACATCG GGCGGGCGTT CCGTGGACGG CAGACCTGCA GACGCTACAC ATAATGAATA CGAATGATGA TTGCAGCCAT CCGCAATGCA TGGGTCAAGC ATCGTCAATA ACAGTTTTGG AACAACATCG TTTCCAAATA GCCAATTCGG AGGAGCAGTA 67
CCGCCAAGCG TTGCTCGACT ATTCCGGCGG TGATAAAACA GACGAGGGTA TCCGCCTGAT GCAACAGAGC GATTACGGCA ACCTGTCCTA CCACATCCGT AATAAAAACA TGCTTTTCAT CTTTTCGACA GGCAATGACG CACAAGCTCA GCCCAACACA TATGCCCTAT TGCCATTTTA TGAAAAAGAC GCTCAAAAAG GCATTATCAC AGTCGCAGGC GTAGACCGCA GTGGAGAAAA GTTCAAACGG GAAATGTATG GAGAACCGGG TACAGAACCG CTTGAGTATG GCTCCAACCA TTGCGGAATT ACTGCCATGT GGTGCCTGTC GGCACCCTAT GAAGCAAGCG TCCGTTTCAC CCGTACAAAC CCGATTCAAA TTGCCGGAAC ATCCTTTTCC GCACCCATCG TAACCGGCAC GGCGGCTCTG CTGCTGCAGA AATACCCGTG GATGAGCAAC GACAACCTGC GTACCACGTT GCTGACGACG GCTCAGGACA TCGGTGCAGT CGGCGTGGAC AGCAAGTTCG GCTGGGGACT GCTGGATGCG GGTAAGGCCA TGAACGGACC CGCGTCCTTT CCGTTCGGCG ACTTTACCGC CGATACGAAA GGTACATCCG ATATTGCCTA CTCCTTCCGT AACGACATTT CAGGCACGGG CGGCCTGATC AAAAAAGGCG GCAGCCAACT GCAACTGCAC GGCAACAACA CCTATACGGG CAAAACCATT ATCGAAGGCG GTTCGCTGGT GTTGTACGGC AACAACAAAT CGGATATGCG CGTCGAAACC AAAGGTGCGC TGATTTATAA CGGGGCGGCA TCCGGCGGCA GCCTGAACAG CGACGGCATT GTCTATCTGG CAGATACCGA CCAATCCGGC GCAAACGAAA CCGTACACAT CAAAGGCAGT CTGCAGCTGG ACGGCAAAGG TACGCTGTAC ACACGTTTGG GCAAACTGCT GAAAGTGGAC GGTACGGCGA TTATCGGCGG CAAGCTGTAC ATGTCGGCAC GCGGCAAGGG GGCAGGCTAT CTCAACAGTA CCGGACGACG TGTTCCCTTC CTGAGTGCCG CCAAAATCGG GCAGGATTAT TCTTTCTTCA CAAACATCGA AACCGACGGC GGCCTGCTGG CTTCCCTCGA CAGCGTCGAA AAAACAGCGG GCAGTGAAGG CGACACGCTG TCCTATTATG TCCGTCGCGG CAATGCGGCA CGGACTGCTT CGGCAGCGGC ACATTCCGCG CCCGCCGGTC TGAAACACGC CGTAGAACAG GGCGGCAGCA ATCTGGAAAA CCTGATGGTC GAACTGGATG CCTCCGAATC ATCCGCAACA CCCGAGACGG TTGAAACTGC GGCAGCCGAC CGCACAGATA TGCCGGGCAT CCGCCCCTAC GGCGCAACTT TCCGCGCAGC GGCAGCCGTA CAGCATGCGA ATGCCGCCGA CGGTGTACGC ATCTTCAACA GTCTCGCCGC TACCGTCTAT GCCGACAGTA CCGCCGCCCA TGCCGATATG CAGGGACGCC GCCTGAAAGC CGTATCGGAC GGGTTGGACC ACAACGGCAC GGGTCTGCGC GTCATCGCGC AAACCCAACA GGACGGTGGA ACGTGGGAAC AGGGCGGTGT TGAAGGCAAA ATGCGCGGCA GTACCCAAAC CGTCGGCATT GCCGCGAAAA CCGGCGAAAA TÁCGACAGCA GCCGCCACAC TGGGCATGGG ACGCAGCACA TGGAGCGAAA ACAGTGCAAA TGCAAAAACC GACAGCATTA GTCTGTTTGC AGGCATACGG CACGATGCGG GCGATATCGG CTATCTCAAA GGCCTGTTCT CCTACGGACG CTACAAAAAC AGCATCAGCC GCAGCACCGG TGCGGACGAA CATGCGGAAG GCAGCGTCAA CGGCACGCTG ATGCAGCTGG GCGCACTGGG CGGTGTCAAC GTTCCGTTTG CCGCAACGGG AGATTTGACG GTCGAAGGCG GTCTGCGCTA CGACCTGCTC AAACAGGATG CATTCGCCGA AAAAGGCAGT GCTTTGGGCT GGAGCGGCAA CAGCCTCACT GAAGGCACGC TGGTCGGACT CGCGGGTCTG AAGCTGTCGC AACCCTTGAG CGATAAAGCC GTCCTGTTTG CAACGGCGGG CGTGGAACGC GACCTGAACG GACGCGACTA CACGGTAACG GGCGGCTTTA CCGGCGCGAC TGCAGCAACC GGCAAGACGG GGGCACGCAA TATGCCGCAC ACCCGTCTGG TTGCCGGCCT GGGCGCGGAT GTCGAATTCG GCAACGGCTG GAACGGCTTG GCACGTTACA GCTACGCCGG TTCCAAACAG TACGGCAACC ACAGCGGACG AGTCGGCGTA GGCTACCGGT TCCTCGAGCA CCACCACCAC CACCACTGA
MVAADIGAGL ADALTAPLDH KDKGLQSLTL DQSVRKNEKL KLAAQGAEKT YGNGDSLNTG KLKNDKVSRF DFIRQIEVDG QLITLESGEF QVYKQSHSAL TAFQTEQIQD SEHSGKMVAK RQFRIGDIAG EHTSFDKLPE GGRATYRGTA FGSDDAGGKL TYTIDFAAKQ GNGKIEHLKS PELNVDLAAA DIKPDGKRHA VISGSVLYNQ AEKGSYSLGI FGGKAQEVAG SAEVKTVNGI RHIGLAAKQL EGSGGGGTSA PDFNAGGTGI GSNSRATTAK SAAVSYAGIK NEMCKDRSML CAGRDDVAVT DRDAKINAPP PNLHTGDFPN PNDAYKNLIN LKPAIEAGYT GRGVEVGIVD TGESVGSISF PELYGRKEHG YNENYKNYTA YMRKEAPEDG GGKDIEASFD DEAVIETEAK PTDIRHVKEI GHIDLVSHII GGRSVDGRPA GGIAPDATLH IMNTNDETKN EMMVAAIRNA WVKLGERGVR IVNNSFGTTS RAGTADLFQI ANSEEQYRQA LLDYSGGDKT DEG1RLMQQS DYGNLSYHIR NKNMLFIFST GNDAQAQPNT YALLPFYEKD AQKGIITVAG VDRSGEKFKR EMYGEPGTEP LEYGSNHCGI TAMWCLSAPY EASVRFTRTN PIQIAGTSFS APIVTGTAAL LLQKYPWMSN DNLRTTLLTT AQDIGAVGVD SKFGWGLLDA GKAMNGPASF PFGDFTADTK GTSDIAYSFR NDISGTGGLI KKGGSQLQLH GNNTYTGKTI IEGGSLVLYG NNKSDMRVET KGALIYNGAA SGGSLNSDGI VYLADTDQSG ANETVHIKGS LQLDGKGTLY TRLGKLLKVD GTAIIGGKLY MSARGKGAGY LNSTGRRVPF LSAAKIGQDY SFFTNIETDG GLLASLDSVE 68
68 901 KTAGSEGDTL 951 ELDASESSAT 1001 IFNSLAATVY 1051 TWEQGGVEGK 1101 DSISLFAGIR 1151 MQLGALGGVN 1201 EGTLVGLAGL 1251 GKTGARNMPH 1301 GYRFLEHHHH SYYVRRGNAA RTASAAAHSA PETVETAAAD RTDMPGIRPY ADSTAAHADM QGRRLKAVSD MRGSTQTVGI AAKTGENTTA HDAGDIGYLK GLFSYGRYKN VPFAATGDLT VEGGLRYDLL KLSQPLSDKA VLFATAGVER TRLVAGLGAD VEFGNGWNGL HH*
PAGLKHAVEQ GGSNLENLMV GAT FRAAAAV QHANAADGVR GLDHNGTGLR VIAQTQQDGG AATLGMGRST WSENSANAKT SISRSTGADE HAEGSVNGTL KQDAFAEKGS ALGWSGNSLT DLNGRDYTVT GGFTGATAAT ARYSYAGSKQ YGNHSGRVGV
AG7 41-ORF4 β.1 1 ATGGTCGCCG 51 GCTCGACCAT 101 TCAGGAAAAA 151 TATGGAAACG 201 CAGCCGTTTC 251 CCTTGGAGAG 301 ACCGCCTTTC 351 GGTTGCGAAA 401 CTTTTGACAA 451 TTCGGTTCAG 501 CGCCAAGCAG 551 ATGTCGACCT 601 GTCATCAGCG 651 CCTCGGTATC 701 TGAAAACCGT 751 GACGGTGGCG 801 CCGGCAGGTT 851 TATTCGGCAG 901 GGAAAAATAC 951 CATTAAAGGA 1001 AAGTCCATTC 1051 GCCGGTAGTC 1101 ATACGAACAC 1151 ATCCCGCTCC 1201 GTTGCCCAAA 1251 ACGGCTTGCC 1301 TAGGCGACGG 1351 TCGGGCAATG 1401 CATCATCGGC 1451 GCATAAGCGA 1501 TGCACCGAAA 1551 ACTCAAAGAC 1601 CCAATGCCGC 1651 ATCCCCATCA 1701 CATCACGGCA 1751 CGAAAGGGAA 1801 AAATACCCGT 1851 GCGTTACGGC 1901 ,GCAAAAATGT 1951 TTTGACGGTA 2001 GCTCGAGCAC 1 mvaadigagl 51 YGNGDSLNTG 101 TAFQTEQIQD 151 FGSDDAGGKL 201 VISGSVLYNQ 251 DGGGGTGSSD 301 . GKIQSHQLGN 351 AGSPVDGFSL 401 VAQNIRLNLT 451 SGNAAEAFNG 501 STENKMARIN 551 IPIKGIGAVR 601 KYPSPYHSRN 651 FDGKGFPNFE
CCGACATCGG TGCGGGGCTT AAAGACAAAG GTTTGCAGTC CGAGAAACTG AAGCTGGCGG GTGACAGCCT CAATACGGGC GACTTTATCC GCCAAATCGA TGGAGAGTTC CAAGTATACA AGACCGAGCA AATACAAGAT CGCCAGTTCA GAATCGGCGA GCTTCCCGAA GGCGGCAGGG ACGATGCCGG CGGAAAACTG GGAAACGGCA AAATCGAACA GGCCGCCGCC GATATCAAGC GTTCCGTCCT TTACAACCAA TTTGGCGGAA AAGCCCAGGA AAACGGCATA CGCCATATCG GAGGCACTGG ATCCTCAGAT CTCGACCGTC AGCATTTCGA CAGGGGGGAA CTTGCCGAGC AAAGCCATCA GTTGGGCAAC AATATCGGCT ACATTGTCCG CCCCTTCGAC AACCATGCCT CCGTTGACGG ATTTAGCCTT CATCCCGCCG ACGGCTATGA CAAAGGCGCG AGGGATATAT ATATCCGCCT CAACCTGACC GACCGTTTCC ACAATGCCGG ATTCAAACGC GCCACCCGAT CCGCCGAAGC CTTCAACGGC GCGGCAGGAG AAATTGTCGG AGGCTCAAAC ATTGCTGTCA ACAAGATGGC GCGCATCAAC TATGCCGCAG CAGCCATCCG ACAAGGCATA GAAGCCGTCA AAGGGATTGG AGCTGTTCGG CATCCTATCA AGCGGTCGCA ATCCGCCGTC AGCGACAATT CCCCTTACCA TTCCCGAAAT AAAGAAAACA TCACCTCCTC CAAACTGGCA GACCAACGCC AAGGGTTTCC GAATTTTGAG CACCACCACC ACCACTGA ADALTAPLDH KDKGLQSLTL KLKNDKVSRF DFIRQIEVDG SEHSGKMVAK RQFRIGDIAG TYTIDFAAKQ GNGKIEHLKS AEKGSYSLGI FGGKAQEVAG LANDSFIRQV LDRQHFEPDG LMIQQAAIKG NIGYIVRFSD YRIHWDGYEH HPADGYDGPQ DNRSTGQRLA DRFHNAGSML TADIVKNIIG AAGEIVGAGD DLADMAQLKD YAAAAIRDWA GKYGLGGITA HPIKRSQMGA IRSNLEQRYG KENITSSTVP KHVKYDTLEH HHHHH*
GCCGATGCAC TAACCGCACC TTTGACGCTG GATCAGTCCG CACAAGGTGC GGAAAAAACT AAATTGAAGA ACGACAAGGT AGTGGACGGG CAGCTCATTA AACAAAGCCA TTCCGCCTTA TCGGAGCATT CCGGGAAGAT CATAGCGGGC GAACATACAT CGACATATCG CGGGACGGCG ACCTACACCA TAGATTTCGC TTTGAAATCG CCAGAACTCA CGGATGGAAA ACGCCATGCC GCCGAGAAAG GCAGTTACTC AGTTGCCGGC AGCGCGGAAG GCCTTGCCGC CAAGCAACTC TTGGCAAACG ATTCTTTTAT ACCCGACGGG AAATACCACC GCAGCGGCCA TATCGGATTG CTGATGATTC AACAGGCGGC CTTTTCCGÁT CACGGGCACG CACATTCCGA TTCTGATGAA TACCGCATCC ATTGGGACGG CGGGCCACAG GGCGGCGGCT ACAGCTACGA CATAAAAGGC GACAACCGCA GCACCGGACA TAGTATGCTG ACGCAAGGAG ACAGCCCCGA GCTGGACAGA ACTGCAGATA TCGTTAAAAA CGCAGGCGAT GCCGTGCAGG TGCACGGCTT GGGTCTGCTT GATTTGGCAG ATATGGCGCA CGATTGGGCA GTCCAAAACC GCAATATCTT TATGGCAGCC GGAAAATACG GCTTGGGCGG GATGGGCGCG ATCGCATTGC TTGCCGATGC GGCATACGCC ATCCGTTCAA ACTTGGAGCA AACCGTGCCG CCGTCAAACG ACCCGAAGAC AGGCGTAÇCG AAGCACGTGA AATATGATAC
DQSVRKNEKL KLAAQGAEKT QLITLESGEF QVYKQSHSAL EHTSFDKLPE GGRATYRGTA PELNVDLAAA DIKPDGKRHA SAEVKTVNGI RHIGLAAKQL KYHLFGSRGE LAERSGHIGL HGHEVHSPFD NHASHSDSDE GGGYPAPKGA RDIYSYDIKG TQGVGDGFKR ATRYSPELDR AVQGISEGSN IAVMHGLGLL VQNPNAAQGI EAVSNIFMAA IALPKGKSAV SDNFADAAYA PSNGKNVKLA DQRHPKTGVP 69
Exemplo 16 - fusões terminal C ('híbridos'} com 287/AG287
De acordo com a invenção, os híbridos de duas proteínas A e B podem ser tanto NH2-A-B-COOH ou NH2-B-A-COOH. 0 efeito desta diferença foi investigado utilizando a proteína 287 tanto C-terminal (na forma '287-His') ou N-terminal (na forma AG287 - sequências mostradas anteriormente) para 919, 953 e ORF46.1. Foi utilizado um painel de estirpes, incluindo a estirpe 2996 homóloga. FCA foi utilizado como adjuvante: 287 e 919 287 e 953 287 e ORF46.1 Estirpe AG287- 919 919-287 AG287- 953 953-287 AG287-46.1 46.1- 287 2996 128000 16000 65536 8192 16384 8192 BZ232 256 128 128 <4 <4 <4 1000 2048 <4 <4 <4 <4 <4 MC58 8192 1024 16384 1024 512 128 NGH38 32000 2048 >2048 4096 16384 4096 394/98 4096 32 256 128 128 16 MenA (F6124) 32000 2048 >2048 32 8192 1024 MenC (BZ133) 64000 >8192 >8192 <16 8192 2048 São geralmente observados melhores títulos bactericidas com a 287 no terminal N (na forma AG).
Quando fundida com a proteína 961 [NH2-AG287-961-COOH - sequência mostrada anteriormente], a proteína resultante é insolúvel e tem que ser desnaturada e renaturada para purificação. Após a renaturação, verificou-se que cerca de 50% da proteína permanecia insolúvel. As proteínas solúveis e insolúveis foram comparadas, e foram obtidos títulos bactericidas muito melhores com a proteína solúvel (FCA 70 como adjuvante): 2996 BZ232 MC58 NGH38 F6124 BZ133 Solúvel 65536 128 4096 >2048 >2048 4096 Insolúvel 8192 <4 <4 16 n.d. n.d.
Os títulos com a forma insolúvel foram, contudo, melhorados utilizando alume como adjuvante:
Insolúvel 32768 128 4096 >2048 >2048 2048
Exemplo 17 - fusões N-terminal ('híbridos') para 287 A expressão da proteína 287 como comprimento inteiro com um C-terminal rotulado com His, ou sem o seu péptido líder mas com um rótulo His no terminal C, dá níveis de expressão bastante baixos. É conseguida uma melhor expressão utilizando uma fusão GST N-terminal.
Como uma alternativa a utilizar GST como um parceiro de fusão N-terminal, a 287 foi colocada no terminal C da proteína 919 ('919-287'), da proteína 953 ('953-287'), e das proteínas ORF46.1 ('ORF46.1-287'). Em ambos os casos, os péptidos líderes foram deletados, e os híbridos foram dirigidos em fusões in-frame.
Para gerar a 953-287 híbrida, os péptidos líderes das duas proteínas foram omitidos desenhando o iniciador forward em sentido descendente do líder de cada sequência; a sequência do codão de terminação foi omitida no iniciador reverso da 953 mas incluída no iniciador reverso da 287. Para o gene 953, os iniciadores 5' e 3' utilizados para a amplificação incluíram locais de restrição da Ndel e BamHI respetivamente, ao passo que para a amplificação do gene 287 os iniciadores 5' e 3' incluíram locais de restrição da BamHI e Xhol respetivamente. Desta forma, poderia ser conseguida uma clonagem sequencial direcional dos dois genes em pET21 b+, utilizando Ndel-BamHI (para clonar o 71 primeiro gene) e subsequentemente BamHI-Xhol (para clonar o segundo gene). 0 híbrido 919-287 foi obtido por clonagem da sequência que codifica a porção madura da 287 no local da Xhol na extremidade 3'do clone 919-His em pET21b+. Os iniciadores utilizados para amplificação do gene 287 foram desenhados para introduzir um local de restrição da Sall na extremidade 5' e um local da Xhol na extremidade 3' do fragmento de PCR. Uma vez que as extremidades coesas produzidas pelas enzimas de restrição Sall e Xhol são compatíveis, o produto da PCR da 287 digerido com Sall-Xhol poderia ser inserido no clone pET21b-919 fracionado com Xhol. 0 híbrido ORF46.1-287 foi obtido de forma semelhante. A eficácia bactericida (estirpe homóloga) de anticorpos criados contra as proteínas híbridas foi comparada com anticorpos criados contra misturas simples dos antígenos componentes:
Mistura com 287 Hibrido com 287 919 32000 16000 953 8192 8192 ORF46.1 128 8192
Os dados para a atividade bactericida contra as estirpes MenB heterólogas e contra os serotipos A e C também foram obtidos para 919-287 e 953-287: 919 953 ORF46.1 Estirpe Mistura Hibrido Mistura Hibrido Mistura Híbrido MC58 512 1024 512 1024 - 1024 NGH38 1024 2048 2048 4096 - 4096 BZ232 512 128 1024 16 - — 72
MenA (F6124) 512 2048 2048 32 1024 MenC (Cll) >2048 n. d. >2048 n. d. n. d. MenC (BZ133) >4096 >8192 >4096 <16 2048 Híbridos de ORF46.1 e 919 também foram construídos. Os melhores resultados (títulos quatro vezes superiores) foram conseguidos com 919 no terminal N. Híbridos 919-519His, ORF97-225His e 225-ORF97His também foram testados. Estes deram títulos de ELISA e respostas de anticorpo bactericida moderados. 73
Exemplo Referência 18 - o péptido líder de 0RF4
Como mostrado anteriormente, o péptido líder de 0RF4 pode ser fundido com a sequência madura de outras proteínas (por exemplo, proteínas 287 e 919) . É capaz de dirigir a lipidação em E. coli.
Exemplo Referência 19 - domínios em 564 A proteína '564 ' é muito grande (2073 aminoácidos) , e é difícil de clonar e de expressá-la na sua forma completa. Para facilitar a expressão, a proteína foi dividida em quatro domínios, como mostrado na Figura 8 (de acordo com a sequência MC58):
Domínio A B C D Aminoácidos 79-360 361-731 732-2044 2045-2073
Estes domínios mostram as seguintes homologias: • Domínio A mostra homologia com outras toxinas bacterianas: gb|AAG03431.1|AE004443_9hemaglutinina provável [Pseudomonas aeruginosa] (38%) gb|AAC31981.1|(139897) HecA [Pectobacterium chrysanthemi] (45%) emb|CAA36409.1|(X52156) hemaglutinina filamentosa [Bordetella pertussis] (31%) gb|AAC79757.1|(AF057695) proteínal grande do sobrenadante [Haemophilus ducreyi] (26%) gb|AAA25657.1|(M30186) precursor de HpmA [Proteus mirabilis] (29%) • Domínio B não mostra qualquer homologia, e é específico de 564. • Domínio C mostra homologia com: gb|AAF84995.1|AE004032 proteína secretada tipo HA [Xylella fastidiosa] (33%) 74 gb I AAG05850.1|ΑΕ004673 proteína hipotética [Pseudomonas aeruginosa] (27%) gb|AAF68414.1AF237928 FHA putativa [Pasteurella multocisida] (23%) gb|AAC79757.1| (AF057695) proteínal grande do sobrenadante [Haemophilus ducreyi] (23%) piriS21010 precursor de FHA B [Bordetella pertussis] (20%) • Domínio D mostra homologia com outras toxinas bacterianas: gb|AAFB4995.1|AE004032_14 proteína secretada tipo HA [Xylella fastidiosa] (29%)
Utilizando a sequência da estirpe MC58, foi obtida uma boa expressão intracelular da 564ab na forma de fusões GST (sem purificação) e a proteína rotulada com his; este domínio par também foi expresso como uma lipoproteína, que mostrou expressão moderada na fração membrana exterior/sobrenadante. 0 domínio b mostrou expressão intracelular moderada quando expresso como um produto rotulado com his (sem purificação), e boa expressão como uma fusão GST. 0 domínio c mostrou boa expressão intracelular como uma fusão GST, mas era insolúvel. O domínio d mostrou expressão intracelular moderada como um produto rotulado com his (sem purificação) . O domínio par da proteína cd mostrou expressão intracelular moderada (sem purificação) como uma fusão GST.
Foram observados bons títulos no ensaio bactericida utilizando o domínio c e o par bc.
Exemplo Referência 20 - o péptido líder da 919 O 20° péptido líder da 919 é discutido no exemplo 1 anterior: 75
MKKYLFRAAL YGIAAAILAA
Como mostrado no exemplo 1, a deleção deste líder melhora a expressão heteróloga, tal como o faz a substituição com o péptido líder da 0RF4. A influência do líder da 919 na expressão foi investigada fundindo a sequência codificadora com o gene repórter PhoC da Morganella morganii [Thaller et al. (1994) Microbiology 140:1341-1350]. A construção foi clonada no plasmídeo pET21-b entre os locais da Ndel e Xhol (Figura 9): 1 MKKYLFRAAL YGIAAAILAA AIPAGNDATT KPDLYYLKNE QAIDSLKLLP 51 PPPEVGSIQF LNDQAMYEKG RMLRNTERGK QAQADADLAA GGVATAFSGA 101 FGYPITEKDS PELYKLLTNM IEDAGDLATR SAKEHYMRIR PFAFYGTETC 151 NTKDQKKLST NGSYPSGHTS IGWATALVLA EVNPANQDAI LERGYQLGQS 201 RVICGYHWQS DVDAARIVGS AAVATLHSDP AFQAQLAKAK QEFAQKSQK'*' O nível de expressão de PhoC deste plasmídeo é >200 vezes mais baixo do que o encontrado para a mesma construção mas contendo o péptido sinal nativo do PhoC. O mesmo resultado foi obtido mesmo após a substituição do promotor T7 com o promotor Plac de E. coli. Isto significa que a influência da sequência líder 919 na expressão não depende do promotor utilizado.
De modo a investigar se os resultados observados foram devidos a alguma peculiaridade da sequência do nucleotídeo do péptido sinal da 919 (formação de estrutura secundária, sensibilidade a ARNases, etc.) ou à instabilidade da proteína induzida pela presença deste péptido sinal, foi gerado um número de mutantes. A abordagem utilizada foi a substituição de nucleotídeos da sequência do péptido sinal da 919 clonando linkers sintéticos contendo codões degenerados. Desta forma, os mutantes foram obtidos com substituições de nucleotídeo e/ou aminoácido.
Foram utilizados dois linkers diferentes, desenhados 76 76 regiões diferentes da nos primeiros 19 pares (Sl) . para produzir mutações em duas sequência do péptido sinal da 919, de base (Ll) e entre as bases 20-36
Ll: 5' T ATG AAa/g TAc/t c/tTN TTt/c a/cGC GCC GCC CTG TAC GGC ATC GCC GCC GCC ATC CTC GCC GCC GCG ATC CC 3'
Sl: 5' T ATG AAA AAA TAC CTA TTC CGa/g GCN GCN c/tTa/g TAc/t GGc/g ATC GCC GCC GCC ATC CTC GCC GCC GCG ATC CC 3' O alinhamento de alguns dos mutantes obtidos é dado a seguir. mutantes Ll 9Ll-a ATG AAGAAGTACCTTTTCAGCGCCGCC — ~ ~ ~ ~ ~ ----. —--------------- 9Ll-e · ATGAAAAAATACTTTTTCCGCGCCGCC----------------------------- 9Ll-d ATGAAAAAATACTTTTTCCGCGCCGCC--------------- -~
9L1 - f ATGAAAAAATATCTCTTTAGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC
919sp ATGAAAAAATACCTATTCCGCGCCGCCCTGTÀCGGCATCGCCGCCGCCATCCTCGCCGCC 9Lla MKKYLFSAA------------ 9Lle MKKYFFRAA----------~ 9Lld MKKYFFRAA----------- 9Llf MKKYLFSAALYGIAAAILAA ...... 919sp MKKYLFRAALYGIAAAILAA peptido sinal nativo) mutantes Sl 9Sl-e 9S1-C 9Sl-b 9S1-Í 919sp 9Sle 9SlC 9Slb 9Sli 919sp
ATGAAAAAATACCTATTC. !................ATCGCCGCCGCCATCCTCGCCGCC
ATGAAAAAATACCTATTCCGAGCTGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC ATGAAAAAATACCTATTCCGGGCCGCCCAATACGGCATCGCCGCCGCCATCCTCGCCGCC ATGAAAAAATACCTATTCCGGGCGGCTTTGTACGGGATCGCCGCCGCCATCCTCGCCGCC ATGAAAAAATACCTATTCCGCGCCGCCCTGTACGGCATCGCCGCCGCCATCCTCGCCGCC
MKKYLF......IAAAILAA
MKKYLFRAAQYGIAAAILAA MKKYLFRAAQYGIAAAX LAA MKKYLFRAALYGI AAAI LAA MKKYLFRAALYGIAAAILAA
Como mostrado nos alinhamentos das sequências, a maioria dos mutantes analisados contém deleções in-frame que foram inesperadamente produzidas pels células hospedeiras.
A seleção dos mutantes foi realizada transformando células BL21(DE3) de E. coli com ADN preparado de uma mistura de clones mutados Ll e Sl. Os transformantes simples foram classificados para alta atividade de PhoC 77 passando-os por placas LB contendo 100 μρ/ιηΐ de ampicilina, 50 mg/ml de verde de metilo, 1 mg/ml de PDP (fenolftaleindifosfato). Neste meio células produtoras de PhoC tornam-se verdes (Figura 10).
Uma análise quantitativa do PhoC produzido por estes mutantes foi realizada em meio líquido utilizando pNPP como um substrato para a atividade de PhoC. As atividades específicas medidas em extratos celulares e sobrenadantes de mutantes crescidos em meio líquido durante 0, 30, 90, 180 min. foram: 78 EXTRATOS CELULARES 0 30 90 180 controlo 0,00 0,00 0,00 0,00 9phoC 1,11 1, 11 3,33 4, 44 9Sle 102,12 111,00 149,85 172,05 9Lla 206,46 111,00 94,35 83,25 9Lld 5, 11 4, 77 4, 00 3,11 9Llf 27, 75 94,35 82,14 36,63 9Slb 156,51 111,00 72,15 28,86 9Slc 72,15 33,30 21, 09 14, 43 9Sli 156,51 83,25 55,50 26,64 phoCwt 194,25 180,93 149,85 142,08 SOBRENADANTES 0 30 90 180 controlo 0, 00 0,00 0, 00 0,00 9phoC 0,33 0,00 0, 00 0,00 9Sle 0, 11 0,22 0, 44 0,89 9Lla 4, 88 5, 99 5, 99 7, 22 9Lld 0, 11 0,11 0, 11 0,11 9Llf 0, 11 0,22 0, 11 0,11 9Slb 1, 44 1,44 1, 44 1,67 9Slc 0, 44 0, 78 0,56 0,67 9Sli 0,22 0,44 0,22 0, 78 phoCwt 34, 41 43,29 87, 69 177,60
Alguns dos mutantes produzem elevadas quantidades de PhoC e em particular, o mutante 9Lla pde segregar PhoC no meio de cultura. Isto é notável uma vez que a sequência do péptido sinal deste mutante só tem 9 aminoácidos de comprimento. Este é o péptido sinal mais curto descrito até à data. 79
Exemplo Referência 21 - deleções C-terminal de proteínas relacionadas com Maf
As proteínas relacionadas com MafB incluem 730, ORF46 e ORF29. A proteína 730 de MC58 tem a sequência seguinte:
1 VKPLRRLTNL LAACAVAAAA LIQPALAADL AQDPFITDNA QRQHYEPGGK 51 YHLFGDPRGS VSDRTGKINV IQDYTHQMGN LLIQQANING TIGYHTRFSG 101 HGHEEHAPFD NHAADSASEE KGNVDEGFTV YRLNWEGHEH HPADAYDGPK 151 GGNYPKPTGA RDEYTYHVNG TARSIKLNPT DTRSIRQRIS DNYSNLGSNF 201 SDRADEANRK MFEHNAKLDR WGNSMEFING VAAGALNPFI SAGEALGIGD 251 ILYGTRYAID KAAMRNIAPL PAEGKFAVIG GLGSVAGFEK NTREAVDRWI 301 QENPNAAETV EAVFNVAAAA KVAKLAKAAK PGKAAVSGDF ADSYKKKLAL 351 SDSARQLYQN AKYREALDIH YEDLIRRKTD GSSKFINGRE IDAVTNDALI 401 QAKRTISAID KPKNFLNQKN RKQIKATIEA ANQQGKRAEF WFKYGVHSQV 451 KSYIESKGGI VKTGLGD* O péptido líder está sublinhado. 730 mostra características semelhantes com ORF46 (ver exemplo 8 anterior): - tal como para Orf46, a conservação da sequência 730 entre MenB, MenA e gonococos é alta (>80%) apenas para a porção N-terminal. O terminal C, de ~340, é altamente divergente. - a sua estrutura secundária prevista contém um segmento hidrofóbico que abrange a região central da molécula (aminoácidos 227-247). - a expressão do gene de comprimento inteiro em E. coli
proporciona rendimentos muito baixos de proteína. A expressão de construções rotuladas ou desmarcadas onde a sequência do péptido sinal foi omitida tem um efeito tóxico nas células hospedeiras. Por outras palavras, a presença da proteína madura de comprimento inteiro no citoplasma é altamente tóxica para a célula hospedeira enquanto a sua translocação para o periplasma (mediada pelo péptido sinal) 80 não tem efeito detetável na viabilidade celular. Esta "toxicidade intracelular" da 730 é particularmente alta uma vez que os clones para expressão da 730 sem líder podem ser obtidos apenas a uma frequência muito baixa utilizando um antecedente genético recA (estirpes de E. coli: HB101 para clonagem; HMS 174(DE3) para expressão).
Para ultrapassar esta toxicidade, uma abordagem semelhante foi utilizada para 730 como descrito no exemplo 8 para ORF46. Foram obtidas quatro formas truncadas de terminal C, cada uma das quais está bem expressa. Todas foram obtidas a partir da expressão intracelular da 730 sem líder rotulada com His. A forma A consiste numa região hidrofílica N-terminal da proteína madura (aminoácidos 28-226). Esta foi purificada como um produto rotulado com His solúvel, tendo um peso molecular superior ao esperado. A forma B estende-se à extremidade da região conservada entre serogrupos (aminoácidos 28-340). Esta foi purificada como um produto rotulado com His insolúvel.
As formas truncadas C-terminal designadas Cl e C2 foram obtidas depois de classificar os clones que expressam altos níveis de clones 730-His na estirpe HMS174(DE3). Resumidamente, o plasmídeo pET21b contendo a sequência rotulada com His que codifica a proteína 730 madura de comprimento inteiro foi utilizado para transformar a estirpe recA HMS 174(DE3). Os transformantes foram obtidos a uma frequência baixa que mostraram dois fenotipos: colónias grandes e colónias muito pequenas. Várias colónias grandes e pequenas foram analisadas para expressão do clone 730-His. Apenas as células das colónias grandes sobre-expressaram uma proteína reconhecida pelos anticorpos anti- 81 73 ΟΑ. Contudo, a proteína sobre-expressa em diferentes clones mostrou diferenças na massa molecular. A sequenciação de dois dos clones revelou que em ambos os casos tinha ocorrido a integração de uma sequência IS de E. coli dentro da sequência que codifica a região C-terminal da 730. Os dois eventos de integração produziram fusão in-frame com 1 codão adicional no caso de Cl, e 12 codões adicionais no caso de C2 (Figura 11). As formas "mutantes" resultantes da 730 têm as seguintes sequências: 730-C1 (devido a uma inserção IS1 - figura 11A)
1 MADLAQDPFI TDNAQRQHYE PGGKYHLFGD PRGSVSDRTG KINVIQDYTH 51 QMGNLLIQQA NINGTIGYHT RFSGHGHEEH APFDNHAADS ASEEKGNVDE 101 GFTVYRLNWE GHEHHPADAY DGPKGGNYPK PTGARDEYTY HVNGTARSIK 151 LNPTDTRSIR QRISDNYSNL GSNFSDRADE ANRKMFEHNA KLDRWGNSME 201 FINGVAAGAL NPFISAGEAL GIGDILYGTR YAIDKAAMRN IAPLPAEGKF
251 AVIGGLGSVA GFEKNTREAV DRWIQENPNA AETVEAVFNV AAAAKVAKLA
301 KAAKPGKAAV SGDFADSYKK KLALSDSARQ LYQNAKYREA LDIHYEDLIR 351 RKTDGSSKFI NGREIDAVTN DALIQAR* O aminoácido adicional produzido pela inserção está sublinhado. 730-C2 (devido a uma inserção IS5 - figura 11B) 1 MADLAQDPFI TDNAQRQHYE PGGKYHLFGD PRGSVSDRTG KINVIQDYTH 51 QMGNLLIQQA NINGTIGYHT RFSGHGHEEH APFDNHAADS ASEEKGNVDE 101 GFTVYRLNWE GHEHHPADAY DGPKGGNYPK PTGARDEYTY HVNGTARSIK 151 LNPTDTRSIR QRISDNYSNL GSNFSDRADE ANRKMFEHNA KLDRWGNSME 201 FINGVAAGAL NPFISAGEAL GIGDILYGTR YAIDKAAMRN IAPLPAEGKF 251 AVIGGLGSVA GFEKNTREAV DRWIQENPNA AETVEAVFNV AAAAKVAKLA 301 KAAKPGKAAV SGDFADSYKK KLALSDSARQ LYQNAKYREA LGKVRISGEI 351 LLG*
Os aminoácidos adicionais produzidos pela inserção estão sublinhados.
Concluindo, a expressão intracelular da forma 730-C1 dá um nível muito alto de proteína e não tem qualquer efeito tóxico nas células hospedeiras, ao passo que a presença do terminal C nativo é tóxico. Estes dados sugerem que a "toxicidade intracelular" da 730 está associada com os 65 aminoácidos do C-terminal da proteína. 82 A truncação equivalente da ORF29 aos primeiros 231 ou 368 aminoácidos foi realizada, utilizando a expressão com ou sem o péptido lider (aminoácidos 1-26; a deleção dá expressão citoplasmática) e com ou sem um rótulo His. Exemplo Referência 22 - domínios em 961
Como descrito no exemplo 9 anterior, a fusão GST da 961 foi a melhor expressa em E. coli. Para melhorar a expressão, a proteína foi dividida em domínios (Figura 12).
Os domínios da 961 foram desenhados com base na YadA (uma adesina produzida por Yersinia que se demonstrou ser uma adesina localizada na superfície bacteriana que forma olígomeros que geram projeção da superfície [Hoiczyk et al. (2000) EMBO J 19:5989-99]) e são: péptido líder, domínio cabeça, região superenrolada (talo), e domínio da membrana via âncora.
Estes domínios foram expressos com ou sem o péptido líder, e opcionalmente fundidos tanto a C-terminal rotulado com His ou a GST N-terminal. Os clones da E. coli que expressam diferentes domínios da 961 foram analisados por SDS-PAGE e western blot para a produção e localização da proteína expressa, da cultura durante a noite (o/n) ou após 3 horas de indução com IPTG. Os resultados foram:
Lisado total (Western Blot) Periplasma (Western Blot) Sobrenadante (Western Blot) OMV SDS-PAGE 961 (o/n) - - - 961 (IPTG) + /- - - 961-L (o/n) + - - + 961-L + + (IPTG) 83 961 c-L (o/n) - - - 961c—L (IPTG) + + + 961A1-L (o/n) - - - 961A1-L (IPTG) + - - +
Os resultados mostram que em E. coli: 961-L é altamente expresso e localizado na membrana exterior. Por análise western blot foram detetadas duas bandas especificas: uma com ~45kDa (o peso molecular previsto) e uma com ~180kDa, indicando que 961-L pode formar oligomeros. Além disso, estes agregados são mais expressos na cultura durante a noite (sem indução por IPTG) . Preparações OMV deste clone foram utilizadas para imunizar ratinhos e soro foi obtido. Utilizando cultura durante a noite (predominantemente por forma oligomérica) o soro foi bactericida; a cultura induzida por IPTG (predominantemente monomérica) não foi bactericida. 961Δ 1 -L (com uma deleção parcial na região âncora) é altamente expressa e localizada na membrana exterior, mas não forma oligomeros; a 961c-L (sem a região âncora) é produzida na forma solúvel e exportada no sobrenadante.
Os títulos nos ensaios de ELISA e bactericida do soro utilizando fusões His foram como se segue: ELISA Bactericida 961a (aa 24-268) 24397 4096 84 84 961b (aa 269-405) 7763 64 961c—L 29770 8192 961c(2996) 30774 >65536 961c (MC58) 33437 16384 961d 26069 >65536
Os clones de E. coli que expressam diferentes formas da 961 (961, 961-L, 961Δ 1 -L e 961c-L) foram utilizados para investigar se a 961 é uma adesina (comparando com YadA) . Um ensaio de adesão foi realizado utilizando (a) células epiteliais humanas e (b) clones de E. coli após ou cultura durante a noite ou três horas de indução por IPTG. 0 crescimento de 961-L durante a noite (961Δ 1 -L) e 961c-L induzido por IPTG (os clones expressando a proteína na superfície) aderem a células epitelais humanas. 961c também foi utilizado em proteínas híbridas (ver em cima). Como a 961 e as suas variantes de domínio dirigem a expressão eficiente, são idealmente adequadas como a porção N-terminal de uma proteína híbrida.
Exemplo Referência 23 - híbridos adicionais
Proteínas híbridas adicionais da invenção são mostradas a seguir (ver também Figura 14). Estas são vantajosas quando comparadas com as proteínas individuais: 85
85 0RF46.1-741 1 ATGTCAGATT TGGCAAACGA 51 GCATTTCGAA CCCGACGGGA 101 TTGCCGAGCG CAGCGGCCAT 151 TTGGGCAACC TGATGATTCA 201 CATTGTCCGC TTTTCCGATC 251 ACCATGCCTC ACATTCCGAT 301 TTTAGCCTTT ACCGCATCCA 351 CGGCTATGAC GGGCCACAGG 401 GGGATATATA CAGCTACGAC 451 AACCTGACCG ACAACCGCAG 501 CAATGCCGGT AGTATGCTGA 551 CCACCCGATA CAGCCCCGAG 601 TTCAACGGCA CTGCAGATAT 651 AATTGTCGGC GCAGGCGATG 701 TTGCTGTCAT GCACGGCTTG 751 CGCATCAACG ATTTGGCAGA 801 AGCCATCCGC GATTGGGCAG 851 AAGCCGTCAG CAATATCTTT 901 GCTGTTCGGG GAAAATACGG 951 GCGGTCGCAG ATGGGCGCGA 1001 GCGACAATTT TGCCGATGCG 1051 TCCCGAAATA TCCGTTCAAA 1101 CACCTCCTCA ACCGTGCCGC 1151 ACCAACGCCA CCCGAAGACA 1201 AATTTTGAGA AGCACGTGAA 1251 CGCCGCCGAC ATCGGTGCGG 1301 ACCATAAAGA CAAAGGTTTG 1351 AAAAACGAGA AACTGAAGCT 1401 AAACGGTGAC AGCCTCAATA 1451 GTTTCGACTT TATCCGCCAA 1501 GAGAGTGGAG AGTTCCAAGT 1551 CTTTCAGACC GAGCAAATAC 1601 CGAAACGCCA GITCAGAATC
TTCTTTTATC CGGCAGGTTC TCGACCGTCA AATACCACCT ATTCGGCAGC AGGGGGGAAC ATCGGATTGG GAAAAATACA AAGCCATCAG ACAGGCGGCC ATTAAAGGAA ATATCGGCTA ACGGGCACGA AGTCCATTCC CCCTTCGACA TCTGATGAAG CCGGTAGTCC CGTTGACGGA TTGGGACGGA TACGAACACC ATCCCGCCGA GCGGCGGCTA TCCCGCTCCC AAAGGCGCGA ATAAAAGGCG TTGCCCAAAA TATCCGCCTC CACCGGACAA CGGCTTGCCG ACCGTTTCCA CGCAAGGAGT AGGCGACGGA TTCAAACGCG CTGGACAGAT CGGGCAATGC CGCCGAAGCC CGTTAAAAAC ATCATCGGCG CGGCAGGAGA CCGTGCAGGG CATAAGCGAA GGCTCAAACA GGTCTGCTTT CCACCGAAAA CAAGATGGCG TATGGCGCAA CTCAAAGACT ATGCCGCAGC TCCAAAACCC CAATGCCGCA CAAGGCATAG ATGGCAGCCA TCCCCATCAA AGGGATTGGA CTTGGGCGGC ATCACGGCAC ATCCTATCAA TCGCATTGCC GAAAGGGAAA TCCGCCGTCA GCATACGCCA AATACCCGTC CCCTTACCAT CTTGGAGCAG CGTTACGGCA AAGAAAACAT CGTCAAACGG CAAAAATGTC AAACTGGCAG GGCGTACCGT TTGACGGTAA AGGGTTTCCG ATATGATACG GGATCCGGAG GGGGTGGTGT GGCTTGCCGA TGCACTAACC GCACCGCTCG CAGTCTTTGA CGCTGGATCA GTCCGTCAGG GGCGGCACAA GGTGCGGAAA AAACTTATGG CGGGCAAATT GAAGAACGAC AAGGTCAGCC ATCGAAGTGG ACGGGCAGCT CATTACCTTG ATACAAACAA AGCCATTCCG CCTTAACCGC AAGATTCGGA GCATTCCGGG AAGATGGTTG GGCGACATAG CGGGCGAACA TACATCTTTT 86
86 1651 GACAAGCTTC 1701 TTCAGACGAT 1751 AGCAGGGAAA 1801 GACCTGGCCG 1851 CAGCGGTTCC 1901 GTATCTTTGG 1951 ACCGTAAACG 2001 CCACCACCAC 1 MSDLANDSFI 51 LGNLMIQQAA 101 FSLYRIHWDG 151 NLTDNRSTGQ 201 FNGTADIVKN 251 RINDLADMAQ 301 AVRGKYGLGG 351 SRNIRSNLEQ 401 NFEKHVKYDT 451 KNEKLKLAAQ 501 ESGEFQVYKQ 551 DKLPEGGRAT 601 DLAAADIKPD 651 TVNGIRHIGL
CCGAAGGCGG CAGGGCGACA GCCGGCGGAA AACTGACCTA CGGCAAAATC GAACATTTGA CCGCCGATAT CAAGCCGGAT GTCCTTTACA ACCAAGCCGA CGGAAAAGCC CAGGAAGTTG GCATACGCCA TATCGGCCTT CACCACTGA RQVLDRQHFE PDGKYHLFGS IKGNIGYIVR FSDHGHEVHS YEHHPADGYD GPQGGGYPAP RLADRFHNAG SMLTQGVGDG IIGAAGEIVG AGDAVQGISE LKDYAAAAIR DWAVQNPNAA XTAHPIKRSQ MGAIALPKGK RYGKENITSS TVPPSNGKNV GSGGGGVAAD IGAGLADALT GAEKTYGNGD SLNTGKLKND SHSALTAFQT EQIQDSEHSG YRGTAFGSDD AGGKLTYTID GKRHAVISGS VLYNQAEKGS AAKQLEHHHH HH+
TATCGCGGGA CGGCGTTCGG CACCATAGAT TTCGCCGCCA AATCGCCAGA ACTCAATGTC GGAAAACGCC ATGCCGTCAT GAAAGGCAGT TACTCCCTCG CCGGCAGCGC GGAAGTGAAA GCCGCCAAGC AACTCGAGCA
RGELAERSGH IGLGKIQSHQ PFDNHASHSD SDEAGSPVDG KGARDIYSYD IKGVAQNIRL FKRATRYSPE LDRSGNAAEA GSNIAVMHGL GLLSTENKMA QGIEAVSNIF MAAIPIKGIG SAVSDNFADA AYAKYPSPYH KLADQRHPKT GVPFDGKGFP APLDHKDKGL QSLTLDQSVR KVSRFDFIRQ IEVDGQLITL KMVAKRQFRI GDIAGEHTSF FAAKQGNGKI EHLKSPELNV YSLGIFGGKA QEVAGSAEVK
ORF46. 1-961 1 ATGTCAGATT 51 GCATTTCGAA 101 TTGCCGAGCG 151 TTGGGCAACC 201 CATTGTCCGC 251 ACCATGCCTC 301 TTTAGCCTTT 351 CGGCTATGAC 401 GGGATATATA 4 51 AACCTGACCG 501 CAATGCCGGT 551 CCACCCGATA 601 TTCAACGGCA 651 AATTGTCGGC 701 TTGCTGTCAT 751 CGCATCAACG 801 AGCCATCCGC 851 AAGCCGTCAG 901 GCTGTTCGGG 951 GCGGTCGCAG 1001 GCGACAATTT 1051 TCCCGAAATA 1101 CACCTCCTCA 1151 ACCAACGCCA 1201 AATTTTGAGA 1251 CACAAACGAC 1301 CCTACAACAA 1351 TACGACATTG 1401 CGATGTTGAA 1451 CTAACCTGAC 1501 GTAAAAGCTG 1551 CACTGATGCC 1601 ACGCCTTGAA 1651 AAGACAAATA 1701 CGTCGACAAG 1751 AAACCAACAC 1801 CAGACGGCCG 1851 AGAAACTGCA 1901 CAGCCGACAA 1951 GATATCGCTA 2001 CGTGTACACC
TGGCAAACGA TTCTTTTATC CCCGACGGGA AATACCACCT CAGCGGCCAT ATCGGATTGG TGATGATTCA ACAGGCGGCC TTTTCCGATC ACGGGCACGA ACATTCCGAT TCTGATGAAG ACCGCATCCA TTGGGACGGA GGGCCACAGG GCGGCGGCTA CAGCTACGAC ATAAAAGGCG ACAACCGCAG CACCGGACAA AGTATGCTGA CGCAAGGAGT CAGCCCCGAG CTGGACAGAT CTGCAGATAT CGTTAAAAAC GCAGGCGATG CCGTGCAGGG GCACGGCTTG GGTCTGCTTT ATTTGGCAGA TATGGCGCAA GATTGGGCAG TCCAAAACCC CAATATCTTT ATGGCAGCCA GAAAATACGG CTTGGGCGGC ATGGGCGCGA TCGCATTGCC TGCCGATGCG GCATACGCCA TCCGTTCAAA CTTGGAGCAG ACCGTGCCGC CGTCAAACGG CCCGAAGACA GGCGTACCGT AGCACGTGAA ATATGATACG GACGATGTTA AAAAAGCTGC TGGCCAAGAA ATCAACGGTT ATGAAGACGG CACAATTACC GCCGACGACT TTAAAGGTCT CAAAACCGTC AATGAAAACA CAGAATCTGA AATAGAAAAG GCTTTAGCAG ATACTGATGC TAAATTGGGA GAAAATATAA TCGTAAAAAT TGATGAAAAA CATGCCGAAG CATTCAAÇGA TAAGGCAGAC GAAGCCGTCA AAGAAACCAA ACAAAACGTC GCAGGCAAAG CCGAAGCTGC GGCCGAAGCT GTCGCTGCAA CGAACAAAGA TAATATTGCT AGAGAAGAGT CTGACAGCAA
CGGCAGGTTC TCGACCGTCA ATTCGGCAGC AGGGGGGAAC GAAAAATACA AAGCCATCAG ATTAAAGGAA ATATCGGCTA AGTCCATTCC CCCTTCGACA CCGGTAGTCC CGTTGACGGA TACGAACACC ATCCCGCCGA TCCCGCTCCC AAAGGCGCGA TTGCCCAAAA TATCCGCCTC CGGCTTGCCG ACCGTTTCCA AGGCGACGGA TTCAAACGCG CGGGCAATGC CGCCGAAGCC ATCATCGGCG CGGCAGGAGA CATAAGCGAA GGCTCAAACA CCACCGAAAA CAAGATGGCG CTCAAAGACT ATGCCGCAGC CAATGCCGCA CAAGGCATAG TCCCCATCAA AGGGATTGGA ATCACGGCAC ATCCTATCAA GAAAGGGAAA TCCGCCGTCA AATACCCGTC CCCTTACCAT CGTTACGGCA AAGAAAACAT CAAAAATGTC AAACTGGCAG TTGACGGTAA AGGGTTTCCG GGATCCGGAG GAGGAGGAGC CACTGTGGCC ATTGCTGCTG TCAAAGCTGG AGAGACCATC AAAAAAGACG CAACTGCAGC GGGTCTGAAA AAAGTCGTGA AACAAAACGT CGATGCCAAA TTAACAACCA AGTTAGCAGA CGCTCTGGAT GCAACCACCA CGACATTTGC TGAAGAGACT TTAGAAGCCG TGGCTGATAC TATCGCCGAT TCATTGGATG AAACCGCCAA TGAAGCCAAA GATGCCAAAG TAAAAGCTGC CGCTGGCACA GCTAATACTG AAGTTACCGA CATCAAAGCT AAAAAAGCAA ACAGTGCCGA ATTTGTCAGA ATTGATGGTC 87
2051 TGAACGCTAC TACCGAAAAA TTGGACACAC GCTTGGCTTC TGCTGAAAAA
2101 TCCATTGCCG ATCACGATAC TCGCCTGAAC GGTTTGGATA AAACAGTGTC
2151 AGACCTGCGC AAAGAAACCC GCCAAGGCCT TGCAGAACAA GCCGCGCTCT
2201 CCGGTCTGTT CCAACCTTAC AACGTGGGTC GGTTCAATGT AACGGCTGCA
2251 GTCGGCGGCT ACAAATCCGA ATCGGCAGTC GCCATCGGTA CCGGCTTCCG
2301 CTTTACCGAA AACTTTGCCG CCAAAGCAGG CGTGGCAGTC GGCACTTCGT
2351 CCGGTTCTTC CGCAGCCTAC CATGTCGGCG TCAATTACGA GTGGCTCGAG
2401 CACCACCACC ACCACCACTG A
1 MSDLANDSFI RQVLDRQHFE PDGKYHLFGS RGELAERSGH IGLGKIQSHQ
51 LGNLMIQQAA IKGNIGYIVR FSDHGHEVHS PFDNHASHSD SDEAGSPVDG
101 FSLYRIHWDG YEHHPADGYD GPQGGGYPAP KGARDIYSYD IKGVAQNIRL
151 NLTDNRSTGQ RLADRFHNAG SMLTQGVGDG FKRATRYSPE LDRSGNAAEA
201 FNGTADIVKN IIGAAGEIVG AGDAVQGISE GSNIAVMHGL GLLSTENKMA
251 RINDLADMAQ LKDYAAAAIR DWAVQNPNAA QGIEAVSNIF MAAIPIKGIG
301 AVRGKYGLGG ITAHPIKRSQ MGAIALPKGK SAVSDNFADA AYAKYPSPYH
351 SRNIRSNLEQ RYGKENITSS TVPPSNGKNV KLADQRHPKT GVPFDGKGFP
401 NFEKHVKYDT GSGGGGATND DDVKKAATVA IAAAYNNGQE INGFKAGETI
451 YDIDEDGTIT KKDATAADVE ADDFKGLGLK KVVTNLTKTV NENKQNVDAK
501 VKAAESEIEK LTTKLADTDA ALADTDAALD ATTNALNKLG ENITTFAEET
551 KTNIVKIDEK LEAVADTVDK HAEAFNDIAD SLDETNTKAD EAVKTANEAK
601 QTAEETKQNV DAKVKAAETA AGKAEAAAGT ANTAADKAEA VAAKVTDIKA
651 DIATNKDNIA KKANSADVYT REESDSKFVR XDGLNATTEK LDTRLASAEK
701 SIADHDTRLN GLDKTVSDLR KETRQGLAEQ AALSGLFQPY NVGRFNVTAA
751 VGGYKSESAV AIGTGFRFTE NFAAKAGVAV GTSSGSSAAY HVGVNYEWLE 801 HHHHHH*
ORF46. l-961c 1 ATGTCAGATT 51 GCATTTCGAA 101 TTGCCGAGCG 151 TTGGGCAACC 201 CATTGTCCGC 251 ACCATGCCTC 301 TTTAGCCTTT 351 CGGCTATGAC 401 GGGATATATA 451 AACCTGACCG 501 CAATGCCGGT 551 CCACCCGATA 601 TTCAACGGCA 651 AATTGTCGGC 701 TTGCTGTCAT 751 CGCATCAACG 801 AGCCATCCGC 851 AAGCCGTCAG 901 GCTGTTCGGG 951 GCGGTCGCAG 1001 GCGACAATTT 1051 TCCCGAAATA 1101 CÁCCTCCTCA 1151 ACCAACGCCA 1201 AATTTTGAGA 1251 CACAAACGAC 1301 CCTACAACAA 1351 TACGACATTG 1401 CGATGTTGAA 1451 CTAACCTGAC 1501 GTAAAAGCTG 1551 CACTGATGCC 1601 ACGCCTTGAA 1651 AAGACAAATA 1701 CGTCGACAAG 1751 AAACCAACAC 1801 CAGACGGCCG 1851 AGAAACTGCA
TGGCAAACGA TTCTTTTATC CCCGACGGGA AATACCACCT CAGCGGCCAT ATCGGATTGG TGATGATTCA ACAGGCGGCC TTTTCCGATC ACGGGCACGA ACATTCCGAT TCTGATGAAG ACCGCATCCA TTGGGACGGA GGGCCACAGG GCGGCGGCTA CAGCTACGAC ATAAAAGGCG ACAACCGCAG CACCGGACAA AGTATGCTGA CGCAAGGAGT CAGCCCCGAG CTGGACAGAT CTGCAGATAT CGTTAAAAAC GCAGGCGATG CCGTGCAGGG GCACGGCTTG GGTCTGCTTT ATTTGGCAGA TATGGCGCAA GATTGGGCAG TCCAAAACCC CAATATCTTT ATGGCAGCCA GAAAATACGG CTTGGGCGGC ATGGGCGCGA TCGCATTGCC TGCCGATGCG GCATACGCCA TCCGTTCAAA CTTGGAGCAG ACCGTGCCGC CGTCAAACGG CCCGAAGACA GGCGTACCGT AGCACGTGAA ATATGATACG GACGATGTTA AAAAAGCTGC TGGCCAAGAA ATCAACGGTT ATGAAGACGG CACAATTACC GCCGACGACT TTAAAGGTCT CAAAACCGTC AATGAAAACA CAGAATCTGA AATAGAAAAG GCTTTAGCAG ATACTGATGC TAAATTGGGA GAAAATATAA TCGTAAAAAT TGATGAAAAA CATGCCGAAG CATTCAACGA TAAGGCAGAC GAAGCCGTCA AAGAAACCAA ACAAAACGTC GCAGGCAAAG CCGAAGCTGC
CGGCAGGTTC TCGACCGTCA ATTCGGCAGC AGGGGGGAAC GAAAAATACA AAGCCATCAG ATTAAAGGAA ATATCGGCTA AGTCCATTCC CCCTTCGAÇA CCGGTAGTCC CGTTGACGGA TACGAACACC ATCCCGCCGÁ TCCCGCTCCC AAAGGCGCGA TTGCCCAAAA TATCCGCCTC CGGCTTGCCG ACCGTTTCCA AGGCGACGGA TTCAAACGCG CGGGCAATGC CGCCGAAGCC ATCATCGGCG CGGCAGGAGA CATAAGCGAA GGCTCAAACA CCACCGAAAA CAAGATGGCG CTCAAAGACT ATGCCGCAGC CAATGCCGCA CAAGGCATAG TCCCCATCAA AGGGATTGGA ATCACGGCAC ATCCTATCAA GAAAGGGAAA TCCGCCGTCA AATACCCGTC CCCTTACCAT CGTTACGGCA AAGAAAACAT CAAAAATGTC AAACTGGCAG TTGACGGTAA AGGGTTTCCG GGATCCGGAG GAGGAGGAGC CACTGTGGCC ATTGCTGCTG TCAAAGCTGG AGAGACCATC AAAAAAGACG CAACTGCAGC GGGTCTGAAA AAAGTCGTGA AACAAAACGT CGATGCCAAA TTAACAACCA AGTTAGCAGA CGCTCTGGAT GCAACCACCA CGACATTTGC TGAAGAGACT TTAGAAGCCG TGGCTGATAC TATCGCCGAT TCATTGGATG AAACCGCCAA TGAAGCCAAA GATGCCAAAG TAAAAGCTGC CGCTGGCACA GCTAATACTG 1901 CAGCCGACAA 1951 GATATCGCTA 2001 CGTGTACACC 2051 TGAACGCTAC 2101 TCCATTGCCG 2151 AGACCTGCGC 2201 CCGGTCTGTT 2251 CACTGA 1 MSDLANDSFI 51 LGNLMIQQAA 101 FSLYRIHWDG 151 NLTDNRSTGQ 201 FNGTADIVKN 251 RINDLADMAQ 301 AVRGKYGLGG 351 SRNIRSNLEQ 401 NFEKHVKYDT 451 YDIDEDGTIT 501 VKAAESEIEK 551 KTNIVKIDEK 601 QTAEETKQNV 651 DIATNKDNIA 701 SIADHDTRLN 751 H*
GGCCGAAGCT GTCGCTGCAA CGAACAAAGA TAATATTGCT AGAGAAGAGT CTGACAGCAA TACCGAAAAA TTGGACACAC ATCACGATAC TCGCCTGAAC AAAGAAACCC GCCAAGGCCT CCAACCTTAC AACGTGGGTC
RQVLDRQHFE PDGKYHLFGS IKGNIGYXVR FSDHGHEVHS YEHHPADGYD GPQGGGYPAP RLADRFHNAG SMLTQGVGDG IIGAAGEIVG AGDAVQGISE LKDYAAAAIR DWAVQNPNAA ITAHPIKRSQ MGAIALPKGK RYGKENITSS TVPPSNGKNV GSGGGGATND DDVKKAATVA KKDATAADVE ADDFKGLGLK LTTKLADTDA ALADTDAALD LEAVADTVDK HAEAFNDIAD DAKVKAAETA AGKAEAAAGT KKANSADVYT REESDSKFVR GLDKTVSDLR KETRQGLAEQ
AAGTTACCGA CATCAAAGCT AAAAAAGCAA ACAGTGCCGA ATTTGTCAGA ATTGATGGTC GCTTGGCTTC TGCTGAAAAA GGTTTGGATA AAACAGTGTC TGCAGAACAA GCCGCGCTCT TCGAGCACCA CCACCACCAC
RGELAERSGH IGLGKIQSHQ PFDNHASHSD SDEAGSPVDG KGARDXYSYD IKGVAQNIRL FKRATRYSPE LDRSGNAAEA GSNIAVMHGL GLLSTENKMA QGIEAVSNIF MAAIPIKGIG SAVSDNFADA AYAKYPSPYH KLADQRHPKT GVPFDGKGFP IAAAYNNGQE INGFKAGETI KWTNLTKTV NENKQNVDAK ATTNALNKLG ENITTFAEET SLDETNTKAD EAVKTANEAK ANTAADKAEA VAAKVTDIKA IDGLNATTEK LDTRLASAEK AALSGLFQPY NVGLEHHHHH
961-ORF46.1 1 ATGGCCACAA 51 TGCTGCCTAC 101 CCATCTACGA 151 GCAGCCGATG 201 CGTGACTAAC 251 CCAAAGTAAA 301 GCAGACACTG 351 CACCAACGCC 401 AGACTAAGAC 451 GATACCGTCG 501 • GGATGAAACC 551 CCAAACAGAC 601 GCTGCAGAAA 651 TACTGCAGCC 701 AAGCTGATAT 751 GCCGACGTGT 801 TGGTCTGAAC 851 AAAAATCCAT 901 GTGTCAGACC 951 GCTCTCCGGT 1001 CTGCAGTCGG 1051 TTCCGCTTTA 1101 TTCGTCCGGT 1151 GATCCGGAGG 1201 GTTCTCGACC 1251 CAGCAGGGGG 1301 TACAAAGCCA 1351 GGAAATATCG 1401 TTCCCCCTTC 1451 GTCCCGTTGA 1501 CACCATCCCG 1551 TCCCAAAGGC 1601 AAAATATCCG 1651 GCCGACCGTT 1701 CGGATTCAAA 1751 ATGCCGCCGA 1801 GGCGCGGCAG 1851 CGAAGGCTCA 1901 AAAACAAGAT
ACGACGACGA TGTTAAAAAA AACAATGGCC AAGAAATCAA CATTGATGAA GACGGCACAA TTGAAGCCGA CGACTTTAAA CTGACCAAAA CCGTCAATGA AGCTGCAGAA TCTGAAATAG ATGCCGCTTT AGCAGATACT TTGAATAAAT TGGGAGAAAA AAATATCGTA AAAATTGATG ACAAGCATGC CGAAGCATTC AACACTAAGG CAGACGAAGC GGCCGAAGAA ACCAAACAAA CTGCAGCAGG CAAAGCCGAA GACAAGGCCG AAGCTGTCGC CGCTACGAAC AAAGATAATA ACACCAGAGA AGAGTCTGAC GCTACTACCG AAAAATTGGA TGCCGATCAC GATACTCGCC TGCGCAAAGA AACCCGCCAA CTGTTCCAAC CTTACAACGT CGGCTACAAA TCCGAATCGG CCGAAAACTT TGCCGCCAAA TCTTCCGCAG CCTACCATGT AGGAGGATCA GATTTGGCAA GTCAGCATTT CGAACCCGAC GAACTTGCCG AGCGCAGCGG TCAGTTGGGC AACCTGATGA GCTACATTGT CCGCTTTTCC GACAACCATG CCTCACATTC CGGATTTAGC CTTTACCGCA CCGACGGCTA TGACGGGCCA GCGAGGGATA TATACAGCTA CCTCAACCTG ACCGACAACC TCCACAATGC CGGTAGTATG CGCGCCACCC GATACAGCCC AGCCTTCAAC GGCACTGCAG GAGAAATTGT CGGCGCAGGC AACATTGCTG TCATGCACGG GGCGCGCATC AACGATTTGG
GCTGCCACTG TGGCCATTGC CGGTTTCAAA GCTGGAGAGA TTACCAAAAA AGACGCAACT GGTCTGGGTC TGAAAAAAGT AAACAAACAA AACGTCGATG AAAAGTTAAC AACCAAGTTA GATGCCGCTC TGGATGCAAC TATAACGACA TTTGCTGAAG AAAAATTAGA AGCCGTGGCT AACGATATCG CCGATTCATT CGTCAAAACC GCCAATGAAG ACGTCGATGC CAAAGTAAAA GCTGCCGCTG GCACAGCTAA TGCAAAAGTT ACCGACATCA TTGCTAAAAA AGCAAACAGT AGCAAATTTG TCAGAATTGA CACACGCTTG GCTTCTGCTG TGAACGGTTT GGATAAAACA GGCCTTGCAG AACAAGCCGC GGGTCGGTTC AATGTAACGG CAGTCGCCAT CGGTACCGGC GCAGGCGTGG CAGTCGGCAC CGGCGTCAAT TACGAGTGGG ACGATTCTTT TATCCGGCAG GGGAAATACC ACCTATTCGG CCATATCGGA TTGGGAAAAA TTCAACAGGC GGCCATTAAA GATCACGGGC ACGAAGTCCA CGATTCTGAT GAAGCCGGTA TCCATTGGGA CGGATACGAA CAGGGCGGCG GCTATCCCGC CGACATAAAA GGCGTTGCCC GCAGCACCGG ACAACGGCTT CTGACGCAAG GAGTAGGCGA CGAGCTGGAC AGATCGGGCA ATATCGTTAA AAACATCATC GATGCCGTGC AGGGCATAAG CTTGGGTCTG CTTTCCACCG CAGATATGGC GCAACTCAAA 89 89 1951 GACTATGCCG 2001 CGCACAAGGC 2051 TCAAAGGGAT 2101 GCACATCCTA 2151 GAAATCCGCC 2201 CGTCCCCTTA 2251 GGCAAAGAAA 2301 TGTCAAACTG 2351 GTAAAGGGTT 2401 CACCACCACC 1 MATNDDDVKK 51 AADVEADDFK 101 ADTDAALADT 151 DTVDKHAEAF 201 AAETAAGfCAE 251 ADVYTREESD 301 VSDLRKETRQ 351 FRFTENFAAK 401 VLDRQHFEPD 451 GNIGYIVRFS 501 HHPADGYDGP 551 ADRFHNAGSM 601 GAAGEIVGAG 651 DYAAAAIRDW 701 AHPIKRSQMG 751 GKENITSSTV 801 HHHHHH*
CAGCAGCCAT CCGCGATTGG ATAGAAGCCG TCAGCAATAT TGGAGCTGTT CGGGGAAAAT TCAAGCGGTC GCAGATGGGC GTCAGCGACA ATTTTGCCGA CCATTCCCGA AATATCCGTT ACATCACCTC CTCAACCGTG GCAGACCAAC GCCACCCGAA TCCGAATTTT GAGAAGCACG ACCACCACTG A
AATVAIAAAY NNGQEINGFK GLGLKKWTN LTKTVNEHKQ DAALDATTNA LNKLGENITT NDIADSLDET NTKADEAVKT AAAGTANTAA DKAEAVAAKV SKFVRIDGLN ATTEKLDTRL GLAEQAALSG LFQPYNVGRF AGVAVGTSSG SSAAYHVGVN GKYHLFGSRG ELAERSGHIG DHGHEVHSPF DNHASHSDSD QGGGYPAPKG ARDIYSYDIK LTQGVGDGFK RATRYSPELD DAVQGISEGS NIAVMHGLGL AVQNPNAAQG IEAVSNIFMA AIALPKGKSA VSDNFADAAY PPSNGKNVKL ADQRHPKTGV
GCAGTCCAAA ACCCCAATGC CTTTATGGCA GCCATCCCCA ACGGCTTGGG CGGCATCACG GCGATCGCAT TGCCGAAAGG TGCGGCATAC GCCAAATACC CAAACTTGGA GCAGCGTTAC GCGCCGTCAA ACGGCAAAAA GACAGGCGTA CCGTTTGACG TGAAATATGA TACGCTCGAG
AGETIYDIDE DGTITKKDAT NVDAKVKAAE SEIEKLTTKL FAEETKTNIV KIDEKLEAVA ANEAKQTAEE TKQNVDAKVK TDIKADIATN KDNIAKKANS ASAEKSIADH DTRLNGLDKT NVTAAVGGYK SESAVAIGTG YEWGSGGGGS DLANDSFIRQ LGKIQSHQLG NLMIQQAAIK EAGSPVDGFS LYRIHWDGYE GVAQNIRLNL TDNRSTGQRL RSGNAAEAFN GTADIVKNII LSTENKMARI NDLADMAQLK AIPIKGIGAV RGKYGLGGIT AKYPSPYHSR NIRSNLEQRY PFDGKGFPNF EKHVKYDTLE
961-741 1 ATGGCCACAA 51 TGCTGCCTAC 101 CCATCTACGA 151 GCAGCCGATG 201 CGTGACTAAC 251 CCAAAGTAAA 301 GCAGACACTG 351 CACCAACGCC 401 AGACTAAGAC 451 . GATACCGTCG 501 GGATGAAACC 551 C CAAACAGAC 601 GCTGCAGAAA 651 TACTGCAGCC 701 AAGCTGATAT 751 GCCGACGTGT 801 TGGTCTGAAC 851 AAAAATCCAT 901 . GTGTCAGACC 951 GCTCTCCGGT 1001 CTGCAGTCGG 1051 TTCCGCTTTA 1101 TTCGTCCGGT 1151 GATCCGGAGG 1201 GCACTAACCG 1251 GCTGGATCAG 1301 GTGCGGAAAA 1351 AAGAACGACA 1401 CGGGCAGCTC 1451 GCCATTCCGC 1501 CATTCCGGGA 1551 GGGCGAACAT 1601 ATCGCGGGAC 1651 ACCATAGATT 1701 ATCGCCAGAA 1751 GAAAACGCCA 1801 AAAGGCAGTT
ACGACGACGA TGTTAAAAAA AACAATGGCC AAGAAATCAA CATTGATGAA GACGGCACAA TTGAAGCCGA CGACTTTAAA CTGACCAAAA CCGTCAATGA AGCTGCAGAA TCTGAAATAG ATGCCGCTTT AGCAGATACT TTGAATAAAT TGGGAGAAAA AAATATCGTA AAAATTGATG ACAAGCATGC CGAAGCATTC AACACTAAGG CAGACGAAGC GGCCGAAGAA ACCAAACAAA CTGCAGCAGG CAAAGCCGAA GACAAGGCCG AAGCTGTCGC CGCTACGAAC AAAGATAATA ACACCAGAGA AGAGTCTGAC GCTACTACCG AAAAATTGGA TGCCGATCAC GATACTCGCC TGCGCAAAGA AACCCGCCAA CTGTTCCAAC CTTACAACGT CGGCTACAAA TCCGAATCGG CCGAAAACTT TGCCGCCAAA TCTTCCGCAG CCTACCATGT GGGTGGTGTC GCCGCCGACA CACCGCTCGA CCATAAAGAC TCCGTCAGGA AAAACGAGAA AACTTATGGA AACGGTGACA AGGTCAGCCG TTTCGACTTT ATTACCTTGG AGAGTGGAGA CTTAACCGCC TTTCAGACCG AGATGGTTGC GAAACGCCAG ACATCTTTTG ACAAGCTTCC GGCGTTCGGT TCAGACGATG TCGCCGCCAA GCAGGGAAAC CTCAATGTCG ACCTGGCCGC TGCCGTCATC AGCGGTTCCG ACTCCCTCGG TATCTTTGGC
GCTGCCACTG TGGCCATTGC CGGTTT CAAA GCTGGAGAGA TTACCAAAAA AGACGCAACT GGTCTGGGTC TGAAAAAAGT AAACAAACAA AACGTCGATG AAAAGTTAAC AACCAAGTTA GATGCCGCTC TGGATGCAAC TATAACGACA TTTGCTGAAG AAAAATTAGA AGCCGTGGCT AACGATATCG CCGATTCATT CGTCAAAACC GCCAATGAAG ACGTCGATGC CAAAGTAAAA GCTGCCGCTG GCACAGCTAA TGCAAAAGTT ACCGACATCA TTGCTAAAAA AGCAAACAGT AGCAAATTTG TCAGAATTGA CACACGCTTG GCTTCTGCTG TGAACGGTTT GGATAAAACA GGCCTTGCAG AACAAGCCGC GGGTCGGTTC AATGTAACGG CAGTCGCCAT CGGTACCGGC GCAGGCGTGG CAGTCGGCAC CGGCGTCAAT TACGAGTGGG TCGGTGCGGG GCTTGCCGAT AAAGGTTTGC AGTCTTTGAC ACTGAAGCTG GCGGCACAAG GCCTCAATAC GGGCAAATTG ATCCGCCAAA TCGAAGTGGA GTTCCAAGTA TACAAACAAA AGCAAATACA AGATTCGGAG TTCAGAATCG GCGACATAGC CGAAGGCGGC AGGGCGACAT CCGGCGGAAA ACTGACCTAC GGCAAAATCG AACATTTGAA CGCCGATATC AAGCCGGATG TCCTTTACAA CCAAGCCGAG GGAAAAGCCC AGGAAGTTGC 90
1851 CGGCAGCGCG GAAGTGAAAA CCGTAAACGG CATACGCCAT ATCGGCCTTG
1901 CCGCCAAGCA ACTCGAGCAC CACCACCACC ACCACTGA
1 MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT
51 AADVEADDFK GLGLKKWTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL
101 ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA
151 DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK
201 AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS
251 ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT
301 VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG
351 FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGV AADIGAGLAD
401 ALTAPLDHKD KGLQSLTLDQ SVRKNEKLKL AAQGAEKTYG NGDSLNTGKL
451 KNDKVSRFDF IRQIEVDGQL ITLESGEFQV YKQSHSALTA FQTEQIQDSE
501 HSGKMVAKRQ FRXGDIAGEH TSFDKLPEGG RATYRGTAFG SDDAGGKLTY
551 TIDFAAKQGN GKIEHLKSPE LNVDLAAADI KPDGKRHAVX SGSVLYNQAE 601 KGSYSLGIFG GKAQEVAGSA EVKTVNGIRH IGLAAKQLEH HHHHH* 961-983
1 ATGGCCACAA ACGACGACGA 51 TGCTGCCTAC AACAATGGCC 101 CCATCTACGA CATTGATGAA 151 GCAGCCGATG TTGAAGCCGA 201 CGTGACTAAC CTGACCAAAA 251 CCAAAGTAAA AGCTGCAGAA 301 GCAGACACTG ATGCCGCTTT 351 CACCAACGCC TTGAATAAAT 401 AGACTAAGAC AAATATCGTA 451 GATACCGTCG ACAAGCATGC 501 GGATGAAACC AACACTAAGG 551 CCAAACAGAC GGCCGAAGAA 601 GCTGCAGAAA CTGCAGCAGG 651 TACTGCAGCC GACAAGGCCG 701 AAGCTGATAT CGCTACGAAC 751 GCCGACGTGT ACACCAGAGA 801 TGGTCTGAAC GCTACTACCG 851 AAAAATCCAT TGCCGATCAC 901 GTGTCAGACC TGCGCAAAGA 951 GCTCTCCGGT CTGTTCCAAC 1001 CTGCAGTCGG CGGCTACAAA 1051 TTCCGCTTTA CCGAAAACTT 1101 TTCGTCCGGT TCTTCCGCAG 1151 GATCCGGCGG AGGCGGCACT 1201 GGTATCGGCA GCAACAGCAG 1251 TTACGCCGGT AT CAAGAACG 1301 CCGGTCGGGA TGACGTTGCG 1351 CCCCCCCCGA ATCTGCATAC 1401 CAAGAATTTG ATCAACCTCA 1451 GCGGGGTAGA GGTAGGTATC 1501 TCCTTTCCCG AACTGTATGG 1551 CAAAAACTAT ACGGCGTATA 1601 GTAAAGACAT TGAAGCTTCT 1651 GCAAAGCCGA CGGATATCCG 1701 GGTCTCCCAT ATTATTGGCG 1751 GTATTGCGCC CGATGCGACG 1801 AAGAACGAAA TGATGGTTGC 1851 CGAACGTGGC GTGCGCATCG 1901 CAGGCACTGC CGACCTTTTC 1951 CAAGCGTTGC TCGACTATTC 2001 CCTGATGCAA CAGAGCGATT 2051 AAAACATGCT TTTCATCTTT 2101 AACACATATG CCCTATTGCC 2151 TATCACAGTC GCAGGCGTAG 2201 TGTATGGAGA ACCGGGTACA 2251 GGAATTACTG CCATGTGGTG 2301 TTTCACCCGT ACAAACCCGA 2351 CCATCGTAAC CGGCACGGCG
TGTTAAAAAA GCTGCCACTG TGGCCATTGC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA GACGGCACAA TTACCAAAAA AGACGCAACT CGACTTTAAA GGTCTGGGTC TGAAAAAAGT CCGTCAATGA AAACAAACAA AACGTCGATG TCTGAAATAG AAAAGTTAAC AACCAAGTTA AGCAGATACT GATGCCGCTC TGGATGCAAC TGGGAGAAAA TATAACGACA TTTGCTGAAG AAAATTGATG AAAAATTAGA AGCCGTGGCT CGAAGCATTC ÁACGATATCG CCGATTCATT CAGACGAAGC CGTCAAAACC GCCAATGAAG ACCAAACAAA ACGTCGATGC CAAAGTAAAA CAAAGCCGAA GCTGCCGCTG GCACAGCTAA AAGCTGTCGC TGCAAAAGTT ACCGACATCA AAAGATAATA TTGCTAAAAA AGCAAACAGT AGAGTCTGAC AGCAAATTTG TCAGAATTGA AAAAATTGGA CACACGCTTG GCTTCTGCTG GATACTCGCC TGAACGGTTT GGATAAAACA AACCCGCCAA GGCCTTGCAG AACAAGCCGC CTTACAACGT GGGTCGGTTC AATGTAACGG TCCGAATCGG CAGTCGCCAT CGGTACCGGC TGCCGCCAAA GCAGGCGTGG CAGTCGGCAC CCTACCATGT CGGCGTCAAT TACGAGTGGG TCTGCGCCCG ACTTCAATGC AGGCGGTACC AGCAACAACA GCGAAATCAG CAGCAGTATC AAATGTGCAA AGACAGAAGC ATGCTCTGTG GTTACAGACA GGGATGCCAA AATCAATGCC CGGAGACTTT CCAAACCCAA ATGACGCATA AACCTGCAAT TGAAGCAGGC TATACAGGAC GTCGACACAG GCGAATCCGT CGGCAGCATA CAGAAAAGAA CACGGCTATA ACGAAAATTA TGCGGAAGGA AGCGCCTGAA GACGGAGGCG TTCGACGATG AGGCCGTTAT AGAGACTGAA CCACGTAAAA GAAATCGGAC ACATCGATTT GGCGTTCCGT GGACGGCAGA CCTGCAGGCG CTACACATAA TGAATACGAA TGATGAAACC AGCCATCCGC AATGCATGGG TCAAGCTGGG TCAATAACAG TTTTGGAACA ACATCGAGGG CAAATAGCCA ATTCGGAGGA GCAGTACCGC CGGCGGTGAT AAAACAGACG AGGGTATCCG ACGGCAACCT GTCCTACCAC ATCCGTAATA TCGACAGGCA ATGACGCACA AGCTCAGCCC ATTTTATGAA AAAGACGCTC AAAAAGGCAT ACCGCAGTGG AGAAAAGTTC AAACGGGAAA GAACCGCTTG AGTATGGCTC CAACCATTGC CCTGTCGGCA CCCTATGAAG CAAGCGTCCG TTCAAATTGC CGGAACATCC TTTTCCGCAC GCTCTGCTGC TGCAGAAATA CCCGTGGATG 91
AGCAACGACA ACCTGCGTAC CACGTTGCTG ACGACGGCTC AGGACATCGG TGCAGTCGGC gtggacagca agttcggctg gggactgctg gatgcgggta AGGCCATGAA CGGACCCGCG TCCTTTCCGT TCGGCGACTT TACCGCCGAT ACGAAAGGTA CATCCGATAT TGCCTACTCC TTCCGTAACG ACATTTCAGG CACGGGCGGC CTGATCAAAA AAGGCGGCAG CCAACTGCAA CTGCACGGCA ACAACACCTA TACGGGCAAA ACCATTATCG AAGGCGGTTC GCTGGTGTTG TACGGCAACA ACAAATCGGA TATGCGCGTC GAAACCAAAG GTGCGCTGAT TTATAACGGG GCGGCATCCG GCGGCAGCCT GAACAGCGAC GGCATTGTCT ATCTGGCAGA TACCGACCAA TCCGGCGCAA ACGAAACCGT ACACATCAAA GGCAGTCTGC AGCTGGACGG CAAAGGTACG CTGTACACAC GTTTGGGCAA ACTGCTGAAA GTGGACGGTA CGGCGATTAT CGGCGGCAAG CTGTACATGT CGGCACGCGG CAAGGGGGCA GGCTATCTCA ACAGTACCGG ACGACGTGTT CCCTTCCTGA GTGCCGCCAA AATCGGGCAG GATTATTCTT TCTTCACAAA CATCGAAACC GACGGCGGCC TGCTGGCTTC CCTCGACAGC GTCGAAAAAA CAGCGGGCAG TGAAGGCGAC ACGCTGTCCT ATTATGTCCG TCGCGGCAAT GCGGCACGGA CTGCTTCGGC AGCGGCACAT TCCGCGCCCG CCGGTCTGAA ACACGCCGTA GAACAGGGCG GCAGCAATCT GGAAAACCTG ATGGTCGAAC TGGATGCCTC CGAATCATCC GCAACACCCG AGACGGTTGA AACTGCGGCA GCCGACCGCA CAGATATGCC GGGCATCCGC CCCTACGGCG CAACTTTCCG CGCAGCGGCA GCCGTACAGC ATGCGAATGC CGCCGACGGT GTACGCATCT TCAACAGTCT CGCCGCTACC GTCTATGCCG ACAGTACCGC CGCCCATGCC GATATGCAGG GACGCCGCCT GAAAGCCGTA TCGGACGGGT TGGACCACAA CGGCACGGGT CTGCGCGTCA TCGCGCAAAC CCAACAGGAC GGTGGAACGT GGGAACAGGG CGGTGTTGAA GGCAAAATGC GCGGCAGTAC CCAAACCGTC GGCATTGCCG CGAAAACCGG CGAAAATACG ACAGCAGCCG CCACACTGGG CATGGGACGC AGCACATGGA GCGAAAACAG TGCAAATGCA AAAACCGACA GCATTAGTCT GTTTGCAGGC ATACGGCACG ATGCGGGCGA TATCGGCTAT CTCAAAGGCC TGTTCTCCTA CGGACGCTAC AAAAACAGCA TCAGCCGCAG CACCGGTGCG GACGAACATG CGGAAGGCAG CGTCAACGGC ACGCTGATGC AGCTGGGCGC ACTGGGCGGT GTCAACGTTC CGTTTGCCGC AACGGGAGAT TTGACGGTCG AAGGCGGTCT GCGCTACGAC CTGCTCAAAC AGGATGCATT CGCCGAAAAA GGCAGTGCTT TGGGCTGGAG CGGCAACAGC CTCACTGAAG GCAGGCTGGT CGGACTCGCG GGTCTGAAGC TGTCGCAACC CTTGAGCGAT AAAGCCGTCC TGTTTGCAAC GGCGGGCGTG GAACGCGACC TGAACGGACG CGACTACACG GTAACGGGCG GCTTTACCGG CGCGACTGCA GCAACCGGCA AGACGGGGGC ACGCAATATG CCGCACACCC GTCTGGTTGC CGGCCTGGGC GCGGATGTCG AATTCGGCAA CGGCTGGAAC GGCTTGGCAC GTTACAGCTA CGCCGGTTCC AAACAGTACG GCAACCACAG CGGACGAGTC GGCGTAGGCT ACCGGTTCCT CGAGCACCAC CACCACCACC ACTGA
MATNDDDVKK AATVAIAAAY NNGQEINGFK AGETIYDIDE DGTITKKDAT AADVEADDFK GLGLKKWTN LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL ADTDAALADT DAALDATTNA LNKLGENITT FAEETKTNIV KIDEKLEAVA DTVDKHAEAF NDIADSLDET NTKADEAVKT ANEAKQTAEE TKQNVDAKVK AAETAAGKAE AAAGTANTAA DKAEAVAAKV TDIKADIATN KDNIAKKANS ADVYTREESD SKFVRIDGLN ATTEKLDTRL ASAEKSIADH DTRLNGLDKT VSDLRKETRQ GLAEQAALSG LFQPYNVGRF NVTAAVGGYK SESAVAIGTG FRFTENFAAK AGVAVGTSSG SSAAYHVGVN YEWGSGGGGT SAPDFNAGGT GIGSNSRATT AKSAAVSYAG IKNEMCKDRS MLCAGRDDVA VTDRDAKINA PPPNLHTGDF PNPNDAYKNL INLKPAIEAG YTGRGVEVGI VDTGESVGSI SFPELYGRKE HGYNENYKNY TAYMRKEAPE DGGGKDIEAS FDDEAVIETE AKPTDIRHVK EXGHIDLVSH IIGGRSVDGR PAGGIAPDAT LHIMNTNDET KNEMMVAAIR NAHVKLGERG VRIVNNSFGT TSRAGTADLF QIANSEEQYR QALLDYSGGD KTDEGIRLMQ QSDYGNLSYH IRNKNMLFIF STGNDAQAQP NTYALLPFYE KDAQKGIITV AGVDRSGEKF KREMYGEPGT EPLEYGSNHC GITAMWCLSA PYEASVRFTR TNPIQIAGTS FSAPIVTGTA ALLLQKYPWM SNDNLRTTLL TTAQDIGAVG VDSKFGWGLL DAGKAMNGPA SFPFGDFTAD TKGTSDIAYS FRNDISGTGG LIKKGGSQLQ LHGNNTYTGK TIIEGGSLVL YGNNKSDMRV ETKGALIYNG AASGGSLNSD GIVYLADTDQ SGANETVHIK GSLQLDGKGT LYTRLGKLLK VDGTAIIGGK LYMSARGKGA GYLNSTGRRV PFLSAAKIGQ DYSFFTNIET DGGLLASLDS VEKTAGSEGD TLSYYVRRGN AARTASAAAH SAPAGLKHAV EQGGSNLENL MVELDASESS ATPETVETAA ADRTDMPGIR PYGATFRAAA. AVQHANAADG VRIFNSLAAT VYADSTAAHA DMQGRRLKAV SDGLDHNGTG LRVIAQTQQD GGTWEQGGVE GKMRGSTQTV GIAAKTGENT TAAATLGMGR STWSENSANA KTDSISLFAG IRHDAGDIGY LKGLFSYGRY KNSISRSTGA DEHAEGSVNG TLMQLGALGG VNVPFAATGD LTVEGGLRYD LLKQDAFAEK GSALGWSGNS LTEGTLVGLA GLKLSQPLSD 92 1351 KAVLFATAGV ERDLNGRDYT VTGGFTGATA ATGKTGARNM PHTRLVAGLG 1401 ADVEFGNGWN GLARYSYAGS KQYGNHSGRV GVGYRFLEHH HHHH*
961C-ORF46.1 1 ATGGCCACAA 51 TGCTGCCTAC 101 CCATCTACGA 151 GCAGCCGATG 201 CGTGACTAAC 251 CCAAAGTAAA 301 GCAGACACTG 351 CACCAACGCC 401 AGACTAAGAC 451 GATACCGTCG 501 GGATGAAACC 551 CCAAACAGAC 601 GCTGCAGAAA 651 TACTGCAGCC 701 AAGCTGATAT 751 GCCGACGTGT 801 TGGTCTGAAC 851 AAAAATCCAT 901 GTGTCAGACC 951 GCTCTCCGGT 1001 GATCAGATTT 1051 CATTTCGAAC 1101 TGCCGAGCGC 1151 TGGGCAACCT 1201 ATTGTCCGCT 1251 CCATGCCTCA 1301 TTAGCCTTTA 1351 GGCTATGACG 1401 GGATATATAC 1451 ACCTGACCGA 1501 AATGCCGGTA 1551 CACCCGATAC 1601 TCAACGGCAC 1651 ATTGTCGGCG 1701 TGCTGTCATG 1751 GCATCAACGA 1801 GCCATCCGCG 1851 AGCCGTCAGC- 1901 CTGTTCGGGG 1951 CGGTCGCAGA 2001 CGACAATTTT 2051 CCCGAAATAT 2101 ACCTCCTCAA 2151 CCAACGCCAC 2201 ATTTTGAGAA 2251 CACTGA 1 MATNDDDVKK 51 AADVEADDFK 101 ADTDAALADT 151 DTVDKHAEAF 201 AAETAAGKAE 251 ADVYTREESD 301 VSDLRKETRQ 351 . HFEPDGKYHL 401 XVRFSDHGHE 451 GYDGPQGGGY 501 NAGSMLTQGV 551 IVGAGDAVQG 601 AIRDWAVQNP 651 RSQMGAIALP 701 TSSTVPPSNG
ACGACGACGA TGTTAAAAAA AACAATGGCC AAGAAATCAA CATTGATGAA GACGGCACAA TTGAAGCCGA CGACTTTAAA CTGACCAAAA CCGTCAATGA AGCTGCAGAA TCTGAAATAG ATGCCGCTTT AGCAGATACT TTGAATAAAT TGGGAGAAAA AAATATCGTA AAAATTGATG ACAAGCATGC CGAAGCATTC AACACTAAGG CAGACGAAGC GGCCGAAGAA ACCAAACAAA CTGCAGCAGG CAAAGCCGAA GACAAGGCCG AAGCTGTCGC CGCTACGAAC AAAGATAATA ACACCAGAGA AGAGTCTGAC GCTACTACCG AAAAATTGGA TGCCGATCAC GATACTCGCC TGCGCAAAGA AACCCGCCAA CTGTTCCAAC CTTACAACGT GGCAAACGAT TCTTTTATCC CCGACGGGAA ATACCACCTA AGCGGCCATA TCGGATTGGG GATGATTCAA CAGGCGGCCA TTTCCGATCA CGGGCACGAA CATTCCGATT CTGATGAAGC CCGCATCCAT TGGGACGGAT GGCCACAGGG CGGCGGCTAT AGCTACGACA TAAAAGGCGT CAACCGCAGC ACCGGACAAC GTATGCTGAC GCAAGGAGTA AGCCCCGAGC TGGACAGATC TGCAGATATC GTTAAAAACA CAGGCGATGC CGTGCAGGGC CACGGCTTGG GTCTGCTTTC TTTGGCAGAT ATGGCGCAAC ATTGGGCAGT CCAAAACCCC AATATCTTTA TGGCAGCCAT AAAATACGGC TTGGGCGGCA TGGGCGCGAT CGCATTGCCG GCCGATGCGG CATACGCCAA CCGTTCAAAC TTGGAGCAGC CCGTGCCGCC GTCAAACGGC CCGAAGACAG GCGTACCGTT GCACGTGAAA TATGATACGC
AATVAIAAAY NNGQEINGFK GLGLKKVVTN LTKTVNENKQ DAALDATTNA LNKLGENITT NDIADSLDET NTKADEAVKT AAAGTANTAA DKAEAVAAKV SKFVRIDGLN ATTEKLDTRL GLAEQAALSG LFQPYNVGGS FGSRGELAER SGHIGLGKIO VHSPFDNHAS HSDSDEAGSP PAPKGARDIY SYDIKGVAQN GDGFKRATRY SPELDRSGNA ISEGSNIAVM HGLGLLSTEN NAAQGIEAV5 NIFMAAIPIK KGKSAVSDNF ADAAYAKYPS KNVKLADQRH PKTGVPFDGK
GCTGCCACTG TGGCCATTGC CGGTTTCAAA GCTGGAGAGA TTACCAAAAA AGACGCAACT GGTCTGGGTC TGAAAAAAGT AAACAAACAA AACGTCGATG AAAAGTTAAC AACCAAGTTA GATGCCGCTC TGGATGCAAC TATAACGACA TTTGCTGAAG AAAAATTAGA AGCCGTGGCT AACGATATCG CCGATTCATT CGTCAAAACC GCCAATGAAG ACGTCGATGC CAAAGTAAAA GCTGCCGCTG GCACAGCTAA TGCAAAAGTT ACCGACATCA TTGCTAAAAA AGCAAACAGT AGCAAATTTG TCAGAATTGA CACACGCTTG GCTTCTGCTG TGAACGGTTT GGATAAAACA GGCCTTGCAG AACAAGCCGC GGGTGGATCC GGAGGAGGAG GGCAGGTTCT CGACCGTCAG TTCGGCAGCA GGGGGGAACT AAAAATACAA AGCCATCAGT TTAAAGGAAA TATCGGCTAC GTCCATTCCC CCTTCGACAA CGGTAGTCCC GTTGACGGAT ACGAACACCA TCCCGCCGAC CCCGCTCCCA AAGGCGCGAG TGCCCAAAAT ATCCGCCTCA GGCTTGCCGA CCGTTTCCAC GGCGACGGAT TCAAACGCGC GGGCAATGCC GCCGAAGCCT TCATCGGCGC GGCAGGAGAA ATAAGCGAAG GCTCAAACAT CACCGAAAAC AAGATGGCGC TCAAAGACTA TGCCGCAGCA AATGCCGCAC AAGGCATAGA CCCCATCAAA GGGATTGGAG TCACGGCACA TCCTATCAAG AAAGGGAAAT CCGCCGTCAG ATACCCGTCC CCTTACCATT GTTACGGCAA AGAAAACATC AAAAATGTCA AACTGGCAGA TGACGGTAAA GGGTTTCCGA TCGAGCACCA CCACCACCAC
AGETIYDIDÉ DGTITKKDAT NVDAKVKAAE SEIEKLTTKL FAEETKTNIV KIDEKLEAVA ANEAKQTAEE TKQNVDAKVK TDIKADIATN KDNIAKKANS ASAEKSIADH DTRLNGLDKT GGGGSDLAND SFIRQVLDRQ SHQLGNLMIQ QAAIKGNIGY VDGFSLYRIH WDGYEHHPAD IRLNLTDNRS TGQRLADRFH AEAFNGTADI VKNIIGAAGE KMARINDLAD MAQLKDYAAA GIGAVRGKYG LGGITAHPIK PYHSRNIRSN LEQRYGKENI GFPNFEKHVK YDTLEHHHHH 93 751 Η* 961c—741
1 ATGGCCACAA ACGACGACGA 51 TGCTGCCTAC AACAATGGCC 101 CCATCTACGA CATTGATGAA 151 GCAGCCGATG TTGAAGCCGA 201 CGTGACTAAC CTGACCAAAA 251 CCAAAGTAAA AGCTGCAGAA 301 GCAGACACTG ATGCCGCTTT 351 CACCAACGCC TTGAATAAAT 401 AGACTAAGAC AAATATCGTA 451 GATACCGTCG ACAAGCATGC 501 GGATGAAACC AACACTAAGG 551 CCAAACAGAC GGCCGAAGAA 601 GCTGCAGAAA CTGCAGCAGG 651 TACTGCAGCC GACAAGGCCG 701 AAGCTGATAT CGCTACGAAC 751 GCCGACGTGT ACACCAGAGA 801 TGGTCTGAAC GCTACTACCG 851 AAAAATCCAT TGCCGATCAC 901 GTGTCAGACC TGCGCAAAGA 951 GCTCTCCGGT CTGTTCCAAC 1001 GTGTCGCCGC CGACATCGGT 1051 CTCGACCATA AAGACAAAGG 1101 CAGGÂAAAAC GAGAAACTGA 1151 ATGGAAACGG TGACAGCCTC 1201 AGCCGTTTCG ACTTTATCCG 1251 CTTGGAGAGT GGAGAGTTCC 1301 CCGCCTTTCA GACCGAGCAA 1351 GTTGCGAAAC GCCAGTTCAG 1401 TTTTGACAAG CTTCCCGAAG 1451 TCGGTTCAGA CGATGCCGGC 1501 GCCAAGCAGG GAAACGGCAA 1551 TGTCGACCTG GCCGCCGCCG 1601 TCATCAGCGG TTCCGTCCTT 1651 CTCGGTATCT TTGGCGGAAA 1701 GAAAACCGTA AACGGCATAC 1751 AGCACCACCA CCACCACCAC 1 MATNDDDVKK AATVAIAAAY 51 AADVEADDFK GLGLKKWTN 101 ADTDAALADT DAALDATTNA 151 DTVDKHAEAF NDIADSLDET 201 AAETAAGKAE AAAGTANTAA 251 ADVYTREESD SKFVRIDGLN 301 VSDLRKETRQ GLAEQAALSG 351 LDHKDKGLQS LTLDQSVRKN 401 SRFDFIRQIE VDGQLITLES 451 VAKRQFRIGD IAGEHTSFDK 501 AKQGNGKIEH LKSPELNVDL 551 LGIFGGKAQE VAGSAEVKTV
TGTTAAAAAA GCTGCCACTG TGGCCATTGC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA GACGGCACAA TTACCAAAAA AGACGCAACT CGACTTTAAA GGTCTGGGTC TGAAAAAAGT CCGTCAATGA AAACAAACAA AACGTCGATG TCTGAAATAG AAAAGTTAAC AACCAAGTTA AGCAGATACT GATGCCGCTC TGGATGCAAC TGGGAGAAAA TATAACGACA TTTGCTGAAG AAAATTGATG AAAAATTAGA AGCCGTGGCT CGAAGCATTC AACGATATCG CCGATTCATT CAGACGAAGC CGTCAAAACC GCCAATGAAG ACCAAACAAA ACGTCGATGC CAAAGTAAAA CAAAGCCGAA GCTGCCGCTG GCACAGCTAA AAGCTGTCGC TGCAAAAGTT ACCGACATCA AAAGATAATA TTGCTAAAAA AGCAAACAGT AGAGTCTGAC AGCAAATTTG TCAGAATTGA AAAAATTGGA CACACGCTTG GCTTCTGCTG GATACTCGCC TGAACGGTTT GGATAAAACA AACCCGCCAA GGCCTTGCAG AACAAGCCGC CTTACAACGT GGGTGGATCC GGAGGGGGTG GCGGGGCTTG CCGATGCACT AACCGCACCG TTTGCAGTCT TTGACGCTGG ATCAGTCCGT AGCTGGCGGC ACAAGGTGCG GAAAAAACTT AATACGGGCA AATTGAAGAA CGACAAGGTC CCAAATCGAA GTGGACGGGC AGCTCATTAC AAGTATACAA ACAAAGCCAT TCCGCCTTAA ATACAAGATT CGGAGCATTC CGGGAAGATG AATCGGCGAC ATAGCGGGCG AACATACATC GCGGCAGGGC GACATATCGC GGGACGGCGT GGAAAACTGA CCTACACCAT AGATTTCGCC AATCGAACAT TTGAAATCGC CAGAACTCAA ATATCAAGCC GGATGGAAAA CGCCATGCCG TACAACCAAG CCGAGAAAGG CAGTTACTCC AGCCCAGGAA GTTGCCGGCA GCGCGGAAGT GCCATATCGG CCTTGCCGCC AAGCAACTCG TGA NNGQEINGFK AGETIYDIDE DGTITKKDAT LTKTVNENKQ NVDAKVKAAE SEIEKLTTKL LNKLGENITT FAEETKTNIV KIDEKLEAVA NTKADEAVKT ANEAKQTAEE TKQNVDAKVK DKAEAVAAKV TDIKADIATN KDNIAKKANS ATTEKLDTRL ASAEKSIADH DTRLNGLDKT LFQPYNVGGS GGGGVAADIG AGLADALTAP EKLKLAAQGA EKTYGNGDSL NTGKLKNDKV GEFQVYKQSH SALTAFQTEQ IQDSEHSGKM LPEGGRATYR GTAFGSDDAG GKLTYTIDFA AAADIKPDGK RHAVISGSVL YNQAEKGSYS NGIRHIGLAA KQLEHHHHHH *
961c-! 1 983 ATGGCCACAA ACGACGACGA 51 TGCTGCCTAC AACAATGGCC 101 CCATCTACGA CATTGATGAA 151 GCAGCCGATG TTGAAGCCGA 201 CGTGACTAAC CTGACCAAAA 251 CCAAAGTAAA AGCTGCAGAA 301 GCAGACACTG ATGCCGCTTT 351 CACCAACGCC TTGAATAAAT 401 AGACTAAGAC AAATATCGTA 451 GATACCGTCG ACAAGCATGC 501 GGATGAAACC AACACTAAGG
TGTTAAAAAA GCTGCCACTG TGGCCATTGC AAGAAATCAA CGGTTTCAAA GCTGGAGAGA GACGGCACAA TTACCAAAAA AGACGCAACT CGACTTTAAA GGTCTGGGTC TGAAAAAAGT CCGTCAATGA AAACAAACAA AACGTCGATG TCTGAAATAG AAAAGTTAAC AACCAAGTTA AGCAGATACT GATGCCGCTC TGGATGCAAC TGGGAGAAAA TATAACGACA TTTGCTGAAG AAAATTGATG AAAAATTAGA AGCCGTGGCT CGAAGCATTC AACGATATCG CCGATTCATT CAGACGAAGC CGTCAAAACC GCCAATGAAG 94
CCAAACAGAC GGCCGAAGAA ACCAAACAAA ACGTCGATGC CAAAGTAAAA GCTGCAGAAA CTGCAGCAGG CAAAGCCGAA GCTGCCGCTG GCACAGCTAA TACTGCAGCC GACAAGGCCG AAGCTGTCGC TGCAAAAGTT ACCGACATCA AAGCTGATAT CGCTACGAAC AAAGATAATA TTGCTAAAAA AGCAAACAGT GCCGACGTGT ACACCAGAGA AGAGTCTGAC AGCAAATTTG TCAGAATTGA TGGTCTGAAC GCTACTACCG AAAAATTGGA CACACGCTTG GCTTCTGCTG AAAAATCCAT TGCCGATCAC GATACTCGCC TGAACGGTTT GGATAAAACA GTGTCAGACC TGCGCAAAGA AACCCGCCAA GGCCTTGCAG AACAAGCCGC GCTCTCCGGT CTGTTCCAAC CTTACAACGT GGGTGGATCC GGCGGAGGCG GCACTTCTGC GCCCGACTTC AATGCAGGCG GTACCGGTAT CGGCAGCAAC AGCAGAGCAA CAACAGCGAA ATCAGCAGCA GTATCTTACG CCGGTATCAA GAACGAAATG TGCAAAGACA GAAGCATGCT CTGTGCCGGT CGGGATGACG TTGCGGTTAC AGACAGGGAT GCCAAAATCA ATGCCCCCCC CCCGAATCTG CATACCGGAG ACTTTCCAAA CCCAAATGAC GCATACAAGA ATTTGATCAA CCTCAAACCT GCAATTGAAG CAGGCTATAC AGGACGCGGG GTAGAGGTAG GTATCGTCGA CACAGGCGAA TCCGTCGGCA GCATATCCTT TCCCGAACTG TATGGCAGAA AAGAACACGG CTATAACGAA AATTACAAAA ACTATACGGC GTATATGCGG AAGGAAGCGC CTGAAGACGG AGGCGGTAAA GACATTGAAG CTTCTTTCGA CGATGAGGCC GTTATAGAGA CTGAAGCAAA GCCGACGGAT ATCCGCCACG TAAAAGAAAT CGGACACATC GATTTGGTCT CCCATATTAT TGGCGGGCGT TCCGTGGACG GCAGACCTGC AGGCGGTATT GCGCCCGATG CGACGCTACA CATAATGAAT ACGAATGATG AAACCAAGAA CGAAATGATG GTTGCAGCCA TCCGCAATGC ATGGGTCAAG CTGGGCGAAC GTGGCGTGCG CATCGTCAAT AACAGTTTTG GAACAACATC GAGGGCAGGC ACTGCCGACC TTTTCCAAAT AGCCAATTCG GAGGAGCAGT ACCGCCAAGC GTTGCTCGAC TATTCCGGCG GTGATAAAAC AGACGAGGGT ATCCGCCTGA TGCAACAGAG CGATTACGGC AACCTGTCCT ACCACATCCG TAATAAAAAC ATGCTTTTCA TCTTTTCGAC AGGCAATGAC GCACAAGCTC AGCCCAACAC ATATGCCCTA TTGCCATTTT ATGAAAAAGA CGCTCAAAAA GGCATTATCA CAGTCGCAGG CGTAGACCGC AGTGGAGAAA AGTTCAAACG GGAAATGTAT GGAGAACCGG GTACAGAACC GCTTGAGTAT GGCTCCAACC ATTGCGGAAT TACTGCCATG TGGTGCCTGT CGGCACCCTA TGAAGCAAGC GTCCGTTTCA CCCGTACAAA CCCGATTCAA ATTGCCGGAA CATCCTTTTC CGCACCCATC GTAACCGGCA CGGCGGCTCT GCTGCTGCAG AAATACCCGT GGATGAGCAA CGACAACCTG CGTACCACGT TGCTGACGAC GGCTCAGGAC ATCGGTGCAG TCGGCGTGGA CAGCAAGTTC GGCTGGGGAC TGCTGGATGC GGGTAAGGCC ATGAACGGAC CCGCGTCCTT TCCGTTCGGC GACTTTACCG CCGATACGAA AGGTACATCC GATATTGCCT ACTCCTTCCG TAACGACATT TCAGGCACGG GCGGCCTGAT CAAAAAAGGC GGCAGCCAAC TGCAACTGCA CGGCAACAAC ACCTATACGG GCAAAACCAT TATCGAAGGC GGTTCGCTGG TGTTGTACGG CAACAACAAA TCGGATATGC GCGTCGAAAC CAAAGGTGCG CTGATTTATA ACGGGGCGGC ATCCGGCGGC AGCCTGAACA GCGACGGCAT TGTCTATCTG GCAGATACCG ACCAATCCGG CGCAAACGAA ACCGTACACA TCAAAGGCAG TCTGCAGCTG GACGGCAAAG gtacgctgta cacacgtttg ggcaaactgc tgaaagtgga cggtacggcg attatcggcg gcaagctgta catgtcggca CGCGGCAAGG gggcaggcta tctcaacagt accggacgac gtgttccctt cctgagtgcc
GCCAAAATCG GGCAGGATTA TTCTTTCTTC ACAAACATCG AAACCGACGG CGGCCTGCTG GCTTCCCTCG ACAGCGTCGA AAAAACAGCG GGCAGTGAAG GCGACACGCT GTCCTATTAT GTCCGTCGCG GCAATGCGGC ACGGACTGCT TCGGCAGCGG CACATTCCGC GCCCGCCGGT CTGAAACACG CCGTAGAACA GGGCGGCAGC AATCTGGAAA ACCTGATGGT CGAACTGGAT GCCTCCGAAT CATCCGCAAC ACCCGAGACG GTTGAAACTG CGGCAGCCGA CCGCACAGAT ATGCCGGGCA TCCGCCCCTA CGGCGCAACT TTCCGCGCAG CGGCAGCCGT ACAGCATGCG AATGCCGCCG ACGGTGTACG CATCTTCAAC AGTCTCGCCG CTACCGTCTA TGCCGACAGT ACCGCCGCCC ATGCCGATAT GCAGGGACGC CGCCTGAAAG CCGTATCGGA CGGGTTGGAC CACAACGGCA CGGGTCTGCG CGTCATCGCG CAAACCCAAC AGGACGGTGG AACGTGGGAA CAGGGCGGTG TTGAAGGCAA AATGCGCGGC AGTACCCAAA CCGTCGGCAT TGCCGCGAAA ACCGGCGAAA ATACGACAGC AGCCGCCACA CTGGGCATGG GACGCAGCAC ATGGAGCGAA AACAGTGCAA ATGCAAAAAC CGACAGCATT AGTCTGTTTG CAGGCATACG GCACGATGCG GGCGATATCG GCTATCTCAA AGGCCTGTTC TCCTACGGAC GCTACAAAAA CAGCATCAGC CGCAGCACCG GTGCGGACGA ACATGCGGAA GGCAGCGTCA ACGGCACGCT GATGCAGCTG GGCGCACTGG GCGGTGTCAA CGTTCCGTTT GCCGCAACGG GAGATTTGAC GGTCGAAGGC GGTCTGCGCT ACGACCTGCT CAAACAGGAT GCATTCGCCG AAAAAGGCAG TGCTTTGGGC TGGAGCGGCA ACAGCCTCAC TGAAGGCACG CTGGTCGGAC TCGCGGGTCT GAAGCTGTCG CAACCCTTGA GCGATAAAGC CfiTCCTGTTT 95
95 3901 GCAACGGCGG 3951 GGGCGGCTTT 4001 ATATGCCGCA 4051 GGCAACGGCT 4101 GTACGGCAAC 4151 ACCACCACCA 1 MATNDDDVKK 51 AADVEADDFK 101 ADT DAALADT 151 DTVDKHAEAF 201 AAETAAGKAE 251 ADVYTREESD 301 VSDLRKETRQ 351 SRATTAKSAA 401 HTGDFPNPND 451 YGRKEHGYNE 501 IRHVKE1GHI 551 VAAIRNAWVK 601 YSGGDKTDEG 651 LPFYEKDAQK 701 WCLSAPYEAS 751 RTTLLTTAQD 801 DIAYSFRNDI 851 SDMRVETKGA 901 DGKGTLYTRL 951 AKIGQDYSFF 1001 SAAAHSAPAG 1051 MPGIRPYGAT 1101 RLKAVSDGLD 1151 TGENTTAAAT 1201 SYGRYKNSIS 1251 GLRYDLLKQD 1301 ATAGVERDLN 1351 GNGWNGLARY
GCGTGGAACG CGACCTGAAC ACCGGCGCGA CTGCAGCAAC CACCCGTCTG GTTGCCGGCC GGAACGGCTT GGCACGTTAC CACAGCGGAC GAGTCGGCGT CCACCACTGA
AATVAIAAAY NNGQEINGFK GLGLKKWTN LTKTVNENKQ DAALDATTNA LNKLGENITT NDIADSLDET NTKADEAVKT AAAGTANTAA DKAEAVAAKV SKFVRIDGLN ATTEKLDTRL GLAEQAALSG LFQPYNVGGS VSYAGIKNEM CKDRSMLCAG AYKNLINLKP AIEAGYTGRG NYKNYTAYMR KEAPEDGGGK DLVSHIIGGR SVDGRPAGGI LGERGVRIVN NSFGTTSRAG IRLMQQSDYG NLSYHIRNKN GIITVAGVDR SGEKFKREMY VRFTRTNPIQ IAGTSFSAPI IGAVGVDSKF GWGLLDAGKA SGTGGLIKKG GSQLQLHGNN LIYNGAASGG SLNSDGIVYL GKLLKVDGTA IIGGKLYMSA TNIETDGGLL ASLDSVEKTA LKHAVEQGGS NLENLMVELD FRAAAAVQHA NAADGVRIFN HNGTGLRVIA QTQQDGGTWE LGMGRSTWSE NSANAKTDSI RSTGADEHAE GSVNGTLMQL AFAEKGSALG WSGNSLTEGT GRDYTVTGGF TGATAATGKT SYAGSKQYGN HSGRVGVGYR
GGACGCGACT ACACGGTAAÇ CGGCAAGACG GGGGCACGCA TGGGCGCGGA TGTCGAATTC AGCTACGCCG GTTCCAAACA AGGCTACCGG TTCCTCGAGC AGETÍYDIDE DGTITKKDAT NVDAKVKAAE SEIEKLTTKL FAEETKTNIV KIDEKLEAVA ANEAKQTAEE TKQNVDAKVK TDIKADIATN KDNIAKKANS ASAEKSIADH DTRLNGLDKT GGGGTSAPDF NAGGTGIGSN RDDVAVTDRD AKINAPPPNL VEVGIVDTGE SVGSISFPEL DIEASFDDEA VIETEAKPTD APDATLHIMN TNDETKNEMM TADLFQIANS EEQYRQALLD MLFIFSTGND AQAQPNTYAL GEPGTEPLEY GSNHCGITAM VTGTAALLLQ KYPWMSNDNL MNGPASFPFG DFTADTKGTS TYTGKTIIEG GSLVLYGNNK ADTDQSGANE TVHIKGSLQL RGKGAGYLNS TGRRVPFLSA GSEGDTLSYY VRRGNAARTA ASESSATPET VETAAADRTD SLAATVYADS TAAHADMQGR QGGVEGKMRG STQTVGIAAK SLFAGIRHDA GDIGYLKGLF GALGGVNVPF AATGDLTVEG LVGLAGLKLS QPLSDKAVLF GARNMPHTRL VAGLGADVEF FLEHHHHHH*
961oL- -ORF46.1 1 ATGAAACACT 51 CTGTAGCGGC 101 CCACTGTGGC 151 TTCAAAGCTG 201 CAAAAAAGAC 251 TGGGTCTGAA 301 AAACAAAACG 351 GTTAACAACC 401 CCGCTCTGGA 451 ACGACATTTG 501 ATTAGAAGCC 551 ATATCGCCGA 601 AAAACCGCCA 651 CGATGCCAAA 701 CCGCTGGCAC 751 AAAGTTACCG 801 TAAAAAAGCA 851 AATTTGTCAG 901 CGCTTGGCTT 951 CGGTTTGGAT 1001 TTGCAGAACA 1051 GGATCCGGAG 1101 GGTTCTCGAC 1151 GCAGCAGGGG 1201 ATACAAAGCC 1251 AGGAAATATC 1301 ATTCCCCCTT 1351 AGTCCCGTTG 1401 ACACCATCCC
tTCCATCCAA AGTACTGACC GCACTGGCAG CCACAAACGA CATTGCTGCT GCCTACAACA GAGAGACCAT CTACGACATT GCAACTGCAG CCGATGTTGA AAAAGTCGTG ACTAACCTGA TCGATGCCAA AGTAAAAGCT AAGTTAGCAG ACACTGATGC TGCAACCACC AACGCCTTGA CTGAAGAGAC TAAGACAAAT GTGGCTGAXA CCGTCGACAA TTCATTGGAT GAAACCAACA ATGAAGCCAA ACAGACGGCC GTAAAAGCTG CAGAAACTGC AGCTAATACT GCAGCCGACA ACATCAAAGC TGATATCGCT AACAGTGCCG ACGTGTACAC AATTGATGGT CTGAACGCTA CTGCTGAAAA ATCCATTGCC AAAACAGTGT CAGACCTGCG AGCCGCGCTC TCCGGTCTGT GAGGAGGATC AGATTTGGCA CGTCAGCATT TCGAACCCGA GGAACTTGCC GAGCGCAGCG ATCAGTTGGG CAACCTGATG GGCTACATTG TCCGCTTTTC CGACAACCAT GCCTCACATT ACGGATTTAG CCTTTACCGC GCCGACGGCT ATGACGGGCC
ACAGCCATCC TTGCCACTTT CGACGATGTT AAAAAAGCTG ATGGCCAAGA AATCAACGGT GATGAAGACG GCACAATTAC AGCCGACGAC TTTAAAGGTC CCAAAACCGT CAATGAAAAC GCAGAATCTG AAATAGAAAA CGCTTTAGCA GATACTGATG ATAAATTGGG AGAAAATATA ATCGTAAAAA TTGATGAAAA GCATGCCGAA GCATTCAACG CTAAGGCAGA CGAAGCCGTC GAAGAAACCA AACAAAACGT AGCAGGCAAA GCCGAAGCTG AGGCCGAAGC TGTCGCTGCA ACGAACAAAG ATAATATTGC CAGAGAAGAG TCTGACAGCA CTACCGAAAA ATTGGACACA GATCACGATA CTCGCCTGAA CAAAGAAACC CGCCAAGGCC TCCAACCTTA CAACGTGGGT AACGATTCTT TTATCCGGCA CGGGAAATAC CACCTATTCG GCCATATCGG ATTGGGAAAA ATTCAACAGG CGGCCATTAA CGATCACGGG CACGAAGTCC CCGATTCTGA TGAAGCCGGT ATCCATTGGG ACGGATACGA ACAGGGCGGC GGCTATCCCG 96
96 1451 CTCCCAAAGG 1501 CAAAATATCC 1551 TGCCGACCGT 1601 ACGGATTCAA 1651 AATGCCGCCG 1701 CGGCGCGGCA 1751 GCGAAGGCTC 1801 GAAAACAAGA 1851 AGACTATGCC 1901 CCGCACAAGG 1951 ATCAAAGGGA 2001 GGCACATCCT 2051 GGAAATCCGC 2101 CCGTCCCCTT 2151 CGGCAAAGAA 2201 ATGTCAAACT 2251 GGTAAAGGGT 2301 CGAG 1 MKHFPSKVLT 51 FKAGETIYDI 101 KQNVDAKVKA 151 TTFAEETKTN 201 KTANEAKQTA 251 KVTDIKADIA 301 RLASAEKSIA 351 GSGGGGSDLA 401 IQSHQLGNLM 451 SPVDGFSLYR 501 QNIRLNLTDN 551 NAAEAFNGTA 601 ENKMARINDL 651 IKGIGAVRGK 701 PSPYHSRNIR 751 GKGFPNFEKH
CGCGAGGGAT ATATACAGCT GCCTCAACCT GACCGACAAC TTCCACAATG CCGGTAGTAT ACGCGCCACC CGATACAGCC AAGCCTTCAA CGGCACTGCA GGAGAAATTG TCGGCGCAGG AAACATTGCT GTCATGCACG TGGCGCGCAT CAACGATTTG GCAGCAGCCA TCCGCGATTG CATAGAAGCC GTCAGCAATA TTGGAGCTGT TCGGGGAAAA ATCAAGCGGT CGCAGATGGG CGTCAGCGAC AATTTTGCCG ACCATTCCCG AAATATCCGT AACATCACCT CCTCAACCGT GGCAGACCAA CGCCACCCGA TTCCGAATTT TGAGAAGCAC TAILATFCSG ALAATNDDDV DEDGTITKKD ATAADVEADD AESEIEKLTT KLADTDAALA IVKIDEKLEA VADTVDKHAE EETKQNVDAK VKAAETAAGK TNKDNIAKKA NSADVYTREE DHDTRLNGLD KTVSDLRKET NDSFIRQVLD RQHFEPDGKY IQQAAIKGNI GYIVRFSDHG IHWDGYEHHP ADGYDGPQGG RSTGQRLADR FHNAGSMLTQ DIVKNIIGAA GEIVGAGDAV ADMAQLKDYA AAAIRDWAVQ YGLGGITAHP IKRSQMGAIA SNLEQRYGKE NITSSTVPPS VKYDT*
ACGACATAAA AGGCGTTGCC CGCAGCACCG GACAACGGCT GCTGACGCAA GGAGTAGGCG CCGAGCTGGA CAGATCGGGC GATATCGTTA AAAACATCAT CGATGCCGTG CAGGGCATAA GCTTGGGTCT GCTTTCCACC GCAGATATGG CGCAACTCAA GGCAGTCCAA AACCCCAATG TCTTTATGGC AGCCATCCCC TACGGCTTGG GCGGCATCAC CGCGATCGCA TTGCCGAAAG ATGCGGCATA CGCCAAATAC TCAAACTTGG AGCAGCGTTA GCCGCCGTCA AACGGCAAAA AGACAGGCGT ACCGTTTGAC GTGAAATATG ATACGTAACT
KKAATVAIAA AYNNGQEING FKGLGLKKW TNLTKTVNEN DTDAALDATT NALNKLGENI AFNDIADSLD ETNTKADEAV AEAAAGTANT AADKAEAVAA SDSKFVRIDG LNATTEKLDT RQGLAEQAAL SGLFQPYNVG HLFGSRGELA ERSGHIGLGK HEVHSPFDNH ASHSDSDEAG GYPAPKGARD IYSYDIKGVA GVGDGFKRAT RYSPELDRSG QGISEGSNIA VMHGLGLLST NPNAAQGIEA VSNIFMAAIP LPKGKSAVSD NFADAAYAKY NGKNVKLADQ RHPKTGVPFD
961cL- 741 1 ATGAAACACT 51 CTGTAGCGGC 101 CCACTGTGGC 151 TTCAAAGCTG 201 CAAAAAAGAC 251 TGGGTCTGAA 301 AAACAAAACG 351 GTTAACAACC 401 CCGCTCTGGA 451 ACGACATTTG 501 ATTAGAAGCC 551 ATATCGCCGA 601 AAAACCGCCA 651 CGATGCCAAA 701 CCGCTGGCAC 751 AAAGTTACCG 801 TAAAAAAGCA 851 AATTTGTCAG 901 CGCTTGGCTT 951 CGGTTTGGAT 1001 TTGCAGAACA 1051 GGATCCGGAG 1101 TGCACTAACC 1151 CGCTGGATCA 1201 GGTGCGGAAA 1251 GAAGAACGAC 1301 ACGGGCAGCT 1351 AGCCATTCCG 1401 GCATTCCGGG
TTCCATCCAA AGTACTGACC GCACTGGCAG CCACAAACGA CATTGCTGCT GCCTACAACA GAGAGACCAT CTACGACATT GCAACTGCAG CCGATGTTGA AAAAGTCGTG ACTAACCTGA TCGATGCCAA AGTAAAAGCT AAGTTAGCAG ACACTGATGC TGCAACCACC AACGCCTTGA CTGAAGAGAC TAAGACAAAT GTGGCTGATA CCGTCGACAA TTCATTGGAT GAAACCAACA ATGAAGCCAA ACAGACGGCC GTAAAAGCTG CAGAAACTGC AGCTAATACT GCAGCCGACA ACATCAAAGC TGATATCGCT AACAGTGCCG ACGTGTACAC AATTGATGGT CTGAACGCTA CTGCTGAAAA ATCCATTGCC AAAACAGTGT CAGACCTGCG AGCCGCGCTC TCCGGTCTGT GGGGTGGTGT CGCCGCCGAC GCACCGCTCG ACCATAAAGA GTCCGTCAGG AAAAACGAGA AAACTTATGG AAACGGTGAC AAGGTCAGCC GTTTCGACTT CATTACCTTG GAGAGTGGAG CCTTAACCGC CTTTCAGACC AAGATGGTTG CGAAACGCCA
ACAGCCATCC TTGCCACTTT CGACGATGTT AAAAAAGCTG ATGGCCAAGA AATCAACGGT GATGAAGACG GCACAATTAC AGCCGACGAC TTTAAAGGTC CCAAAACCGT CAATGAAAAC GCAGAATCTG AAATAGAAAA CGCTTTAGCA GATACTGATG ATAAATTGGG AGAAAATATA ATCGTAAAAA TTGATGAAAA GCATGCCGAA GCATTCAACG CTAAGGCAGA CGAAGCCGTC GAAGAAACCA AACAAAACGT AGCAGGCAAA GCCGAAGCTG AGGCCGAAGC TGTCGCTGCA ACGAACAAAG ATAATATTGC CAGAGAAGAG TCTGACAGCA CTACCGAAAA ATTGGACACA GATCACGATA CTCGCCTGAA CAAAGAAACC CGCCAAGGCC TCCAACCTTA CAACGTGGGT ATCGGTGCGG GGCTTGCCGA CAAAGGTTTG CAGTCTTTGA AACTGAAGCT GGCGGCACAA AGCCTCAATA CGGGCAAATT TATCCGCCAA ATCGAAGTGG AGTTCCAAGT ATACAAACAA GAGCAAATAC AAGATTCGGA GTTCAGAATC GGCGACATAG 97
1451 CGGGCGAACA TACATCTTTT 1501 TATCGCGGGA CGGCGTTCGG .1551 CACCATAGAT TTCGCCGCCA 1601 AATCGCCAGA ACTCAATGTC 1651 GGAAAACGCC ATGCCGTCAT 1701 GAAAGGCAGT TACTCCCTCG 1751 CCGGCAGCGC GGAAGTGAAA 1801 GCCGCCAAGC AACTCGAGCA 1 MKHFPSKVLT TAILATFCSG 51 FKAGETIYDI DEDGTITKKD 101 KQNVDAKVKA AESEIEKLTT 151 TTFAEETKTN IVKIDEKLEA 201 KTANEAKQTA EETKQNVDAK 251 KVTDIKADIA TNKDNIAKKA 301 RLASAEKSIA DHDTRLNGLD 351 GSGGGGVAAD IGAGLADALT 401 GAEKTYGNGD SLNTGKLKND 4 51 SHSALTAFQT EQIQDSEHSG 501 YRGTAFGSDD AGGKLTYTID 551 GKRHAVISGS VLYNQAEKGS 601 961oL- AAKQLEHHHH 983 HH* 1 ATGAAACACT TTCCATCCAA 51 CTGTAGCGGC GCACTGGCAG 101 CCACTGTGGC CATTGCTGCT 151 TTCAAAGCTG GAGAGACCAT 201 CAAAAAAGAC GCAACTGCAG 251 TGGGTCTGAA AAAAGTCGTG 301 AAACAAAACG TCGATGCCAA 351 GTTAACAACC AAGTTAGCAG 401 CCGCTCTGGA TGCAACCACC 451 ACGACATTTG CTGAAGAGAC 501 ATTAGAAGCC GTGGCTGATA 551 ATATCGCCGA TTCATTGGAT 601 AAAACCGCCA ATGAAGCCAA 651 CGATGCCAAA GTAAAAGCTG 701 CCGCTGGCAC AGCTAATACT 751 AAAGTTACCG ACATCAAAGC 801 TAAAAAAGCA AACAGTGCCG 851 AATTTGTCAG AATTGATGGT 901 CGCTTGGCTT CTGCTGAAAA 951 CGGTTTGGAT AAAACAGTGT 100.1 TTGCAGAACA AGCCGCGCTC 1051 GGATCCGGCG GAGGCGGCAC 1101 CGGTATCGGC AGCAACAGCA 1151 CTTACGCCGG TATCAAGAAC 1201 GCCGGTCGGG ATGACGTTGC 1251 CCCCCCCCCG AATCTGCATA 1301 ACAAGAATTT GATCAACCTC 1351 CGCGGGGTAG AGGTAGGTAT 1401 ATCCTTTCCC GAACTGTATG 1451 ACAAAAACTA TACGGCGTAT 1501 GGTAAAGACA TTGAAGCTTC 1551 AGCAAAGCCG ACGGATATCC 1601 TGGTCTCCCA TATTATTGGC 1651 GGTATTGCGC CCGATGCGAC 1701 CAAGAACGAA ATGATGGTTG 1751 GCGAACGTGG CGTGCGCATC 1801 GCAGGCACTG CCGACCTTTT 1851 CCAAGCGTTG CTCGACTATT 1901 GCCTGATGCA ACAGAGCGAT 1951 AAAAACATGC TTTTCATCTT 2001 CAACACATAT GCCCTATTGC 2051 TTATCACAGT CGCAGGCGTA
GACAAGCTTC CCGAAGGCGG CAGGGCGACA TTCAGACGAT GCCGGCGGAA AACTGACCTA AGCAGGGAAA CGGCAAAATC GAACATTTGA GACCTGGCCG CCGCCGATAT CAAGCCGGAT CAGCGGTTCC GTCCTTTACA ACCAAGCCGA GTATCTTTGG CGGAAAAGCC CAGGAAGTTG ACCGTAAACG GCATACGCCA TATCGGCCTT CCACCACCAC CACCACTGA
ALAATNDDDV KKAATVAIAA AYNNGQEING ATAADVEADD FKGLGLKKW TNLTKTVNEN KLADTDAALA DTDAALDATT NALNKLGENI VADTVDKHAE AFNDIADSLD ETNTKADEAV VKAAETAAGK AEAAAGTANT AADKAEAVAA NSADVYTREE SDSKFVRIDG LNATTEKLDT KTVSDLRKET RQGLAEQAAL SGLFQPYNVG APLDHKDKGL QSLTLDQSVR KNEKLKLAAQ KVSRFDFIRQ IEVDGQLITL ESGEFQVYKQ KMVAKRQFRI GDIAGEHTSF DKLPEGGRAT FAAKQGNGKI EHLKSPELNV DLAAADIKPD YSLGIFGGKA QEVAGSAEVK TVNGIRHIGL
AGTACTGACC ACAGCCATCC TTGCCACTTT CCACAAACGA CGACGATGTT AAAAAAGCTG GCCTACAACA ATGGCCAAGA AATCAACGGT CTACGACATT GATGAAGACG GCACAATTAC CCGATGTTGA AGCCGACGAÇ TTTAAAGGTC ACTAACCTGA CCAAAACCGT CAATGAAAAC AGTAAAAGCT GCAGAATCTG AAATAGAAAA ACACTGATGC CGCTTTAGCA GATACTGATG AACGCCTTGA ATAAATTGGG AGAAAATATA TAAGACAAAT ATCGTAAAAA TTGATGAAAA CCGTCGACAA GCATGCCGAA GCATTCAACG GAAACCAACA CTAAGGCAGA CGAAGCCGTC ACAGACGGCC GAAGAAACCA AACAAAACGT CAGAAACTGC AGCAGGCAAA GCCGAAGCTG GCAGCCGACA AGGCCGAAGC TGTCGCTGCA TGATATCGCT ACGAACAAAG ATAATATTGC ACGTGTACAC CAGAGAAGAG TCTGACAGCA CTGAACGCTA CTACCGAAAA ATTGGACACA ATCCATTGCC GATCACGATA CTCGCCTGAA CAGACCTGCG CAAAGAAACC CGCCAAGGCC TCCGGTCTGT TCCAACCTTA CAACGTGGGT TTCTGCGCCC GACTTCAATG CAGGCGGTAC GAGCAACAAC AGCGAAATCA GCAGCAGTAT GAAATGTGCA AAGACAGAAG CATGCTCTGT GGTTACAGAC AGGGATGCCA AAATCAATGC CCGGAGACTT TCCAAACCCA AATGACGCAT AAACCTGCAA TTGAAGCAGG CTATACAGGA CGTCGACACA GGCGAATCCG TCGGCAGCAT GCAGAAAAGA ACACGGCTAT AACGAAAATT ATGCGGAAGG AAGCGCCTGA AGACGGAGGC TTTCGACGAT GAGGCCGTTA TAGAGACTGA GCCACGTAAA AGAAATCGGA CACATCGATT GGGCGTTCCG TGGACGGCAG ACCTGCAGGC GCTACACATA ATGAATACGA ATGATGAAAC CAGCCATCCG CAATGCATGG GTCAAGCTGG GTCAATAACA GTTTTGGAAC AACATCGAGG CCAAATAGCC AATTCGGAGG AGCAGTACCG CCGGCGGTGA TAAAACAGAC GAGGGTATCC TACGGCAACC TGTCCTACCA CATCCGTAAT TTCGACAGGC AATGACGCAC AAGCTCAGCC CATTTTATGA AAAAGACGCT CAAAAAGGCA GACCGCAGTG GAGAAAAGTT CAAACGGGAA 98
ATGTATGGAG AACCGGGTAC AGAACCGCTT GAGTATGGCT CCAACCATTG CGGAATTACT GCCATGTGGT GCCTGTCGGC ACCCTATGAA GCAAGCGTCC GTTTCACCCG tacaaacccg attcaaattg ccggaacatc cttttccgca
CCCATCGTAA CCGGCACGGC GGCTCTGCTG CTGCAGAAAT ACCCGTGGAT GAGCAACGAC AACCTGCGTA CCACGTTGCT GACGACGGCT CAGGACATCG GTGCAGTCGG CGTGGACAGC AAGTTCGGCT GGGGACTGCT GGATGCGGGT AAGGCCATGA ACGGACCCGC GTCCTTTCCG TTCGGCGACT TTACCGCCGA TACGAAAGGT ACATCCGATA TTGCCTACTC CTTCCGTAAC GACATTTCAG GCACGGGCGG CCTGATCAAA AAAGGCGGCA GCCAACTGCA ACTGCACGGC AACAACACCT ATACGGGCAA AACCATTATC GAAGGCGGTT CGCTGGTGTT GTACGGCAAC AACAAATCGG ATATGCGCGT CGAAACCAAA GGTGCGCTGA TTTATAACGG GGCGGCATCC GGCGGCAGCC TGAACAGCGA CGGCATTGTC TATCTGGCAG ATACCGACCA ATCCGGCGCA AACGAAACCG TACACATCAA AGGCAGTCTG CAGCTGGACG GCAAAGGTAC GCTGTACACA CGTTTGGGCA AACTGCTGAA AGTGGACGGT ACGGCGATTA TCGGCGGCAA GCTGTACATG TCGGCACGCG GCAAGGGGGC AGGCTATCTC AACAGTACCG GACGACGTGT TCCCTTCCTG AGTGCÇGCCA AAATCGGGCA GGATTATTCT TTCTTCACAA ACATCGAAAC CGACGGCGGC CTGCTGGCTT CCCTCGACAG CGTCGAAAAA ACAGCGGGCA GTGAAGGCGA CACGCTGTCC TATTATGTCC GTCGCGGCAA TGCGGCACGG ACTGCTTCGG CAGCGGCACA TTCCGCGCCC GCCGGTCTGA AACACGCCGT AGAACAGGGC GGCAGCAATC TGGAAAACCT GATGGTCGAA CTGGATGCCT CCGAATCATC CGCAACACCC GAGACGGTTG AAACTGCGGC AGCCGACCGC ACAGATATGC CGGGCATCCG CCCCTACGGC GCAACTTTCC GCGCAGCGGC AGCCGTACAG CATGCGAATG CCGCCGACGG TGTACGCATC TTCAACAGTC TCGCCGCTAC CGTCTATGCC GACAGTACCG CCGCCCATGC CGATATGCAG GGACGCCGCC TGAAAGCCGT ATCGGACGGG TTGGACCACA ACGGCACGGG TCTGCGCGTC ATCGCGCAAA CCCAACAGGA CGGTGGAACG TGGGAACAGG GCGGTGTTGA AGGCAAAATG CGCGGCAGTA CCCAAACCGT CGGCATTGCC GCGAAAACCG GCGAAAATAC GACAGCAGCC GCCACACTGG GCATGGGACG CAGCACATGG AGCGAAAACA GTGCAAATGC AAAAACCGAC AGCATTAGTC TGTTTGCAGG CATACGGCAC GATGCGGGCG ATATCGGCTA TCTCAAAGGC CTGTTCTCCT ACGGACGCTA CAAAAACAGC ATCAGCCGCA GCACCGGTGC GGACGAACAT GCGGAAGGCA GCGTCAACGG CACGCTGATG CAGCTGGGCG CACTGGGCGG TGTCAACGTT CCGTTTGCCG CAACGGGAGA TTTGACGGTC GAAGGCGGTC TGCGCTACGA CCTGCTCAAA CAGGATGCAT TCGCCGAAAA AGGCAGTGCT TTGGGCTGGA GCGGCAACAG CCTCACTGAA GGCACGCTGG TCGGACTCGC GGGTCTGAAG CTGTCGCAAC CCTTGAGCGA TAAAGCCGTC CTGTTTGCAA CGGCGGGCGT GGAACGCGAC CTGAACGGAC GCGACTACAC GGTAACGGGC GGCTTTACCG GCGCGACTGC AGCAACCGGC AAGACGGGGG CACGCAATAT GCCGCACACC CGTCTGGTTG CCGGCCTGGG CGCGGATGTC GAATTCGGCA ACGGCTGGAA CGGCTTGGCA CGTTACAGCT ACGCCGGTTC CAAACAGTAC GGCAACCACA GCGGACGAGT CGGCGTAGGC TACCGGTTCT GACTCGAG
MKHFPSKVLT TAILATFCSG ALAATNDDDV KKAATVAIAA AYNNGQEING FKAGETIYDI DEDGTITKKD ATAADVEADD FKGLGLKKVV TNLTKTVNEN KQNVDAKVKA AESEIEKLTT KLADTDAALA DTDAALDATT NALNKLGENI TTFAEETKTN IVKIDEKLEA VADTVDKHAE AFNDIADSLD ETNTKADEAV KTANEAKQTA EETKQNVDAK VKAAETAAGK AEAAAGTANT AADKAEAVAA KVTDIKADIA TNKDNIAKKA NSADVYTREE SDSKFVRIDG LNATTEKLDT RLASAEKSIA DHDTRLNGLD KTVSDLRKET RQGLAEQAAL SGLFQPYNVG GSGGGGTSAP DFNAGGTGIG SNSRATTAKS AAVSYAGIKN EMCKDRSMLC AGRDDVAVTD RDAKINAPPP NLHTGDFPNP NDAYKNLINL KPAIEAGYTG RGVEVGIVDT GESVGSISFP ELYGRKEHGY NENYKNYTAY MRKEAPEDGG GKDIEASFDD EAVIETEAKP TDIRHVKEIG HIDLVSHIIG GRSVDGRPAG GIAPDATLHI MNTNDETKNE MMVAAIRNAW VKLGERGVRI VNNSFGTTSR AGTADLFQIA NSEEQYRQAL LDYSGGDKTD EGIRLMQQSD YGNLSYHIRN KNMLFIFSTG NDAQAQPNTY ALLPFYEKDA QKGIITVAGV DRSGEKFKRE MYGEPGTEPL EYGSNHCGIT AHWCLSAPYE ASVRFTRTNP IQIAGTSFSA PIVTGTAALL LQKYPWMSND NLRTTLLTTA QDIGAVGVDS KFGWGLLDAG KAMNGPASFP FGDFTADTKG TSDIAYSFRN DISGTGGLIK KGGSQLQLHG NNTYTGKTII EGGSLVLYGN NKSDMRVETK GALIYNGAAS GGSLNSDGIV YLADTDQSGA NETVHIKGSL QLDGKGTLYT RLGKLLKVDG TAIIGGKLYM SARGKGAGYL NSTGRRVPFL SAAKIGQDYS FFTNIETDGG LLASLDSVEK TAGSEGDTLS YYVRRGNAAR TASAAAHSAP AGLKHAVEQG GSNLENLMVE LDASESSATP ETVETAAADR TDMPGIRPYG ATFRAAAAVQ HANAADGVRI FNSLAATVYA DSTAAHADMQ GRRLKAVSDG LDHNGTGLRV IAQTQQDGGT 99 1151 WEQGGVEGKM RGSTQTVGIA AKTGENTTAA ATLGMGRSTW SENSANAKTD 1201 SISLFAGIRH DAGDIGYLKG LFSYGRYKNS ISRSTGADEH AEGSVNGTLM 1251 QLGALGGVNV PFAATGDLTV EGGLRYDLLK QDAFAEKGSA LGWSGNSLTE 1301 GTLVGLAGLK LSQPLSDKAV LFATAGVERD LNGRDYTVTG GFTGATAATG 1351 KTGARNMPHT RLVAGLGADV EFGNGWNGLA RYSYAGSKQY GNHSGRVGVG 1401 YRF*
Será entendido que a invenção foi descrita a titulo de exemplo apenas e podem ser feitas modificações desde que permaneçam dentro do âmbito e espírito da invenção. Por exemplo, a utilização de proteínas de outras estirpes é considerada [por exemplo ver documento WOOO/66741 para sequências polimórficas para ORF4, ORF40, ORF46, 225, 235, 287, 519, 726, 919 e 953].
DETALHES EXPERIMENTAIS Purificação da proteína FPLC 0 quadro seguinte sumariza a purificação da proteína FPLC que foi utilizada:
Proteína PI Coluna Tampão PH Protocolo ^21 ^desmarcado 6, 23 Mono Q Tris 8, 0 A ^28 ^desmarcado 5, 04 Mono Q Bis-Tris propano 6,5 A 406.1L 7, 75 Mono Q Dietanolamina 9, 0 B 576.1L 5,63 Mono Q Tris 7,5 B 593e*esn,arcacl0 8, 79 Mono S Hepes 7,4 A 72 gdesmarcado 4, 95 Hi-trap S Bis-Tris 6, 0 A 919desmarcado 10,5(-líder) Mono S Bicine 8, 5 C 919Lorf4 10,4(- líder) Mono S Tris 8,0 B 920L 6,92(-líder) Mono Q Dietanolamina 8, 5 A 100
100 953L 7,56(-líder) Mono S MES 6,6 D gg2 desmarcaao 4, 73 Mono Q Bis-Tris propano 6, 5 A Proteína PI Coluna Tampão PH Protocolo 919-287 6, 58 Hi- trapQ Tris 8,0 A 953-287 4, 92 Mono Q Bis-Tris propano 6, 2 A
Soluções tampão incluíram NaCl 20-120 mM, 5,0 mg/ml de CHAPS e glicerol 10% v/v. 0 dialisado foi centrifugado a 13000 g durante 20 min e aplicado tanto a uma resina de troca de iões FPLC mono Q ou mono S. O tampão e as resinas troca de iões foram selecionados de acordo com o pi da proteína de interesse e as recomendações do manual de protocolo do FPLC [Pharmacia: FPLC Ion Exchange and Chromatofocussing; Principies and Methods. Publicação
Pharmacia]. As proteínas foram eluídas utilizando um gradiente NaCl passo por passo. A purificação foi analisada por SDS-PAGE e a concentração da proteína determinada pelo método de Bradford. A letra na coluna do 'protocolo' refere-se ao seguinte: FPLC-A: Clones 121.1, 128.1, 593, 726, 982, proteína periplásmica 920L e proteínas híbridas 919-287, 953-287 foram purificadas a partir da fração solúvel de E. coli obtida após disrupção das células. Colónias únicas que albergam o plasmídeo de interesse foram crescidas durante a noite a 37°C em 20 ml de cultura líquida LB/Amp (100 μρ/ιηΐ). As bactérias foram diluídas 1:30 em 1,0 L de meio fresco e crescidas ou a 30°C ou 37°C até o OD55o atingir 101 0,6-0,8. A expressão da proteína recombinante foi induzida com IPTG a uma concentração final de 1,0 mM. Após incubação durante 3 horas, as bactérias foram colhidas por centrifugação a 8000 g durante 15 minutos a 4°C. Quando necessário as células foram armazenadas a -20°C. Todos os procedimentos subseguentes foram realizados em gelo ou a 4°C. Para proteínas citosólicas (121.1, 128.1, 593, 726 e 982) e a proteína periplásmica 920L, as bactérias foram ressuspensas em 25 ml de PBS contendo inibidor da protease completo (Boehringer-Mannheim). As células foram lisadas por sonicação utilizando um sonicador Branson 450. As células interrompidas foram centrifugadas a 8000 g durante 30 min para sedimentar células não fracionadas e corpos de inclusão e o sobrenadante tomado para saturação 35% v/v por adição de (NH4)2S04 3, 9 Μ. O precipitado foi sedimentado a 8000 g durante 30 minutos. O sobrenadante foi tomado a saturação 70% v/v pela adição de (NH^SCg 3,9 M e o precipitado recolhido como anteriormente. As bolas contendo a proteína de interesse foram identificadas por SDS-PAGE e dialisadas contra o tampão de troca de iões apropriado (ver em baixo) durante 6 horas ou durante a noite. A fração periplásmica da E. coli que expressa 953L foi preparada de acordo com o protocolo de Evans et. al. [Infect.Immun. (1974), 10:1010-1017] e dialisada contra o tampão de troca de iões apropriado. O tampão e a resina de troca de iões foram selecionados de acordo com o pi da proteína de interesse e as recomendações do manual de protocolo do FPLC (Pharmacia). As soluções tampão incluíram NaCl 20 mM, e glicerol 10% (v/v). O dialisado foi centrifugado a 13000 g durante 20 min e aplicado a uma resina de troca de iões FPLC ou mono Q ou mono S. O tampão e a resina de troca de 102 iões foram selecionados de acordo com o pi da proteína de interesse e as recomendações do manual de protocolo FPLC (Pharmacia). As proteínas foram eluídas a partir da resina de troca de iões utilizando gradientes de NaCl quer passo a passo ou contínuos. A purificação foi analisada por SDS-PAGE e a concentração da proteína determinada pelo método de Bradford. A clivagem do péptido líder das proteínas periplásmicas foi demonstrada sequenciando o terminal NH2 (ver em baixo) . FPLC-B: Estas proteínas foram purificadas a partir da fração da membrana de E. coli. Colónias únicas que albergam o plasmídeo de interesse foram crescidas durante a noite a 37°C em 20 ml de cultura líquida LB/Amp (100 μg/ml) . As bactérias foram diluídas 1:30 em 1,0 L de meio fresco. Clones 406.1 L e 919LOrf4 foram crescidos a 30°C e Orf25L e 576.1L a 37°C até o OD550 atingir 0,6-0,8. No caso do 919LOrf4, o crescimento a 30"C foi essencial uma vez que a expressão da proteína recombinante a 37°C resultou na lise das células. A expressão da proteína recombinante foi induzida com IPTG a uma concentração final de 1, 0 mM. Após incubação durante 3 horas, as bactérias foram colhidas por centrifugação a 8000 g durante 15 minutos a 4°C. Quando necessário as células foram armazenadas a -20 °C. Todos os procedimentos subsequentes foram realizados a 4°C. As bactérias foram ressuspensas em 25 ml de PBS contendo inibidor da protease completo (Boehringer-Mannheim) e lisadas por choque osmótico com 2-3 passagens através de um French Press. As células não fracionadas foram removidas por centrifugação a 5000 g durante 15 min e as membranas precipitadas por centrifugação a 100000 g (Beckman Ti50, 38000 rpm) durante 45 minutos. Um homogeneizador Dounce foi 103 utilizado para ressuspender a bola de membranas em 7,5 ml de Tris-HCl 20 mM (pH 8,0), NaCl 1,0 Me inibidor da protease completo. A suspensão foi misturada durante 2-4 horas, centrifugada a 100000 g durante 45 min e a bola ressuspensa em 7,5 ml de Tris-HCl 20mM (pH 8,0), NaCl 1,0 M, 5,0 mg/ml de CHAPS, glicerol 10% (v/v) e inibidor da protease completo. A solução foi misturada durante a noite, centrifugada a 100000 g durante 45 minutos e o sobrenadante dialisado durante 6 horas contra um tampão apropriadamente selecionado. No caso de Orf25.L, verificou-se que a bola obtida após extração com CHAPS continha a proteína recombinante. Esta fração, sem mais purificação, foi utilizada para imunizar ratinhos. FPLC-C: Idêntica a FPLC-A, mas a purificação foi a partir da fração solúvel obtida após permeabilização de E. coli com polimixina B, em vez de após a disrupção das células. FPLC-D: Uma única colónia que alberga o plasmídeo de interesse foi crescida durante a noite a 37 °C em 20 ml de cultura líquida LB/Amp (100 μg/ml). As bactérias foram diluídas 1:30 em 1,0 L de meio fresco e crescidas a 30°C até o OD550 atingir 0,6-0,8. A expressão da proteína recombinante foi induzida com IPTG a uma concentração final de 1,0 mM. Após incubação durante 3 horas, as bactérias foram colhidas por centrifugação a 8000 g durante 15 minutos a 4°C. Quando necessário as células foram armazenadas a -20 °C. Todos os procedimentos subsequentes foram realizados em gelo ou a 4°C. As células foram ressuspensas em Bicine 20mM (pH 8,5), NaCl 20mM, glicerol 10% (v/v), inibidor da protease completo (Boehringer-
Mannheim) e interrompido utilizando um sonicador Branson 104 450. O sonicado foi centrifugado a 8000 g durante 30 min para sedimentar células não fracionadas e corpos de inclusão. A proteina recombinante foi precipitada a partir da solução com entre 35% v/v e 70% v/v de saturação pela adição de (NH4)2S04 3, 9 Μ. O precipitado foi sedimentado a 8000 g durante 30 minutos, ressuspenso em Bicine 20 mM (pH 8,5), NaCl 20 mM, glicerol 10% (v/v) e dialisado contra este tampão durante 6 horas ou durante a noite. O dialisado foi centrifugado a 13000 g durante 20 min e aplicado à resina FPLC. A proteina foi eluida a partir da coluna utilizando gradientes de NaCl passo por passo. A purificação foi analisada por SDS-PAGE e a concentração da proteina determinada pelo método de Bradford.
Estratégia de clonagem e desenho de oligonucleotídeo
Os genes que codificam os antígenos de interesse foram amplificados por PCR, utilizando oligonucleotideos desenhados com base na sequência genómica de B MC58 de N. meningitidis. O ADN genómico da estirpe 2996 foi sempre utilizado como um molde em reações de PCR, a menos que especificado em contrário, e os fragmentos amplificados foram clonados no vetor de expressão pET21 b+ (Novagen) para expressar a proteina como produto C-terminal rotulado com His, ou um pET-24b+(Novagen) para expressar a proteína na forma 'desmarcada' (por exemplo, AG 287K).
Onde uma proteína foi expressa sem um parceiro de fusão e com o seu próprio péptido líder (se presente), a amplificação do quadro de leitura aberto (codão ATG a codão de terminação) foi realizada.
Onde uma proteína foi expressa na forma 'desmarcada', o péptido líder foi omitido desenhando o iniciador de amplificação da extremidade 5' em sentido descendente a 105 partir da sequência líder prevista. A temperatura de fusão dos iniciadores utilizados na PCR dependeu do número e tipo de nucleotídeos hibridizantes em todo o iniciador, e foi determinada utilizando as fórmulas: (tail excluded) (whole primer)
Tmi = 4 (G+C)+ 2 (A+T)
Tm2 = 64.9 + 0.41 (% GC) - 600/N (TRADUÇÃO DAS FÓRMULAS: tail exluded= cauda excluída, "whole primer= todo o iniciador)
As temperaturas de fusão dos oligonucleotídeos selecionados foram normalmente 65-70°C para o oligo completo e 50-60°C para a região hibridizante sozinha.
Os oligonucleotídeos foram sintetizados utilizando um sintetizador Perkin Elmer 394 ADN/ARN, eluídos a partir das colunas em 2,0 ml de NH4OH, e desprotegidos por 5 horas de incubação a 56°C. Os oligos foram precipitados por adição de Na-Acetato 0,3 M e 2 volumes de etanol. As amostras foram centrifugadas e as bolas ressuspensas em água. 106
107
108
109 f» ~u 2 Φ : o : Φ· Jz \ sz : T? z z
O ; ω T5 X : Z
Z : X
α φ o j~ *λ X < X ΐ α> ! *Ϊ3I ? I sφ 6 : E «λ r : Ώ < x \ m
X
O
C ; i~ <Φ f fe á : < & ! O « ! < W ! ca ! ^ ! G I í ! O\ < I CSÍ m \ 51 i OÍ ! U 1 O ; H < i 0 ! 0 ! O ! 0 1 O I O ! O ! <uil 9 l·® o j o. s õ5 ': ' p ! O ! ·< < o < 'i£ i < <
Í5 i <3 I ® UIQ|0 O O O μ. 0 j P < ! < Òíl ® 01 S i= !£ Oi i P ei ta o ! < o ca h I Ó < ίο ! O. , _ ta !e :o O ! O 1 O 0 ! O 1 0 O 1 O i o ta ca O l·-; ta | q 9 : <3 ir 5— : 0 0 ca o o ta - , < o ! ta U ! < 0 i ta < \ < < < l·*' <51 <i 0! Qi 5 O è H < μ. ^ < μ-! $ Ο ou o O i ο Q ! 0 ο I ο Ο ! Ο ο ο ο ta ο ca 0 ο ο ο ο ο ο ο Ο 0 Ο 0 0 Κ ο 9 ι_ Ο < Ο < 9 u < 0 9 < t ® ο ο 9 < "ί 3* ο < t;~ Ο 5 Q 0 I— < Ο *< 0 < _ 0 I— Ο (— ^ < Ο Ο ο 0 0 0 ta ο ο 0 0 ί 0 ΙΟ : < : : < < ί < ί < ί Ο οί 9 15 ί < ί ο ί 0 ί ca ! 0 ; ί—. ί < : f-! < Ο ί Ο ί Ο ί 5 ί 0 ; ο ; Ο ί 0 Ο 0 0 Ο Ο Ο ca 0 0 Ο 0 Ο 10 < 0 Ο Ι Ο 0 Ο Ο Ο 5 ο Ο ο ο ο ο ο 1—' 9, 0!51 5ΐ Ο: Ο Ο }— « ο 0 ο 0 ο ! Ό ί 5 1 U. ι£ ! st 1 i£ > ! Ό a> s 5 ο: I Ρ > Χί > Φ > αϊ te £ cc ui CC Hl,
φ CC φ ce 0S ο ο ί to ί ο. ¢0 to ο Ξ <£ «0 ΙΟ Ο 5 <0 Ο 110
111
112
113
114
115
116 Ό m T3 z :CTCGAGAAAATCCGGGCT.AACCGOAG j Xhol •d z O -C' x
m t> Z
o _c X
pR
ra CD
X « 2
X o 0 o o o O ί- Ο 0 0 O O < O 0 U 0 < 0 © < ) © s- < l·-< o o o <t 0 0 O 0 u 0 0 1 0 o 0 o © 0 t-t-U 0 (~ H 0 < 0 O ί ο 0 o o 0
0 CJ< o < 0 o o 0 o o 0 o Ι Ο 0 (— < f-<o o o 0 0 Q 0 Q O 0 0 o 0 0 0 0 0 0: 0: 0 < 0; 0: O: 0: O ο υ h- i5 Ι Ο o 0 ]... 0 H (- 0 μ- o 0 0 <c 0 0 μ_ < 1 < o o D K <c oOooo d í © ί α H· $ α o o<o 0 0 0 <£i-<O o o f- < 0 o u 0 0: 0 ο [ξ 0 ^ < o μ- ! x O i γ 0 0 < 0 511 ° 0 O 01 0 O o 0 , o Q o o o· < < 0 < o 0 H- b y 0 ã 0 ír o S 0 H o < < t“ Q £ 5 í 0 co o ií §! < 0 5 0 <1 H· o u o o o o O 0 O Q O 0 0 h~ u < 0 0 o I— 0 0 0 s— H 0 I H i *5 - j < 0 0 0 0 O 5~ 0 0 < N5 o 5 o 0 < o; o < u o 0 o < ] 0 0 < < ΙΌ < <c I < o 1 0 ! O: ! !— < O \ 0 0 | 0 0 i o O I 0 0 j 0 q R P P o h u b ool §U í || u rr h o P o < Η o u y o <So o G o < S υ < H u <μΟ < ^
U. CCCGCTCGAG.TTATTÇGSGGGCTTTTTCGGCATTGCCG I Xha! S £t Ό ti
tãm O w ÍÊ
δ IX
p UL
co 1Λ U
><&X TJ Ul 0 «tf fv,
> <s CE & φ i£ ít
1L U- 8 o H V) O ífl t>v o o Ξ o Φ h»
Ctt ITJ U
£ $ í 05 (0 K K o Φ -i T·' Φ
< O. E O 117
118
119 φ "Ο Έ. Ε « 33
ο X ® -ο ο χ
Xε Λ DD X !ε ί φ fÇ ; Ό. co Ζ ο ι ε : £3 X ί 03 «3 05 χ X Ε «ϊ ca
ο ,£Γ X Ή. ϋ β 8 Ο Ο < υ D ί-" Η ϊ- Ο < £ 5 £5 Η «£ © <· <£! ο ο 0 5 ο C5 Ο Ο 0 Ι Ο ω < < Η Ο )~ I— 0 Ο ο ο < < Ο Ο 0 ί ο < ο «ί ο l·—· ο I— ο ώ\ <\ 0! Ρί ί“! Ρϊ Ο ο ο ο οο Ρ-< ο ο 0 ϊ— ϊ— ο < 0 < < < 0 ί> --¾ ο; £ 5 ο ο ο 5 ο ο ο 0 ο Ο! < © ο; t- Οί ο ο ο 0 α < ο Q <ί 0 ο I ο < ο ο ο 0 < ϊ Ρ ο 0 ϊ ο 0 ο 0 ο S ι~~ ο ο I— ϋ < Ρ υ ό; «ί I—: < ΟΡΟ ο ο À ρ ο < 0 Ο Ο Ο S Ρ Ο ί ο ! Ο ! < ί 0 ο ί α Ρ ί: © ; 0 < 0 (- i— Ο ί 0 Ρ © ί © ο ο Q Ο ί— Ο U < Ρ £ < Η < Ο ί Ο 9 é < © ο ί— ο 0 ο Ο ο Ρ © ρ \— 0 l·— ο Ρ Ι Ο 0 0 0 S ο 9 Ρί Ρ; I—: <ί Ρί 0-α ρ ο Ο 0 Ρ ο 0 0 ί— ί— ο © >- ί·" 0. <ϊ 0 Ο h~ ο 0 ο ο © ο ο Ο α Ο < ί ο ο 0 < Η- ο 0 ο ^ , < ί ο I < Ο I ί— ? ι . 5 οη <\\ Ο: i Õ h ί— t ϊ 'Ό\\ Ο Ο 1 α ι ο \ 'Ό Li_ t) $ α. Ό Φ ££ > Φ (£ > : Ό Φ $ § ££ \ ίί > : Ό Φ : £ Όέ i tl ι > © Οί Ό $ > Φ CC \ υ S -J ύ δ ο
Ρ ϋ> Ρ $ X Φ <3) Φ Φ Ο φ φ X Λ. «ο Ο « ί Ξ «ο JO ο <& <r> Φ σ> fs. Φ Φ <0 Ϊ Ο <0 ¢5. Η -J ο C0 <?> C0 <?5. 120
121 .JZ Z
: Ο Φ O ,c "C .c. X Z X o φ jr P X z Φ O z Φ P z Φ P z
o .£- X «5 rt O fi «B 3 Ϊ?1
c o υυ;ο UU;< Η < | 0 <í O iP x y i o O << ! 0 O < \ O O O : o OU lo
O O
: > p ::· i Φ i » 1 Ct li, IX
¢0 to O
O O : H- |_ÍMig-S δ q o P < r= p o p o l·- q < < < 0 0 0 o u O 0 o o > p Φ % IX ú. o o f- H- h~ 0 (- H- < 0 < O 0 < 0 o 0 o < o u í- .¾ 5 0 9 0 < o o 0 P 0 s 0 < o :¾ Pí Q5 1 1- ; < l·-.! O l·— i 0 O! O O i O 0 í H 0 : O < < < ! O < ' >' Ί 0 rr. < o o 0 0; <; 0: O; í—: 0: _ 0 0 O h~ O < O 0 Ό Φ ¾ a: ii ã. 0 0 0j < © o f~ 0 (*~ 0 H !— < 0 [™ H 0 S © 0 0 < O O 0 1 o o © u 0 o 0 o i— o fr— o 0 o < o < o 0 o *7 0 o 1— o 0 o o o 0 < o 0 0 o 0 0 < 0 0 o 0 0 0 0 t™ < H < O 0 υ 1 0 o 0 o
o o 0 a t- 0 Ι Ο 0 0 < O < 0 © u X 0Í <: 0 O: }—; O: 0 O O O O < O 0 0 o 0 0 < 0 0 0 0 0 0 Jsss 0 < i— < o o o l·- 0 o 0 υ © a 0 0 i— i— O t- υ 0 9 < o < o 0 0 hy Çi <: 01 O; 1—: oi 0 O o o p > a, t£ £ li. > Φ Φ Qí Φ 0! rs co « X t N 00 <75
« to O Φ oa Φ .SÊ X < ff o
fió to O
LU u
0 X » τ- Ο K o
ÇQ to O S (0 Ξ £X f— O Ó * V) X <3 £1
O O
«£ x » iN 1 H 122
123
124 fu-(.iG287)~ Orf46,1~HSs i Fwd i CGCGGATCCGGTGGTGGTGOT- I BamH!
125
126(Δ6983)- Grf46,1- His Fwd1 GGAGGÇACTGGATCCTCAGATTTGGÇAAACGATTe SallFwd2 GCGGCGT GGACGGTGGCGGAGGCACT GGATCCT CAGA
Cf ;o
r- GO CM y ir.
CD O ώ < 0 o O CD O O O P co Ο Ή ό Vj Γ-cd .co >0 :'M CO S3 O 'Pt CO U V) & rd > Cd co U rd 'V P jJ. -d cd -p m u ftí ·Ηα « o ÇO O hí > o cp co το (d cd c; co 8
r-\ O p cd O co £ o o dd O aí -P P P ;d
•m dd co rd
co co •M -O d MO 127 NB - Todas as reações PCR utilizam a estirpe 2996 a menos que especificado em contrário (por exemplo estirpe MC58). Em todas as construções que começam com um ATG não seguidas por um único local Nhel, o codão ATG é parte do local Ndel utilizado para clonagem. As construções feitas utilizando Nhel como um local de clonagem na extremidade 5' (por exemplo, todas aquelas contendo 287 no terminal N) têm dois codões adicionais (GCT AGC) fundidos com a sequência codificadora do antigeno.
Preparação de moldes de ADN cromossomais
As estirpes 2996, MC58, 394.98, 1000 e BZ232 (e outras) de N. meningitidis foram crescidas a fase exponencial em 100 ml de meio GC, colhidas por centrifugação, e ressuspensas em 5 ml de tampão (sacarose 20% p/v, Tris-HCl 50mM, EDTA 50mM, pH 8). Após 10 minutos de incubação em gelo, as bactérias foram lisadas adicionando 10 ml de solução de lise (NaCl 50mM, 1% Na-Sarcosil, 50 mg/ml de proteinase K), e a suspensão incubada a 37 °C durante 2 horas. Duas extrações com fenol (equilibradas a pH 8) e uma extração com CHCls/álcool isoamil (24:1) foram realizadas. 0 ADN foi precipitado por adição de acetato de sódio 0,3 Me 2 volumes de etanol, e colhido por centrifugação. A bola foi lavada uma vez com etanol 70% (v/v) e redissolvida em 4,0 ml de tampão TE (Tris-HCl lOmM, EDTA lmM, pH 8,0). A concentração de ADN foi medida lendo OD26o ·
Amplificação por PCR O protocolo padrão de PCR foi como se segue: 200 ng de ADN genómico das estirpes 2996, MC581000, ou BZ232 ou 10 ng de preparação de ADN de plasmídeo de clones recombinantes foram utilizados como moldes na presença de 40 mM de cada 128 iniciador oligonucleotóideo, solução dNTPs 400-800 mM, tampão lx PCR (incluindo 1,5 M MgCl2), 2,5 unidades de ADN polimerase de Taql (utilizando AmpliTaQ Perkin-Elmer, Boerhingher Mannheim Expand™ Long Template).
Após uma incubação preliminar de 3 minutos da mistura inteira a 95°C, cada amostra passou por uma amplificação em duas etapas: os primeiros 5 ciclos foram realizados utilizando a temperatura de hibridização que excluiu cada da enzima de restrição do iniciador (Tml). Isto foi seguido por 30 ciclos de acordo com a temperatura de hibridização calculada para os oligos de comprimento inteiro (Tm2) . Tempos de alongamento, realizado a 68 °C ou 72°C, variaram de acordo com o comprimento do Orf a ser amplificado. No caso do Orfl o tempo de alongamento, começando dos 3 minutos, foi aumentado em 15 segundos cada ciclo. Os ciclos foram completados com uma etapa de extensão de 10 minutos a 72 ° C. 0 ADN amplificado ou era carregado diretamente num gel de agarose a 1%. O fragmento de ADN correspondente à banda de tamanho correto foi purificado a partir do gel utilizando o kit de extração Qiagen Gel, seguindo o protocolo do fabricante.
Digestão de fragmentos de PCR e dos vetores de clonagem O ADN purificado correspondente ao fragmento amplificado foi digerido com as enzimas de restrição apropriadas para clonagem em pET-21 b+, pET22b+ ou pET-24b+. Os fragmentos digeridos foram purificados utilizando o kit de purificação QIAquick PCR (seguindo as instruções do fabricante) e eluidos com ou H20 ou Tris 10 mM, pH 8,5. Os vetores do plasmídeo foram digeridos com as enzimas de restrição apropriadas, carregadas num gel de agarose a 1,0 129 % e a banda correspondente ao vetor digerido purificado utilizando o kit de extração de gel Qiagen QIAquick. Clonagem
Os fragmentos correspondentes a cada gene, previamente digeridos e purificados, foram ligados em pET21b+, pET22b+ ou pET-24b+. Uma razão molar de 3:1 fragmento/vetor foi utilizada com ADN ligase T4 no tampão de ligação fornecido pelo fabricante. 0 plasmideo recombinante foi transformado em DH5 competente ou HB101 de E. coli incubando a solução de reação de ligase e as bactérias durante 40 minutos em gelo, depois a 37°C durante 3 minutos. Isto foi seguido pela adição de 800 ml de caldo LB e incubação a 37°C durante 20 minutos. As células foram centrifugadas a velocidade máxima numa microcentrifuga de Eppendorf, ressuspensas em aproximadamente 200 ml do sobrenadante e colocadas em agar LB ampicilina (100 mg/ml). A classificação para clones recombinantes foi realizada crescendo aleatoriamente colónias selecionadas durante a noite a 37"C em 4,0 ml de caldo LB + 100 mg/ml de ampicilina. As células foram tornadas em bolas e o ADN do plasmideo extraído utilizando o kit Qiagen QIAprep Spin Miniprep, seguindo as instruções do fabricante.
Aproximadamente 1 mg de cada miniprep individual foi digerido com as enzimas de restrição apropriadas e o digerido carregado num gel de agarose a 1-1,5 % (dependendo do tamanho do inserido esperado), em paralelo com o marcador de peso molecular (lkb DNA Ladder, GIBCO) . Os clones positivos foram selecionados com base no tamanho do inserido.
Expressão 130
Após clonar cada gene no vetor de expressão, os plasmídeos recombinantes foram transformados em estirpes de E. coli adequadas para a expressão da proteína recombinante. 1 ml de cada construção foi utilizado para transformar BL21-DE3 de E. coli como descrito anteriormente. As colónias recombinantes únicas foram inoculadas em 2 ml de LB+Amp (100 mg/ml), incubadas a 37°C durante a noite, depois diluídas 1:30 em 20 ml de LB+Amp (100 mg/ml) em frascos de 100 ml, para dar um OD60o entre 0,1 e 0,2. Os frascos foram incubados a 30°C ou a 37°C numa misturadora de banho de água giratória até o OD6oo indicar crescimento exponencial adequado para indução da expressão (0,4-0,8 OD). A expressão proteica foi induzida por adição de IPTG 1,0 mM. Após 3 horas de incubação a 30°C ou 37°C o Οϋεοο foi medido e a expressão examinada. Foi centrifugado 1,0 ml de cada amostra numa microcentrífuga, a bola ressuspensa em PBS e analisada por SDS-PAGE e coloração com azul de Coomassie.
Clonagem gateway e expressão
As sequências rotuladas PORTA foram clonadas e expressas utilizando a Tecnologia de Clonagem GATEWAY (GIBCO-BRL). A clonagem recombinacional (RC) é baseada em reações de recombinação que medeiam a integração e excisão do fago no e a partir do genoma de E. coli, respetivamente. A integração envolve recombinação do local attP do ADN do fago dentro do local attB localizado no genoma bacteriano (reação BP) e gera um genoma de fago integrado flanqueado por locais attL e attR. A excisão recombina locais attL e attR de novo para os locais attP e attB (reação LR) . A reação de integração requer duas enzimas [a proteína integrase (Int) do fago e a proteína bacteriana de fator do 131 hospedeiro de integração (IHF)] (BP clonase). A reação de excisão requer Int, IHF, e uma enzima adicional do fago, Excisionase (Xis) (LR clonase). Os derivados artificiais do local de recombinação attB bacteriano com 25-bp, referidos como BI e B2, foram adicionados à extremidade 5' dos iniciadores utilizados nas reações de PCR para amplificar ORFs de Neisseria. Os produtos resultantes foram clonados BP num "vetor dador" contendo derivados complementares do local de recombinação attP do fago (PI e P2) utilizando BP clonase. Os "clones de entrada" resultantes contêm ORFs flanqueados por derivados do local attL (LI e L2) e foram subclonados na expressão de "vetores de destino" que contêm derivados dos locais attR compatíveis com attL (RI e R2) utilizando LR clonase. Isto resultou em "clones de expressão" nos quais os ORFs são flanqueados por BI e B2 e fundidos in-frame aos rótulos do terminal N GST ou His. A estirpe de E. coli utlizada para a expressão GATEWAY é BL21-SI. As células desta estirpe são induzidas para expressão da ARN polimerase T7 por crescimento em meio contendo sal (NaCl 0,3 M).
Note que este sistema proporciona N-terminal com rótulos His.
Preparação de proteínas de membrana
As frações compostas principalmente da membrana interior, ou exterior ou total foram isoladas de maneira a obter proteínas recombinantes expressas com sequências líder de localização de membrana. O método para preparação das frações de membrana, enriquecido para proteínas recombinantes, foi adaptado de Filip et al. [J.Bact. (1973) 115:717-722] e Davies et al. [J.Immunol.Meth. (1990) 143:215-225]. As colónias únicas que albergam o plasmídeo 132 de interesse foram crescidas durante a noite a 37°C em 20 ml de cultura liquida LB/Amp (100 μρ/ιηΐ) . As bactérias foram diluídas 1:30 em 1,0 L de meio fresco e crescidas a ou 30°C ou 37°C até o OD550 atingir 0,6-0,8. A expressão da proteína recombinante foi induzida com IPTG a uma concentração final de 1,0 mM. Após incubação durante 3 horas, as bactérias foram colhidas por centrifugação a 8000 g durante 15 minutos a 4°C e ressuspensas em 20 ml de Tris-HC1 20 mM (pH 7,5) e inibidores da protease completos (Boehringer-Mannheim). Todos os procedimentos subsequentes foram realizados a 4°C ou em gelo.
As células foram interrompidas por sonicação utilizando um sonicador Branson 450 e centrifugadas a 5000 g durante 20 min para sedimentar células não fracionadas e corpos de inclusão. O sobrenadante, contendo membranas e restos celulares, foi centrifugado a 50000 g (Beckman Ti50, 29000 rpm) durante 75 min, lavado com Bis-tris propano 20 mM (pH 6,5), NaCl 1,0 M, glicerol 10% (v/v) e sedimentado de novo a 50000 g durante 75 minutos. A bola foi ressuspensa em Tris-HCl 20 mM (pH 7,5), Sarcosil 2,0% (v/v), inibidor da protease completo (EDTA 1,0 mM, concentração final) e incubado durante 20 minutos para dissolver a membrana interior. Os restos celulares foram tornados em bola por centrifugação a 5000 g durante 10 min e o sobrenadante centrifugado a 75000 g durante 75 minutos (Beckman Ti50, 33000 rpm) . As proteínas 008L e 519L foram encontradas no sobrenadante sugerindo a localização na membrana interior. Para estas proteínas tanto frações de membrana interior e total (lavadas com NaCl como em cima) foram utilizadas para imunizar ratinhos. As vesículas da membrana exterior obtidas da bola 75000 g foram lavadas com 133
Tris-HCl 20 mM (pH 7,5) e centrifugadas a 75000 g durante 75 minutos ou durante a noite. O OMV foi finalmente ressuspenso em 500 ml de Tris-HCl 20 mM (pH 7,5), glicerol 10% v/v. OrflL e Orf40L foram ambos localizados e enriquecidos na fração da membrana exterior que foi utilizada para imunizar ratinhos. A concentração proteica foi estimada pelo ensaio de Bradford (Bio-Rad) padrão, enquanto a concentração proteica da fração da membrana interior foi determinada com o ensaio da proteína DC (Bio-Rad) . Várias frações do procedimento de isolamento foram testadas por SDS-PAGE.
Purificação das proteínas rotuladas com His Várias formas de 287 foram clonadas das estirpes 2996 e MC58. Elas foram construídas com uma fusão de terminal C rotulado com His e incluíram a forma madura (aminoácidos 18-427) , construções com deleções (Δ1, Δ2, Δ3 e Δ4) e os clones compostos de domínios B ou C. Para cada clone purificado como uma fusão His, uma única colónia foi
passada e crescida durante a noite a 37°C numa placa de agar LB/Amp (100 μg/ml). Uma colónia isolada desta placa foi inoculada em 20 ml de meio líquido LB/Amp (100 μρ/ιηΐ) e crescida durante a noite a 37°C com agitação. A cultura durante a noite foi diluída 1:30 em 1,0 L de meio líquido LB/Amp (100 μρ/ιηΐ) e permitida crescer à temperatura ótima (30 ou 37°C) até o OD550 atingir 0,6-0,8. A expressão da proteína recombinante foi induzida por adição de IPTG (concentração final de 1,0 mM) e a cultura incubada durante umas 3 horas adicionais. As bactérias foram colhidas por centrifugação a 8000 g durante 15 min a 4°C. A bola bacteriana foi ressuspensa em 7,5 ml de ou (i) tampão A frio (NaCl 300 mM, tampão fosfato 50 mM, 10 mM imidazol, pH 134 8,0) para proteínas solúveis ou (ii) tampão B (lOmM Tris-HC1, 100 mM tampão fosfato, pH 8,8 e, opcionalmente, 8M ureia) para proteínas insolúveis. As proteínas purificadas numa forma solúvel incluíram 287-His, Δ1, Δ2, Δ3 e Δ4287-His, A4287MC58-His, 287c-His e 287cMC58-His. A proteína 287bMC58-His foi insolúvel e purificada em concordância. As células foram interrompidas por sonicação em gelo quatro vezes durante 30 segundos a 40W utilizando um sonificador Branson 450 e centrifugadas a 13000xg durante 30 min a 4°C. Para proteínas insolúveis, as bolas foram ressuspensas em 2,0 ml de tampão C (6 M cloridrato de guanidina, 100 mM tampão fosfato, 10 mM Tris- HC1, pH 7,5 e tratada com 10 passagens de um homogeneizador Dounce. O homogeneizado foi centrifugado a 13000 g durante 30 min e o sobrenadante retido. Os sobrenadantes para ambas preparações solúveis e insolúveis foram misturados com 150 ml de Ni2+-resina (previamente equilibrado com ou tampão A ou tampão B, conforme apropriado) e incubados à temperatura ambiente com agitação suave durante 30 min. A resina foi a Chelating Sepharose Fast Flow (Pharmacia), preparada de acordo com o protocolo do fabricante. A preparação em série foi centrifugada a 700 g durante 5 min a 4°C e o sobrenadante descartado. A resina foi lavada duas vezes (em série) com 10 ml de tampão A ou B durante 10 min, ressuspensa em 1,0 ml de tampão A ou B e carregada numa coluna descartável. A resina continuou a ser lavada ou com (i) tampão A a 4°C ou (ii) tampão B à temperatura ambiente, até o OD280 do fluxo atingir 0,02-0,01. A resina foi ainda lavada com ou (i) tampão C frio (300 mM NaCl, 50mM tampão fosfato, 20 mM imidazol, pH 8,0) ou (ii) tampão D (lOmM Tris-HCl, 100 mM tampão fosfato, pH 6,3 e, opcionalmente, 8M ureia) até OD280 135 do fluxo atingir 0,02-0,01. A proteína de fusão His foi eluída por adição de 700 ml de ou (i) tampão de eluição frio A (300 mM NaCl, 50 mM tampão fosfato, 250 mM imidazol, pH 8,0) ou (ii) tampão de eluição B (10 mM Tris-HCl, 100 mM tampão fosfato, pH 4,5 e, opcionalmente, 8 M ureia) e frações colhidas até o OD28o indicar que toda a proteína recombinante é obtida. Aliquotas de 20 ml de cada fração de eluição foram analisadas por SDS-PAGE. As concentrações proteicas foram estimadas utilizando o ensaio de Bradford. Renaturação de proteínas de fusão His desnaturadas. A desnaturação foi requerida para solubilizar 287bMC8, por isso uma etapa de renaturação foi empregue antes da imunização. O glicerol foi adicionado às frações desnaturadas obtidas anteriormente para dar uma concentração final de 10% v/v. As proteínas foram diluídas para 200 μρ/πιΐ utilizando tampão de diálise I (glicerol 10% v/v, 0,5 M arginina, 50 mM tampão fosfato, 5,0 mM glutationa reduzida, 0,5 mM glutationa oxidada, 2,0 M ureia, pH 8,8) e dialisadas contra o mesmo tampão durante 12-14 horas a 4°C. Diálise adicional foi realizada com tampão II (glicerol 10% v/v, 0,5 M arginina, 50 mM tapão fosfato, 5,0 mM glutationa reduzida, 0,5 mM glutationa oxidada, pH 8,8) durante 12-14 horas a 4°C. A concentração proteica foi estimada utilizando a fórmula:
Proteína (mg/ml) = (], 55 x OD2so) - (0,76 x OD260)
Análise de sequência de aminoácido. A análise de sequência automatizada do terminal NH2 de proteínas foi realizada num sequenciador Beckman (LF 3000) equipado com um analisador de feniltiohidantoina-aminoácido on-line (System Gold) de acordo com as recomendações do 136 fabricante .
Imunização
Ratinhos Balb/C foram imunizados com antigenos nos dias 0, 21 e 35 e os soros analisados ao dia 49.
Análise dos soros - ELISA A MenB M7 acapsulada e as estirpes capsuladas foram colocadas em placas em pratos de agar chocolate e incubadas durante a noite a 37°C com 5% de C02. As colónias bacterianas foram recolhidas dos pratos de agar utilizando cotonetes de ponta de poliéster estéreis e inoculadas em caldo de Mueller-Hinton (Difco) contendo 0,25% de glicose. O crescimento bacteriano foi monitorizado cada 30 minutos seguindo o OD620 · Foi-lhes permitido às bactérias crescer até o OD atingir o valor de 0,4-0,5. A cultura foi centrifugada durante 10 minutos a 4000 rpm. O sobrenadante foi descartado e as bactérias foram lavadas duas vezes com PBS, ressuspensas em PBS contendo 0,025% de formaldeido, e incubadas durante 1 hora a 37°C e depois durante a noite a 4°C com agitação. 100 ml de células bacterianas foram adicionados a cada poço de uma placa de Greiner com 96 poços e incubadas durante a noite a 4°C. Os poços foram depois lavados três vezes com tampão de lavagem PBT (0,1% de Tween-20 em PBS). 200 ml de tampão de saturação (2,7% polivinilpirrolidona 10 em água) foi adicionado a cada poço e as placas incubadas durante 2 horas a 37°C. Os poços foram lavados três vezes com PBT. 200 ml de soros diluídos (tampão de diluição: 1% de BSA, 0,1% de Tween-20, 0,1% de NaN3 em PBS) foram adicionados a cada poço e as placas incubadas durante 2 horas a 37°C. Os poços foram lavados três vezes com PBT. 100 ml de soro anti-ratinho coelho (Dako) conjugado com HRP diluído 1:2000 em tampão de 137 diluição foram adicionados a cada poço e as placas foram incubadas durante 90 minutos a 37°C. Os poços foram lavados três vezes com tampão PBT. 100 ml de tampão de substrato para HRP (25 ml de tampão citrato pH 5, 10 mg de 0- fenildiamina e 10 ml de H202) foram adicionados a cada poço e as placas foram deixadas à temperatura ambiente durante 20 minutos. 100 ml de 12,5% de H2S04 foi adicionado a cada poço e o OD490 foi seguido. Os títulos de ELISA foram calculados arbitrariamente como a diluição dos soros que deram um valor de OD490 de 0,4 acima do nível de soros pré-imunes. O ELISA foi considerado positivo quando a diluição dos soros com OD490 de 0,4 foi superior a 1 : 400 .
Análise de soros - ensaio de ligação de bactérias Scan FACS A estirpe MenB M7 acapsulada foi colocada em pratos de agar chocolate e incubada durante a noite a 37°C com 5% de C02. As colónias bacterianas foram colhidas das placas de agar utilizando cotonetes de ponta de poliéster estéreis e inoculadas em 4 tubos contendo 8 ml cada de caldo de
Mueller-Hinton (Difco) contendo 0,25% de glicose. O crescimento bacteriano foi monitorizado cada 30 minutos seguindo o OD620 · As bactérias foram deixadas crescer até o OD atingir o valor de 0,35-0,5. A cultura foi centrifugada durante 10 minutos a 4000 rpm. O sobrenadante foi descartado e a bola foi ressuspensa em tampão bloqueador (1% BSA em PBS, 0,4% NaN3) e centrifugada durante 5 minutos a 4000 rpm. As células foram ressuspensas em tampão bloqueador para atingir o OD620 de 0,05. 100 ml de células bacterianas foram adicionados a cada poço de uma placa Costar com 96 poços. 100 ml de soros diluídos (1:100, 1:200, 1:400) (em tampão bloqueador) foram adicionados a cada poço e as placas incubadas durante 2 horas a 4°C. As 138 células foram centrifugadas durante 5 minutos a 4000 rpm, o sobrenadante aspirado e as células lavadas por adição de 200 ml/poço de tampão bloqueador em cada poço. 100 ml de F(ab)2 anti-ratinho cabra conjugado com R-ficoeritrina, diluído 1:100, foi adicionado a cada poço e as placas incubadas durante 1 hora a 4°C. As células foram giradas por centrifugação a 4000 rpm durante 5 minutos e lavadas por adição de 200 ml/poço de tampão bloqueador. O sobrenadante foi aspirado e as células ressuspensas em 200 ml/poço de PBS, 0,25% de formaldeído. As amostras foram transferidas para tubos FACScan e lidas. A condição para definir FACScan (Laser Power 15mW) foi: FL2 acendido; FSC-H limiar: 92; FSC PMT Voltagem: E 01; SSC PMT: 474; Amp.
Ganhos 6.1; FL-2 PMT: 586; valores de compensação: 0. Análise de soros - ensaio bactericida A estirpe 2996 de N. meningitidis foi crescida durante a noite a 37°C em placas de agar chocolate (começando a partir de um estoque congelado) com 5% de C02. As colónias foram colhidas e utilizadas para inocular 7 ml de caldo Mueller-Hinton, contendo 0,25% de glicose para atingir um OD620 de 0,05-0, 08. A cultura foi incubada durante
aproximadamente 1,5 horas a 37 graus com agitação até o OD620 atingir o valor de 0,23-0,24. As bactérias foram diluídas em 50 mM tampão fosfato pH 7,2 contendo 10 mM
MgCl2, 10 mM CaCl2 e 0,5% (p/v) BSA (tampão de ensaio) à diluição de trabalho de 105 CFU/ml. O volume total da mistura de reação final foi 50 ml com 25 ml de diluição em duas séries de soro teste, 12,5 ml de bactérias na diluição de trabalho, 12,5 ml de complemento de coelho bebé (concentração final 25%).
Os controlos incluíram bactérias incubadas com soro 139 complemento, soros imunes incubados com bactérias e com complemento desativado por aquecimento a 56°C durante 30'. Imediatamente após a adição do complemento de coelho bebé, 10 ml dos controlos foram colocados em placas de agar Mueller-Hinton utilizando o método de inclinação (tempo 0). A placa com 96 poços foi incubada durante 1 hora a 37°C com rotação. 7 ml de cada amostra foi colocada em placas de agar Mueller-Hinton como manchas, ao passo que 10 ml dos controlos foram colocados em placas de agar Mueller-Hinton utilizando o método de inclinação (tempo 1). As placas de agar foram incubadas durante 18 horas a 37 graus e as colónias correspondentes ao tempo 0 e tempo 1 foram contadas.
Análise de soros - western blots
As proteinas purificadas (500 ng/via), vesículas da membrana exterior (5 mg) e extratos celulares totais (25 mg) derivados da estirpe 2996 de MenB foram carregados num gel de SDS-poliacrilamida a 12% e transferidas para uma membrana de nitrocelulose. A transferência foi realizada durante 2 horas a 150 mA a 4°C, utilizando tampão de transferência (0,3% base Tris, 1,44% glicina, 20% (v/v) metanol). A membrana foi saturada durante a noite por incubação a 4°C em tampão de saturação (10% leite desnatado, 0,1% Triton X100 em PBS). A membrana foi lavada duas vezes com tampão de lavagem (3% leite desnatado, 0,1% Triton X100 em PBS) e incubada durante 2 horas a 37 °C com soros de ratinhos diluído 1:200 em tampão de lavagem. A membrana foi lavada duas vezes e incubada durante 90 minutos com uma diluição 1:2000 de Ig anti-ratinho rotulada com peroxidase de raiz-forte. A membrana foi lavada duas vezes com 0,1% Triton X100 em PBS e desenvolvida com o kit 140 de substrato 0pti-4CN (Bio-Rad). A reação foi terminada adicionando água.
Os OMVs foram preparados como se segue: a estirpe 2996 de N. meningitidis foi crescida durante a noite a 37 graus com 5% de CO2 em placas 5 GC, colhidas com um loop e ressuspensas em 10 ml de 20mM Tris-HCl pH 7,5, 2 mM EDTA. A desativação por calor foi realizada a 56 °C durante 45 minutos e as bactérias interrompidas por sonicação durante 5 minutos em gelo (50% ciclo de trabalho, 50% rendimento, sonicador Branson microponta de 3 mm). As células não fracionadas foram removidas por centrifugação a 5000 g durante 10 minutos, o sobrenadante contendo a fração envelope de célula total recuperado e ainda centrifugado durante a noite a 50000 g à temperatura de 4°C. A bola contendo as membranas foi ressuspensa em 2% sarcosil, 20mM Tris-HCl pH 7,5, 2 mM EDTA e incubada à temperatura ambiente durante 20 minutos para solubilizar as membranas interiores. A suspensão foi centrifugada a 10000 g durante 10 minutos para remover agregados, o sobrenadante foi ainda centrifugado a 50000 g durante 3 horas. A bola, contendo as membranas exteriores foi lavada em PBS e ressuspensa no mesmo tampão. A concentração proteica foi medida pelo ensaio de proteína Bio-Rad D.C. (método de Lowry modificado), utilizando BSA como um padrão.
Os extratos celulares totais foram preparados como se segue: a estirpe 2996 de N. meningitidis foi crescida durante a noite numa placa GC, colhida com um loop e ressuspensa em 1 ml de 20 mM Tris-HCl. A desativação por calor foi realizada a 56°C durante 30 minutos.
Estudos do domínio 961
Preparação de frações celulares O lisado total, 141 periplasma, sobrenadante e OMV de clones de E. coli expressando diferentes domínios da 961 foram preparados utilizando bactérias de culturas durante a noite ou após 3 horas da indução com IPTG. Resumidamente, o periplasma foram obtidos suspendendo bactérias em sacarose 25% e Tris 50 mM (pH 8) com 100 mg/ml polimixina. Após 1 hora à temperatura ambiente as bactérias foram centrifugadas a 13000 rpm durante 15 min e o sobrenadante foi recolhido. O sobrenadante da cultura foi filtrado com 0,2 mm e precipitado com TCA 50% em gelo durante duas horas. Após centrifugação (30 min a 13000 rp) as bolas foram passadas duas vezes por etanol 70% e suspensas em PBS. A preparação do OMV foi realizada como descrito previamente. Cada fração celular foi analisada em SDS-PAGE ou em Western Blot utilizando o anti-soro policlonal criado contra GST-961. O ensaio de adesão das células epiteliais Chang (derivado de Wong-Kilbourne, clone l-5c-4, conjuntiva humana) foram mantidos em DMEM (Gibco) suplementados com 10% de FCS desativada pelo calor, 15 mM L-glutamina e antibióticos.
Para o ensaio de aderência, a cultura sub-confluente das células epiteliais Chang foi passada por PBS e tratada com tripsina-EDTA (Gibco), para os libertar do suporte de plástico. As células foram depois suspensas em PBS, contadas e diluídas em PBS para 5xl05 células/ml.
As bactérias das culturas durante a noite ou após indução com IPTG foram tornadas em bolas e lavadas duas vezes com PBS centrifugando a 13000 durante 5 min. Aproximadamente 2-3xl08 (cfu) foram incubadas com 0,5 mg/ml de FITC (Sigma) e 1 ml de tampão contendo 50 mM NaHC03 e 100 mM NaCl pH 8, durante 30 min à temperatura ambiente na 142 escuridão. As bactérias rotuladas com FITC foram lavadas 2-3 vezes e suspensas em PBS a 1-1,5xl09/ml. 200 ml desta suspensão (2-3xl0s) foram incubados com 200 μΐ (lxlO5) de células epiteliais durante 30 min a 37°C. As células foram depois centrifugadas e 2000 rpm durante 5 min para remover bactérias não aderentes, suspensas em 200 μΐ de PBS, transferidas para tubos FACScan e lidas. 143
DOCUMENTOS REFERIDOS NA DESCRIÇÃO
Esta lista de documentos referidos pelo autor do presente pedido de patente foi elaborada apenas para informação do leitor. Não é parte integrante do documento de patente europeia. Não obstante o cuidado na sua elaboração, o IEP não assume qualquer responsabilidade por eventuais erros ou omissões.
Documentos de patente referidos na descrição WO 9924578 A [0002] [0004] [0005] [0116] [0147] WO 9936544 A [0002] [0004] [0005] [0147] WO 9957280 A [0002] [0004] [0005] [0066] [0136] [0142] [0147] WO 0022430 A [0002] WO 0066791 A [0006] WO 0066741 A [0008] [0022] [0024] [0040] [0047] [0050] [0065] [0093] [0126] [0141] [0163] [0248] • WO 0071574 A [0009] • WO 0104316 A [0009] • WO 9955873 A [0115]
Literatura não relacionada com patentes, citada na descrição • Tettelin et al. Science, 2000, vol. 287, 1809-1815 [0006] • Ursinus ; Holtje. J.Bact., 1994, vol. 176, 338-343 [0074] • Harz.Anal.Biochem., 1990, vol. 190, 12 0-128 [0077] • Glauner. Anal. Biochem., 1988, vol. 172, 451-464 [0079] • Thunnissen et al. Biochemistry, 1995, vol. 34, 12729-12737 [0084] 144 • Asselt et al. Structure Fold Des, 1999, vol. 7, 1167-80 [0084] • Terrak et al. Mol .Microbiol., 1999, vol. 34, 350-64 [0087] • Velati Bellini et al. J. Biotechnol., 1991, vol. 18, 177-192 [0105] • Ropp ;Nicholas.J. Bact.,1997, vol.179, 2783-2787 [0159] • Kraft. J. Bact., 1998, vol. 180, 3441-3447 [0160] • Thaller et al. Microbiology, 1994, vol. 140, 1341-1350 [0217] • Hoiczyk et al. EMBO J, 2000, vol. 19, 5989-99 [0241] • Evans. Infect.Immun., 1974, vol. 10, 1010-1017 [0251] • Filip. J. Bact., 1973, vol. 115, 717-722 [0271] • Davies. J. Immunol.Meth., 1990, vol. 143, 215-225 [0271]

Claims (9)

1 REIVINDICAÇÕES 1. Um método para a expressão heteróloga de uma proteína imunogénica que compreende a) pelo menos 90 aminoácidos consecutivos da sequência MFERSVIAMACIFAL5ACGGGGGGSPDVKSADTLSKPAAPWAEKETEVKEDAPOAGSQGOGAPSTOQSODMAA VSAENTGNGGAATTDKPKNEDEGPQNDMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGV LIDGPSQNITLTHCKGDSCNGDNLLDEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVnYK DKS ASS S S ARFRRS ARS RRSLP AEMPLIP VNQ ADTLIVDGEAVS LTGHSGNIFAPEGNYRYLTYGAEKLPGGS YALR VQGEPAKGEMLAGTAVYNGEVLHFHTENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKA aidgngfkgtwtengggdvsgrfygpageevagkysyrptdaekggfgvfagkkeqd; ··,··· » b) uma sequência de comprimento inteiro com pelo menos 70% de identidade com a sequência MFBB SVTAMACIFA LS ACOGGGGGSPDVKS ADTLSKPAAP WAEKETEVKEDAPQAGSQGQGAPSTQGSQDMAA VSAENTGNGGAATTDKPKNEDEGPQNDMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGV LIDGPSQNITLTHCKGDSCNGDNLLDEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVUYK DKSASSSSARFRRSARSRRSLPAEMPUPVNQADTLIVDGEAVSLTGHSGNIFAPEGNYRYLTYGAEKUGGSYALR VQGEPAKGEMLAGTAVYNGEVLHFHTENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKA AIDGNGFKGTWTENGGGDVSGRFYGPAGEEVAGKYSYRPTDAEKGGFGVFAGKKEQD. e em que ocorre a deleção do péptido líder da proteína.
2. O método da reivindicação 1, em que a proteína compreende uma sequência de comprimento inteiro com pelo menos 80% de identidade com a sequência apresentada na reivindicação 1 a) .
3. 0 método da reivindicação 1, em que a proteína compreende uma sequência de comprimento inteiro com pelo menos 90% de identidade com a sequência apresentada na reivindicação 1 a) .
4. 0 método da reivindicação 1, em que a proteína compreende uma sequência de comprimento inteiro com pelo menos 95% de identidade com a sequência apresentada na 2 reivindicação 1 a).
5. 0 método da reivindicação 1, em que a proteína compreende uma sequência de comprimento inteiro com pelo menos 99% de identidade com a sequência apresentada na reivindicação 1 a).
6. 0 método de qualquer uma das reivindicações 1-5, em que não é utilizado parceiro de fusão.
7. 0 método de qualquer uma das reivindicações 1-6, em que a dita proteína é expressa em E. coli.
8. 0 método da reivindicação 1 em que a proteína consiste na sequência MASPDVKSADTLSKPAAPWAEKETEVKEDAPQAOSQGQGAPSTQGSQDMAAVSAÈNTGNGGAATTDKPKNEDEG PQNDMPQNSAESANQÍGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGVLIDGPSQNnXTHCKGDSCJíGDNLL DEEAPSKSEFENLNESERIEKYKKDGKSDKFTNLVATAVQANGTNKYVIIYKDKSASSSSARFRRSARSRRSLPAEMP LIPVNQADTLIVDGEAVSLTGHSGNIFAPEGNYRYLTyGAEKLPGGSYALRVQGEPAKGEMLAGTAVYNGEVLHFHT ENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKAAZDGNGFKGTWTENGGGDVSGRFYGPAGEEVAGK YSYRPTDAEKGGFGVFAGKKEQDGSGGGGATYKVDEYHANARFAIDHFNTSTNVGGFYGLTGSVEFDQAKRDGKI DII1PVANLQSGSQHFTDHLKSADIFDAAQYPDIRFVSTKFNFNGKKLVSVDGNLTMHGKTAPVKLKAEKFNCYQSP MAKTEVCGGDFSTTIDRTKWGVDYLVNVGMTKSVRIDIQÍEAAKQ.
9. Uma proteína imunogénica que consiste na sequência MASPDVKSADTLSKPAAPWAEKETEVKEDAPQAGSQGQGAPSTQGSQDMAAVSAENTGNGGAATTDKPKNEDEG PQNDMPQNSAESANQTGNNQPADSSDSAPASNPAPANGGSNFGRVDLANGVLnXjPSQNITLTHCKGDSCNGDNLL 'OEEAPSKSEFENLNESERJEKYKKDGKSDKFTNLVATAVQANGTNKYVnYKDKSASSSSARFRRSARSRRSLPAEMP UPVNQADTUVDGEAVSLTGHSGNIFAPEGNYRYLTYGAEKLPGGSYALRVQGEPAKGEMLAGTAVYNGEVLHFHT ENGRPYPTRGRFAAKVDFGSKSVDGIIDSGDDLHMGTQKFKAAIDGNGFKGTWTENGGGDVSGRFYGPAGEEVAGK YSYRPTDAEKGGFGVFAGKKEQDGSGGGGATYKVDEYHANARFAIDHFNTSTNVGGFYGLTGSVEFDQAKRDGKI DITIP VANLQSGSQHFTDHLKS ADIFD A AQYPDIRFVSTKFNFNGKK LVS VDGNLTMHGKTAP VKLKAEKFNC YQSP MAKTEVCGGDFSTTIDRTKWGVDYLVNVGMTKSVRJDIQffiAAKQ.
PT06076718T 2000-02-28 2001-02-28 Expressão heteróloga de proteínas de neisseria PT1790660E (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0004695A GB0004695D0 (en) 2000-02-28 2000-02-28 Protein expression
GB0027675A GB0027675D0 (en) 2000-11-13 2000-11-13 Protein Expression

Publications (1)

Publication Number Publication Date
PT1790660E true PT1790660E (pt) 2012-09-17

Family

ID=26243750

Family Applications (4)

Application Number Title Priority Date Filing Date
PT01914098T PT1261723E (pt) 2000-02-28 2001-02-28 Expressões híbridas de proteínas de neisseria
PT06076718T PT1790660E (pt) 2000-02-28 2001-02-28 Expressão heteróloga de proteínas de neisseria
PT10178586T PT2270030E (pt) 2000-02-28 2001-02-28 Expressão heteróloga de proteínas de neisseria
PT08075111T PT1947187E (pt) 2000-02-28 2001-02-28 Expressões híbridas de proteínas de neisseria

Family Applications Before (1)

Application Number Title Priority Date Filing Date
PT01914098T PT1261723E (pt) 2000-02-28 2001-02-28 Expressões híbridas de proteínas de neisseria

Family Applications After (2)

Application Number Title Priority Date Filing Date
PT10178586T PT2270030E (pt) 2000-02-28 2001-02-28 Expressão heteróloga de proteínas de neisseria
PT08075111T PT1947187E (pt) 2000-02-28 2001-02-28 Expressões híbridas de proteínas de neisseria

Country Status (20)

Country Link
US (9) US20040092711A1 (pt)
EP (6) EP2270030B1 (pt)
JP (8) JP4763210B2 (pt)
CN (7) CN1800385B (pt)
AT (3) ATE352631T1 (pt)
AU (4) AU3948801A (pt)
BR (2) BR0108713A (pt)
CA (5) CA2744921C (pt)
CY (6) CY1106532T1 (pt)
DE (3) DE60126249T2 (pt)
DK (4) DK1790660T3 (pt)
ES (5) ES2281409T3 (pt)
HK (4) HK1064120A1 (pt)
LU (1) LU92240I2 (pt)
MX (2) MXPA02008314A (pt)
NL (1) NL300605I2 (pt)
NZ (2) NZ521396A (pt)
PT (4) PT1261723E (pt)
RU (2) RU2304617C2 (pt)
WO (2) WO2001064922A2 (pt)

Families Citing this family (86)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001500738A (ja) 1996-09-17 2001-01-23 カイロン コーポレイション 細胞内疾患を処置するための組成物および方法
ATE446368T1 (de) * 1998-01-14 2009-11-15 Novartis Vaccines & Diagnostic Antigene aus neisseria meningitidis
US20070026021A1 (en) * 1998-05-01 2007-02-01 Chiron S.R.I. Neisseria meningitidis antigens and compositions
EP2261355A3 (en) 1998-05-01 2012-01-11 Novartis Vaccines and Diagnostics, Inc. Neisseria meningitidis antigens and compositions
ES2228454T3 (es) * 1999-02-26 2005-04-16 Chiron S.R.L. Mejora de la actividad bacteriana de antigenos de neisseria con oligonucleotidos que contienen motivos cg.
DK1228217T3 (da) 1999-04-30 2013-02-25 Novartis Vaccines & Diagnostic Konserverede neisseria-antigener
GB9911683D0 (en) * 1999-05-19 1999-07-21 Chiron Spa Antigenic peptides
CN102580072A (zh) * 1999-05-19 2012-07-18 诺华疫苗和诊断有限公司 组合式奈瑟球菌组合物
CA2864069A1 (en) 1999-10-29 2001-05-03 Novartis Vaccines And Diagnostics S.R.L. Neisserial antigenic peptides
GB9928196D0 (en) 1999-11-29 2000-01-26 Chiron Spa Combinations of B, C and other antigens
ES2507100T3 (es) * 2000-01-17 2014-10-14 Novartis Vaccines And Diagnostics S.R.L. Vacuna OMV suplementada contra meningococo
DK1790660T3 (da) * 2000-02-28 2012-09-17 Novartis Vaccines & Diagnostic Heterolog ekspression af Neisseria-proteiner
AU2002252638A1 (en) * 2001-04-17 2002-10-28 Children's Hospital Oakland Research Institute Molecular mimetics of meningococcal b epitopes which elicit functionally active antibodies
GB0115176D0 (en) 2001-06-20 2001-08-15 Chiron Spa Capular polysaccharide solubilisation and combination vaccines
US6928463B1 (en) * 2001-07-06 2005-08-09 Nortel Networks Limited Broadband content delivery via personal content tunnel
GB0118249D0 (en) 2001-07-26 2001-09-19 Chiron Spa Histidine vaccines
GB0121591D0 (en) * 2001-09-06 2001-10-24 Chiron Spa Hybrid and tandem expression of neisserial proteins
MXPA04000653A (es) 2001-07-27 2004-11-22 Chiron Srl Adhesinas de meningococcus nada, app y orf 40.
AU2014201962B2 (en) * 2001-09-06 2016-06-09 Novartis Vaccines And Diagnostics S.R.L. Hybrid and tandem expression of Neisserial proteins
CN100354297C (zh) * 2001-10-03 2007-12-12 希龙公司 辅助的脑膜炎球菌组合物
US7838015B2 (en) 2001-10-03 2010-11-23 Novartis Vaccines And Diagnostics, Inc. Adjuvanted meningococcus compositions
AR045702A1 (es) 2001-10-03 2005-11-09 Chiron Corp Composiciones de adyuvantes.
MX339524B (es) 2001-10-11 2016-05-30 Wyeth Corp Composiciones inmunogenicas novedosas para la prevencion y tratamiento de enfermedad meningococica.
PL399492A1 (pl) * 2002-08-02 2012-11-19 Glaxosmithkline Biologicals S.A. Szczepionka
US7785608B2 (en) 2002-08-30 2010-08-31 Wyeth Holdings Corporation Immunogenic compositions for the prevention and treatment of meningococcal disease
JP4697706B2 (ja) * 2002-10-11 2011-06-08 ノバルティス ヴァクシンズ アンド ダイアグノスティクス エスアールエル 高毒性髄膜炎菌系統に対する広範な防御のためのポリペプチド−ワクチン
ES2280809T3 (es) 2002-11-01 2007-09-16 Glaxosmithkline Biologicals S.A. Composicion inmunogenica.
CA2506318C (en) 2002-11-15 2011-07-12 Chiron Srl Unexpected surface proteins in neisseria meningitidis
GB0227346D0 (en) 2002-11-22 2002-12-31 Chiron Spa 741
EP2191844B1 (en) * 2003-01-30 2014-03-05 Novartis AG Injectable vaccines against multiple meningococcal serogroups
JP4522997B2 (ja) 2003-08-13 2010-08-11 ノバルティス バクシンズ アンド ダイアグノスティックス,インコーポレーテッド Tfpiおよびtfpiアナログを精製するための改良された方法
CN103405761A (zh) * 2003-10-02 2013-11-27 诺华疫苗和诊断有限公司 多种脑膜炎球菌血清群的液体疫苗
GB0323103D0 (en) 2003-10-02 2003-11-05 Chiron Srl De-acetylated saccharides
GB0408977D0 (en) * 2004-04-22 2004-05-26 Chiron Srl Immunising against meningococcal serogroup Y using proteins
GB0409748D0 (en) 2004-04-30 2004-06-09 Chiron Srl Lactoferrin cleavage
GB0419408D0 (en) * 2004-09-01 2004-10-06 Chiron Srl 741 chimeric polypeptides
GB0424092D0 (en) 2004-10-29 2004-12-01 Chiron Srl Immunogenic bacterial vesicles with outer membrane proteins
NZ580974A (en) 2005-02-18 2011-05-27 Novartis Vaccines & Diagnostic Immunogens from uropathogenic escherichia coli
LT2351772T (lt) 2005-02-18 2016-10-10 Glaxosmithkline Biologicals Sa Baltymai ir nukleorūgštys iš su meningitu/sepsiu susijusių escherichia coli
CN100475965C (zh) * 2005-07-22 2009-04-08 上海高科联合生物技术研发有限公司 一种大肠杆菌高效外分泌表达溶葡萄球菌酶的方法
GB0524066D0 (en) 2005-11-25 2006-01-04 Chiron Srl 741 ii
CA2632434A1 (en) * 2005-12-06 2007-06-14 Universita Degli Studi Di Padova Methods and compositions relating to adhesins as adjuvants
WO2008020330A2 (en) 2006-08-16 2008-02-21 Novartis Ag Immunogens from uropathogenic escherichia coli
AR064642A1 (es) 2006-12-22 2009-04-15 Wyeth Corp Polinucleotido vector que lo comprende celula recombinante que comprende el vector polipeptido , anticuerpo , composicion que comprende el polinucleotido , vector , celula recombinante polipeptido o anticuerpo , uso de la composicion y metodo para preparar la composicion misma y preparar una composi
GB0700562D0 (en) 2007-01-11 2007-02-21 Novartis Vaccines & Diagnostic Modified Saccharides
GB0713880D0 (en) 2007-07-17 2007-08-29 Novartis Ag Conjugate purification
EP2462949A3 (en) 2007-10-19 2012-09-05 Novartis AG Meningococcal vaccine formulations
US9579372B2 (en) 2008-02-21 2017-02-28 Glaxosmithkline Biologicals Sa Meningococcal fHBP polypeptides
CA2716706C (en) 2008-03-03 2014-02-18 Irm Llc Compounds and compositions as tlr activity modulators
CA2726512A1 (en) * 2008-06-09 2009-12-17 Novartis Ag Antibodies against neisserial factor h binding protein
JP5487463B2 (ja) 2008-08-08 2014-05-07 独立行政法人産業技術総合研究所 非拡散植物ウイルスベクター
EP2411048B1 (en) 2009-03-24 2020-05-06 GlaxoSmithKline Biologicals SA Adjuvanting meningococcal factor h binding protein
US9517263B2 (en) 2009-06-10 2016-12-13 Glaxosmithkline Biologicals Sa Benzonaphthyridine-containing vaccines
ES2596653T3 (es) 2009-06-16 2017-01-11 Glaxosmithkline Biologicals Sa Ensayos bactericidas de opsonización y dependientes de anticuerpo mediado por el complemento de alto rendimiento
CN104650241A (zh) 2009-08-27 2015-05-27 诺华股份有限公司 包括脑膜炎球菌fHBP序列的杂交多肽
BR112012004806B8 (pt) 2009-09-02 2022-10-04 Novartis Ag composições imunogênicas que incluem moduladores da atividade de tlr, método para aumento da eficácia da referida composição e uso
JO3257B1 (ar) 2009-09-02 2018-09-16 Novartis Ag مركبات وتركيبات كمعدلات لفاعلية tlr
CN102724988B (zh) 2009-09-30 2014-09-10 诺华股份有限公司 脑膜炎球菌fHBP多肽的表达
CA2779816A1 (en) 2009-10-27 2011-05-05 Novartis Ag Modified meningococcal fhbp polypeptides
WO2011057148A1 (en) 2009-11-05 2011-05-12 Irm Llc Compounds and compositions as tlr-7 activity modulators
SG10201501980SA (en) 2009-12-15 2015-05-28 Novartis Ag Homogeneous suspension of immunopotentiating compounds and uses thereof
JP5848748B2 (ja) 2010-03-23 2016-01-27 アイアールエム・リミテッド・ライアビリティ・カンパニーIrm,Llc 感染症、炎症、呼吸器疾患などの処置に使用するtlr2アゴニストとしての化合物(システインベースのリポペプチド)および組成物
EP2585106A1 (en) 2010-06-25 2013-05-01 Novartis AG Combinations of meningococcal factor h binding proteins
HRP20210242T4 (hr) 2010-08-23 2024-05-10 Wyeth Llc Stabilne formulacije antigena iz bakterije neisseria meningitidis rlp2086
CN103096920B (zh) 2010-09-10 2016-03-23 惠氏有限责任公司 脑膜炎奈瑟球菌orf2086抗原的非脂质化变体
EP2613805B1 (en) 2010-09-10 2019-10-23 GlaxoSmithKline Biologicals SA Meningococcus overexpressing nada and/or nhba and outer membrane vesicles derived therefrom
GB201102090D0 (en) * 2011-02-08 2011-03-23 Univ Sheffield Antigenic polypeptide
CA2846290A1 (en) 2011-08-31 2013-03-07 Children's Hospital & Research Center Oakland Engineered sequences to facilitate expression of antigens in neisseria and methods of use
SA115360586B1 (ar) 2012-03-09 2017-04-12 فايزر انك تركيبات لعلاج الالتهاب السحائي البكتيري وطرق لتحضيرها
BR122016004924A2 (pt) 2012-03-09 2019-07-30 Pfizer Inc. Polipeptídeo isolado e composições imunogênicas compreendendo os mesmos
EP2861247B1 (en) 2012-06-14 2020-12-09 GlaxoSmithKline Biologicals SA Vaccines for serogroup x meningococcus
JP2015524418A (ja) 2012-07-27 2015-08-24 アンスティテュ ナショナル ドゥ ラ サンテ エ ドゥ ラ ルシェルシュ メディカル 血管内皮細胞への髄膜炎菌の線毛媒介接着の受容体としてのcd147
WO2014084432A1 (ko) * 2012-11-30 2014-06-05 경상대학교 산학협력단 헬리코박터 파일로리 발현 벡터
JP6446377B2 (ja) 2013-03-08 2018-12-26 ファイザー・インク 免疫原性融合ポリペプチド
CA2923129C (en) 2013-09-08 2020-06-09 Pfizer Inc. Neisseria meningitidis compositions and methods thereof
RS61246B1 (sr) 2014-02-28 2021-01-29 Glaxosmithkline Biologicals Sa Modifikovani meningokokni fhbp polipeptidi
AU2016221318B2 (en) 2015-02-19 2020-06-25 Pfizer Inc. Neisseria meningitidis compositions and methods thereof
GB201522153D0 (en) 2015-12-15 2016-01-27 Univ Southampton Meningococcal infection and modified neisseria lactamica
US20180064801A1 (en) 2016-09-02 2018-03-08 Glaxosmithkline Biologicals Sa Vaccines for neisseria gonorrhoeae
EP3312192B1 (en) * 2016-10-24 2023-02-22 BiOMVis Srl Immunogenic compositions containing bacterial outer membrane vesicles
AU2018215585B2 (en) 2017-01-31 2022-03-17 Pfizer Inc. Neisseria meningitidis compositions and methods thereof
CN110516550B (zh) * 2019-07-26 2022-07-05 电子科技大学 一种基于fpga的车道线实时检测方法
IL305313A (en) 2021-02-19 2023-10-01 Sanofi Pasteur Recombinant meningococcal B vaccine
GB202208089D0 (en) 2022-06-01 2022-07-13 Glaxosmithkline Biologicals Sa Immunogenic composition
GB202208093D0 (en) 2022-06-01 2022-07-13 Glaxosmithkline Biologicals Sa Immunogenic composition
WO2024030931A1 (en) 2022-08-03 2024-02-08 Sanofi Pasteur Inc. Adjuvanted immunogenic composition against neisseria meningitidis b

Family Cites Families (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4239749A (en) * 1979-09-27 1980-12-16 United States Of America Neisseria gonorrhoeae vaccine
WO1995013796A1 (en) 1993-11-16 1995-05-26 Depotech Corporation Vesicles with controlled release of actives
US5288641A (en) * 1984-06-04 1994-02-22 Arch Development Corporation Herpes Simplex virus as a vector
CA1282721C (en) 1984-06-04 1991-04-09 Bernard Roizman Herpes simplex virus as a vector
EP0273116A3 (en) 1986-10-09 1990-05-02 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Gonococcal and meningococcal polypeptides, vaccines and diagnostics
GB8702816D0 (en) 1987-02-07 1987-03-11 Al Sumidaie A M K Obtaining retrovirus-containing fraction
US5270176A (en) * 1987-11-20 1993-12-14 Hoechst Aktiengesellschaft Method for the selective cleavage of fusion proteins with lysostaphin
CA1340506C (en) * 1987-11-24 1999-04-20 Nicholas H. Carbonetti Production of gonorrheal pi proteins and vaccines
CH684094A5 (de) 1988-03-21 1994-07-15 Viagene Inc Rekombinante Retroviren.
US5591624A (en) * 1988-03-21 1997-01-07 Chiron Viagene, Inc. Retroviral packaging cell lines
US5422120A (en) * 1988-05-30 1995-06-06 Depotech Corporation Heterovesicular liposomes
AP129A (en) 1988-06-03 1991-04-17 Smithkline Biologicals S A Expression of retrovirus gag protein eukaryotic cells
ATE120093T1 (de) 1988-12-19 1995-04-15 Praxis Biolog Inc Meningococcales klasse i-aussenmembranprotein- vakzin.
NL8803111A (nl) 1988-12-19 1990-07-16 Nederlanden Staat Multivalent meningococcen klasse i buitenmembraaneiwit vaccin.
US5703055A (en) * 1989-03-21 1997-12-30 Wisconsin Alumni Research Foundation Generation of antibodies through lipid mediated DNA delivery
DE69032284T2 (de) 1989-03-21 1998-10-08 Vical Inc Expression von exogenen polynukleotidsequenzen in wirbeltieren
GB8919607D0 (en) 1989-08-30 1989-10-11 Wellcome Found Novel entities for cancer therapy
CU22302A1 (es) * 1990-09-07 1995-01-31 Cigb Secuencia nucleotidica codificante para una proteina de la membrana externa de neisseria meningitidis y uso de dicha proteina en preparados vacunales
IE912559A1 (en) 1990-07-19 1992-01-29 Merck & Co Inc The class ii protein of the outer membrane of neisseria¹meningitidis, and vaccines containing same
JPH06500923A (ja) 1990-09-21 1994-01-27 カイロン コーポレイション パッケージング細胞
US5965424A (en) * 1991-01-11 1999-10-12 Boehringer Mannheim Gmbh Methods for making neisseria or hemophilus IgA protease and DNA encoding the proteases
AU1749292A (en) * 1991-03-14 1992-10-21 Imclone Systems Incorporated Recombinant hybrid porin epitopes
FR2681786A1 (fr) 1991-09-27 1993-04-02 Centre Nat Rech Scient Vecteurs recombinants d'origine virale, leur procede d'obtention et leur utilisation pour l'expression de polypeptides dans des cellules musculaires.
IL103059A0 (en) 1991-09-30 1993-02-21 Boehringer Ingelheim Int Conjugates for introducing nucleic acid into higher eucaryotic cells
NZ244306A (en) 1991-09-30 1995-07-26 Boehringer Ingelheim Int Composition for introducing nucleic acid complexes into eucaryotic cells, complex containing nucleic acid and endosomolytic agent, peptide with endosomolytic domain and nucleic acid binding domain and preparation
US6100380A (en) * 1991-10-28 2000-08-08 Cytran, Inc. Immunomodulating peptides and methods of use
WO1993014778A1 (en) 1992-01-23 1993-08-05 Vical, Inc. Ex vivo gene transfer
FR2692592B1 (fr) 1992-06-19 1995-03-31 Pasteur Merieux Serums Vacc Fragments d'ADN codant pour les sous-unités du récepteur de la transferrine de Neisseria meningitidis et procédés les exprimant.
ATE307200T1 (de) * 1992-07-07 2005-11-15 Fuso Pharmaceutical Ind Sonde zur diagnose einer ansteckenden krankheit verursacht durch staphylococcus epidermidis
US6592873B1 (en) 1992-10-30 2003-07-15 Iowa State University Research Foundation, Inc. Polynucleic acids isolated from a porcine reproductive and respiratory syndrome virus (PRRSV) and proteins encoded by the polynucleic acids
EP0647655B1 (en) * 1993-01-23 1998-12-23 Inmunologia Y Genetica Aplicada, S.A. Synthetic peptides and vaccines against parvovirus
US5439808A (en) 1993-07-23 1995-08-08 North American Vaccine, Inc. Method for the high level expression, purification and refolding of the outer membrane group B porin proteins from Neisseria meningitidis
JPH11501203A (ja) * 1993-07-30 1999-02-02 ザ ユニバーシティー オブ ノースカロライナ アット チャペル ヒル 大腸菌およびサルモネラ菌中における淋菌piタンパクおよびワクチンの製造
US5914254A (en) * 1993-08-02 1999-06-22 Celtrix Pharmaceuticals, Inc. Expression of fusion polypeptides transported out of the cytoplasm without leader sequences
US5510264A (en) 1993-09-28 1996-04-23 Insight Biotech Inc. Antibodies which bind meningitis related homologous antigenic sequences
EP0772689B1 (en) 1994-05-09 2007-12-19 Oxford Biomedica (UK) Limited Retroviral vectors having a reduced recombination rate
FR2720408B1 (fr) * 1994-05-31 1996-08-14 Pasteur Merieux Serums Vacc Fragments Tbp2 de Neisseria meningitidis.
US6245337B1 (en) 1994-08-25 2001-06-12 Washington University Haemophilus adherence and penetration proteins
IL117483A (en) 1995-03-17 2008-03-20 Bernard Brodeur MENINGITIDIS NEISSERIA shell protein is resistant to proteinase K.
US5646259A (en) 1995-03-24 1997-07-08 St. Louis University DNA encoding haemophilus adhesion proteins
US6265567B1 (en) 1995-04-07 2001-07-24 University Of North Carolina At Chapel Hill Isolated FrpB nucleic acid molecule
DK0832093T3 (da) * 1995-06-07 2007-01-08 Sanofi Pasteur Inc Udtrykkelse af lipoproteiner
DE19534579C2 (de) 1995-09-18 2000-06-08 Max Planck Gesellschaft Nucleinsäure-Moleküle codierend Proteine, die die Adhäsion von Neisseria-Zellen an humane Zellen vermitteln
CN1211192A (zh) 1995-09-18 1999-03-17 美国陆军医疗材料研究指挥部 生产非共价复合的多价蛋白体亚基疫苗的改进方法
FR2739624B1 (fr) 1995-10-10 1997-12-05 Pasteur Merieux Serums Vacc Nouvelle sous-unite tbp2 de neisseria meningitidis
ZA9610456B (en) * 1995-12-20 1997-06-20 Novo Nordisk As N-terminally extended proteins expressed in yeast
KR19990082265A (ko) 1996-02-01 1999-11-25 다니엘 제이. 압둔-나비 효모중에서 b군 나이세리아 멘인기티디스 외막(mb3)단백질을 발현시키는 방법 및 백신
US6083499A (en) * 1996-04-19 2000-07-04 Mycogen Corporation Pesticidal toxins
US6472518B1 (en) 1996-10-24 2002-10-29 Centers For Disease Control And Prevention, As Represented By The Secretary, Department Of Health And Human Services Invasion associated genes from Neisseria meningitidis serogroup B
US5980898A (en) 1996-11-14 1999-11-09 The United States Of America As Represented By The U.S. Army Medical Research & Material Command Adjuvant for transcutaneous immunization
BR9714160A (pt) 1996-12-20 2000-05-02 Univ Texas Antìgenos uspa1 e uspa2 de moraxella catarrhalis
US6017531A (en) 1997-06-02 2000-01-25 W. R. Grace & Co. Hydrophilic composition containing protease produced by Vibrio
US6583275B1 (en) * 1997-07-02 2003-06-24 Genome Therapeutics Corporation Nucleic acid sequences and expression system relating to Enterococcus faecium for diagnostics and therapeutics
CA2671261A1 (en) 1997-11-06 1999-05-20 Novartis Vaccines And Diagnostics S.R.L. Neisserial antigens
US6914131B1 (en) * 1998-10-09 2005-07-05 Chiron S.R.L. Neisserial antigens
GB9726398D0 (en) * 1997-12-12 1998-02-11 Isis Innovation Polypeptide and coding sequences
ATE446368T1 (de) * 1998-01-14 2009-11-15 Novartis Vaccines & Diagnostic Antigene aus neisseria meningitidis
AU2313199A (en) * 1998-02-03 1999-08-23 Center For Disease Control And Prevention Recombinant lipidated psaa protein, methods of preparation and use
AU739292B2 (en) * 1998-02-11 2001-10-11 Eli Lilly And Company Processes and intermediates useful to make antifolates
GB9808734D0 (en) 1998-04-23 1998-06-24 Smithkline Beecham Biolog Novel compounds
GB9808866D0 (en) 1998-04-24 1998-06-24 Smithkline Beecham Biolog Novel compounds
US6150502A (en) * 1998-04-29 2000-11-21 Genesis Research & Development Corporation Limited Polypeptides expressed in skin cells
US6615024B1 (en) * 1998-05-01 2003-09-02 Arraycomm, Inc. Method and apparatus for determining signatures for calibrating a communication station having an antenna array
US20070026021A1 (en) * 1998-05-01 2007-02-01 Chiron S.R.I. Neisseria meningitidis antigens and compositions
EP2261355A3 (en) * 1998-05-01 2012-01-11 Novartis Vaccines and Diagnostics, Inc. Neisseria meningitidis antigens and compositions
US5990085A (en) * 1998-05-04 1999-11-23 Michigan State University Inhibin-HBc fusion protein
GB9810276D0 (en) 1998-05-13 1998-07-15 Smithkline Beecham Biolog Novel compounds
US6248329B1 (en) * 1998-06-01 2001-06-19 Ramaswamy Chandrashekar Parasitic helminth cuticlin nucleic acid molecules and uses thereof
JP2004511201A (ja) 1998-10-09 2004-04-15 カイロン コーポレイション ナイセリアゲノム配列およびそれらの使用方法
JP2004537954A (ja) 1999-01-15 2004-12-24 グラクソスミスクライン バイオロジカルズ ソシエテ アノニム ナイセリア・メニンギティディス・ポリペプチドbasb052
EP1147194A1 (en) 1999-01-22 2001-10-24 SMITHKLINE BEECHAM BIOLOGICALS s.a. Neisseria meningitidis antigenic polypeptides, corresponding polynucleotides and protective antibodies
GB9902084D0 (en) 1999-01-29 1999-03-24 Smithkline Beecham Biolog Novel compounds
ES2228454T3 (es) * 1999-02-26 2005-04-16 Chiron S.R.L. Mejora de la actividad bacteriana de antigenos de neisseria con oligonucleotidos que contienen motivos cg.
EP1185691B1 (en) 1999-04-30 2009-04-29 Novartis Vaccines and Diagnostics, Inc. Neisseria genomic sequences and methods of their use
DK1228217T3 (da) * 1999-04-30 2013-02-25 Novartis Vaccines & Diagnostic Konserverede neisseria-antigener
CN102580072A (zh) * 1999-05-19 2012-07-18 诺华疫苗和诊断有限公司 组合式奈瑟球菌组合物
GB9911683D0 (en) 1999-05-19 1999-07-21 Chiron Spa Antigenic peptides
GB9916529D0 (en) 1999-07-14 1999-09-15 Chiron Spa Antigenic peptides
CA2864069A1 (en) * 1999-10-29 2001-05-03 Novartis Vaccines And Diagnostics S.R.L. Neisserial antigenic peptides
ATE460484T1 (de) * 1999-11-29 2010-03-15 Novartis Vaccines & Diagnostic 85 kda antigen von neisseria
GB9928676D0 (en) 1999-12-03 2000-02-02 Provalis Uk Ltd Pseudomonas aeruginosa antigens
US20010031268A1 (en) * 1999-12-17 2001-10-18 Baldwin Thomas John Antigen preparations
ES2507100T3 (es) * 2000-01-17 2014-10-14 Novartis Vaccines And Diagnostics S.R.L. Vacuna OMV suplementada contra meningococo
US7947291B2 (en) * 2000-01-25 2011-05-24 The University Of Queensland Modified surface antigen
DK1790660T3 (da) 2000-02-28 2012-09-17 Novartis Vaccines & Diagnostic Heterolog ekspression af Neisseria-proteiner
WO2001081581A2 (en) 2000-04-21 2001-11-01 Corixa Corporation Compositions and methods for the therapy and diagnosis of acne vulgaris
DE60139690D1 (de) 2000-07-03 2009-10-08 Novartis Vaccines & Diagnostic Immunisierung gegen chlamydia pneumoniae
GB0017149D0 (en) 2000-07-12 2000-08-30 Chiron Spa Helicobacter pylori mutants
GB0103170D0 (en) 2001-02-08 2001-03-28 Smithkline Beecham Biolog Vaccine composition
US20040073294A1 (en) * 2002-09-20 2004-04-15 Conor Medsystems, Inc. Method and apparatus for loading a beneficial agent into an expandable medical device
GB0103424D0 (en) * 2001-02-12 2001-03-28 Chiron Spa Gonococcus proteins
RU2323002C2 (ru) 2001-07-26 2008-04-27 Чирон Срл. Вакцины, содержащие алюминиевые адъюванты и гистидин
GB0118249D0 (en) * 2001-07-26 2001-09-19 Chiron Spa Histidine vaccines
GB0121591D0 (en) 2001-09-06 2001-10-24 Chiron Spa Hybrid and tandem expression of neisserial proteins
MXPA04000653A (es) * 2001-07-27 2004-11-22 Chiron Srl Adhesinas de meningococcus nada, app y orf 40.
MX339524B (es) 2001-10-11 2016-05-30 Wyeth Corp Composiciones inmunogenicas novedosas para la prevencion y tratamiento de enfermedad meningococica.
GB0129007D0 (en) * 2001-12-04 2002-01-23 Chiron Spa Adjuvanted antigenic meningococcal compositions
PL399492A1 (pl) * 2002-08-02 2012-11-19 Glaxosmithkline Biologicals S.A. Szczepionka
US7785608B2 (en) * 2002-08-30 2010-08-31 Wyeth Holdings Corporation Immunogenic compositions for the prevention and treatment of meningococcal disease
JP4697706B2 (ja) * 2002-10-11 2011-06-08 ノバルティス ヴァクシンズ アンド ダイアグノスティクス エスアールエル 高毒性髄膜炎菌系統に対する広範な防御のためのポリペプチド−ワクチン
GB0227346D0 (en) * 2002-11-22 2002-12-31 Chiron Spa 741
US20070148729A1 (en) 2003-01-15 2007-06-28 Farley John E Methods for increasing neisseria protein expression and compositions thereof
EP2191844B1 (en) * 2003-01-30 2014-03-05 Novartis AG Injectable vaccines against multiple meningococcal serogroups
CA2522751A1 (en) 2003-04-16 2004-11-04 Wyeth Holdings Corporation Novel immunogenic compositions for the prevention and treatment of meningococcal disease
GB0315021D0 (en) * 2003-06-26 2003-07-30 Chiron Srl Immunogenic gonococcal compositions
CN103405761A (zh) * 2003-10-02 2013-11-27 诺华疫苗和诊断有限公司 多种脑膜炎球菌血清群的液体疫苗
GB0323103D0 (en) * 2003-10-02 2003-11-05 Chiron Srl De-acetylated saccharides
GB0408977D0 (en) * 2004-04-22 2004-05-26 Chiron Srl Immunising against meningococcal serogroup Y using proteins
GB0409748D0 (en) * 2004-04-30 2004-06-09 Chiron Srl Lactoferrin cleavage
GB0410866D0 (en) * 2004-05-14 2004-06-16 Chiron Srl Haemophilius influenzae
GB0419408D0 (en) 2004-09-01 2004-10-06 Chiron Srl 741 chimeric polypeptides
US9034345B2 (en) 2005-01-27 2015-05-19 Children's Hospital & Research Center Oakland GNA1870-based vesicle vaccines for broad spectrum protection against diseases caused by Neisseria meningitidis
GB0524066D0 (en) 2005-11-25 2006-01-04 Chiron Srl 741 ii
PT2004225E (pt) 2006-03-22 2012-05-30 Novartis Ag Regimes para imunização com conjugados meningocócicos
TW200806315A (en) 2006-04-26 2008-02-01 Wyeth Corp Novel formulations which stabilize and inhibit precipitation of immunogenic compositions
NZ573931A (en) * 2006-06-29 2012-03-30 Craig J Venter Inst Inc Polypeptides from neisseria meningitidis
AR064642A1 (es) * 2006-12-22 2009-04-15 Wyeth Corp Polinucleotido vector que lo comprende celula recombinante que comprende el vector polipeptido , anticuerpo , composicion que comprende el polinucleotido , vector , celula recombinante polipeptido o anticuerpo , uso de la composicion y metodo para preparar la composicion misma y preparar una composi
US20100150912A1 (en) 2007-04-11 2010-06-17 Novartis Ag Blocking interaction between pathogen factors and factor h to inhibit hemorrhagic syndromes
RU2009149359A (ru) 2007-06-04 2011-07-20 Новартис АГ (CH) Состав вакцин против менингита
US9579372B2 (en) 2008-02-21 2017-02-28 Glaxosmithkline Biologicals Sa Meningococcal fHBP polypeptides
CA2716706C (en) * 2008-03-03 2014-02-18 Irm Llc Compounds and compositions as tlr activity modulators
EP2631245A1 (en) 2008-03-10 2013-08-28 Children's Hospital & Research Center at Oakland Chimeric factor H binding proteins (fHBP) containing a heterologous B domain and methods of use
EP2331562A4 (en) 2008-09-03 2012-07-04 Childrens Hosp & Res Ct Oak PEPTIDES WITH AN EPITOPE OF A DOMAIN OF THE FACTOR H-BINDING PROTEIN AND METHOD OF USE
IT1394288B1 (it) 2008-09-12 2012-06-06 Novartis Vaccines & Diagnostic Immunogeni di proteine che legano il fattore h.
GB0819633D0 (en) 2008-10-25 2008-12-03 Isis Innovation Composition
EP2411048B1 (en) * 2009-03-24 2020-05-06 GlaxoSmithKline Biologicals SA Adjuvanting meningococcal factor h binding protein
AU2011295853A1 (en) * 2010-09-01 2013-04-04 Irm Llc Adsorption of immunopotentiators to insoluble metal salts
EP2612148B1 (en) * 2010-09-04 2019-06-12 GlaxoSmithKline Biologicals SA Bactericidal antibody assays to assess immunogenicity and potency of meningococcal capsular saccharide vaccines
EP2613805B1 (en) * 2010-09-10 2019-10-23 GlaxoSmithKline Biologicals SA Meningococcus overexpressing nada and/or nhba and outer membrane vesicles derived therefrom
EP3912619A1 (en) * 2011-05-11 2021-11-24 Children's Medical Center Corporation Modified biotin-binding protein, fusion proteins thereof and applications
US9184727B2 (en) * 2012-06-11 2015-11-10 Phonon Corporation SAW device and method for post-seal frequency trimming

Also Published As

Publication number Publication date
US20040110670A1 (en) 2004-06-10
DK2270030T3 (da) 2012-08-13
AU2001239488B2 (en) 2006-01-19
CN1800385B (zh) 2010-06-02
CA2875231A1 (en) 2001-09-07
ES2391153T3 (es) 2012-11-22
EP1790660A3 (en) 2007-10-31
EP2270030A3 (en) 2011-02-02
CA2400562A1 (en) 2001-09-07
ATE387502T1 (de) 2008-03-15
CY1111591T1 (el) 2015-10-07
AU3948801A (en) 2001-09-12
CA2744921A1 (en) 2001-09-07
ES2281409T3 (es) 2007-10-01
MXPA02008314A (es) 2002-12-09
NZ521531A (en) 2005-12-23
EP1790660B1 (en) 2012-06-20
CY1107447T1 (el) 2012-12-19
JP4846160B2 (ja) 2011-12-28
JP2003525049A (ja) 2003-08-26
CN1508253A (zh) 2004-06-30
PT2270030E (pt) 2012-07-24
ES2360746T9 (es) 2012-02-13
US20140363462A1 (en) 2014-12-11
US8114960B2 (en) 2012-02-14
WO2001064922A3 (en) 2001-12-06
DE60132978T2 (de) 2009-02-26
JP2011083287A (ja) 2011-04-28
DE60132978D1 (de) 2008-04-10
DE60144353D1 (de) 2011-05-12
CA2400570A1 (en) 2001-09-07
NZ521396A (en) 2004-06-25
HK1064120A1 (en) 2005-01-21
EP2270030B1 (en) 2012-05-23
HK1056197A1 (en) 2004-02-06
CN1800385A (zh) 2006-07-12
JP2003525050A (ja) 2003-08-26
PT1947187E (pt) 2011-07-04
HK1055993A1 (en) 2004-01-30
US20170080077A1 (en) 2017-03-23
EP1259627B1 (en) 2007-01-24
EP1947187B9 (en) 2011-09-21
BR0108711A (pt) 2004-06-22
EP1947187B1 (en) 2011-03-30
ATE352631T1 (de) 2007-02-15
DE60126249D1 (de) 2007-03-15
CN100473663C (zh) 2009-04-01
CY1113477T1 (el) 2016-06-22
JP2016128520A (ja) 2016-07-14
EP1261723B1 (en) 2008-02-27
ES2386534T3 (es) 2012-08-22
JP5941027B2 (ja) 2016-06-29
ATE503837T1 (de) 2011-04-15
CA2689666C (en) 2015-02-24
JP5346004B2 (ja) 2013-11-20
CA2400562C (en) 2011-09-20
EP2270031A3 (en) 2011-02-16
LU92240I2 (fr) 2013-09-04
WO2001064920A3 (en) 2002-03-14
ES2299476T3 (es) 2008-06-01
US20060051840A1 (en) 2006-03-09
US8703914B2 (en) 2014-04-22
RU2304617C2 (ru) 2007-08-20
CN100339482C (zh) 2007-09-26
CY2013025I1 (el) 2015-11-04
PT1261723E (pt) 2008-06-05
CN101906413A (zh) 2010-12-08
CY1113032T1 (el) 2016-04-13
NL300605I2 (pt) 2016-09-22
CY1106532T1 (el) 2012-01-25
DK1261723T3 (da) 2008-06-23
CA2400570C (en) 2010-04-27
RU2002125880A (ru) 2004-03-10
US20040092711A1 (en) 2004-05-13
HK1071147A1 (en) 2005-07-08
JP2013005816A (ja) 2013-01-10
RU2002125882A (ru) 2004-03-10
US20140294885A1 (en) 2014-10-02
RU2299906C2 (ru) 2007-05-27
US20130005667A1 (en) 2013-01-03
MXPA02008313A (es) 2002-12-09
DK1947187T3 (da) 2011-05-09
JP2014000092A (ja) 2014-01-09
WO2001064922A2 (en) 2001-09-07
EP1259627A2 (en) 2002-11-27
JP2011101657A (ja) 2011-05-26
CN1544462A (zh) 2004-11-10
AU2001239478B2 (en) 2007-05-17
CN101139590A (zh) 2008-03-12
CY2013025I2 (el) 2015-11-04
CA2689666A1 (en) 2001-09-07
US7803387B2 (en) 2010-09-28
WO2001064920A2 (en) 2001-09-07
JP2014121333A (ja) 2014-07-03
CN1426471A (zh) 2003-06-25
CN100334214C (zh) 2007-08-29
EP1261723A2 (en) 2002-12-04
DE60126249T2 (de) 2008-05-29
CN1426473A (zh) 2003-06-25
DK1790660T3 (da) 2012-09-17
JP4763210B2 (ja) 2011-08-31
CN101139590B (zh) 2012-07-18
DK1947187T5 (da) 2011-10-24
US9267163B2 (en) 2016-02-23
ES2360746T3 (es) 2011-06-08
EP1790660A2 (en) 2007-05-30
AU3947801A (en) 2001-09-12
US20170080076A1 (en) 2017-03-23
EP1947187A1 (en) 2008-07-23
EP2270031A2 (en) 2011-01-05
CA2744921C (en) 2014-05-13
US20100267931A1 (en) 2010-10-21
EP2270030A2 (en) 2011-01-05
US9150898B2 (en) 2015-10-06
CN1201011C (zh) 2005-05-11
BR0108713A (pt) 2004-06-22

Similar Documents

Publication Publication Date Title
US9150898B2 (en) Heterologous expression of Neisserial proteins
AU2001239488A1 (en) Heterologous expression of neisserial proteins