BR112020007413A2 - Vetores adenovirais com dois cassetes de expressão - Google Patents

Vetores adenovirais com dois cassetes de expressão Download PDF

Info

Publication number
BR112020007413A2
BR112020007413A2 BR112020007413-6A BR112020007413A BR112020007413A2 BR 112020007413 A2 BR112020007413 A2 BR 112020007413A2 BR 112020007413 A BR112020007413 A BR 112020007413A BR 112020007413 A2 BR112020007413 A2 BR 112020007413A2
Authority
BR
Brazil
Prior art keywords
vector
adenoviral vector
fact
simian adenoviral
chad155
Prior art date
Application number
BR112020007413-6A
Other languages
English (en)
Inventor
Stefano Colloca
Original Assignee
Glaxosmithkline Biologicals S.A.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glaxosmithkline Biologicals S.A. filed Critical Glaxosmithkline Biologicals S.A.
Publication of BR112020007413A2 publication Critical patent/BR112020007413A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N7/00Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/235Adenoviridae
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10334Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10342Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/16011Herpesviridae
    • C12N2710/16111Cytomegalovirus, e.g. human herpesvirus 5
    • C12N2710/16121Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/18011Paramyxoviridae
    • C12N2760/18511Pneumovirus, e.g. human respiratory syncytial virus
    • C12N2760/18534Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2760/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses negative-sense
    • C12N2760/00011Details
    • C12N2760/20011Rhabdoviridae
    • C12N2760/20111Lyssavirus, e.g. rabies virus
    • C12N2760/20134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/48Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Virology (AREA)
  • Medicinal Chemistry (AREA)
  • Immunology (AREA)
  • Biochemistry (AREA)
  • Mycology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Molecular Biology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

a presente invenção refere-se a um vetor adenoviral símio que compreende dois cassetes de expressão, em que cada cassete de expressão compreende um transgene e um promotor, e em que o primeiro cassete de expressão é inserido na região e1 do vetor adenoviral símio e o segundo cassete de expressão é inserido em uma região do vetor adenoviral compatível com a replicação do vetor.

Description

Relatório Descritivo da Patente de Invenção para “VETO- RES ADENOVIRAIS COM DOIS CASSETES DE EXPRESSÃO”.
LISTAGEM DE SEQUÊNCIAS
[001] O presente pedido de patente contém uma listagem de se- quências que foi submetida eletronicamente no formato ASCII e é incor- porada por referência em sua totalidade. A dita cópia ASCII, criada em 11 de outubro de 2018, é denominada VUG66441A WO SL.txt e tem
178.926 bytes de tamanho.
CAMPO DA INVENÇÃO
[002] Esta invenção está no campo de vetores adenovirais recom- binantes. A invenção refere-se a um vetor adenoviral compreendendo dois cassetes de expressão. Em particular, a invenção refere-se a um adenovírus símio como um adenovírus de chimpanzé compreendendo dois cassetes de expressão.
ANTECEDENTES DA INVENÇÃO
[003] Os adenovírus recombinantes são úteis na terapia genética e como vacinas.
[004] Os adenovírus humanos têm sido amplamente utilizados para aplicações de transferência de genes devido à sua grande capaci- dade transgênica e capacidade de obter transferência de genes alta- mente eficiente em uma variedade de tecidos alvo.
[005] No entanto, a maioria dos seres humanos é exposta e de- senvolve imunidade aos adenovírus humanos. Portanto, há uma de- manda por vetores que efetivamente entregam moléculas a um alvo e minimizam o efeito da imunidade preexistente aos sorotipos de adeno- vírus humano. Os adenovírus símios são eficazes nesse sentido; estão suficientemente relacionados aos vírus humanos para serem eficazes na indução de imunidade a antígenos exógenos entregues aos quais os seres humanos têm pouca ou nenhuma imunidade preexistente. Por- tanto, vetores virais baseados em adenovírus símios podem fornecer uma alternativa ao uso de vetores adenovirais derivados de seres hu- manos para o desenvolvimento de vacinas baseadas em ácidos nuclei- cos.
[006] Os adenovírus com defeito de replicação entregam seu ge- noma no interior de uma célula e, por não se replicarem, não amplificam a carga útil do transgene. Tipicamente, o gene E1 é substituído por um cassete de transgene compreendendo um promotor de escolha e uma sequência de ácidos nucleicos correspondente a um gene ou genes de interesse, resultando em um vírus recombinante com defeito de replica- ção.
[007] Há uma necessidade na técnica de adenovírus recombinan- tes melhorados.
SUMÁRIO DA INVENÇÃO
[008] A presente invenção refere-se a um vetor adenoviral símio compreendendo dois cassetes de expressão. Em particular, a invenção refere-se a um adenovírus símio como um adenovírus de chimpanzé compreendendo dois cassetes de expressão. Exemplos de adenovírus de chimpanzé adequados incluem ChAd155 e ChAd83.
[009] Os vetores adenovirais da invenção são úteis como compo- nentes de composições imunogênicas para a indução de uma resposta imune em um indivíduo, métodos para sua utilização no tratamento e processos para a produção.
[0010] O termo “vetor” refere-se a um agente (como um plasmídeo ou vírus) que contém ou transporta material genético e pode ser usado para introduzir genes exógenos em um organismo. O vetor adenoviral da presente invenção é derivado de um adenovírus símio não humano, também conhecido como “adenovírus símio”. De preferência, o vetor adenoviral símio da presente invenção é um adenovírus símio.
[0011] Cada cassete de expressão no vetor adenoviral da invenção compreende um transgene e um promotor. Um “transgene” é uma se- quência de ácidos nucleicos, heteróloga às sequências de vetores que flanqueiam o transgene, que codifica um polipeptídeo de interesse. À sequência de codificação de ácidos nucleicos está operacionalmente li- gada a componentes reguladores de uma maneira que permite a trans- crição, tradução e/ou expressão de transgene em uma célula hospe- deira. Um “promotor” é uma sequência nucleotídica que permite a liga- ção da RNA polimerase e direciona a transcrição de um gene. Tipica- mente, um promotor está localizado em uma região não codificante de um gene, proximal ao sítio de início da transcrição.
[0012] Nos vetores adenovirais da invenção, o primeiro cassete de expressão é inserido na região E1 do vírus e o segundo cassete de ex- pressão é inserido em uma segunda região do vetor adenoviral.
[0013] Em um vetor adenoviral símio compreendendo dois cassetes de expressão da invenção, o primeiro cassete de expressão é inserido na região E1 do vetor adenoviral símio e o segundo cassete de expres- são é inserido em uma região do vetor adenoviral que é compatível com a replicação do vetor. Uma região do genoma do vetor adenoviral é con- siderada “compatível com a replicação do vetor” se a interrupção dessa região não afetar a capacidade do vetor adenoviral de se replicar.
[0014] De preferência, nos vetores adenovirais da invenção, o pri- meiro cassete de expressão é inserido na região E1 do vírus, e o se- gundo cassete de expressão é inserido na região E3, HE1 ou HE2 do vetor adenoviral. Como é bem conhecido na técnica, os genes E3 são expressos na fase inicial da transdução para preparar a célula hospe- deira para replicação viral. E3 está envolvido na modulação imunoló- gica. O termo “HE1” é usado para descrever um sítio localizado entre os códons de parada de L5 e E4. O termo “HE2” foi utilizado para definir um sítio localizado entre a extremidade da ITR e o sítio de terminação do mRNA de E4.
[0015] Por exemplo, em um vetor de adenovírus ChAd155: U HE1 ChAd155: sítio de inserção entre os pb 34611 e 34612 da SEQ ID NO: 1. .º HE2 ChAd155: sítio de inserção entre os pb 37662 e 37663 da SEQ |D NO: 1.
[0016] Em outro exemplo, em um vetor de adenovírus ChAd83: .º HE1 ChAd83: sítio de inserção entre os pb 33535 e 33536 da SEQ ID NO: 2. U HE2 ChAd83: sítio de inserção entre os pb 36387 e 36388 da SEQ ID NO: 2.
[0017] À medida que o primeiro cassete de expressão é inserido na região E1 do vetor adenoviral, a região E1 nativa é deletada. A fim de aumentar a capacidade de clonagem do vetor, a região E3 nativa pode ser removida do vetor adenoviral. A região E3 nativa pode ser excluída do vetor adenoviral nas modalidades da invenção em que o segundo cassete de expressão é inserido na região E3, ou nas modalidades em que o segundo cassete de expressão não é inserido na região E3. À inserção no sítio HE1 ou HE2 não requer deleção de nenhuma sequên- cia específica da cadeia principal do vetor.
[0018] De preferência, o segundo cassete de expressão é inserido na região HE1 ou HE2 do vetor adenoviral. Com a máxima preferência, o segundo cassete de expressão é inserido na região HE2 do vetor ade- noviral. Em uma modalidade, a região E3 nativa é excluída do vetor ade- noviral para aumentar a capacidade de clonagem do vetor e o segundo cassete de expressão é inserido na região HE1 ou HE2 do vetor adeno- viral.
[0019] Nas modalidades da invenção, o primeiro cassete de expres- são do vetor adenoviral pode compreender um CMV humano ou um pro- motor de CMV humano aprimorado e/ou o segundo cassete de expres-
são pode compreender um CMV humano ou um promotor de CMV hu- mano aprimorado.
[0020] Em uma modalidade preferencial, o primeiro e o segundo cassete de expressão compreendem diferentes promotores. Por exem- plo, em uma modalidade, o primeiro cassete de expressão pode com- preender um promotor de CMV humano e o segundo cassete de expres- são, um promotor de CMV humano aprimorado (ou vice-versa).
[0021] Em um aspecto da invenção, é fornecido um vetor adenoviral da invenção, em que o primeiro cassete de expressão é inserido na re- gião E1 do vírus, e o segundo cassete de expressão é inserido em uma região do vetor adenoviral que é compatível com replicação de vetor, em que pelo menos um do primeiro e do segundo cassete de expressão compreende um promotor de CMV aprimorado. Em algumas modalida- des, o promotor de hCMV aprimorado pode incluir uma sequência de ácidos nucleicos tendo pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou mais, de identidade de se- quência com a SEQ ID NO: 6. Em algumas modalidades, o promotor compreende ou consiste em uma sequência de ácidos nucleicos da SEQ ID NO: 6.
[0022] Os vetores adenovirais da invenção são derivados de um ve- tor adenoviral símio, por exemplo, de chimpanzés (Pan troglodytes), bonobos (Pan paniscus), gorilas (Gorilla gorilla) e orangotangos (Pongo abelii e Pongo pygnaeus). Os adenovírus de chimpanzé incluem, mas não são limitados a AdY25, ChAd3, ChAd19, ChAd25.2, ChAd26, ChAd27, ChAd29, ChAd30, ChAd31, ChAd32, ChAd33, ChAd34, ChAd35, ChAd37, ChAd38, ChAd39, ChAd40, ChAd63, ChAdê83, ChAd155, ChAd15, SadV41, sAd4310A, sAd4312, SAdV31, SAdV- A1337, ChAdOx1, ChAdOx2 e ChAd157. De preferência, o vetor ade- noviral símio da invenção é um vetor de adenovírus ChAd83 ou
ChAd155, com mais preferência, um vetor de adenovírus ChAd155.
[0023] De preferência, o vetor adenoviral da invenção tem uma so- roprevalência inferior a 30%, de preferência, menor que 10% em indiví- duos humanos e, com mais preferência, nenhuma soroprevalência em indivíduos humanos.
[0024] Em uma modalidade preferencial, o vetor adenoviral símio da invenção é capaz de infectar uma célula de mamífero.
[0025] Em uma modalidade, o primeiro e o segundo cassete de ex- pressão do vetor adenoviral da invenção compreendem transgenes do vírus sincicial respiratório (RSV). Por exemplo, em uma modalidade, um dos cassetes de expressão compreende um antígeno RSV F e o outro cassete de expressão compreende os antígenos RSV M e N. Em tais modalidades, o vetor codifica preferencialmente um antígeno RSV FOATM (proteína de fusão (F) deletada das regiões transmembrana e citoplasmática) e antígenos RSV M2-1 (anti-terminação da transcrição) e N (nucleocapsídeo).
[0026] A presente invenção também fornece uma composição com- preendendo um vetor adenoviral símio e um excipiente farmaceutica- mente aceitável.
[0027] Além disso, a presente invenção fornece um vetor adenoviral símio ou composição compreendendo esse vetor adenoviral para uso como medicamento, vacina e/ou para terapia ou profilaxia de uma do- ença.
[0028] A invenção também fornece um método para induzir uma resposta imune em um indivíduo, compreendendo a administração do vetor ou composição adenoviral símia ao indivíduo.
DESCRIÇÃO DAS FIGURAS
[0029] Figura 1: Construtos adenovirais símios com um cassete de expressão único. Repetições terminais invertidas (ITR) flanqueiam as extremidades 3' e 50; E1 é o primeiro gene 1; CMV é o promotor do citomegalovírus; CASI é o promotor CASI, RG é um antígeno modelo, WPRE é o Elemento Regulador Pós-Transcricional de Hepatite da Mar- mota, AE3 indica que o gene 3 inicial é excluído; fibra representa o gene adenoviral que codifica a proteína da fibra e E4 é o gene inicial 4.
[0030] Três vetores adenovirais símios diferentes são mostrados na Figura 1. O vetor da Figura 1(i) foi construído inserindo um cassete de expressão de transgene no local da região E3 do genoma adenoviral (“RC1”) (painel superior), o vetor da Figura 1(ii) foi formado pela inser- ção de um cassete de expressão de transgene na região HE1, isto é, entre os códons de parada do gene da fibra e da região E4 (“RC3”) (pai- nel intermediário) e o vetor da Figura 1(iii) foi feito pela inserção de um cassete de expressão de transgene na região HE2, isto é, entre a extre- midade da ITR e o sítio de terminação do mMRNA de E4 (“RC2”) (painel inferior).
[0031] Figura 2A: Produção de ChAd155 e ChAd83 com cassete de transgene inserido nos sítios E3 e HE2 (vetores RC1 e RC2 da Figura 1) em uma linhagem celular humana primária.
[0032] Figura 2B: Produção de ChAd83 com cassete de transgene inserido em E3, HE1 e HE2 (vetores RC1, RC2 e RC3 da Figura 1) em uma linhagem celular MRC5 humana dois e sete dias após a infecção. As células foram infectadas nas multiplicidades de infecção de 250 e
1250.
[0033] Figura 3A: Número total de cópias do genoma viral do vetor RC1 e RC2 (ChAd155 e ChAd83) da Figura 1 em uma linhagem celular humana primária.
[0034] Figura 3B: Número total de cópias do genoma viral das ver- sões RC1, RC2 e RC3 do vetor ChAd83 da Figura 1 em uma linhagem celular MRC5 humana dois e sete dias após a infecção. As células foram infectadas nas multiplicidades de infecção de 250 e 1250.
[0035] Figura 4: Número total de cópias do genoma viral dos vetores
ChAd155 RC1 e RC2 e ChAd83 RC1 e RC2 da Figura 1 em uma linha- gem de células murinas (Figura 4(a), painel superior) e em uma linha- gem de células de primatas não humanos (Figura 4(b), painel inferior). As células foram infectadas em multiplicidades de infecção de 50 e 250.
[0036] Figura 5: Comparação dos níveis de expressão dos vetores ChAd155 RC1 e RC2 que expressam um modelo de transgene de gli- coproteína da raiva (RG) em uma linhagem de células murinas, demons- trada por western blot dois e cinco dias após a infecção (Figura 5(a), painel superior). Comparação dos níveis de expressão dos vetores ChAd155 RC1 e RC2 com os vetores ChAd83 RC1 e RC2 que expres- sam um modelo de transgene de glicoproteína da raiva (RG) em uma linhagem de células murinas, demonstrada por western blot dois e cinco dias após a infecção (Figura 5(b), painel inferior). As células foram in- fectadas em multiplicidades de infecção de 50, 250 e 1250.
[0037] Figura 5(c): Comparação dos níveis de expressão dos veto- res ChAd83 RC1, RC2 e RC3 que expressam um modelo de transgene de glicoproteína da raiva (RG) em uma linhagem celular humana MRC5, demonstrada por western blot dois e sete dias após a infecção. As cé- lulas foram infectadas em multiplicidades de infecção de 250 e 1250.
[0038] Figura 6: Outro construto adenoviral símio com um cassete de expressão único. Repetições terminais invertidas (ITR) flanqueiam as extremidades 3' e 51; o CMV humano (hCMV) é o promotor do cito- megalovírus; FATM (FODTM) e N.M2-1 são antígenos de RSV; 2A é uma sequência de ligação de autoclivagem; 4E4 indica que o gene ini- cial 4 é deletado; fibra representa o gene adenoviral que codifica a pro- teína da fibra. No vetor da Figura 6, o cassete de expressão do trans- gene é inserido no local da região E1 do genoma adenoviral.
[0039] Figura 7: Um construto adenoviral símio de acordo com a in- venção com um cassete de expressão duplo. Repetições terminais in- vertidas (ITR) flanqueiam as extremidades 3' e 5; o CMV humano
(hOMV) é o promotor do citomegalovírus; o hncCMV aprimorado é o pro- motor de citomegalovírus aprimorado; N-M2-1 e FATM (FODTM) são os antígenos de RSV; WPRE é o elemento regulador pós-transcricional da hepatite da marmota; AE3 indica que o gene 3 inicial é deletado; fibra representa o gene adenoviral que codifica a proteína da fibra; e Ad5E4orf6 em um substituto na região inicial do gene 4 (E4).
[0040] O vetor da Figura 7 foi construído inserindo um primeiro cas- sete de expressão de transgene no local da região E1 do genoma ade- noviral e um segundo cassete de expressão de transgene na região HE2, isto é, a jusante da ITR direita.
[0041] Figura 8: Comparação dos níveis de expressão de vetores que expressam o transgene FOTM em uma linhagem celular MRC5, de- monstrada por western blot 48 horas e 96 horas após a infecção em condições não redutoras. As células foram infectadas em multiplicida- des de infecção de 500 e 1250.
[0042] Figura 9: Comparação dos níveis de expressão de vetores que expressam o transgene NM2-1 em uma linhagem celular MRC5, demonstrada por western blot 48 horas após a infecção em condições redutoras. As células foram infectadas em multiplicidades de infecção de 250 e 1250.
[0043] Figura 10: Comparação da imunogenicidade dos vetores ChAd155 que expressam o antígeno RSV FOTM (FATm). Os dados fo- ram coletados 4 semanas e 8 semanas após a vacinação com uma dose de 5x10º partículas de vírus.
[0044] Figura 11: Comparação da imunogenicidade dos vetores ChAd155 que expressam o antígeno RSV M2. Os dados foram coleta- dos 3 semanas após a vacinação com uma dose de 107 ou 10º partícu- las de vírus.
[0045] Figura 12A e 12B: Ilustram os resultados do experimento do Exemplo 9 para investigar as respostas de células T do pulmão a partir de vetores ChAd155. A Figura 12A mostra a resposta CD4+ e a Figura 12B mostra a resposta CD8+.
[0046] Figuras 13A e 13B: Mostram os resultados do experimento do Exemplo 9 para investigar as respostas de células T periféricas dos vetores ChAd155. A Figura 13A mostra a resposta PBMC CD4+ e a Fi- gura 13B mostra a resposta PBMC CD8+.
[0047] Figuras 14A e 14B: Mostram também os resultados do Exemplo 9. A Figura 14A mostra os títulos de Ab neutralizantes do RSV e a Figura 14B ilustra a razão do nAb do dia D90 para DO.
[0048] A Figura 15A, 15B e 15C: Mostram os resultados do experi- mento de imunogenicidade do Exemplo 10.
[0049] Figura 16A e 16B: Western blots obtidos utilizando a expres- são em células HeLa dos vetores no Exemplo 11.
[0050] Figura 17: Ilustra os resultados do experimento de CRPV do Exemplo 12.
[0051] Figura 18: Mostra os resultados da caracterização do vetor de cassete duplo de HPV do Exemplo 13.
ANOTAÇÃO DAS SEQUÊNCIAS SEQ ID NO: 1 - Sequência polinucleotídica que codifica ChAd155 sel- vagem SEQ ID NO: 2 - Sequência polinucleotídica que codifica ChAd83 selva- gem SEQ ID NO: 3 - Sequência polinucleotídica que codifica o promotor
CASI SEQ ID NO: 4 - Sequência de polinucleotídeos que codifica ChAd155/RSV SEQ ID NO: 5 - Sequência de aminoácidos RSV FOATM-N-M2-1 SEQ ID NO: 6 - Sequência polinucleotídica que codifica o promotor de hCMV aprimorado SEQ1ID NO: 7 - Sequência polinucleotídica que codifica o cassete hcMV
NM?2 bghpolyA SEQ ID NO: 8 - Sequência de aminoácidos (proteína) NM2 SEQ ID NO: 9 - Sequência polinucleotídica que codifica o cassete hCMV FO WPRE bghpolyA SEQ ID NO: 10 - Sequência de aminoácidos (proteína) FO SEQ ID NO: 11 - Sequência de aminoácidos de um ligante flexível SEQ ID NO: 12 - Sequência de aminoácidos de um ligante flexível
DESCRIÇÃO DETALHADA DA INVENÇÃO Adenovírus
[0052] Os adenovírus são vírus icosaédricos não envelopados com um genoma linear de DNA de fita dupla de aproximadamente 36 kb. Os adenovírus podem transduzir numerosos tipos de células de várias es- pécies de mamíferos, incluindo células que se dividem e que não se dividem, sem se integrar ao genoma da célula hospedeira. Eles têm sido amplamente utilizados para aplicações de transferência de genes de- vido à sua segurança comprovada, capacidade de obter transferência de genes altamente eficiente em uma variedade de tecidos alvo e grande capacidade de transgene. Atualmente, os vetores adenovirais humanos são usados em terapia gênica e vacinas, mas têm a desvan- tagem de uma alta prevalência mundial de imunidade preexistente, após exposição prévia a adenovírus humanos comuns.
[0053] Os adenovírus têm uma morfologia característica com um capsídeo icosaédrico compreendendo três proteínas principais, hexônio (Il), base pentônio (Ill) e uma fibra com uma protuberância (IV), junta- mente com várias outras proteínas menores, VI, VIII, IX, Illa e IVa2. O hexônio é responsável pela maioria dos componentes estruturais do capsídeo, que consiste em 240 capsômeros de hexônio triméricos e 12 bases pentônio. O hexônio possui três tambores duplos conservados e o topo tem três torres, cada torre contendo uma alça de cada subuni-
dade que forma a maior parte do capsídeo. A base do hexônio é alta- mente conservada entre os sorotipos adenovirais, enquanto as alças de superfície são variáveis. O pentônio é outra proteína do capsídeo ade- noviral; forma uma base pentamérica à qual a fibra se liga. A proteína da fibra trimérica se projeta da base de pentônio em cada um dos 12 vértices do capsídeo e é uma estrutura em forma de bastão. O papel principal da proteína da fibra é fixar o capsídeo viral à superfície celular através da interação da região da protuberância com um receptor celu- lar. Variações no eixo flexível, bem como nas regiões das protuberân- cias das fibras, são características dos diferentes sorotipos adenovirais.
[0054] O genoma adenoviral foi bem caracterizado. O DNA linear de dupla fita está associado à proteína VII altamente básica e a um pe- queno peptídeo pX (também denominado mu). Outra proteína, V, é em- pacotada com este complexo de DNA-proteína e fornece uma ligação estrutural ao capsídeo via proteína VI. Existe uma conservação geral na organização geral do genoma adenoviral em relação a quadros de lei- tura aberta específicos posicionados de maneira similar, por exemplo, a localização dos genes E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 e L5 de cada vírus. Cada extremidade do genoma adenoviral compreende uma sequência conhecida como repetição terminal invertida (ITR), ne- cessária para a replicação viral. A extremidade 5' do genoma adenoviral contém os elementos cis 5' necessários para o empacotamento e repli- cação; isto é, as sequências 5' ITR (que podem funcionar como origens da replicação) e os domínios aprimoradores nativos de empacotamento 5', que contêm sequências necessárias para empacotar genomas ade- novirais lineares e elementos potencializadores para o promotor E1. À extremidade 3' do genoma adenoviral inclui elementos cis 3', incluindo as ITRs, necessárias para o empacotamento e encapsidação. O vírus também compreende uma protease codificada por vírus, necessária para processar algumas das proteínas estruturais necessárias para pro- duzir vírions infecciosos.
[0055] A estrutura do genoma adenoviral é descrita com base na ordem em que os genes virais são expressos após a transdução das células hospedeiras. Mais especificamente, os genes virais são referi- dos como genes precoces (E) ou tardios (L), de acordo com se a trans- crição ocorre antes ou após o início da replicação do DNA. Na fase ini- cial da transdução, os genes E1A, E1B, E2A, E2B, E3 e E4 do adeno- vírus são expressos para preparar a célula hospedeira para replicação viral. O gene E1 é considerado uma chave principal, atua como um ati- vador da transcrição e está envolvido na transcrição gênica precoce e tardia. E2 está envolvido na replicação do DNA; E3 está envolvido na modulação imune e E4 regula o metabolismo do RNAm viral. Durante a fase tardia da infecção, a expressão dos genes tardios L1 a L5, que codificam os componentes estruturais das partículas virais, é ativada. Os genes tardios são transcritos do Promotor Tardio Principal (MLP) com splicing alternativo.
[0056] Os sítios HE1 e HE2 foram identificados como sítios de in- serção em potencial para um transgene, pois a inserção nesses pontos específicos não interrompe as sequências de codificação ou sequências de regulação importantes de um adenovírus de chimpanzé, como um adenovírus de chimpanzé Tipo C ou E, por exemplo, ChAd155 e ChAd83. Os sítios HE1 e HE2 podem ser identificados por alinhamento de sequência em qualquer adenovírus de chimpanzé. Portanto, a clona- gem de cassetes de expressão nos sítios HE1 e HE2 dos genomas ChAd não afeta o ciclo de replicação do vírus. Replicação adenoviral
[0057] Historicamente, o desenvolvimento da vacina contra adeno- vírus se concentrou em vetores com defeito e não replicantes. Eles são tornados defeituosos na replicação por deleção dos genes da região E1,
que são essenciais para a replicação. Normalmente, os genes da região E3 não essenciais também são deletados para abrir espaço para trans- genes exógenos. Um cassete de expressão compreendendo o trans- gene sob o controle de um promotor exógeno é então inserido. Esses vírus com defeito de replicação são produzidos em células que comple- mentam a E1.
[0058] O termo “adenovírus com defeito de replicação” ou “incom- petente de replicação” refere-se a um adenovírus que é incapaz de re- plicação porque foi projetado para compreender pelo menos uma dele- ção funcional (ou mutação de “perda de função”), ou seja, uma deleção ou mutação que prejudique a função de um gene sem removê-lo com- pletamente, por exemplo, introdução de códons artificiais de parada, de- leção ou mutação de sítios ativos ou domínios de interação, mutação ou deleção de uma sequência reguladora de um gene etc., ou uma remo- ção completa de um gene codificando um produto genético essencial à replicação viral, como um ou mais genes adenovirais selecionados de E1A, E1B, E2A, E2B, E3 e E4 (como E3 ORF1, E3 ORF2, E3 ORF3, E3 ORFA4, E3 ORF5, E3 ORF6, E3 ORF7, E3 ORF8, E3 ORF9, E4 ORF7, E4 ORF6, E4 ORF4, E4 ORF3, E4 ORF2 e/ou E4 ORF1). Adequada- mente, E1 e opcionalmente E3 e/ou E4 são deletadas. Se deletada, a região do gene deletada mencionada acima não será adequadamente considerada no alinhamento ao determinar a porcentagem de identi- dade em relação a outra sequência. Vetores da Invenção
[0059] Os vetores virais baseados em adenovírus símios não huma- nos representam uma alternativa ao uso de vetores derivados humanos para terapia gênica e vacinas genéticas. Certos adenovírus isolados de sí- mios não humanos estão intimamente relacionados aos adenovírus isola- dos de seres humanos, como demonstrado por sua propagação eficiente em células de origem humana. Como os seres humanos desenvolvem pouca ou nenhuma imunidade aos adenovírus símios, eles prometem fornecer uma alternativa melhorada aos usos adenovirais humanos.
[0060] “Baixa soroprevalência” pode significar ter um nível de anti- corpo neutralizante preexistente reduzido em comparação com o ade- novírus humano 5 (Ad5). Da mesma forma ou alternativamente, “baixa soroprevalência” pode significar menos de cerca de 30% de soropreva- lência, menos de cerca de 20% de soroprevalência, menos de cerca de 15% de soroprevalência, menos de cerca de 10% de soroprevalência, menos de cerca de 10% de soroprevalência, menos de cerca de 5% de soroprevalência, menos de cerca de 4% soroprevalência, menos de cerca de 3% de soroprevalência, menos de cerca de 2% de soropreva- lência, menos de cerca de 1% de soroprevalência ou nenhuma soropre- valência detectável. A soroprevalência pode ser medida como a porcen- tagem de indivíduos com um título de neutralização clinicamente rele- vante (definido como um título de neutralização de 50% >200) usando métodos como descrito em Hum. Gene Ther. (2004) 15:293.
[0061] O vetor adenoviral da presente invenção é derivado de um adenovírus símio não humano, também conhecido como “adenovírus símio”. Numerosos adenovírus foram isolados de símios não humanos, como chimpanzés, bonobos, macacos rhesus, orangotangos e gorilas. Os vetores derivados desses adenovírus podem induzir fortes respostas imunes aos transgenes codificados por esses vetores. Certas vanta- gens de vetores baseados em adenovírus símios não humanos incluem uma relativa falta de anticorpos neutralizantes cruzados para esses ade- novírus na população alvo humana, portanto, seu uso supera a imuni- dade preexistente aos adenovírus humanos. Por exemplo, alguns ade- novírus símios não têm reatividade cruzada com anticorpos neutralizan- tes humanos preexistentes e a reação cruzada de certos adenovírus de chimpanzés com anticorpos neutralizantes humanos preexistentes está presente apenas em 2% da população alvo, em comparação a 35% no caso de certos vetores de adenovírus humanos candidatos (Sci. Transl. Med. (2012) 4:1).
[0062] Os vetores adenovirais da invenção são derivados de um adenovírus símio, por exemplo, de chimpanzés (Pan troglodytes), bonobos (Pan paniscus), gorilas (Gorilla gorilla) e orangotangos (Pongo abelii e Pongo pygnaeus). Eles incluem adenovírus do Grupo B, Grupo C, Grupo D, Grupo E e Grupo G. Os adenovírus dos chimpanzés in- cluem, mas não estão limitados a AdY25, ChAd3, ChAd19, ChAd25.2, ChAd26, ChAd27, ChAd29, ChAd30, ChAd31, ChAd32, ChAd33, ChAd34, ChAd35, ChAd37, ChAd38, ChAd39, ChAd40, ChAd63, ChAd83, ChAd155, ChAd15, SadV41 e ChAd157 ChAd3, ChAdi9, ChAd25.2, ChAd26, ChAd27, ChAd29, ChAd30, ChAd31, ChAd32, ChAd33, ChAd34, ChAd35, ChAd37, ChAd38, ChAd39, ChAda4o, ChAd63, ChAd83, ChAd155, ChAd15, SadV41, sAd4310A, sAd4312, SAdV31, SAdV-A1337, ChAdOx1, ChAdOx2 e ChAd157. Alternativa- mente, os vetores adenovirais podem ser derivados de adenovírus sí- mios não humanos isolados de bonobos, como PanAd1, PanAd2, Pa- nAÃd3, PanAd3, Pan 5, Pan 6, Pan 7 (também conhecido como C7) e Pan 9. Os vetores podem incluir, no todo ou em parte, um nucleotídeo que codifica a fibra, pentônio ou hexônio de um adenovírus não humano.
[0063] Em uma modalidade dos vetores adenovirais da invenção, o vetor adenoviral tem uma soroprevalência inferior a 30%, inferior a 20%, inferior a 10% ou inferior a 5% em indivíduos humanos, de preferência nenhuma soroprevalência em indivíduos humanos e com mais preferên- cia, não há soroprevalência em indivíduos humanos que não haviam estado em contato com um vetor adenoviral de chimpanzé.
[0064] Em modalidades dos vetores adenovirais da invenção, o DNA adenoviral é capaz de entrar em uma célula alvo de mamífero, isto é, é infeccioso. Um vetor adenoviral recombinante infeccioso da inven- ção pode ser utilizado como uma vacina profilática ou terapêutica e para terapia genética. Dessa forma, em uma modalidade, o vetor adenoviral recombinante compreende uma molécula endógena para entrega em uma célula alvo. A célula alvo é uma célula de mamífero, por exemplo, uma célula bovina, uma célula canina, uma célula caprina, uma célula de cervo, uma célula de chimpanzé, uma célula de quiróptero, uma cé- lula equina, uma célula felina, uma célula humana, uma célula de lobo, uma célula ovina, célula suína, célula de roedor, célula de urso ou célula vulpina. A molécula endógena para entrega em uma célula alvo é um cassete de expressão.
[0065] Em uma modalidade da invenção, o vetor compreende uma região ITR esquerda, uma região E1 deletada, depois uma região E3 deletada e, opcionalmente, elementos intensificadores adicionais; estes são seguidos por uma região de fibra, uma região E4 e uma ITR direita. A tradução ocorre nas direções direita e esquerda. Nesta modalidade, o primeiro cassete de expressão é inserido na região E1 deletada e o se- gundo cassete de expressão é inserido na região E3 deletada. Em uma outra modalidade, os promotores dos dois cassetes de expressão são promotores de CMV. Ainda em uma modalidade adicional, o elemento intensificador é o Elemento Regulador Pós-Traducional da Hepatite B (HPRE) ou o Elemento Regulador Pós-Traducional de Hepatite B da Marmota (WPRE).
[0066] Em uma modalidade da invenção, o vetor compreende regi- ões ITR esquerda e direita; uma região E1 deletada; pelo menos uma região E3 parcialmente deletada; uma região de fibra; uma região E4; dois cassetes de expressão, cada um compreendendo: um promotor e pelo menos um antígeno de interesse e, opcionalmente, um ou mais elementos intensificadores. O primeiro cassete de expressão é inserido na região E1 deletada e o segundo cassete de expressão é inserido no sítio HE1, ou seja, entre os códons de parada do gene da fibra e uma região E4 (“o sítio HEI”). O sítio de inserção ChAd155 HE1 está entre os pb 34611 e 34612 da sequência ChAd155 selvagem. O sítio de in- serção ChAd83 HE1 está entre os pb 33535 e 33536 da sequência ChAd83 selvagem. A tradução ocorre nas direções direita e esquerda. Em uma outra modalidade, os promotores são promotores de CMV. Em uma modalidade preferencial, um promotor é um promotor de CMV e o outro é um promotor de eECMV. Ainda em uma modalidade adicional, o elemento intensificador é HPRE ou WPRE.
[0067] Em uma outra modalidade, o vetor compreende regiões ITR esquerda e direita; uma região E1 deletada; pelo menos uma região E3 parcialmente deletada; uma região de fibra; uma região E4; dois casse- tes de expressão, cada um compreendendo: um promotor, pelo menos um antígeno de interesse e, opcionalmente, um ou mais elementos in- tensificadores. O primeiro cassete de expressão é inserido na região E1 deletada e o segundo cassete de expressão é inserido no sítio HE2, ou seja, entre a extremidade da ITR esquerda e o sítio de terminação do mMRNA de E4 (“o sítio HE2”). O sítio de inserção ChAd155 HE2 está entre os pb 37662 e 37663 da sequência ChAd155 selvagem. O sítio de inserção ChAd8ê3 HE2 está entre os pb 36387 e 36388 da sequência ChAd83 selvagem. A tradução ocorre nas direções direita e esquerda. Em uma outra modalidade, os promotores são promotores de CMV. Em uma modalidade preferencial, um promotor é um promotor de CMV e o outro é um promotor de eECMV. Ainda em uma modalidade adicional, o elemento intensificador é HPRE ou WPRE (o elemento intensificador aumenta a expressão do transgene).
[0068] Os sítios HE1 e HE2 foram identificados como sítios de in- serção para um transgene, uma vez que a inserção nesses pontos es- pecíficos não interrompe as sequências de codificação ou de regulação de ChAd155 e ChAd83. Portanto, a inserção de cassetes de expressão nos sítios HE1 ou HE2 do genoma ChAd não afeta o ciclo de replicação viral.
[0069] Em uma modalidade da invenção, o vetor é um derivado fun- cional ou imunogênico de um vetor adenoviral. Por “derivado de um ve- tor adenoviral” entende-se uma versão modificada do vetor, por exem- plo, um ou mais nucleotídeos do vetor são deletados, inseridos, modifi- cados ou substituídos. Elementos de Regulação
[0070] Elementos reguladores, isto é, sequências de controle de ex- pressão, incluem sequências apropriadas de iniciação, terminação, pro- motoras e intensificadoras de transcrição; sinais eficientes de processa- mento de RNA, como sinais de junção e poliadenilação (poli A), inclu- indo beta-globina poliA de coelho; sistemas reguláveis por tetraciclina, microRNAs, elementos reguladores pós-transcricionais (por exemplo, WPRE, elemento regulador pós-transcricional do vírus de hepatite da marmota); sequências que estabilizam o MRNA citoplasmático; sequên- cias que aumentam a eficiência da tradução (por exemplo, sequência consenso de Kozak); sequências que melhoram a estabilidade das pro- teínas; e quando desejado, sequências que aumentam a secreção de um produto codificado.
[0071] Um “promotor” é uma sequência nucleotídica que permite a ligação da RNA polimerase e direciona a transcrição de um gene. Tipi- camente, um promotor está localizado em uma região não codificante de um gene, proximal ao sítio de início da transcrição. Os elementos de sequência dentro dos promotores que funcionam no início da transcri- ção são frequentemente caracterizados por sequências de nucleotídeos consenso. Exemplos de promotores incluem, mas não estão limitados a promotores de bactérias, leveduras, plantas, vírus e mamíferos, inclu- indo símios e humanos. Um grande número de sequências de controle de expressão, incluindo promotores internos, nativos, constitutivos, in- dutíveis e/ou específicos para tecidos, são conhecidos na técnica e po- dem ser utilizados.
[0072] Os promotores da invenção serão tipicamente promotores heterólogos. Os promotores da invenção podem ser constitutivos.
[0073] Exemplos de promotores incluem, mas não estão limitados a promotores de bactérias, leveduras, plantas, vírus e mamíferos (inclu- indo seres humanos).
[0074] Exemplos de promotores incluem, sem limitação, o promotor TBG, o promotor LTR do vírus retroviral do sarcoma de Rous (opcional- mente com o intensificador), o promotor do citomegalovírus (CMV) (op- cionalmente com o intensificador do CMV, ver, por exemplo, Boshart et al, Cell, 41:521-530 (1985)), o promotor CASI, o promotor SV40, o pro- motor da di-hidrofolato redutase, o promotor da B-actina, o promotor da fosfoglicero|l quinase (PGK) e o promotor EF1a (Invitrogen).
[0075] Promotores adequados incluem o promotor de citomegalovíií- rus (CMV) e o promotor CASI. O promotor CMV é forte e onipresente ativo. Tem a capacidade de conduzir altos níveis de expressão de trans- gene em muitos tipos de tecidos e é bem conhecido na técnica. O pro- motor de CMV pode ser utilizado em vetores da invenção, com ou sem um intensificador de CMV.
[0076] O promotor CAS! é um promotor sintético descrito como uma combinação do intensificador de CMV, o promotor de beta-actina de frango e um doador de junção e um aceptor de junção que flanqueiam o intensificador de ubiquitina (UBC) (US 8865881).
[0077] Em algumas modalidades, o promotor CASI pode incluir uma sequência de ácidos nucleicos com pelo menos cerca de 90%, pelo me- nos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou mais, de identidade de sequência com a SEQ ID NO: 3. Em algumas modalida- des, o promotor compreende ou consiste em uma sequência de ácidos nucleicos da SEQ ID NO: 3.
[0078] Em algumas modalidades, o promotor de hcMV aprimorado pode incluir uma sequência de ácidos nucleicos tendo pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou mais, de identidade de sequência com a SEQ ID NO: 6. Em algumas modalidades, o promotor compreende ou consiste em uma se- quência de ácidos nucleicos da SEQ ID NO: 6.
[0079] Opcionalmente, vetores transportando transgenes que codi- ficam produtos terapeuticamente úteis ou imunogênicos também podem incluir marcadores selecionáveis ou genes repórter. O gene repórter pode ser escolhido dentre aqueles conhecidos na técnica. Genes repór- ter adequados incluem, mas não estão limitados a proteína fluorescente verde aprimorada, proteína fluorescente vermelha, luciferase e fosfa- tase alcalina embrionária segregada (seAP), que podem incluir sequên- cias que codificam resistência à geneticina, higromicina ou purimicina, entre outras. Esses genes repórter ou marcadores selecionáveis (que podem ou não estar localizados fora do genoma viral para serem empa- cotados em uma partícula viral) podem ser usados para sinalizar a pre- sença dos plasmídeos nas células bacterianas, como resistência à am- picilina. Outros componentes do vetor podem incluir uma origem de re- plicação.
[0080] Um “elemento regulador pós-transcricional”, como utilizado neste pedido, é uma sequência de DNA que, quando transcrita, melhora a expressão do(s) transgene(s) ou fragmentos dos mesmos que são en- tregues pelos vetores virais da invenção. Os elementos reguladores pós-transcricionais incluem, entre outros, o Elemento Regulador Pós- Transcricional do Vírus da Hepatite B (HPRE) e o Elemento Regulador Pós-transcricional da Hepatite de Marmota (WPRE). O WPRE é um ele- mento tripartido cis-atuante que demonstrou melhorar a expressão do transgene acionado por certos promotores, mas não todos.
[0081] Nas modalidades da invenção, um vetor ChAd155 pode compreender um ou mais dentre um promotor, um intensificador e um gene repórter. Por exemplo, os vetores da invenção podem compreen- der hoMV-SeAP, ChAd155-CASI-seAP e ChAd155-hCMV-seAP, opci- onalmente com um controle transcricional liga/desliga de tetraciclina e ChAd155-CMV-hFerL-chEF1-seAP com um controle transcricional liga/desliga de tetraciclina.
[0082] Nas modalidades da invenção, um vetor ChAd83 pode com- preender um ou mais dentre um promotor, um intensificador e um gene repórter. Por exemplo, os vetores da invenção podem compreender hCMV-SeAP aprimorado por ChAd155, hoMV-SeAP aprimorado por ChAd83, ChAd155-CASI-seAP e ChAd83-hCMV-seAP, opcionalmente com um controle transcricional liga/desliga de tetraciclina e ChAd83- CMV-hFerL-chEF1-seAP com um controle transcricional liga/desliga de tetraciclina.
[0083] Os vetores da invenção são gerados usando técnicas forne- cidas neste pedido, em conjunto com técnicas conhecidas pelos versa- dos na técnica. Tais técnicas incluem técnicas convencionais de clona- gem de cDNA, como as descritas nos textos, uso de sequências oligo- nucleotídicas sobrepostas dos genomas de adenovírus, reação de poli- merase em cadeia e qualquer método adequado que forneça a sequên- cia nucleotídica desejada.
Transgenes
[0084] Um “transgene” é uma sequência de ácidos nucleicos, hete- róloga às sequências de vetores que flanqueiam o transgene, que codi- fica um polipeptídeo de interesse. A sequência de codificação de ácidos nucleicos está operacionalmente ligada a componentes reguladores de uma maneira que permite a transcrição, tradução e/ou expressão de transgene em uma célula hospedeira. Nas modalidades da invenção, os vetores expressam transgenes em nível terapêutico ou profilático. Um
“derivado funcional” de um polipeptídeo transgênico é uma versão mo- dificada de um polipeptídeo, por exemplo, em que um ou mais aminoá- cidos são deletados, inseridos, modificados ou substituídos.
[0085] O transgene pode ser utilizado para profilaxia ou tratamento, por exemplo, como uma vacina para induzir uma resposta imune, para corrigir deficiências genéticas, corrigindo ou substituindo um gene de- feituoso ou ausente, ou como terapia para o câncer. Como utilizado neste pedido, a indução de uma resposta imune refere-se à capacidade de uma proteína para induzir uma célula T e/ou uma resposta imune de anticorpo humoral à proteína.
[0086] A resposta imune provocada pelo transgene pode ser uma resposta de célula B específica ao antígeno, que produz anticorpos neu- tralizantes. A resposta imune provocada pode ser uma resposta de cé- lula T específica para o antígeno, que pode ser uma resposta sistêmica e/ou local. A resposta das células T específicas para o antígeno pode compreender uma resposta das células T CD4+, como uma resposta envolvendo células T CD4+ que expressam citocinas, por exemplo, in- terferon gama (IFN gama), fator de necrose tumoral alfa (TNF alfa) e/ou interleucina 2 (IL2). Alternativamente ou adicionalmente, a resposta da célula T específica para o antígeno compreende uma resposta da célula T CD8+, como uma resposta envolvendo células T CD8+ que expres- sam citocinas, por exemplo, IFN gama, TNF alfa, TNF alfa e/ou I|L2.
[0087] A composição da sequência de transgene dependerá do uso ao qual o vetor resultante será aplicado. Em uma modalidade, o trans- gene é uma sequência que codifica um produto que é útil em biologia e medicina, como um transgene profilático, um transgene terapêutico ou um transgene imunogênico, por exemplo, proteína ou RNA. Os transge- nes de proteínas incluem antígenos. Os transgenes antigênicos da in- venção induzem uma resposta imunogênica para um organismo causa- dor de doença.
[0088] Os transgenes da invenção incluem, mas não estão limitados a antígenos do vírus da raiva, por exemplo, glicoproteína da raiva (RG), antígenos do vírus sincicial respiratório (RSV), antígenos do vírus da imunodeficiência humana (HIV) ou fragmentos dos mesmos.
[0089] Como resultado da redundância no código genético, um po- lipeptídeo pode ser codificado por uma variedade de diferentes sequên- cias de ácidos nucleicos. A codificação é enviesada para usar alguns códons sinônimos, ou seja, códons que codificam o mesmo aminoácido, mais do que outros. Por “códon otimizado”, entende-se que modifica- ções na composição do códon de um ácido nucleico recombinante são feitas sem alterar a sequência de aminoácidos. A otimização de códons tem sido usada para melhorar a expressão de mMRNA em diferentes or- ganismos usando frequências de uso de códons específicas para cada organismo.
[0090] Além de e independentemente do viés do códon, alguns pa- res de códons sinônimos são usados com mais frequência do que ou- tros. Esse viés do par de códons significa que alguns pares de códons estão super-representados e outros estão sub-representados. A desoti- mização do par de códons tem sido utilizada para reduzir a virulência viral. Por exemplo, foi relatado que os poliovírus modificados para conter pares de códons sub-representados demonstraram menor eficiência de tradução e foram atenuados em comparação com o poliovírus selvagem (Science (2008) 320:1784). A engenharia de um vírus sintético atenu- ado por desotimização de pares de códons pode produzir vírus que co- dificam as mesmas sequências de aminoácidos selvagens, mas usam diferentes arranjos de pares de códons sinônimos. Os vírus atenuados pela desotimização do par de códons geraram até 1000 vezes menos placas em comparação com o tipo selvagem, produziram menos partí- culas virais e exigiram cerca de 100 vezes mais partículas virais para formar uma placa.
[0091] Em contraste, os poliovírus modificados para conter pares de códons que são super-representados no genoma humano agiram de maneira semelhante ao RNA selvagem e geraram placas idênticas em tamanho ao RNA selvagem (Coleman et a/. (2008) Science 320:1784). Isso ocorreu apesar do fato de que o vírus com pares de códons super- representados continha um número semelhante de mutações que o ví- rus com pares de códons sub-representados e demonstrou tradução aprimorada em comparação com o tipo selvagem. Esta observação su- gere que se espera que os construtos otimizados do par de códons atuem de maneira semelhante às suas contrapartes não otimizadas do par de códons e que não forneça uma vantagem funcional. Sem desejar ser limitado pela teoria, isso pode ocorrer porque a evolução natural oti- mizou o emparelhamento de códons.
[0092] Um construto da invenção pode compreender uma sequên- cia de ácidos nucleicos otimizada por códon. Alternativamente ou adici- onalmente, um vetor da invenção compreende uma sequência otimi- zada por códon de um transgene ou um derivado imunogênico ou frag- mento do mesmo. Um construto da invenção pode compreender uma sequência de ácidos nucleicos otimizada para o par de códons. Alterna- tivamente ou adicionalmente, um vetor da invenção compreende ou consiste em uma sequência otimizada do par de códons de um trans- gene ou um derivado imunogênico ou fragmento do mesmo. Transgenes do Vírus Sincicial Respiratório (RSV)
[0093] Em uma modalidade, a presente invenção fornece o uso de um vetor adenoviral derivado de símio recombinante compreendendo dois cassetes de expressão, em que cada cassete de expressão com- preende um transgene imunogênico derivado do vírus sincicial respira- tório humano (RSV), no tratamento ou profilaxia da infecção por RSV. Em uma modalidade, o vetor adenoviral derivado de símio recombinante da presente invenção compreende um antígeno RSV F em um dos cas- setes de expressão e outro antígeno viral de RSV no outro cassete de expressão. Antígenos adequados são discutidos mais adiante. Em uma modalidade, o vetor adenoviral derivado de símio recombinante com- preende antígenos RSV M e N no segundo cassete de expressão. Em tais modalidades, o vetor codifica preferencialmente um antígeno RSV FOATM (proteína de fusão (F) deletada das regiões transmembrana e citoplasmática) e antígenos RSV M2-1 (anti-terminação da transcrição) e N (nucleocapsídeo).
[0094] A infecção por RSV não confere imunidade protetora total. À infecção na infância é seguida por reinfecções sintomáticas do RSV, que continuam por toda a vida adulta. Essas reinfecções geralmente não são diagnosticadas porque geralmente se apresentam como infec- ções agudas comuns do trato respiratório superior. Em pessoas mais vulneráveis (por exemplo, adultos ou idosos imunocomprometidos), as reinfecções também podem levar a doenças graves. Ambos os braços do sistema imunológico (imunidade humoral e celular) estão envolvidos na proteção contra doenças graves [Guvenel AK, Chiu C and Openshaw PJ. Current concepts and progress in RSV vaccine development. Expert Rev Vaccines. 2014; 13(3): 333-44.].
[0095] A resposta imune humoral é capaz de neutralizar o vírus e inibir a replicação viral, desempenhando, assim, um papel importante na proteção contra infecção respiratória inferior por RSV e doenças gra- ves [Piedra PA, Jewell AM, Cron SG, et al., Correlates of immunity to respiratory syncytial virus (RSV) associated-hospitalization: establish- ment of minimum protective threshold levels of serum neutralizing anti- bodies. Vaccine. 2003; 21(24): 3479-82.]. Foi demonstrado que a imu- nização passiva, na forma de anticorpos monoclionais neutralizadores de RSV (Synagis) de imunoglobulina G (IgG) administrados profilatica-
mente, tem demonstrado prevenir a doença por RSV em alguma exten- são em bebês e recém-nascidos prematuros com displasia broncopul- monar ou doença cardiopulmonar subjacente [Cardenas S, Auais A and Piedimonte G. Palivizumab in the prophylaxis of respiratory syncytial vi- rus infection. Expert Rev Anti Infect Ther. 2005; 3(5): 719-26].
[0096] As células T também estão envolvidas no controle da doença por RSV. Infecções letais por RSV foram descritas em pacientes com baixa contagem de células T CD8, como no caso de imunodeficiência combinada grave, receptores de medula óssea e transplante de pulmão [Hertz, 1989]. A histopatologia de casos fatais de infecção por RSV de recém-nascidos mostra que existe uma escassez relativa de células T CDB8 no infiltrado pulmonar [Welliver TP, Garofalo RP, Hosakote Y, et al., Severe human lower respiratory tract illhess caused by respiratory syncytial virus and influenza virus is characterized by the absence of pulmonary cytotoxic Iymphocyte responses. J Infect Dis. 2007. 195(8): 1126-36.]. Além disso, a presença de células T CD8 produtoras de in- terferon gama (IFN-y) tem sido associada a respostas Th2 diminuídas e eosinofilia reduzida em modelos animais de RSV [Castilow EM and Varga SM. Overcoming T cell-mediated immunopathology to achieve safe RSV vaccination. Future Virol. 2008; 3(5): 445-454; Stevens WW, Sun J, Castillo JP, et al., Pulmonary eosinophilia is attenuated by early responding CD8(+) memory T cells in a murine model of RSV vaccine- enhanced disease. Viral Immunol. 2009; 22(4): 243-51].
[0097] Antígenos adequados de RSV que são úteis como imunóge- nos para imunizar um ser humano ou um animal não humano podem ser selecionados dentre: a proteína de fusão (F), a proteína de ligação (G), a proteína de matriz (M2) e a nucleoproteína (N). O termo “proteína F” ou “proteína de fusão” ou “polipeptídeo de proteína F” ou “polipeptí- deo de proteína de fusão” refere-se a um polipeptídeo ou proteína que possui a totalidade ou parte de uma sequência de aminoácidos de um polipeptídeo da proteína de fusão de RSV. Da mesma forma, o termo “proteína G” ou “polipeptídeo de proteína G” refere-se a um polipeptídeo ou proteína que possui a totalidade ou parte de uma sequência de ami- noácidos de um polipeptídeo da proteína de ligação de RSV. O termo “proteína M" ou “proteína da matriz" ou “polipeptídeo da proteína M” re- fere-se a um polipeptídeo ou proteína que possui a totalidade ou parte de uma sequência de aminoácidos de uma proteína da Matriz RSV e pode incluir um ou ambos os M2-1 (que pode ser escrito neste pedido como produtos dos genes M2.1) e M2-2. Da mesma forma, o termo “pro- teína N” ou “proteína de nucleocapsídeo” ou “polipeptídeo da proteína N” refere-se a um polipeptídeo ou proteína que possui a totalidade ou parte de uma sequência de aminoácidos de uma nucleoproteína de RSV.
[0098] Dois grupos de cepas humanas de RSV foram descritos, os grupos A e B, baseados principalmente em diferenças na antigenicidade da glicoproteína G. Numerosas cepas de RSV foram isoladas até o mo- mento, qualquer uma das quais é adequada no contexto dos antígenos das combinações imunogênicas divulgadas neste pedido. Cepas exem- plares indicadas pelo número de acesso GenBank e/ou EMBL podem ser encontradas no pedido de publicação publicado US 2010/0203071 (WOZ2008114149), que é incorporado neste pedido por referência com o objetivo de divulgar as sequências de ácidos nucleicos e polipeptídeos de proteínas RSV F e G adequadas para uso na presente invenção. Em uma modalidade, a proteína RSV F pode ser um ectodomínio de uma proteína RSV F (FOATM).
[0099] Exemplos de ácidos nucleicos e sequências de proteínas das proteínas M e N podem ser encontrados, por exemplo, no pedido publicado US 2014/0141042 (WO2012/089833), que é incorporado neste pedido com o objetivo de divulgar as sequências de ácidos nuclei- cos e polipeptídeos das proteínas RSV M e N adequadas para uso na presente invenção.
[00100] —Adequadamente, para utilização na presente invenção, os ácidos nucleicos do transgene codificam um antígeno RSV F e antíge- nos RSV M e N. Mais especificamente, os ácidos nucleicos codificam uma proteína do antígeno RSV FOATM (proteína de fusão (F) deletada das regiões transmembrana e citoplasmática) e antígenos RSV M2-1 (anti-terminação da transcrição) e N (nucleocapsídeo). Proteína de fusão (F) deletada das regiões transmembrana e citoplas- mática (FOATM)
[00101] A proteina RSV F é um antígeno de superfície principal e medeia a fusão viral para as células alvo. A proteína F é um antígeno que é altamente conservado entre subgrupos e cepas de RSV. A prote- ína F é um alvo para anticorpos neutralizantes, incluindo o anticorpo monoclonal profilático neutralizante para RSV, Synagis. A deleção da região transmembrana e da cauda citoplasmática permite a secreção da proteína FOATM. Anticorpos neutralizantes, incluindo Synagis, que re- conhecem essa forma solúvel da proteína F, inibem a infectividade por RSV in vitro [Magro M, Andreu D, Gómez-Puertas P, et al., Neutraliza- tion of human respiratory syncytial virus infectivity by antibodies and low- molecular-weight compounds targeted against the fusion glycoprotein. J Virol. 2010; 84(16): 7970-82]. Proteína nucleocapsídica (N)
[00102] A proteína Né um antígeno interno (não exposto), altamente conservado entre as cepas de RSV e conhecida por ser uma fonte de muitos epítopos de células T. A proteína N é essencial para a replicação e transcrição do genoma do RSV. A função principal da proteína N é encapsular o genoma do vírus para fins de transcrição, replicação e em- pacotamento de RNA, protegendo-o das ribonucleases. Proteína de transcrição anti-terminação (M2-1)
[00103] AproteínaM?2-1 é um fator de anti-terminação de transcrição importante para a síntese eficiente de RNAs mensageiros completos (MRNAs), bem como para a síntese de MRNAs de leitura policistrônica, que são característicos de vírus de RNA de cadeia negativa não seg- mentada. M2-1 é um antígeno interno (não exposto), que é altamente conservado entre as cepas de RSV e conhecido por ser uma fonte de muitos epítopos de células T. Proteína de Fusão N-M2-1
[00104] Um polinucleotídeo que codifica um ligante é posicionado en- tre o polinucleotídeo que codifica um antígeno RSV N, ou fragmento do mesmo, e o polinucleotídeo que codifica um antígeno RSV M2.1, ou fra- gmento do mesmo. Dessa forma, em certos exemplos preferenciais, um cassete de expressão contém um transgene que codifica uma proteína viral RSV N-ligante-M2.1 fundida. É preferencial que o ligante seja um ligante flexível, de preferência, um ligante flexível compreendendo uma sequência de aminoácidos de acordo com a SEQ ID NO: 11 (Gly-Gly- Gly-Ser-Gly-Gly-Gly) ou SEQ ID NO: 12 (Gly-Gly-Gly-Gly-Ser-Gly-Gly- Gly-Gly). Transgenes do papiloma (PV)
[00105] Em uma modalidade, a presente invenção fornece o uso de um vetor adenoviral derivado de símio recombinante compreendendo dois cassetes de expressão, em que cada cassete de expressão com- preende um transgene imunogênico derivado de um vírus do papiloma (PV), no tratamento ou profilaxia de uma doença induzida pelo vírus do papiloma. Adequadamente, o vetor adenoviral derivado de símio recom- binante da presente invenção compreende um antígeno E1 do vírus do papiloma modificado em um dos cassetes de expressão e um antígeno E2 do vírus do papiloma modificado no outro cassete de expressão.
[00106] O papilomavírus humano (HPV) é um pequeno vírus de DNA que infecta a pele e/ou mucosa cutânea e causa várias doenças, inclu-
indo neoplasia cervical, câncer cervical e outros tipos de câncer anoge- nital. Sabe-se que existem mais de 40 tipos de HPV que infectam o trato anogenital de seres humanos e cerca de 15 genótipos de alto risco es- tão associados causalmente a cânceres cervicais humanos. A maioria das infecções por HPV do epitélio cervical é subclínica e auto-resolvida em um período de dois anos. No entanto, a infecção persistente com tipos de HPV de alto risco pode causar lesões e progredir para câncer invasivo.
[00107] —Antígenos adequados para HPV que são úteis como imunó- genos são descritos no documento WO2018060288 e incluem, em par- ticular, as proteínas E1 e E2 do HPV. Transgenes da Raiva (RG)
[00108] O Lyssavirusé um vírus de RNA de fita simples da família Rhabdoviridae. Os membros do gênero Lyssavirus causam raiva e têm a maior taxa de mortalidade de todos os patógenos virais humanos co- nhecidos. A raiva é transmitida pela saliva de mamíferos infectados. Um vírus neurotrópico, entra no sistema nervoso de seu hospedeiro, cau- sando uma encefalomielite quase invariavelmente fatal. Atualmente, existem cerca de 60.000 mortes por raiva em todo o mundo anualmente, principalmente causadas por mordidas de cães em países em desen- volvimento na Ásia e África e por animais selvagens e morcegos na América do Norte.
[00109] A raiva se apresenta de forma furiosa ou paralítica. O perí- odo de incubação varia entre cerca de cinco dias e vários anos, mas é tipicamente entre cerca de 20 e 90 dias. A doença clínica geralmente começa com queixas prodrômicas de mal-estar, anorexia, fadiga, dor de cabeça e febre, seguidas de dor ou paratesia no local da exposição. Ansiedade, agitação ou irritabilidade podem ser proeminentes durante esse período, seguidas de hiperatividade, desorientação, convulsões, hidrofobia, hipersalivação e, eventualmente, paralisia, coma e morte.
[00110] Os antígenos da raiva podem ser derivados da glicoproteína viral da raiva (RG). Por exemplo, a glicoproteína da raiva pode ser usada como um antígeno modelo. Entrega de Vetores Adenovirais
[00111] Em algumas modalidades, o vetor adenoviral recombinante da invenção é administrado a um indivíduo por administração epicutâ- nea, administração intradérmica, injeção intramuscular, injeção intrape- ritoneal, injeção intravenosa, administração nasal, administração nasal, administração oral, administração retal, injeção subcutânea, administra- ção transdérmica ou administração intravaginal.
[00112] Em uma modalidade da invenção, os vetores podem ser ad- ministrados por via intramuscular (IM), isto é, injeção diretamente no músculo. Os músculos são bem vascularizados e a captação é tipica- mente rápida. Adjuvantes
[00113] As abordagens para estabelecer uma imunidade forte e du- radoura a patógenos específicos incluem a adição de adjuvantes às va- cinas. Por “adjuvante” entende-se um agente que aumenta, estimula, ativa, potencializa ou modula a resposta imune a um ingrediente ativo da composição. O efeito adjuvante pode ocorrer no nível celular ou hu- moral, ou em ambos. Os adjuvantes estimulam a resposta do sistema imunológico ao antígeno real, mas não têm efeito imunológico por si só. Alternativamente ou adicionalmente, as composições adjuvantes da in- venção podem incluir um ou mais imunoestimulantes. Por “imunoesti- mulante”, entende-se um agente que induz um aumento geral e tempo- rário na resposta imune de um indivíduo, seja administrado com o antí- geno ou separadamente.
[00114] Uma composição da invenção pode ser administrada com ou sem um adjuvante. Alternativamente, ou adicionalmente, a composição pode compreender, ou ser administrada em conjunto com um ou mais adjuvantes (por exemplo, adjuvantes de vacina), em particular a com- posição compreende uma quantidade imunologicamente eficaz de um vetor da invenção que codifica um transgene. Métodos de uso/usos
[00115] São fornecidos métodos para induzir uma resposta imune contra uma doença causada por um patógeno em um indivíduo em ne- cessidade dos mesmos, compreendendo uma etapa de administração de uma quantidade imunologicamente eficaz de um construto ou com- posição, como divulgado neste pedido. Em algumas modalidades, é for- necido o uso de construtos ou composições divulgados neste pedido para induzir uma resposta imune a um antígeno transgênico em um in- divíduo em necessidade dos mesmos. Os vetores da invenção podem ser aplicados para a profilaxia, tratamento ou melhora de doenças de- vido à infecção.
[00116] Os métodos da invenção incluem o uso de um vetor da in- venção em medicina. Eles incluem o uso de um vetor da invenção para o tratamento de uma doença causada por um patógeno. Um vetor da invenção pode ser utilizado na fabricação de um medicamento para o tratamento de uma doença causada por um patógeno. Um vetor da in- venção pode ser utilizado na fabricação de um medicamento para a pre- venção ou tratamento de uma doença, por exemplo, uma doença cau- sada pelo vírus sincicial respiratório (RSV).
[00117] Aimunização eficaz com vetores adenovirais depende da ca- pacidade imunomoduladora intrínseca da cadeia principal do vetor ade- noviral. Os adenovírus imunologicamente menos potentes induzem me- nos expressão de antígeno. A imunização eficaz também depende da capacidade do promotor de conduzir a expressão forte e sustentada do transgene. Por exemplo, os vetores adenovirais conduzidos pelo pro- motor do citomegalovírus imediato-precoce (CMV-IE) não sustentam a expressão de transgene em longo prazo porque induzem citocinas que amortecem a expressão.
[00118] Por “indivíduo” entende-se um vertebrado, como um mamí- fero, por exemplo, um ser humano ou um mamífero veterinário. Em al- gumas modalidades, o indivíduo é um ser humano. Geral
[00119] Os vetores da invenção são gerados usando técnicas e se- quências fornecidas neste pedido, em conjunto com técnicas conheci- das pelos versados na técnica. Tais técnicas incluem técnicas conven- cionais de clonagem de cDNA, como as descritas nos textos, uso de sequências oligonucleotídicas sobrepostas dos genomas de adenovíií- rus, reação de polimerase em cadeia e qualquer método adequado que forneça a sequência nucleotídica desejada.
[00120] A menos que definido de outra forma, todos os termos técni- cos e científicos usados neste pedido têm o mesmo significado que co- mumente entendido por um versado na técnica à qual pertence esta di- vulgação. Os termos singulares “um”, “uma”, “o” e “a” incluem referên- cias no plural a menos que o contexto indique claramente de outra ma- neira. Da mesma forma, a palavra “ou” pretende incluir “e”, a menos que o contexto indique claramente de outra maneira. O termo “pluralidade” refere-se a dois ou mais. Além disso, as limitações numéricas dadas em relação às concentrações ou níveis de uma substância, como as con- centrações dos componentes da solução ou razões das mesmas, e as condições da reação, como temperaturas, pressões e tempos de ciclo, devem ser aproximadas. O termo “aproximadamente” utilizado neste pedido pretende significar a quantidade de +10%.
[00121] A presente invenção será agora descrita mais detalhada- mente por meio dos seguintes exemplos não limitadores.
EXEMPLOS Exemplo 1: Construção de adenovírus de chimpanzé com um cassete de expressão única
[00122] Os adenovírus selvagens de chimpanzé tipo 155 (ChAd155) (WO 2016/198621) e tipo 83 (CRhAd83) (WO 2010/086189) foram isola- dos de chimpanzés saudáveis usando procedimentos padrão e foram construídos conforme descrito em Sci Transl Med (2012) 4:1 e WO 2010/086189.
[00123] No Exemplo 1, os vetores ChAd155 e ChAd 83 foram cons- truídos inserindo um cassete único de expressão de transgene. Os com- ponentes do cassete de expressão usavam o promotor clássico de CMV humano ou o promotor CAS, glicoproteína da raiva como antígeno mo- delo e, opcionalmente, um intensificador do WPRE. Três sítios de inser- ção diferentes foram testados para o cassete do transgene: (i) substituição da região E3 pelo cassete do transgene, (ii) inserção do cassete do transgene entre a fibra e a região E4 (sítio HEI), e (iii) inserção do cassete do transgene a jusante da ITR direita (sítio HE2).
[00124] Essa numeração desses sítios de inserção corresponde às ilustrações da Figura 1 onde: (i) o painel superior ilustra o vetor RC1, no qual um cassete de transgene substituiu a região E3, (ii) o painel intermediário ilustra o vetor RO3, no qual um cassete do transgene é inserido entre os códons de parada do gene da fibra e da região E4 (sítio HEI), e (iii) o painel inferior ilustra o vetor RC2, no qual um cassete do transgene é inserido a jusante da ITR direita (sítio HE2).
[00125] Nos vetores mostrados no Exemplo 1, a região E1 perma- nece intacta em todas as configurações.
[00126] O transgene foi inserido por técnicas de recombinação ho- móloga nas seguintes posições da SEQ ID NO: 1, e da SEQ ID NO: 2: HE1 ChAd155: sítio de inserção entre os pb 34611 e 34612 da SEQ ID
NO: 1; HE2 ChAd155: sítio de inserção entre os pb 37662 e 37663 da SEQ ID NO: 1; HE1 ChAd83: sítio de inserção entre os pb 33535 e 33536 da SEQ ID NO: 2; HE2 ChAd83: sítio de inserção entre os pb 36387 e 36388 da SEQ ID NO: 2.
[00127] Quando o cassete do transgene foi inserido no sítio HE1, ChAd155 falhou ao replicar. No entanto, a inserção de um cassete do transgene no sítio HE1 de ChAd83 produziu um vetor viável.
Exemplo 2: Produção de Vírus, Título do Vetor e Expressão de Vetores do Exemplo 1
[00128] Para identificar um modelo animal no qual avaliar a replica- ção do vetor, os vetores do adenovírus tipo C ChAd155 RC2 e adeno- vírus tipo E ChAd83 RC2 do Exemplo 1 foram avaliados quanto à sua capacidade de replicação, medida pelo título do vetor e número de có- pias do genoma, em células de várias origens animais. Os resultados são mostrados na Tabela 1. Tabela 1. Replicação e Expressão de ChAd155 RC2 e ChAd83 RC2 do Exemplo 1 Linhagem celular: Título do Cópia do pressão ES Emas me om os se
NMU vero Prnsersonno favas o ND = não detectado; NA = não disponível
[00129] “Como mostrado na Tabela 1, as células MRC5 humanas e as células PK15 de suínos produziram altos títulos de vetores e altos números de cópias do genoma de ChAd155 e ChAd83. As células NMuLi murinas e as células Vero de primatas não humanos também produziram RC ChAd155, mas em menor grau do que as células huma- nas ou suínas. RC ChAd83 falhou em crescer bem nas células NMuLi murinas e, surpreendentemente, nas células Vero de primatas não hu- manos.
[00130] Células MRC5 humanas, células NMuLi de camundongo e células Vero de primatas não humanos suportaram a expressão de RC ChAd155 até o dia 7. As células MRC5 humanas suportaram a expres- são de RC ChAd83 até o dia 7, assim como as células NMuLi de ca- mundongo e as células Vero de primatas não humanos, mas em menor extensão que as células humanas. Produção de vírus
[00131] A Figura 2A mostra a quantidade de vírus produzido por cé- lulas MRC5 primárias humanas infectadas com ChAd155 ou ChAd83, cada uma compreendendo o construto do vetor RC1 ou RC2 do Exem- plo 1. As células foram coletadas sete dias após a infecção e o título do vetor foi avaliado em lisados celulares obtidos após três ciclos de con- gelamento e descongelamento. Os títulos de vetor foram medidos por análise quantitativa de PCR (QPCR) com iniciadores projetados para as respectivas regiões promotoras. A multiplicidade de infecção (moi) foi de 1250 partículas de vírus por célula. A produção de vírus é indicada no número de partículas de vírus por célula (vp/célula) acima das barras.
[00132] As células MRC5 humanas suportaram a produção de ChAd155 compreendendo RC1 (2,17 x 10º vp/célula) ou RC2 (4,40 x 10º vp/célula) e também suportaram a produção de ChAd83 compreen- dendo RC1 (1,18 x 10º vp/célula) ou RC2 (1,06 x 10º vp/célula). Como mostrado na Figura 2A, ChAd83 foi produzido em um nível superior ao de ChAd155; o vetor ChAd83 compreendendo RC?2 foi a mais robusta das quatro combinações vírus/vetor.
[00133] A Figura2B mostra a quantidade de vírus produzido por cé- lulas MRC5 primárias humanas infectadas com ChAd83 compreen- dendo o construto do vetor RC1, RC2 ou RC3 do Exemplo 1. As células foram coletadas dois e sete dias após a infecção. Como na Figura 2A, os títulos de vetor foram medidos por análise quantitativa de PCR (QPCR) com iniciadores projetados para as respectivas regiões promo- toras. A multiplicidade de infecção (moi) foi de 250 ou 1250 partículas de vírus por célula. A produção de vírus é indicada no número de partí- culas de vírus por célula (vp/célula) acima das barras.
[00134] As células MRC5 humanas suportaram a produção de ChAd83 compreendendo RC1, RC2 ou RC3. Como mostrado na Figura 2B, houve maior produção de vírus para os vetores RC2 e RC3 de ChAd83 do que para o vetor RC1. Também houve maior produção de vírus para o vetor ChAd83 RC2 HE2 do que o vetor RC3 HE1. Número de cópias do genoma de vetor
[00135] Após a infecção, o vetor é replicado na célula e o número de cópias do genoma do vetor pode ser medido por QPCR. A replicação do DNA vetorial pode ocorrer mesmo em células não totalmente permis- sivas à replicação e propagação viral. QPCR do DNA do vetor fornece uma medida de replicação do vetor dentro da célula infectada, indepen- dentemente da capacidade do vírus de completar o ciclo de replicação e ser liberado como progênie viral madura. A replicação vetorial pode, assim, ser quantificada em espécies animais, tipos de tecidos e tipos de células que não são permissivos à replicação ou propagação do vírus ChAd.
[00136] O número de cópias do genoma do vetor foi medido em pa- ralelo com o título do vetor e os resultados mostrados na Figura 3A e na Figura 3B.
[00137] Como acontece com a produção de vírus mostrada na Figura 2A, células MRC5 humanas foram infectadas com ChAd155 ou ChAd83,
cada um compreendendo o construto do vetor RC1 ou RC2 do Exemplo
1. As células foram coletadas sete dias após a infecção, o DNA total extraído, o genoma viral quantificado por QPCR e os resultados expres- sos como cópia do genoma do vetor por célula. A multiplicidade de in- fecção (moi) foi de 250 partículas de vírus por célula e o número de partículas de vírus por célula é indicado acima das barras, indicando cópias do genoma viral por célula. O número de cópias é diretamente proporcional ao nível de expressão do transgene.
[00138] “Como mostrado na Figura 3A, a quantidade de replicação de DNA viral de RC1 (6,21 x 10º vp/célula) e RC2 (6,71 x 10º vp/célula) por ChAd155 foi similar. ChAd83 produziu mais RC1 (2,76 x 10º vp/célula) e RC2 (9,19 x 10º vp/célula) de DNA viral de ChAd155. O nível mais alto de replicação do DNA viral foi observado por ChAdê3 RC2.
[00139] “Como acontece com a produção de vírus mostrada na Figura 2B, células MRC5 humanas foram infectadas com ChAd83, compreen- dendo o construto do vetor RC1, RC2 ou RC3 do Exemplo 1. As células foram coletadas dois e sete dias após a infecção, o DNA total extraído, o genoma viral quantificado por QPCR e os resultados expressos como cópia do genoma do vetor por célula. A multiplicidade de infecção (moi) foi de 250 e 1250 partículas de vírus por célula e o número de partículas de vírus por célula é indicado acima das barras, indicando cópias do genoma viral por célula. O número de cópias é diretamente proporcional ao nível de expressão do transgene.
[00140] “Conforme mostrado na Figura 3B, a quantidade de replica- ção do DNA viral foi maior para os vetores RC2 e RC3 de ChAd83 do que para o vetor RC1. Houve replicação do DNA viral comparável entre os vetores ChAd83 RC2 e RC3. Exemplo 3: Número de Cópias do Genoma Adenoviral de Vetores do Exemplo 1
[00141] A eficiência dos vetores adenovirais competentes para repli- cação com os construtos do Exemplo 1, expressa como cópias de veto- res por célula, foi avaliada em culturas de células derivadas de camun- dongos e primatas não humanos.
[00142] A Figura 4(a) mostra o número de cópias do genoma de ve- tores competentes para replicação desenvolvidos em células NMuLi he- páticas murinas cultivadas em monocamadas e infectadas com ChAd155 RC1, ChAd155 RC2, ChAd83 RC1 ou ChAdê3 RC2 em uma multiplicidade de infecção de 250 partículas de vírus por célula. O DNA total foi extraído cinco dias após a infecção e a replicação do vetor foi medida por QPCR usando iniciadores de recozimento na região promo- tora do vetor.
[00143] Os resultados, expressos como cópias de vetores por célula, são mostrados na Figura 4(a). ChAd155 amplificou o vetor RC1 e ROC2 com alta eficiência nas células NMuLi. ChAd155 replicou os vetores RC1 (1,73 x 10º) e RC2 (1,92 x 10º) aproximadamente no mesmo grau. ChAd83 foi menos eficiente que ChAd155 na replicação dos vetores RC1 e RC2. ChAdê83 replicou o DNA do vetor apenas em pequenas quantidades nas células murinas. O vetor RC1 replicou em um nível de 5,47 x 10º cópias por célula e o vetor RC2 em um nível de 6,74 x 10? cópias por célula.
[00144] As células Vero de primatas não humanos também foram cultivadas em monocamadas e infectadas com ChAd155 RC1, ChAd155 RC2, ChAdê3 RC1 ou ChAd83 RC2 (Figura 4(b)). Duas mul- tiplicidades diferentes de infecção foram utilizadas: 50 e 250 partículas de vírus por célula. O DNA total foi extraído cinco dias após a infecção e a replicação do vetor foi medida por QPCR usando iniciadores de re- cozimento na região promotora do vetor.
[00145] Os resultados, expressos como cópias de vetores por célula, são mostrados na Figura 4(b). A linhagem de células Vero de primatas era permissiva para ChAd155 RC1 (3,71 x 10º cópias por célula em uma moi de 50 e 4,93 x 10º cópias por célula em uma moi de 250) e ChAd155 RC2 (8,15 x 10º cópias por célula em uma moi de 50 e 7,05 x 10º cópias por célula em uma moi de 250). A linhagem de células de primatas Vero era pouco, se é que era, permissiva para ChAd83 RC1 ou ChAd83 RC2. Não foram detectados vetores ChAd83 RC1 ou ChAd83 RC2 expressos a partir de células Vero a um moi de 50. Em um moi de 250, ChAd8ê3 replicou o vetor RC1 no nível de 1,13 x 10º cópias por célula e o vetor RC?2 no nível de 1,29 x 10º cópias por célula. Exemplo 4: Expressão do Transgene a Partir de Células Murinas e de Primatas não Humanos de Vetores do Exemplo 1
[00146] AanáliseWestern blot foi realizada para comparar o nível de expressão do transgene por ChAd155 RC1 e ChAd155 RC2 em células murinas NMuLi (Figura 5(a)). As células foram infectadas com ChAd155 RC1 ou ChAd155 RC2 a uma multiplicidade de infecção de 50, 250 ou 1250 partículas virais por célula. As células foram coletadas dois e cinco dias após a infecção, extratos preparados usando métodos padrão e uma quantidade equivalente de extrato celular total carregado em géis de SDS-PAGE. Após a separação eletroforética, as proteínas foram transferidas para membranas de nitrocelulose, que foram testadas com um anticorpo monoclonal disponível comercialmente para o transgene da glicoproteína da raiva.
[00147] A Figura 5(a) demonstra que ChAd155 RC1 e ChAd155 RC2 expressam um transgene em células NMuLi murinas. A expressão foi observada dois e cinco dias após a infecção, indicada pela banda de cerca de 51 kDa, que corresponde ao peso molecular esperado da gli- coproteína da raiva (RG). O vetor ChAd155 RC2 produziu um nível mais alto de expressão de transgene do que o vetor ChAd155 RC1 dois e cinco dias após a infecção.
[00148] A análise Western blot foi então realizada para comparar o nível de expressão do transgene por ChAd155 RC1, ChAd155 RC?2, ChAd83 RC1 e ChAd83 RC2 em células NMuLi murinas (Figura 5(b)). As células foram infectadas com ChAd155 RC1, ChAd155 RC2, ChAd83 RC1 ou ChAdê3 RC2 com uma multiplicidade de infecção de 50, 250 ou 1250 partículas virais por célula (250 e 1250 para ChAd8ê3 RC1). As células foram processadas para western blot. As células foram coletadas dois e sete dias após a infecção, os extratos preparados usando métodos padrão e uma quantidade equivalente de extrato car- regado em géis de SDS-PAGE. Após a separação eletroforética, as pro- teínas foram transferidas para membranas de nitrocelulose, que foram testadas com um anticorpo monoclonal disponível comercialmente para o transgene da glicoproteína da raiva.
[00149] A Figura 5(b) demonstra que ChAd155 RC1, ChAd155 RC?2, ChAd8ê3 RC1 e ChAdê3 RC2 expressam um transgene em células NMUuLi murinas. A expressão foi observada dois e cinco dias após a in- fecção, indicada pela banda de cerca de 51 kDa, que corresponde ao peso molecular esperado da glicoproteína da raiva (RG). ChAd155 de- monstrou expressão mais eficiente do transgene que ChAd83. Dois dias após a infecção, a expressão robusta de transgene por ChAd155 RC2 foi observada mesmo na baixa multiplicidade de 50 vp/célula, enquanto a expressão robusta de transgene por ChAd155 RC1 foi observada pela primeira vez em mois mais altas. Além disso, ROC2 demonstrou expres- são de transgene mais eficiente que o RC1 nos sorotipos virais ChAd155 e ChAd83. RC?2 foi expresso com mais robustez que RC1 em cada uma das comparações diretas.
[00150] A análise Western blot foi realizada para comparar o nível de expressão do transgene por ChAd83 RC1, RC2 e RC3 em células MRCOCS5 (Figura 5(c)). As células foram infectadas com ChAd83 RC1, RC2 ou RC3 em uma multiplicidade de infecção de 250 ou 1250 partículas virais por célula. As células foram coletadas dois e sete dias após a in- fecção, os extratos preparados usando métodos padrão e uma quanti- dade equivalente de extrato celular total carregado em géis de SDS- PAGE. Após a separação eletroforética, as proteínas foram transferidas para membranas de nitrocelulose, que foram testadas com um anticorpo monoclonal disponível comercialmente para o transgene da glicoprote- ina da raiva.
[00151] A Figura 5(c) demonstra que todos os ChAd83 RC1, RC2 e RC3 expressam um transgene nas células MRC5. A expressão foi ob- servada dois e sete dias após a infecção, indicada pela banda de cerca de 51 kDa, que corresponde ao peso molecular esperado da glicoprote- ína da raiva (RG). O vetor ChAd83 RC2 produziu um nível mais alto de expressão de transgene do que os vetores ChAd83 RC1 e RC3 dois e sete dias após a infecção. Não houve detecção de glicoproteína da raiva para os vetores RC1 e RC3 nos 7 dias. Exemplo 5: Construção de Adenovírus Alternativos de Chimpanzé com um Cassete de Expressão Única
[00152] Como no Exemplo 1, adenovírus selvagens de chimpanzé tipo 155 (ChAd155) (WO 2016/198621) isolados de chimpanzés saudá- veis usando procedimentos padrão foram construídos como vírus com defeito de replicação, conforme descrito em Sci Trans! Med (2012) 4:1 e em WO 2010/086189.
[00153] No Exemplo 5, ChAd155 é construído inserindo um cassete de expressão único do transgene. Este cassete de expressão compre- ende o promotor clássico de CMV humano (hCMV), antígenos RSV FOATM, N e M2-1 e, opcionalmente, um intensificador de WPRE. Este vetor é mostrado na Figura 6. O cassete de expressão é inserido na região E1 do adenovírus (após a região E1 ter sido deletada).
[00154] —“ChAd155 mostrado na Figura 6 compreende um transgene que codifica todos os antígenos RSV FOATM, M2-1 e N, em que um sítio de auto-clivagem (“2A”) é incluído entre o antígeno RSV FOATM e o an- tígeno RSV N.M2-1 composto, no qual um ligante flexível está incluído entre os antígenos RSV M2-1 e N.
[00155] O vetor ChAd155 RSV do Exemplo 5 compõe o polinucleotí- deo da SEQ ID NO: 4, e codifica o polipeptídeo da SEQ ID NO: 5. Exemplo 6: Construção de Adenovírus de Chimpanzé com um Cassete de Expressão Duplo
[00156] “Novamente, adenovírus selvagens de chimpanzé tipo 155 (ChAd155) (WO 2016/198621) isolados de chimpanzés saudáveis usando procedimentos padrão foram construídos como vírus com de- feito de replicação, conforme descrito em Sci Trans! Med (2012) 4:1 e em WO 2010/086189.
[00157] O ChAd155 do Exemplo 6 é construído inserindo dois cas- setes de expressão de transgene em dois sítios diferentes no adenoví- rus: (1) Os primeiros componentes do cassete de expressão com- preendem o promotor clássico de CMV humano (hCMV) e o antígeno RSV N.M2-1 composto. Este primeiro cassete de expressão é inserido na região E1 do adenovírus (após a região E1 ter sido deletada). (2) O segundo cassete de expressão compreende um promotor de CMV humano clássico aprimorado (hCMV aprimorado), o antígeno RSV FOATM e um intensificador de WPRE. Este primeiro cassete de expressão é inserido na região HE2 do adenovírus (após a região HE2 ter sido deletada).
[00158] Este vetor compreendendo um cassete de expressão duplo é mostrado na Figura 7.
[00159] — No construto da Figura 7, Ad5E4orf6 foi substituído na região inicial do gene 4 (E4). A substituição é necessária para aumentar a pro- dutividade nas células HEK 293. Exemplo 7: Expressão de transgene do Cassete de Expressão Duplo do Exemplo 6
[00160] Aanálise Western blot foi realizada para comparar o nível de expressão do transgene no vetor ChAd155 do Exemplo 6 (marcado como “Duplo” ou “Cassete Duplo” nas Figuras) nas células MRC5 com: (i) um vetor compreendendo um cassete de expressão F único (ChAd155-FOATM, marcado como “FOATMm'”), (ii) um vetor compreendendo um cassete de expressão NM2 único (ChAd155-NM2, marcado como “NM2-1") e (iii) o vetor do Exemplo 5 compreendendo um cassete de ex- pressão único contendo os antígenos F e N.M2-1 RSV (ChAd155- FOATM.NM?2, também marcado como “RSV”)
[00161] Aanálise Western blot é mostrada na Figura 8 e na Figura 9.
[00162] Como mostrado na Figura 8, as células foram infectadas com ChAd155-FOATM, ChAd155-FOATM.NM2 (“RSV”) ou o cassete duplo ChAd155 do Exemplo 6 com uma multiplicidade de infecção de 500 par- tículas virais por célula. Além disso, as células foram infectadas com ChAd155-FOATM.NM2 (“RSV”) em uma multiplicidade de infecção de 500 ou 1250 partículas virais por célula. As células foram coletadas 48 horas e 96 horas após a infecção, os extratos preparados usando mé- todos padrão e uma quantidade equivalente de extrato celular total car- regado em géis de SDS-PAGE.
[00163] A Figura8 mostra que o cassete duplo ChAd155 fornece um nível de expressão do antígeno F que é comparável ao CRhAd155FOATM e superior ao ChAd155-FATM.NM?2 nas células MRC5.
[00164] Como mostrado na Figura 9, as células foram infectadas com ChAd155-NM2, ChAd155-FOATM.NM2 (“RSV”) ou o cassete duplo ChAd155 do Exemplo 6 com uma multiplicidade de infecção de 250 e 1250 partículas virais por célula. As células foram coletadas 48 horas após a infecção, os extratos preparados usando métodos padrão e uma quantidade equivalente de extrato celular total carregado em géis de
SDS-PAGE.
[00165] Na Figura 9, o cassete duplo ChAd155 fornece o nível de expressão de NM2-1 pelo menos comparável ao vetorChAd155-NM2 único e superior ao ChAd155-FATM.NM?2 (“RSV”) nas células MRC5. Exemplo 8: Imunogenicidade do Cassete de Expressão Duplo do Exem- plo 6
[00166] Aimunogenicidade do cassete de expressão duplo do Exem- plo 6 foi avaliada em camundongos CD1 (10 por grupo). O experimento foi realizado por injeção de 5x10º partículas virais por via intramuscular em camundongos. A resposta das células B foi medida 4 e 8 semanas após a imunização, medindo os títulos neutralizadores de RSV. Cada ponto representa a resposta em um único camundongo e a linha corres- ponde à média de cada grupo de doses. Os resultados desta análise são mostrados na Figura 10.
[00167] A Figura 10 mostra que o cassete duplo ChAd155 fornece uma resposta de células B comparável a CRhAd155FOATM e superior à produzida por ChAd155-FOATM.NM?2 (“RSV”).
[00168] —Aimunogenicidade do cassete de expressão duplo do Exem- plo 6 também foi avaliada em ratos BALB/c (48, 11 ou 8 por grupo). O experimento foi realizado injetando 107 ou 10º partículas virais por via intramuscular. A resposta das células T foi medida 3 semanas após a imunização por Immunospot ligado à enzima IFN-gama ex vivo (ELIS- pot) usando um epítopo de célula T do peptídeo M2 mapeado em ca- mundongos BALB/c. Os resultados são mostrados na Figura 11, expres- sos como células formadoras de pontos IFN-gama (SFC) por milhão de esplenócitos. Cada ponto representa a resposta em um único camun- dongo e a linha corresponde à média de cada grupo de doses. A dose injetada em número de partículas virais é mostrada no eixo x. Os resul- tados são mostrados na Figura 11.
[00169] A Figura 11 mostra que o cassete duplo ChAd155 fornece uma resposta de células T superior à produzida pelo cassete único ChAd155-FOATM.NM?2 (“RSV triplo”, cujos resultados são obtidos a par- tir de dados históricos). Essa diferença na resposta é maior para a dose de 10º vp.
[00170] A Figura 11 refere-se a «camundongos positivos”, isto é, o número de camundongos que responderam à vacina. Exemplo 9: Imunogenicidade do Cassete de Expressão Duplo do Exem- plo 6 em vacas
[00171] O desenho do estudo está detalhado na Tabela 2 abaixo: o jus A E RSS ARO Vacas tudo | Er E msm ro
[6] somo | ET | 5 | o pm a a sm mese | E | o os
[00172] “ChAdi55 RSV único” é o ChAd1i55 do Exemplo 5 e “ChAd155 RSV duplo” é o ChAd155 do Exemplo 6.
[00173] Um totalde 12 vacas adultas foram incluídas no estudo. As vacas variaram de 2,7 a 7,8 anos e tinham uma média de 4,8 anos.
[00174] Antes de serem inscritas no estudo, as vacas foram pré-tria- das para anticorpos para RSV bovino (BRSV) por ELISA. Isso permitiu o estabelecimento de grupos de estudo com distribuição semelhante e título médio de Ab BRSV (para não influenciar nenhum dos grupos).
[00175] As amostras foram coletadas das vacas antes da vacinação (D-5 ou DO) e após a vacinação (D7,10,14, 28, 60, 90). Neste estudo, as vacas foram vacinadas com 1x10%11 partículas virais de uma das duas vacinas ou com soro fisiológico no dia zero (DO).
[00176] Umalavagem broncoalveolar (BAL) foi realizada no dia -5, 7, ou 28 após a vacinação para isolar as células T nos pulmões da vaca. Em seguida, a produção de citocinas IFN-gama das células CD4+ e CD8+ após a estimulação com antígenos RSV (na forma de agrupamen- tos de peptídeos) codificados nas vacinas foi detectada usando colora- ção intracelular de citocinas (ICS) (ou seja, ICS para IFNy foi utilizado para detectar respostas de células T pulmonares nos animais). Os re- sultados do experimento são mostrados nas Figuras 12A e 12B. Pode- se concluir a partir deste experimento que RSV ChAd155-duplo induz respostas consistentes CD4+ e CD8+ específicas para RSV consisten- tes no lavado broncoalveolar (LBA).
[00177] Também foram coletadas amostras de sangue das vacas nos dias O, 14, 28, 60 e 90 após a vacinação para a produção de citoci- nas IFN-gama de respostas CD4+ e CD8+ específicas para RSV das células mononucleares do sangue periférico (PBMC) a ser detectada usando coloração intracelular de citocinas (ICS) (isto é, ICS para IFNy foi utilizado para detectar as respostas periféricas das células T). Os resultados do experimento são mostrados nas Figuras 13A e 13B. Com base nesses resultados, pode-se concluir que RSV ChAd155-duplo ex- pande consistentemente as respostas preexistentes CD4+ e CD8+ es- pecíficas para RSV em PBMC.
[00178] As amostras de sangue também foram utilizadas para detec- tar anticorpos neutralizantes (nÃbs) para RSV no soro (isto é, a resposta humoral periférica foi detectada). Os resultados do experimento são mostrados nas Figuras 14A e 14B. Estes resultados mostram que RSV ChAd155-duplo aumenta nAbs de RSV no soro, os quais são mantidos em níveis superiores aos valores basais 3 meses após a vacinação. Exemplo 10: Imunogenicidade de ChAd155 duplo que codifica as prote- ínas G da raiva e RS2 NM2
[00179] Três vetores ChAd155 diferentes foram construídos neste experimento: .º ChAd155 que codifica as proteínas G da raiva (RG) e RSV NM?2 (denominado “ChAd155 duplo” neste exemplo e ChAd155 duplo hCMV NM 2-1 - CASI RG WPRE); U ChAd155 que codifica apenas a proteína G da raiva (RG) (denominado “ChAd155 RG” neste exemplo e ChAd155(AE4)CASI RG
WPRE); e U O vetor ChAd155 mostrado na Figura 6, ou seja, o vetor com transgene que codifica todos os antígenos RSV FOATM, M2-1 e N (de- nominado “ChAd155 RSV”).
[00180] Três doses diferentes do adenovírus ChAd155 duplo foram administradas a camundongos: uma dose mais alta de 107 partículas virais, e uma dose média de 10º partículas virais e uma dose mais baixa de 105º partículas virais.
[00181] Duas doses diferentes dos vetores ChAd155 RG e ChAd155 RSV foram administradas aos camundongos. Para ChAd155 RSV, essa era uma dose mais alta de 10º partículas de vacina e uma dose mais baixa de 10º partículas de vacina. Para ChAd155 RG, essa era uma dose mais alta de 10º partículas de vacina e uma dose mais baixa de 105 partículas de vacina. Os camundongos foram sacrificados três se- manas depois e os esplenócitos testados por IFNy ELISpot para res- posta da célula T aos antígenos codificados pela vacina.
[00182] Os resultados deste experimento são mostrados na Figura 15A, 15B e 15C. Como pode ser visto da Figura 15A, 15B e 15C, o vetor ChAd155 duplo RG-NM2 mostra respostas imunológicas comparáveis globais aos vetores que codificam cada um dos antígenos RG e NM2 sozinhos.
[00183] A Figura 15C compara a resposta cumulativa a todos os an- tígenos codificados na dosagem comum de 10º vp usada para todos os três vetores diferentes. A proteína G da raiva é listada duas vezes (G1 e G2), pois dois conjuntos de peptídeos sobrepostos foram utilizados para cobrir toda a sequência da proteína
[00184] Portanto, a colocação dos dois antígenos no mesmo vetor produz ainda uma resposta imune comparável, permitindo que antíge- nos para diferentes patógenos sejam fornecidos no mesmo vetor. Exemplo 11: Expressão de ChAd155 duplo que codifica as proteínas G da raiva e RSV NM2 em células HeLa
[00185] — Nos experimentos do Exemplo 11, as células HeLa foram in- fectadas com o “ChAd155 duplo” purificado, “ChAd155 RG” e “ChAd155 RSV" usados no Exemplo 10.
[00186] Multiplicidades de infecção (MOI) de 50, 250 e 1250 foram utilizadas neste experimento.
[00187] Para obter o Western Blot mostrado na Figura 16A (obtido sob condições de redução), o lisado celular foi coletado 48 horas após a infecção. O tamanho estimado de NM2-1 é de 65 kDa. A Figura 16A mostra um nível de expressão comparável para o cassete ChAd155 du- plo e ChAd155 NM2-1. Além disso, o nível de expressão NM2-1 foi maior para o cassete ChAd155 duplo do que o vetor RSV ChAd155.
[00188] Para obtero Western Blot mostrado na Figura 16B, o sobre- nadante foi coletado 48 horas após a infecção. O tamanho estimado da glicoproteína da raiva é 57,6 kDa. A Figura 16B mostra um nível de ex- pressão comparável para os adenovírus ChAd155 duplo e ChAd155 RG.
[00189] Além disso, os dados de infectividade também foram coleta- dos usando os quatro vetores diferentes. A infecciosidade do vírus puri- ficado foi avaliada em células Procell 92 aderentes por Hexon Immunos- taining. Os resultados são apresentados na Tabela 3 abaixo (vp = par- tícula de vírus, ifu = unidade infecciosa e R é a razão entre esses dois números). Os resultados de infecciosidade indicam que todos os veto- res têm infecciosidade similar. Além disso, como todos os valores de R estavam abaixo de 300, a infecciosidade de todos os vetores foi consi- derada dentro da faixa de aceitabilidade. Tabela 3: E FATOS]
CASI RG WPRE
Exemplo 12: Imunogenicidade de ChAd155 duplo que codifica as prote- ínas G da raiva e RS2 E1
[00190] Dois vetores ChAd155 diferentes foram construídos neste experimento: U ChAd155 que codifica uma proteína CRPV E2 modificada em um primeiro cassete de expressão e uma proteína CRPV E1 modi- ficada em um segundo cassete de expressão (chamado “CRPV Duplo”); e . ChAd155 que codifica uma fusão das proteínas E2 e E1 de CRPV modificadas em um cassete de expressão único (chamado “Fu- são de CRPV”)
[00191] Duas doses diferentes dos dois vetores de adenovírus foram administradas a camundongos: uma dose mais elevada de 107 partícu- las virais, e uma dose mais baixa de 10º partículas virais. Os resultados deste experimento são mostrados na Figura 17. A Figura 17 é um IFNy ELISpot em esplenócitos 3 semanas após a vacinação. Uma análise estatística foi realizada sobre os resultados e as diferenças entre a res- posta dos diferentes vetores não foram consideradas estatisticamente significativas. No entanto, como pode ser visto na Figura 17, os vetores ChAd155 CRPV Duplo mostram frequência aumentada de camundon- gos que respondem na dose mais baixa que os vetores de fusão CRPV (6/6 camundongos com resposta positiva para a dose de 10º do vetor CRPV duplo, mas apenas 4/6 camundongos com resposta positiva para dose de 10º do vetor de fusão de CRPV). Exemplo 13: Expressão de ChAd155 duplo que codifica as proteínas E2 e E1 de CRPV
[00192] Os dois vetores diferentes ChAd155 usados no Exemplo 12 também foram usados no Exemplo 13.
[00193] Multiplicidades de infecção (MOI) de 250 e 1250 foram utili- zadas neste experimento. O lisado celular foi coletado 48 horas após a infecção. O tamanho estimado da proteína E1 modificada é de 48 kDa, a proteína E2 modificada é de 35 kDa e a proteína de fusão que contém as proteínas E1 e E2 modificadas é de 88 kDa.
[00194] A Figura 18 mostra um Western blot (obtido sob condições de redução) ilustrando que houve melhor expressão das proteínas E1 e E2 modificadas pelo vetor de CRPV dual do que o vetor de fusão de CRPV. As colunas “Pvj” mostradas na Figura 18 são os controles usados.
[00195] Além disso, os dados de infectividade foram coletados usan- do dois vetores diferentes. A infecciosidade do vírus purificado foi avali- ada em células Procell 92 aderentes por Hexon Immunostaining. Os re- sultados são apresentados na Tabela 4 abaixo (vp = partícula de vírus, ifu = unidade infecciosa e R é a razão entre esses dois números). Os resultados de infecciosidade indicam que os dois vetores têm infeccio- sidade similar. Além disso, como todos os valores de R estavam abaixo de 300, a infecciosidade de todos os vetores foi considerada dentro da faixa de aceitabilidade. Tabela 4:
NANA LL “Fusão CRPV" DE1 HA WPRE aprim “CRPV Duplo”
DESCRIÇÃO DAS SEQUÊNCIAS SEQ ID NO: 1 Sequência de polinucleotídeos que codifica ChAd155 selvagem CATCATCAATAATATACCTTATTTTGGATTGAAGCCAATATGATAATGAGA- TGGGCGGCGE-
CGGGGCEGCEAGECEGETCCEGEGECEGECCEGCEGECEGEGCEGTETEGCEG AAGTGGACTTTGTAAGTGTGGCGGATGTGACTTGCTAGTGCCGGGCGCEG- TAAAAGTGACG- TTTTCCGTGCGCGACAACGCCCACGGGAAGTGACATTTTTCCCGCGGTTTTT ACCGGATGTTGTAGTGAATTTGGGCGTAACCAAGTAAGATTTGGCCATTTT- CGCGGGAAAAC- TGAAACGGGGAAGTGAAATCTGATTAATTTCGCGTTAGTCATACCGCGTAAT ATTTGTCGAGGGCCGAGGGACTTTGGCCGATTACGTGGAGGACTCGCCCA- GGTG- TTTTTTGAGGTGAATTTCCGCGTTCCGGGTCAAAGTCTCCGTTTTATTATTA TAGTCAGCTGACGCGGAGTGTATTTATACCCTCTGATCTCGTCAAGTGG- CCACTCTTGAGTG- CCAGCGAGTAGAGTTTTCTCCTCTGCCGCTCTCCGCTCCGCTCCGCTCGEGCT CTGACACCGGGGAAAAAATGAGACATTTCACCTACGATGGCGGTGTGCT- CACCGGCCAG- CTGGCTGCTGAAGTCCTGGACACCCTGATCGAGGAGGTATTGGCCGATAATT ATCCTCCCTCGACTCCTTTTGAGCCACCTACACTTCACGAACTC- TACGATCTGGATGTGG- TGGGGCCCAGCGATCCGAACGAGCAGGCGGTTTCCAGTTTTTTTCCAGAGTC CATGTTGTTGGCCAGCCAGGAGGGGGTCGAACTTGAGAC- CCCTCCTCCGATCGTGGATT- CCCCCGATCCGCCGCAGCTGACTAGGCAGCCCGAGCGCTEGTGCGGGACCTGA GACTATGCCCCAGCTGCTACCTGAGGTGATCGATCTCACCTGTAATGAG- TCTGGTTTTCCAC- CCAGCGAGGATGAGGACGAAGAGGGTGAGCAGTTTGTGTTAGATTCTGTGGA ACAACCCGGGCGAGGATGCAGGTCTTGTCAATATCACCGGAAAAACACAG- GAGACTCCCAGA- TTATGTGTTCTCTGTGTTATATGAAGATGACCTGTATGTTTATTTACAGTAA GTTTATCATCTGTGGGCAGGTGGGCTATAGTGTGGGTGGTGGÇ- TCTTTGGGGGGTTTTTTAA- TATATGTCAGGGGTTATGCTGAAGACTTTTTTATTGTGATTTTTAAAGGTCC AGTGTCTGAGCCCGAGCAAGAACCTGAACCGGAGCCTGAGCCTTCTCG- CCCCAGGAGAAAG- CCTGTAATCTTAACTAGACCCAGCGCACCGGTAGCGAGAGGCCTCAGCAGCG CGGAGACCACCGACTCCGGTGCTTCCTCATCACCCCCGGAGATTCAC- CCCCTGGTGCCCCTGE- TGTCCCGTTAAGCCCGTTGCCGTGAGAGTCAGTGGGCGGCGGTCTGCTGTGEGG AGTGCATTGAGGACTTGCTTTTTGATTCACAGGAACCTTTGGACTTGAG- CTTGAAACG- CCCCAGGCATTAAACCTGGTCACCTGGACTGAATGAGTTGACGCCTATGTTT GCTTTTGAATGACTTAATGTGTATAGATAATAAAGAGTGAGATAATGTTT- TAATTGCATGG- TGTGTTTAACTTGGGCGGAGTCTGCTGGGTATATAAGCTTCCCTGGGCTAAA CTTGGTTACACTTGACCTCATGGAGGCCTGGGAGTGTTTGGAGAACTTTG- CCGGAGTTCGTG- CCTTGCTGGACGAGAGCTCTAACAATACCTCTTGGTGGTGGAGGTATTTGTG GGGCTCTCCCCAGGGCAAGTTAGTTTGTAGAATCAAGGAGGATTACAAG- TGGGAA- TTTGAAGAGCTTTTGAAATCCTGTGGTGAGCTATTGGATTCTTTGAATCTAG GCCACCAGGCTCTCTTCCAGGAGAAGGTCATCAGGACTTTGGATTTTTCCA- CACCGGGGCG- CATTGCAGCCGCGGTTGCTTTTCTAGCTTTTTTGAAGGATAGATGGAGCGAA GAGACCCACTTGAGTTCGGGCTACGTCCTGGATTTTCTGGCCATGCAACTG- TGGAGAGCATG- GATCAGACACAAGAACAGGCTGCAACTGTTGTCTTCCGTCCGCCCGTTGCTG ATTCCGGCGGAGGAGCAACAGGCCGGGTCAGAGGACCGGGCCCGETCGGGA- TCCGGAGGA- GAGGGCACCGAGGCCGGGCGAGAGGAGCGCGCTGAACCTGGGAACCGGGCTG AGCGGCCATCCACATCGGGAGTGAATGTCGGGCAGGTGGTGGATCTTTTT- CCAGAACTGCGG- CGGATTTTGACTATTAGGGAGGATGGGCAATTTGTTAAGGGTCTTAAGAGGG AGAGGGGGGCTTCTGAGCATAACGAGGAGGCCAGTAATTTAGCTTTTAG- CTTGATGACCAGA- CACCGTCCAGAGTGCATCACTTTTCAGCAGATTAAGGACAATTGTGCCAATG AGTTGGATCTGTTGGGTCAGAAGTATAGCATAGAGCAGCTGACCACTTAC- TGGCTGCAG- CCGGGTGATGATCTGGAGGAAGCTATTAGGGTGTATGCTAAGGTGGCCCTGC GGCCCGATTGCAAGTACAAGCTCAAGGGGCTGGTGAATATCAGGAATTG- TTGCTACATTT- CTGGCAACGGGGCGGAGGTGGAGATAGAGACCGAAGACAGGGTGGCTTTCAG ATGCAGCATGATGAATATGTGGCCGGGGGTCGCTGGGCATGGACGGGGTGEG- TGATTATGAATG- TGAGGTTCACGGGGCCCAACTTTAACGGCACGGTGTTTTTGGGGAACACCAA CCTGGTCCTGCACGGGGTGAGCTTCTATGGGTTTAACAACACCTGTGTGGA- GGCCTGGAC- CGATGTGAAGGTCCGCGGTTGCGCCTTTTATGGATGTTGGAAGGCCATAGTG AGCCGCCCTAAGAGCAGGAGTTCCATTAAGAAATGCTTGTTTGAGAGGTG- CACCTTGGGGA- TCCTGGCCGAGGGCAACTGCAGGGTGCGCCACAATGTGGCCTCCGAGTGCGEG TTGCTTCATGCTAGTCAAGAGCGTGGCGGTAATCAAGCATAATATGGTGTG- CGGCAACAG- CGAGGACAAGGCCTCACAGATGCTGACCTGCACGGATGGCAACTGCCACTTG CTGAAGACCATCCATGTAACCAGCCACAGCCGGAAGGCCTGGCCCGTGTT- CGAGCACAAC- TTGCTGACCCGCTGCTCCTTGCATCTGGGCAACAGGCGGGGGGTGTTCCTGC CCTATCAATGCAACTTTAGTCACACCAAGATCTTGCTAGAGCCCGAGAG- CATGTCCAAGG- TGAACTTGAACGGGGTGTTTGACATGACCATGAAGATCTGGAAGGTGCTGAG GTACGACGAGACCAGGTCCCGGTGCAGACCCTGCGAGTGCGGGGGCAAGCA- TATGAGGAAC- CAGCCCGTGATGCTGGATGTGACCGAGGAGCTGAGGACAGACCACTTGGTTC TGGCCTGCACCAGGGCCGAGTTTGGTTCTAGCGATGAAGACACAGA- TTGAGGTGGGTGAG- TGGGCGTGGCCTGGEGTGGTCATGAAAATATATAAGTTGGGGGTCTTAGGGT CTCTTTATTTGTGTTGCAGAGACCGCCGGAGCCATGAGCGGGAGCAGCAG- CAGCAGCAGTAG- CAGCAGCGCCTTGGATGGCAGCATCGTGAGCCCTTATTTGACGACGCGGATG CCCCACTGGGCCEGEGTCCETCAGAATGTGATGGGCTCCAGCATCGACGG- CCGACCCG- TCCTGCCCGCAAATTCCGCCACGCTGACCTATGCGACCGTCGCGGGGACGECC GTTGGACGCCACCGCCGCCGCCEGCCGCCACCGCAGCCGCCTCGGCCGTGCGÇ- CAGCCTGG- CCACGGACTTTGCATTCCTGGGACCACTGGCGACAGGGGCTACTTCTCGGGC CGCTGCTGCCECCETTCGCGATGACAAGCTGACCGCCCTGCTGGCGECAG- TTGGATGCGCT- TACTCGGGAACTGGGTGACCTTTCTCAGCAGGTCATGGCCCTGCGCCAGCAG GTCTCCTCCCTGCAAGCTGGCGGGAATGCTTCTCCCACAAATGCCGTTTAA- GATAAA- TAAAACCAGACTCTGTTTGGATTAAAGAAAAGTAGCAAGTGCATTGCTCTCT TTATTTCATAATTTTCCGCGCGCGATAGGCCCTAGACCAGCGTTCTCGG- TCGTTGAGGGTG- CGGTGTATCTTCTCCAGGACGTGGTAGAGGTGGCTCTGGACGTTGAGATACA TGGGCATGAGCCCGTCCCGGGGGTEGAGGTAGCACCACTGCAGAGCTT- CATGCTCCGGGG- TGGTGTTGTAGATGATCCAGTCGTAGCAGGAGCGCTGGGCATGGTGCCTAAA AATGTCCTTCAGCAGCAGGCCGATGGCCAGGGGGAGGCCCTTGGTGTAAG- TGTTTA- CAAAACGGTTAAGTTGGGAAGGGTGCATTCGGGGAGAGATGATGTGCATCTT GGACTGTATTTTTAGATTGGCGATGTTTCCGCCCAGATCCCTTCTGGGATT- CATGTTGTGCA- GGACCACCAGTACAGTGTATCCGGTGCACTTGGGGAATTTGTCATGCAGCTT AGAGGGAAAAGCGTGGAAGAACTTGGAGACGCCTTTGTGGCCTCCCAGA- TTTTCCATGCATT- CGTCCATGATGATGGCAATGGGCCCGCEGGAGGCAGCTTGGGCAAAGATATT TCTGGGGTCGCTGACGTCGTAGTTGTGTTCCAGGGTGAGGTCGTCATAGG- CCATTTTTA- CAAAGCGCGGGCGGAGGGTGCCCGACTGGGGGATGATGGTCCCCTCTGGCCC TGGGGCGTAGTTGCCCTCGCAGATCTGCATTTCCCAGGCCTTAATCTCGGA- GGGGGGAATCA- TATCCACCTGCGGGGCGATGAAGAAAACGGTTTCCGGAGCCGGGGAGATTAA CTGGGATGAGAGCAGGTTTCTAAGCAGCTGTGATTTTCCACAACCGGTGGG- CCCATAAATAA- CACCTATAACCGGTTGCAGCTGGTAGTTTAGAGAGCTGCAGCTGCCGTCGTC CCGGAGGAGGGGGGCCACCTCGTTGAGCATGTCCCTGACGCGCATGTT- CTCCCCGACCAGA- TCCGCCAGAAGGCGCTCGCCEGCCCAGGGACAGCAGCTCTTGCAAGGAAGCAA AGTTTTTCAGCGGCTTGAGGCCGTCCGCCGTGGGCATGTTTTTCAGGG- TCTGGCTCAGCAG- CTCCAGGCGGTCCCAGAGCTCGGTGACGTGCTCTACGGCATCTCTATCCAGC ATATCTCCTCGTTTCGCGGGTTGGGGCGACTTTCGCTGTAGGGCACCAAG- CGGTGGTCG- TCCAGCGGGGCCAGAGTCATGTCCTTCCATGGGCGCAGGGTCCTCGETCAGGEG TGGTCTGGGTCACGGTGAAGGGGTGCGCTCCGGGCTGAGCGCTTGCCAAGG- TGCGCTTGAGG- CTGGTTCTGCTGGTGCTGAAGCGCTGCCGGTCTTCGCCCTGCGCGETCGGCCA GGTAGCATTTGACCATGGTGTCATAGTCCAGCCCCTCCGCGGCGTGE- TCCCTTGGCGCGCAG- CTTGCCCTTGGAGGTGGCGCCGCACGAGGGGCAGAGCAGGCTCTTGAGCGCG TAGAGCTTGGGGGCGAGGAAGACCGATTCGGGGGAGTAGGCGTCCGCGCCG- CAGACCCCGCA- CACGGTCTCGCACTCCACCAGCCAGGTGAGCTCGGGGCGCGCCGGETCAAAA ACCAGGTTTCCCCCATGCTTTTTGATGCGTTTCTTACCTCGGG- TCTCCATGAGGTGGTG- TCCCCGCTCGGETGACGAAGAGGCTGTCCGTGTCTCCGTAGACCGACTTGAGG GGTCTTTTCTCCAGGGGGGTCCCTCGGTCTTCCTCGTAGAGGAACTCGGAC- CACTCTGAGA- CGAAGGCCCGCGTCCAGGCCAGGACGAAGGAGGCTATGTGGGAGGGGTAGCG GTCGTTGTCCACTAGGGGGTCCACCTTCTCCAAGGTGTGAAGACACATG- TCGCCTTCCTCGG- CGTCCAGGAAGGTGATTGGCTTGTAGGTGTAGGCCACGTGACCGGGGGTTCC TGACGGGGGGGTATAAAAGGGGGTGGGGGCGCGCTCGTCGTCACTCTCTT- CCGCATCGCTG- TCTGCGAGGGCCAGCTGCTGGGGTGAGTATTCCCTCTCGAAGGCGGGCATGA CCTCCGCGCTGAGEGTTGTCAGTTTCCAAAAACGAGGAGGATTTGATGTT- CACCTG- TCCCGAGGTGATACCTTTGAGGGTACCCGCGTCCATCTGGTCAGAAAACACG ATCTTTTTATTGTCCAGCTTGGTGGCGAACGACCCGTAGAGGGCGTTGGA- GAGCAGCTTGG- CGATGGAGCGCAGGGTCTGGTTCTTGTCCCTGTCGGCGCGCTCCTTGGECCGC GATGTTGAGCTGCACGTACTCGCGCGCGACGCAGCGCCACTCGGGGAAGA- CGGTGGTGCGE- CTCGTCGGGCACCAGGCGCACGCGCCAGCCGCEGTTETGCAGGGTGACCAGG TCCACGCTGGTGGCGACCTCGCCGCGCAGGCGCTCGTTGGTCCAGCAGAGA- CGGCCG- CCCTTGCGCGAGCAGAAGGGGGGCAGGGGGTCGAGCTGGGTCTCGETCCGEGEG GGTCCGCGTCCACGGTGAAAACCCCGGGGCGCAGGCGCGCGTCGAAGTAG- TCTATCTTG- CAACCTTGCATGTCCAGCGCCTGCTGCCAGTCGCGGGCEGCGAGCGCGCGCT CGTAGGGGTTGAGCGGCGGGCCCCAGGGCATGGGCGTGGETCGAGTGCGGAGGE- CGTACATGCCG- CAGATGTCATAGACGTAGAGGGGCTCCCGCAGGACCCCGATGTAGGTGGGGÇT AGCAGCGGCCGCCGCGEGATGCTGGCGCGCACGTAGTCATACAGCTCGTG- CGAGGGGGCGAG- GAGGTCGGGGCCCAGGTTGGTGCEGECEGEGCECTCCECGCGGAAGACGATC TGCCTGAAGATGGCATGCGAGTTGGAAGAGATGGTGGGGCGCTGGAAGACG- TTGAAGCTGG- CGTCCTGCAGGCCGACGGCGTCGCGCACGAAGGAGGCGTAGGAGTCGCGCAG CTTGTGTACCAGCTCGGCGGTGACCTGCACGTCGAGCGCGCAGTAG- TCGAGGGTCTCGCGGA- TGATGTCATATTTAGCCTGCCCCTTCTTTTTCCACAGCTCGCGGTTGAGGAC AAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGGAAACCGTCCGGTT- CCGAACGG- TAAGAGCCTAGCATGTAGAACTGGTTGACGGCCTGGTAGGCGCAGCAGCCCT TCTCCACGGGGAGGGCGTAGGCCTGCGCGEGCCTTGCEGAGCGAGGTGETGEGGÇE- TCAGGG- CGAAGGTGTCCCTGACCATGACTTTGAGGTACTGGTGCTTGAAGTCGGAGTC GTCGCAGCCGCCCCGCTCCCAGAGCGAGAAGTCGGTGCGCTTCTTGGAG- CGGGGGTTGGGCA- GAGCGAAGGTGACATCGTTGAAGAGGATTTTGCCCGCGCGGGGCATGAAGTT GCGGGTGATGCGGAAGGGCCCCGGCACTTCAGAGCGGTTGTTGATGAC- CTGGGCGGCGAG- CACGATCTCGTCGAAGCCGTTGATGTTGTGGCCCACGATGTAGAGTTCCAGG AAGCGGGGCCGGCCCTTTACGGTGGGCAGCTTCTTTAGCTCTTCGTAGG- TGAGCTCCTCGGG- CGAGGCGAGGCCGTGCTCGGCCAGGGCCCAGTCCGCGAGGTGCGGGTTETCT CTGAGGAAGGACTTCCAGAGGTCGCGGGCCAGGAGGGTCTGCAGGCGG- TCTCTGAAGG- TCCTGAACTGGCGGCCCACGGCCATTTTTTCGGGGGTGATGCAGTAGAAGGT GAGGGGGTCTTGCTGCCAGCGGTCCCAGTCGAGCTGCAGGGCGAGGTCGCG- CGCGGCGGTGA- CCAGGCGCTCGTCGCCCCCGAATTTCATGACCAGCATGAAGGGCACGAGCTG CTTTCCGAAGGCCCCCATCCAAGTGTAGGTCTCTACATCGTAGGTGA- CAAAGAGGCGCTCCG- TGCGAGGATGCGAGCCGATCGGGAAGAACTGGATCTCCCGCCACCAGTTGGA GGAGTGGCTGTTGATGTGGTGGAAGTAGAAGTCCCGTCGCCGGGCCGAACA- CTCGTGCTGG- CTTTTGTAAAAGCGAGCGCAGTACTGGCAGCGCTGCACGGGCTGTACCTCAT GCACGAGATGCACCTTTCGCCCGCGCACGAGGAAGCCGAGGGGAAA- TCTGAGCCCCCCG- CCTGGCTCGCGGCATGGCTGGTTCTCTTCTACTTTGGATGCGTGTCCGTCTC CGTCTGGCTCCTCGAGGGGTGTTACGGTGGAGCGGACCACCACGCCGCG- CGAGCCGCAGG- TCCAGATATCGGCGCGCGGCGGTCGEGAGTTTGATGACGACATCGCGCAGCTG GGAGCTGTCCATGGTCTGGAGCTCCCGCEGCEGCEGCAGETCAGCCGGGAGÇG- TTCTTGCAGG- TTCACCTCGCAGAGTCGGGCCAGGGCGCGGGGCAGGTCTAGGTGGTACCTGA TCTCTAGGGGCGTEGTTGEGTGGCGGCEGTCGATGGCTTGCAGGAGCCCGCAG- CCCCGEGEGEG- CGACGACGGTGCCCCGCGEGEGTEGTEGTEGTEGTCEGCEGTCGCAGCTCAGAAG CGGTGCCGCEGECEGECCCCCEGAGETAGGGGEGGGCTCCGGTCCCGCEGGE- CAGGGGCGGCAG- CGGCACGTCGGCGTGGAGCGCGGGCAGGAGTTGGTGCTEGTGCCCGGAGGETTGÇ CTGGCGAAGGCGACGACGCGGCGGTTGATCTCCTGGATCTGGCGCCTCTG- CGTGAAGACGA- CGGGCCCGGTGAGCTTGAACCTGAAAGAGAGTTCGACAGAATCAATCTCGGT GTCATTGACCGCGGCCTGGCGCAGGATCTCCTGCACGTCTCCCGAGTTG- TCTTGGTAGG- CGATCTCGGCCATGAACTGCTCGATCTCTTCCTCCTGGAGGTCTCCGCGTCC GGCGCGTTCCACGGTGGCCGCCAGGTCGTTGGAGATGCGCCCCATGAGCTG- CGAGAAGGCG- TTGAGTCCGCCCTCGTTCCAGACTCGGCTGTAGACCACGCCCCCCTGGTCAT CGCEGECECECATGACCACCTGCGCGAGETTGAGCTCCACGTGCCGCG- CGAAGACGGCGTAG- TTGCGCAGACGCTGGAAGAGGTAGTTGAGGGTGGTGGCEGTETCCTCGGECCA CGAAGAAGTTCATGACCCAGCGGCGCAACGTGGATTCGTTGATG- TCCCCCAAGGCCTCCAG- CCGTTCCATGGCCTCGTAGAAGTCCACGGCGAAGTTGAAAAACTGGGAGTTG CGCGCCGACACGGTCAACTCCTCCTCCAGAAGACGGATGAGCTCGGCGA- CGGTGTCGCGCAC- CTCGCGCTCGAAGGCTATGGGGATCTCTTCCTCCGCTAGCATCACCACCTCC TCCTCTTCCTCCTCTTCTGGCACTTCCATGATGGCTTCCTCCTCTT- CGGGCGCGETEGCEGCEG- CGGCEGTEGEGEAGEGEGCGCTCTGCGECCEGCEGCEGCECACCGGGAGECEG TCCACGAAGCGCGCGATCATCTCCCCGCGECEGCEGCGCATGGTCTCGG- TGACGGCGCGG- CCGTTCTCCCGGEGECECAGTTGGAAGACGCCGCCGGACATCTGGTGCTGGGÇE GCGGGTGGCCGTGAGGCAGCGAGACGGCGCTGACGATGCATCTCAACAA- TTGCTGCGTAGG- TACGCCGCCGAGGGACCTGAGGGAGTCCATATCCACCGGATCCGAAAACCTT TCGAGGAAGGCGTCTAACCAGTCGCAGTCGCAAGGTAGGCTGAGCACCG- TGGCGGGCGEG- CGGGEGCGETEGGEGCGGAGTGTCTGGCGGAGGTGCTGCTGATGATGTAATTGAAG TAGGCGGACTTGACACGGCGGATGGTCGACAGGAGCACCATGTCCTTGGG- TCCGGCCTGCTG-
GATGCGGAGGCGGTCGGCTATGCCCCAGGCTTCGTTCTGGCATCGGCGCAGGE TCCTTGTAGTAGTCTTGCATGAGCCTTTCCACCGGCACCTCTTCTCCTT- CCTCTTCTGCTT- CTTCCATGTCTGCTTCGGCCCTGEGEGCEGCECCGCGCCCCCeTGCCCCCCAT GCGCGTGACCCCGAACCCCCTGAGCGGTTGGAGCAGGGCCAGGTCGGCGA- CGACGCGCTCGG-
CCAGGATGGCCTGCTGCACCTGCGTGAGGGTGGTTTGGAAGTCATCCAAGTC CACGAAGCGGTGGTAGGCGCCCGTGTTGATGGTGTAGGTGCAGTTGG- CCATGACGGACCAG- TTGACGGTCTGGTGGCCCGEGTTGCGACATCTCGGTGTACCTGAGTCGCGAGT AGGCGCGGGAGTCGAAGACGTAGTCGTTGCAAGTCCGCACCAGGTACTGG- TAGCCCACCAG- GAAGTGCGGCGGCGGCTGGCGGTAGAGGGGCCAGCGCAGGGTGGCEGEGÇGCT CCGGGGGCCAGGTCTTCCAGCATGAGGCGGTGGTAGGCGTAGATGTACCTG- GACATCCAGG- TGATACCCGCGGCGETGETGGAGGCGCGCGGGAAGTCGCGCACCCGGTTCCA GATGTTGCGCAGGGGCAGAAAGTGCTCCATGGTAGGCGTGCTCTGTCCAGT- CAGACGCGCG- CAGTCGTTGATACTCTAGACCAGGGAAAACGAAAGCCGGTCAGCGGGCACTC TTCCGTGGTCTGGTGAATAGATCGCAAGGGTATCATGGCGGAGGGCCTCGG- TTCGAG- CCCCGGETCCEGECCEGACGEGTCCGCCATGATCCACGCGGTTACCGCCCGCG TGTCGAACCCAGGTGTGCGACGTCAGACAACGGTGGAGTGTTCCTTTTGG- CGTTTTTCTGG- CCGGEGCECCEEGCECCECETAAGAGACTAAGCCGCGAAAGCGAAAGCAGTAAG TGGCTCGCTCCCCGETAGCCGGAGGGATCCTTGCTAAGGGTTGCGTTGCGEG- CGAACCCCGGTT-
CGAATCCCGTACTCGGGCCGGCCGGACCCGCGEGCTAAGGTGTTGGATTGGCC TCCCCCTCGTATAAAGACCCCGCTTGCGGATTGACTCCGGACACGGGGA- CGAGCCCCTTTTA- TTTTTGCTTTCCCCAGATGCATCCGGTGCTGCGGCAGATGCGCCCCCEGEce CAGCAGCAGCAACAACACCAGCAAGAGCGGCAGCAACAGCAGCGGGAGT>- CATGCAGGG-
CCCCCTCACCCACCCTCGGCGGECCEGCCACCETCGGCGTCCGCGEGCCGETEGTC TGGCGCCTGCEGCEGCEGCEGEGEGCCEGCTEACGACCCCGAGGAG- CCCCCGCGEGCGCAGEG- CCAGACACTACCTGGACCTGGAGGAGGGCGAGGGCCTGGCGCEGCTEGEGÇSCÇ GCCGTCTCCCGAGCGCCACCCGCGGETECAGCTGAAGCGCGACTCGCG- CGAGGCGTACGTG- CCTCGGCAGAACCTGTTCAGGGACCGCGCEGGECGAGGAGCCCGAGGAGATGC GGGACAGGAGGTTCAGCGCAGGGCGGGAGCTGCGGCAGGGGCTGAACCG- CGAGCGGCTGCTG- CGCGAGGAGGACTTTGAGCCCGACGCGCGGACGGGGATCAGCCCCGCGCGECGS CGCACGTGGCGGCCGCCGACCTGGTGACGGCGTACGAGCAGACGGTGAAC- CAGGAGATCAAC- TTCCAAAAGAGTTTCAACAACCACGTGCGCACGCTGGTGGCGCGCGAGGAGG TGACCATCGGGCTGATGCACCTGTGGGACTTTGTAAGCGCGCTGGTGCA- GAACCCCAACAG- CAAGCCTCTGACGGCGCAGCTGTTCCTGATAGTGCAGCACAGCAGGGACAAC GAGGCGTTTAGGGACGCGCTGCTGAACATCACCGAGCCCGAGGGTCGGTGG- CTGCTGGAC- CTGATTAACATCCTGCAGAGCATAGTGGTGCAGGAGCGCAGCCTGAGCCTGG CCGACAAGGTGGCGGCCATCAACTACTCGATGCTGAGCCTGGGCAAGTTT- TACGCGCGCAA- GATCTACCAGACGCCGTACGTGCCCATAGACAAGGAGGTGAAGATCGACGGT TTTTACATGCGCATGGCGCTGAAGGTGCTCACCCTGAGCGACGACCTGGG- CGTGTACCG- CAACGAGCGCATCCACAAGGCCGTGAGCGTGAGCCGGCEGCGCGAGCTGAGC GACCGCGAGCTGATGCACAGCCTGCAGCGGGCGCTGEGCEGECECCGEGCAGÇG- CGGCGACAGGGA- GGCGGAGTCCTACTTCGATGCGGGGGCGGACCTGCECTEGECECCCAGCEGGE CGGGCCCTGGAGECCGCEGEGETCCECGAGGACTATGACGAGGACGGCGAG- GAGGATGAGGA- GTACGAGCTAGAGGAGGGCGAGTACCTGGACTAAACCGCGGGTGGTGTTTCCÇ GGTAGATGCAAGACCCGAACGTGGTGGACCCGGCGCTGCGGGCGGCTCTGE- CAGAGCCAGCCG- TCCGGCCTTAACTCCTCAGACGACTGGCGACAGGTCATGGACCGCATCATGT CGCTGACGGCGCGTAACCCGGACGCGTTCCGGCAGCAGCCGCAGGCCAACA- GGCTCTCCG- CCATCCTGGAGGCGGTGGTGCCTGCGCEGCTCGAACCCCACGCACGAGAAGGT GCTGGCCATAGTGAACGCGCTGGCCGAGAACAGGGCCATCCGCCCGGA- CGAGGCCGGGCTGGE- TGTACGACGCGCTGCTGCAGCGCGTGGCCCGCTACAACAGCGGCAACGTGCA GACCAACCTGGACCGGCTGGTGGGGCGGACGTGCGCGAGGCEGEGTEGCEGCAGCGE- CGAGCGCGCG- GATCGGCAGGGCAACCTGGGCTCCATGGTGGCGCTGAATGCCTTCCTGAGCA CGCAGCCGGCCAACGTGCCGCGGGGGCAGGAAGACTACACCAACTTTG- TGAGCGCGCTGCGG- CTGATGGTGACCGAGACCCCCCAGAGCGAGGTGTACCAGTCGGGCCCGGACT ACTTCTTCCAGACCAGCAGACAGGGCCTGCAGACGGTGAACCTGAGCCAGG- CTTTCAAGAAC- CTGCGGGGGCTEGTGGGGCEGTGAAGGCGCCCACCGGCGACCGGGCGACGGTECT CCAGCCTGCTGACGCCCAACTCGCGCCTGCTGCTGCTGCTGATCGCGCCG- TTCACGGACAG- CGGCAGCGTGTCCCGGGACACCTACCTGGGGCACCTGCTGACCCTGTACCGC GAGGCCATCGGGCAGGCGCAGGTGGACGAGCACACCTTCCAGGAGATCAC- CAGCGTGAGCCG- CGCGCTGGGGCAGGAGGACACGAGCAGCCTGGAGGCGACTCTGAACTACCTG CTGACCAACCGGCGGCAGAAGATTCCCTCGCTGCACAGCCTGACCTCCGAG- GAGGAGCG- CATCTTGCGCTACGTGCAGCAGAGCGTGAGCCTGAACCTGATGCGCGACGGG GTGACGCCCAGCGTGGCGCTGGACATGACCGCGCGCAACATGGAACCGGG- CATGTACGCCG- CGCACCGGCCTTACATCAACCGCCTGATGGACTACCTGCATCGCGCGGCGGC CGTGAACCCCGAGTACTTTACCAACGCCATCCTGAACCCGCACTGG- CTCCCGCCGCCCGGGE- TTCTACAGCGGGGGCTTCGAGGTCCCGGAGACCAACGATGGCTTCCTGTGGG ACGACATGGACGACAGCGTGTTCTCCCCGCGECCGECAGECGCTGGCGEGAAG- CGTCCCTGCTG- CGTCCCAAGAAGGAGGAGGAGGAGGAGGCGAGTCGCCGCCGCEGCAGCAGCG GCGTGGCTTCTCTGTCCGAGCTGGGGEGCEGCAGCCGCCECGCECCCCGGGE- TCCCTGGGCGGE- CAGCCCCTTTCCGAGCCTGGTGGGGTCTCTGCACAGCGAGCGCACCACCCGC CCTCGGCTGCTGEGCGAGGACGAGTACCTGAATAACTCCCTGCTGCAG- CCGGTGCGGGA- GAAAAACCTGCCTCCCGCCTTCCCCAACAACGGGATAGAGAGCCTGGTGGAC AAGATGAGCAGATGGAAGACCTATGCGCAGGAGCACAGGGACGCGCCTGCG- CTCCGGCCG- CCCACGCGGCGCCAGCGCCACGACCGGCAGCGGGGECTEGTGTGGGATGACG AGGACTCCGCGGACGATAGCAGCGTGCTGGACCTGGGAGGGAGCGGCAAC- CCGTTCGCGCAC- CTGCGCCCCCGCCTGGGEGAGGATGTTTTAAAAAAAAAAAAAAAAAGCAAGAA GCATGATGCAAAAATTAAATAAAACTCACCAAGGCCATGGCGACCGAGCG- TTGGTTTCTTG- TGTTCCCTTCAGTATGCGGCGCGCGGCGATGTACCAGGAGGGACCTCCTCCC TCTTACGAGAGCGTGGTGGGCGCEGCEGCEGCEGCGCCCTCTT- CTCCCTTTGCGTCGCAG- CTGCTGGAGCCGCCGTACGTGCCTCCGCGCTACCTGCGGCCTACGGGGGGÇA GAAACAGCATCCGTTACTCGGAGCTGGCGCCCCTGTTCGACACCACCCGGG- TGTACCTGGTG- GACAACAAGTCGGCGGACGTGGCCTCCCTGAACTACCAGAACGACCACAGCA ATTTTTTGACCACGGTCATCCAGAACAATGACTACAGCCCGAGCGAGGCCA- GCACCCAGAC- CATCAATCTGGATGACCGGTCGCACTGGGGCGGCGACCTGAAAACCATCCTG CACACCAACATGCCCAACGTGAACGAGTTCATGTTCACCAATAAGTT- CAAGGCGCGGG- TGATGGTGTCGCGCTCGCACACCAAGGAAGACCGGGTGGAGCTGAAGTACGA GTGGGTGGAGTTCGAGCTGCCAGAGGGCAACTACTCCGAGACCATGAC- CATTGAC- CTGATGAACAACGCGATCGTGGAGCACTATCTGAAAGTGGGCAGGCAGAACG GGGTCCTGGAGAGCGACATCGGGGTCAAGTTCGACACCAGGAACTTCCG- CCTGGGGCTGGAC- CCCGTGACCGGGCTGGTTATGCCCGEGGTEGTACACCAACGAGGCCTTCCATC CCGACATCATCCTGCTGCCCGGCTGCEGEGTCGGACTTCACTTACAGCCG- CCTGAGCAAC- CTCCTGGGCATCCGCAAGCGGCAGCCCTTCCAGGAGGGCTTCAGGATCACCT ACGAGGACCTGGAGGGGGGCAACATCCCCGCGCTCCTCGATGTGGAGGCC- TACCAGGATAG- CTTGAAGGAAAATGAGGCGGGACAGGAGGATACCGCCCCCGCCGCCTCCGCC GCCGCCGAGCAGGGCGAGGATGCTGCTGACACCGCGGCCGCGGACGEGGGCA- GAGGCCGAC- CCCGCTATGGTGETGGAGGCTCCCGAGCAGGAGGAGGACATGAATGACAGTG CGGTGCGCGGAGACACCTTCGTCACCCGGGGGGAGGAAAAGCAAGCGGAGG- CCGAGGCCG- CGGCCGAGGAAAAGCAACTGGCGGCAGCAGCGGCEGCEGCEGCETTEGCEGC GGCGGAGGCTGAGTCTGAGGGGACCAAGCCCGCCAAGGAGCCCGTGAT- TAAGCCCCTGAC- CGAAGATAGCAAGAAGCGCAGTTACAACCTGCTCAAGGACAGCACCAACACC GCGTACCGCAGCTGGTACCTGGCCTACAACTACGGCGACCCGTCGA- CGGGGGTGCGCTCCTG- GACCCTGCTGTGCACGCCGGACGTGACCTGCGGCTCGGAGCAGGTGTACTGG TCGCTGCCCGACATGATGCAAGACCCCGTGACCTTCCGCTCCACGCGGCA- GGTCAGCAACTT- CCCGETEGTEGECECCGAGCTGCTGCCCGTGCACTCCAAGAGCTTCTACAAC GACCAGGCCGTCTACTCCCAGCTCATCCGCCAGTTCACCTCTCTGAC- CCACGTGTTCAATCG- CTTTCCTGAGAACCAGATTCTGGCGCGCCCGCCCGCCCCCACCATCACCACC GTCAGTGAAAACGTTCCTGCTCTCACAGATCACGGGACGCTACCGCTGCG- CAACAGCATCG- GAGGAGTCCAGCGAGTGACCGTTACTGACGCCAGACGCCGCACCTGCCCCTA CGTTTACAAGGCCTTGGGCATAGTCTCGCCGCGCETCCTTTCCAGCCGCAC- TTTTTGAGCAA- CACCACCATCATGTCCATCCTGATCTCACCCAGCAATAACTCCGGCTGGGGA CTGCTGCGCGCGCCCAGCAAGATGTTCGGAGGGGCGAGGAAGCGTTCCGAG- CAGCACCCCG- TGCGCGTGCGCEGECACTTCCGCGCCCCCTGGGGAGCGCACAAACGCGGCCG CGCGGGGCGCACCACCGTGGACGACGCCATCGACTCGGTGGTGGAGCAGG- CGCGCAACTACA- GGCCCGCGETCTCTACCGTGGACGCGGCCATCCAGACCGTGGTGCEGEGCÇC GCGGCGGTACGCCAAGCTGAAGAGCCGCCGGAAGCGCGETGGCCCGCEG- CCACCGCCGCCGAC- CCGGGGCCGCCGCCAAACGCGCCGCCGCEGCCCTGCTTCGCCGEGECCAAGCG CACGGGCCGCCGCGCCGECCATGAGGGCCGCGCGECCECTTGGCCGCCGGCAT- CACCGCCG-
CCACCATGGCCCCCCGTACCCGAAGACGCGCEGCCECCECCGCCGCEGCEGC CATCAGTGACATGGCCAGCAGGCGCCGGGGCAACGTGTACTGGGTGCGCGA- CTCGGTGAC- CGGCACGCGCGTGCCCGTGCEGCTTCCGCCCCCeGeGGACTTGAGATGATGTG AAAAAACAACACTGAGTCTCCTGCTGTTGTGTGTATCCCAGCGGCGGCGG- CGCGCGCAGCGT-
CATGTCCAAGCGCAAAATCAAAGAAGAGATGCTCCAGGTCGTCGCGCCGGAG ATCTATGGGCCCCCGAAGAAGGAAGAGCAGGATTCGAAGCCCCGCAAGA- TAAAGCGGGT- CAAAAAGAAAAAGAAAGATGATGACGATGCCGATGGGGAGGTGGAGTTCCTG CGCGCCACGGCGCCCAGGCGCCCGETECAGTGGAAGGGCCGGCGCGTAAAG- CGCGTCCTGCG- CCCCGGCACCGCEGTEGTCTTCACGCCCGGCEAGCGCTCCACCCGGACTTTC AAGCGCGTCTATGACGAGGTGTACGGCGACGAAGACCTGCTGGAGCAGG- CCAACGAGCGCTT- CGGAGAGTTTGCTTACGGGAAGCGTCAGCGGGCGCTGGGGAAGGAGGACCTG CTGGCGCTGCCGCTGGACCAGGGCAACCCCACCCCCAGTCTGAAGCCCG- TGACCCTGCAGCA- GGTGCTGCCGAGCAGCGCACCCTCCGAGGCGAAGCGGGGTCTGAAGCGCGAG GGCGGCGACCTGGCGCCCACCGTGCAGCTCATGGTGCCCAAGCGGCAGAGG- CTGGAGGATG- TGCTGGAGAAAATGAAAGTAGACCCCGGTCTGCAGCCGGACATCAGGGTCCG CCCCATCAAGCAGGTGGCGCCEGECCTCEGCETGCAGACCGTGGACGTGGT- CATCCCCAC- CGGCAACTCCCCCGCCGCCGCCACCACTACCGCTGCCTCCACGGACATGGAG ACACAGACCGATCCCGCCGCAGCCGCAGCCGCAGCCGCCGCCGCGAC- CTCCTCGGCGGAGGE- TGCAGACGGACCCCTGGCTGCCGCCGGCGATGTCAGCTCCCCGCGCGCETCGE CGGGCGCAGGAAGTACGGCGCCGCCAACGCGCTCCTGCCCGAGTACG- CCTTGCATCCTT- CCATCGCGCCCACCCCCGGCTACCGAGGCTATACCTACCGCCCGCGAAGAGC CAAGGGTTCCACCCGCCGTCCCCGCCGACGCGCCGCCGCCACCACCCGCCG- CCGCCGCCGCA- GACGCCAGCCCGCACTGGCTCCAGTCTCCGTGAGGAAAGTGGCGCGCGACEG ACACACCCTGGTGCTGCCCAGGGCGCGCTACCACCCCAGCATCGTT- TAAAAGCCTGTTGTGG- TTCTTGCAGATATGGCCCTCACTTGCCGCCTCCGTTTCCCGGETGCCGGGATA CCGAGGAGGAAGATCGCGCCGCAGGAGGGGTCTGGCCGGCCGECGGCCTGAG- CGGAGGCAG- CCGCCGCGECECACCEGGCEGCGACGCGCCACCAGCCGACGCATGCGCGEGCEGGÇ GTGCTGCCCCTGTTAATCCCCCTGATCGCCGCGEGCGATCGGCGCCETE- CCCGGGATCG- CCTCCGTGGCCTTGCAAGCGTCCCAGAGGCATTGACAGACTTGCAAACTTGC AAATATGGAAAAAAAAACCCCAATAAAAAAGTCTAGACTCTCACGCTCG- CTTGGTCCTGTGA- CTATTTTGTAGAATGGAAGACATCAACTTTGCGTCGCTGGCCCCGCETCACG GCTCGCGCCCETTCCTGGGACACTGGAACGATATCGGCACCAGCAACA- TGAGCGGTGGCG- CCTTCAGTTGGGGCTCTCTGTGGAGCGGCATTAAAAGTATCGGGTCTGCCGT TAAAAATTACGGCTCCCGGGCCTGGAACAGCAGCACGGGCCAGATG- TTGAGAGACAAG- TTGAAAGAGCAGAACTTCCAGCAGAAGGTGGTGGAGGGCCTGGCCTCCGGCA TCAACGGGGTGGTGGACCTGGCCAACCAGGCCGTGCAGAATAAGATCAACA- GCAGACTGGAC- CCCCEGECCECCEGTEGAGGAGGTGCCGCCGECECTEGAGACGGTGTCCCCEG ATGGGCGTGGCGAGAAGCGCCCGCEGCCCGATAGGGAAGAGACCACTCTGG- TCACGCAGAC- CGATGAGCCGCCCCCGTATGAGGAGGCCCTGAAGCAAGGTCTGCCCACCACG CGGCCCATCGCGCCCATGGCCACCGGGGTEGTEGGEGCCGCCACACCCCCG- CCACGCTGGAC- TTGCCTCCGCCCGCCGATGTGCCGCAGCAGCAGAAGGCGGCACAGCCGGGCC CGCCCGCGACCGCCTCCEGTTCCTCCGCCGGTCCTCTGCGCCGCGCGGCCA- GCGGCCCCCG- CGGGGCGGETCGCGAGGCACGGCAACTGGCAGAGCACGCTGAACAGCATCGTG GGTCTGGGGGTGCEGTCCGETGAAGCGCCGCCGATGCTACTGAATAGCTTAG- CTAACGTGTTG- TATGTGTGTATGCGCCCTATGTCGCCGCCAGAGGAGCTGCTGAGTCGCCGCC GTTCGCGCGCCCACCACCACCGCCACTCCGCCCCTCAAGATGGCGAC- CCCATCGATGATG- CCGCAGTGGTCGTACATGCACATCTCGGGCCAGGACGCCTCGGAGTACCTGA GCCCCGGECTEGTGCAGTTCGCCCGCGCCACCGAGAGCTACTTCAG- CCTGAGTAACAAGTT- TAGGAACCCCACGGTGGCGCCCACGCACGATGTGACCACCGACCGGTCTCAG CGCCTGACGCTGCEGTTCATTCCCGTGGACCGCGAGGACACCGCGTACTCG- TACAAGGCG- CGGTTCACCCTGGCCGTGEGCGACAACCGCGTGCTEGACATGGCCTCCACCT ACTTTGACATCCGCGGGGTGCTGGACCGGGGTCCCACTTTCAAGCCCTAC- TCTGGCACCGCC- TACAACTCCCTGGCCCCCAAGGGCGCTCCCAACTCCTGCGAGTGGGAGCAAG AGGAAACTCAGGCAGTTGAAGAAGCAGCAGAAGAGGAAGAAGAAGATG- CTGACGGTCAAG- CTGAGGAAGAGCAAGCAGCTACCAAAAAGACTCATGTATATGCTCAGGCTCC CCTTTCTGGCGAAAAAATTAGTAAAGATGGTCTGCAAATAGGAACGGACGC- TACAGCTACA- GAACAAAAACCTATTTATGCAGACCCTACATTCCAGCCCGAACCCCAAATCG GGGAGTCCCAGTGGAATGAGGCAGATGCTACAGTCGCCGGCGGTAGAGTGC- TAAAGAAATC- TACTCCCATGAAACCATGCTATGGTTCCTATGCAAGACCCACAAATGCTAAT GGAGGTCAGGGTGTACTAACGGCAAATGCCCAGGGACAGCTAGAATCTCA- GGTTGAAATGCA- ATTCTTTTCAACTTCTGAAAACGCCCGTAACGAGGCTAACAACATTCAGCCC AAATTGGTGCTGTATAGTGAGGATGTGCACATGGAGACCCCGGATACGCAC- CTTTCTTA- CAAGCCCGCAAAAAGCGATGACAATTCAAAAATCATGCTGGGTCAGCAGTCC ATGCCCAACAGACCTAATTACATCGGCTTCAGAGACAACTTTATCGGCCT- CATGTATTACAA- TAGCACTGGCAACATGGGAGTGCTTGCAGGTCAGGCCTCTCAGTTGAATGCA GTGGTGGACTTGCAAGACAGAAACACAGAACTGTCCTACCAGCTCTTG- CTTGATTCCATGGG- TGACAGAACCAGATACTTTTCCATGTGGAATCAGGCAGTGGACAGTTATGAC CCAGATGTTAGAATTATTGAAAATCATGGAACTGAAGACGAGCTCCCCAAC- TATTGTTT- CCCTCTGGGTGGCATAGGGGTAACTGACACTTACCAGGCTGTTAAAACCAAC AATGGCAATAACGGGGGCCAGGTGACTTGGACAAAAGATGAAACTTTTGCA- GATCGCAA- TGAAATAGGGGTGGGAAACAATTTCGCTATGGAGATCAACCTCAGTGCCAAC CTGTGGAGAAACTTCCTGTACTCCAACGTGGCGCTGTACCTACCAGACAAG- CTTAAGTA- CAACCCCTCCAATGTGGACATCTCTGACAACCCCAACACCTACGATTACATG AACAAGCGAGTGGTGGCCCCGEGGCGCTGGTGGACTGCTACATCAACCTGGG- CGCGCGCTGCGG- TCGCTGGACTACATGGACAACGTCAACCCCTTCAACCACCACCGCAATGCGG GCCTGCGCTACCGCTCCATGCTCCTGGGCAACGGGCGCTACGTGCCCTT- CCACATCCAGGTG- CCCCAGAAGTTCTTTGCCATCAAGAACCTCCTCCTCCTGCCGGGCTCCTACA CCTACGAGTGGAACTTCAGGAAGGATGTCAACATGGTCCTCCAGAG- CTCTCTGGG- TAACGATCTCAGGGTGGACGGGGCCAGCATCAAGTTCGAGAGCATCTGCCTC TACGCCACCTTCTTCCCCATGGCCCACAACACGGCCTCCACGCTCGAGG- CCATGCTCAGGA- ACGACACCAACGACCAGTCCTTCAATGACTACCTCTCCGCCGCCAACATGCT CTACCCCATACCCGCCAACGCCACCAACGTCCCCATCTCCATCCCCTCGCG- CAACTGGGCGG- CCTTCCGCGGCTEGECCTTCACCCGCCTCAAGACCAAGGAGACCCCCTCCCT GGGCTCGGGATTCGACCCCTACTACACCTACTCGGGCTCCATTCCCTAC- CTGGACGGCAC- CTTCTACCTCAACCACACTTTCAAGAAGGTCTCGGTCACCTTCGACTCCTCG GTCAGCTGGCCGGGCAACGACCGTCTGCTCACCCCCAACGAGTTCGAGAT- CAAGCGCTCGG- TCGACGGGGAGGGCTACAACGTGGCCCAGTGCAACATGACCAAGGACTGGTT CCTGGTCCAGATGCTGGCCAACTACAACATCGGCTACCAGGGCTTCTACA- TCCCAGAGAGC- TACAAGGACAGGATGTACTCCTTCTTCAGGAACTTCCAGCCCATGAGCCGGC AGGTGGTGGACCAGACCAAGTACAAGGACTACCAGGAGGTGGGCAT- CATCCACCAGCACAA- CAACTCGGGCTTCGTGGGCTACCTCGCCCCCACCATGCGCGAGGGACAGGCC TACCCCGCCAACTTCCCCTATCCGCTCATAGGCAAGACCGCGGTCGACAG- CATCACCCA- GAAAAAGTTCCTCTGCGACCGCACCCTCTGGCGCATCCCCTTCTCCAGCAAC TTCATGTCCATGGGTGCGCTCTCGGACCTGGGCCAGAACTTGCTCTACG- CCAACTCCG- CCCACGCCCTCGACATGACCTTCGAGGTCGACCCCATGGACGAGCCCACCCT TCTCTATGTTCTGTTCGAAGTCTTTGACGTGGTCCGGGTCCACCAGCCG- CACCGCGGCGT- CATCGAGACCGTGTACCTGCGTACGCCCTTCTCGGCCGGCAACGCCACCACC TAAAGAAGCAAGCCGCAGTCATCGCCGCCTGCATGCCGTCGGGTTCCAC- CGAGCAAGAGCT- CAGGGCCATCGTCAGAGACCTGGGATGCGGGCCCTATTTTTTGGGCACCTTC GACAAGCGCTTCCCTGGCTTTGTCTCCCCACACAAGCTGGCCTGCG- CCATCGTCAACACGG- CCGGCCECGAGACCGGEGEGCGTECACTGGCTEGCCTTCGCCTGGAACCCGCG CTCCAAAACATGCTTCCTCTTTGACCCCTTCGGCTTTTCGGACCAGCGGCT- CAAGCAAATC- TACGAGTTCGAGTACGAGGGCTTGCTGCGTCGCAGCGCCATCGCCTCCTCGC CCGACCGCTGCGETCACCCTCGAAAAGTCCACCCAGACCGTGCAGGGG- CCCGACTCGGCCG- CCTGCGGETCTCTTCTGCTGCATGTTTCTGCACGCCTTTGTGCACTGGCCTCA GAGTCCCATGGACCGCAACCCCACCATGAACTTGCTGACGGGGGTG- CCCAACTCCATG- CTCCAGAGCCCCCAGGTCGAGCCCACCCTGCGCCGCAACCAGGAGCAGCTCT ACAGCTTCCTGGAGCGCCACTCGCCTTACTTCCGCCGCCACAGCGCACAGA- TCAGGAGGG- CCACCTCCTTCTGCCACTTGCAAGAGATGCAAGAAGGGTAATAACGATGTAC ACACTTTTTTTCTCAATAAATGGCATCTTTTTATTTATACAAG- CTCTCTGGGGTATTCATTT- CCCACCACCACCCGCCGTTGTCGCCATCTGGCTCTATTTAGAAATCGAAAGG GTTCTGCCGGGAGTCGCCGTGCECCACGGGCAGGGACACGTTGCGATAC- TGGTAGCGGGTG- CCCCACTTGAACTCGGGCACCACCAGGCGAGGCAGCTCGGGGAAGTTTTCGC TCCACAGGCTGCGGGTCAGCACCAGCGCGTTCATCAGGTCGGGCGCCGAGA- TCTTGAAGTCG- CAGTTGGGGCCGCCGCCCTGCECGCEGCGAGTTGCGGTACACCGGGTTGCAGC ACTGGAACACCAACAGCGCCGGGTGCTTCACGCTGGCCAGCACGCTGCGG- TCGGAGATCAG- CTCGGCEGTCCAGGTCCTCCGCGTTGCTCAGCGCGAACGGGGTCATCTTGGGC ACTTGCCGCCCCAGGAAGGGCGCGTGCCCCGETTTCGAGTTGCAGTCGCAG- CGCAGCGGGAT- CAGCAGGTGCCCGTGCCCGGACTCGGECEGTTGGGGTACAGCGCGCGCATGAAG GCCTGCATCTGGCGGAAGGCCATCTGGGCCTTGGCGCCCTCCGAGAAGAA- CATGCCGCAGGA- CTTGCCCGAGAACTGGTTTGCGGGGCAGCTGGCGTCEGTGCAGGCAGCAGCGC GCGTCGGTGTTGGCGATCTGCACCACGTTGCGCCCCCACCGGTTCTT- CACGATCTTGG- CCTTGGACGATTGCTCCTTCAGCGCGCGCTGCCCGETTCTCGCTGGTCACATC CATCTCGATCACATGTTCCTTGTTCACCATGCTGCTGCCGTGCAGACACTT- CAGCTCG- CCCTCCGTCTCGGTGCAGCGETGCTEGCCACAGCGCGCAGCCCGTGEGCTCÇA AAGACTTGTAGGTCACCTCCGCGAAGGACTGCAGGTACCCCTGCAAAAAG- CGGCCCAT- CATGGTCACGAAGGTCTTGTTGCTGCTGAAGGTCAGCTGCAGCCCGCGGTGC TCCTCGTTCAGCCAGGTCTTGCACACGGCCGCCAGCGCCTCCACCTGG- TCGGGCAG- CATCTTGAAGTTCACCTTCAGCTCATTCTCCACGTGGTACTTGTCCATCAGC GTGCGCGCCGCCTCCATGCCCTTCTCCCAGGCCGACACCAGCGGCAGGCT- CACGGGGTTCTT- CACCATCACCGTGGCCGCCECCTCCGCCGECGECTTTCGECTTTCCGCCCCGCTG TTCTCTTCCTCTTCCTCCTCTTCCTCGCCGCCGCCCACTCGCAGCCCCCGE- CACCACGGGG- TCGTCTTCCTGCAGGCGCTGCACCTTGCGCTTGCCGTTGCGCCCCTGCTTGA TGCGCACGGGCGGGTTGCTGAAGCCCACCATCACCAGCGCGGCCTCTT- CTTGCTCGTCCTCG- CTGTCCAGAATGACCTCCGGGGAGGGGGGGCGTTEGGTCATCCTCAGTACCGAGG CACGCTTCTTTTTCTTCCTGGGGGCGTTCGCCAGCTCCGCGGCTGCGGCCGE- CTGCCGAGG- TCGAAGGCCGAGGGCTGGGCETGCECGECACCAGCGCGTCCTGCGAGCCGTC CTCGTCCTCCTCGGACTCGAGACGGAGGCGGGCCCGCTTCTTCGGGGGCGE- CGCEGGGCGGCE- GAGGCGGCGGCGGCGACGGAGACGGGGACGAGACATCGTCCAGGGTGGGTEG ACGGCGGGCCGCGCCGCETCCGCECTCEGGEGGECGTGGTCTCGCGCTGEG- TCCTCTTCCCGACTGG- CCATCTCCCACTGCTCCTTCTCCTATAGGCAGAAAGAGATCATGGAGTCTCT CATGCGAGTCGAGAAGGAGGAGGACAGCCTAACCGCCCCCTCTGAG- CCCTCCACCACCGCCG- CCACCACCGCCAATGCCGCCGCGEGACGACGCGCCCACCGAGACCACCGCCAG TACCACCCTCCCCAGCGACGCACCCCCGCTCGAGAATGAAGTG- CTGATCGAGCAGGAC- CCGGGTTTTGTGAGCGGAGAGGAGGATGAGGTGGATGAGAAGGAGAAGGAGG AGGTCGCCGCCTCAGTGCCAAAAGAGGATAAAAAGCAAGACCAGGACGACG- CAGATAAGGA- TGAGACAGCAGTCGGGCGGGGGAACGGAAGCCATGATGCTGATGACGGCTAC CTAGACGTGGGAGACGACGTGCTGCTTAAGCACCTGCACCGCCAGTGCGT- CATCGTCTGCGA- CGCGCTGCAGGAGCGCTGCGAAGTGCCCCTGGACGTGGCGGAGGTCAGCCGC GCCTACGAGCGGCACCTCTTCGCGCCGCACGTGCCCCCCAAGCGCCGGGA- GAACGGCACCTG- CGAGCCCAACCCGCGTCTCAACTTCTACCCGGTCTTCGCGGTACCCGAGGTG CTGGCCACCTACCACATCTTTTTCCAAAACTGCAAGATCCCCCTCTCCTG- CCGCGCCAACCG- CACCCGCGCCGACAAAACCCTGACCCTGCGGCAGGGCGCCCACATACCTGAT ATCGCCTCTCTGGAGGAAGTGCCCAAGATCTTCGAGGGTCTCGGTCGCGA- CGAGAAACGGG- CGGCGAACGCTCTGCACGGAGACAGCGAAAACGAGAGTCACTCGGGGGTGCT GGTGGAGCTCGAGGGCGACAACGCGCGCCTGGCCETACTCAAGCGCAGCA- TAGAGGTCAC- CCACTTTGCCTACCCGGCGCTCAACCTGCCCCCCAAGGTCATGAGTGTGGTC ATGGGCGAGCTCATCATGCGCCGCGCCCAGCCCCTGECCGCGGATGCAAAC- TTGCAAGAG- TCCTCCGAGGAAGGCCTGCCCGCEGTCAGCGACGAGCAGCTGGCGCGECTEGC TGGAGACCCGCGACCCCGCGCAGCTGGAGGAGCGGCGCAAGCTCATGATGG- CCGCGGTG- CTGGTCACCGTGGAGCTCGAGTGTCTGCAGCGCTTCTTCGCGGACCCCGAGA TGCAGCGCAAGCTCGAGGAGACCCTGCACTACACCTTCCGCCAGGGCTACG- TGCGCCAGG- CCTGCAAGATCTCCAACGTGGAGCTCTGCAACCTGGTCTCCTACCTGGGCAT CCTGCACGAGAACCGCCTCGGGCAGAACGTCCTGCACTCCACCCT- CAAAGGGGAGGCGCG- CCGCGACTACATCCGCGACTGCGCCTACCTCTTCCTCTGCTACACCTGGCAG ACGGCCATGGGGGTCTGGCAGCAGTGCCTGGAGGAGCGCAACCTCAAGGAG- CTGGAAAAG- CTCCTCAAGCGCACCCTCAGGGACCTCTGGACGGGCTTCAACGAGCGCTCGG TGGCCGCCGCECTEGCGGACATCATCTTTCCCGAGCGCCTGCTCAAGAC- CCTGCAGCAGGG- CCTGCCCGACTTCACCAGCCAGAGCATGCTGCAGAACTTCAGGACTTTCATC CTGGAGCGCTCGGGCATCCTGCCGGCCACTTGCTGCGCGCTGCCCAGCGAC- TTCGTGCCCAT- CAAGTACAGGGAGTGCCCGCCGCCGCTCTGEGECCACTGCTACCTCTTCCAG CTGGCCAACTACCTCGCCTACCACTCGGACCTCATGGAAGACGTGAGCGG- CGAGGGCCTG- CTCGAGTGCCACTGCCGCTGCAACCTCTGCACGCCCCACCGCTCTCTAGTCT GCAACCCGCAGCTGCTCAGCGAGAGTCAGATTATCGGTACCTTCGAGCTG- CAGGGTCCCTCG- CCTGACGAGAAGTCCGCGGCTCCAGGGCTGAAACTCACTCCGGGGCTGEGTGGÇGA CTTCCGCCTACCTACGCAAATTTGTACCTGAGGACTACCACGCCCACGAGA- TCAGGTTC- TACGAAGACCAATCCCGCCCGCCCAAGGCGGAGCTCACCGCCTGCGTCATCA CCCAGGGGCACATCCTGGGCCAATTGCAAGCCATCAACAAAGCCCG- CCGAGAGTTCTTG-
CTGAAAAAGGGTCGGGGGGTGTACCTGGACCCCCAGTCCGGCGAGGAGCTAA ACCCGCTACCCCCGCCGCCGCCCcAGCAGCGGGACCTTGCTTCCCAGGA- TGGCACCCA-
GAAAGAAGCAGCAGCCGCCGCCGCCECCEGCAGCCATACATGCTTCTGGAGGA AGAGGAGGAGGACTGGGACAGTCAGGCAGAGGAGGTTTCGGACGAGGAGCA- GGAGGAGA- TGATGGAAGACTGGGAGGAGGACAGCAGCCTAGACGAGGAAGCTTCAGAGGC CGAAGAGGTGGCAGACGCAACACCATCGCCCTCGGEGTCGCAGCCCCCTCG- CCGGEGG- CCCCTGAAATCCTCCGAACCCAGCACCAGCGCTATAACCTCCGCTCCTCCGG CGCCGGCGCCACCCGCCCGCAGACCCAACCGTAGATGGGACACCACAGGA- ACCGGGGTCGG- TAAGTCCAAGTGCCCGCCGCCGCCACCGCAGCAGCAGCAGCAGCAGCGCCAG GGCTACCGCTCGTGGCGCGGGCACAAGAACGCCATAGTCGCCTGCTTGCAA- GACTGCGGGGG- CAACATCTCTTTCGCCCGCCGCTTCCTGCTATTCCACCACGGGGTCGCCTTT CCCCGCAATGTCCTGCATTACTACCGTCATCTCTACAGCCCCTACTGCAG- CGGCGACCCA- GAGGCGGCAGCGGCAGCCACAGCGGCGACCACCACCTAGGAAGATATCCTCC GCGGGCAAGACAGCGGCAGCAGCGGCCAGGAGACCCGCGGCAGCAGCGG- CGGGAGCGGTGGG- CGCACTGCGCCTCTCGCCCAACGAACCCCTCTCGACCCGGGAGCTCAGACAC AGGATCTTCCCCACTTTGTATGCCATCTTCCAACAGAGCAGAGGCCAGGAG- CAGGAG- CTGAAAATAAAAAACAGATCTCTGCGCTCCCTCACCCGCAGCTGTCTGTATC ACAAAAGCGAAGATCAGCTTCGGCGCACGCTGGAGGACGCGGAGGCAC- TCTTCAGCAAATAC- TGCGCGCTCACTCTTAAAGACTAGCTCCGCGCCCTTCTCGAATTTAGGCGGG AGAAAACTACGTCATCGCCGGCCGCCGCCCAGCCCGCCCAGCCGAGATGAG- CAAAGAGATT- CCCACGCCATACATGTGGAGCTACCAGCCGCAGATGGGACTCGCGGCGGGAG CGGCCCAGGACTACTCCACCCGCATGAACTACATGAGCGCGGGACCCCACA- TGATCTCACA- GGTCAACGGGATCCGCGCCCAGCGAAACCAAATACTGCTGGAACAGGCGGCC ATCACCGCCACGCCCCGCCATAATCTCAACCCCCGAAATTGGCCCGCCG- CCCTCGTGTACCA- GGAAACCCCCTCCGCCACCACCGTACTACTTCCGCGTGACGCCCAGGCCGAA GTCCAGATGACTAACTCAGGGGCGCAGCTCGCGGGCGGCTTTCGET- CACGGGGCGCGGCCG- CTCCGACCAGGTATAAGACACCTGATGATCAGAGGCCGAGGTATCCAGCTCA ACGACGAGTCGGTGAGCTCTTCGCTCGGTCTCCGTCCGGACGGAACTTT- CCAGCTCGCCGGA- TCCGGCCECTCTTCGTTCACGCCCCGCCAGGCGTACCTGACTCTGCAGACCT CGTCCTCGGAGCCCCGCTCCGGCGECATCGGAACCCTCCAGTTCGTGGAG- GAGTTCGTG- CCCTCGGTCTACTTCAACCCCTTCTCGGGACCTCCCGGACGCTACCCCGACE AGTTCATTCCGAACTTTGACGCGGTGAAGGACTCGGCGGACGGCTACGAC- TGAATGTCAGG- TGTCGAGGCAGAGCAGCTTCGCCTGAGACACCTCGAGCACTGCCGCCGCCAC AAGTGCTTCGCCCGCEGTTCTGGTGAGTTCTGCTACTTTCAGCTACCCGAG- GAGCATAC- CGAGGGGCCGGCGCACGGCETCCGCCTGACCACCCAGGGCGAGGTTACCTGT TCCCTCATCCGGGAGTTTACCCTCCGTCCCCTGCTAGTGGAGCGGGAG- CGGGGTCCCTGTG- TCCTAACTATCGCCTGCAACTGCCCTAACCCTGGATTACATCAAGATCTTTG CTGTCATCTCTGTGCTGAGTTTAATAAACGCTGAGATCAGAATCTAC- TGGGGCTCCTGTCG- CCATCCTGTGAACGCCACCGTCTTCACCCACCCCGACCAGGCCCAGGCGAAC CTCACCTGCGGTCTGCATCGGAGGGCCAAGAAGTACCTCACCTGGTACTT- CAACGGCAC- CCCCTTTGTGGTTTACAACAGCTTCGACGGGGACGGAGTCTCCCTGAAAGAC CAGCTCTCCGGTCTCAGCTACTCCATCCACAAGAACACCACCCTCCAAC- TCTTCCCTCCC- TACCTGCCGGGAACCTACGAGTGCGTCACCGGCCGCTGCACCCACCTCACCC GCCTGATCGTAAACCAGAGCTTTCCGGGAACAGATAACTCCCTCTTCCCCA- GAACAGGAGG- TGAGCTCAGGAAACTCCCCGGGGACCAGGGCGGAGACGTACCTTCGACCCTT GTGGGGTTAGGATTTTTTATTACCGGGTTGCTGGCTCTTTTAATCAAAG- TTTCCTTGAGA- TTTGTTCTTTCCTTCTACGTGTATGAACACCTCAACCTCCAATAACTCTACC CTTTCTTCGGAATCAGGTGACTTCTCTGAAATCGGGCTTGGTGTGCTGCT- TACTCTG- TTGATTTTTTTCCTTATCATACTCAGCCTTCTGTGCCTCAGGCTCGCCGCCT GCTGCGCACACATCTATATCTACTGCTGGTTGCTCAAGTGCAGGGGTCG- CCACCCAAGA- TGAACAGGTACATGGTCCTATCGATCCTAGGCCTGCTGGCCCTGGCGEGCCTGE CAGCGCCGCCAAAAAAGAGATTACCTTTGAGGAGCCCGCTTGCAATGTAAC- TTTCAAG- CCCGAGGGTGACCAATGCACCACCCTCGTCAAATGCGTTACCAATCATGAGA GGCTGCGCATCGACTACAAAAACAAAACTGGCCAGTTTGCGGTCTATAGTG- TGTTTACG- CCCGGAGACCCCTCTAACTACTCTGTCACCGTCTTCCAGGGCGGACAGTCTA AGATATTCAATTACACTTTCCCTTTTTATGAGTTATGCGATGCGGTCATG- TACATGTCAAAA- CAGTACAACCTGTGGCCTCCCTCTCCCCAGGCGTGTGTGGAAAATACTGGGT CTTACTGCTGTATGGCTTTCGCAATCACTACGCTCGCTCTAATCTGCACGG- TGCTATACA- TAAAATTCAGGCAGAGGCGAATCTTTATCGATGAAAAGAAAATGCCTTGATC GCTAACACCGGCTTTCTATCTGCAGAATGAATGCAATCACCTCCCTACTAA- TCACCACCAC- CCTCCTTGCGATTGCCCATGGGTTGACACGAATCGAAGTGCCAGTGGGGTCCÇ AATGTCACCATGGTGGGCCCCGCCGGCAATTCCACCCTCATGTGGGAAAAA- TTTGTCCGCAA- TCAATGGGTTCATTTCTGCTCTAACCGAATCAGTATCAAGCCCAGAGCCATC TGCGATGGGCAAAATCTAACTCTGATCAATGTGCAAATGATGGATGCTGGG- TACTAT- TACGGGCAGCGGGGAGAAATCATTAATTACTGGCGACCCCACAAGGACTACA TGCTGCATGTAGTCGAGGCACTTCCCACTACCACCCCCACTACCAC- CTCTCCCACCACCAC- CACCACTACTACTACTACTACTACTACTACTACTACTACCACTACCGCTGCC CGCCATACCCGCAAAAGCACCATGATTAGCACAAAGCCCCCTCGTGCTCAC- TCCCACGCCGG- CGGGCCCATCGGTGCGACCTCAGAAACCACCGAGCTTTGCTTCTGCCAATGC ACTAACGCCAGCGCTCATGAACTGTTCGACCTGGAGAATGAGGATGTCCAG- CAGAGCTCCG- CTTGCCTGACCCAGGAGGCTGTGGAGCCCGTTGCCCTGAAGCAGATCGGTGA TTCAATAATTGACTCTTCTTCTTTTGCCACTCCCGAATACCCTCCCGATTC- TACTTTCCACA- TCACGGGTACCAAAGACCCTAACCTCTCTTTCTACCTGATGCTGCTGCTCTG TATCTCTGTGGTCTCTTCCGCGCTGATGTTACTGGGGATGTTCTGCTG- CCTGATCTGCCGCA- GAAAGAGAAAAGCTCGCTCTCAGGGCCAACCACTGATGCCCTTCCCCTACCC CCCGGATTTTGCAGATAACAAGATATGAGCTCGCTGCTGACACTAACCG- CTTTACTAGCCTG- CGCTCTAACCCTTGTCGCTTGCGACTCGAGATTCCACAATGTCACAGCTGTG GCAGGAGAAAATGTTACTTTCAACTCCACGGCCGATACCCAGTGGTCGTG- GAGTGGCTCAGG- TAGCTACTTAACTATCTGCAATAGCTCCACTTCCCCCGGCATATCCCCAACC AAGTACCAATGCAATGCCAGCCTGTTCACCCTCATCAACGCTTCCACCCTG- GACAATGGAC- TCTATGTAGGCTATGTACCCTTTGGTGGGCAAGGAAAGACCCACGCTTACAA CCTGGAAGTTCGCCAGCCCAGAACCACTACCCAAGCTTCTCCCACCACCAC- CACCACCAC- CACCATCACCAGCAGCAGCAGCAGCAGCAGCCACAGCAGCAGCAGCAGATTA TTGACTTTGGTTTTGGCCAGCTCATCTGCCGCTACCCAGGCCATCTACAG- CTCTGTG- CCCGAAACCACTCAGATCCACCGCCCAGAAACGACCACCGCCACCACCCTAC ACACCTCCAGCGATCAGATGCCGACCAACATCACCCCCTTGGCTCTTCAAA- TGGGACTTA- CAAGCCCCACTCCAAAACCAGTGGATGCGGCCGAGGTCTCCGCCCTCGTCAA TGACTGGGCGGGGCTGGGAATGTGGTGGTTCGCCATAGGCATGATGGCG- CTCTGCCTGCTT- CTGCTCTGGCTCATCTGCTGCCTCCACCGCAGGCGAGCCAGACCCCCCATCT ATAGACCCATCATTGTCCTGAACCCCGATAATGATGGGATCCATAGATTG- GATGG- CCTGAAAAACCTACTTTTTTCTTTTACAGTATGATAAATTGAGACATGCCTC GCATTTTCTTGTACATGTTCCTTCTCCCACCTTTTCTGGGGTGTTCTACG- CTGGCCGCTGTGE- TCTCACCTGGAGGTAGACTGCCTCTCACCCTTCACTGTCTACCTGCTTTACG GATTGGTCACCCTCACTCTCATCTGCAGCCTAATCACAGTAATCATCG- CCTTCATCCAGTG- CATTGATTACATCTGTGTGCGCCTCGCATACTTCAGACACCACCCGCAGTAC CGAGACAGGAACATTGCCCAACTTCTAAGACTGCTCTAATCATGCATAAGA- CTGTGATCTG- CCTTCTGATCCTCTGCATCCTGCCCACCCTCACCTCCTGCCAGTACACCACA AAATCTCCGCGCAAAAGACATGCCTCCTGCCGCTTCACCCAACTGTGGAA- TATACCCAAATG- CTACAACGAAAAGAGCGAGCTCTCCGAAGCTTGGCTGTATGGGGTCATCTGT GTCTTAGTTTTCTGCAGCACTGTCTTTGCCCTCATAATCTACCCCTAC- TTTGATTTGGGATG- GAACGCGATCGATGCCATGAATTACCCCACCTTTCCCGCACCCGAGATAATT CCACTGCGACAAGTTGTACCCGTTGTCGTTAATCAACGCCCCCCATCCCC- TACGCCCAC- TGAAATCAGCTACTTTAACCTAACAGGCGGAGATGACTGACGCCCTAGATCT AGAAATGGACGGCATCAGTACCGAGCAGCGTCTCCTAGAGAGGCGCAGGCA- GGCGGCTGAG- CAAGAGCGCCTCAATCAGGAGCTCCGAGATCTCGTTAACCTGCACCAGTGCA AAAGAGGCATCTTTTGTCTGGTAAAGCAGGCCAAAGTCACCTACGAGAAGA- CCGGCAACAG- CCACCGCCTCAGTTACAAATTGCCCACCCAGCGCCAGAAGCTGGTGCTCATG GTGGGTGAGAATCCCATCACCGTCACCCAGCACTCGGTAGAGACCGAGGGG- TGTCTGCAC- TCCCCCTGTCGGGETCCAGAAGACCTCTGCACCCTGGTAAAGACCCTGTGCG GTCTCAGAGATTTAGTCCCCTTTAACTAATCAAACACTGGAATCAA- TAAAAAGAATCACT- TACTTAAAATCAGACAGCAGGTCTCTGTCCAGTTTATTCAGCAGCACCTCCT TCCCCTCCTCCCAACTCTGGTACTCCAAACGCCTTCTGGCGGCAAACTT- CCTCCACAC- CCTGAAGGGAATGTCAGATTCTTGCTCCTGTCCCTCCGCACCCACTATCTTC ATGTTGTTGCAGATGAAGCGCACCAAAACGTCTGACGAGAGCTTCAAC- CCCGTGTACCCCTA- TGACACGGAAAGCGGCCCTCCCTCCGTCCCTTTCCTCACCCCTCCCTTCGTG TCTCCCGATGGATTCCAAGAAAGTCCCCCCGGGETCCTGTCTCTGAAC- CTGGCCGAG- CCCCTGGTCACTTCCCACGGCATGCTCGCCCTGAAAATGGGAAGTGGCCTCT CCCTGGACGACGCTGGCAACCTCACCTCTCAAGATATCACCACCGCTAG- CCCTCCCCT- CAAAAAAACCAAGACCAACCTCAGCCTAGAAACCTCATCCCCCCTAACTGTG AGCACCTCAGGCGCCCTCACCGTAGCAGCCGCCGCTCCCCTGGCEGTEG- CCGGCACCTCCCT- CACCATGCAATCAGAGGCCCCCCTGACAGTACAGGATGCAAAACTCACCCTG GCCACCAAAGGCCCCCTGACCGTGTCTGAAGGCAAACTGGCCTTGCAAACA- TCGGCCCCG- CTGACGGCCGCTGACAGCAGCACCCTCACAGTCAGTGCCACACCACCCCTTA GCACAAGCAATGGCAGCTTGGGTATTGACATGCAAGCCCCCATTTACAC- CACCAATGGA- AAACTAGGACTTAACTTTGGCGCTCCCCTGCATGTGGTAGACAGCCTAAATG CACTGACTGTAGTTACTGGCCAAGGTCTTACGATAAACGGAACAGCCCTA- CAAACTAGAG- TCTCAGGTGCCCTCAACTATGACACATCAGGAAACCTAGAATTGAGAGCTGC AGGGGGTATGCGAGTTGATGCAAATGGTCAACTTATCCTTGATGTAGCT- TACCCATTTGATG- CACAAAACAATCTCAGCCTTAGGCTTGGACAGGGACCCCTGTTTGTTAACTC TGCCCACAACTTGGATGTTAACTACAACAGAGGCCTCTACCTGTTCACA- TCTGGAAATAC- CAAAAAGCTAGAAGTTAATATCAAAACAGCCAAGGGTCTCATTTATGATGAC ACTGCTATAGCAATCAATGCGGGTGATGGGCTACAGTTTGACTCAGGCTCA- GATACAAA- TCCATTAAAAACTAAACTTGGATTAGGACTGGATTATGACTCCAGCAGAGCC ATAATTGCTAAACTGGGAACTGGCCTAAGCTTTGACAACACAGGTGCCAT- CACAGTAGGCAA- CAAAAATGATGACAAGCTTACCTTGTGGACCACACCAGACCCATCCCCTAAC TGTAGAATCTATTCAGAGAAAGATGCTAAATTCACACTTGTTTTGACTAAA- TGCGGCAGTCA- GGTGTTGGCCAGCGTTTCTGTTTTATCTGTAAAAGGTAGCCTTGCGCCCATC AGTGGCACAGTAACTAGTGCTCAGATTGTCCTCAGATTTGATGAAAATGGA- GTTCTACTAAG- CAATTCTTCCCTTGACCCTCAATACTGGAACTACAGAAAAGGTGACCTTACA GAGGGCACTGCATATACCAACGCAGTGGGATTTATGCCCAACCTCACAGCA- TACCCAAAAA- CACAGAGCCAAACTGCTAAAAGCAACATTGTAAGTCAGGTTTACTTGAATGG GGACAAATCCAAACCCATGACCCTCACCATTACCCTCAATGGAACTAA- TGAAACAGGAGATG- CCACAGTAAGCACTTACTCCATGTCATTCTCATGGAACTGGAATGGAAGTAA TTACATTAATGAAACGTTCCAAACCAACTCCTTCACCTTCTCCTACATCG- CCCAAGAA- TAAAAAGCATGACGCTGTTGATTTGATTCAATGTGTTTCTGTTTTATTTTCA AGCACAACAAAATCATTCAAGTCATTCTTCCATCTTAGCTTAATAGACACA- GTAGCTTAATA- GACCCAGTAGTGCAAAGCCCCATTCTAGCTTATAGATCAGACAGTGATAATT AACCACCACCACCACCATACCTTTTGATTCAGGAAATCATGATCATCACAG- GATCCTAG- TCTTCAGGCCGCCCCCTCCCTCCCAAGACACAGAATACACAGTCCTCTCCCC CCGACTGGCTTTAAATAACACCATCTGGTTGGTCACAGACATGTTCT- TAGGGGTTATATT- CCACACGGTCTCCTGCCGCGCCAGGCGCTCGTCGETGATGTTGATAAACTCT CCCGGCAGCTCGCTCAAGTTCACGTCGCTGTCCAGCGGCTGAACCTCCGG- CTGACGCGA- TAACTGTGCGACCGGCTGCTGGACGAACGGAGGCCGCGCCTACAAGGGGGTA GAGTCATAATCCTCGGTCAGGATAGGGCGGTGATGCAGCAGCAGCGAG- CGAAACATCTGCTG- CCGCCGCCECTCCETCCGGCAGGAAAACAACACGCCGGTGGTCTCCTCCGCG ATAATCCGCACCGCCCGCAGCATCAGCTTCCTCGTTCTCCGCGCGCAGCAC- CTCACCCTTA- TCTCGCTCAAATCGGCGCAGTAGGTACAGCACAGCACCACGATGTTATTCAT GATCCCACAGTGCAGGGCGCTGTATCCAAAGCTCATGCCGGGAACCACCG- CCCCCACGTGG- CCATCGTACCACAAGCGCACGTAAATCAAGTGTCGACCCCTCATGAACGCGC TGGACACAAACATTACTTCCTTGGGCATGTTGTAATTCACCACCTCCCGG- TACCAGATAAAC- CTCTGGTTGAACAGGGCACCTTCCACCACCATCCTGAACCAAGAGGCCAGAA CCTGCCCACCGGCTATGCACTGCAGGGAACCCGGGTTGGAACAATGACAA- TGCAGAC- TCCAAGGCTCGTAACCGTGGATCATCCGGCTGCTGAAGGCATCGATGTTGGC ACAACACAGACACACGTGCATGCACTTTCTCATGATTAGCAGCTCTT- CCCTCGTCAGGATCA- TATCCCAAGGAATAACCCATTCTTGAATCAACGTAAAACCCACACAGCAGGG AAGGCCTCGCACATAACTCACGTTGTGCATGGTCAGCGTGTTGCATTCCG- GAAACAGCGGA- TGATCCTCCAGTATCGAGGCGCGGGTCTCCTTCTCACAGGGAGGTAAAGGGT CCCTGCTGTACGGACTGCGCCGGGACGACCGAGATCGTGTTGAGCGTAGTG- TCATGGA- AAAGGGAACGCCGGACGTGGTCATACTTCTTGAAGCAGAACCAGGTTCGCGC GTGGCAGGCCTCCTTGCGTCTGCGGTCTCGCCGTCTAGCTCGCTCCGTG- TGATAGTTGTAG- TACAGCCACTCCCGCAGAGCGTCGAGGCGCACCCTGGCTTCCGGATCTATGT AGACTCCGTCTTGCACCGCGGCCCTGATAATATCCACCACCGTAGAATAAG- CAACACCCAG- CCAAGCAATACACTCGCTCTGCGAGCGGCAGACAGGAGGAGCGGGCAGAGAT GGGAGAACCATGATAAAAAACTTTTTTTAAAGAATATTTTCCAATTCTT- CGAAAGTAAGATC- TATCAAGTGGCAGCGCTCCCCTCCACTGGCGCGGTCAAACTCTACGGCCAAA GCACAGACAACGGCATTTCTAAGATGTTCCTTAATGGCGTCCAAAAGACA- CACCGCTCT- CAAGTTGCAGTAAACTATGAATGAAAACCCATCCGGCTGATTTTCCAATATA GACGCGCCGGCAGCGTCCACCAAACCCAGATAATTTTCTTCTCTCCAGCGG- TTTACGATCTG- TCTAAGCAAATCCCTTATATCAAGTCCGACCATGCCAAAAATCTGCTCAAGA GCGCCCTCCACCTTCATGTACAAGCAGCGCATCATGATTGCAAAAATTCA- GGTTCTTCAGA- GACCTGTATAAGATTCAAAATGGGAACATTAACAAAAATTCCTCTGTCGCGC AGATCCCTTCGCAGGGCAAGCTGAACATAATCAGACAGGTCCGAACGGAC- CAGTGAGGCCAA- ATCCCCACCAGGAACCAGATCCAGAGACCCTATACTGATTATGACGCGCATA CTCGGGGCTATGCTGACCAGCGTAGCGCCGATGTAGGCGTGCTGCATGGG- CGGCGAGATAAA- ATGCAAAGTGCTGGTTAAAAAATCAGGCAAAGCCTCGCGCAAAAAAGCTAAC ACATCATAATCATGCTCATGCAGGTAGTTGCAGGTAAGCTCAGGAAC- CAAAACGGAATAACA- CACGATTTTCCTCTCAAACATGACTTCGCGGATACTGCGTAAAACAAAAAAT TATAAATAAAAAATTAATTAAATAACTTAAACATTGGAAGCCTGTCTCA- CAACAGGAAAAAC- CACTTTAATCAACATAAGACGGGCCACGGGCATGCCGGCATAGCCGTAAAAA AATTGGTCCCCGTGATTAACAAGTACCACAGACAGCTCCCCGGTCATG- TCGGGGGTCAT- CATGTGAGACTCTGTATACACGTCTGGATTGTGAACATCAGACAAACAAAGA AATCGAGCCACGTAGCCCGGAGGTATAATCACCCGCAGGCGGAGGTACAG- CAAAACGAC- CCCCATAGGAGGAATCACAAAATTAGTAGGAGAAAAAAATACATAAACACCA GAAAAACCCTGTTGCTGAGGCAAAATAGCGCCCTCCCGATCCAAAACAACA- TAAAGCGCTT- CCACAGGAGCAGCCATAACAAAGACCCGAGTCTTACCAGTAAAAGAAAAAAG ATCTCTCAACGCAGCACCAGCACCAACACTTCGCAGTGTAAAAGGCCAAG- TGCCGAGAGAG- TATATATAGGAATAAAAAGTGACGTAAACGGGCAAAGTCCAAAAAACGCCCA GAAAAACCGCACGCGAACCTACGCCCCGAAACGAAAGCCAAAAAACACTA- GACACTCCCTT- CCGGCGTCAACTTCCGCTTTCCCACGCTACGTCACTTCCCCCGGTCAAACAA ACTACATATCCCGAACTTCCAAGTCGCCACGCCCAAAACACCGCCTACAC- CTCCCCGCCCG- CCGGCCCECCCCCGEACCEGCCTCCCGCCCCGCECCGCCCATCTCATTATCA
TATTGGCTTCAATCCAAAATAAGGTATATTATTGATGATG SEQ ID NO: 2 Sequência de polinucleotídeos que codifica ChAd83 selvagem CATCATCAATAATATACCTCAAACTTTTGGTGCGCGTTAATATGCAAA- TGAGCTGTTTGAA-
TTTGGGGATGCGGGGCECTEATTGGCTECEGEAGCEGCEGACCETTAGEGECGÇ GGGCGGGETGACGTTTTGATGACGTGGCCGTGAGECEGAGCCGGTTTGCAAG- TTCTCGTGGGA- AAAGTGACGTCAAACGAGGTGTGGTTTGAACACGGAAATACTCAATTTTCCC GCGCTCTCTGACAGGAAATGAGGTGTTTCTGGGCGGATGCAAG- TGAAAACGGGCCATTTTCG- CGCGAAAACTGAATGAGGAAGTGAAAATCTGAGTAATTTCGCGTTTATGGCA GGGAGGAGTATTTGCCGAGGGCCGAGTAGACTTTGACCGATTACGTGGGGG- TTTCGATTAC- CGTATTTTTCACCTAAATTTCCGCGTACGGTGTCAAAGTCCGGTGTTTTTAC GTAGGCGTCAGCTGATCGCCAGGGTATTTAAACCTGCGCTCACTAGT- CAAGAGGCCAC- TCTTGAGTGCCAGCGAGTAGAGTTTTCTCCTCCGCGCCGCGAGTCAGATCTA CACTTTGAAAGATGAGGCACTTGAGAGACCTGCCCGGTAATGTTTTCCTGG- CTACTGGGA- ACGAGATTCTGGAATTGGTGGTGGACGCCATGATGGGTGACGACCCTCCCGA GCCCCCTACCCCATTTGAGGCGCCTTCGCTGTACGATTTGTATGATCTGGA- GGTGGATGTG- CCCGAGAACGACCCCAACGAGGAGGCGGTGAATGATTTGTTTAGCGATGCCG CGCTGCTGGCTGCCGAGCAGGCTAATACGGACTTTGGCTCAGACAGCGATT- CTTCTCTCCA- TACCCCGAGACCCGGCAGAGGTGAGAAAAAGATCCCCGAGCTTAAAGGGGAA GAGCTCGACCTGCGCTGCTATGAGGAATGCTTGCCTCCGAGCGATGATGAG- GAGGACGAGGA- GGCGATTCGAGCTGCAGCGAACCAGGGAGTGAAAGCTGCGGGCGAAAGCTTT AGCCTGGACTGTCCTACTCTGCCCGGACACGGCTGTAAGTCTTGTGAATTT- CATCGCATGAA- TACTGGAGATAAGAATGTGATGTGTGCCCTGTGCTATATGAGAGCTTACAAC CATTGTGTTTACAGTAAGTGTGATTAACTTTAGTTGGGAAGGCAGAGGG- TGACTGGGTG- CTGACTGGTTTATTTATGTATATGTTTTTTATGTGTAGGTCCCGTCTCTGAC GCAGATGAGACCCCCACTTCAGAGTGCATTTCATCACCCCCAGAAATTGG- CGAGGAACCG- CCCGAAGATATTATTCATAGACCAGTTGCAGTGAGAGTCACCGGGCGGAGAG CAGCTGTGGAGAGTTTGGATGACTTGCTACAGGGTGGGGATGAACCTTTG- GACTTGTGTAC- CCGGAAACGCCCCAGGCACTAAGTGCCACACATGTGTGTTTACTTAAGGTGA TGTCAGTATTTATAGGGTGTGGAGTGCAATAAAATCCGTGTTGACTTTAAG- TGCGTGGTTTA- TGACTCAGGGGTGGGGACTGTGGGTATATAAGCAGGTGCAGACCTGTGTGGT CAGTTCAGAGCAGGACTCATGGAGATCTGGACGGTCTTGGAAGACTTTCAC- CAGACTAGACA- GCTGCTAGAGAACTCATCGGAGGGAGTCTCTTACCTGTGGAGATTCTGCTTC GGTGGGCCTCTAGCTAAGCTAGTCTATAGGGCCAAGCAGGATTATAAGGAT- CAATTTGAGGA- TATTTTGAGAGAGTGTCCTGGTATTTTTGACTCTCTCAACTTGGGCCATCAG TCTCACTTTAACCAGAGTATTCTGAGAGCCCTTGACTTTTCCACTCCTGG- CAGAACTACCG- CCGCGGETAGCCTTTTTTGCCTTTATCCTTGACAAATGGAGTCAAGAAACCCA TTTCAGCAGGGATTACCGTCTGGACTGCTTAGCAGTAGCTTTGTGGAGAA- CATGGAGGTG- CCAGCGCCTGAATGCAATCTCCGGCTACTTGCCAGTACAGCCGGTAGACACG CTGAGGATCCTGAGTCTCCAGTCACCCCAGGAACACCAACGCCGCCAGCAG- CCGCAGCAGGA- GCAGCAGCAAGAGGAGGACCGAGAAGAGAACCCGAGAGCCGGTCTGGACCCT CCGGTGGCEGGAGGAGGAGGAGTAGCTGACTTGTTTCCCGAGCTGCGCCGGGC- TGCTGACTAGG- TCTTCCAGTGGACGGGAGAGGGGGATTAAGCGGGAGAGGCATGAGGAGACTA GTCACAGAACTGAACTGACTGTCAGTCTGATGAGCCGCAGGCGCCCAGAA- TCGGTGTGGTGCG- CATGAGGTGCAGTCGCAGGGGATAGATGAGGTCTCGGTGATGCATGAGAAAT ATTCCCTAGAACAAGTCAAGACTTGTTGGTTGGAGCCTGAGGATGATTGG- GAGGTAGCCAT- CAGGAATTATGCCAAGCTAGCTCTGAAGCCAGACAAGAAGTACAAGATTACC AAACTGATTAATATCAGAAATTCCTGCTACATTTCAGGGAATGGGG- CCGAGGTGGAGATCAG- TACCCAGGAGAGGGTGGCCTTCAGATGCTGCATGATGAATATGTACCCGGGG GTGGTGGGCATGGAGGGAGTCACCTTTATGAACGCGAGGTTCAGGGG- CGATGGGTATAA- TGGGGTGGTCTTTATGGCCAACACCAAGCTGACAGTGCACGGATGCTCCTTC TTTGGCTTCAATAACATGTGCATCGAGGCCTGGGGCAGTGTTTCAG- TGAGGGGATGCAG- TTTTTCAGCCAACTGGATGGGGGTCGTGGGCAGAACCAAGAGCAAGGTGTCA GTGAAGAAATGCCTGTTCGAGAGGTGCCACCTGGGGGTGATGAGCGAGGG- CGAAGCCAAAGT- CAAACACTGCGCCTCTACTGAGACGGGCTGCTTTGTGCTGATCAAGGGCAAT GCCCAAGTCAAGCATAACATGATCTGTGGGGCCTCGGATGAGCGCGGCTAC- CAGATGCTGAC- CTGCGCCGGTGGGAACAGCCATATGCTGGCCACCGTGCATGTGACCTCGCAC CCCCGCAAGACATGGCCCGAGTTCGAGCACAACGTCATGACCCGCTGCAA- TGTGCACCTGGG- CTCCCGCCGAGGCATGTTCATGCCCTACCAGTGCAACATGCAATTTGTGAAG GTGCTGCTGGAGCCCGATGCCATGTCCAGAGTGAGCCTGACGGGGGTGE- TTTGACATGAATG- TGGAGATGTGGAAAATTCTGAGATATGATGAATCCAAGACCAGGTGCCGGGC CTGCGAATGCGGAGGCAAGCACGCCAGGCTTCAGCCCGTGTGTGTGGAGG- TGACGGAGGAC- CTGCGACCCGATCATTTGGTGTTGTCCTGCAACGGGACGGAGTTCGGCTCCA GCGGGGAAGAATCTGACTAGAGTGAGTAGTGTTTGGGGGAGGTGGAGGG- CCTGGATGAGGGG- CAGAATGACTAAAATCTGTGTTTTTCTGCGCAGCAGCATGAGCGGAAGCGCC TCCTTTGAGGGAGGGGTATTCAGCCCTTATCTGACGGGGCG- TCTCCCCTCCTGGGCGGÇAGÇG- TGCGTCAGAATGTGATGGGATCCACGGTGGACGGCCGGCCCGTGCAGCCEGC GAACTCTTCAACCCTGACCTACGCGACCCTGAGCTCCTCGTCCGTGGACG- CAGCTGCCGCCG- CAGCTGCTGCTTCCGCCGCCAGCGCCETGCECEGAATGGCCCTGEGCGCCEG CTACTACAGCTCTCTGGTGGCCAACTCGAGTTCCACCAATAATCCCGCCAG- CCTGAACGAG- GAGAAGCTGCTGCTGCTGATGGCCCAGCTCGAGGCCCTGACCCAGCGCCTGG GCGAGCTGACCCAGCAGGTTGCTCAGCTGCAGGCGGAGACGCGGGCCGCEG- TTGCCACGG- TGAAAACCAAATAAAAAATGAATCAATAAATAAACGGAGACGGTTGTTGATT TTAACACAGAGTCTTGAATCTTTATTTGATTTTTCGCGCGCGGTAGG- CCCTGGACCACCGG- TCTCGATCATTGAGCACCCGGTGGATCTTTTCCAGGACCCGGTAGAGGTGGG CTTGGATGTTGAGGTACATGGGCATGAGCCCGTCCCGGGGGTGGAGGTAG- CTCCATTGCA- GGGCCTCGTGCTCGGGGCTEGTECGTTGTAAATCACCCAGTCATAGCAGGGGCG CAGGGCGTGGTGCTGCACGATGTCCTTGAGGAGGAGACTGATGGCCACGGG- CAGCCCCTTGG- TGTAGGTGTTGACGAACCTGTTGAGCTGGGAGGGATGCATGCGGGGGGAGAT GAGATGCATCTTGGCCTGGATCTTGAGATTGGCGATGTTCCCGCCCAGA- TCCCGCCEGEGE- TTCATGTTGTGCAGGACCACCAGCACGGTGTATCCGGTGCACTTGGGGAATT TGTCATGCAACTTGGAAGGGAAGGCGTGAAAGAATTTGGAGACGCCCTTG- TGGCCGCCCAGG- TTTTCCATGCACTCATCCATGATGATGGCGATGGGCCCGTGGGCGGCGGCCT GGGCAAAGACGTTTCGGGGGTCGGACACATCGTAGTTGTGGTCCTGGG- TGAGCTCGTCATA- GGCCATTTTAATGAATTTGGGGCGGAGGGTGCCCGACTGGGGGACGAAGGTG CCCTCGATCCCGGGEGCETAGTTGCCCTCGCAGATCTGCATCTCCCAGG- CCTTGAGCTCGGA- GGGGGGGATCATGTCCACCTGCGGGGCGATGAAAAAAACGGTTTCCGGGGCGE GGGGAGATGAGCTGCGCCGAAAGCAGGTTCCGGAGCAGCTGGGACTTGCCG- CAGCCGG- TGGGGCCGTAGATGACCCCGATGACCGGCTGCAGGTGGTAGTTGAGGGAGAG ACAGCTGCCGTCCTCGCGGAGGAGGGGGGCCACCTCGTTCATCATCTCGCG- CACATGCATG- TTCTCGCGCACGAGTTCCGCCAGGAGGCGCTCGCCCCCCAGCGAGAGGAGCT CTTGCAGCGAGGCGAAGTTTTTCAGCGGCTTGAGCCCGTCGGCCATGGG- CATTTTGGA- GAGGGTCTGTTGCAAGAGTTCCAGACGGTCCCAGAGCTCGGTGATGTGCTCT AGGGCATCTCGATCCAGCAGACCTCCTCGTTTCGCGGGTTGGGGCGACTG- CGGGAGTAGGG- CACCAGGCGATGGGCGTCCAGCGAGGCCAGGGTCCGGTCCTTCCAGGGTCGC AGGGTCCGCGTCAGCGTGGTCTCCGTCACGGTGAAGGGGTGCGCECCEGE- CTGGGCGCTTG- CGAGGGTGCGCTTCAGGCTCATCCGGCTGGTCGAGAACCGCTCCCGGTCGEGC GCCCTGTGCETCEGGCCAGGTAGCAATTGAGCATGAGTTCGTAGTTGAGCG- CCTCGGCCGCG- TGGCCCTTGGCGCGGAGCTTACCTTTGGAAGTGTGTCCGCAGACGGGACAGA GGAGGGACTTGAGGGCGTAGAGCTTGGGGGCGAGGAAGACGGACTCGGGGGE- CGTAGGCG- TCCGCGCCGCAGCTGGCGCAGACGGTCTCGCACTCCACGAGCCAGGTGAGGT CGGGGCGEGTCGGEGTCAAAAACGAGGTTTCCTCCGTGCTTTTTGATGCG- TTTCTTAC- CTCTGGTCTCCATGAGCTCGTGTCCCCGCTGGGTGACAAAGAGGCTGTCCGT GTCCCCGTAGACCGACTTTATGGGCCGGTCCTCGAGCGGGGTECCGCEG- TCCTCGTCG- TAGAGGAACCCCGCCCACTCCGAGACGAAGGCCCGGGTCCAGGCCAGCACGA AGGAGGCCACGTGGGAGGGGTAGCGGTCGTTGTCCACCAGCGGGTCCAC- CTTCTCCAGGGTA- TGCAAGCACATGTCCCCCTCGTCCACATCCAGGAAGGTGATTGGCTTGTAAG TGTAGGCCACGTGACCGGGGGTCCCGGCCEGEGEGETATAAAAGGGGG- CGGGCCCCTGCTCG- TCCTCACTGTCTTCCGGATCGCTGTCCAGGAGCGCCAGCTGTTGGGGTAGGT ATTCCCTCTCGAAGGCGGGCATGACCTCGGCACTCAGGTTGTCAGTTTC- TAGAAACGAGGAG- GATTTGATATTGACGGTGCCGTTGGAGACGCCTTTCATGAGCCCCTCGTCCA TCTGGTCAGAAAAGACGATCTTTTTGTTGTCGAGCTTGGTGGCGAAGGAG- CCGTAGAGGGCG- TTGGAGAGCAGCTTGGCGATGGAGCGCATGGTCTGGTTCTTTTCCTTGTCGG CGCGCTCCTTGGCEGCEGATGTTGAGCTGCACGTACTCGCGCGCCACGCAC- TTCCATTCGGG- GAAGACGGTGGTGAGCTCGTCGGGCACGATTCTGACCCGCCAGCCGCGGTTG TGCAGGGTGATGAGGTCCACGCTGGTGGCCACCTCGCCGCGCAGEGGCCTCE- TTGGTCCAGCA- GAGGCGCCCGCCCTTGCGCGAGCAGAAGGGGGGCAGCGGGTCCAGCATGAGC TCGTCGGEGEGETCEGCETCCACGGTGAAGATGCCGGGCAGGAGCTCGGGG- TCGAAGTAG- CTGATGCAGGTGCCCAGATCGTCCAGCGCCGCTTGCCAGTCGCGCACGGCCA GCGCGCGCTCETAGGGGCTGAGGGGCGTECCCCAGGGCATGGGGTÇCE- TGAGCGCGGAGGCG- TACATGCCGCAGATGTCGTAGACGTAGAGGGGCTCCTCGAGGACGCCGATGT AGGTGGGGTAGCAGCGCCCCCCGCGEGATGCTGGCGCGCACGTAGTCGTACA- GCTCGTG- CGAGGGCGCGAGGAGCCCCGTGCCGAGGTTGGAGCGTTGCGGCTTTTCGGCG CGGTAGACGATCTGGCGGAAGATGGCGTGGGAGTTGGAGGAGATGGTGGG- CCTCTGGAAGA- TGTTGAAGTGGGCGTGGGGCAGGCCGACCGAGTCCCTGATGAAGTGGGCGTA GGAGTCCTGCAGCTTGGCGACGAGCTCGGCGETGACGAGGACGTCCAGGG- CGCAGTAG- TCGAGGGTCTCTTGGATGATGTCGTACTTGAGCTGGCCCTTCTGCTTCCACA GCTCGCGGTTGAGAAGGAACTCTTCGCGGTCCTTCCAGTACTCTT- CGAGGGGGAACCCG- TCCTGATCGGCACGGTAAGAGCCCACCATGTAGAACTGGTTGACGGCCTTGT AGGCGCAGCAGCCCTTCTCCACGGGGAGGGCGTAAGCTTGCGCGGCCTTG- CGCAGGGAGGTG- TGGGTGAGGGCGAAGGTGTCGCGCACCATGACTTTGAGGAACTGGTGCTTGA AGTCGAGGTCGTCGCAGCCGCCCTGCTCCCAGAGTTGGAAGTCCGTGCGE- CTTCTTGTAGG- CGGGGTTGGGCAAAGCGAAAGTAACATCGTTGAAGAGGATCTTGCCCGCGCG GGGCATGAAGTTGCGAGTGATGCGGAAAGGCTGGGGCACCTCGGCCCGG- TTGTTGATGAC- CTGGGCGGCGAGGACGATCTCGTCGAAGCCGTTGATGTTGTGCCCGACGATG TAGAGTTCCACGAATCGCGGGCAGCCCTTGACGTGGGGCAGCTTCTTGAG- CTCGTCGTAGG- TGAGCTCGGCGGGGTCGCTGAGCCCGTGCTGCTCGAGGGCCCAGTCGGCGAC GTGGGGGTTGGCGCTGAGGAAGGAAGTCCAGAGATCCACGGCCAGGGCGG- TCTGCAAGCGG- TCCCGGTACTGACGGAACTGCTGGCCCACGGCCATTTTTTCGGGGGTGACEC AGTAGAAGGTGCGGGGGTCGCCETGCCAGCGGETCCCACTTGAGTTGGAGGG- CGAGGTCG- TGGGCGAGCTCGACGAGCGGCGGGTCCCCGGAGAGTTTCATGACCAGCATGA AGGGGACGAGCTGCTTGCCGAAGGACCCCATCCAGGTGTAGGTTTCCACA- TCGTAGGTGAG- GAAGAGCCTTTCGGTGCGAGGATGCGAGCCGATGGGGAAGAACTGGATCTCC TGCCACCAGTTGGAGGAATGGCTGTTGATGTGATGGAAGTAGAAATGCCGA- CGGCGCG- CCGAGCACTCGTGCTTGTGTTTATACAAGCGTCCGCAGTGCTCGCAACGCTG CACGGGATGCACGTGCTGCACGAGCTGTACCTGGGTTCCTTTGACGAGGAA- TTTCAGTGGG- CAGTGGAGCGCTGGCGGCTGCATCTGGTGCTGTACTACGTCCTGGCCATCGG CGTGGCCATCGTCTGCCTCGATGGTGGTCATGCTGACGAGCCCGCGCGGGA- GGCAGGTCCA- GACCTCGGCTCGGACGGGTCGGAGAGCGAGGACGAGGGCGCGCAGGCCGGAG CTGTCCAGGGTCCTGAGACGCTGCGGAGTCAGGTCAGTGGGCAGCGGCGG- CGCGCGGTTGAC- TTGCAGGAGCTTTTCCAGGGCGCGCGGGAGGTCCAGATGGTACTTGATCTCC ACGGCGCCGTTGGTGGCGACGTCCACGGCTTGCAGGGTCCCGETG- CCCCTGGGGCGCCACCAC- CGTGCCCCGTTTCTTCTTGGGCEGEGCGGCGGCTCCATGCTTAGAAGCGGCGGC GAGGACGCGCGCCGGGCGECAGGEGECEGEGCTCGGEGGCCCEGAGGCAGGGGE- CGGCAGGGGCACG- TCGGCGCCGCGCGCEGEGCAGEGTTCTGGTACTGCGCCCGGAGAAGACTGGCGT GAGCGACGACGCGACGGTTGACGTCCTGGATCTGACGCCTCTGGGTGAAGG- CCACGGGAC- CCGTGAGTTTGAACCTGAAAGAGAGTTCGACAGAATCAATTTCGGTATCGTT GACGGCGGCCTGCCGCAGGATCTCTTGCACGTCGCCCGAGTTGTCCTGG- TAGGCGATCTCGG- TCATGAACTGCTCGATCTCCTCCTCCTGAAGGTCTCCGCGGCCEGCGCGCTC GACGGTGGCCGCGAGGTCGTTGGAGATGCGGCCCATGAGCTGCGAGAAGG- CGTTCATGCCGG- CCTCGTTCCAGACGCGGCTGTAGACCACGGCTCCGTTGGGGTCGCGCECGCGE CATGACCACCTGGGCGAGGTTAAGCTCGACGTGGCGCGTGAAGACCGCG- TAGTTGCAGAGG- CGCTGGTAGAGGTAGTTGAGCGTGGTGGCGATGTGCTCGGTGACGAAGAAGT ACATGATCCAGCGGCGGAGCGGCATCTCGCTGACGTCGCCCAGGGCTT- CCAAGCG- CTCCATGGTCTCGTAGAAGTCCACGGCGAAGTTGAAAAACTGGGAGTTGCGC GCCGAGACGGTCAACTCCTCCTCCAGAAGACGGATGAGCTCGGCGATGG- TGGCGCGCAC- CTCGCGCTCGAAGGCCCCGEGEGEGCTCCTCTTCTTCCATCTCCTCCTCCTCT TCCTCCTCCACTAACATCTCTTCTACTTCCTCCTCAGGAGGCGGCGEG- CGGGGGAGGGGE- CCCTGCEGTCGCCGEGCGGCEGCACGEGGCAGACGGTCGATGAAGCGCTCGATGGT CTCCCCGCGCCEGCGACGCATGGTCTCGGTGACGGCGCGCCCGTCCTCG- CGGGGCCGCAGCG- TGAAGACGCCGCCGCGCATCTCCAGGTGGCCGCCEGGCGGGGTCTCCGTTGGG CAGGGAGAGGGCGCTGACGATGCATCTTATCAATTGGCCCGTAGGGAC- TCCGCGCAAGGAC- CTGAGCGTCTCGAGATCCACGGGATCCGAAAACCGCTGAACGAAGGCTTCGA GCCAGTCGCAGTCGCAAGGTAGGCTGAGCCCGGTTTCTTGTTCTTCGGGTA- TTTGGTCGGGA- GGCGGGCGGGCGATGCTGCTGGTGATGAAGTTGAAGTAGGCGGTCCTGAGAC GGCGGATGGTGGCGAGGAGCACCAGGTCCTTGGGCCCGGCTTGCTGGATG- CGCAGACGG- TCGGCCATGCCCCAGGCGTGETCCTGACACCTGGCGAGGTCCTTGTAGTAGT CCTGCATGAGCCGCTCTACGGGCACGTCCTCCTCGCCCGCGCGGCCGETE- CATGCGCGTGAG- CCCGAACCCGCGCTGCEGCTEGACGAGCGCCAGGTCGGCGACGACGCGCTCG GCGAGGATGGCCTGCTGGATCTGGGTGAGGGTGETCTGGAAGTCGTCGAAG- TCGACGAAG- CGGTGGTAGGCTCCGGTGTTGATGGTGTAGGAGCAGTTGGCCATGACGGACC AGTTGACGGTCTGGTGGCCGEGGCGCACGAGCTCGTGGTACTTGAGGCG- CGAGTAGGCGCG- CGTGTCGAAGATGTAGTCGTTGCAGGTGCGCACGAGGTACTGGTATCCGACG AGGAAGTGCGGCGGCGGCTGGCGGTAGAGCGGCCATCGCTCGGTGG- CGGGGEGCGCCGGGECÇ- CGAGGTCCTCGAGCATGAGGCGGTGGTAGCCGTAGATGTACCTGGACATCCA GGTGATGCCGGCGGCEGTCECGTEGAGGCGCGCGEGGAACTCGCGGACGCGGTT- CCAGATGTTG- CGCAGCGGCAGGAAGTAGTTCATGGTGGCCGCGGTCTGGCCCGETGAGGCÇCGE CGCAGTCGTGGATGCTCTAGACATACGGGCAAAAACGAAAGCGGTCAGCGG- CTCGACTCCG- TGGCCTGGAGGCTAAGCGAACGGGTTGGGCTGCECEGTEGTACCCCGGTTCGAA TCTCGAATCAGGCTGGAGCCGCAGCTAACGTGGTACTGGCACTCCCG- TCTCGACCCAAG- CCTGCTAACGAAACCTCCAGGATACGGAGGCGGGTCGTTTTTTGGCCTTGGT CGCTGGTCATGAAAAACTAGTAAGCGCGGAAAGCGGCCGCCCGCGATGG- CTCGCTGCCGTAG- TCTGGAGAAAGAATCGCCAGGGTTGCGTTGCGGTGTGCCCCGGTTCGAGCCT CAGCGCTCGGTGCCGGCCGGATTCCGCGGCTAACGTGGGCGTEGCTGE- CCCCGTCGTTTCCAA- GACCCCTTAGCCAGCCGACTTCTCCAGTTACGGAGCGAGCCCCTCTTTTTCT TGTGTTTTTGCCAGATGCATCCCGTACTGCGGCAGATGCGCCCCCAC- CCTCCACCACAACCG- CCCCTACCGCAGCAGCAGCAACAGCCGGCGCTTCTGCCCCCGCCCCAGCAGC AGCAGCCAGCCACTACCGCGGCGGCCECCGETGAGCGGAGCCGGCGTTCAG- TATGACCTGG- CCTTGGAAGAGGGCGAGGGGCTGGCECEGCTEGEGECETCETCGCCGGAGEG GCACCCGCGCGTGCAGATGAAAAGGGACGCTCGCGAGGCCTACGTG- CCCAAGCAGAACCTG- TTCAGAGACAGGAGCGGCGAGGAGCCCGAGGAGATGCGCGCCTCCCGCTTCC ACGCGGGGCGGGAGCTGCEGGCECEGCCTEGACCGAAAGCGGGTGCTGAGGE- GACGAGGATTT—- CGAGGCGGACGAGCTGACGGGGATCAGCCCCGCGCECGCEGCACGTEGCCGEG GCCAACCTGGTCACGGCGTACGAGCAGACCGTGAAGGAGGAGAGCAACTTT- CAAAAATCCTT- CAACAACCACGTGCGCACGCTGATCGCGCGCGAGGAGGTGACCCTGGGCCTG ATGCACCTGTGGGACCTGCTGGAGGCCATCGTGCAGAACCCCACGAGCAAG- CCGCTGACGG- CGCAGCTGTTTCTGGTGGTGCAGCACAGTCGGGACAACGAGACGTTCAGGGA GGCGCTGCTGAATATCACCGAGCCCGAGGGCCGCTGGCTCCTGGACCTGG- TGAACATTCTG- CAGAGCATCGTGGTGCAGGAGCGCGGGCTGCCGECTETCCGAGAAGCTGGCGEG CCATCAACTTCTCGGTGCTGAGCCTGGGCAAGTACTACGCTAGGAAGATC- TACAAGACCCCG- TACGTGCCCATAGACAAGGAGGTGAAGATCGACGGGTTTTACATGCGCATGA CCCTGAAAGTGCTGACCCTGAGCGACGATCTGGGGGTGTACCGCAACGACA- GGATGCACCG- CGCGGTGAGCGCCAGCCGCCEGCECEAGCTGAGCGACCAGGAGCTGATGCAC AGCCTGCAGCGGGCCCTGACCGGGGCCEGGACCGAGGGGGAGAGCTAC- TTTGACATGGGCG- CGGACCTGCGCTGGCAGCCCAGCCGCCGEGCCTTGGAAGCTGCCGGCEGCGST GCCCTACGTGGAGGAGGTGGACGATGAGGAGGAGGAGGGCGAGTACCTGGA- AGACTGATGG- CGCGACCGTATTTTTGCTAGATGCAGCAACAGCCACCGCCGCCTCCTGATCC CGCGATGCGGGCEGCEGCTGCAGAGCCAGCCGTCCGGCATTAACTCCTCGGA- CGATTGGAC- CCAGGCCATGCAACGCATCATGGCGCTGACGACCCGCAATCCCGAAGCCTTT AGACAGCAGCCTCAGGCCAACCGGCTCTCGGCCATCCTGGAGGCCGTGGTE- CCCTCGCG- CTCGAACCCCACGCACGAGAAGGTGCTGGCCATCGTGAACGCGCTGGTGGAG AACAAGGCCATCCGCGGCGACGAGGCCGGGCTGGTGTACAACGCGCTGCTG- GAGCGCGTGG- CCCGCTACAACAGCACCAACGTGCAGACGAACCTGGACCGCATGGTGACCGA CGTGCGCGAGGCGGTETCGCAGCGCGAGCGGTTCCACCGCGAGTCGAAC- CTGGGCTCCATGG- TGGCGCTGAACGCCTTCCTGAGCACGCAGCCCGCCAACGTGCCCCGGEGCCA GGAGGACTACACCAACTTCATCAGCGCGCTGCGGCTGATGGTGGCCGAGE- TGCCCCAGAG- CGAGGTGTACCAGTCGGGGCCGGACTACTTCTTCCAGACCAGTCGCCAGGGC TTGCAGACCGTGAACCTGAGCCAGGCTTTCAAGAACTTGCAGGGACTG- TGGGGCGTGCAGG- CCCCEGGTCGGEGEACCEGCGCGACEGTETCGAGCCTGCTGACGCCGAACTCGCG CCTGCTGCTGCTECTEGTCGGCEGCCCTTCACGGACAGCGGCAGCGTGAGCCG- CGACTCGTAC- CTGGGCTACCTGCTTAACCTGTACCGCGAGGCCATCGGGCAGGCGCACGTGG ACGAGCAGACCTACCAGGAGATCACCCACGTGAGCCGCGCGCTGGGCCAGÇG- GAGGACCCGGG- CAACCTGGAGGCCACCCTGAACTTCCTGCTGACCAACCGGTCGCAGAAGATC CCGCCCCAGTACGCGCTGAGCACCGAGGAGGAGCGCATCCTGCGCTACGTG- CAGCAGAGCG- TGGGGCTGTTCCTGATGCAGGAGGGGGCCACGCCCAGCGCCGCGCTCGACAT GACCGCGCGCAACATGGAGCCCAGCATGTACGCCCGCAACCGCCCGTTCAT- CAATAAG- CTGATGGACTACTTGCATCGGGCGGCCGCCATGAACTCGGACTACTTTACCA ACGCCATCTTGAACCCGCACTGGCTCCCGCCGCCCGGETTCTACACGGG- CGAGTACGACATG- CCCGACCCCAACGACGGGTTCCTGTGGGATGACGTGGACAGCAGCGTGTTCT CGCCGCETCCCACCACCACCGTGTGGAAGAAAGAGGGCGGGGACCGGCGEG- CCGTCCTCGGCG- CTGTCCGEGTCGCECEGETECTECCECEGCEGTECCCGAGGCCGCCAGCCCCT TTCCGAGCCTGCCCTTTTCGCTGAACAGCGTGCGCAGCAGCGAGCTGGG- TCGGCTGACGCGG- CCGCGCCTGCTEGECGAGGAGGAGTACCTGAACGACTCCTTGTTGAGGCCCG AGCGCGAAAAGAACTTCCCCAATAACGGGATAGAGAGCCTGGTGGACAAGA- TGAGCCGCTG- GAAGACGTACGCGCACGAGCACAGGGACGAGCCCCGAGCTAGCAGCGCAGGC ACCCGTAGACGCCAGCGGCACGACAGGCAGCGGGGTCTGGTGTGGGÇGA- CGATGAGGATTCCG- CCGACGACAGCAGCGTGTTGGACTTGGGTGGGAGTGGTGGTGGTAACCCGTT CGCTCACTTGCGCCCCCGTATCGGGCGCCTGATGTAAGAATCTGAAAAA- TAAAAAACGGTAC- TCACCAAGGCCATGGCGACCAGCGTGCGTTCTTCTCTGTTGTTTGTAGTAGT ATGATGAGGCGCGTGTACCCGGAGGGTCCTCCTCCCTCGTACGAGAGCG- TGATGCAGCAGG- CGGTGGCEGCEGCGATGCAGCCCCEGCTEGAGECGCCTTACGTGCCCCEGCG GTACCTGGCGCCTACGGAGGGGCGGAACAGCATTCGTTACTCGGAGCTGG- CACCCTTG- TACGATACCACCCGGTTGTACCTGGTGGACAACAAGTCGGCGGACATCGCCT CGCTGAACTACCAGAACGACCACAGCAACTTCCTGACCACCGTGGTGCA- GAACAACGATTT- CACCCCCACGGAGGCCAGCACCCAGACCATCAACTTTGACGAGCGCTCGCGG TGGGGCGGCCAGCTGAAAACCATCATGCACACCAACATGCCCAACG- TGAACGAGTTCATGTA- CAGCAACAAGTTCAAGGCGCGGGTGATGGTCTCGCGCAAGACCCCCAACGGG GTCACAGTAACAGATGGTAGTCAGGACGAGCTGACCTACGAGTGGGTGGAG- TTTGAGCTG- CCCGAGGGCAACTTCTCGGTGACCATGACCATCGATCTGATGAACAACGCCA TCATCGACAACTACTTGGCGGTGGGGCGGCAGAACGGGGTGCTGGAGAG- CGACATCGGCG- TGAAGTTCGACACGCGCAACTTCCGGCTGGGCTGGGACCCCGTGACCGAGCT GGTGATGCCGGGCGTGTACACCAACGAGGCCTTCCACCCCGACATCG- TCCTGCTGCCCGEG- CTGCGGCGTGGACTTCACCGAGAGCCGCCTCAGCAACCTGCTGGGCATCCGC AAGCGGCAGCCCTTCCAGGAGGGCTTCCAGATCCTGTACGAGGACCTGGA- GGGGGGCAACA- TCCCCGCGCTCTTGGATGTCGAAGCCTACGAGAAAAGCAAGGAGGATAGCAC CGCCGTGGCTACCGCCGCGACTGTGGCAGATGCCACTGTCACCAGGGGCGA- TACATTCG- CCACCCAGGCGGAGGAAGCAGCCGCCCTAGCGGCGACCGATGATAGTGAAAG TAAGATAGTTATCAAGCCGGTGGAGAAGGACAGCAAGGACAGGAGCTA- CAACGTTCTATCG- GATGGAAAGAACACCGCCTACCGCAGCTGGTACCTGGCCTACAACTACGGCG ACCCCGAGAAGGGCGTGCGCTCCTGGACGCTGCTCACCACCTCGGACGT- CACCTGCGGCGTG- GAGCAAGTCTACTGGTCGCTGCCCGACATGATGCAAGACCCGGTCACCTTCC GCTCCACGCGTCAAGTTAGCAACTACCCGGTGGTGGGCGCCGAGCTCCTG- CCCGTCTAC- TCCAAGAGCTTCTTCAACGAGCAGGCCGTCTACTCGCAGCAGCTGCGCGCCT TCACCTCGCTCACGCACGTCTTCAACCGCTTCCCCGAGAACCAGATCCTCG- TCCGCCCG- CCCGCGCCCACCATTACCACCGTCAGTGAAAACGTTCCTGCTCTCACAGATC ACGGGACCCTGCCGCTGCGCAGCAGTATCCGGGGAGTCCAGCGCGTGACCG- TCACTGACG- CCAGACGCCGCACCTGCCCCTACGTCTACAAGGCCCTGGGCGTAGTCGCGCC GCGCGTCCTCTCGAGCCGCACCTTCTAAAAAATGTCCATTCTCATCTCG- CCCAGTAATAACA- CCGETTGGEGCCTECECEGCGCCCAGCAAGATGTACGGAGGCGCTCGCCAACG CTCCACGCAACACCCCGTGCGCGETGCEGCEGECACTTCCGCECTCCCTGGGE- CGCCCT- CAAGGGTCGCGTGCGCTCGCGCACCACCGTCGACGACGTGATCGACCAGGTG GTGGCCGACGCGCGCAACTACACGCCCGCCGCCGCGCCCGCCTCCACCGTG- GACGCCGT- CATCGACAGCGTGGTGGCCGACGCGCGCCEGTACGCCCGCGCCAAGAGCCGG CGGCGGCGCATCGCCCGGCEGCACCGGAGCACCCCCGCCATGCGCGCGEGCGÇE- CGAGCCTTG- CTGCGCAGGGCCAGGCGCACGGGACGCAGGGCCATGCTCAGGGCGGCCAGAC GCGCGGCCTCCGGCAGCAGCAGCGCCGGCAGGACCCGCAGACGCGCGG- CCACGGCGGCGG-
CGGCGGCCATCGCCAGCATGTCCCGCCCGCGGCECEGCAACGTGTACTGGGT GCGCGACGCCGCCACCGGTETGCGCETGCCCETGCGCACCCOGCCCCceTcG- CACTTGAAGA-
TGCTGACTTCGCGATGTTGATGTGTCCCAGCGGCGAGGAGGATGTCCAAGCG CAAATACAAGGAAGAGATGCTCCAGGTCATCGCGCCTGAGATCTACGG- CCCEGEEGCEGCEG- TGAAGGAGGAAAGAAAGCCCCGCAAACTGAAGCGGGTCAAAAAGGACAAAAA
GGAGGAGGAAGATGTGGACGGACTGGTGGAGTTTGTGCGCGAGTTCG- CCCCccGECEGEGCGE-
TGCAGTGGCGCGGGCGGAAAGTGAAACCGGTGCTGCGGCCCGGCACCACGGT GGTCTTCACGCCCGGCGAGCGTTCCGEGCTCCGCCTCCAAGCGCTCCTACGA- CGAGGTG- TACGGGGACGAGGACATCCTCGAGCAGGCGGCCGAGCGTCTGGGCGAGTTTG CTTACGGCAAGCGCAGCCGCCCCGCECCCTTGAAAGAGGAGGCGGTGE- TCCATCCCGCTGGAC- CACGGCAACCCCACGCCGAGCCTGAAGCCGGTGACCCTGCAGCAGGTGCTGC CGAGCGCGGCGCCGECECCEGEGCTTCAAGCGCGAGGGCGGCGAGGATCTG- TACCCGACCATG- CAGCTGATGGTGCCCAAGCGCCAGAAGCTGGAGGACGTGCTGGAGCACATGA AGGTGGACCCCGAGGTGCAGCCCGAGGTCAAGGTGCGGCCCATCAAGCAGG- TGGCCCCGEGG- CCTGGGCGTGCAGACCGTGGACATCAAGATCCCCACGGAGCCCATGGAAACG CAGACCGAGCCCGTGAAGCCCAGCACCAGCACCATGGAGGTGCAGACGGA- TCCCTGGATG- CCGGCECCEGCTTCCACCACCACTCGCCGAAGACGCAAGTACGGCGCGGCCA GCCTGCTGATGCCCAACTACGCGCTGCATCCTTCCATCATCCCCACG- CCGGGCTACCGCGG- CACGCGCTTCTACCGCGGCTACAGCAGCCGCCGCAAGACCACCACCCGCCGC CGCCGTCGCCGCACCCGCCGCAGCACCACCGCGACTTCCGCCGCCG- CCTTGGTGCGGAGAG- TGTACCGCAGCGGGCGTGAGCCTCTGACCCTGCCGCECECGCGCTACCACCC GAGCATCGCCATTTAACTCTGCCGTCGCCTCCTTGCAGATATGGCCCTCA- CATGCCG- CCTCCGCGETCCCCATTACGGGCTACCGAGGAAGAAAGCCGCGCCGTAGAAGG CTGACGGGGAACGGGCTGCGTCGCCATCACCACCGGCGGCGGCGCGCCAT- CAGCAAGCGG- TTGGGGGGAGGCTTCCTGCCCGCGCTGATCCCCATCATCGCCGCGECGATCG GGGCGATCCCCGGCATAGCTTCCGTGGCEGTGCAGGCCTCTCAGCGCCAC- TGAGACACAG- CTTGGAAAATTTGTAATAAAAAAATGGACTGACGCTCCTGGTCCTGTGATGT GTGTTTTTAGATGGAAGACATCAATTTTTCGTCCCTGGCACCGCGACACGG- CACGCGGCCG- TTTATGGGCACCTGGAGCGACATCGGCAACAGCCAACTGAACGGGGGCGCCT TCAATTGGAGCAGTCTCTGGAGCGGGCTTAAGAATTTCGGGTCCACGCT- CAAAACCTATGG- CAACAAGGCGTGGAACAGCAGCACAGGGCAGGCGCTGAGGGAAAAGCTGAAA GAGCAGAACTTCCAGCAGAAGGTGGTCGATGGCCTGGCCTCGGGCAT- CAACGGGGTGGTGGA- CCTGGCCAACCAGGCCGTGCAGAAACAGATCAACAGCCGCCTGGACGCGGTC CCGCCCGCEGEGTCCGTGGAGATGCCCCAGGTGGAGGAGGAGCTG- CCTCCCCTGGACAAGCG- CGGCGACAAGCGACCGCGTCCCGACGCGGAGGAGACGCTGCTGACGCACACG GACGAGCCGCCCCCGTACGAGGAGGCGGTGAAACTGGGTCTGCCCACCACG- CGGCCCGTEG-
CGCCTCTGGCCACCGGEGETGCTGAAACCCAGCAGCAGCAGCAGCCAGCCCGC GACCCTGGACTTGCCTCCACCTCGCCCCTCCACAGTGGCTAAGCCCCTG- CCGCCGEGTEGCCGÇE- TCGCGTCGCGCECCCCCCGAGGCCGCCCCcAGGCGAACTGGCAGAGCACTCT GAACAGCATCGTGGGTCTGGGAGTGCAGAGTGTGAAGCGCCGCCGCTGCTA- TTAAAAGACAC-
TGTAGCGCTTAACTTGCTTGTCTGTGTGTATATGTATGTCCGCCGACCAGAA GGAGGAGGAAGAGGCGCGTCGCCGAGTTGCAAGATGGCCACCCCATCGATG- CTGCCCCAG- TGGGCGTACATGCACATCGCCGGACAGGACGCTTCGGAGTACCTGAGTCCGG GTCTGGTGCAGTTCGCCCGCGCCACAGACACCTACTTCAGTCTGGGGAA- CAAGTTTAGGAAC- CCCACGGTGGCACCCACGCACGATGTGACCACCGACCGCAGCCAGCGGCTGA CGCTGCECTTCETGCCCGTGGACCGCGAGGACAACACCTACTCGTACAAAG- TGCGCTACACG- CTGGCCETGGEGCEACAACCGCGETGCTGGACATGGCCAGCACCTACTTTGACA TCCGCGGCETGCTGGATCGGGGCCCCAGCTTCAAACCCTACTCCGGCACCG- CCTACAACAG- CCTGGCTCCCAAGGGAGCGCCCAACACCTCACAGTGGATAACCAAAGACAAT GGAACTGATAAGACATACAGTTTTGGAAATGCTCCAGTCAGAGGATTGGA- CATTACA- GAAGAGGGTCTCCAAATAGGAACCGATGAGTCAGGGGGTGAAAGCAAGAAAA TTTTTGCAGACAAAACCTATCAGCCTGAACCTCAGCTTGGAGATGAGGAA- TGGCATGATAC- TATTGGAGCTGAAGACAAGTATGGAGGCAGAGCGCTTAAACCTGCCACCAAC ATGAAACCCTGCTATGGGTCTTTCGCCAAGCCAACTAATGCTAAGGGAGGT- CAGGCTAAAAG- CAGAACCAAGGACGATGGCACTACTGAGCCTGATATTGACATGGCCTTCTTT GACGATCGCAGTCAGCAAGCTAGTTTCAGTCCAGAACTTGTTTTGTATAC- TGAGAATG- TCGATCTGGACACCCCGGATACCCACATTATTTACAAACCTGGCACTGATGA AACAAGTTCTTCTTTCAACTTGGGTCAGCAGTCCATGCCCAACAGAC- CCAACTACATTGG- CTTCAGAGACAACTTTATCGGGCTCATGTACTACAACAGCACTGGCAATATG GGTGTACTGGCCGGTCAGGCCTCCCAGCTGAATGCTGTGGTGGACTTGCAG- GACAGAAACAC- TGAACTGTCCTACCAGCTCTTGCTTGACTCTCTGGGTGACAGAACCAGGTAT TTCAGTATGTGGAATCAGGCGGTGGACAGCTATGACCCCGATGTGCGCAT- TATTGAAAAT- CACGGTGTGGAGGATGAACTCCCCAACTATTGCTTCCCTTTGAATGGTGTGG GCTTTACAGATACATTCCAGGGAATTAAGGTTAAAACTACAAATAACGGAA- CAGCAAATGC- TACAGAGTGGGAATCTGATACCTCTGTCAATAATGCTAATGAGATTGCCAAG GGCAATCCTTTCGCCATGGAGATCAACATCCAGGCCAACCTGTGGCGGAAC- TTCCTCTACG- CGAACGTGGCGCTGTACCTGCCCGACTCCTACAAGTACACGCCGGCCAACAT CACGCTGCCCACCAACACCAACACCTACGATTACATGAACGGCCGCGTGEGG- TGGCGCCCTCG- CTGGTGGACGCCTACATCAACATCGGGGCGCGCTGEGTCGCTGGACCCCATGG ACAACGTCAACCCCTTCAACCACCACCGCAACGCGGGCCTGCGCTACCG- CTCCATG- CTCCTGGGCAACGGGCGCTACGTGCCCTTCCACATCCAGGTGCCCCAAAAGT TTTTCGCCATCAAGAGCCTCCTGCTCCTGCCCGGGTCCTACACCTACGAG- TGGAACTTCCG- CAAGGACGTCAACATGATCCTGCAGAGCTCCCTCGGCAACGACCTGCGCACG GACGGGGCCTCCATCGCCTTCACCAGCATCAACCTCTACGCCACCTTCTT- CCCCATGGCGCA- CAACACCGCCTCCACGCTCGAGGCCATGCTGCGCAACGACACCAACGACCAG TCCTTCAACGACTACCTCTCGGCGGCCAACATGCTCTACCCCATCCCGG- CCAACGCCAC- CAACGTGCCCATCTCCATCCCCTCGCGCAACTGGGCCGCCTTCCGCGGATGG TCCTTCACGCGCCTCAAGACCCGCGAGACGCCCTCGCTCGGCTCCGGGTT- CGACCCCTACTT- CGTCTACTCGGGCTCCATCCCCTACCTCGACGGCACCTTCTACCTCAACCAC ACCTTCAAGAAGGTCTCCATCACCTTCGACTCCTCCGTCAGCTGGCCCGG- CAACGACCG- CCTCCTGACGCCCAACGAGTTCGAAATCAAGCGCACCGTCGACGGAGAGGGG TACAACGTGGCCCAGTGCAACATGACCAAGGACTGGTTCCTGGTCCAGATG- CTGGCCCACTA- CAACATCGGCTACCAGGGCTTCTACGTGCCCGAGGGCTACAAGGACCGCATG TACTCCTTCTTCCGCAACTTCCAGCCCATGAGCCGCCAGGTCGTGGA- CGAGGTCAACTA- CAAGGACTACCAGGCCGTCACCCTGGCCTACCAGCACAACAACTCGGGCTTC GTCGGCTACCTCGCGCCCACCATGCGCCAGGGCCAGCCCTACCCCGCCAAC- TACCCCTAC- CCGCTCATCGGCAAGAGCGCCGTCGCCAGCGTCACCCAGAAAAAGTTCCTCT GCGACCGGGTCATGTGGCGCATCCCCTTCTCCAGCAACTTCATG- TCCATGGGCGCGCTCAC- CGACCTCGGCCAGAACATGCTCTACGCCAACTCCGCCCACGCGCTAGACATG AATTTCGAAGTCGACCCCATGGATGAGTCCACCCTTCTCTATGTTGTCTT- CGAAGTCTTCGA- CGTCGTCCGAGTGCACCAGCCCCACCGCGGCETCATCGAGGCCGTCTACCTG CGCACGCCCTTCTCGGCCGGCAACGCCACCACCTAAGCCTCTTGCTTCTTG- CAAGATGACGG- CCTGTGGCTCCGGCGAGCAGGAGCTCAGGGCCATCCTCCGCGACCTGGGCTGE CGGGCCCTACTTCCTGGGCACCTTCGACAAGCGCTTCCCGGGATTCATGG- CCCCGCACAAG- CTGGCCTGCGCCATCGTCAACACGGCCGECCECGAGACCGGGGGCGAGCACT GGCTGGCCTTCGCCTGGAACCCGCGCACCCACACCTGCTACCTCTTCGAC- CCCTTCGGGTT- CTCGGACGAGCGCCTCAAGCAGATCTACCAGTTCGAGTACGAGGGCCTGCTG CGCCGCAGCGCCCTGGECCACCGAGGACCGCTGCGTCACCCTGGAAAAG- TCCACCCAGACCG- TGCAGGGTCCGCGCTCGGCCEGCCTGCGGGCTCTTCTGCTGCATGTTCCTGCA CGCCTTCGTGCACTGGCCCGACCGCCCCATGGACAAGAACCCCAC- CATGAACTTGCTGA- CGGGGGTGCCCAACGGCATGCTCCAGTCGCCCCAGGTGGAACCCACCCTGCG CCGCAACCAGGAGGCGCTCTACCGCTTCCTCAACGCCCACTCCGCCTAC- TTTCGCTCCCAC- CGCGCGCGCATCGAGAAGGCCACCGCCTTCGACCGCATGAATCAAGACATGT AAACTGTGTGTATGTGAATGCTTTATTCATAATAAACAGCACATGTTTATG- CCACCTT- CTCTGAGGCTCTGACTTTATTTAGAAATCGAAGGGGTTCTGCCGGCTCTCGG CGTGCCCCGCEGECAGGEGATACGTTGCGGAACTGGTACTTGGGCAGCCAC- TTGAACTCGGG- GATCAGCAGCTTCGGCACGGGGAGGTCGGGGAACGAGTCGCTCCACAGCTTG CGCGTGAGTTGCAGGGCGCCCAGCAGGTCGGGCGCGGATATCTTGAAATCA- CAGTTGGGAC- CCGCGTTCTGCGCGECGAGAGTTGCGGTACACGGGGTTGCAGCACTGGAACAC CATCAGGGCCGGGTGCTTCACGCTCGCCAGCACCGTCGCGTCGGTGATG- CCCTCCACGTCCA- GATCCTCGGCGTTGGCCATCCCGAAGGGGGTCATCTTGCAGGTCTGCCGCCC CATGCTGGGCACGCAGCCGGGCTTGTGGTTGCAATCGCAGTGCAGGGGGAT- CAGCAT- CATCTGGGCCTGCTCGGAGCTCATGCCCGGGTACATGGCCTTCATGAAAGCC TCCAGCTGGCGGAAGGCCTGCTGCGCCTTGCCGCCCTCGGTGAAGAAGAC- CCCGCAGGAC- TTGCTAGAGAACTGGTTGGTGGCGCAGCCGGCEGTCGTGCACGCAGCAGCGCG CGTCGTTGTTGGCCAGCTGCACCACGCTGCGCCCCCAGCGGTTCTGGGÇ- TGATCTTGGCCCGG- TCGGGGTTCTCCTTCAGCGCGCGCTGCCCGTTCTCGCTCGCCACATCCATCT CGATCGTGTGCTCCTTCTGGATCATCACGGTCCCGTGCAGGCACCGCAG- CTTGCCCTCGG- CTTCGGTGCATCCGTGCAGCCACAGCGCGCAGCCGGTGCACTCCCAGTTCTT GTGGGCGATCTGGGAGTGCGAGTGCACGAAGCCCTGCAGGAAGCGGCCCAT- CATCGCGGTCA- GGGTCTTGTTGCTGGTGAAGGTCAGCGGGATGCCGCGGTGCTCCTCGTTCAC ATACAGGTGGCAGATGCGGCGGTACACCTCGCCCTGCTCGGGCATCAGCTG- GAAGGCGGAC- TTCAGGTCGCTCTCCACGCGGTACCGCTCCATCAGCAGCGTCATGACTTCCA TGCCCTTCTCCCAGGCCGAAACGATCGGCAGGCTCAGGGGGTTCTTCACCG- TTGTCATCT- TAGTCGCCGCCGCCGAGEGTCAGGGGGTCGTTCTCGTCCAGGGTCTCAAACAC TCGCTTGCCGTCCTTCTCGGTGATGCGCACGGGGGGAAAGCTGAAG- CCCACGGCCGCCAG- CTCCTCCTCGECCTGCCTTTCGETCCTCGCTGTCCTGGCTGATGTCTTGCAAA GGCACATGCTTGGTCTTGCGGGGTTTCTTTTTGGGCGGCAGAGGCGGCGEG- CGGAGACGTG- CTGGGCGAGCGCGAGTTCTCGCTCACCACGACTATTTCTTCTTCTTGGCCGT CGTCCGAGACCACGCGGCGGTAGGCATGCCTCTTCTGGGGCAGAGGCGGA- GGCGACGGG-
CTCTCGCGETTCEGCEGECEGCTGGCAGAGCCCCTTCCGCGEGTTCEGEGETÇECÇ GCTCCTGGCGGCECTGCTCTGACTGACTTCCTCCGCGGCCGGCCATTGTG- TTCTCCTAGGGA- GCAAGCATGGAGACTCAGCCATCGTCGCCAACATCGCCATCTGCCCCCGCeG CCGCCGACGAGAACCAGCAGCAGCAGAATGAAAGCTTAACCGCCCCGCCG- CCCAGCCCCAC-
CTCCGACGCCGCEGCCCCAGACATGCAAGAGATGGAGGAATCCATCGAGATT GACCTGGGCTACGTGACGCCCGCGGAGCACGAGGAGGAGCTGGCAGCGCG- CTTTTCAG- CCCCGGAAGAGAACCACCAAGAGCAGCCAGAGCAGGAAGCAGAGAGCGAGCA GAGCCAGGCTGGGCTCGAGCATGGCGACTACCTGAGCGGGGCAGAGGACG- TGCTCATCAAG- CATCTGGCCCGCCAATGCATCATCGTCAAGGATGCGCTGCTCGACCGCGCCG AGGTGCCCCTCAGCGTGGCGGAGCTCAGCCGCGCCTACGAGCGCAAC- CTCTTCTCGCCGCG- CGTGCCCCCCAAGCGCCAGCCCAACGGCACCTGCGAGCCCAACCCGOGCCTC AACTTCTACCCGGTCTTCGCGGTGCCCGAGGCCCTGGCCACCTACCAC- CTCTTTTT- CAAGAACCAAAGGATCCCCGTCTCCTGCCGCGCCAACCGCACCCGCGCCGAC GCCCTGCTCAACCTGGGCCCCGEGCECCCGCCTACCTGATATCGCCTCCTTG- GAAGAGGTT- CCCAAGATCTTCGAGGGTCTGGGCAGCGACGAGACTCGGGCCGCGAACGCTC TGCAAGGAAGCGGAGAGGAGCATGAGCACCACAGCGCCCTGGTGGAGTTG- GAAGGCGA- CAACGCGCGCCTGGCGGTCCTCAAGCGCACGGTCGAGCTGACCCACTTCGCC TACCCGGCGCTCAACCTGCCCCCCAAGGTCATGAGCGCCGTCATGGACCA- GGTGCTCAT- CAAGCGCGCCTCGCCCCTCTCGGAGGAGGAGATGCAGGACCCCGAGAGCTCG GACGAGGGCAAGCCCGTGGTCAGCGACGAGCAGCTGGCGCGCTGGCTGGGA- GCGAGTAGCAC- CCCCCAGAGCCTGGAAGAGCGGCGCAAGCTCATGATGGCCGTGGTCCTGGTG ACCGTGGAGCTGGAGTGTCTGCGCCGCTTCTTCGCCGACGCGGAGACCCTG- CGCAAGG- TCGAGGAGAACCTGCACTACCTCTTCAGGCACGGGTTCGTGCGCCAGGCCTG CAAGATCTCCAACGTGGAGCTGACCAACCTGGTCTCCTACATGGG- CATCCTGCACGAGAAC- CGCCTGGGGCAGAACGTGCTGCACACCACCCTGCGCGGEGAGGCCCGCCGCG ACTACATCCGCGACTGCGTCTACCTGTACCTCTGCCACACCTGGCAGA- CGGGCATGGGCGTG- TGGCAGCAGTGCCTGGAGGAGCAGAACCTGAAAGAGCTCTGCAAGCTCCTGC AGAAGAACCTGAAGGCCCTGTGGACCGGGTTCGACGAGCGCACCACCG- CCTCGGACCTGG- CCGACCTCATCTTCCCCGAGCGCCTGCEGCTGACGCTGCGCAACGGGCTGECC CGACTTTATGAGCCAAAGCATGTTGCAAAACTTTCGCTCTTT- CATCCTCGAACGCTCCGGGA- TCCTGCCCGCCACCTGCTCCGCGCTGCCCTCGGACTTCGTGCCGCTGACCTT CCGCGAGTGCCCCCCGCCGCTCTGGAGCCACTGCTACCTGCTGCGTCTGG- CCAACTACCTGG- CCTACCACTCGGACGTGATCGAGGACGTCAGCGGCGAGGGTCTGCTCGAGTG CCACTGCCGCTGCAACCTCTGCACGCCGCACCGCTCCCTGGCCTGCAAC- CCCCAGCTG- CTGAGCGAGACCCAGATCATCGGCACCTTCGAGTTGCAAGGCCCCGGCGAGE AGGGCAAGGGGGGTCTGAAACTCACCCCGGGGCTEGTGGACCTCGGCCTAC- TTGCGCAAGTT- CGTGCCCGAGGACTACCATCCCTTCGAGATCAGGTTCTACGAGGACCAATCC CAGCCGCCCAAGGCCGAGCTGTCGGCCTGCGTCATCACCCAGGGGG- CCATCCTGGCCCAA- TTGCAAGCCATCCAGAAATCCCGCCAAGAATTTCTGCTGAAAAAGGGCCACG GGGTCTACTTGGACCCCCAGACCGGAGAGGAGCTCAACCCCAGCTT- CCCCCAGGATGCCCA- GAGGAAGCAGCAAGAAGCTGAAAGTGGAGCTGCCGCTGCCGCCGGAGGATTT GGAGGAAGACTGGGAGAGCAGTCAGGCAGAGGAGGAGGAGATGGAAGAC- TGGGACAGCACT- CAGGCAGAGGAGGACAGCCTGCAAGACAGTCTGGAAGACGAGGTGGAGGAGG AGGCAGAGGAAGAAGCAGCCGCCGCCAGACCGTCGTCCTCGGCGGAGAAAG- CAAGCAGCACG- GATACCATCTCCGCTCCGGGTCEGEGTCTCGGCGEGCCGEGGCCCACAGTAGGT GGGACGAGACCGGGCGCTTCCCGAACCCCACCACCCAGACCGGTAAGAAG- GAGCGGCAGGGA- TACAAGTCCTGGCGGGGGCACAAAAACGCCATCGTCTCCTGCTTGCAAGCCT GCGGGGGCAACATCTCCTTCACCCGGCGCTACCTGCTCTTCCACCGCGGGG- TGAACTT- CCCCCGCAACATCTTGCATTACTACCGTCACCTCCACAGCCCCTACTACTGT TTCCAAGAAGAGGCAGAAACCCAGCAGCAGCAGAAAACCAGCAGCAGC- TAGAAAATCCACAG- CGGCGGCEGCEGCAGETGGACTGAGGATCGCGGCGAACGAGCCGGCGCAGAC CCGGGAGCTGAGGAACCGGATCTTTCCCACCCTCTATGCCATCTTCCAGCA- GAGTCGGGGG- CAGGAGCAGGAACTGAAAGTCAAGAACCGTTCTCTGCGCTCGCTCACCCGCA GTTGTCTGTATCACAAGAGCGAAGACCAACTTCAGCGCACTCTCGAGGACG- CCGAGG- CTCTCTTCAACAAGTACTGCGCGCTCACTCTTAAAGAGTAGCCCGCGCCCGC CCACACACGGAAAAAGGCGGGAATTACGTCACCACCTGCGCCCTTCG- CCCGACCATCAT- CATGAGCAAAGAGATTCCCACGCCTTACATGTGGAGCTACCAGCCCCAGATG GGCCTGGCCECCEGCECCGCCCAGGACTACTCCACCCGCATGAACTGGCT- CAGTGCCGGG-
CCCGCGATGATCTCACGGGTGAATGACATCCGCGCCCGCCGAAACCAGATAC TCCTAGAACAGTCAGCGATCACCGCCACGCCCCGCCATCACCTTAATCCG- CGTAATTGG- CCCECGCCEGCCeTtEGTETACCAGGAAATTCCCCAGCCCACGACCGTACTACTTC CGCGAGACGCCCAGGCCGAAGTCCAGCTGACTAACTCAGGTGTCCAGCTGG- CCGGCGGECG-
CCGCCCTGTGTCGTCACCGCCCCGCTCAGGGTATAAAGCGGCTGGTGATCCG AGGCAGAGGCACACAGCTCAACGACGAGGTGGTGAGCTCTTCGCTGGG- TCTGCGACCTGACG- GAGTCTTCCAACTCGCCGGATCGGGGAGATCTTCCTTCACGCCTCGTCAGGC CGTCCTGACTTTGGAGAGTTCGTCCTCGCAGCCCCGCTCGGGTGGCATCGG- CACTCTCCAG- TTCGTGGAGGAGTTCACTCCCTCGGTCTACTTCAACCCCTTCTCCGGCTCCC CCGGCCACTACCCGGACGAGTTCATCCCGAACTTCGACGCCATCAGCGAG- TCGGTGGACGGC- TACGATTGAATGTCCCATGGTGGCGCGGCTGACCTAGCTCGGCTTCGACACC TGGACCACTGCCGCCGCTTCCGCTGCTTCGCTCGGGATCTCGCCGAGTTTG- CCTACTTTGAG- CTGCCCGAGGAGCACCCTCAGGGCCCGGCCCACGGAGTGCGGATCATCGTCG AAGGGGGCCTCGACTCCCACCTGCTTCGGATCTTCAGCCAGCG- TCCGATCCTGGTCGAGCG- CGAGCAAGGACAGACCCGTCTGACCCTGTACTGCATCTGCAACCACCCCGGC CTGCATGAAAGTCTTTGTTGTCTGCTGTGTACTGAGTATAATAAAAGCTGA- GATCAGCGAC- TACTCCGGACTTCCGTGTGTTCCTGAATCCATCAACCAGTCCCTGTTCTTCA CCGGGAACGAGACCGAGCTCCAGCTCCAGTGTAAGCCCCACAAGAAGTAC- CTCACCTGGCTG- TTCCAGGGCTCCCCGATCGCCGTTGTCAACCACTGCGACAACGACGGAGTCC TGCTGAGCGGCCCTGCCAACCTTACTTTTTCCACCCGCAGAAGCAAG- CTCCAGCTCTT- CCAACCCTTCCTCCCCGGGACCTATCAGTGCGTCTCGGGACCCTGCCATCAC ACCTTCCACCTGATCCCGAATACCACAGCGTCGCTCCCCGCTACTAACAAC- CAAACTAC- CCACCAACGCCACCGTCGCGACCTTTCCTCTGAATCTAATACCACTACCGGA GGTGAGCTCCGAGGTCGACCAACCTCTGGGATTTACTACGGCCCCTGGGA- GGTGGTGGGGT- TAATAGCGCTAGGCCTAGTTGTGGGTGGGCTTTTGGCTCTCTGCTACCTATA CCTCCCTTGCTGTTCGTACTTAGTGGTGCTGTGTTGCTGGTTTAAGAAA- TGGGGCAGATCAC- CCTAGTGAGCTGCGGTGTGCTGEGTGGCGETCGETGCTTTCGATTGTGGGACTG GGCGGCGCGEGCTETAGTGAAGGAGAAGGCCGATCCCTGCTTGCATTTCAA- TCCCGACAAATG- CCAGCTGAGTTTTCAGCCCGATGGCAATCGGTGCGCGGTGCTGATCAAGTGC GGATGGGAATGCGAGAACGTGAGAATCGAGTACAATAACAAGACTCGGAA- CAATACTCTCG- CGTCCGTGTGGCAGCCCGGGGACCCCGAGTGGTACACCGTCTCTGTCCCCGG TGCTGACGGCTCCCCGCGCACCGTGAATAATACTTTCATTTTTGCGCACA- TGTGCGACACGG- TCATGTGGATGAGCAAGCAGTACGATATGTGGCCCCCCACGAAGGAGAACAT CGTGGTCTTCTCCATCGCTTACAGCCTGTGCACGGTGCTAATCACCGCTA- TCGTGTG- CCTGAGCATTCACATGCTCATCGCTATTCGCCCCAGAAATAATGCCGAAAAA GAGAAACAGCCATAACACGTTTTTTCACACACCTTGTTTTTACAGACAATG- CGTCTGTTAAA- TTTTTTAAACATTGTGCTCAGTATTGCTTATGCCTCTGGCTATGCAAACATA CAGAAAACCCTCTATGTAGGATCTGATGATACACTAGAGGGTACCCAATCA- CAAGCTAGGG- TTTCATGGTATTTTTATAAAAGCTCAGATAATCCTATTACTCTTTGCAAAGG TGATCAGGGGCGGACAACAAAGCCGCCTATCACATTTAGCTGTACCAGAA- CAAATCTCACG- CTTTTCTCAATTACAAAACAATATGCTGGTATTTATTACAGTACAAACTTTC ATAGTGGGCAAGATAAATATTATACTGTTAAGGTAGAAAATCCTACCAC- TCCTAGAACTAC- CACCACCACCACCACCACCACCACTACTGCGAAGCCCACTAAACCTAAAACT ACCAAGAAAACCACTGTGAAAACTACAACTAGAACCACCACAACTACA- GAAACCACCACCAG- CACAACACTTGCTGCAACTACACACACACACACTGAGCTAACCTTACAGACC ACTAATGATTTGATAGCCCTGTTGCAAAAGGGGGATAACAGCACCACTT- CCAATGAGGAGA- TACCCAAATCCATGATTGGCATTATTGTTGCTGTAGTGGTGTGCATGTTGAT CATCGCCTTGTGCATGGTGTACTATGCCTTCTGCTACAGAAAGCACAGAC- TGAACGACAAG- CTGGAACACTTACTAAGTGTTGAATTTTAATTTTTTAGAACCATGAAGATCC TAGGCCTTTTAGTTTTTTCTATCATTACCTCTGCTCTATGCAATTCTGACA- ATGAGGACGT- TACTGTCGTTGTCGGATCAAATTATACACTGAAAGGTCCAGCGAAGGGTATG CTTTCGTGGTATTGCTGGTTTGGAACTGACACTGATCAAACTGAGCTTTG- CAATGCAA- TGAAAGGTCAAATACCAACCTCAAAAATTAAACATAAATGCAATGGTACTGA CTTAGTACTACTCAATATCACGAAATCATATGCTGGCAGCTATTCATG- CCCTGGAGATGATG- CTGAGAACATGATTTTTTACAAAGTAACTGTTGTTGATCCCACTACTCCACC ACCCACCACCACAACTACTCACACCACACACACAGAACAAACACCAGAGG- CAGCAGAAGCA- GAGTTGGCCTTCCAGGTTCACGGAGATTCCTTTGCTGTCAATACCCCTACAC CCGATCATCGGTGTCCGGEGCTGCTAGTCAGCGGCATTGTCGGTGTGCTTT- CGGGATTAGCA- GTCATAATCATCTGCATGTTCATTTTTGCTTGCTGCTATAGAAGGCTTTACC GACAAAAATCAGACCCACTGCTGAACCTCTATGTTTAATTTTTTCCAGAG- CCATGAAGGCAG- TTAGCGCTCTAGTTTTTTGTTCTTTGATTGGCATTGTTTTTTGCAATCCTAT TACTAGAGTTAGCTTTATTAAAGATGTGAATGTTACTGAGGGGGGCAATG- TGACACTGG- TAGGTGTAGAGGGTGCTAAAAACACCACCTGGACAAAATACCACCTTGGGTG GAAAGATATTTGCAATTGGAGTGTCACTGTGTACACATGTGAGGGAGTTAA- TCTTACCATTG- TCAATGCCACCTCAGCTCAAAATGGTAGAATTCAAGGACAAAGTGTTAGTGT GACCAGTGATGGGTATTTTACCCAACATACTTTTATCTATGACGTTAAAGT- CATACCACTG- CCTACGCCTAGCCCACCTAGCACCACTACACAAACAACCCACACTACACAGA CAACCACATACAGTACATCAAATCAGCCTACCACCACTACAGCAGCAGAGG- TTGCCAGCTCG- TCTGGAGTTCAAGTGGCATTTTTGTTGTTGCCCCCATCTAGCAGTCCCACTG CTATTACCAATGAGCAGACTACTGCATTTTTGTCCACTGTCGAGAGCCACA- CCACAGCTAC- CTCCAGTGCCTTCTCTAGCACCGCCAATCTCTCCTCGCTTTCCTCTACACCA ATCAGTCCCGCTACTACTACTACCCCCGCTATTCTTCCCACTCCCCTGAAG- CAAACAGACGG- CGGCATGCAATGGCAGATCACCCTGCTCATTGTGATCGGGTTGGTCATCCTA GCCGTGTTGCTCTACTACATCTTCTGCCGCCGCATTCCCAACGCGCACCG- CAAGCCGGTCTA- CAAGCCCATCATTGTCGGGCAGCCGGAGCCGCTTCAGGTGGAAGGGGGTCTA AGGAATCTTCTCTTCTCTTTTACAGTATGGTGATTGAACTATGATTCCTA- GACAATT- CTTGATCACTATTCTTATCTGCCTCCTCCAAGTCTGTGCCACCCTCGCTCTG GTGGCCAACGCCAGTCCAGACTGTATTGGGCCCTTCGCCTCCTACGTG- CTCTTTGCCTTCAT- CACCTGCATCTGCTGCTGTAGCATAGTCTGCCTGCTTATCACCTTCTTCCAG TTCATTGACTGGATCTTTGTGCGCATCGCCTACCTGCGCCACCACCCCCAG- TACCGCGACCA- GCGAGTGGCGCAGCTGCTCAGGCTCCTCTGATAAGCATGCGGGCTCTGCTAC TTCTCGCGCTTCTGCTGTTAGTGCTCCCCCGTCCCGTTGACCCCCGG- CCCCCCACTCAG- TCCCCCGAGGAGGTCCGCAAATGCAAATTCCAAGAACCCTGGAAATTCCTCA AATGCTACCGCCAAAAATCAGACATGCATCCCAGCTGGATCATGAT- CATTGGGATCGTGAA- CATTCTGGCCTGCACCCTCATCTCCTTTGTGATTTACCCCTGCTTTGACTTT GGTTGGAACTCGCCAGAGGCGCTCTATCTCCCGCCTGAACCTGACACAC- CACCACAGCAAC- CTCAGGCACACGCACTACCACCACCACAGCCTAGGCCACAATACATGCCCAT ATTAGACTATGAGGCCGAGCCACAGCGACCCATGCTCCCCGCTATTAGT- TACTTCAATC- TAACCGGCGGAGATGACTGACCCACTGGCCAACAACAACGTCAACGACCTTC TCCTGGACATGGACGGCCGCGCCTCGGAGCAGCGACTCGCCCAACTTCG- CATTCGCCAGCAG- CAGGAGAGAGCCGTCAAGGAGCTGCAGGACGGCATAGCCATCCACCAGTGCA AGAAAGGCATCTTCTGCCTGGTGAAACAGGCCAAGATCTCCTACGAGGT- CACCCAGACCGAC- CATCGCCTCTCCTACGAGCTCCTGCAGCAGCGCCAGAAGTTCACCTGCCTGG TCGGAGTCAACCCCATCGTCATCACCCAGCAGTCGGGCGATACCAAGGGG- TGCATCCACTG- CTCCTGCGACTCCCCCGACTGCGTCCACACTCTGATCAAGACCCTCTGCGGC CTCCGCGACCTCCTCCCCATGAACTAATCACCCACTTATCCAGTGAAA- TAAAAAAATAAT- CATTTGATTTGAAATAAAGATACAATCATATTGATGATTTGAGTTTAACAAA AATAAAGAATCACTTACTTGAAATCTGATACCAGGTCTCTGTCCATATTTT- CTGCCAACAC- CACCTCACTCCCCTCTTCCCAGCTCTGGTACTGCAGGCCCCGGCEGECTECA AACTTCCTCCACACGCTGAAGGGGATGTCAAATTCCTCCTGCCCCTCAA- TCTTCATTTTA- TCTTCTATCAGATGTCCAAAAAGCGCGTCCGGGTGGATGATGACTTCGACCC CGTCTACCCCTACGATGCAGACAACGCACCGACCGTGCCCTTCATCAAC- CCCCCCTTCG- TCTCTTCAGATGGATTCCAAGAGAAGCCCCTGGGGGTGTTGTCCCTGCGACT GGCCGACCCCGTCACCACCAAGAACGGGGAAATCACCCTCAAGCTGGGA- GAGGGGGTGGAC- CTCGACTCCTCGGGAAAACTCATCTCCAACACGGCCACCAAGGCCGCTGCCC CTCTCAGTTTTTCCAACAACACCATTTCCCTTAACATGGATCACCCCTTT- TACACTAAAGA- TGGAAAATTAGCCTTACAAGTTTCTCCACCATTAAATATACTGAGAACAAGC ATTCTAAACACACTAGCTTTAGGTTTTGGATCAGGTTTAGGACTCCGTGG- CTCTGCCTTGG- CAGTACAGTTAGTCTCTCCACTTACATTTGATACTGATGGAAACATAAAGCT TACCTTAGACAGAGGTTTGCATGTTACAACAGGAGATGCAATTGAAAGCAA- CATAAGCTGGG- CTAAAGGTTTAAAATTTGAAGATGGAGCCATAGCAACCAACATTGGAAATGG GTTAGAGTTTGGAAGCAGTAGTACAGAAACAGGTGTCGATGATGCTTAC- CCAATCCAAGT- TAAACTTGGATCTGGCCTTAGCTTTGACAGTACAGGAGCCATAATGGCTGGT AACAAAGAAGACGATAAACTCACTTTGTGGACAACACCTGATCCATCAC- CAAACTGTCAAA- TACTCGCAGAAAATGATGCAAAACTAACACTTTGCTTGACTAAATGTGGTAG TCAAATACTGGCCACTGTGTCAGTCTTAGTTGTAGGAAGTGGAAACC- TAAACCCCATTAC- TGGCACCGTAAGCAGTGCTCAGGTGTTTCTACGTTTTGATGCAAACGGTGTT CTTTTAACAGAACATTCTACACTAAAAAAATACTGGGGGTATAGGCAGGGA- GATAGCATAGA- TGGCACTCCATATGTCAATGCTGTAGGATTCATGCCCAATTTAAAAGCTTAT CCAAAGTCACAAAGTTCTACTACTAAAAATAATATAGTAGGGCAAGTATA- CATGAATGGAGA- TGTTTCAAAACCTATGCTTCTCACTATAACCCTCAATGGTACTGATGACAGC AACAGTACATATTCAATGTCATTTTCATACACCTGGACTAATGGAAGCTA- TGTTGGAGCAA- CATTTGGAGCTAACTCTTATACCTTCTCCTACATCGCCCAAGAATGAATACT GTATCCCACCCTGCATGCCCAACCCTCCCCCACCTCTGTCTATATGGA- AAACTCTGAAACA- CAAAATAAAATAAAGTTCAAGTGTTTTATTGATTCAACAGTTTTACAGGATT CGAGCAGTTATTTTTCCTCCACCCTCCCAGGACATGGAATACACCAC- CCTCTCCCCCCGCA- CAGCCTTGAACATCTGAATGCCATTGGTGATGGACATGCTTTTGGTCTCCAC GTTCCACACAGTTTCAGAGCGAGCCAGTCTCGGGTCGGTCAGGGAGA- TGAAACCCTCCGGG- CACTCCCGCATCTGCACCTCACAGCTCAACAGCTGAGGATTGTCCTCGGTGG TCGGGATCACGGTTATCTGGAAGAAGCAGAAGAGCGGCGGTGGGAATCATA- GTCCG- CGAACGGGATCGGCCGGTGGTGTCGCATCAGGCCCCGCAGCAGTCGCTGCCG CCGCCGCTCCGTCAAGCTGCTGCTCAGGGGGTCCGGGTCCAGGGACTCCCT- CAGCATGATG- CCCACGGCCCTCAGCATCAGTCGTCTGGTGCGGCGGGCEGCAGCAGCGCATGC GGATCTCGCTCAGGTCGCTGCAGTACGTGCAACACAGGACCACCAGGTTG- TTCAACAGTCCA- TAGTTCAACACGCTCCAGCCGAAACTCATCGCGGGAAGGATGCTACCCACGT GGCCGTCGTACCAGATCCTCAGGTAAATCAAGTGGCGCCCCCTCCAGAACA- CGCTGCCCATG- TACATGATCTCCTTGGGCATGTGGCGGTTCACCACCTCCCGGTACCACATCA CCCTCTGGTTGAACATGCAGCCCCGGATGATCCTGCGGAACCACAGGGCCA- GCACCGCCCCG- CCCGCCATGCAGCGAAGAGACCCCGGEGTCCCGGCAATGGCAATGGAGGACCC ACCGCTCGTACCCGTGGATCATCTGGGAGCTGAACAAGTCTATGTTGGCA- CAGCACAGGCA- CACGCTCATGCATCTCTTCAGCACTCTCAGCTCCTCGGGGGTCAAAACCATA TCCCAGGGCACGGGAAACTCTTGCAGGACAGCGAAGCCCGCAGAACAGGG- CAATCCTCGCA- CATAACTTACATTGTGCATGGACAGGGTATCGCAATCAGGCAGCACCGGGTG ATCCTCCACCAGAGAAGCGCGGGTCTCGGTCTCCTCACAGCGTGG- TAAGGGGGCCGGCCGA- TACGGGTGATGGCGGGACGCGGCTGATCGTGTTCGCGACCGTGTCATGATGC AGTTGCTTTCGGACATTTTCGTACTTGCTGAAGCAGAACCTGGTCCGGGCG- CTGCACAC- CGATCGCCGGCGECEGTCTCGGCGCTTGGAACGCTCGGTGTTGAAGTTGTAA AACAGCCACTCTCTCAGACCGTGCAGCAGATCTAGGGCCTCAGGAG- TGATGAAGATCCCAT- CATGCCTGATGGCTCTGATCACATCGACCACCGTGGAATGGGCCAGACCCAG CCAGATGATGCAATTTTGTTGGGTTTCGGTGACGGCGGGGGAGGGAAGAA- CAGGAAGAAC- CATGATTAACTTTTAATCCAAACGGTCTCGGAGCACTTCAAAATGAAGGTCG CGGAGATGGCACCTCTCGCCCCCGCTEGTGTTGGTGGAAAATAACAGCCAGG- TCAAAGGTGA- TACGGTTCTCGAGATGTTCCACGGTGGCTTCCAGCAAAGCCTCCACGCGCAC ATCCAGAAACAAGACAATAGCGAAAGCGGGAGGGTTCTCTAATTCCTCAAT- CATCATGTTA- CACTCCTGCACCATCCCCAGATAATTTTCATTTTTCCAGCCTTGAATGATTC GAACTAGTTCCTGAGGTAAATCCAAGCCAGCCATGATAAAGAGCTCGCGCA- GAGCG- CCCTCCACCGGCATTCTTAAGCACACCCTCATAATTCCAAGATATTCTGCTC CTGGTTCACCTGCAGCAGATTGACAAGCGGGATATCAAAATCTCTGCCG- CGATCCCTGAG- CTCCTCCCTCAGCAATAACTGTAAGTACTCTTTCATATCCTCTCCGAAATTT TTAGCCATAGGACCCCCAGGAATAAGAGAAGGGCAAGCCACATTACAGA- TAAACCGAAG- TCCCCCCCAGTGAGCATTGCCAAATGTAAGATTGAAATAAGCATGCTGGCTA GACCCGGTGATATCTTCCAGATAACTGGACAGAAAATCGGGCAAGCAA- TTTTTAAGAAAAT- CAACAAAAGAAAAATCTTCCAGGTGCACGTTTAGGGCCTCGGGAACAACGAT GGAGTAAGTGCAAGGGGTGCGTTCCAGCATGGTTAGTTAGCTGATCTG- TAAAAAAACAAAAA- ATAAAACATTAAACCATGCTAGCCTGGCGAACAGGTGGGTAAATCGTTCTCT CCAGCACCAGGCAGGCCACGGGGTCTCCGGCGCGACCCTCGTAAAAATTG- TCGCTA- TGATTGAAAACCATCACAGAGAGACGTTCCCGGTGGCCGGCGTGAATGATTC GAGAAGAAGCATACACCCCCGGAACATTGGAGTCCGTGAGTGAAAAAAAG- CGGCCGAGGAAG- CAATGAGGCACTACAACGCTCACTCTCAAGTCCAGCAAAGCGATGCCATGCG GATGAAGCACAAAATTTTCAGGTGCGTAAAAAATGTAATTAC- TCCCCTCCTGCACAGGCAG- CGAAGCTCCCGATCCCTCCAGATACACATACAAAGCCTCAGCGTCCATAGCT TACCGAGCGGCAGCAGCAGCGGCACACAACAGGCGCAAGAGTCAGAGAAAA- GACTGAGCTC- TAACCTGTCCGCCCGCTCTCTGCTCAATATATAGCCCCAGATCTACACTGAC GTAAAGGCCAAAGTCTAAAAATACCCGCCAAATAATCACACACGCCCAGCA- CACGCCCA- GAAACCGGTGACACACTCAAAAAAATACGCGCACTTCCTCAAACGCCCAAAC TGCCGTCATTTCCGGGTTCCCACGCTACGTCATCAAAACACGACTTTCAAA- TTCCGTCGAC- CGTTAAAAACGTCACCCGCCCCGCCCCTAACGGTCGCCGCTCCCGCAGCCÇAA TCAGCGCCCCGCATCCCCAAATTCAAACAGCTCATTTGCATATTAACGCG-
CACCAAAAGTTTGAGGTATATTATTGATGATG SEQ ID NO: 3 Sequência polinucleotídica que codifica o promo- tor CASI GGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCE- CCCAACGAC-
CCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAG GGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCAC- TTGGCAGTACAT- CAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAAT GGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTAC- TTGGCAGTACATC- TACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCT TCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTA- TTTTTTAATTA- TTTTGTGCAGCGATGGGEGCEGEGEGEGEGECGEGECECECECCAGECEGEGC GGEGECEGEGCEAGEGECEGEGCEGEGCEAGECEGAGAGETGECEGCEGCAG- CCAATCAGAG- CGGCGCGCTCCGAAMAGTTTCCTTTTATGGCGAGGCEGCEGCEGCEGCEGCCC TATAAAAAGCGAAGCGCTCCCTATCAGTGATAGAGATCTCCCTATCAGTGA- TAGAGATCG- TCGACGAGCTCGCGGCGEGCEGEAGTCGCTECECGCTGCCTTCGCCCCGTEC CCCGCTCCGCCGCCECCTCECECCECCCECCCCGECTCTGACTGACCGCGT- TACTAAAACA- GGTAAGTCCGGCCTCCGCECCEGETTTTEGCECCTCCCGCEGECECCCCCCT CCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCEGCAGCGAGCGE- TCCTGATCCTTCCG- CCCGGACGCTCAGGACAGCGGCCCECTECTCATAAGACTCGGCCTTAGAACC CCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGEG- CACTGGTTTT- CTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCT GCGGAGGGATCTCCGTGEGECEGTEGAACGCCGATGATGCCTCTACTAAC-
CATGTTCATGTTTTCTTTTTTTTTCTACAGGTCCTGGGTGACGAACAG SEQ ID NO: 4 Sequência de polinucleotídeos que codifica ChAd155/RSV CATCATCAATAATATACCTTATTTTGGATTGAAGCCAATATGATAA- TGAGATGGGCGGCG-
CGGGGCGGGGCGCGGAGGGCGGGAGGCGGGAGTTTGGAGGGGCGGGCCGGC GGGCGGGGCGGTGTGGCGGAAGTGGACTTTGTAAGTGTGGCGGA- TGTGACTTGCTAGTG- CCEGGGCGCGGTAAAAGTGACGTTTTCCGTGCGCGACAACGCCCCCG GGAAGTGACATTTTTCCCGCGGTTTTTACCGGATGTTGTAGTGAA- TTTGGGCGTAACCAAG- TAAGATTTGGCCATTTTCGCGGGAAAACTGAAACGGGGAAGTGAA ATCTGATTAATTTTGCGTTAGTCATACCGCGTAATATTTGTC- TAGGGCCGAGGGACTTTGG- CCGATTACGTGGAGGACTCGCCCAGGTGTTTTTTGAGGTGAATTTC CGCGTTCCGGGTCAAAGTCTGCGTTTTATTATTATAGGATA- TCCCATTGCATACGTTGTA- TCCATATCATAATATGTACATTTATATTGGCTCATGTCCAACATTAC CGCCATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAAT- TACGGGGTCATTAGTT- CATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATG GCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAA- TAATGACGTATGTT- CCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGG AGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCA- TATGCCAAGTACG- CCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATG CCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATC- TACGTATTAGTCATCGC- TATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGA TAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACG- TCAATGGGAGTTTG- TTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACT CCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGG- TCTATATAAGCAGAG- CTCTCCCTATCAGTGATAGAGATCTCCCTATCAGTGATAGAGATCG TCGACGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACG- CCATCCACGCTGTTTTGAC- CTCCATAGAAGACACCGGGACCGATCCAGCCTCCGCGGCCGGGAA CGGTGCATTGGAACGCGGATTCCCCGTGCCAAGAGTGAGATCTT- CCGTTTATCTAGGTACCA- GATATCGCCACCATGGAACTGCTGATCCTGAAGGCCAACGCCATCA CCACCATCCTGACCGCCGTGACCTTCTGCTTCGCCAGCGGCCAGAA- CATCACCGAGGAATTC- TACCAGAGCACCTGTAGCGCCGTGAGCAAGGGCTACCTGAGCGCC CTGAGAACCGGCTGGTACACCAGCGTGATCACCATCGAGCTGAG- CAACATCAAAGAAAA- CAAGTGCAACGGCACCGACGCCAAAGTGAAGCTGATCAAGCAGGA ACTGGACAAGTACAAGAACGCCGTGACCGAGCTGCAGCTG- CTGATGCAGAGCACCCCCG- CCACCAACAACCGGGCCAGACGGGAGCTGCCCCGGTTCATGAACT ACACCCTGAACAACGCCAAAAAGACCAACGTGACCCTGAG- CAAGAAGCGGAAGCGGCGGTT- CCTGGGCTTTCTGCTGGGCGTGGGCAGEGCCATTGCCAGEGGCGTG GCCGTGTCTAAGGTGCTGCACCTGGAAGGCGAAGTGAACAAGAT- CAAGAGCGCCCTGCTGAG- CACCAACAAGGCCGTGGTGTCCCTGAGCAACGGCGTGAGCGTGCT GACCAGCAAGGTGCTGGATCTGAAGAACTACATCGACAAGCAG- CTGCTGCCCATCGTGAA- CAAGCAGAGCTGCAGCATCAGCAACATCGAGACAGTGATCGAGTT CCAGCAGAAGAACAACCGGCTGCTGGAAATCACCCGGGAGTTCAG- CGTGAACGCCGGCGTGA- CCACCCCTGTGTCCACCTACATGCTGACCAACAGCGAGCTGCTGAG CCTGATCAACGACATGCCCATCACCAACGACCAGAAAAAG- CTGATGAGCAACAACGTGCAGA- TCGTGCGGCAGCAGAGCTACTCCATCATGTCCATCATCAAAGAAGA GGTGCTGGCCTACGTGGTGCAGCTGCCCCTGTACGGCGTGATCGA- CACCCCCTGCTGGAAG- CTGCACACCAGCCCCCTGTGCACCACCAACACCAAAGAGGGCAGC AACATCTGCCTGACCCGGACCGACAGAGGCTGGTACTGCGA- CAACGCCGGCAGCGTGTCATT- CTTTCCACAGGCCGAGACATGCAAGGTGCAGAGCAACCGGGTGTTC TGCGACACCATGAACAGCCTGACCCTGCCCTCCGAAGTGAACCTG- TGCAACGTGGACATCTT- CAACCCCAAGTACGACTGCAAGATCATGACCTCCAAGACCGACGT GTCCAGCTCCGTGATCACCTCCCTGGGCGCCATCGTGTCCTGC- TACGGCAAGACCAAGTG- CACCGCCAGCAACAAGAACCGGGGCATCATCAAGACCTTCAGCAA CGGCTGCGACTACGTGTCCAACAAGGGGGTGGACACCGTGTCCG- TGGGCAACACCCTGTAC- TACGTGAACAAACAGGAAGGCAAGAGCCTGTACGTGAAGGGCGAG CCCATCATCAACTTCTACGACCCCCTGGTGTTCCCCAGCGACGAG- TTCGACGCCAGCATCAG- CCAGGTGAACGAGAAGATCAACCAGAGCCTGGCCTTCATCCGGAA GTCCGACGAGCTGCTGCACAATGTGAATGCCGGCAAGTCCACCAC- CAACCGGAAGCGGAGAG- CCCCTGTGAAGCAGACCCTGAACTTCGACCTGCTGAAGCTGGCCGG CGACGTGGAGAGCAATCCCGGCCCTATGGCCCTGAGCAAAG- TGAAACTGAACGATACAC- TGAACAAGGACCAGCTGCTGTCCAGCAGCAAGTACACCATCCAGC GGAGCACCGGCGACAGCATCGATACCCCCAACTACGACGTGCA- GAAGCACATCAACAAGCTG- TGCGGCATGCTGCTGATCACAGAGGACGCCAACCACAAGTTCACCG GCCTGATCGGCATGCTGTACGCCATGAGCCGGCTGGGCCGGGAG- GACACCATCAAGATCCTG- CGGGACGCCGGCTACCACGTGAAGGCCAATGGCGTGGACGTGACC ACACACCGGCAGGACATCAACGGCAAAGAAATGAAGTTCGAGG- TGCTGACCCTGGCCAG- CCTGACCACCGAGATCCAGATCAATATCGAGATCGAGAGCCGGAA GTCCTACAAGAAAATGCTGAAAGAAATGGGCGAGGTGG- CCCCCEGAGTACAGACACGACAG- CCCCGACTGCEGGCATGATCATCCTGTGTATCGCCGCCCTGGTGATCE ACAAAGCTGGCCGCTGGCGACAGATCTGGCCTGACAGCCGTGAT- CAGACGGGCCAACAATG- TGCTGAAGAACGAGATGAAGCGGTACAAGGGCCTGCTGCCCAAGG ACATTGCCAACAGCTTCTACGAGGTGTTCGAGAAGTACCCCCACTT- CATCGACGTGTTCGTG- CACTTCGGCATTGCCCAGAGCAGCACCAGAGGCGGCTCCAGAGTG GAGGGCATCTTCGCCGGCCTGTTCATGAACGCCTACGGCGCOTGG- CCAGGTGATGCTGAGA- TGGGGCGTGCTGGCCAAGAGCGTGAAGAACATCATGCTGGGCCAC GCCAGCGTGCAGGCCGAGATGGAACAGGTGGTGGAGGTG- TACGAGTACGCCCAGAAGCTGGG- CGGAGAGGCCGGCTTCTACCACATCCTGAACAACCCTAAGGCCTCC CTGCTGTCCCTGACCCAGTTCCCCCACTTCTCCAGCEGTGGTGCTGG- GAAATGCCGCCGGAC- TGGGCATCATGGGCGAGTACCGGGGCACCCCCAGAAACCAGGACC TGTACGACGCCGCCAAGGCCTACGCCGAGCAG- CTGAAAGAAAACGGCGTGATCAACTACAG- CGTGCTGGACCTGACCGCTGAGGAACTGGAAGCCATCAAGCACCA GCTGAACCCCAAGGACAACGACGTGGAGCTGGGAGGCGGAGGA- TCTGGCGGCGGAGG- CATGAGCAGACGGAACCCCTGCAAGTTCGAGATCCGGGGCCACTG CCTGAACGGCAAGCGGTGCCACTTCAGCCACAACTACTTCGAG- TGGCCCCCTCATGCTCTG- CTGGTGCGGCAGAACTTCATGCTGAACCGGATCCTGAAGTCCATGG ACAAGAGCATCGACACCCTGAGCGAGATCAGCGGAGCCGCCGAG- CTGGACAGAACCGAGGAA- TATGCCCTGGGCGTGGTGGGAGTGCTGGAAAGCTACATCGGCTCCA TCAACAACATCACAAAGCAGAGCGCCTGCGTGGCCATGAGCAAG- CTGCTGACAGAGCTGAA- CAGCGACGACATCAAGAAGCTGAGGGACAACGAGGAACTGAACAG CCCCAAGATCCGGGTGTACAACACCGTGATCAGCTACATTGAGAG- CAACCGCAAGAACAA- CAAGCAGACCATCCATCTGCTGAAGCGGCTGCCCGCCGACGTGETG AAAAAGACCATCAAGAACACCCTGGACATCCACAAGTCCATCAC- CATCAACAA- TCCCAAAGAAAGCACCGTGTCTGACACCAACGATCACGCCAAGAA CAACGACACCACCTGATGAGCGGCCGCGATCTGCTGTGCCTTC- TAGTTGCCAGCCATCTG- TTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACT CCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTG- TCTGAGTAGGTGTCATTC- TATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTG GGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG- CCGATCAGCGATCG- CTGAGGTGGGTGAGTGGGCGTGGCCTGGGGTGGTCATGAAAATAT ATAAGTTGGGGGTCTTAGGGTCTCTTTATTTGTGTTGCAGAGACCG- CCGGAGCCATGAGCGG- GAGCAGCAGCAGCAGCAGTAGCAGCAGCGCCTTGGATGGCAGCAT CGTGAGCCCTTATTTGACGACGCGGATGCCCCACTGGGCCGGGG- TGCGTCAGAATG- TGATGGGCTCCAGCATCGACGGCCGACCCGTCCTGCCCGCAAATTC CGCCACGCTGACCTATGCGACCGTCGCGGGGACGCCEGTTGGACG- CCACCGCCEGCCGECGOCG- CCACCGCAGCEGCCTEGGCCEGTGEGCAGCECTGGCCACGGACTTTGC ATTCCTGGGACCACTGGCGACAGGGGCTACTTCTCGGGCCGCTG- CTGCCGCCGTTCG- CGATGACAAGCTGACCGCCCTGCTGGCGCAGTTGGATGCGCTTACT CGGGAACTGGGTGACCTTTCTCAGCAGGTCATGGCCCTGCOGCCAG- CAGGTCTCCTCCCTG- CAAGCTGGCGGGAATGCTTCTCCCACAAATGCCGTTTAAGATAAAT AAAACCAGACTCTGTTTGGATTAAAGAAAAGTAGCAAGTGCATTG- CTCTCTTTATTTCATAA- TTTTCCGCGCGCGATAGGCCCTAGACCAGCGTTCTCGGTCGTTGAG GGTGCGGTGTATCTTCTCCAGGACGTGGTAGAGGTGGCTCTGGA- CGTTGAGATACATGGG- CATGAGCCCGTCCCEGGGGGTGGAGGTAGCACCACTGCAGAGCTTC ATGCTCCGGGGTGGTGTTGTAGATGATCCAGTCGTAGCAGGAGCG- CTGGGCATGGTGCC- TAAAAATGTCCTTCAGCAGCAGGCCGATGGCCAGGGGGAGGCCCT TGGTGTAAGTGTTTACAAAACGGTTAAGTTGGGAAGGGTGCATT- CGGGGAGAGATGATGTG- CATCTTGGACTGTATTTTTAGATTGGCGATGTTTCCGCCCAGATCCC TTCTGGGATTCATGTTGTGCAGGACCACCAGTACAGTGTATCCGG- TGCACTTGGGGAATTTG- TCATGCAGCTTAGAGGGAAAAGCGTGGAAGAACTTGGAGACGCCT TTGTGGCCTCCCAGATTTTCCATGCATTCGTCCATGATGATGGCAA- TGGGCCCGCGGGAGG- CAGCTTGGGCAAAGATATTTCTGGGGTCGCTGACGTCGTAGTTGTG TTCCAGGGTGAGGTCGTCATAGGCCATTTTTACAAAGCGCGGGCG- GAGGGTGCCCGAC- TGGGGGATGATGGTCCCCTCTGGCCCTGGGGCGTAGTTGCCCTCGCE AGATCTGCATTTCCCAGGCCTTAATCTCGGAGGGGGGAATCATA- TCCACCTGCGGGG- CGATGAAGAAAACGGTTTCCGGAGCCGGGGAGATTAACTGGGATG AGAGCAGGTTTCTAAGCAGCTGTGATTTTCCACAACCGGTGGG- CCCATAAATAACACCTA- TAACCGGTTGCAGCTGGTAGTTTAGAGAGCTGCAGCTGCCGTCGTC CCGGAGGAGGGGGGCCACCTEGTTGAGCATGTCCCTGACGCOG- CATGTTCTCCCCGACCAGA- TCCGCCAGAAGGCEGCTEGCEGCCCAGGGACAGCAGCTCTTGCAAG GAAGCAAAGTTTTTCAGCGGCTTGAGGCCGTCCGCCGTGGGCATG- TTTTTCAGGGTCTGGCT- CAGCAGCTCCAGGCGGTCCCAGAGCTCGGTGACGTGCTCTACGGCA TCTCTATCCAGCATATCTCCTCGTTTCGCGGGTTGGGGCGACTTT- CGCTGTAGGGCACCAAG- CGGTGGTCGTCCAGCEGGGGCCAGAGTCATGTCCTTCCATGGGCGCA GGGTCCTCGTCAGGGTGGTCTGGGTCACGGTGAAGGGGTGCG- CTCCGGGCTGAGCGCTTG- CCAAGGTGCGCTTGAGGCTGGTTCTGCTGGTGCTGAAGCGCTGCCG GTCTTCGCCCTGEGCEGTCGGCCAGGTAGCATTTGACCATGGTGTCA- TAGTCCAGCCCCTCCG- CGGCGTGTCCCTTGGCEGCEGCAGCTTGCCCTTGGAGGTGGCGCCGCA CGAGGGGCAGAGCAGGCTCTTGAGCGCGTAGAGCTTGGGGG- CGAGGAAGACCGATTCGGGG- GAGTAGGCGTCCGCGCCEGCAGACCCCGCACACGGTCTCGCACTCCA CCAGCCAGGTGAGCTCGGGGCGCGCCEGGGTCAAAAACCAGGTTT- CCCCCATGCTTTTTGATG- CGTTTCTTACCTCGGGTCTCCATGAGGTGGTGTCCCCGCOTCGGTGAC GAAGAGGCTGTCCGTGTCTCCGTAGACCGACTTGAGGGGTCTTTT- CTCCAGGGGGG- TCCCTCGGTCTTCCTCGTAGAGGAACTCGGACCACTCTGAGACGAA GGCCCGCEGTCCAGGCCAGGACGAAGGAGGCTATGTGGGAGGGG- TAGCGGTCGTTGTCCAC- TAGGGGGTCCACCTTCTCCAAGGTGTGAAGACACATGTCGCCTTCC TCGGCGTCCAGGAAGGTGATTGGCTTGTAGGTGTAGGCCACGTGA- CCGGGGGTTCCTGA- CGGGGGGGTATAAAAGGGGGTGGGGGCGCGCTCGTCEGTCACTCTC TTCCGCATCGCTGTCTGCEGAGGGCCAGCTGCTGGGGTGAGTATT- CCCTCTCGAAGGCGGG- CATGACCTCCGCGCTGAGGTTGTCAGTTTCCAAAAACGAGGAGGAT TTGATGTTCACCTGTCCCGAGGTGATACCTTTGAGGGTACCCGCG- TCCATCTGGTCAGAAAA- CACGATCTTTTTATTGTCCAGCTTGGTGGCGAACGACCCGTAGAGG GCGTTGGAGAGCAGCTTGGCGATGGAGCGCAGGGTCTGGTTCTTG- TCCCTGTCGGCGCG- CTCCTTGGCCGCEGATGTTGAGCTGCACGTACTCGCGCGCGACGCAG CGCCACTCGGGGAAGACGGTGGTGCGCTEGTCEGGGCACCAGGCOG- CACGCGCCAGCCGCGG- TTGTGCAGGGTGACCAGGTCCACGCTGGTGGCGACCTCGCCGCOGCA GGCGCTCGTTGGTCCAGCAGAGACGGCCGCCCETTGCEGCOGAGCA- GAAGGGGGGCAGGGGG- TCGAGCTGGGTCTCGTCCGGGGGGTCCEGCGTCCACGGTGAAAACCC CGGGGCGCAGGCGCGCGTCGAAGTAGTCTATCTTGCAACCTTG- CATGTCCAGCGCCTGCTG- CCAGTCGCGGGCGGCGAGCEGCGCGCTCGTAGGGGTTGAGCGGCGG GCCCCAGGGCATGGGGTGGGTGAGTGCGGAGGCGTACATGCCGCA- GATGTCATAGACG- TAGAGGGGCTCCCGCAGGACCCCGATGTAGGTGGGGTAGCAGCOGG CCGCCEGEGGATGCTGGCGCGCACGTAGTCATACAGCTCGTG- CGAGGGGGCGAGGAGG- TCGGGGCCCAGGTTGGTGCGGGCGGEGGCGCTCCEGCGCGGAAGACG ATCTGCCTGAAGATGGCATGCGAGTTGGAAGAGATGGTGGGGCG- CTGGAAGACGTTGAAG- CTGGCGTCCTGCAGGCCGACGGCEGTCGCGCACGAAGGAGGCGTAG GAGTCGCGCAGCTTGTGTACCAGCTCGGCGGTGACCTGCACG- TCGAGCGCGCAGTAG- TCGAGGGTCTCGCGGATGATGTCATATTTAGCCTGCCCCTTCTTTTT CCACAGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTAC- TCTTGGATCGGGAAAC- CGTCCGGTTCCGAACGGTAAGAGCCTAGCATGTAGAACTGGTTGAC GGCCTGGTAGGCGCAGCAGCCCTTCTCCACGGGGAGGGCGTAGG- CCTGCGCEGGCCTTGCGGA- GCGAGGTGTGGGTCAGGGCGAAGGTGTCCCTGACCATGACTTTGAG GTACTGGTGCTTGAAGTCGGAGTCGTCGCAGCCGCCCCGCOTCCCA- GAGCGAGAAGTCGGTG- CGCTTCTTGGAGCGGGGGTTGGGCAGAGCGAAGGTGACATCGTTG AAGAGGATTTTGCCCGCGCGGGGCATGAAGTTGCGGGTGATGCG- GAAGGGCCCCGGCACTT- CAGAGCGGTTGTTGATGACCTGGGCGGCGAGCACGATCTCGTCGAA GCCGTTGATGTTGTGGCCCACGATGTAGAGTTCCAGGAAGCGGGG- CCGGCCCTTTACGG- TGGGCAGCTTCTTTAGCTCTTCGTAGGTGAGCTCCTCGGGCGAGGC GAGGCCGTGCTCGGCCAGGGCCCAGTCCGCGAGGTGCGGGTTG- TCTCTGAGGAAGGACTT- CCAGAGGTCGCGGGCCAGGAGGGTCTGCAGGCGGTCTCTGAAGGT CCTGAACTGGCGGCCCACGGCCATTTTTTCGGGGGTGATGCAG- TAGAAGGTGAGGGGG- TCTTGCTGCCAGCEGGTCCCAGTCGAGCTGCAGGGCGAGGTEGEGEOG CGGCGGTGACCAGGCGCTCGTCGCCCCCGAATTTCATGACCAG- CATGAAGGGCACGAGCTG- CTTTCCGAAGGCCCCCATCCAAGTGTAGGTCTCTACATCGTAGGTG ACAAAGAGGCGCTCCGTGCGAGGATGCGAGCCGATCGGGA- AGAACTGGATCTCCCGCCACCA- GTTGGAGGAGTGGCTGTTGATGTGGTGGAAGTAGAAGTCCCGTCGC CGGGCCGAACACTCGTGCTGGCTTTTGTAAAAGCGAGCGCAGTAC- TGGCAGCGCTGCACGGG- CTGTACCTCATGCACGAGATGCACCTTTCGCCCGCEGCACGAGGAAG CCGAGGGGAAATCTGAGCCCCCCEGCETGGETCEGCEGGCATGGCOTGG- TTCTCTTCTACTTTGGA- TGCGTGTCCGTCTCCGTCTGGCTCCTCGAGGGGTGTTACGGTGGAG CGGACCACCACGCCGCGCGAGCCEGCAGGTCCAGATATCGGCGCG- CGGCGGTCGGAG- TTTGATGACGACATCGCGCAGCTGGGAGCTGTCCATGGTCTGGAGC TCCCECGCEGGCEGGCEGGCAGGTCAGCCGGGAGTTCTTGCAGGTTCAC- CTCGCAGAGTCGGGCCA- GGGCGCGGGGCAGGTCTAGGTGGTACCTGATCTCTAGGGGCGTGTT GGTGGCGGCGTCGATGGCTTGCAGGAGCCCGCAGCCCEGGGGGG- CGACGACGGTGCCCCG- CGGGGTGGTGGTGGTGGTGGCGGTGCAGCTCAGAAGCGGTGCCGC GGGCGGGCCCCEGGAGGTAGGGGGGGCTCEGGTCCCGCGGGCA- GGGGCGGCAGCGGCACG- TCGGCGTGGAGCGCGGGCAGGAGTTGGTGCTGTGCCCGGAGGTTG CTGGCGAAGGCGACGACGCGGCGGTTGATCTCCTGGATCTGGCG- CCTCTGCGTGAAGACGA- CGGGCCCGGTGAGCTTGAACCTGAAAGAGAGTTCGACAGAATCAA TCTCGGTGTCATTGACCGCGGCCTGGCGCAGGATCTCCTGCACG- TCTCCCGAGTTGTCTTGG- TAGGCGATCTCGGCCATGAACTGCTCGATCTCTTCCTCCTGGAGGT CTCCGCEGTCCEGGCEGEGTTCCACGGTGGCCGCCAGGTCGTTGGAGA- TGCGCCCCATGAGCTG- CGAGAAGGCGTTGAGTCCGCCCTCGTTCCAGACTCGGCTGTAGACC ACGCCCCCCTGGTCATCGCGGGCGCEGCATGACCACCTGCGCGAGG- TTGAGCTCCACGTGCCG- CGCGAAGACGGCGTAGTTGCGCAGACGCTGGAAGAGGTAGTTGAG GGTGGTGGCGGTGTGCTCGGCCACGAAGAAGTTCATGACCCAG- CGGCGCAACGTGGATTCG- TTGATGTCCCCCAAGGCCTCCAGCCEGTTCCATGGCCTCGTAGAAGT CCACGGCGAAGTTGAAAAACTGGGAGTTGCGCGCCGACACGGT- CAACTCCTCCTCCAGAAGA- CGGATGAGCTCGGCGACGGTGTCGCGCACCTCEGCEGCTCGAAGGCTA TGGGGATCTCTTCCTCCGCTAGCATCACCACCTCCTCCTCTT- CCTCCTCTTCTGGCACTT- CCATGATGGCTTCCTCCTCTTCGGGGGGTGGCGGCGGCGGCGGTEÇG GGGAGGGGGCGCTCTGCGCCEGGCGGCGGCGCACCGGGAGGEOGG- TCCACGAAGCGCGCGAT- CATCTCCCCGEGGCEGGCGGCGCATGGTCTEGGTGACGGEGCGGCEG TTCTCCCEGGGGGCEGCAGTTGGAAGACGCCGCCGGACATCTGGTG- CTGGGGCGGGTGGCCG- TGAGGCAGCGAGACGGCGCTGACGATGCATCTCAACAATTGCTGC GTAGGTACGCCGCCGAGGGACCTGAGGGAGTCCATATCCACCGGA- TCCGAAAACCTTTCGAG- GAAGGCGTCTAACCAGTCGCAGTCGCAAGGTAGGCTGAGCACCGT GGCGGGCGGCGGGGGGTGGGGGGAGTGTCTGGCGGAGGTGCTG- CTGATGATGTAATTGAAG- TAGGCGGACTTGACACGGCGGATGGTCGACAGGAGCACCATGTCC TTGGGTCCGGCCTGCTGGATGCGGAGGCGGTCGGCTATGCCCCA- GGCTTCGTTCTGG-
CATCGGCGCAGGTCCTTGTAGTAGTCTTGCATGAGCCTTTCCACCOG GCACCTCTTCTCCTTCCTCTTCTGCTTCTTCCATGTCTGCOTTCOGG- CCCETGGGGCGGEGCOCG- CGCCCCCeTGCCCCccATGOEGCOGTGACCCCGAACCCCCTGAGCGGT TGGAGCAGGGCCAGGTCGGCGACGACGCGCTCGGCCAGGATGG- CCTGCTGCACCTGCG-
TGAGGGTGGTTTGGAAGTCATCCAAGTCCACGAAGCGGTGGTAGG CGCCCEGTGTTGATGGTGTAGGTGCAGTTGGCCATGACGGACCAG- TTGACGGTCTGGTGG- CCEGGTTGEGACATCTCEGGTGTACCTGAGTCGCEGAGTAGGCGCGGG AGTCGAAGACGTAGTCGTTGCAAGTCCGCACCAGGTACTGGTAG- CCCACCAGGAAGTGCGG- CGGCGGCETGGCEGEATAGAGGGGCCAGCEGCAGGGTGGEGGGGGCTCCÇ GGGGGCCAGGTCTTCCAGCATGAGGCGGTGGTAGGCGTAGATG- TACCTGGACATCCAGGTGA- TACCCGCGGCGGTGGTGGAGGCGCGEGGGAAGTCGCGCACCCGGT TCCAGATGTTGCGCAGGGGCAGAAAGTGCTCCATGGTAGGCGTG- CTCTGTCCAGTCAGACG- CGCGCAGTCGTTGATACTCTAGACCAGGGAAAACGAAAGCCGGTC AGCGGGCACTCTTCCGTGGTCTGGTGAATAGATCGCAAGGGTAT- CATGGCGGAGGGCCTCGG- TTCGAGCCCCGGGTCCEGGGCCEGGACGGTCCGCCATGATCCACGEOGG TTACCGCCCGCGTGTCGAACCCAGGTGTGCGACGTCAGACAACGG- TGGAGTGTTCCTTTTGG- CGTTTTTCTGGCCEGGGCEGCCEGGCEGCCEGCGTAAGAGACTAAGCCGCOG AAAGCGAAAGCAGTAAGTGGCTCGCTCCCCGTAGCCGGAGGGA- TCCTTGCTAAGGGTTGCG- TTGCGGCGAACCCCGGTTCGAATCCCGTACTCGGGCCEGGCCGGACE CGCGGCTAAGGTGTTGGATTGGCCTCCCCCTCGTATAAAGACCCCG- CTTGCGGATTGAC- TCCGGACACGGGGACGAGCCCCTTTTATTTTTGCTTTCCCCAGATGC ATCCGGTGCTGCGGCAGATGCGCCCCCEGCCCCAGCAGCAGCAA- CAACACCAGCAAGAGCGG- CAGCAACAGCAGCGGGAGTCATGCAGGGCCCCCTCACCCACCCTC GGCGGGCCEGGCCACCETEGGEGTCCGEGGCCGTGTCTGGEGCCOTG- CGGCEGGEGGCGGGGGG- CCGGCTGACGACCCCEGAGGAGCCCCEGCGGCEGCAGGGCCAGACAC TACCTGGACCTGGAGGAGGGCGAGGGCCTGGCEGCEGGCTGGGGG- CGCCGTCTCCCGAGECG- CCACCCGCEGGGTGCAGCETGAAGCGCGACTCGCGEGAGGCGTACGT GCCTCGGCAGAACCTGTTCAGGGACCGCGCGGGCGAGGAG- CCCGAGGAGATGCGGGACAGGA- GGTTCAGCGCAGGGCGGGAGCTGCGGCAGGGGCTGAACCGCGAGC GGCTGCTGCGCGAGGAGGACTTTGAGCCCGACGCGCGGACGGGGA- TCAGCCCCGCGEGEOGCG- CACGTGGCGGCCGCCEGACCETGGTGACGGCGTACGAGCAGACGGTG AACCAGGAGATCAACTTCCAAAAGAGTTTCAACAACCACGTGCG- CACGCTGGTGGCGCG- CGAGGAGGTGACCATCGGGCTGATGCACCTGTGGGACTTTGTAAGC GCGCTGGTGCAGAACCCCAACAGCAAGCCTCTGACGGCGCAGCTG- TTCCTGATAGTGCAGCA- CAGCAGGGACAACGAGGCGTTTAGGGACGCGCTGCTGAACATCAC CGAGCCCGAGGGTCGGTGGCTGCTGGACCTGATTAACATCCTGCA- GAGCATAGTGGTGCAG- GAGCGCAGCCTGAGCCTGGCCGACAAGGTGGCGGCCATCAACTAC TCGATGCTGAGCCTGGGCAAGTTTTACGCGCGCAAGATCTACCA- GACGCCGTACGTGCCCA- TAGACAAGGAGGTGAAGATCGACGGTTTTTACATGCGCATGGCGCT GAAGGTGCTCACCCTGAGCGACGACCTGGGCGTGTACCG- CAACGAGCGCATCCACAAGGCCG- TGAGCGTGAGCCGGCGGCGCGAGCTGAGCGACCGCGAGCTGATGC ACAGCCTGCAGCGGGCGCTGGCGGGCGCCEGGCAGCGGCGACAGG- GAGGCGGAGTCCTACTT- CGATGCGGGGGCGGACCTGCEGCTGGGEGCCCAGCCGGEGGGCCCT GGAGGCCGCGGGGGTCCEGEGAGGACTATGACGAGGACGGCGAG- GAGGATGAGGAGTACGAGC- TAGAGGAGGGCGAGTACCTGGACTAAACCGCGGGTGGTGTTTCCG GTAGATGCAAGACCCGAACGTGGTGGACCCGGCGCTGCGGGEGG- CTCTGCAGAGCCAGCCG- TCCGGCCTTAACTCCTCAGACGACTGGCGACAGGTCATGGACCGCA TCATGTCGCTGACGGCGCGTAACCCGGACGCGTTCCGGCAGCAG- CCGCAGGCCAACAGG- CTCTCCEGCCATCCTGGAGGCEGGTGGTGCCTGEGEGCTEGAACCOCCA CGCACGAGAAGGTGCTGGCCATAGTGAACGCGCTGGCCGAGAACA- GGGCCATCCGCCCGGA- CGAGGCCGGGCTGGTGTACGACGCGCTGCTGCAGCGCGTGGECCG CTACAACAGCGGCAACGTGCAGACCAACCTGGACCGGCTGG- TGGGGGACGTGCGCGAGGCGG- TGGCGCAGCGCGAGCGCGCEGGATCGGCAGGGCAACCTGGGCTCCA TGGTGGCGCTGAATGCCTTCCTGAGCACGCAGCCGGCCAACGTG- CCGCGGGGGCAGGAAGAC- TACACCAACTTTGTGAGCGCGCTGCGGCTGATGGTGACCGAGACCC CCCAGAGCGAGGTGTACCAGTCGGGCCCGGACTACTTCTTCCAGA- CCAGCAGACAGGGCCTG- CAGACGGTGAACCTGAGCCAGGCTTTCAAGAACCTGCGGGGGCTG TGGGGCGTGAAGGCGCCCACCGGCGACCGGGCGACGGTGTCCAG- CCTGCTGACGCCCAAC- TCGCGCCTGCTGCTGCTGCTGATCGCGCCEGTTCACGGACAGCGGCA GCGTGTCCCGGGACACCTACCTGGGGCACCTGCTGACCCTGTAC- CGCGAGGCCATCGGGCA- GGCGCAGGTGGACGAGCACACCTTCCAGGAGATCACCAGCGTGAG CCGCGCGCTGGGGCAGGAGGACACGAGCAGCCTGGAGGCGAC- TCTGAACTACCTGCTGAC- CAACCGGCGGCAGAAGATTCCCTCGCTGCACAGCCTGACCTCCGAG GAGGAGCGCATCTTGCGCTACGTGCAGCAGAGCGTGAGCCTGAAC- CTGATGCGCGACGGGG- TGACGCCCAGCGTGGCGCTGGACATGACCGCGCGCAACATGGAAC CGGGCATGTACGCCGCGCACCEGGCCTTACATCAACCGCCTGATG- GACTACCTGCATCGCG- CGGCGGCCEGTGAACCCCGAGTACTTTACCAACGCCATCCTGAACCC GCACTGGCTCCCGCCEGCCCGGGTTCTACAGCGGGGGCTTCGAGG- TCCCGGAGAC- CAACGATGGCTTCCTGTGGGACGACATGGACGACAGCGTGTTCTCC CCECGCEGGCCGCAGGCEGCETGGCGGAAGCGTCCCTGCOTGCOG- TCCCAAGAAGGAGGAGGAGGAGGA- GGCGAGTCGCCGCCEGCGGCAGCAGCEGGCGTGGCTTCTCTGTCCGAG CTGGGGGCGGCAGCCEGCCEGEGEGCECCEGGGTCCCTGGGCGGCAG- CCCCTTTCCGAGCCTGG- TGGGGTCTCTGCACAGCGAGCGCACCACCCGCCETEGGETGETGGÇGG CGAGGACGAGTACCTGAATAACTCCCTGCTGCAGCCGGTGCGGGA- GAAAAACCTGCCTCCCG- CCTTCCCCAACAACGGGATAGAGAGCCTGGTGGACAAGATGAGCA GATGGAAGACCTATGCGCAGGAGCACAGGGACGCGCCTGCG- CTCCEGGCCGCCCACGCEGGCG- CCAGCGCCACGACCGGCAGCGGGGGCTGGTGTGGGATGACGAGGA CTCCGCGGACGATAGCAGCGTGCTGGACCTGGGAGGGAGCGG- CAACCCGTTCGCGCACCTG- CGCCCCEGCETGGGGAGGATGTTTTAAAAAAAAAAAAAAAAAGCA AGAAGCATGATGCAAAAATTAAATAAAACTCACCAAGGCCATGG- CGACCGAGCGTTGGTTT- CTTGTGTTCCCTTCAGTATGCGGCGCGCGGCGATGTACCAGGAGGG ACCTCCTCCCTCTTACGAGAGCGTGGTGGGCGCGGCGGCGGOGG- CGCCCTCTTCTCCCTTTG- CGTCGCAGCTGCTGGAGCCGCCGTACGTGCCTCCEGEGCTACCOTGEG GCCTACGGGGGGGAGAAACAGCATCCGTTACTCGGAGCTGGCG- CCCCTGTTCGACACCAC- CCGGGTGTACCTGGTGGACAACAAGTCGGCGGACGTGGCCTCCCTG AACTACCAGAACGACCACAGCAATTTTTTGACCACGGTCATCCA- GAACAATGACTACAG- CCCGAGEGAGGCCAGCACCCAGACCATCAATCTGGATGACCGGTC GCACTGGGGCGGCGACCTGAAAACCATCCTGCACACCAACATG- CCCAACGTGAACGAGTT- CATGTTCACCAATAAGTTCAAGGCGCGGGTGATGGTGTCGCGCTCG CACACCAAGGAAGACCGGGTGGAGCTGAAGTACGAGTGGGTGGA- GTTCGAGCTGCCAGAGGG- CAACTACTCCGAGACCATGACCATTGACCTGATGAACAACGCGATC GTGGAGCACTATCTGAAAGTGGGCAGGCAGAACGGGGTCCTGGA- GAGCGACATCGGGGT- CAAGTTCGACACCAGGAACTTCCGCCTGGGGCTGGACCCCGTGACCE GGGCTGGTTATGCCCGGGGTGTACACCAACGAGGCCTT- CCATCCCGACATCATCCTGCTG- CCCEGGCTGEGGGGTGGACTTCACTTACAGCCGCCTGAGCAACCTCC TGGGCATCCGCAAGCGGCAGCCCTTCCAGGAGGGCTTCAGGAT- CACCTACGAGGACCTGGA- GGGGGGCAACATCCCCGCGCTCCTCGATGTGGAGGCCTACCAGGAT AGCTTGAAGGAAAATGAGGCGGGACAGGAGGATACCGCCCCCG- CCGCCTCCGCCGOCG- CCGAGCAGGGCGAGGATGCTGCTGACACCGCGGCCEGCGGACGGGG CAGAGGCCGACCCCGCTATGGTGGTGGAGGCTCCCGAGCAGGAG- GAGGACATGAATGACAG- TGCGGTGCGCGGAGACACCTTCGTCACCCGGGGGGAGGAAAAGCA AGCGGAGGCCGAGGCCEGCGGCCEGAGGAAAAGCAACTGGCGGCAG- CAGCGGCGGCGGCGGCG- TTGGCCGCGGCGGAGGCTGAGTCTGAGGGGACCAAGCCCGCCAAG GAGCCCGTGATTAAGCCCCTGACCGAAGATAGCAAGAAGCGCAGT- TACAACCTGCTCAAGGA- CAGCACCAACACCGCGTACCGCAGCTGGTACCTGGCCTACAACTAC GGCGACCCGTCGACGGGGGTGCGCTCCETGGACCCOTGCTGTGCACG- CCGGACGTGACCTGCGG- CTCGGAGCAGGTGTACTGGTCGCTGCCCGACATGATGCAAGACCCC GTGACCTTCCGCTCCACGCGGCAGGTCAGCAACTTCCCGGTGG- TGGGCGCCGAGCTGCTG- CCCEGTGCACTCCAAGAGCTTCTACAACGACCAGGCCGTCTACTCCC AGCTCATCCGCCAGTTCACCTCTCTGACCCACGTGTTCAATCG- CTTTCCTGAGAACCAGATT- CTGGCGCGCCCEGECEGCCCCCACCATCACCACCGTCAGTGAAAACG TTCCTGCTCTCACAGATCACGGGACGCTACCGCTGCGCAACAG- CATCGGAGGAGTCCAG- CGAGTGACCGTTACTGACGCCAGACGCCGCACCTGCCCCTACGTTT ACAAGGCCTTGGGCATAGTCTCGCCGCEGEGTCCTTTCCAGCCOGCAC- TTTTTGAGCAACAC-
CACCATCATGTCCATCCTGATCTCACCCAGCAATAACTCCGGCTGG GGACTGCTGCGCGCGCCCAGCAAGATGTTCGGAGGGGCGAGGA- AGCGTTCCGAGCAGCAC- CCEGTGCEGEGTGCEGCEGGGCACTTCEGCEGCCCCoTGGGGAGCGCACA AACGCGGCCGCGCEGGGGCEGCACCACCGTGGACGACGCCATCGAC- TCGGTGGTGGAGCAGGCG-
CGCAACTACAGGCCCGCGGTCTCTACCGTGGACGCGGCCATCCAGA CCGTGGTGCGGGGCEAECGCGGCGGTACGCCAAGCTGAAGAGCCG- CCGGAAGCGCGTGGCCCG- CCECGCCACCGCCGCEGACCCGGGGCCGCCEGCCAAACGCOGCCGOCGC GGCCCTGCTTCGCEGGGCCAAGCEGCACGGGCCGCCGEOGOCG- CCATGAGGGCCGCGCGCOCG- CTTGGCCGCCEGGCATCACCEGCCEGCCACCATGGCCCCCEGTACCOCGA AGACGCGCGGCCEGCEGCEGCEGCCEGCCEGCCATCAGTGACATGG- CCAGCAGGCGCCEGGGG- CAACGTGTACTGGGTGCGCGACTCGGTGACCGGCACGCGCGTGCCC GTGCGCTTCCGCCCCCEGEGGACTTGAGATGATGTGAAAAAACAA- CACTGAGTCTCCTGCTG- TTGTGTGTATCCCAGCGGCGGEGGCEGCEGCEGCAGEGTCATGTCCAAG CGCAAAATCAAAGAAGAGATGCTCCAGGTCGTCGCGCCGGAGATC- TATGGG- CCCCECGAAGAAGGAAGAGCAGGATTCGAAGCCCCGCAAGATAAAG CGGGTCAAAAAGAAAAAGAAAGATGATGACGATGCCGATGGGGA- GGTGGAGTTCCTGCGCG- CCACGGCGCCCAGGCEGCCEGGTGCAGTGGAAGGGCCGGCGCGTAA AGCGCGTCCTGCEGCCCCGGCACCEGCEGGTGGTCTTCACGCCCGG- CGAGCGCTCCACCCGGAC- TTTCAAGCGCGTCTATGACGAGGTGTACGGCGACGAAGACCTGCTG GAGCAGGCCAACGAGCGCTTCGGAGAGTTTGCTTACGGGAAGCGT- CAGCGGGCGCTGGGGA- AGGAGGACCTGCTGGCGCTGCCGCTGGACCAGGGCAACCOCCACCOC CCAGTCTGAAGCCCGTGACCCTGCAGCAGGTGCTGCCGAGCAGECG- CACCCTCCGAGGCGAAG- CGGGGTCTGAAGCGCGAGGGCGGCGACCTGGCGCCCACCEGTGCAG CTCATGGTGCCCAAGCGGCAGAGGCTGGAGGATGTGCTGGAGAAA- ATGAAAGTAGACCCCGG- TCTGCAGCCGGACATCAGGGTCCGCCCCATCAAGCAGGTGGCOGECG GGCCTCGGCGTGCAGACCGTGGACGTGGTCATCCCCACCGGCAAC- TCCCCCGCEGCCGCCAC- CACTACCGCTGCCTCCACGGACATGGAGACACAGACCGATCCCGCOC GCAGCCGCAGCCGCAGCCGCEGCCGEGACCETCCTCGGCGGAGGTG- CAGACGGACCCCTGG- CTGCCGCCEGGCGATGTCAGCTCCCEGEGCGEGTEGCGGGCGCAGGA AGTACGGCGCCGCCAACGCGCTCCETGCCCGAGTACGCCTTG- CATCCTTCCATCGCGCCCAC- CCCCGGCETACCEGAGGCTATACCTACCGCCCGCGAAGAGCCAAGGG TTCCACCCGCCEGTCCCEGCEGACGEGCCGCCGCECACCACCCGCOCG- CCGCCGCCGCAGACG- CCAGCCCGCACTGGCETCCAGTCETCEGTGAGGAAAGTGGCGCGCGAC GGACACACCCTGGTGCTGCCCAGGGCGCGCTACCACCCCAG- CATCGTTTAAAAGCCTGTTG- TGGTTCTTGCAGATATGGCCCTCACTTGCCGCCTCCEGTTTCCCGGTG CCGGGATACCGAGGAGGAAGATCGCGCCGCAGGAGGGGTCTGG- CCGGCCEGEGGCCTGAGCOG- GAGGCAGCCGCCGCGCEGCACCGGCGGCGACGCGCCACCAGCCGAC GCATGCGCGGCGGGGTGCTGCCCCTGTTAATCCCCCTGATCOGCOCG- CGGCGATCGGCGCCGTG- CCEGGGATCEGCCTCEGTGGCCTTGCAAGCEGTCCCAGAGGCATTGAC AGACTTGCAAACTTGCAAATATGGAAAAAAAAACCCCAA- TAAAAAAGTCTAGACTCTCACG- CTCGCTTGGTCCTGTGACTATTTTGTAGAATGGAAGACATCAACTTT GCGTCGCTGGCCCEGEGTCACGGCOTEGCEGCCCGTTCCTGGGACAC- TGGAACGATATCGGCAC- CAGCAACATGAGCGGTGGCGCCTTCAGTTGGGGCTCTCTGTGGAGC GGCATTAAAAGTATCGGGTCTGCCGTTAAAAATTACGG- CTCCCGGGCCTGGAACAGCAG- CACGGGCCAGATGTTGAGAGACAAGTTGAAAGAGCAGAACTTCCA GCAGAAGGTGGTGGAGGGCCTGGCCTCCGGCATCAACGGGGTGG- TGGACCTGGCCAACCAGG- CCGTGCAGAATAAGATCAACAGCAGACTGGACCCCCGGCCGECGG TGGAGGAGGTGCCGCCGGCGCTGGAGACGGTGTCCCCCGATGGG- CGTGGCGAGAAGCGCCCG-
CGGCCCGATAGGGAAGAGACCACTCTGGTCACGCAGACCGATGAG CCGCCCCeGTATGAGGAGGCCCTGAAGCAAGGTCTGCCCACCACG- CGGCCCATCGCG-
CCCATGGCCACCEGGGGTGGTGGGCCEGCCACACCCCEGCECACGCOTGG ACTTGCCTCCGCCCGCEGATGTGCCEGCAGCAGCAGAAGGCGGCA- CAGCCGGGCCCGCCCG- CGACCGCCTCCEGTTCETCEGCEGGTCETCTGEGCECGCGEGGCCAG CGGCCCCEGEGGEGGGGGTCEGCGAGGCACGGCAACTGGCAGAG- CACGCTGAACAGCATCG- TGGGTCTGGGGGTGCGGTCCEGTGAAGCGCCGCCGATGCTACTGAAT AGCTTAGCTAACGTGTTGTATGTGTGTATGCGCCCTATGTCGCCG- CCAGAGGAGCTGCTGAG- TCGCCEGCCEGTTCGCEGEGCCCACCACCACCGCCACTCCGCCCCTCAA GATGGCGACCCCATCGATGATGCCGCAGTGGTCGTACATGCACA- TCTCGGGCCAGGACG- CCTCGGAGTACCTGAGCCCEGGGCTGGTGCAGTTCGCCCGCEGCCAC CGAGAGCTACTTCAGCCTGAGTAACAAGTTTAGGAACCCCACGG- TGGCGCCCACGCACGATG- TGACCACCGACCGGTCTCAGCGCCTGACGCTGCGGTTCATTCCCGT GGACCGCGAGGACACCGCGTACTCGTACAAGGCGCGGTTCAC- CCTGGCCEGTGGGEGACAAC- CGCGTGCTGGACATGGCCTCCACCTACTTTGACATCCGCGGGGTGC TGGACCGGGGTCCCACTTTCAAGCCCTACTCTGGCACCGCCTA- CAACTCCCTGG- CCCCCAAGGGCGCTCCCAACTCCTGEGAGTGGGAGCAAGAGGAAA CTCAGGCAGTTGAAGAAGCAGCAGAAGAGGAAGAAGAAGATG- CTGACGGTCAAGCTGAGGA- AGAGCAAGCAGCTACCAAAAAGACTCATGTATATGCTCAGGCTCCC CTTTCTGGCGAAAAAATTAGTAAAGATGGTCTGCAAATAGGAACG- GACGCTACAGCTACA- GAACAAAAACCTATTTATGCAGACCCTACATTCCAGCCCGAACCCC AAATCGGGGAGTCCCAGTGGAATGAGGCAGATGCTACAGTCG- CCGGCGGTAGAGTGC- TAAAGAAATCTACTCCCATGAAACCATGCTATGGTTCCTATGCAAG ACCCACAAATGCTAATGGAGGTCAGGGTGTACTAACGGCAAATG- CCCAGGGACAGCTAGAA- TCTCAGGTTGAAATGCAATTCTTTTCAACTTCTGAAAACGCCCGTA ACGAGGCTAACAACATTCAGCCCAAATTGGTGCTGTATAGTGAG- GATGTGCACATGGAGAC- CCCEGGATACGCACCTTTCTTACAAGCCCGCAAAAAGCGATGACAAT TCAAAAATCATGCTGGGTCAGCAGTCCATGCCCAACAGACCTAAT- TACATCGGCTTCAGAGA- CAACTTTATCGGCCTCATGTATTACAATAGCACTGGCAACATGGGA GTGCTTGCAGGTCAGGCCTCTCAGTTGAATGCAGTGGTGGACTTG- CAAGACAGAAACACA- GAACTGTCCTACCAGCTCTTGCTTGATTCCATGGGTGACAGAACCA GATACTTTTCCATGTGGAATCAGGCAGTGGACAGTTATGACCCA- GATGTTAGAATTA- TTGAAAATCATGGAACTGAAGACGAGCTCCCCAACTATTGTTTCCC TCTGGGTGGCATAGGGGTAACTGACACTTACCAGGCTGTTAAAAC- CAACAATGGCAA- TAACGGGGGCCAGGTGACTTGGACAAAAGATGAAACTTTTGCAGA TCGCAATGAAATAGGGGTGGGAAACAATTTCGCTATGGAGAT- CAACCTCAGTGCCAACCTG- TGGAGAAACTTCCTGTACTCCAACGTGGCGCTGTACCTACCAGACA AGCTTAAGTACAACCCCTCCAATGTGGACATCTCTGACAAC- CCCAACACCTACGATTACA- TGAACAAGCGAGTGGTGGCCCCGGGGCTGGTGGACTGCTACATCA ACCTGGGCGCGCGCTGGAGTCGCTGGACTACATGGACAACGTCAAC- CCCTTCAACCACCACCG- CAATGCGGGCCTGCGCTACCGCTCCATGCTCCETGGGCAACGGGECGC TACGTGCCCTTCCACATCCAGGTGCCCCAGAAGTTCTTTGCCAT- CAAGAAC- CTCCTCCTCCTGCCGGGETCCTACACCTACGAGTGGAACTTCAGGA AGGATGTCAACATGGTCCTCCAGAGCTCTCTGGGTAACGATCTCA- GGGTGGACGGGGCCAG- CATCAAGTTCGAGAGCATCTGCCTCTACGCCACCTTCTTCCCCATGG CCCACAACACGGCCTCCACGCTCEGAGGCCATGCTCAGGAACGACA- CCAACGACCAGTCCTT- CAATGACTACCTCTCCGCCGCCAACATGCTCTACCCCATACCCGCC AACGCCACCAACGTCCCCATCTCCATCCCCTCGCGCAACTGGG- CGGCCTTCCGCGGCTGGG- CCTTCACCCGCCETCAAGACCAAGGAGACCCCCTCCCTGGGETEGGG ATTCGACCCCTACTACACCTACTCGGGCTCCATTCCCTACCTGGA- CGGCACCTTCTACCT- CAACCACACTTTCAAGAAGGTCTCGGTCACCTTCGACTCCTCGGTC AGCTGGCCGGGCAACGACCGTCTGCTCACCCCCAACGAGTTCGA- GATCAAGCGCTCGGTCGA- CGGGGAGGGCTACAACGTGGCCCAGTGCAACATGACCAAGGACTG GTTCCTGGTCCAGATGCTGGCCAACTACAACATCGGCTACCAGGG- CTTCTACATCCCA- GAGAGCTACAAGGACAGGATGTACTCCTTCTTCAGGAACTTCCAGC CCATGAGCCGGCAGGTGGTGGACCAGACCAAGTACAAGGACTAC- CAGGAGGTGGGCAT- CATCCACCAGCACAACAACTCGGGCTTCGTGGGCTACCTCGCCCCC ACCATGCGCGAGGGACAGGCCTACCCCGCCAACTTCCCCTATCCG- CTCATAGGCAAGACCG- CGGTCGACAGCATCACCCAGAAAAAGTTCCTCTGCGACCGCACCCT CTGGCGCATCCCCTTCTCCAGCAACTTCATGTCCATGGGTGCG- CTCTCGGACCTGGGCCA- GAACTTGCTCTACGCCAACTCCGCCCACGCCCTCGACATGACCTTC GAGGTCGACCCCATGGACGAGCCCACCCTTCTCTATGTTCTGTT- CGAAGTCTTTGACGTGG- TCCGGGTCCACCAGCCEGCACCEGEGGCEGTCATCGAGACCGTGTACCT GCGTACGCCCTTCTCGGCCEGGCAACGCCACCACCTAAAGAAG- CAAGCCGCAGTCATCGCCG- CCTGCATGCCEGTEGGGTTCCACCGAGCAAGAGCTCAGGGCCATCGT CAGAGACCTGGGATGCGGGCCCTATTTTTTGGGCACCTTCGA- CAAGCGCTTCCCTGGCTTTG- TCTCCCCACACAAGCTGGCCTGCGCCATEGTCAACACGGCCGGCCG CGAGACCGGGGGCGTGCACTGGCTGGCCTTCGCCTGGAACCOCGCOG- CTCCAAAACATGCTT- CCTCTTTGACCCCTTCGGCTTTTCGGACCAGCGGCTCAAGCAAATCOT ACGAGTTCGAGTACGAGGGCTTGCTGCGTCGCAGCGCCATCG- CCTCCTCGCCCGACCOGCOTG- CGTCACCCTCGAAAAGTCCACCCAGACCGTGCAGGGGCCCGACTCEG GCCGCCTGCEGGTCTCTTCTGCTGCATGTTTCTGCACGCCTTTGTG- CACTGGCCTCAGAG- TCCCATGGACCGCAACCCCACCATGAACTTGCTGACGGGGGTGCCC AACTCCATGCTCCAGAGCCCCCAGGTCGAGCCCACCCTGEGCOCG- CAACCAGGAGCAGCTCTA- CAGCTTCCTGGAGCGCCACTCGCCTTACTTCCEGCCEGCCACAGOGCA CAGATCAGGAGGGCCACCTCCTTCTGCCACTTGCAAGAGATG- CAAGAAGGGTAATAACGATG- TACACACTTTTTTTCTCAATAAATGGCATCTTTTTATTTATACAAGC TCTCTGGGGTATTCATTTCCCACCACCACCCGCCGTTGTCG- CCATCTGGCTCTATTTAGAAA- TCGAAAGGGTTCTGCCGGGAGTCGCCGTGCEGCCACGGGCAGGGAC ACGTTGCGATACTGGTAGCGGGTGCCCCACTTGAACTCGGGCAC- CACCAGGCGAGGCAG- CTCGGGGAAGTTTTCGCTCCACAGGCTGCGGGTCAGCACCAGCGCG TTCATCAGGTCGGGCGCCGAGATCTTGAAGTCGCAGTTGGGGCCG- CCGCCCTGEGCOGCOG- CGAGTTGCGGTACACCGGGTTGCAGCACTGGAACACCAACAGCGC CGGGTGCTTCACGCTGGCCAGCACGCTGCGGTCGGAGATCAG- CTCGGCEGTCCAGGTCCTCOCG- CGTTGCTCAGCGCGAACGGGGTCATCTTGGGCACTTGCCEGCCCCAG GAAGGGCGCGTGCCCEGGTTTCGAGTTGCAGTCGCAGCGCAGCOGG- GATCAGCAGGTGCCCG- TGCCCGGACTCGGCEGTTGGGGTACAGEGCGCGCATGAAGGCCTGC ATCTGGCGGAAGGCCATCTGGGCCTTGGCGCCCTCCGAGAAGAA- CATGCCGCAGGACTTG- CCCGAGAACTGGTTTGCGGGGCAGCTGGCGTCGTGCAGGCAGCAG CGCGCGTCGGTGTTGGCGATCTGCACCACGTTGCGCCCCCACCOGG- TTCTTCACGATCTTGG- CCTTGGACGATTGCTCCTTCAGCGCGCGETGCCCGTTCTCGCEOTGGTE ACATCCATCTCGATCACATGTTCCTTGTTCACCATGCTGCTGCCG- TGCAGACACTTCAG- CTCGCCCTCCGTCTCGGTGCAGEGGTGCTGCCACAGCGCGCAGCOCC GTGGGCTCGAAAGACTTGTAGGTCACCTCCGCGAAGGACTGCAGG- TACCCCTGCAAAAAG- CGGCCCATCATGGTCACGAAGGTCTTGTTGCTGCTGAAGGTCAGCT GCAGCCCGCGGTGCTCCTCEGTTCAGCCAGGTCTTGCACACGGCOCG- CCAGCGCCTCCACCOTGG- TCGGGCAGCATCTTGAAGTTCACCTTCAGCTCATTCTCCACGTGGTA CTTGTCCATCAGCGTGCGCGCCGCCTCCATGCCCOTTCTCCCAGG- CCGACACCAGCGGCAGG- CTCACGGGGTTCTTCACCATCACCGTGGCCEGCCEGCCTCCGCCGOGE TTTCGCTTTCCGCCCCOGCOTGTTCTCTTCCTCTTCCTCCTCTTCCTCG- CCGCCGCCCACTCG- CAGCCCCCGCACCACGGGGTEGTCTTCCETGCAGGCGCTGCACCTTG CGCTTGCCGTTGCGCCCCTGCTTGATGCGCACGGGCGGGTTG- CTGAAGCCCACCATCACCAG- CGCGGCCTCTTCTTGCTCGTCCTCGCTGTCCAGAATGACCTCCOGGGG AGGGGGGGTTGGTCATCCTCAGTACCGAGGCACGCTTCTTTTTCTT- CCTGGGGGCGTTCG- CCAGCTCCEGEGGETGEGGCEGETGCEGAGGTCEGAAGGCCEGAGGGC TGGGCGTGCGCGGCACCAGCGCEGTCCETGEGAGCEGTCCOTCOG- TCCTCCTCGGACTCGAGACG- GAGGCGGGCCCGCTTCTTCEGGGGGEGCEGCGGGGCGGCGGAGGEGG CGGCGGCGACGGAGACGGGGACGAGACATCGTCCAGGGTGGGTG- GACGGCGGGCCGCGCOCG- CGTCCGCEGCETCGGGGGTGGTCTCGEGCTGGTCCTCTTCCCGACTGG CCATCTCCCACTGCTCCTTCTCCTATAGGCAGAAAGAGATCATGGA- GTCTCTCATGCGAG- TCGAGAAGGAGGAGGACAGCCTAACCGCCCCCTCTGAGCCCTCCA CCACCGCCEGCCACCACCEGCCAATGCOCGCCEGCGGACGACGCG- CCCACCGAGACCACCGCCAG- TACCACCCTCCCCAGCEGACGCACCCCCEGCTCGAGAATGAAGTGCTG ATCGAGCAGGACCCGGGTTTTGTGAGCGGAGAGGAGGATGAGGTG- GATGAGAAGGAGAAGGA- GGAGGTCGCCGCCTCAGTGCCAAAAGAGGATAAAAAGCAAGACCA GGACGACGCAGATAAGGATGAGACAGCAGTCGGGCGGGGGAACG- GAAGCCATGATG- CTGATGACGGCTACCTAGACGTGGGAGACGACGTGCTGCTTAAGCA CCTGCACCGCCAGTGCGTCATCGTCTGCGACGCGCTGCAGGAGCG- CTGCGAAGTGCCCCTG- GACGTGGCGGAGGTCAGCCGCGCCTACGAGCGGCACCTCTTCGEGCE CGCACGTGCCCCCCAAGCEGCCEGGGAGAACGGCACCTGCGAG- CCCAACCCGCGTCTCAACTTC- TACCCGGTCTTCGCGGTACCCGAGGTGCTGGCCACCTACCACATCT TTTTCCAAAACTGCAAGATCCCCCTCTCCTGCCGCGCCAACCGCAC- CCGCGCCGACAAAAC- CCTGACCCTGCGGCAGGGCGCCCACATACCTGATATCGCCTCTCTG GAGGAAGTGCCCAAGATCTTCGAGGGTCTCGGTCGCGA- CGAGAAACGGGCGGCGAACG- CTCTGCACGGAGACAGCGAAAACGAGAGTCACTCGGGGGTGCTGG TGGAGCTCGAGGGCGACAACGCGCGCCTGGCCGTACTCAAGCGCA- GCATAGAGGTCACCCAC- TTTGCCTACCCGGCGCTCAACCETGCCCCCCAAGGTCATGAGTGTGG TCATGGGCGAGCTCATCATGCGCCGCGCCCAGCCCCTGGCCOGEOG- GATGCAAACTTGCAAGAG- TCCTCCGAGGAAGGCCTGCCCGEGGTCAGCGACGAGCAGCTGGCG CGCTGGCTGGAGACCCGCGACCCCEGCEGCAGCTGGAGGAGCGGCG- CAAGCTCATGATGGCCG- CGGTGCTGGTCACCGTGGAGCTCGAGTGTCTGCAGCGCTTCTTCGC GGACCCCGAGATGCAGCGCAAGCTCGAGGAGACCCTGCACTACAC- CTTCCGCCAGGGCTACG- TGCGCCAGGCCTGCAAGATCTCCAACGTGGAGCTCTGCAACCTGGT CTCCTACCTGGGCATCCTGCACGAGAACCGCCTCGGGCAGAACG- TCCTGCACTCCACCCT- CAAAGGGGAGGCGCGCCGCGACTACATCCGCGACTGCGCCTACCT CTTCCTCTGCTACACCTGGCAGACGGCCATGGGGGTCTGGCAGCA- GTGCCTGGAGGAGCG- CAACCTCAAGGAGCTGGAAAAGCTCCTCAAGCGCACCCTCAGGGA CCTCTGGACGGGCTTCAACGAGCGCTCGGTGGCCEGCCGEOGCOTGG- CGGACATCATCTTT- CCCGAGCGCCETGETCAAGACCCTGCAGCAGGGCCOTGCCCGACTTCA CCAGCCAGAGCATGCTGCAGAACTTCAGGACTTTCATCCTGGAG- CGCTCGGGCATCCTG- CCGGCCACTTGCTGCGCEGCTGCCCAGCGACTTCGTGCCCATCAAGT ACAGGGAGTGCCCGCCEGCCGCTCTGGGGCCACTGCTACCTCOTTCCA- GCTGGCCAACTAC- CTCGCCTACCACTCGGACCTCATGGAAGACGTGAGCGGCGAGGGC CTGCTCGAGTGCCACTGCCGCTGCAACCTCTGCACGCCCCACCG- CTCTCTAGTCTGCAAC- CCGCAGCTGCTCAGCEGAGAGTCAGATTATCGGTACCTTCGAGCTGC AGGGTCCCTCGCCTGACGAGAAGTCCGCGGCTCCAGGGCTGAAAC- TCACTCCGGGGCTGTG- GACTTCCGCCTACCTACGCAAATTTGTACCTGAGGACTACCACGCC CACGAGATCAGGTTCTACGAAGACCAATCCCGCCCGCCCAAGGCG- GAGCTCACCGCCTGCGT-
CATCACCCAGGGGCACATCCTGGGCCAATTGCAAGCCATCAACAA AGCCCGCCGAGAGTTCTTGCTGAAAAAGGGTCGGGGGGTGTAC- CTGGACCCCCAGTCCGG- CGAGGAGCTAAACCCGCTACCCCCGCEGCCEGCCCcAGCAGCGGGA CCTTGCTTCCCAGGATGGCACCCAGAAAGAAGCAGCAGCCGCOCG- CCGCCGCCGCAGCCATA-
CATGCTTCTGGAGGAAGAGGAGGAGGACTGGGACAGTCAGGCAGA GGAGGTTTCGGACGAGGAGCAGGAGGAGATGATGGAAGACTGG- GAGGAGGACAGCAGCCTA- GACGAGGAAGCTTCAGAGGCCGAAGAGGTGGCAGACGCAACACCA TCGCCCTCGGTCGCAGCCCCCTCEGCCEGGGGCCCCOTGAAA- TCCTCCGAACCCAGCACCAGCGC- TATAACCTCCGCTCCTCCEGGCGCCEGGCGCCACCCEGCCCGCAGACCOC AACCGTAGATGGGACACCACAGGAACCGGGGTCGGTAAG- TCCAAGTGCCCGCCGCCGCCAC- CGCAGCAGCAGCAGCAGCAGCGCCAGGGCTACCGCTCGTGGEGEG GGCACAAGAACGCCATAGTCGCCTGCTTGCAAGACTGCGGGGG- CAACATCTCTTTCGCCCG- CCGCTTCCTGCTATTCCACCACGGGGTCGCCTTTCCCCGCAATGTCC TGCATTACTACCGTCATCTCTACAGCCCCTACTGCAGCGGCGAC- CCAGAGGCGGCAGCGGCA- GCCACAGCGGCGACCACCACCTAGGAAGATATCCTCCGCGGGCAA GACAGCGGCAGCAGCGGCCAGGAGACCCGCGGCAGCAGCGGCOGG- GAGCGGTGGGCGCACTG- CGCCTCTEGCCCAACGAACCCCTCTEGACCEGGGAGCTCAGACACA GGATCTTCCCCACTTTGTATGCCATCTTCCAACAGAGCAGAGGCCA- GGAGCAGGAGCTGAAA- ATAAAAAACAGATCTCTGCGCTCCCTCACCCGCAGCTGTCTGTATC ACAAAAGCGAAGATCAGCTTCGGCGCACGCTGGAGGACGCGGA- GGCACTCTTCAGCAAATAC- TGCGCGCTCACTCTTAAAGACTAGCTCCGCGCCCTTCTCGAATTTAG GCGGGAGAAAACTACGTCATCGCCGGCCGCCEGCCCAGCCCOGCOCCA- GCCGAGATGAGCAAAGA- GATTCCCACGCCATACATGTGGAGCTACCAGCCGCAGATGGGACTC GCGGCGGGAGCEGGCCCAGGACTACTCCACCCGCATGAACTACA- TGAGCGCGGGACCCCACA- TGATCTCACAGGTCAACGGGATCCGCGCCCAGCGAAACCAAATACT GCTGGAACAGGCGGCCATCACCGCCACGCCCCGCCATAATCT- CAACCCCCGAAATTGGCCCG- CCGCCCETCGTGTACCAGGAAACCCCCTCCGCCACCACCGTACTACT TCCGCGTGACGCCCAGGCCGAAGTCCAGATGACTAACTCAGGGG- CGCAGCTCGCGGGCGG- CTTTCGTCACGGGGCGCEGGCCGCTCCGACCAGGTATAAGACACCTG ATGATCAGAGGCCGAGGTATCCAGCTCAACGACGAGTCGGTGAG- CTCTTCGCTCGGTCTCCG- TCCGGACGGAACTTTCCAGCTCGCCGGATCCGGCEGCTCTTCGTTC ACGCCCCEGCCAGGEGTACCTGACTCTGCAGACCTCOGTCCTCGGAG- CCCCGCETCCGGEOGG- CATCGGAACCCTCCAGTTCGTGGAGGAGTTCGTGCCCTCGGTCTAC TTCAACCCCTTCTCGGGACCTCCCGGACGCTACCCCGACCAGTT- CATTCCGAACTTTGACG- CGGTGAAGGACTCGGCGGACGGCTACGACTGAATGTCAGGTGTCG AGGCAGAGCAGCTTCGCCTGAGACACCTCGAGCACTGCCGCCG- CCACAAGTGCTTCGCCCG- CGGTTCTGGTGAGTTCTGCTACTTTCAGCTACCCGAGGAGCATACC GAGGGGCCGGCGCACGGCEGTCCEGCETGACCACCCAGGGCGAGGT- TACCTGTTCCCT- CATCCGGGAGTTTACCCTCCGTCCCCTGCTAGTGGAGCEGGGAGEGG GGTCCCTGTGTCCTAACTATCGCCTGCAACTGCCCTAACCCTGGAT- TACATCAAGATCTTTG- CTGTCATCTCTGTGCTGAGTTTAATAAACGCTGAGATCAGAATCTA CTGGGGCTCCTGTCGCCATCCTGTGAACGCCACCGTCTTCACCCAC- CCCGACCAGGCCCAGG- CGAACCTCACCTGCGGTCTGCATCGGAGGGCCAAGAAGTACCTCAC CTGGTACTTCAACGGCACCCCCTTTGTGGTTTACAACAGCTTCGA- CGGGGACGGAG- TCTCCCTGAAAGACCAGCTCTCCGGTCTCAGCTACTCCATCCACAA GAACACCACCCTCCAACTCTTCCCTCCCTACCTGCCGGGAACC- TACGAGTGCGTCACCGG- CCGCTGCACCCACCOTCACCCGCCTGATCGTAAACCAGAGCTTTCCG GGAACAGATAACTCCCTCTTCCCCAGAACAGGAGGTGAGCTCAG- GAAACTCCCCGGGGACCA- GGGCGGAGACGTACCTTCGACCCTTGTGGGGTTAGGATTTTTTATT ACCGGGTTGCTGGCTCTTTTAATCAAAGTTTCCTTGAGATTTGTT- CTTTCCTTCTACGTGTA- TGAACACCTCAACCTCCAATAACTCTACCCTTTCTTCGGAATCAGGT GACTTCTCTGAAATCGGGCTTGGTGTGCTGCTTACTCTG- TTGATTTTTTTCCTTATCATACT- CAGCCTTCTGTGCCTCAGGCTCGCCGCCTGCTGCGCACACATCTAT ATCTACTGCTGGTTGCTCAAGTGCAGGGGTCGCCACCCAAGA- TGAACAGGTACATGGTCCTA- TCGATCCTAGGCCTGCTGGCCCTGGCEGGCCTGCAGEGCCOGCCAAAA AAGAGATTACCTTTGAGGAGCCCGCTTGCAATGTAACTTTCAAG- CCCGAGGGTGACCAATG- CACCACCCTCGTCAAATGCGTTACCAATCATGAGAGGCTGCGCATC GACTACAAAAACAAAACTGGCCAGTTTGCGGTCTATAGTGTGTT- TACGCCCGGAGACCCCTC- TAACTACTCTGTCACCGTCTTCCAGGGCGGACAGTCTAAGATATTC AATTACACTTTCCCTTTTTATGAGTTATGCGATGCGGTCATGTACA- TGTCAAAACAGTA- CAACCTGTGGCCTCCCTCTCCCCAGGCGTGTGTGGAAAATACTGGG TCTTACTGCTGTATGGCTTTCGCAATCACTACGCTCGCTCTAATCTG- CACGGTGCTATACA- TAAAATTCAGGCAGAGGCGAATCTTTATCGATGAAAAGAAAATGC CTTGATCGCTAACACCGGCTTTCTATCTGCAGAATGAATGCAAT- CACCTCCCTACTAATCAC- CACCACCCTCCTTGCGATTGCCCATGGGTTGACACGAATCGAAGTG CCAGTGGGGTCCAATGTCACCATGGTGGGCCCCGCCGGCAATT- CCACCCTCATGTGGGAAAA- ATTTGTCCGCAATCAATGGGTTCATTTCTGCTCTAACCGAATCAGTA TCAAGCCCAGAGCCATCTGCGATGGGCAAAATCTAACTCTGATCA- ATGTGCAAATGATGGA- TGCTGGGTACTATTACGGGCAGCGGGGAGAAATCATTAATTACTGG CGACCCCACAAGGACTACATGCTGCATGTAGTCGAGGCACTT- CCCACTACCACCCCCACTAC- CACCTCTCCCACCACCACCACCACTACTACTACTACTACTACTACTA CTACTACTACCACTACCGCTGCCCGCCATACCCGCAAAAGCAC- CATGATTAGCACAAAG- CCCCCTCGTGETCACTCCCACGCCEGGCEGGGCCCATCGGTGCGACCOT CAGAAACCACCGAGCTTTGCTTCTGCCAATGCACTAACGCCAGCG- CTCATGAACTGTTCGAC- CTGGAGAATGAGGATGTCCAGCAGAGCTCCGCTTGCCTGACCCAGG AGGCTGTGGAGCCCGTTGCCCTGAAGCAGATCGGTGATTCAATAA- TTGACTCTTCTT- CTTTTGCCACTCCCGAATACCCTCCCGATTCTACTTTCCACATCACG GGTACCAAAGACCCTAACCTCTCTTTCTACCTGATGCTGCTG- CTCTGTATCTCTGTGG- TCTCTTCCGCGCTGATGTTACTGGGGATGTTCTGCTGCCTGATCTGC CGCAGAAAGAGAAAAGCTCGCTCTCAGGGCCAACCACTGATG- CCCTTCCCCTACCCCCCGGA- TTTTGCAGATAACAAGATATGAGCTCGCTGCTGACACTAACCGCTT TACTAGCCTGCGCTCTAACCCTTGTCGCTTGCGACTCGAGATTCCA- CAATGTCACAGCTG- TGGCAGGAGAAAATGTTACTTTCAACTCCACGGCCGATACCCAGTG GTCGTGGAGTGGCTCAGGTAGCTACTTAACTATCTGCAATAG- CTCCACTTCCCCCGGCATA- TCCCCAACCAAGTACCAATGCAATGCCAGCCTGTTCACCCTCATCA ACGCTTCCACCCTGGACAATGGACTCTATGTAGGCTATGTAC- CCTTTGGTGGGCAAGGAAA- GACCCACGCTTACAACCTGGAAGTTCGCCAGCCCAGAACCACTACC CAAGCTTCTCCCACCACCACCACCACCACCACCATCACCAGCAG- CAGCAGCAGCAGCAGCCA- CAGCAGCAGCAGCAGATTATTGACTTTGGTTTTGGCCAGCTCATCT GCCGCTACCCAGGCCATCTACAGCTCTGTGCCCGAAACCACTCA- GATCCACCGCCCA- GAAACGACCACCGCCACCACCCTACACACCTCCAGCGATCAGATGC CGACCAACATCACCCCCTTGGCTCTTCAAATGGGACTTACAAG- CCCCACTCCAAAACCAGTG- GATGCGGCCGAGGTCTCCGCCCTCGTCAATGACTGGGCGGGGCTGG GAATGTGGTGGTTCGCCATAGGCATGATGGCGCTCTGCCTGCTT- CTGCTCTGGCTCATCTG- CTGCCTCCACCGCAGGCEGAGCCAGACCCCCCATCTATAGACCCATCE ATTGTCCTGAACCCCGATAATGATGGGATCCATAGATTGGATGG- CCTGAAAAACCTAC- TTTTTTCTTTTACAGTATGATAAATTGAGACATGCCTCGCATTTTCT TGTACATGTTCCTTCTCCCACCTTTTCTGGGGTGTTCTACGCTGG- CCGCTGTGTCTCACCTG- GAGGTAGACTGCCTCTCACCCTTCACTGTCTACCTGCTTTACGGATT GGTCACCCTCACTCTCATCTGCAGCCTAATCACAGTAATCATCG- CCTTCATCCAGTG- CATTGATTACATCTGTGTGCGCCTCGCATACTTCAGACACCACCCG CAGTACCGAGACAGGAACATTGCCCAACTTCTAAGACTGCTCTAA- TCATGCATAAGACTG- TGATCTGCCTTCTGATCCTCTGCATCCTGCCCACCCOTCACCTCCTGC CAGTACACCACAAAATCTCCGCGCAAAAGACATGCCTCCTGCCG- CTTCACCCAACTGTGGAA- TATACCCAAATGCTACAACGAAAAGAGCGAGCTCTCCGAAGCTTG GCTGTATGGGGTCATCTGTGTCTTAGTTTTCTGCAGCACTGTCTTTG- CCCTCATAATCTAC- CCCTACTTTGATTTGGGATGGAACGCGATCGATGCCATGAATTACC CCACCTTTCCCGCACCCEGAGATAATTCCACTGCGACAAGTTGTAC- CCGTTGTCGTTAAT- CAACGCCCCCCATCCCCTACGCCCACTGAAATCAGCTACTTTAACC TAACAGGCGGAGATGACTGACGCCCTAGATCTAGAAATGGACGG- CATCAGTACCGAGCAGCG- TCTCCTAGAGAGGCGCAGGCAGGCGGCTGAGCAAGAGCGCCTCAA TCAGGAGCTCCGAGATCTCGTTAACCTGCACCAGTGCAAAAGAGG- CATCTTTTGTCTGG- TAAAGCAGGCCAAAGTCACCTACGAGAAGACCGGCAACAGCCACC GCCTCAGTTACAAATTGCCCACCCAGCGCCAGAAGCTGGTGCT- CATGGTGGGTGAGAA- TCCCATCACCGTCACCCAGCACTCGGTAGAGACCGAGGGGTGTCTG CACTCCCCCTGTCGGGGTCCAGAAGACCTCTGCACCCTGGTAAA- GACCCTGTGCGGTCTCA- GAGATTTAGTCCCCTTTAACTAATCAAACACTGGAATCAATAAAAA GAATCACTTACTTAAAATCAGACAGCAGGTCTCTGTCCAGTTTATT- CAGCAGCACCTCCTT- CCCCTCCTCCCAACTETGGTACTCCAAACGCCTTCTGGCEGGCAAAC TTCCTCCACACCCTGAAGGGAATGTCAGATTCTTGCTCCTG- TCCCTCCGCACCCACTATCTT- CATGTTGTTGCAGATGAAGCGCACCAAAACGTCTGACGAGAGCTTC AACCCCGTGTACCCCTATGACACGGAAAGCGGCCCTCCCTCCG- TCCCTTTCCTCAC- CCCETCCCTTCGTGTCTCCCGATGGATTCCAAGAAAGTCCCCCCGGG GTCCTGTCTCTGAACCTGGCCGAGCCCCTGGTCACTTCCCACGG- CATGCTCGCCCTGAAAA- TGGGAAGTGGCCTCTCCCTGGACGACGCTGGCAACCTCACCTCTCA AGATATCACCACCGCTAGCCCTCCCCTCAAAAAAACCAAGAC- CAACCTCAGCCTAGAAACCT-
CATCCCCCCTAACTGTGAGCACCTCAGGCGCCCTCACCGTAGCOAGE CGCCEGCTCCCeTGGEGGTGGCCGGCACCOTCCCTCACCATGCAATCA- GAGGCCCCCCTGACAG-
TACAGGATGCAAAACTCACCCTGGCCACCAAAGGCCCCCTGACCGT GTCTGAAGGCAAACTGGCCTTGCAAACATCGGCCCCGCTGACGG- CCGCTGACAGCAGCAC- CCTCACAGTCAGTGCCACACCACCCCTTAGCACAAGCAATGGCAGC TTGGGTATTGACATGCAAGCCCCCATTTACACCACCAATGGA- AAACTAGGACTTAACTTTGG- CGCTCCCCTGCATGTGGTAGACAGCCTAAATGCACTGACTGTAGTT ACTGGCCAAGGTCTTACGATAAACGGAACAGCCCTACAAAC- TAGAGTCTCAGGTGCCCT- CAACTATGACACATCAGGAAACCTAGAATTGAGAGCTGCAGGGGG TATGCGAGTTGATGCAAATGGTCAACTTATCCTTGATGTAGCTTAC- CCATTTGATGCA- CAAAACAATCTCAGCCTTAGGCTTGGACAGGGACCCCTGTTTGTTA ACTCTGCCCACAACTTGGATGTTAACTACAACAGAGGCCTCTAC- CTGTTCACATCTGGAAA- TACCAAAAAGCTAGAAGTTAATATCAAAACAGCCAAGGGTCTCATT TATGATGACACTGCTATAGCAATCAATGCGGGTGATGGGCTACAG- TTTGACTCAGGCTCAGA- TACAAATCCATTAAAAACTAAACTTGGATTAGGACTGGATTATGAC TCCAGCAGAGCCATAATTGCTAAACTGGGAACTGGCCTAAG- CTTTGACAACACAGGTGCCAT- CACAGTAGGCAACAAAAATGATGACAAGCTTACCTTGTGGACCAC ACCAGACCCATCCCCTAACTGTAGAATCTATTCAGAGAAAGATGC- TAAATTCACACTTG- TTTTGACTAAATGCGGCAGTCAGGTGTTGGCCAGCGTTTCTGTTTTA TCTGTAAAAGGTAGCCTTGCGCCCATCAGTGGCACAGTAACTAG- TGCTCAGATTGTCCTCA- GATTTGATGAAAATGGAGTTCTACTAAGCAATTCTTCCCTTGACCCT CAATACTGGAACTACAGAAAAGGTGACCTTACAGAGGGCACTGCA- TATACCAACGCAGTGG- GATTTATGCCCAACCTCACAGCATACCCAAAAACACAGAGCCAAA CTGCTAAAAGCAACATTGTAAGTCAGGTTTACTTGAATGGGGA- CAAATCCAAACCCATGAC- CCTCACCATTACCCTCAATGGAACTAATGAAACAGGAGATGCCACA GTAAGCACTTACTCCATGTCATTCTCATGGAACTGGAATGGAAGTA- ATTACATTAA- TGAAACGTTCCAAACCAACTCCTTCACCTTCTCCTACATCGCCCAA GAATAAAAAGCATGACGCTGTTGATTTGATTCAATGTGTTTCTG- TTTTATTTTCAAGCACAA- CAAAATCATTCAAGTCATTCTTCCATCTTAGCTTAATAGACACAGT AGCTTAATAGACCCAGTAGTGCAAAGCCCCATTCTAGCTTATAAC- TAGTGGAGAAGTACTCG- CCTACATGGGGGTAGAGTCATAATCGTGCATCAGGATAGGGCGGT GGTGCTGCAGCAGCGCGCGAATAAACTGCTGCCEGCECGECGETCCG- TCCTGCAGGAATACAA- CATGGCAGTGGTCTCCTCAGCGATGATTCGCACCGCCCGCAGCATA AGGCGCCTTGTCCTCCGGGCACAGCAGCGCACCCTGATCTCACT- TAAATCAGCACAGTAAC- TGCAGCACAGCACCACAATATTGTTCAAAATCCCACAGTGCAAGGC GCTGTATCCAAAGCTCATGGCGGGGACCACAGAACCCACGTGG- CCATCATACCACAAGCGCA- GGTAGATTAAGTGGCGACCCCTCATAAACACGCTGGACATAAACAT TACCTCTTTTGGCATGTTGTAATTCACCACCTCCCGGTACCATA- TAAACCTCTGATTAAACA- TGGCGCCATCCACCACCATCCTAAACCAGCTGGCCAAAACCTGCCC GCCGGCTATACACTGCAGGGAACCGGGACTGGAACAATGACAGTG- GAGAGCCCAGGACTCG- TAACCATGGATCATCATGCTCGTCATGATATCAATGTTGGCACAAC ACAGGCACACGTGCATACACTTCCTCAGGATTACAAGCTCCTCCCG- CGTTAGAACCATA- TCCCAGGGAACAACCCATTCCTGAATCAGCGTAAATCCCACACTGC AGGGAAGACCTCGCACGTAACTCACGTTGTGCATTGTCAAAGTGT- TACATTCGGGCAGCAG- CGGATGATCCTCCAGTATGGTAGCGCGGGTTTCTGTCTCAAAAGGA GGTAGACGATCCCTACTGTACGGAGTGCGCCGAGACAACCGAGA- TCGTGTTGGTCGTAGTGT- CATGCCAAATGGAACGCCGGACGTAGTCATATTTCCTGAAGTCTTA GATCTCTCAACGCAGCACCAGCACCAACACTTCGCAGTG- TAAAAGGCCAAGTGCCGAGAGAG- TATATATAGGAATAAAAAGTGACGTAAACGGGCAAAGTCCAAAAA ACGCCCAGAAAAACCGCACGCGAACCTACGCCCCGAAACGAAAG- CCAAAAAACACTAGACAC-
TCCCTTCCGGCGTCAACTTCCGCTTTCCCACGCTACGTCACTTGCCC CAGTCAAACAAACTACATATCCCGAACTTCCAAGTCGCCACG- CCCAAAACACCGCCTACAC- CTCCCEeEGEceGCeGGECEGCCCCCAAACCEGECTECEGCCCeGEGE CCCEGCCceGCGCEGCCCATCTCATTATCATATTGGCTTCAA-
TCCAAAATAAGGTATATTATTGATGATG SEQ ID NO: 5 Sequência de aminoácidos de RSV FOATM-N-M2-1 MELLILKANAITTILTAVTFCFASGQNITEEFYQSTCSAVSKGYLSAL- RTGWYTSVITIELS-
NIKENKCNGTDAKVKLIKQELDKYKNAVTELQLLMQOSTPATNNRARR ELPRFMNYTLNNAKKTNVTLSKKRKRRFLGFLLGVGSAIAS- GVAVSKVLHLEGEVN- KIKSALLSTNKAVVSLSNGVSVLTSKVLDLKNYIDKQLLPIVNKQSCSI SNIETVIEFQOQKNNRLLEITREFSVYNAGVTTPVSTYMLTNSELLSLNDM- PITNDQKKLMSNN- VQIVRQQSYSIMSIIKEEVLAY VVQLPLYGVIDTPCWKLHTSPLCTTNT KEGSNICLTRTDRGWYCDNAGSVSFFPQAETCKVQSNRVFCDTMNS- LTLPSEVNLCNVDIFN- PKYDCKIMTSKTDVSSSVITSLGAIVSCYGKTKCTASNKNRGIIKTFSN GCDY VSNKGVDTVSVGNTLYYVNKQEGKSLY VKGEPIINFYD- PLVFPSDEFDASIS- QVNEKINQSLAFIRKSDELLHNVNAGKSTTNRKRRAPVKQTLNFDLLK LAGDVESNPGPMALSKVKLNDTLNKDQLLSSSKYTIQRS- TGDSIDTPNYDVQKHINKLCG- MLLITEDANHKFTGLIGMLY AMSRLGREDTIKILRDAGYHVKANGVD VTTHRQDINGKEMKFEVLTLASLTTEIQINIEIESRKSYKKMLKEMGE- VAPEYRHDSPDCG- MIILCIAALVITKLAAGDRSGLTAVIRRANNVLKNEMKRYKGLLPKDI ANS FYEVFEKYPHFIDVFVHFGIAQSSTRGGSRVEGIFA- GLFMNAYGAGQVMLR- WGVLAKSVKNIMLGHASVQAEMEQVVEVYEYAQKLGGEAGFYHILN NPKASLLSLTQFPHFSSVYVLGNAAGLGIMGEYRGTPRNQDLYDAAKA- YAEQLKEN- GVINYSVLDLTAEELEAIKHQLNPKDNDVELGGGGSGGGGMSRRNPC KFEIRGHCLNGKRCHFSHNYFEWPPHALLVRQNFMLNRILKSMDK- SIDTLSEISGAAELDR- TEEYALGVVGVLESYIGSINNITKOSACVAMSKLLTELNSDDIKKLRDN EELNSPKIRVYNTVISYIESNRKNNKQTIHLLKRLPADVLKKTIKNTL-
DIHKSITINNPKESTVSDTNDHAKNNDTT SEQ ID NO: 6 Sequência polinucleotídica que codifica o promo- tor de hoMV aprimorado MELLILKANAITTILTAVTFCFASGQNITEEFYQSTCSAVSKGYLSAL- RTGWYTSVITIELS-
NIKENKCNGTDAKVKLIKQELDKYKNAVTELQLLMQSTPATNNRARR ELPRFMNYTLNNAKKTNVTLSKKRKRRFLGFLLGVGSAIAS- GVAVSKVLHLEGEVN- KIKSALLSTNKAV VSLSNGVSVLTSKVLDLKNYIDKQLLPIVNKQSCSI SNIETVIEFQOQKNNRLLEITREFSVYNAGVTTPVSTYMLTNSELLSLNDM- PITNDQKKLMSNN- VQIVRQQSYSIMSIIKEEVLAY VVQLPLYGVIDTPCWKLHTSPLCTTNT KEGSNICLTRTDRGWYCDNAGSVSFFPQAETCKVQSNRVFCDTMNS- LTLPSEVNLCNVDIFN- PKYDCKIMTSKTDVSSSVITSLGAIVSCYGKTKCTASNKNRGIIKTFSN GCDYVSNKGVDTVSVGNTLYYVNKQEGKSLY VKGEPIINFYD- PLVFPSDEFDASIS- QVNEKINQSLAFIRKSDELLHNVNAGKSTTNRKRRAPVKQTLNFDLLK LAGDVESNPGPMALSKVKLNDTLNKDQLLSSSKYTIQRS- TGDSIDTPNYDVQKHINKLCG- MLLITEDANHKFTGLIGMLYAMSRLGREDTIKILRDAGYHVKANGVD VTTHRQDINGKEMKFEVLTLASLTTEIQINIFEIESRKSYKKMLKEMGE- VAPEYRHDSPDCG- MIILCIAALVITKLAAGDRSGLTAVIRRANNVLKNEMKRYKGLLPKDI ANS FYEVFEKYPHFIDVFVHFGIAQSSTRGGSRVEGIFA- GLFMNAYGAGQVMLR- WGVLAKSVKNIMLGHASVQAEMEQVVEVYEYAQKLGGEAGFYHILN NPKASLLSLTQFPHFESSVYVLGNAAGLGIMGEYRGTPRNQDLYDAAKA- YAEQLKEN- GVINYSVLDLTAEELEAIKHOQLNPKDNDVELGGGGSGGGGMSRRNPC KFEIRGHCLNGKRCHFSHNYFEWPPHALLVRQNFMLNRILKSMDK- SIDTLSEISGAAELDR- TEEYALGVVGVLESYIGSINNITKOSACVAMSKLLTELNSDDIKKLRDN EELNSPKIRVYNTVISYIESNRKNNKQTIHLLKRLPADVLKKTIKNTL-
DIHKSITINNPKESTVSDTNDHAKNNDTT SEQ ID NO: 7 Sequência polinucleotídica que codifica o cas- sete hoMV NM2 bahpolyA
CCATTGCATACGTTGTATCCATATCATAATATGTACATTTATATTGGCT- CATGTCCAACAT- TACCGCCATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTAC GGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACT- TACGGTAAATGG- CCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTG- GAGTATT- TACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTAC GCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCA- GTACATGACCT- TATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTAC CATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGA- CTCACGGGGA- TTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAA ATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAA- TGGGCGGTAGG- CGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCTCCCTATCAGTGATAGAG ATCTCCCTATCAGTGATAGAGATCGTCGACGAGCTCGTTTAGTGAACCGT- CAGATCGCCTG- GAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCC AGCCTCCGCGGCCEGGGAACGGTGCATTGGAACGCGGATTCCCCGTG- CCAAGAGTGAGATCTT- CCGTTTATCTAGGTACCAGATATCGCCACCATGGCCCTGAGCAAAGTGAAAC TGAACGATACACTGAACAAGGACCAGCTGCTGTCCAGCAGCAAGTACAC- CATCCAGCGGAG- CACCGGCGACAGCATCGATACCCCCAACTACGACGTGCAGAAGCACATCAAC AAGCTGTGCGGCATGCTGCTGATCACAGAGGACGCCAACCACAAGTTCAC- CGGCCTGATCGG- CATGCTGTACGCCATGAGCCGGCTGGGCCGEGGAGGACACCATCAAGATCCTG CGGGACGCCGGCTACCACGTGAAGGCCAATGGCGTGGACGTGACCACACAC- CGGCAGGACAT- CAACGGCAAAGAAATGAAGTTCGAGGTGCTGACCCTGGCCAGCCTGACCACC GAGATCCAGATCAATATCGAGATCGAGAGCCGGAAGTCCTACAAGAAAATG- CTGAAAGAAA- TGGGCGAGGTGGCCCCCGAGTACAGACACGACAGCCCCGACTGCGGCATGAT CATCCTGTGTATCGCCGCCCTGGTGATCACAAAGCTGGCCGCTGGCGACA- GATCTGGCCTGA- CAGCCGTGATCAGACGGGCCAACAATGTGCTGAAGAACGAGATGAAGCGGTA CAAGGGCCTGCTGCCCAAGGACATTGCCAACAGCTTCTACGAGGTGTT- CGAGAAGTAC- CCCCACTTCATCGACGTGTTCGTGCACTTCGGCATTGCCCAGAGCAGCACCA GAGGCGGCTCCAGAGTGGAGGGCATCTTCGCCGGCCTGTTCATGAACGCC- TACGGCGCTGG- CCAGGTGATGCTGAGATGGGGCGTGCTGGCCAAGAGCGTGAAGAACATCATG CTGGGCCACGCCAGCGTGCAGGCCGAGATGGAACAGGTGGTGGAGGTG- TACGAGTACGCCCA- GAAGCTGGGCGGAGAGGCCGGCTTCTACCACATCCTGAACAACCCTAAGGCC TCCCTGCTGTCCCTGACCCAGTTCCCCCACTTCTCCAGCGTGGTGCTGGGA- AATGCCGCCG- GACTGGGCATCATGGGCGAGTACCGGGGCACCCCCAGAAACCAGGACCTGTA CGACGCCGCCAAGGCCTACGCCGAGCAGCTGAAAGAAAACGGCGTGAT- CAACTACAGCGTG- CTGGACCTGACCGCTGAGGAACTGGAAGCCATCAAGCACCAGCTGAACCCCA AGGACAACGACGTGGAGCTGGGAGGCGGAGGATCTGGCGGCGGAGG- CATGAGCAGACGGAAC- CCCTGCAAGTTCGAGATCCGGGGCCACTGCCTGAACGGCAAGCGGTGCCACT TCAGCCACAACTACTTCGAGTGGCCCCCTCATGCTCTGCTGGTGCGGCA- GAACTTCATG- CTGAACCGGATCCTGAAGTCCATGGACAAGAGCATCGACACCCTGAGCGAGA TCAGCGGAGCCGCCGAGCTGGACAGAACCGAGGAATATGCCCTGGGCGTGG- TGGGAGTGCTG- GAAAGCTACATCGGCTCCATCAACAACATCACAAAGCAGAGCGCCTGCGTGG CCATGAGCAAGCTGCTGACAGAGCTGAACAGCGACGACATCAAGAAG- CTGAGGGACAACGAG- GAACTGAACAGCCCCAAGATCCGGGTGTACAACACCGTGATCAGCTACATTG AGAGCAACCGCAAGAACAACAAGCAGACCATCCATCTGCTGAAGCGGCTG- CCCGCCGACGTG- CTGAAAAAGACCATCAAGAACACCCTGGACATCCACAAGTCCATCACCATCA ACAATCCCAAAGAAAGCACCGTGTCTGACACCAACGATCACGCCAAGAA- CAACGACACCAC- CTGATGAGCGGCCGCGATCTGCTGTGCCTTCTAGTTGCCAGCCATCTGTTGT TTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTG- TCCTTTCCTAA- TAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGG GGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCA-
GGCATGCTGGGGATGCGGTGGGCTCTATGG Sequência do promotor CMV: negrito Sequência do transgene NM?2: itálico bghpolyA sinal PolyA: itálico + sublinhado SEQ ID NO: 8 Sequência de proteínas NM2 MALSKVKLNDTLNKDQLLSSSKYTIQORSTGDSIDTPNYDVOKHINKLCG- MLLITEDANHK-
FTGLIGMLYAMSRLGREDTIKILRDAGYHVKANGVDVTTHRODINGKEMKFE VLTLASLTTEIQINIEIESRKSYKKMLKEMGEVAPEYRHDSPDCGMIIL- CIAALVITKLAAG- DRSGLTAVIRRANNVLKNEMKRYKGLLPKDIANSFYEVFEKYPHFIDVFVHF GIAQSSTRGGSRVEGIFAGLFMNAYGAGQOVMLRWGVLAKSVKNIMLGHAS- VQOAE- MEQVVEVYEYAQKLGGEAGFYHILNNPKASLLSLTQFPHFSSVVLGNAAGLG IMGEYRGTPRNODLYDAAKAYAEQLKENGVINYSVLDLTAEELEAIKHQLN- PKDNDVEL- GGGGSGGGGMSRRNPCKFE IRGHCLNGKRCHFSHNYFEWPPHALLVRONFML NRILKSMDKSIDTLSEISGAAELDRTEEYALGVVGVLESYIGSINNIT- KOSACVAMSKLL- TELNSDDIKKLRDNEELNSPKIRVYNTVISYIESNRKNNKQTIHLLKRLPAD
VLKKTIKNTLDIHKSITINNPKESTVSDTNDHAKNNDTT SEQ ID NO: 9 Sequência polinucleotídica que codifica o cas- sete hoMV FO WPRE bahpolyA CCATTGCATACGTTGTATCCATATCATAATATGTACATTTATATTGGCT- CATGTCCAACAT-
TACCGCCATGTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTAC GGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACT- TACGGTAAATGG- CCCGCCTGEGCTEGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG TATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTG- GAGTATT- TACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTAC GCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCA- GTACATGACCT- TATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTAC CATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGA- CTCACGGGGA- TTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAA ATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAA- TGGGCGGTAGG-
CGTGTACGGTGGGAGGTCTATATAAGGCGAAGCGCTCCCTATCAGTGATAGA GATCTCCCTATCAGTGATAGAGATCGTCGACGAGCTCGCGGCGGGCGGGAG- TCGCTGCGCGE- CTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCECCTEGCECCECCEECCCees
CTCTGACTGACCGCGTTACTAAAACAGGTAAGTCCGGCCTCCGCGCCGGG- TTTTGGCG- CCTCCCGCEGECECCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAG GGCGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGG- CCCGCTGCTCATAA- GACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACT TGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAG- GAAAAGTAG- TCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGEGGCGGTGAACGCCGAT GATGCCTCTACTAACCATGTTCATGTTTTCTTTTTTTTTCTACAGG- TCCTGGGTGACGAACA- GGATATCGCCACCATGGAACTGCTGATCCTGAAGGCCAACGCCATCACCACC ATCCTGACCGCCGTGACCTTCTGCTTCGCCAGCGGCCAGAACATCACCGAG- GAATTCTACCA- GAGCACCTGTAGCGCCGTGAGCAAGGGCTACCTGAGCGCCCTGAGAACCGGC TGGTACACCAGCGTGATCACCATCGAGCTGAGCAACATCAAAGAAAACAAG- TGCAACGGCAC- CGACGCCAAAGTGAAGCTGATCAAGCAGGAACTGGACAAGTACAAGAACGCC GTGACCGAGCTGCAGCTGCTGATGCAGAGCACCCCCGCCACCAACAAC- CGGGCCAGACGGGA- GCTGCCCCGGTTCATGAACTACACCCTGAACAACGCCAAAAAGACCAACGTG ACCCTGAGCAAGAAGCGGAAGCGGCGGTTCCTGGGCTTTCTGCTGGGCG- TGGGCAGCG- CCATTGCCAGCGGCGTGGCCGTGTCTAAGGTGCTGCACCTGGAAGGCGAAGT GAACAAGATCAAGAGCGCCCTGCTGAGCACCAACAAGGCCGTGGTG- TCCCTGAGCAACGGCG- TGAGCGTGCTGACCAGCAAGGTGCTGGATCTGAAGAACTACATCGACAAGCA GCTGCTGCCCATCGTGAACAAGCAGAGCTGCAGCATCAGCAACATCGAGA- CAGTGATCGAG- TTCCAGCAGAAGAACAACCGGCTGCTGGAAATCACCCGGGAGTTCAGCGTGA ACGCCGGCGTGACCACCCCTGTGTCCACCTACATGCTGACCAACAGCGAG- CTGCTGAG- CCTGATCAACGACATGCCCATCACCAACGACCAGAAAAAGCTGATGAGCAAC AACGTGCAGATCGTGCGGCAGCAGAGCTACTCCATCATGTCCATCAT- CAAAGAAGAGGTG- CTGGCCTACGTGGTGCAGCTGCCCCTGTACGGCGTGATCGACACCCCCTGCT GGAAGCTGCACACCAGCCCCCTGTGCACCACCAACACCAAAGAGGGCAG- CAACATCTG- CCTGACCCGGACCGACAGAGGCTGGTACTGCGACAACGCCGGCAGCGTGTCA TTCTTTCCACAGGCCGAGACATGCAAGGTGCAGAGCAACCGGGTGTTCTG- CGACACCATGAA- CAGCCTGACCCTGCCCTCCGAAGTGAACCTGTGCAACGTGGACATCTTCAAC CCCAAGTACGACTGCAAGATCATGACCTCCAAGACCGACGTGTCCAG- CTCCGTGATCAC- CTCCCTGGGCGCCATCGTGTCCTGCTACGGCAAGACCAAGTGCACCGCCAGC AACAAGAACCGGGGCATCATCAAGACCTTCAGCAACGGCTGCGACTACGTG- TCCAA- CAAGGGGGTGGACACCGTGTCCGTGGGCAACACCCTGTACTACGTGAACAAA CAGGAAGGCAAGAGCCTGTACGTGAAGGGCGAGCCCATCATCAACTTC- TACGACCCCCTGG- TGTTCCCCAGCGACGAGTTCGACGCCAGCATCAGCCAGGTGAACGAGAAGAT CAACCAGAGCCTGGCCTTCATCCGGAAGTCCGACGAGCTGCTGCACAATG- TGAATGCCGG- CAAGTCCACCACCAACTGATGAGCGGCCATCTAATCAACCTCTGGATTACAA AATTTGTGAAAGATTGACTGGTATTCTTAACTATGTTGCTCCTTTTACGC- TATGTGGATACG- CTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGGCTTTCATTTT CTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGG- CCCGTTGTCAGG- CAACGTGGCGTGGTGTGCACTGTGTTTGCTGACGCAACCCCCACTGGTTGGG GCATTGCCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTT- CCCCCTCCCTATTG- CCACGGCGGAACTCATCGCCGCCTGCCTTEGCCCGCTEGCTGGACAGEGECTCE GCTGTTGGGCACTGACAATTCCGTGGTGTTGTCGGGGAAATCATCG- TCCTTTCCTTGGCTG- CTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCC CTTCGGCCCTCAATCCAGCGGACCTTCCTTCCCGCGEGCCTECTECCEG- CTCTGCGGCCTCTT- CCGCETCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCECCT CCCCGCCTGCEGCCGCGATCTGCTGTGCCTTCTAGTTGCCAGCCATCTG- TTGTTTG- CCCCETCCCCCGTEGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTT TCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTC- TATTCTGGGGGG- TGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCAT
GCTGGGGATGCGGTGGGCTCTATGG Sequência aprimorada do promotor de CMV: negrito Sequência do transgene FO: itálico Sequência de WPRE: negrito sublinhado bghpolyA sinal PolyA: itálico + sublinhado SEQIDNO: 10 Sequência de proteínas FO MELLILKANAITTILTAVTFCFASGONITEEFYQSTCSAVSKGYLSAL- RTGWYTSVITIELS-
NIKENKCNGTDAKVKLIKQELDKYKNAVTELQLLMOSTPATNNRARRELPRF MNYTLNNAKKTNVTLSKKRKRRFLGFLLGVGSAIASGVAVSKVLHLEGEVN- KIKSALLSTN- KAVVSLSNGVSVLTSKVLDLKNY IDKQLLPIVNKQOSCSISNIETVIEFQQOKN NRLLEITREFSVNAGVTTPVSTYMLTNSELLSLINDMPITNDOKKLMSNN- VOIVR- QQSYSIMSIIKEEVLAYVVOLPLYGVIDTPCWKLHTSPLCTTNTKEGSNICL TRTDRGWYCDNAGSVSFFPQAETCKVOSNRVFCDTMNSLTLPSEVNLCNV- DIFNPKYDCKIM- TSKTDVSSSVITSLGAIVSCYGKTKCTASNKNRGIIKTFSNGCDYVSNKGVD TVSVGNTLYYVNKQEGKSLYVKGEPIINFYDPLVFPSDEFDASIS-
QVNEKINQSLAFIRKSDELLHNVNAGKSTTN SEQID NO: 11 Sequência de aminoácidos de um ligante flexível Gly-Gly-Gly-Ser-Gly-Gly-Gly SEQID NO: 12 Sequência de aminoácidos de um ligante flexível Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly

Claims (25)

REIVINDICAÇÕES
1. Vetor adenoviral símio, caracterizado pelo de que compre- ende dois cassetes de expressão, em que cada cassete de expressão compreende um transgene e um promotor, e em que o primeiro cassete de expressão é inserido na região E1 do vetor adenoviral símio e o se- gundo cassete de expressão é inserido em uma região do vetor adeno- viral compatível com a replicação do vetor.
2. Vetor adenoviral símio, caracterizado pelo de que compre- ende dois cassetes de expressão, em que cada cassete de expressão compreende um transgene e um promotor, e em que o primeiro cassete de expressão é inserido na região E1 do vetor adenoviral símio e o se- gundo cassete de expressão é inserido na região E3, entre os códons de parada de L5 e E4 (a região “HE1”) ou entre o final da ITR e o sítio de terminação do mRNA de E4 (a região “HE2”) do vetor adenoviral sí- mio.
3. Vetor adenoviral símio, de acordo com a reivindicação 2, caracterizado pelo fato de que o segundo cassete de expressão é inse- rido na região E3 do vetor adenoviral símio.
4. Vetor adenoviral símio, de acordo com a reivindicação 2, caracterizado pelo fato de que o segundo cassete de expressão é inse- rido na região HE1 do vetor adenoviral símio.
5. Vetor adenoviral símio, de acordo com a reivindicação 2, caracterizado pelo fato de que o segundo cassete de expressão é inse- rido na região HE2 do vetor adenoviral símio.
6. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o vetor é um vetor adenoviral de chimpanzé.
7. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o vetor é um adenovírus.
8. Vetor adenoviral símio, de acordo com a reivindicação 7, caracterizado pelo fato de que o vetor é ChAd155.
9. Vetor adenoviral símio, de acordo com a reivindicação 7, caracterizado pelo fato de que o vetor é ChAd83.
10. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o primeiro cassete de expressão compreende um CMV humano ou um promotor de CMV humano aprimorado.
11. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o segundo cassete de expressão compreende um CMV humano ou um promotor de CMV humano aprimorado.
12. Vetor adenoviral símio, de acordo com a reivindicação 10 ou 11, caracterizado pelo fato de que o promotor de hoMV aprimorado tem uma sequência de ácidos nucleicos tendo pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% de identidade de sequência com a SEQ ID NO: 6.
13. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações 10 a 12, caracterizado pelo fato de que o promotor com- preende ou consiste em uma sequência de ácidos nucleicos da SEQ ID NO: 6.
14. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o primeiro e o segundo cassete de expressão compreendem promotores diferentes.
15. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o vetor ade- noviral é capaz de infectar uma célula de mamífero.
16. Vetor adenoviral símio, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que o primeiro e/ou o segundo cassete de expressão compreendem ainda um ele- mento regulador pós-transcricional.
17. Vetor adenoviral símio, de acordo com a reivindicação 16, caracterizado pelo fato de que o elemento regulador pós-transcrici- onal é um Elemento Regulador Pós-transcricional de Hepatite da Mar- mota.
18. Composição, caracterizada pelo fato de que compreende um vetor adenoviral símio como definido em qualquer uma das reivindi- cações precedentes e um excipiente farmaceuticamente aceitável.
19. Vetor ou composição adenoviral símia, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que é para uso como medicamento.
20. Vetor ou composição adenoviral símia, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que é para uso como vacina.
21. Vetor ou composição adenoviral símia, de acordo com qualquer uma das reivindicações precedentes, caracterizado pelo fato de que é para terapia ou profilaxia de uma doença.
22. Método para induzir uma resposta imune em um indiví- duo, caracterizado pelo de que compreende a administração do vetor ou composição adenoviral símia como definido em qualquer uma das reivindicações precedentes ao indivíduo.
23. Uso de um vetor, como definido em qualquer uma das reivindicações 1 a 17, ou uma composição, como definida na reivindica- ção 18, caracterizado pelo fato de que é para o preparo de um medica- mento ou uma vacina para terapia ou profilaxia de uma doença.
24. Uso de um vetor, como definido em qualquer uma das reivindicações 1 a 17, ou uma composição, como definida na reivindica- ção 18, caracterizado pelo fato de que é para o preparo de um medica- mento ou uma vacina para induzir uma resposta imune em um indivíduo.
25. Invenção, caracterizada em quaisquer formas de suas concretizações ou em qualquer categoria aplicável de reivindicação, por exemplo, produto ou processo ou uso, ou qualquer outro tipo de reivin- dicação englobada pela matéria inicialmente descrita, revelada ou ilustrada no pedido de patente.
BR112020007413-6A 2017-10-16 2018-10-16 Vetores adenovirais com dois cassetes de expressão BR112020007413A2 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762572944P 2017-10-16 2017-10-16
US62/572,944 2017-10-16
PCT/EP2018/078210 WO2019076880A1 (en) 2017-10-16 2018-10-16 SIMIENS ADENOVIRAL VECTORS COMPRISING TWO EXPRESSION CASSETTES

Publications (1)

Publication Number Publication Date
BR112020007413A2 true BR112020007413A2 (pt) 2020-12-08

Family

ID=63896161

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020007413-6A BR112020007413A2 (pt) 2017-10-16 2018-10-16 Vetores adenovirais com dois cassetes de expressão

Country Status (9)

Country Link
US (2) US20200299651A1 (pt)
EP (1) EP3697918A1 (pt)
JP (1) JP2021500880A (pt)
CN (1) CN111479926A (pt)
AR (1) AR114989A1 (pt)
BR (1) BR112020007413A2 (pt)
CA (1) CA3084346A1 (pt)
MX (1) MX2020003746A (pt)
WO (1) WO2019076880A1 (pt)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220047277A (ko) 2019-07-16 2022-04-15 길리애드 사이언시즈, 인코포레이티드 Hiv 백신, 및 이의 제조 및 사용 방법
CN117843811A (zh) 2019-09-30 2024-04-09 吉利德科学公司 Hbv疫苗和治疗hbv的方法
WO2024015741A1 (en) 2022-07-12 2024-01-18 Gilead Sciences, Inc. Hiv immunogenic polypeptides and vaccines and uses thereof

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040136963A1 (en) * 2001-06-22 2004-07-15 The Trustees Of The University Of Pennsylvania Simian adenovirus vectors and methods of use
JP5690038B2 (ja) * 2004-04-28 2015-03-25 ザ・トラステイーズ・オブ・ザ・ユニバーシテイ・オブ・ペンシルベニア 多価ウイルスベクターおよびその作製のためのシステム
US20100203071A1 (en) 2007-03-21 2010-08-12 Norman Blais Chimeric antigens
EP3544196B1 (en) 2008-09-27 2023-09-13 WiTricity Corporation Wireless energy transfer systems
ES2898235T3 (es) 2009-02-02 2022-03-04 Glaxosmithkline Biologicals Sa Secuencias de aminoácidos y de ácidos nucleicos de adenovirus de simio, vectores que las contienen, y sus usos
WO2012021730A2 (en) * 2010-08-11 2012-02-16 Genvec, Inc. Respiratory syncytial virus (rsv) vaccine
WO2012089231A1 (en) 2010-12-30 2012-07-05 Okairòs Ag Paramyxovirus vaccines
WO2012115980A1 (en) 2011-02-22 2012-08-30 California Institute Of Technology Delivery of proteins using adeno-associated virus (aav) vectors
WO2013052859A2 (en) * 2011-10-05 2013-04-11 Genvec, Inc. Adenoviral vector-based respiratory syncytial virus (rsv) vaccine
EP3154576A1 (en) * 2014-06-13 2017-04-19 GlaxoSmithKline Biologicals S.A. Immunogenic combinations
CA2988654A1 (en) 2015-06-12 2016-12-15 Glaxosmithkline Biologicals S.A. Adenovirus polynucleotides and polypeptides
GB201513176D0 (en) * 2015-07-27 2015-09-09 Glaxosmithkline Biolog Sa Novel methods for inducing an immune response
EP3518966A1 (en) 2016-09-29 2019-08-07 GlaxoSmithKline Biologicals S.A. Compositions and methods of treatment of persistent hpv infection

Also Published As

Publication number Publication date
WO2019076880A1 (en) 2019-04-25
AR114989A1 (es) 2020-11-18
CA3084346A1 (en) 2019-04-25
US20240093161A1 (en) 2024-03-21
CN111479926A (zh) 2020-07-31
US20200299651A1 (en) 2020-09-24
EP3697918A1 (en) 2020-08-26
JP2021500880A (ja) 2021-01-14
MX2020003746A (es) 2020-11-06

Similar Documents

Publication Publication Date Title
US20230158134A1 (en) Chimpanzee adenovirus constructs with lyssavirus antigens
JP6230527B2 (ja) サルアデノウイルス及び雑種アデノウイルスベクター
AU2019271972A1 (en) Adenovirus polynucleotides and polypeptides
ES2697903T3 (es) Vacunas terapéuticas contra el VPH16
US20240093161A1 (en) Simian adenoviral vectors with two expression cassettes
US11268108B2 (en) Replication competent adenoviral vectors
US11859199B2 (en) Adenoviral vectors with two expression cassettes encoding RSV antigenic proteins or fragments thereof
KR20170068410A (ko) 엔테로바이러스 감염증에 대항하는 아데노바이러스 벡터-기반 백신
BR112020024285A2 (pt) polinucleotídeos e polipeptídeos de adenovírus
JP7240390B2 (ja) 増強されたプロモーター
EA039001B1 (ru) Аденовирусные полинуклеотиды и полипептиды

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 5A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: REFERENTE AO DESPACHO 8.6 PUBLICADO NA RPI 2744 DE 08/08/2023.