BR112020007042A2 - promotor intensificado - Google Patents

promotor intensificado Download PDF

Info

Publication number
BR112020007042A2
BR112020007042A2 BR112020007042-4A BR112020007042A BR112020007042A2 BR 112020007042 A2 BR112020007042 A2 BR 112020007042A2 BR 112020007042 A BR112020007042 A BR 112020007042A BR 112020007042 A2 BR112020007042 A2 BR 112020007042A2
Authority
BR
Brazil
Prior art keywords
promoter
sequence
seq
expression cassette
adenoviral
Prior art date
Application number
BR112020007042-4A
Other languages
English (en)
Inventor
Stefano Colloca
Original Assignee
Glaxosmithkline Biologicals S.A.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glaxosmithkline Biologicals S.A. filed Critical Glaxosmithkline Biologicals S.A.
Publication of BR112020007042A2 publication Critical patent/BR112020007042A2/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/155Paramyxoviridae, e.g. parainfluenza virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10321Viruses as such, e.g. new isolates, mutants or their genomic sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10334Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/001Vector systems having a special element relevant for transcription controllable enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/44Vectors comprising a special translation-regulating system being a specific part of the splice mechanism, e.g. donor, acceptor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pulmonology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

A presente invenção refere-se a um novo promotor compreendendo: (i) uma sequência de intensificador de hCMV; (ii) uma sequência de promotor de hCMV; (iii) uma região de doador de splice; (iv) uma sequência de intensificador derivado de célula; e (v) uma região de aceitador de splice.

Description

Relatório Descritivo da Patente de Invenção para: “PRO- MOTOR INTENSIFICADO”.
CAMPO DA INVENÇÃO
[0001] Esta invenção está no campo de promotores para uso em vetores como plasmídeos ou vírus, particularmente vetores virais, co- mo vetores adenovirais. Em particular, a presente invenção é direcio- nada a um promotor de CMV humano intensificado.
FUNDAMENTOS DA INVENÇÃO
[0002] O termo "vetor" refere-se a um agente (como um plasmídeo ou vírus) que contém ou transporta material genético e pode ser usado para introduzir genes exógenos em um organismo. Um vetor adenovi- ral é um exemplo de um tipo de vetor.
[0003] Quando um vetor entrega o material genético às células de um organismo, o RNA pode ser transcrito a partir do DNA entregue usando uma RNA polimerase. Uma RNA polimerase pode reconhecer elementos promotores específicos, permitindo a transcrição da se- quência de DNA ligada a esse elemento promotor.
[0004] Um promotor é uma sequência nucleotídica que permite a ligação da RNA polimerase e direciona a transcrição do DNA. Tipica- mente, um promotor está localizado em uma região não codificante do DNA, proximal ao sítio de início da transcrição. Os elementos de se- quência dentro dos promotores que funcionam no início da transcrição são frequentemente caracterizados por sequências de nucleotídeos de consenso.
[0005] Diz-se frequentemente que os vetores compreendem uma "cassete de expressão". A cassete de expressão compreende o mate- rial genético de interesse operacionalmente ligado a componentes re- guladores de uma maneira que permite a transcrição, tradução e/ou expressão de transgene do DNA de interesse na célula hospedeira. O promotor é um desses componentes regulatórios. Se a sequência de
DNA de interesse (por exemplo, um gene) for heteróloga às sequên- cias de vetores que flanqueiam o gene, ela pode ser referida como "transgene".
[0006] Exemplos de promotores incluem, mas não estão limitados a, promotores de bactérias, leveduras, plantas, vírus e mamíferos, in- cluindo símios e humanos. Um grande número de sequências de con- trole de expressão, incluindo promotores internos, nativos, constituti- vos, induzíveis e/ou específicos de tecido, são conhecidos na técnica.
[0007] Exemplos de promotores disponíveis incluem, sem limita- ção, o promotor TBG, o promotor LTR do vírus retroviral do sarcoma de Rous (opcionalmente com o intensificador), o promotor do citome- galovírus (CMV) (opcionalmente com o intensificador do CMV, consul- te, por exemplo, Boshart et al., Cell, 41:521-530 (1985)), o promotor de CASI, o promotor SV40, o promotor de di-hidrofolato redutase, o pro- motor de β-actina, o promotor de fosfoglicerol quinase (PGK) e o pro- motor EF1a (Invitrogen).
[0008] O promotor de CMV é forte e onipresentemente ativo. Tem a capacidade de incitar altos níveis de expressão de transgene em muitos tipos de tecidos e é bem conhecido na técnica.
[0009] O promotor de CASI é um promotor sintético descrito como uma combinação do intensificador de CMV, o promotor de beta-actina de frango e um doador de splice e um aceitador de splice que flan- queiam o intensificador de ubiquitina (UBC) (US 8865881). SEQ ID NO: 2 é uma sequência polinucleotídica que codifica o promotor de CASI.
[00010] Existe uma necessidade na técnica de novos promotores.
SUMÁRIO DA INVENÇÃO
[00011] A invenção refere-se a um novo promotor. Mais particular- mente, a invenção refere-se a um novo promotor de CMV humano.
[00012] A presente invenção provê um promotor que compreende:
(i) uma sequência de intensificador de hCMV; (ii) uma sequência de promotor de hCMV; (ii) uma região de doador de splice; (iv) uma sequência de intensificador derivado de célula; e (v) uma região de aceitador de splice
[00013] O termo "derivado de célula" significa que o promotor é ob- tido a partir de uma célula eucariótica (por exemplo, humana).
[00014] Em uma modalidade preferida, a sequência de intensifica- dor derivado de célula é uma sequência de intensificador de ubiquitina (UBC).
[00015] Em outra modalidade preferida, os componentes (i) a (v) do promotor são fornecidos na ordem listada acima, ou seja, o componen- te (i) é o primeiro, (ii) é o segundo, (iii) é o terceiro, (iv) é o quarto e (v) é o quinto. Em outra modalidade, a ordem dos dois intensificadores (isto é, componentes (i) e (iv)) pode ser trocada.
[00016] Em uma modalidade, o promotor compreende uma ou mais das seguintes sequências: (i) o intensificador de hCMV; e (ii) as sequências de promotor de hCMV; da SEQ ID NO: 8; e/ou (iii) a região de doador de splice da SEQ ID NO: 10; e/ou (iv) a sequência de intensificador de UBC da SEQ ID NO:11; e/ou (v) a região de aceitador de splice da SEQ ID NO: 12
[00017] Em algumas modalidades, o promotor compreende pelo menos cerca de 50%, pelo menos cerca de 60%, pelo menos cerca de 70%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo me- nos cerca de 90%, pelo menos cerca de 95%, em pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou mais, de identidade de sequência à SEQ ID
NO: 8, SEQ ID NO:10, SEQ ID NO:11 e/ou SEQ ID NO:12. Em algu- mas modalidades, as partes (i) a (v) do promotor consistem na se- quência relevante.
[00018] Em uma modalidade, o promotor compreende: (i) o intensificador de hCMV; e (ii) as sequências de promotor de hCMV; da SEQ ID NO: 8; e (iii) a região de doador de splice da SEQ ID NO:10; (iv) a sequência de intensificador de UBC da SEQ ID NO:11; e (v) a região de aceitador de splice da SEQ ID NO: 12
[00019] Em uma modalidade, o promotor compreende adicional- mente: (vi) um fragmento da sequência de beta-actina
[00020] Nesta modalidade, compreendendo um fragmento da se- quência de beta-actina, o fragmento da sequência de beta-actina de frango compreende preferencialmente uma região não traduzida em 5' da sequência de beta-actina de frango e não contém a sequência de promotor. Em uma modalidade, a sequência de beta-actina de frango pode ter pelo menos cerca de 50%, pelo menos cerca de 60%, pelo menos cerca de 70%, pelo menos cerca de 80%, pelo menos cerca de 85%, pelo menos cerca de 90%, pelo menos cerca de 95%, em pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99% ou mais, identidade de sequência à SEQ ID NO: 9. Em uma modalidade compreendendo (vi) um fragmen- to da sequência de beta-actina, este fragmento é preferencialmente encontrado entre a região de promotor de hCMV (ii) e a região de doa- dor de splice (iii).
[00021] Em outro aspecto, a presente invenção refere-se a um novo promotor tendo pelo menos cerca de 84,1% ou mais de identidade à SEQ ID NO: 3. Em algumas modalidades, o promotor pode incluir uma sequência de ácido nucleico com pelo menos cerca de 84,5%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89%, ou mais, de identidade de sequência à SEQ ID NO: 3.
[00022] Em algumas modalidades, o promotor pode incluir uma se- quência de ácido nucleico com pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo menos cerca de 99%, ou mais, de identidade de sequência à SEQ ID NO: 3. Em algumas modalidades, o promotor compreende ou consiste em uma sequência de ácido nuclei- co de SEQ ID NO: 3.
[00023] Em outro aspecto, a invenção refere-se a um vetor, como um vetor adenoviral ou um plasmídeo, contendo o novo promotor des- crito acima. Todas as características descritas acima em relação ao promotor podem ser incorporadas no vetor. Por exemplo, em uma mo- dalidade, a invenção fornece um vetor adenoviral da invenção, o vetor adenoviral compreende uma cassete de expressão, em que a cassete de expressão compreende um transgene e um promotor, em que o promotor compreende: (i) uma sequência de intensificador de hCMV; (ii) uma sequência de promotor de hCMV; (iii) uma região de doador de splice; (iv) uma sequência de intensificador derivado de célula; e (v) uma região de aceitador de splice.
[00024] Outro exemplo de um vetor da invenção é um vetor adeno- viral compreendendo uma cassete de expressão, em que a cassete de expressão compreende um transgene e um promotor, em que o pro- motor compreende uma sequência de ácido nucleico com pelo menos 84,1% de identidade à SEQ ID NO: 3.
[00025] Em um exemplo adicional, um vetor (por exemplo, um vetor adenoviral) compreende uma primeira e uma segunda cassete de ex-
pressão, em que cada cassete de expressão compreende um transge- ne e um promotor, em que o promotor da primeira cassete de expres- são e/ou da segunda cassete de expressão é o novo promotor descrito acima. Em uma modalidade, a primeira cassete de expressão compre- ende o promotor. Em outra modalidade, a segunda cassete de expres- são compreende o promotor.
[00026] Por exemplo, em uma modalidade, um vetor adenoviral da invenção compreende uma primeira e uma segunda cassete de ex- pressão, em que cada cassete de expressão compreende um transge- ne e um promotor, em que o promotor da primeira cassete de expres- são e/ou da segunda cassete de expressão é um promotor compreen- dendo: (i) uma sequência de intensificador de hCMV; (ii) uma sequência de promotor de hCMV; (iii) uma região de doador de splice; (iv) uma sequência derivada de células; e (v) uma região de aceitador de splice.
[00027] Em um exemplo adicional, um vetor adenoviral compreende uma primeira e uma segunda cassete de expressão, em que cada cassete de expressão compreende um transgene e um promotor, em que o promotor da primeira cassete de expressão e/ou da segunda cassete de expressão é um promotor que tem pelo menos 84,1 % de identidade à SEQ ID NO: 3.
[00028] Os vetores (por exemplo, vetores adenovirais) da invenção são úteis como componentes de composições imunogênicas para a indução de uma resposta imune em um indivíduo, métodos para seu uso no tratamento e processos para fabricação. O vetor adenoviral da presente invenção é preferencialmente derivado de um adenovírus sí- mio não humano, também conhecido como "adenovírus símio". Prefe- rencialmente, o vetor adenoviral símio da presente invenção é um adenovírus de chimpanzé (por exemplo ChAd155 ou ChAd83).
[00029] A presente invenção também provê uma composição com- preendendo o vetor adenoviral acima mencionado e um excipiente farmaceuticamente aceitável. Além disso, a presente invenção fornece o vetor ou composição adenoviral acima mencionado compreendendo esse vetor adenoviral para uso como medicamento, vacina e/ou para terapia ou profilaxia de uma doença.
[00030] A invenção também fornece um método para induzir uma resposta imune em um indivíduo compreendendo a administração do vetor ou composição adenoviral acima mencionado descrito acima ao indivíduo. Um vetor ou composição da invenção pode ser usado na fabricação de um medicamento para a prevenção ou tratamento de uma doença.
DESCRIÇÃO DAS FIGURAS
[00031] FIG. 1: Um construto adenoviral símio de acordo com a in- venção com uma cassete de expressão dupla. Repetições terminais invertidas (ITR) flanqueiam as extremidades 3’ e 5'; o CMV humano (hCMV) é o promotor do citomegalovírus; o hCMV intensificado é o promotor de citomegalovírus intensificado; N-M2-1 e FΔTM são os an- tígenos do RSV; WPRE é o elemento regulador pós-transcricional do vírus da hepatite da marmota; ∆E3 indica que o gene 3 precoce é ex- cluído; fibra indica o gene adenoviral que codifica a proteína da fibra; e Ad5E4orf6 em um substituto na região do gene 4 precoce (E4).
[00032] O vetor da FIG. 1 foi construído inserindo uma primeira cassete de expressão de transgene no lugar da região E1 do genoma adenoviral e uma segunda cassete de expressão de transgene na re- gião HE2, isto é, a jusante da ITR direita.
[00033] FIG. 2: Comparação dos níveis de expressão de vetores que expressam o transgene F∆TM em uma linha celular MRC5, de- monstrada por western blot 48 horas e 96 horas após a infecção em condições não redutoras. As células foram infectadas em multiplicida- des de infecção de 500 e 1250.
[00034] FIG. 3: Comparação dos níveis de expressão de vetores que expressam o transgene NM2-1 em uma linha celular de MRC5, demonstrada por western blot 48 horas após a infecção em condições redutoras. As células foram infectadas em multiplicidades de infecção de 250 e 1250.
[00035] FIG. 4: Comparação da imunogenicidade dos vetores de ChAd155 que expressam o antígeno de RSV F∆Tm. Os dados foram coletados 4 semanas e 8 semanas após a vacinação com uma dose de 5x108 partículas de vírus.
[00036] FIG. 5: Comparação da imunogenicidade dos vetores de ChAd155 que expressam o antígeno de RSV M2. Os dados foram co- letados 3 semanas após a vacinação com uma dose de 107 ou 106 partículas de vírus.
[00037] FIG. 6: Expressão de SeAP em células MRC5 por ChAd155 com diferentes promotores.
[00038] FIG.7: Expressão de SeAP em células HeLa por ChAd155 com diferentes promotores.
ANOTAÇÃO DAS SEQUÊNCIAS
[00039] SEQ ID NO: 1 - Sequência de polinucleotídeos que codifica ChAd155 de tipo selvagem
[00040] SEQ ID NO: 2 - Sequência polinucleotídica que codifica o promotor CASI
[00041] SEQ ID NO: 3 - Sequência polinucleotídica que codifica o promotor de hCMV intensificado
[00042] SEQ ID NO: 4 - Sequência polinucleotídica que codifica a cassete de hCMV NM2 bghpolyA
[00043] SEQ ID NO: 5 – Sequência de proteína NM2
[00044] SEQ ID NO: 6 - Sequência polinucleotídica que codifica a cassete de hCMV F0 WPRE bghpolyA
[00045] SEQ ID NO: 7 – Sequência de proteína F0
[00046] SEQ ID NO: 8 - Sequência polinucleotídica que codifica a sequência de promotor e de intensificador de hCMV (nucleotídeos 1- 650 da SEQ ID NO: 3).
[00047] SEQ ID NO: 9 - Sequência polinucleotídica que codifica um fragmento de beta-actina de frango (nucleotídeos 651-809 da SEQ ID NO: 3).
[00048] SEQ ID NO: 10 - Sequência polinucleotídica que codifica a região de doador de splice (nucleotídeos 810-824 da SEQ ID NO: 3).
[00049] SEQ ID NO: 11 - Sequência polinucleotídica que codifica o intensificador de ubiquitina (UBC) (nucleotídeos 825-1127 da SEQ ID NO: 3).
[00050] SEQ ID NO: 12 - Sequência polinucleotídica que codifica a região de aceitador de splice (nucleotídeos 1128-1187 da SEQ ID NO: 3).
DESCRIÇÃO DETALHADA DA INVENÇÃO Adenovírus
[00051] Os adenovírus são vírus icosaédricos não envelopados com um genoma de DNA de fita dupla linear de aproximadamente 36 kb. Os adenovírus podem transduzir vários tipos de células de várias espécies de mamíferos, incluindo células que se dividem e que não se dividem, sem se integrar no genoma da célula hospedeira. Eles têm sido amplamente utilizados para aplicações de transferência de genes devido à sua segurança comprovada, capacidade de obter transferên- cia de genes altamente eficiente em uma variedade de tecidos alvo e grande capacidade de transgene. Atualmente, os vetores adenovirais humanos são usados em terapia gênica e vacinas, mas têm a desvan- tagem de uma alta prevalência mundial de imunidade pré-existente, após exposição prévia a adenovírus humanos comuns.
[00052] Os adenovírus têm uma morfologia característica com um capsídeo icosaédrico compreendendo três proteínas principais, hexon (II), base de penton (III) e uma fibra nodosa (“knobbed”) (IV), junta- mente com várias outras proteínas menores, VI, VIII, IX, IlIa e IVa2. O hexon é responsável pela maioria dos componentes estruturais do capsídeo, que consiste em 240 capsômeros de hexon triméricos e 12 bases penton. O hexon possui três barris duplos conservados e o topo tem três torres, cada torre contendo uma alça de cada subunidade que forma a maior parte do capsídeo. A base do hexon é altamente con- servada entre os serótipos adenovirais, enquanto as laças de superfí- cie são variáveis. O penton é outra proteína do capsídeo adenoviral; ele forma uma base pentamérica à qual a fibra se liga. A proteína da fibra trimérica se projeta da base de penton em cada um dos 12 vérti- ces do capsídeo e é uma estrutura em forma de bastão nodosa. O pa- pel principal da proteína da fibra é fixar o capsídeo viral na superfície celular através da interação da região globular com um receptor celu- lar. Variações no eixo flexível, bem como nas regiões globulares das fibras, são características dos diferentes serótipos adenovIrais.
[00053] O genoma adenoviral foi bem caracterizado. O DNA de du- pla fita linear está associado à proteína VII altamente básica e a um pequeno peptídeo pX (também denominado mu). Outra proteína, V, é empacotada com este complexo de DNA-proteína e fornece uma liga- ção estrutural ao capsídeo através da proteína VI. Existe uma conser- vação geral na organização geral do genoma adenoviral em relação a quadros de leitura abertos específicos posicionados de maneira seme- lhante, por exemplo, a localização dos genes E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 e L5 de cada vírus. Cada extremidade do genoma adenoviral compreende uma sequência conhecida como repetição terminal invertida (ITR), necessária para a replicação viral. A extremi- dade 5’ do genoma adenoviral contém os elementos cis 5' necessários para o empacotamento e replicação; isto é, as sequências ITR 5’ (que podem funcionar como origens da replicação) e os domínios intensifi- cadores de empacotamento 5' nativos, que contêm sequências neces- sárias para empacotar genomas adenovirais lineares e elementos in- tensificadores para o promotor E1. A extremidade 3’ do genoma ade- noviral inclui elementos cis 3', incluindo os ITRs, necessários para o empacotamento e encapsidação. O vírus também compreende uma protease codificada por vírus, necessária para processar algumas das proteínas estruturais necessárias para produzir vírions infecciosos.
[00054] A estrutura do genoma adenoviral é descrita com base na ordem em que os genes virais são expressos após a transdução das células hospedeiras. Mais especificamente, os genes virais são referi- dos como genes precoces (E) ou tardios (L), de acordo com se a transcrição ocorre antes ou após o início da replicação do DNA. Na fase inicial da transdução, os genes E1A, E1B, E2A, E2B, E3 e E4 do adenovírus são expressos para preparar a célula hospedeira para re- plicação viral. O gene E1 é considerado um interruptor principal, atua como um ativador da transcrição e está envolvido na transcrição do gene tardio ou precoce. E2 está envolvido na replicação do DNA; E3 está envolvido na modulação imune e E4 regula o metabolismo do mRNA viral. Durante a fase tardia da infecção, a expressão dos genes tardios L1-L5, que codificam os componentes estruturais das partícu- las virais, é ativada. Os genes tardios são transcritos do promotor tar- dio principal (MLP) com splicing alternativo.
[00055] Os sítios HE1 e HE2 foram identificados como sítios de in- serção potenciais para um transgene, pois a inserção nesses pontos específicos não interrompe as sequências de codificação ou sequên- cias reguladoras importantes de um adenovírus de chimpanzé, como um adenovírus de chimpanzé Tipo C ou E, por exemplo, ChAd155 e ChAd83. Os sítios HE1 e HE2 podem ser identificados por alinhamen-
to de sequência em qualquer adenovírus de chimpanzé. Portanto, a clonagem de cassetes de expressão nos sítios HE1 e HE2 dos geno- mas ChAd não afeta o ciclo de replicação do vírus. Replicação adenoviral
[00056] Historicamente, o desenvolvimento da vacina contra ade- novírus se concentrou em vetores defeituosos e não replicantes. Eles são tornados defeituosos na replicação por exclusão dos genes da re- gião E1, que são essenciais para a replicação. Normalmente, os genes da região E3 não essenciais também são excluídos para abrir espaço para transgenes exógenos. Uma cassete de expressão compreenden- do o transgene sob o controle de um promotor exógeno é então inseri- da. Esses vírus defeituosos na replicação são então produzidos em células que complementam a E1.
[00057] O termo adenovírus "defeituoso na replicação" ou "incom- petente na replicação" refere-se a um adenovírus que é incapaz de replicação porque foi projetado para compreender pelo menos uma exclusão funcional (ou mutação de "perda de função"), ou seja, uma exclusão ou mutação que prejudique a função de um gene sem remo- vê-lo completamente, por exemplo introdução de códons de parada artificiais, exclusão ou mutação de sítios ativos ou domínios de intera- ção, mutação ou exclusão de uma sequência reguladora de um gene etc., ou uma remoção completa de um gene que codifica um produto genético essencial para a replicação viral, como um ou mais dos ge- nes adenovirais selecionados de E1A, E1B, E2A, E2B, E3 e E4 (tal como E3 ORF1, E3 ORF2, E3 ORF3, E3 ORF4, E3 ORF5, E3 ORF6, E3 ORF7, E3 ORF8, E3 ORF9, E4 ORF7, E4 ORF6, E4 ORF4, E4 ORF3, E4 ORF2 e/ou E4 ORF1). Adequadamente, E1 e opcionalmen- te E3 e/ou E4 são excluídos. Se excluída, a região do gene excluída mencionada acima não será adequadamente considerada no alinha- mento ao determinar a porcentagem de identidade em relação a outra sequência.
[00058] Em algumas modalidades da invenção, o vetor adenoviral é um adenovírus defeituoso na replicação. Por exemplo, nas modalida- des de um vetor adenoviral com duas cassetes de expressão, a pri- meira cassete de expressão é inserida na região E1 excluída e, por- tanto, esses adenovírus apresentam defeito de replicação.
[00059] Em outras modalidades, o vetor adenoviral é um adenoví- rus competente na replicação. O termo adenovírus "competente na replicação" refere-se a um adenovírus que pode se replicar em uma célula hospedeira na ausência de quaisquer proteínas auxiliares re- combinantes compreendidas na célula. Adequadamente, um adenoví- rus "competente na replicação" compreende genes estruturais intactos e os seguintes genes precoce intactos ou funcionalmente essenciais: E1A, E1B, E2A, E2B e E4. Os adenovírus do tipo selvagem isolados a partir de um animal em particular serão competentes para replicação nesse animal. Vetores da invenção
[00060] Os vetores virais baseados em adenovírus símios não hu- manos representam uma alternativa ao uso de vetores derivados hu- manos para terapia gênica e vacinas genéticas. Certos adenovírus iso- lados de símios não humanos estão intimamente relacionados aos adenovírus isolados de humanos, como demonstrado por sua propa- gação eficiente em células de origem humana. Como os humanos normalmente não desenvolvem imunidade aos adenovírus símios, eles prometem fornecer uma alternativa melhorada aos usos adenovirais humanos.
[00061] "Baixa seroprevalência" pode significar ter um nível de anti- corpo neutralizante pré-existente reduzido em comparação com o adenovírus humano 5 (Ad5). Da mesma forma ou alternativamente, "baixa seroprevalência" pode significar menos de cerca de 40% de se-
roprevalência, menos de cerca de 30% de seroprevalência, menos de cerca de 20% de seroprevalência, menos de cerca de 15% de sero- prevalência, menos de cerca de 10% de seroprevalência, menos de cerca de 5% seroprevalência, menos de cerca de 4% de seropreva- lência, menos de cerca de 3% de seroprevalência, menos de cerca de 2% de seroprevalência, menos de cerca de 1% de seroprevalência ou nenhuma seroprevalência detectável. A soroprevalência pode ser me- dida como a porcentagem de indivíduos com um título de neutraliza- ção clinicamente relevante (definido como um título de neutralização de 50% > 200) usando os métodos descritos em Hum. Gene Ther. (2004) 15:293.
[00062] Em uma modalidade, o vetor adenoviral da presente inven- ção é derivado de um adenovírus símio não humano, também conhe- cido como "adenovírus símio". Vários adenovírus foram isolados de símios não humanos, como chimpanzés, bonobos, macacos rhesus, orangotangos e gorilas. Os vetores derivados desses adenovírus po- dem induzir fortes respostas imunes aos transgenes codificados por esses vetores. Certas vantagens de vetores baseados em adenovírus símios não humanos incluem uma relativa falta de anticorpos neutrali- zantes cruzados para esses adenovírus na população alvo humana, portanto, seu uso supera a imunidade pré-existente aos adenovírus humanos. Por exemplo, alguns adenovírus símios não têm reatividade cruzada com anticorpos neutralizantes humanos pré-existentes e a reação cruzada de certos adenovírus de chimpanzés com anticorpos neutralizantes humanos pré-existentes está presente apenas em 2% da população alvo, em comparação a 35% no caso de certos vetores de adenovírus humanos candidatos (Sci. Transl. Med. (2012) 4:1).
[00063] Os vetores adenovirais da invenção podem ser derivados de um adenovírus não humano, como um adenovírus símio, por exemplo, de chimpanzés (Pan troglodytes), bonobos (Pan paniscus),
gorilas (Gorilla gorilla) e orangotangos (Pongo abelii e Pongo pyg- naeus). Eles incluem adenovírus do Grupo B, Grupo C, Grupo D, Gru- po E e Grupo G. Os adenovírus dos chimpanzés incluem, mas não es- tão limitados a, ChAd3, ChAd19, ChAd25.2, ChAd26, ChAd27, ChAd29, ChAd30, ChAd31, ChAd32, ChAd33, ChAd34, ChAd35, ChAd37, ChAd38, ChAd39, ChAd40, ChAd63, ChAd83, ChAd155, ChAd15, SadV41 e ChAd157. Alternativamente, os vetores adenovi- rais podem ser derivados de adenovírus símios não humanos isolados de bonobos, como PanAd1, PanAd2, PanAd3, Pan 5, Pan 6, Pan 7 (também conhecido como C7) e Pan 9. Os vetores podem incluir, no todo ou em parte, um nucleotídeo que codifica a fibra, penton ou he- xon de um adenovírus não humano.
[00064] Em uma modalidade dos vetores adenovirais da invenção, o vetor adenoviral tem uma seroprevalência inferior a 40%, inferior a 30%, inferior a 20%, inferior a 10% ou inferior a 5% em indivíduos hu- manos, preferencialmente nenhuma seroprevalência em indivíduos humanos e, mais preferencialmente, nenhuma seroprevalência em in- divíduos humanos que não haviam estado anteriormente em contato com um adenovírus de chimpanzé.
[00065] Em modalidades dos vetores adenovirais da invenção, o DNA adenoviral é capaz de entrar em uma célula alvo de mamífero, isto é, é infeccioso. Um vetor adenoviral recombinante infeccioso da invenção pode ser usado como uma vacina profilática ou terapêutica e para terapia gênica. Assim, em uma modalidade, o vetor adenoviral recombinante compreende uma molécula endógena para entrega em uma célula alvo. A célula alvo é uma célula de mamífero, por exemplo, uma célula bovina, uma célula canina, uma célula caprina, uma célula de cervídeo, uma célula de chimpanzé, uma célula de chiroptera, uma célula equina, uma célula felina, uma célula humana, uma célula de lobo, uma célula ovina, uma célula suína, um célula de roedor, uma célula de urso ou uma célula de raposa. A molécula endógena para entrega em uma célula alvo é uma cassete de expressão.
[00066] Em uma modalidade da invenção, o vetor compreende uma região de ITR esquerda, uma região E1 excluída, depois uma região E3 excluída e, opcionalmente, elementos intensificadores adicionais; estes são seguidos por uma região de fibra, uma região E4 e uma ITR certo. A tradução ocorre nas direções direita e esquerda. Nesta moda- lidade, a primeira cassete de expressão é inserida na região E1 exclu- ída e a segunda cassete de expressão é inserida na região E3 excluí- da. Em uma modalidade adicional, os promotores das duas cassetes de expressão são promotores de CMV. Ainda em uma modalidade adicional, o elemento intensificador é o Elemento Regulador Pós- traducional da Hepatite B (HPRE) ou o Elemento Pós-traducional da Hepatite B da Marmota (WPRE).
[00067] Em uma modalidade da invenção, o vetor compreende re- giões de ITR esquerda e direita; uma região E1 excluída; pelo menos uma região E3 parcialmente excluída; uma região de fibra; uma região E4; duas cassetes de expressão, cada uma compreendendo: um pro- motor e pelo menos um antígeno de interesse e, opcionalmente, um ou mais elementos intensificadores. A primeira cassete de expressão é inserida na região E1 excluída e a segunda cassete de expressão é inserida no sítio HE1, isto é, entre os códons de parada do gene da fibra e uma região E4 ("o sítio HE1"). O sítio de inserção de ChAd155 HE1 está entre os pb 34611 e 34612 da sequência ChAd155 do tipo selvagem. O sítio de inserção de ChAd83 HE1 está entre os pb 33535 e 33536 da sequência ChAd83 do tipo selvagem. A tradução ocorre nas direções direita e esquerda. Em uma modalidade adicional, os promotores são promotores de CMV. Em uma modalidade preferida, um promotor é um promotor de CMV e o outro é um promotor de eCMV. Ainda em uma modalidade adicional, o elemento intensificador é HPRE ou WPRE.
[00068] Em uma modalidade adicional, o vetor compreende regiões ITR esquerda e direita; uma região E1 excluída; pelo menos uma regi- ão E3 parcialmente excluída; uma região de fibra; uma região E4; duas cassetes de expressão, cada uma compreendendo: um promotor, pelo menos um antígeno de interesse e, opcionalmente, um ou mais ele- mentos intensificadores. A primeira cassete de expressão é inserida na região E1 excluída e a segunda cassete de expressão é inserida no sítio HE2, isto é, entre o final da ITR esquerda e o sítio de cap do mRNA E4 ("o sítio HE2"). O sítio de inserção de ChAd155 HE2 está entre os pb 37662 e 37663 da sequência de ChAd155 do tipo selva- gem. O sítio de inserção de ChAd83 HE2 está entre os pb 36387 e 36388 da sequência de ChAd83 do tipo selvagem. A tradução ocorre nas direções direita e esquerda. Em uma modalidade adicional, os promotores são promotores de CMV. Em uma modalidade preferida, um promotor é um promotor de CMV e o outro é um promotor de eCMV. Ainda em uma modalidade adicional, o elemento intensificador é HPRE ou WPRE (o elemento intensificador aumenta a expressão do transgene).
[00069] Os sítios HE1 e HE2 foram identificados como sítios de in- serção para um transgene, uma vez que a inserção nesses pontos es- pecíficos não interrompe as sequências de codificação ou as sequên- cias reguladoras de ChAd155 e ChAd83. Portanto, a inserção de cas- setes de expressão nos sítios HE1 ou HE2 do genoma de ChAd não afeta o ciclo de replicação viral.
[00070] Em uma modalidade da invenção, o vetor é um derivado funcional ou imunogênico de um vetor adenoviral. Por "derivado de um vetor adenoviral" entende-se uma versão modificada do vetor, por exemplo, um ou mais nucleotídeos do vetor são excluídos, inseridos, modificados ou substituídos.
Elementos reguladores adicionais
[00071] Elementos reguladores, isto é, sequências de controle de expressão, além de sequências de promotor, incluem sequências apropriadas de iniciação, terminação e intensificadora de transcrição; sinais de processamento de RNA eficientes, como sinais de splicing e poliadenilação (poli A), incluindo poliA de beta-globina de coelho; sis- temas reguláveis de tetraciclina, microRNAs, elementos reguladores pós-transcricionais, por exemplo, WPRE, elemento regulador pós- transcricional do vírus da hepatite da marmota); sequências que esta- bilizam o mRNA citoplasmático; sequências que intensificam a eficiên- cia da tradução (por exemplo, sequência de consenso de Kozak); se- quências que intensificam a estabilidade das proteínas; e quando de- sejado, sequências que intensificam a secreção de um produto codifi- cado.
[00072] Opcionalmente, vetores portando transgenes que codificam produtos terapeuticamente úteis ou imunogênicos também podem in- cluir marcadores selecionáveis ou genes repórteres. O gene repórter pode ser escolhido dentre aqueles conhecidos na técnica. Os genes repórter adequados incluem, mas não estão limitados a proteína verde fluorescente intensificada, proteína vermelha fluorescente, luciferase e fosfatase alcalina embrionária secretada (seAP), que podem incluir sequências que codificam resistência à geneticina, higromicina ou pu- rimicina, entre outras. Esses repórteres selecionáveis ou genes mar- cadores (que podem ou não estar localizados fora do genoma viral a ser empacotado em uma partícula viral) podem ser usados para sinali- zar a presença dos plasmídeos nas células bacterianas, como resis- tência à ampicilina. Outros componentes do vetor podem incluir uma origem de replicação.
[00073] Um "elemento regulador pós-transcricional", como aqui uti- lizado, é uma sequência de DNA que, quando transcrita, melhora a expressão do(s) transgene(s) ou seus fragmentos que são entregues pelos vetores virais da invenção. Os elementos reguladores pós- transcricionais incluem, mas não limitados a, o Elemento Regulador Pós-Transcricional do Vírus da Hepatite B (HPRE) e o Elemento Regu- lador Pós-transcricional da Hepatite da Marmota (WPRE). O WPRE é um elemento tripartido de ação cis que demonstrou intensificar a ex- pressão do transgene impulsionado por certos promotores, mas nem todos os promotores.
[00074] Nas modalidades da invenção, um vetor de ChAd155 pode compreender um ou mais dentre um promotor, um intensificador e um gene repórter. Por exemplo, os vetores da invenção podem compre- ender hCMV -SeAP intensificado com ChAd155 ChAd155-CASI-seAP e ChAd155-hCMV-seAP, opcionalmente com um controle transcricio- nal ativado/desativado de tetraciclina e ChAd155 -CMV-hFerL-chEF1- seAP com um controle transcricional ativado/desativado de tetraciclina.
[00075] Nas modalidades da invenção, um vetor de ChAd83 pode compreender um ou mais dentre um promotor, um intensificador e um gene repórter. Por exemplo, os vetores da invenção podem compre- ender hCMV SeAP intensificado com ChAd155, hCMV SeAP intensifi- cado com ChAd83, ChAd155-CASI-seAP e ChAd83-hCMV-seAP, op- cionalmente com um controle transcricional ativado/desativado de te- traciclina e ChAd83 –CMV-hFerL-chEF1-seAP com um controle trans- cricional ativado/desativado de tetraciclina.
[00076] Os vetores da invenção são gerados usando técnicas aqui fornecidas, em conjunto com técnicas conhecidas dos versados na técnica. Tais técnicas incluem técnicas de clonagem convencionais de cDNA, como as descritas em textos, uso de sequências oligonucleotí- dicas sobrepostas dos genomas de adenovírus, reação em cadeia da polimerase e qualquer método adequado que forneça a sequência nu- cleotídica desejada.
Transgenes
[00077] Um "transgene" é uma sequência de ácido nucleico, heteró- loga às sequências de vetores que flanqueiam o transgene, que codifi- ca um polipeptídeo de interesse. A sequência de codificação de ácido nucleico está operacionalmente ligada a componentes reguladores de uma maneira que permite a transcrição, tradução e/ou expressão de transgene em uma célula hospedeira. Nas modalidades da invenção, os vetores expressam transgenes no nível terapêutico ou profilático. Um "derivado funcional" de um polipeptídeo transgênico é uma versão modificada de um polipeptídeo, por exemplo, em que um ou mais ami- noácidos são excluídos, inseridos, modificados ou substituídos.
[00078] O transgene pode ser usado para profilaxia ou tratamento, por exemplo, como uma vacina para induzir uma resposta imune, para corrigir deficiências genéticas, corrigindo ou substituindo um gene de- feituoso ou ausente, ou como terapêutica para o câncer. Como aqui utilizado, a indução de uma resposta imune refere-se à capacidade de uma proteína para induzir uma célula T e/ou uma resposta imune de anticorpo humoral à proteína.
[00079] A resposta imune desencadeada pelo transgene pode ser uma resposta de célula B específica ao antígeno, que produz anticor- pos neutralizantes. A resposta imune desencadeada pode ser uma resposta de célula T específica ao antígeno, que pode ser uma respos- ta sistêmica e/ou local. A resposta de célula T específica do antígeno pode compreender uma resposta de célula T CD4+, tal como uma res- posta envolvendo células T CD4+ que expressam citocinas, por exem- plo interferon gama (IFN gama), fator de necrose tumoral alfa (TNF alfa) e/ou interleucina 2 (IL2). Alternativamente, ou adicionalmente, a resposta de célula T específica de antígeno compreende uma resposta de célula T CD8+, tal como uma resposta envolvendo células T CD8+ que expressam citocinas, por exemplo, IFN gama, TNN alfa, TNF alfa e/ou IL2.
[00080] A composição da sequência de transgene dependerá do uso ao qual o vetor resultante será aplicado. Em uma modalidade, o transgene é uma sequência que codifica um produto que é útil em bio- logia e medicina, como um transgene profilático, um transgene tera- pêutico ou um transgene imunogênico, por exemplo, proteína ou RNA. Os transgenes de proteínas incluem antígenos. Os transgenes antigê- nicos da invenção induzem uma resposta imunogênica a um organis- mo causador de doença.
[00081] Transgenes como antígenos do vírus da raiva, por exemplo, glicoproteína da raiva (RG), antígenos do vírus sincicial respiratório (RSV), antígenos do vírus da imunodeficiência humana (HIV) ou frag- mentos dos mesmos seriam adequados para uso com os promotores da invenção. No entanto, a invenção não está limitada ao uso com es- ses transgenes.
[00082] Como resultado da redundância no código genético, um polipeptídeo pode ser codificado por uma variedade de diferentes se- quências de ácidos nucleicos. A codificação é enviesada para usar al- guns códons sinônimos, ou seja, códons que codificam o mesmo ami- noácido, mais do que outros. Por "códon otimizado", entende-se que modificações na composição do códon de um ácido nucleico recombi- nante são feitas sem alterar a sequência de aminoácidos. A otimização de códons tem sido usada para melhorar a expressão de mRNA em diferentes organismos usando frequências de uso de códons específi- cas do organismo.
[00083] Além de, e independentemente do viés de códon , alguns pares de códons sinônimos são usados com mais frequência do que outros. Esse viés do par de códons significa que alguns pares de có- dons estão super-representados e outros estão sub-representados. A desotimização do par de códons tem sido usada para reduzir a viru-
lência viral. Por exemplo, foi relatado que os poliovírus modificados para conter pares de códons sub-representados demonstraram menor eficiência de tradução e foram atenuados em comparação com o poli- ovírus do tipo selvagem (Science (2008) 320: 1784). A manipulação de um vírus sintético atenuado por desotimização de pares de códons pode produzir vírus que codificam as mesmas sequências de aminoá- cidos do tipo selvagem, mas usam diferentes arranjos em pares de códons sinônimos. Os vírus atenuados pela desotimização do par de códons geraram até 1000 vezes menos placas em comparação com o tipo selvagem, produziram menos partículas virais e exigiram cerca de 100 vezes mais partículas virais para formar uma placa.
[00084] Em contraste, os poliovírus modificados para conter pares de códons que são super-representados no genoma humano agiram de maneira semelhante ao RNA do tipo selvagem e geraram placas idênticas em tamanho ao RNA do tipo selvagem (Coleman et al. (2008) Science 320:1784). Isso ocorreu apesar do fato de que o vírus com pares de códons super-representados continha um número seme- lhante de mutações que o vírus com pares de códons sub-repre- sentados e demonstrou tradução aprimorada em comparação com o tipo selvagem. Esta observação sugere que se espera que os constru- tos otimizados do par de códons atuem de maneira semelhante às su- as contrapartes otimizadas do par de códons e que não forneça uma vantagem funcional. Sem desejar ser limitado pela teoria, isso pode ocorrer porque a evolução natural otimizou o pareamento de códons.
[00085] Um construto da invenção pode compreender uma sequên- cia de ácido nucleico otimizada por códon. Alternativamente ou adicio- nalmente, um vetor da invenção compreende uma sequência otimiza- da por códon de um transgene ou um derivado imunogênico ou frag- mento do mesmo. Um construto da invenção pode compreender uma sequência de ácido nucleico otimizada por par de códon. Alternativa-
mente ou adicionalmente, um vetor da invenção compreende ou con- siste em uma sequência otimizada por par de códon de um transgene ou um derivado imunogênico ou fragmento do mesmo. Trangenes do Vírus Sincicial Respiratório (RSV)
[00086] A infecção pelo RSV não confere imunidade protetora total. A infecção na infância é seguida por reinfecções sintomáticas do RSV, que continuam por toda a vida adulta. Essas reinfecções geralmente não são diagnosticadas porque geralmente se apresentam como in- fecções agudas comuns do trato respiratório superior. Em pessoas mais vulneráveis (por exemplo, adultos ou idosos imunocomprometi- dos), as reinfecções também podem levar a doenças graves. Ambos os braços do sistema imunológico (imunidade humoral e celular) estão envolvidos na proteção contra doenças graves [Guvenel, 2014].
[00087] A resposta imune humoral é capaz de neutralizar o vírus e inibir a replicação viral, desempenhando, assim, um papel importante na proteção contra infecções por VSR no trato respiratório inferior e doenças graves [Piedra, 2003]. Foi demonstrado que a imunização passiva, na forma de anticorpos monoclonais neutralizadores de RSV (Synagis) de imunoglobulina G (IgG) administrados profilaticamente, previne a doença de RSV em alguma extensão em bebês prematuros e recém-nascidos com displasia broncopulmonar ou doença cardio- pulmonar subjacente [Cardenas, 2005].
[00088] As células T também estão envolvidas no controle da doen- ça por RSV. Infecções letais por RSV foram descritas em pacientes com baixa contagem de células T CD8, como no caso de imunodefici- ência combinada grave, receptores de transplante de medula óssea e pulmão [Hertz, 1989]. A histopatologia de casos fatais de infecção por RSV de recém-nascidos mostra que existe uma escassez relativa de células T CD8 no infiltrado pulmonar [Welliver, 2007]. Além disso, a presença de células T CD8 produtoras de interferon gama (IFN-γ) tem sido associada a respostas Th2 diminuídas e eosinofilia reduzida em modelos animais de RSV [Castilow, 2008; Stevens, 2009].
[00089] Antígenos adequados de RSV que são úteis como imuno- gênios para imunizar um humano ou animal não humano podem ser selecionados dentre: a proteína de fusão (F), a proteína de ligação (G), a proteína de matriz (M2) e a nucleoproteína (N). O termo "proteína F" ou "proteína de fusão" ou "polipeptídeo de proteína F" ou "polipeptídeo de proteína de fusão" refere-se a um polipeptídeo ou proteína que possui a totalidade ou parte de uma sequência de aminoácidos de um polipeptídeo de proteína de fusão de RSV. Da mesma forma, o termo "proteína G" ou "polipeptídeo de proteína G" refere-se a um polipeptí- deo ou proteína que possui a totalidade ou parte de uma sequência de aminoácidos de um polipeptídeo de proteína de ligação de RSV. O termo "proteína M" ou "proteína de matriz" ou "polipeptídeo da proteína M" refere-se a um polipeptídeo ou proteína que possui a totalidade ou parte de uma sequência de aminoácidos de uma proteína da Matriz de RSV e pode incluir um ou ambos os produtos gênicos M2-1 (que pode ser escrito aqui como M2.1) e M2-2. Da mesma forma, o termo "prote- ína N" ou "proteína de nucleocapsídeo" ou "polipeptídeo da proteína N" refere-se a um polipeptídeo ou proteína que possui a totalidade ou parte de uma sequência de aminoácidos de uma nucleoproteína de RSV.
[00090] Dois grupos de cepas humanas de RSV foram descritos, os grupos A e B, baseados principalmente em diferenças na antigenicida- de da glicoproteína G. Numerosas cepas de RSV foram isoladas até o momento, qualquer uma das quais é adequada no contexto dos antí- genos das combinações imunogênicas aqui descritas. As cepas exemplares indicadas pelo número de acesso GenBank e/ou EMBL podem ser encontradas no pedido de publicação publicado nos EUA 2010/0203071 (WO2008114149), que é incorporado aqui por referên-
cia com o objetivo de descrever as sequências de ácidos nucleicos e polipeptídeos de proteínas F e G de RSV adequadas para uso na pre- sente invenção. Em Numa modalidade, a proteína F de RSV pode ser um ectodomínio de uma proteína F de RSV (FΔTM).
[00091] Exemplos de sequências de ácidos nucleicos e proteínas das proteínas M e N podem ser encontrados, por exemplo, no pedido de publicação publicado nos EUA 2014/0141042 (WO2012/089833), que são incorporados aqui com o objetivo de descrever as sequências de ácidos nucleicos e polipeptídeos das proteínas M e N do RSV ade- quadas para uso na presente invenção.
[00092] Os ácidos nucleicos do transgene podem codificar um antí- geno de F de RSV e antígenos de M e N de RSV. Mais especificamen- te, os ácidos nucleicos podem codificar uma proteína do antígeno FΔTM de RSV (proteína de fusão (F) excluída das regiões de trans- membrana e citoplasmática) e antígenos M2-1 (anti-terminação da transcrição) e N (nucleocapsídeo) de RSV. Proteína de fusão (F) excluída das regiões de transmembrana e cito- plasmática (FΔTM)
[00093] A proteína F de RSV é um antígeno de superfície principal e medeia a fusão viral para as células-alvo. A proteína F é um antíge- no que é altamente conservado entre subgrupos e cepas de RSV. A proteína F é um alvo para anticorpos neutralizantes, incluindo o anti- corpo monoclonal neutralizante profilático do RSV, Synagis. A exclu- são da região transmembranar e da cauda citoplasmática permite a secreção da proteína FΔTM. Anticorpos neutralizantes, incluindo Synagis, que reconhecem essa forma solúvel da proteína F, inibem a infectividade do RSV in vitro [Magro, 2010]. Proteína de nucleocapsídeo (N)
[00094] A proteína N é um antígeno interno (não exposto), altamen- te conservado entre as cepas de RSV e conhecido por ser uma fonte de muitos epítopos de células T [Townsend, 1984]. A proteína N é es- sencial para a replicação e transcrição do genoma do RSV. A função primária da proteína N é encapsular o genoma do vírus para fins de transcrição, replicação e empacotamento de RNA, protegendo-o das ribonucleases. Proteína de anti-terminação de transcrição (M2-1)
[00095] A proteína M2-1 é um fator de anti-terminação de transcri- ção importante para a síntese eficiente de RNAs mensageiros de comprimento total (mRNAs), bem como para a síntese de mRNAs de leitura policistrônicas, que são característicos de vírus de RNA de fita negativa não segmentado. M2-1 é um antígeno interno (não exposto), que é altamente conservado entre as cepas de RSV e conhecido por ser uma fonte de muitos epítopos de células T [Townsend, 1984]. Proteína de fusão N-M2-1
[00096] Um polinucleotídeo que codifica um ligante é posicionado entre o polinucleotídeo que codifica um antígeno N de RSV, ou frag- mento do mesmo, e o polinucleotídeo que codifica um antígeno M2.1 de RSV, ou fragmento do mesmo. Assim, em certos exemplos preferi- dos, uma cassete de expressão contém um transgene que codifica uma N-ligante-M2.1 de proteína viral de RSV fundida. É preferível que o ligante seja um ligante flexível, preferencialmente um ligante flexível compreendendo uma sequência de aminoácidos de acordo com SEQ ID NO:13 (Gly-Gly-Gly-Ser-Gly-Gly-Gly) ou SEQ ID NO:14 (Gly-Gly- Gly-Gly-Ser-Gly-Gly-Gly-Gly). Entrega de vetores adenovirais
[00097] Em algumas modalidades, o vetor adenoviral recombinante da invenção é administrado a um indivíduo por administração epicutâ- nea, administração intradérmica, injeção intramuscular, injeção intra- peritoneal, injeção intravenosa, administração nasal, administração nasal, administração oral, administração retal, injeção subcutânea,
administração transdérmica ou administração intravaginal.
[00098] Em uma modalidade da invenção, os vetores podem ser administrados por via intramuscular (IM), isto é, injeção diretamente no músculo. Os músculos são bem vascularizados e a captação é tipica- mente rápida. Adjuvantes
[00099] As abordagens para estabelecer uma imunidade forte e du- radoura a patógenos específicos incluem a adição de adjuvantes às vacinas. Por "adjuvante" entende-se um agente que aumenta, estimu- la, ativa, potencializa ou modula a resposta imune a um ingrediente ativo da composição. O efeito adjuvante pode ocorrer no nível celular ou humoral, ou em ambos. Os adjuvantes estimulam a resposta do sistema imunológico ao antígeno real, mas não têm efeito imunológico. Alternativa ou adicionalmente, as composições adjuvadas da invenção podem compreender um ou mais imunoestimulantes. Por "imunoesti- mulante", entende-se um agente que induz um aumento geral e tem- porário na resposta imune de um indivíduo, seja administrado com o antígeno ou separadamente.
[000100] Uma composição da invenção pode ser administrada com ou sem um adjuvante. Alternativamente, ou adicionalmente, a compo- sição pode compreender, ou ser administrada em conjunto com, um ou mais adjuvantes (por exemplo, adjuvantes de vacina), em particular a composição compreende uma quantidade imunologicamente eficaz de um vetor da invenção que codifica um transgene. Métodos de Uso/Usos
[000101] Os métodos são fornecidos para induzir uma resposta imu- ne contra uma doença causada por um patógeno em um indivíduo em necessidade da mesma, compreendendo uma etapa de administração de uma quantidade imunologicamente eficaz de um construto ou com- posição, conforme descrito aqui. Em algumas modalidades, é forneci-
da a utilização dos construtos ou composições aqui descritas para in- duzir uma resposta imune a um antígeno transgênico em um indivíduo em necessidade do mesmo. Os vetores da invenção podem ser apli- cados para a profilaxia, tratamento ou melhora de doenças devido à infecção.
[000102] Os métodos da invenção incluem o uso de um vetor da in- venção em medicina. Eles incluem o uso de um vetor da invenção pa- ra o tratamento de uma doença causada por um patógeno. Um vetor da invenção pode ser utilizado na fabricação de um medicamento para o tratamento de uma doença causada por um patógeno.
[000103] A imunização eficaz com vetores adenovirais depende da capacidade imunomoduladora intrínseca do esqueleto do vetor adeno- viral. Os adenovírus imunologicamente menos potentes induzem me- nos expressão de antígeno. A imunização eficaz também depende da capacidade do promotor de incitar a expressão de transgene forte e sustentada. Por exemplo, os vetores adenovirais impulsionados pelo promotor precoce-imediato do citomegalovírus (CMV-IE) não susten- tam a expressão de transgene a longo prazo porque induzem citocinas que atenuar a expressão.
[000104] Por "indivíduo" entende-se um vertebrado, como um mamí- fero, por exemplo, um mamífero humano ou veterinário. Em algumas modalidades, o indivíduo é humano. Geral
[000105] Os vetores da invenção são gerados usando técnicas e se- quências aqui fornecidas, em conjunto com técnicas conhecidas dos versados na técnica. Tais técnicas incluem técnicas de clonagem con- vencionais de cDNA, como as descritas em textos, uso de sequências oligonucleotídicas sobrepostas dos genomas de adenovírus, reação em cadeia da polimerase e qualquer método adequado que forneça a sequência nucleotídica desejada.
[000106] Salvo explicado de outro modo, todos os termos técnicos e científicos aqui utilizados têm o mesmo significado que o comumente entendido por um especialista na técnica a que esta descrição perten- ce. Os termos singulares "um/uma" e "o/a" incluem referentes plurais, menos que o contexto indique claramente o contrário. Da mesma for- ma, a palavra "ou" destina-se a incluir "e", a menos que o contexto in- dique claramente o contrário. O termo "pluralidade" refere-se a dois ou mais. Além disso, as limitações numéricas dadas em relação às con- centrações ou níveis de uma substância, como as concentrações dos componentes da solução ou razões das mesmas, e as condições da reação, como temperaturas, pressões e tempos de ciclo, devem ser aproximadas. O termo "cerca de" aqui utilizado pretende significar a quantidade ± 10%.
[000107] A presente invenção será agora descrita mais detalhada- mente por meio dos seguintes exemplos não limitativos.
EXEMPLOS Exemplo 1: Construção de um adenovírus de chimpanzé
[000108] Adenovírus de chimpanzé do tipo selvagem tipo 155 (ChAd155) (WO 2016/198621) isolados de chimpanzés saudáveis usando procedimentos padrão e foram construídos como vírus com defeito de replicação, conforme descrito em Sci Transl Med (2012) 4:1 e WO 2010/086189.
[000109] O ChAd155 é construído inserindo dois cassetes de ex- pressão de transgene em dois locais diferentes no adeno: (1) Os primeiros componentes da cassete de expressão compreendem o promotor clássico de CMV humano (hCMV) e antígenos N.M2-1 de RSV. Esta primeira cassete de expressão é inserida na região E1 do adeno (após a região E1 ter sido excluída). (2) A segunda cassete de expressão compreende um promotor clássi- co de CMV humano intensificado (hCMV intensificado), o antígeno
FΔTM RSV e um intensificador WPRE. Esta primeira cassete de ex- pressão é inserida na região HE2 do adeno (após a região HE2 ter si- do excluída).
[000110] Este vetor compreendendo um cassete de expressão dupla é mostrado na FIG. 1.
[000111] No construto da FIG. 1, Ad5E4orf6 foi substituído na região do gene precoce 4 (E4). A substituição é necessária para aumentar a produtividade nas células HEK 293. Exemplo 2: Expressão de transgene do adenovírus do chimpanzé do exemplo 1
[000112] A análise de Western blot foi realizada para comparar o ní- vel de expressão do transgene no vetor ChAd155 do Exemplo 6 (iden- tificado como "Duplo" ou "cassete dupla" nas figuras) nas células MRC5 com: (i) um vetor compreendendo uma única cassete de expressão F (ChAd155-FΔTM, identificado como "F0ΔTm"), (ii) um vetor compreendendo uma única cassete de expressão NM2 (ChAd155-NM2, identificado como "NM2-1") e (iii) o vetor do Exemplo 5 compreendendo um cassete de expressão única contendo os antígenos F e N-M2 de RSV (ChAd155-FΔTM.NM2, também identificado como "RSV")
[000113] A análise de western blot é mostrada na FIG. 2 e FIG. 3.
[000114] Conforme mostrado na fig. 2, as células foram infectadas com ChAd155-FΔTM, ChAd155-FΔTM.NM2 ("RSV") ou a cassete du- pla ChAd155 a uma multiplicidade de infecção de 500 partículas virais por célula. Além disso, as células foram infectadas com ChAd155- FΔTM.NM2 ("RSV") a uma multiplicidade de infecção de 1250 partícu- las virais por célula. As células foram colhidas 48 horas e 96 horas após a infecção, extratos preparados usando métodos padrão e uma quantidade equivalente de extrato celular total carregado em géis de
SDS-PAGE.
[000115] FIG. 2 mostra que a cassete dupla ChAd155 fornece um nível de expressão do antígeno F que é comparável ao ChAd155FΔTM e superior ao ChAd155-FΔTM.NM2 nas células MRC5.
[000116] Conforme mostrado na fig. 3, as células foram infectadas com ChAd155-NM2, ChAd155-FΔTM.NM2 ("RSV") ou a cassete dupla ChAd155 do exemplo 6 a uma multiplicidade de infecção de 1250 par- tículas virais por célula. As células foram colhidas 48 horas após a in- fecção, extratos preparados usando métodos padrão e uma quantida- de equivalente de extrato celular total carregado em géis de SDS- PAGE.
[000117] Na FIG. 3, a cassete dupla ChAd155 fornece um nível de expressão de NM2-1 comparável ao vetor único de ChAd155-NM2 e superior ao ChAd155-FΔTM.NM2 ("RSV") nas células MRC5. Exemplo 3: Imunogenicidade do adenovírus do chimpanzé do exemplo 1
[000118] A imunogenicidade da cassete de expressão dupla do Exemplo 6 foi avaliada em camundongos não consanguíneos CD1 (10 por grupo). O experimento foi realizado injetando 5x108 partículas vi- rais por via intramuscular nos camundongos. A resposta das células B foi medida 4 e 8 semanas após a imunização, medindo os títulos neu- tralizadores do RSV. Cada ponto representa a resposta em um único camundongo e a linha corresponde à média de cada grupo de doses. Os resultados desta análise são mostrados na FIG. 4.
[000119] FIG. 4 mostra que a cassete dupla ChAd155 fornece uma resposta de células B comparável ao ChAd155FΔTM e superior à pro- duzida pelo ChAd155-FΔTM.NM2 ("RSV").
[000120] A imunogenicidade da cassete de expressão dupla do Exemplo 6 também foi avaliada em camundongos consanguíneos BALB/c (48, 11 ou 8 por grupo). O experimento foi realizado injetando
107 ou 108 partículas virais por via intramuscular. A resposta das célu- las T foi medida 3 semanas após a imunização por “immunospot” liga- do à enzima IFN-gama ex vivo (ELISpot) usando um epítopo de célula T do peptídeo M2 mapeado em camundongos BALB/c. Os resultados são mostrados na Figura 11, expressos como células formadoras de spot de IFN-gama (SFC) por milhão de esplenócitos. Cada ponto re- presenta a resposta em um único camundongo e a linha corresponde à média de cada grupo de doses. A dose injetada em número de partí- culas virais é mostrada no eixo x. Os resultados são mostrados na FIG. 5.
[000121] FIG. 5 mostra que a cassete dupla ChAd155 fornece uma resposta de células T superior à produzida por ChAd155-FΔTM.NM2 ("RSV", cujos resultados são obtidos a partir de dados históricos). Esta diferença na resposta é maior para dose de 106.
[000122] FIG. 5 refere-se a "no de camundongos positivos", isto é, o número de camundongos que responderam à vacina. Exemplo 3: Expressão de SeAP em células MRC5 por ChAd155 com diferentes promotores
[000123] O sistema de fosfatase alcalina embrionária secretada (Se- AP) é amplamente utilizado para estudar a atividade do promotor. O gene repórter SeAP codifica um gene truncado para a fosfatase alcali- na placentária humana que não possui o domínio de ancoragem da membrana. Portanto, a proteína SeAP é secretada no sobrenadante celular e permite que a atividade do promotor seja determinada sem perturbar as células.
[000124] FIG. 6 mostra a expressão de SeAP em células MRC5 a partir de vetores de ChAd155 construídos com diferentes promotores. Os três vetores de ChAd155 diferentes usados neste exemplo são os seguintes:  Um ChAd155 com o promotor de CMV humano conhecido
(hCMV);  Um ChAd155 com o conhecido promotor de CASI; e  Um ChAd155 com o novo promotor de hCMV intensificado
[000125] Neste experimento, o MRC5 foi infectado com moi = 250 vp/célula, e a medição do SeAP ocorreu 2 dias (48 horas), 4 dias (96 horas) e 7 dias (1 semana) após a infecção com os vírus de ChAd155.
[000126] Como pode ser visto a partir da fig. 6, os vetores construí- dos com o novo promotor de hCMV intensificado apresentaram maior expressão de SeAP do que os outros dois vetores em todos os mo- mentos de avaliação medidos. Exemplo 4: Expressão de SeAP em células HeLa por ChAd155 com diferentes promotores
[000127] FIG. 7 mostra a expressão de SeAP em células HeLa a par- tir de vetores ChAd155 construídos com diferentes promotores. Como no Exemplo 3, os três vetores ChAd155 diferentes usados neste expe- rimento foram os seguintes:  Um ChAd155 (d) com o promotor de CMV humano conhe- cido (hCMV);  Um ChAd155 (d) com o conhecido promotor de CASI; e  Um ChAd155 (d) com o novo promotor de hCMV intensifi- cado (hCMV);
[000128] Neste experimento, HeLa foi infectada com moi = 50 vp/célula, e a medição do SeAP ocorreu 2 dias (48 horas), 4 dias (96 horas) e 7 dias (1 semana) após a infecção com os vírus de ChAd155.
[000129] Como pode ser visto a partir da fig. 7, os vetores construí- dos com o novo promotor de hCMV intensificado apresentaram maior expressão de SeAP do que os outros dois vetores em todos os mo- mentos de avaliação medidos.
DESCRIÇÃO DAS SEQUÊNCIAS SEQ ID NO: 1 - Sequência de polinucleotídeos que codifica
ChAd155 de tipo selvagem CATCATCAATAATATACCTTATTTTGGATTGAAGCCAATATGATAA- TGAGATGGGCGGCGCGGGGCGGGAGGCGGGTCCGGGGG- CGGGCCGGCGGGCGGGGCGGTGTGGCGGAAGTGGACTTTG- TAAGTGTGGCGGATGTGACTTGCTAGTGCCGGGCGCGG- TAAAAGTGACGTTTTCCGTGCGCGACAACGCCCACGGGAAG- TGACATTTTTCCCGCGGTTTTTACCGGATGTTGTAGTGAA- TTTGGGCGTAACCAAGTAAGATTTGGCCATTTTCGCGGGAAAAC- TGAAACGGGGAAGTGAAATCTGATTAATTTCGCGTTAGTCATAC- CGCGTAATATTTGTCGAGGGCCGAGGGACTTTGGCCGATTACG- TGGAGGACTCGCCCAGGTGTTTTTTGAGGTGAATTTCCGCGTT- CCGGGTCAAAGTCTCCGTTTTATTATTATAGTCAGCTGACGCG- GAGTGTATTTATACCCTCTGATCTCGTCAAGTGGCCACTCTTGAG- TGCCAGCGAGTAGAGTTTTCTCCTCTGCCGCTCTCCGCTCCG- CTCCGCTCGGCTCTGACACCGGGGAAAAAATGAGACATTTCACC- TACGATGGCGGTGTGCTCACCGGCCAGCTGGCTGCTGAAG- TCCTGGACACCCTGATCGAGGAGGTATTGGCCGATAATTA- TCCTCCCTCGACTCCTTTTGAGCCACCTACACTTCACGAACTC- TACGATCTGGATGTGGTGGGGCCCAGCGATCCGAACGAGCAGG- CGGTTTCCAGTTTTTTTCCAGAGTCCATGTTGTTGGCCAGCCAG- GAGGGGGTCGAACTTGAGACCCCTCCTCCGATCGTGGATT- CCCCCGATCCGCCGCAGCTGACTAGGCAGCCCGAGCGCTGTG- CGGGACCTGAGACTATGCCCCAGCTGCTACCTGAGG- TGATCGATCTCACCTGTAATGAGTCTGGTTTTCCACCCAGCGAG- GATGAGGACGAAGAGGGTGAGCAGTTTGTGTTAGATTCTGTGGA- ACAACCCGGGCGAGGATGCAGGTCTTGTCAATATCACCGGA- AAAACACAGGAGACTCCCAGATTATGTGTTCTCTGTGTTATA- TGAAGATGACCTGTATGTTTATTTACAGTAAGTTTATCATCTG- TGGGCAGGTGGGCTATAGTGTGGGTGGTGGTCTTTGGGGGG- TTTTTTAATATATGTCAGGGGTTATGCTGAAGACTTTTTTATTG-
TGATTTTTAAAGGTCCAGTGTCTGAGCCCGAGCAAGAAC- CTGAACCGGAGCCTGAGCCTTCTCGCCCCAGGAGAAAGCCTG- TAATCTTAACTAGACCCAGCGCACCGGTAGCGAGAGGCCTCAG- CAGCGCGGAGACCACCGACTCCGGTGCTTCCTCATCACCCCCG- GAGATTCACCCCCTGGTGCCCCTGTGTCCCGTTAAGCCCGTTG- CCGTGAGAGTCAGTGGGCGGCGGTCTGCTGTGGAGTG- CATTGAGGACTTGCTTTTTGATTCACAGGAACCTTTGGACTTGAG- CTTGAAACGCCCCAGGCATTAAACCTGGTCACCTGGACTGAA- TGAGTTGACGCCTATGTTTGCTTTTGAATGACTTAATGTGTATA- GATAATAAAGAGTGAGATAATGTTTTAATTGCATGGTGTGTT- TAACTTGGGCGGAGTCTGCTGGGTATATAAGCTTCCCTGGGC- TAAACTTGGTTACACTTGACCTCATGGAGGCCTGGGAGTGTTTG- GAGAACTTTGCCGGAGTTCGTGCCTTGCTGGACGAGAGCTCTAA- CAATACCTCTTGGTGGTGGAGGTATTTGTGGGGCTCTCCCCA- GGGCAAGTTAGTTTGTAGAATCAAGGAGGATTACAAGTGGGAA- TTTGAAGAGCTTTTGAAATCCTGTGGTGAGCTATTGGATT- CTTTGAATCTAGGCCACCAGGCTCTCTTCCAGGAGAAGGTCAT- CAGGACTTTGGATTTTTCCACACCGGGGCGCATTGCAGCCG- CGGTTGCTTTTCTAGCTTTTTTGAAGGATAGATGGAGCGAAGA- GACCCACTTGAGTTCGGGCTACGTCCTGGATTTTCTGGCCATG- CAACTGTGGAGAGCATGGATCAGACACAAGAACAGGCTGCAAC- TGTTGTCTTCCGTCCGCCCGTTGCTGATTCCGGCGGAGGAG- CAACAGGCCGGGTCAGAGGACCGGGCCCGTCGGGATCCGGAG- GAGAGGGCACCGAGGCCGGGCGAGAGGAGCGCGCTGAAC- CTGGGAACCGGGCTGAGCGGCCATCCACATCGGGAGTGAATG- TCGGGCAGGTGGTGGATCTTTTTCCAGAACTGCGGCGGA- TTTTGACTATTAGGGAGGATGGGCAATTTGTTAAGGGTCT- TAAGAGGGAGAGGGGGGCTTCTGAGCATAACGAGGAGGCCAG- TAATTTAGCTTTTAGCTTGATGACCAGACACCGTCCAGAGTGCAT- CACTTTTCAGCAGATTAAGGACAATTGTGCCAATGAGTTGGA- TCTGTTGGGTCAGAAGTATAGCATAGAGCAGCTGACCACTTAC- TGGCTGCAGCCGGGTGATGATCTGGAGGAAGCTATTAGGGTG- TATGCTAAGGTGGCCCTGCGGCCCGATTGCAAGTACAAGCT- CAAGGGGCTGGTGAATATCAGGAATTGTTGCTACATTTCTGG- CAACGGGGCGGAGGTGGAGATAGAGACCGAAGACAGGGTGG- CTTTCAGATGCAGCATGATGAATATGTGGCCGGGGGTGCTGGG- CATGGACGGGGTGGTGATTATGAATGTGAGGTTCACGGGG- CCCAACTTTAACGGCACGGTGTTTTTGGGGAACACCAACCTGG- TCCTGCACGGGGTGAGCTTCTATGGGTTTAACAACACCTGTGTG- GAGGCCTGGACCGATGTGAAGGTCCGCGGTTGCGCCTTTTATG- GATGTTGGAAGGCCATAGTGAGCCGCCCTAAGAGCAGGAGTT- CCATTAAGAAATGCTTGTTTGAGAGGTGCACCTTGGGGA- TCCTGGCCGAGGGCAACTGCAGGGTGCGCCACAATGTGG- CCTCCGAGTGCGGTTGCTTCATGCTAGTCAAGAGCGTGGCGG- TAATCAAGCATAATATGGTGTGCGGCAACAGCGAGGACAAGG- CCTCACAGATGCTGACCTGCACGGATGGCAACTGCCACTTG- CTGAAGACCATCCATGTAACCAGCCACAGCCGGAAGGCCTGG- CCCGTGTTCGAGCACAACTTGCTGACCCGCTGCTCCTTG- CATCTGGGCAACAGGCGGGGGGTGTTCCTGCCCTATCAATG- CAACTTTAGTCACACCAAGATCTTGCTAGAGCCCGAGAGCATG- TCCAAGGTGAACTTGAACGGGGTGTTTGACATGACCATGAAGA- TCTGGAAGGTGCTGAGGTACGACGAGACCAGGTCCCGGTGCA- GACCCTGCGAGTGCGGGGGCAAGCATATGAGGAACCAGCCCG- TGATGCTGGATGTGACCGAGGAGCTGAGGACAGACCACTTGG- TTCTGGCCTGCACCAGGGCCGAGTTTGGTTCTAGCGATGAAGA- CACAGATTGAGGTGGGTGAGTGGGCGTGGCCTGGGGTGGT- CATGAAAATATATAAGTTGGGGGTCTTAGGGTCTCTTTATTTGTG- TTGCAGAGACCGCCGGAGCCATGAGCGGGAGCAGCAGCAGCA- GCAGTAGCAGCAGCGCCTTGGATGGCAGCATCGTGAGCCCTTA- TTTGACGACGCGGATGCCCCACTGGGCCGGGGTGCGTCAGAA- TGTGATGGGCTCCAGCATCGACGGCCGACCCGTCCTGCCCG- CAAATTCCGCCACGCTGACCTATGCGACCGTCGCGGGGACG- CCGTTGGACGCCACCGCCGCCGCCGCCGCCACCGCAGCCG- CCTCGGCCGTGCGCAGCCTGGCCACGGACTTTGCATTCCTGG- GACCACTGGCGACAGGGGCTACTTCTCGGGCCGCTGCTGCCG- CCGTTCGCGATGACAAGCTGACCGCCCTGCTGGCGCAGTTGGA- TGCGCTTACTCGGGAACTGGGTGACCTTTCTCAGCAGGTCATGG- CCCTGCGCCAGCAGGTCTCCTCCCTGCAAGCTGGCGGGAATG- CTTCTCCCACAAATGCCGTTTAAGATAAATAAAACCAGACTCTG- TTTGGATTAAAGAAAAGTAGCAAGTGCATTGCTCTCTTTATTTCA- TAATTTTCCGCGCGCGATAGGCCCTAGACCAGCGTTCTCGGTCG- TTGAGGGTGCGGTGTATCTTCTCCAGGACGTGGTAGAGGTGG- CTCTGGACGTTGAGATACATGGGCATGAGCCCGTCCCGGGGG- TGGAGGTAGCACCACTGCAGAGCTTCATGCTCCGGGGTGGTG- TTGTAGATGATCCAGTCGTAGCAGGAGCGCTGGGCATGGTGCC- TAAAAATGTCCTTCAGCAGCAGGCCGATGGCCAGGGGGAGG- CCCTTGGTGTAAGTGTTTACAAAACGGTTAAGTTGGGAAGGGTG- CATTCGGGGAGAGATGATGTGCATCTTGGACTGTATTTTTAGA- TTGGCGATGTTTCCGCCCAGATCCCTTCTGGGATTCATGTTGTG- CAGGACCACCAGTACAGTGTATCCGGTGCACTTGGGGAATTTGT- CATGCAGCTTAGAGGGAAAAGCGTGGAAGAACTTGGAGACG- CCTTTGTGGCCTCCCAGATTTTCCATGCATTCG- TCCATGATGATGGCAATGGGCCCGCGGGAGGCAGCTTGGG- CAAAGATATTTCTGGGGTCGCTGACGTCGTAGTTGTGTTCCA- GGGTGAGGTCGTCATAGGCCATTTTTACAAAGCGCGGGCGGA- GGGTGCCCGACTGGGGGATGATGGTCCCCTCTGGCCCTGGGG- CGTAGTTGCCCTCGCAGATCTGCATTTCCCAGGCCTTAATCTCG- GAGGGGGGAATCATATCCACCTGCGGGGCGATGAAGAAAACGG- TTTCCGGAGCCGGGGAGATTAACTGGGATGAGAGCAGGTTTC- TAAGCAGCTGTGATTTTCCACAACCGGTGGGCCCATAAATAACA- CCTATAACCGGTTGCAGCTGGTAGTTTAGAGAGCTGCAGCTG- CCGTCGTCCCGGAGGAGGGGGGCCACCTCGTTGAGCATG- TCCCTGACGCGCATGTTCTCCCCGACCAGATCCGCCAGAAGG- CGCTCGCCGCCCAGGGACAGCAGCTCTTGCAAGGAAGCAAAG- TTTTTCAGCGGCTTGAGGCCGTCCGCCGTGGGCATGTTTTTCA- GGGTCTGGCTCAGCAGCTCCAGGCGGTCCCAGAGCTCGGTGA- CGTGCTCTACGGCATCTCTATCCAGCATATCTCCTCGTTTCG- CGGGTTGGGGCGACTTTCGCTGTAGGGCACCAAGCGGTGGTCG- TCCAGCGGGGCCAGAGTCATGTCCTTCCATGGGCGCAGGG- TCCTCGTCAGGGTGGTCTGGGTCACGGTGAAGGGGTGCG- CTCCGGGCTGAGCGCTTGCCAAGGTGCGCTTGAGGCTGGTT- CTGCTGGTGCTGAAGCGCTGCCGGTCTTCGCCCTGCGCGTCGG- CCAGGTAGCATTTGACCATGGTGTCATAGTCCAGCCCCTCCG- CGGCGTGTCCCTTGGCGCGCAGCTTGCCCTTGGAGGTGGCG- CCGCACGAGGGGCAGAGCAGGCTCTTGAGCGCGTAGAG- CTTGGGGGCGAGGAAGACCGATTCGGGGGAGTAGGCGTCCG- CGCCGCAGACCCCGCACACGGTCTCGCACTCCACCAGCCAGG- TGAGCTCGGGGCGCGCCGGGTCAAAAACCAGGTTTCCCCCATG- CTTTTTGATGCGTTTCTTACCTCGGGTCTCCATGAGGTGGTG- TCCCCGCTCGGTGACGAAGAGGCTGTCCGTGTCTCCGTAGAC- CGACTTGAGGGGTCTTTTCTCCAGGGGGGTCCCTCGGTCTT- CCTCGTAGAGGAACTCGGACCACTCTGAGACGAAGGCCCGCG- TCCAGGCCAGGACGAAGGAGGCTATGTGGGAGGGGTAGCGG- TCGTTGTCCACTAGGGGGTCCACCTTCTCCAAGGTGTGAAGACA- CATGTCGCCTTCCTCGGCGTCCAGGAAGGTGATTGGCTTGTAGG- TGTAGGCCACGTGACCGGGGGTTCCTGACGGGGGGGTA- TAAAAGGGGGTGGGGGCGCGCTCGTCGTCACTCTCTTCCG- CATCGCTGTCTGCGAGGGCCAGCTGCTGGGGTGAGTATT- CCCTCTCGAAGGCGGGCATGACCTCCGCGCTGAGGTTGTCAG- TTTCCAAAAACGAGGAGGATTTGATGTTCACCTGTCCCGAGG- TGATACCTTTGAGGGTACCCGCGTCCATCTGGTCAGAAAACA- CGATCTTTTTATTGTCCAGCTTGGTGGCGAACGACCCG- TAGAGGGCGTTGGAGAGCAGCTTGGCGATGGAGCGCAGGG- TCTGGTTCTTGTCCCTGTCGGCGCGCTCCTTGGCCGCGATG- TTGAGCTGCACGTACTCGCGCGCGACGCAGCGCCACTCGGGGA- AGACGGTGGTGCGCTCGTCGGGCACCAGGCGCACGCGCCAG- CCGCGGTTGTGCAGGGTGACCAGGTCCACGCTGGTGGCGAC- CTCGCCGCGCAGGCGCTCGTTGGTCCAGCAGAGACGGCCG- CCCTTGCGCGAGCAGAAGGGGGGCAGGGGGTCGAGCTGGG- TCTCGTCCGGGGGGTCCGCGTCCACGGTGAAAACCCCGGGG- CGCAGGCGCGCGTCGAAGTAGTCTATCTTGCAACCTTGCATG- TCCAGCGCCTGCTGCCAGTCGCGGGCGGCGAGCGCGCGCTCG- TAGGGGTTGAGCGGCGGGCCCCAGGGCATGGGGTGGGTGAG- TGCGGAGGCGTACATGCCGCAGATGTCATAGACGTAGAGGGG- CTCCCGCAGGACCCCGATGTAGGTGGGGTAGCAGCGGCCG- CCGCGGATGCTGGCGCGCACGTAGTCATACAGCTCGTG- CGAGGGGGCGAGGAGGTCGGGGCCCAGGTTGGTGCGGG- CGGGGCGCTCCGCGCGGAAGACGATCTGCCTGAAGATGGCATG- CGAGTTGGAAGAGATGGTGGGGCGCTGGAAGACGTTGAAG- CTGGCGTCCTGCAGGCCGACGGCGTCGCGCACGAAGGAGGCG- TAGGAGTCGCGCAGCTTGTGTACCAGCTCGGCGGTGACCTG- CACGTCGAGCGCGCAGTAGTCGAGGGTCTCGCGGATGATGTCA- TATTTAGCCTGCCCCTTCTTTTTCCACAGCTCGCGGTTGAGGA- CAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGGAAACCG- TCCGGTTCCGAACGGTAAGAGCCTAGCATGTAGAACTGGTTGA- CGGCCTGGTAGGCGCAGCAGCCCTTCTCCACGGGGAGGGCG- TAGGCCTGCGCGGCCTTGCGGAGCGAGGTGTGGGTCAGGG- CGAAGGTGTCCCTGACCATGACTTTGAGGTACTGGTGCTTGAAG- TCGGAGTCGTCGCAGCCGCCCCGCTCCCAGAGCGAGAAGTCGG- TGCGCTTCTTGGAGCGGGGGTTGGGCAGAGCGAAGGTGACA- TCGTTGAAGAGGATTTTGCCCGCGCGGGGCATGAAGTTGCGGG- TGATGCGGAAGGGCCCCGGCACTTCAGAGCGGTTGTTGATGAC- CTGGGCGGCGAGCACGATCTCGTCGAAGCCGTTGATGTTGTGG- CCCACGATGTAGAGTTCCAGGAAGCGGGGCCGGCCCTTTACGG- TGGGCAGCTTCTTTAGCTCTTCGTAGGTGAGCTCCTCGGG- CGAGGCGAGGCCGTGCTCGGCCAGGGCCCAGTCCGCGAGGTG- CGGGTTGTCTCTGAGGAAGGACTTCCAGAGGTCGCGGGCCAG- GAGGGTCTGCAGGCGGTCTCTGAAGGTCCTGAACTGGCGG- CCCACGGCCATTTTTTCGGGGGTGATGCAGTAGAAGG- TGAGGGGGTCTTGCTGCCAGCGGTCCCAGTCGAGCTGCAGGG- CGAGGTCGCGCGCGGCGGTGACCAGGCGCTCGTCGCCCCCGA- ATTTCATGACCAGCATGAAGGGCACGAGCTGCTTTCCGAAGG- CCCCCATCCAAGTGTAGGTCTCTACATCGTAGGTGACAAAGAGG- CGCTCCGTGCGAGGATGCGAGCCGATCGGGAAGAACTGGA- TCTCCCGCCACCAGTTGGAGGAGTGGCTGTTGATGTGGTGGA- AGTAGAAGTCCCGTCGCCGGGCCGAACACTCGTGCTGG- CTTTTGTAAAAGCGAGCGCAGTACTGGCAGCGCTGCACGGG- CTGTACCTCATGCACGAGATGCACCTTTCGCCCGCGCACGAG- GAAGCCGAGGGGAAATCTGAGCCCCCCGCCTGGCTCGCGG- CATGGCTGGTTCTCTTCTACTTTGGATGCGTGTCCGTCTCCG- TCTGGCTCCTCGAGGGGTGTTACGGTGGAGCGGACCACCACG- CCGCGCGAGCCGCAGGTCCAGATATCGGCGCGCGGCGGTCG- GAGTTTGATGACGACATCGCGCAGCTGGGAGCTGTCCATGG- TCTGGAGCTCCCGCGGCGGCGGCAGGTCAGCCGGGAGTT- CTTGCAGGTTCACCTCGCAGAGTCGGGCCAGGGCGCGGGGCA- GGTCTAGGTGGTACCTGATCTCTAGGGGCGTGTTGGTGGCGG- CGTCGATGGCTTGCAGGAGCCCGCAGCCCCGGGGGGCGACGA- CGGTGCCCCGCGGGGTGGTGGTGGTGGTGGCGGTGCAGCTCA- GAAGCGGTGCCGCGGGCGGGCCCCCGGAGGTAGGGGGGG- CTCCGGTCCCGCGGGCAGGGGCGGCAGCGGCACGTCGGCGTG- GAGCGCGGGCAGGAGTTGGTGCTGTGCCCGGAGGTTGCTGG- CGAAGGCGACGACGCGGCGGTTGATCTCCTGGATCTGGCG- CCTCTGCGTGAAGACGACGGGCCCGGTGAGCTTGAAC- CTGAAAGAGAGTTCGACAGAATCAATCTCGGTGTCATTGACCG- CGGCCTGGCGCAGGATCTCCTGCACGTCTCCCGAGTTG- TCTTGGTAGGCGATCTCGGCCATGAACTGCTCGATCTCTT- CCTCCTGGAGGTCTCCGCGTCCGGCGCGTTCCACGGTGGCCG- CCAGGTCGTTGGAGATGCGCCCCATGAGCTGCGAGAAGGCG- TTGAGTCCGCCCTCGTTCCAGACTCGGCTGTAGACCACG- CCCCCCTGGTCATCGCGGGCGCGCATGACCACCTGCGCGAGG- TTGAGCTCCACGTGCCGCGCGAAGACGGCGTAGTTGCGCAGA- CGCTGGAAGAGGTAGTTGAGGGTGGTGGCGGTGTGCTCGG- CCACGAAGAAGTTCATGACCCAGCGGCGCAACGTGGATTCG- TTGATGTCCCCCAAGGCCTCCAGCCGTTCCATGGCCTCG- TAGAAGTCCACGGCGAAGTTGAAAAACTGGGAGTTGCGCG- CCGACACGGTCAACTCCTCCTCCAGAAGACGGATGAGCTCGG- CGACGGTGTCGCGCACCTCGCGCTCGAAGGCTATGGGGA- TCTCTTCCTCCGCTAGCATCACCACCTCCTCCTCTTCCTCCTCTT- CTGGCACTTCCATGATGGCTTCCTCCTCTTCGGGGGGTGGCGG- CGGCGGCGGTGGGGGAGGGGGCGCTCTGCGCCGGCGGCGG- CGCACCGGGAGGCGGTCCACGAAGCGCGCGATCATCTCCCCG- CGGCGGCGGCGCATGGTCTCGGTGACGGCGCGGCCGTT- CTCCCGGGGGCGCAGTTGGAAGACGCCGCCGGACATCTGGTG- CTGGGGCGGGTGGCCGTGAGGCAGCGAGACGGCGCTGA- CGATGCATCTCAACAATTGCTGCGTAGGTACGCCGCCGAGGGA- CCTGAGGGAGTCCATATCCACCGGATCCGAAAACCTTTCGAGGA- AGGCGTCTAACCAGTCGCAGTCGCAAGGTAGGCTGAGCACCG- TGGCGGGCGGCGGGGGGTGGGGGGAGTGTCTGGCGGAGGTG- CTGCTGATGATGTAATTGAAGTAGGCGGACTTGACACGGCGGA- TGGTCGACAGGAGCACCATGTCCTTGGGTCCGGCCTGCTGGA- TGCGGAGGCGGTCGGCTATGCCCCAGGCTTCGTTCTGG- CATCGGCGCAGGTCCTTGTAGTAGTCTTGCATGAGCCTTTCCAC- CGGCACCTCTTCTCCTTCCTCTTCTGCTTCTTCCATGTCTGCTT- CGGCCCTGGGGCGGCGCCGCGCCCCCCTGCCCCCCATGCGCG- TGACCCCGAACCCCCTGAGCGGTTGGAGCAGGGCCAGGTCGG- CGACGACGCGCTCGGCCAGGATGGCCTGCTGCACCTGCG- TGAGGGTGGTTTGGAAGTCATCCAAGTCCACGAAGCGGTGG- TAGGCGCCCGTGTTGATGGTGTAGGTGCAGTTGGCCATGACG- GACCAGTTGACGGTCTGGTGGCCCGGTTGCGACATCTCGGTG- TACCTGAGTCGCGAGTAGGCGCGGGAGTCGAAGACGTAGTCG- TTGCAAGTCCGCACCAGGTACTGGTAGCCCACCAGGAAGTG- CGGCGGCGGCTGGCGGTAGAGGGGCCAGCGCAGGGTGG- CGGGGGCTCCGGGGGCCAGGTCTTCCAGCATGAGGCGGTGG- TAGGCGTAGATGTACCTGGACATCCAGGTGATACCCGCGGCGG- TGGTGGAGGCGCGCGGGAAGTCGCGCACCCGGTTCCAGATG- TTGCGCAGGGGCAGAAAGTGCTCCATGGTAGGCGTGCTCTG- TCCAGTCAGACGCGCGCAGTCGTTGATACTCTAGACCAGGGA- AAACGAAAGCCGGTCAGCGGGCACTCTTCCGTGGTCTGGTGAA- TAGATCGCAAGGGTATCATGGCGGAGGGCCTCGGTTCGAG- CCCCGGGTCCGGGCCGGACGGTCCGCCATGATCCACGCGGT- TACCGCCCGCGTGTCGAACCCAGGTGTGCGACGTCAGA- CAACGGTGGAGTGTTCCTTTTGGCGTTTTTCTGGCCGGGCG- CCGGCGCCGCGTAAGAGACTAAGCCGCGAAAGCGAAAGCAG- TAAGTGGCTCGCTCCCCGTAGCCGGAGGGATCCTTGCTAAGGG- TTGCGTTGCGGCGAACCCCGGTTCGAATCCCGTACTCGGG- CCGGCCGGACCCGCGGCTAAGGTGTTGGATTGG- CCTCCCCCTCGTATAAAGACCCCGCTTGCGGATTGACTCCGGA- CACGGGGACGAGCCCCTTTTATTTTTGCTTTCCCCAGATG- CATCCGGTGCTGCGGCAGATGCGCCCCCCGCCCCAGCAGCAG- CAACAACACCAGCAAGAGCGGCAGCAACAGCAGCGGGAGT- CATGCAGGGCCCCCTCACCCACCCTCGGCGGGCCGGCCAC- CTCGGCGTCCGCGGCCGTGTCTGGCGCCTGCGGCGGCGG- CGGGGGGCCGGCTGACGACCCCGAGGAGCCCCCGCGGCGCA- GGGCCAGACACTACCTGGACCTGGAGGAGGGCGAGGGCCTGG- CGCGGCTGGGGGCGCCGTCTCCCGAGCGCCACCCGCGGGTG- CAGCTGAAGCGCGACTCGCGCGAGGCGTACGTGCCTCGGCA- GAACCTGTTCAGGGACCGCGCGGGCGAGGAGCCCGAGGAGA- TGCGGGACAGGAGGTTCAGCGCAGGGCGGGAGCTGCGGCA- GGGGCTGAACCGCGAGCGGCTGCTGCGCGAGGAGGAC- TTTGAGCCCGACGCGCGGACGGGGATCAGCCCCGCGCGCGCG- CACGTGGCGGCCGCCGACCTGGTGACGGCGTACGAGCAGA- CGGTGAACCAGGAGATCAACTTCCAAAAGAGTTTCAACAAC- CACGTGCGCACGCTGGTGGCGCGCGAGGAGGTGACCATCGGG- CTGATGCACCTGTGGGACTTTGTAAGCGCGCTGGTGCAGAAC- CCCAACAGCAAGCCTCTGACGGCGCAGCTGTTCCTGATAGTG- CAGCACAGCAGGGACAACGAGGCGTTTAGGGACGCGCTG- CTGAACATCACCGAGCCCGAGGGTCGGTGGCTGCTGGAC- CTGATTAACATCCTGCAGAGCATAGTGGTGCAGGAGCGCAG- CCTGAGCCTGGCCGACAAGGTGGCGGCCATCAACTACTCGATG- CTGAGCCTGGGCAAGTTTTACGCGCGCAAGATCTACCAGACG- CCGTACGTGCCCATAGACAAGGAGGTGAAGATCGACGGTTTTTA- CATGCGCATGGCGCTGAAGGTGCTCACCCTGAGCGACGAC- CTGGGCGTGTACCGCAACGAGCGCATCCACAAGGCCGTGAGCG- TGAGCCGGCGGCGCGAGCTGAGCGACCGCGAGCTGATGCACA- GCCTGCAGCGGGCGCTGGCGGGCGCCGGCAGCGGCGACAGG- GAGGCGGAGTCCTACTTCGATGCGGGGGCGGACCTGCG- CTGGGCGCCCAGCCGGCGGGCCCTGGAGGCCGCGGGGG- TCCGCGAGGACTATGACGAGGACGGCGAGGAGGATGAGGAG- TACGAGCTAGAGGAGGGCGAGTACCTGGACTAAACCGCGGG- TGGTGTTTCCGGTAGATGCAAGACCCGAACGTGGTGGACCCGG- CGCTGCGGGCGGCTCTGCAGAGCCAGCCGTCCGGCCTTAAC- TCCTCAGACGACTGGCGACAGGTCATGGACCGCATCATGTCG- CTGACGGCGCGTAACCCGGACGCGTTCCGGCAGCAGCCGCA- GGCCAACAGGCTCTCCGCCATCCTGGAGGCGGTGGTGCCTGCG- CGCTCGAACCCCACGCACGAGAAGGTGCTGGCCATAGTGAACG- CGCTGGCCGAGAACAGGGCCATCCGCCCGGACGAGGCCGGG- CTGGTGTACGACGCGCTGCTGCAGCGCGTGGCCCGCTACAACA- GCGGCAACGTGCAGACCAACCTGGACCGGCTGGTGGGGGACG- TGCGCGAGGCGGTGGCGCAGCGCGAGCGCGCGGATCGGCA- GGGCAACCTGGGCTCCATGGTGGCGCTGAATGCCTTCCTGAG- CACGCAGCCGGCCAACGTGCCGCGGGGGCAGGAAGACTACAC- CAACTTTGTGAGCGCGCTGCGGCTGATGGTGACCGAGAC- CCCCCAGAGCGAGGTGTACCAGTCGGGCCCGGACTACTTCTT- CCAGACCAGCAGACAGGGCCTGCAGACGGTGAACCTGAGCCA- GGCTTTCAAGAACCTGCGGGGGCTGTGGGGCGTGAAGGCG- CCCACCGGCGACCGGGCGACGGTGTCCAGCCTGCTGACG- CCCAACTCGCGCCTGCTGCTGCTGCTGATCGCGCCGTTCACG- GACAGCGGCAGCGTGTCCCGGGACACCTACCTGGGGCACCTG- CTGACCCTGTACCGCGAGGCCATCGGGCAGGCGCAGGTGGA- CGAGCACACCTTCCAGGAGATCACCAGCGTGAGCCGCGCG- CTGGGGCAGGAGGACACGAGCAGCCTGGAGGCGACTCTGAAC- TACCTGCTGACCAACCGGCGGCAGAAGATTCCCTCGCTGCACA- GCCTGACCTCCGAGGAGGAGCGCATCTTGCGCTACGTGCAGCA- GAGCGTGAGCCTGAACCTGATGCGCGACGGGGTGACGCCCAG- CGTGGCGCTGGACATGACCGCGCGCAACATGGAACCGGGCATG- TACGCCGCGCACCGGCCTTACATCAACCGCCTGATGGACTAC- CTGCATCGCGCGGCGGCCGTGAACCCCGAGTACTTTACCAACG- CCATCCTGAACCCGCACTGGCTCCCGCCGCCCGGGTTCTACAG- CGGGGGCTTCGAGGTCCCGGAGACCAACGATGGCTTCCTGTGG- GACGACATGGACGACAGCGTGTTCTCCCCGCGGCCGCAGGCG- CTGGCGGAAGCGTCCCTGCTGCGTCCCAAGAAGGAGGAGGAG- GAGGAGGCGAGTCGCCGCCGCGGCAGCAGCGGCGTGGCTT- CTCTGTCCGAGCTGGGGGCGGCAGCCGCCGCGCGCCCCGGG- TCCCTGGGCGGCAGCCCCTTTCCGAGCCTGGTGGGGTCTCTG- CACAGCGAGCGCACCACCCGCCCTCGGCTGCTGGGCGAGGA- CGAGTACCTGAATAACTCCCTGCTGCAGCCGGTGCGGGA- GAAAAACCTGCCTCCCGCCTTCCCCAACAACGGGATAGAGAG- CCTGGTGGACAAGATGAGCAGATGGAAGACCTATGCGCAGGAG- CACAGGGACGCGCCTGCGCTCCGGCCGCCCACGCGGCGCCAG- CGCCACGACCGGCAGCGGGGGCTGGTGTGGGATGACGAGGAC- TCCGCGGACGATAGCAGCGTGCTGGACCTGGGAGGGAGCGG- CAACCCGTTCGCGCACCTGCGCCCCCGCCTGGGGAGGATGTTT- TAAAAAAAAAAAAAAAAAGCAAGAAGCATGATGCAAAAATTAAA- TAAAACTCACCAAGGCCATGGCGACCGAGCGTTGGTTTCTTGTG- TTCCCTTCAGTATGCGGCGCGCGGCGATGTACCAGGAGGGAC- CTCCTCCCTCTTACGAGAGCGTGGTGGGCGCGGCGGCGGCGG- CGCCCTCTTCTCCCTTTGCGTCGCAGCTGCTGGAGCCGCCG- TACGTGCCTCCGCGCTACCTGCGGCCTACGGGGGGGAGAAACA- GCATCCGTTACTCGGAGCTGGCGCCCCTGTTCGACACCAC- CCGGGTGTACCTGGTGGACAACAAGTCGGCGGACGTGG- CCTCCCTGAACTACCAGAACGACCACAGCAATTTTTTGAC- CACGGTCATCCAGAACAATGACTACAGCCCGAGCGAGGCCAG- CACCCAGACCATCAATCTGGATGACCGGTCGCACTGGGGCGG- CGACCTGAAAACCATCCTGCACACCAACATGCCCAACG- TGAACGAGTTCATGTTCACCAATAAGTTCAAGGCGCGGG- TGATGGTGTCGCGCTCGCACACCAAGGAAGACCGGGTGGAG- CTGAAGTACGAGTGGGTGGAGTTCGAGCTGCCAGAGGGCAAC- TACTCCGAGACCATGACCATTGACCTGATGAACAACGCGATCG- TGGAGCACTATCTGAAAGTGGGCAGGCAGAACGGGGTCCTGGA- GAGCGACATCGGGGTCAAGTTCGACACCAGGAACTTCCG- CCTGGGGCTGGACCCCGTGACCGGGCTGGTTATGCCCGGGG- TGTACACCAACGAGGCCTTCCATCCCGACATCATCCTGCTG- CCCGGCTGCGGGGTGGACTTCACTTACAGCCGCCTGAGCAAC- CTCCTGGGCATCCGCAAGCGGCAGCCCTTCCAGGAGGGCTTCA- GGATCACCTACGAGGACCTGGAGGGGGGCAACATCCCCGCG- CTCCTCGATGTGGAGGCCTACCAGGATAGCTTGAAGGAAAA- TGAGGCGGGACAGGAGGATACCGCCCCCGCCGCCTCCGCCG- CCGCCGAGCAGGGCGAGGATGCTGCTGACACCGCGGCCGCG- GACGGGGCAGAGGCCGACCCCGCTATGGTGGTGGAGG- CTCCCGAGCAGGAGGAGGACATGAATGACAGTGCGGTGCGCG- GAGACACCTTCGTCACCCGGGGGGAGGAAAAGCAAGCGGAGG- CCGAGGCCGCGGCCGAGGAAAAGCAACTGGCGGCAGCAGCGG- CGGCGGCGGCGTTGGCCGCGGCGGAGGCTGAGTCTGAGGGGA- CCAAGCCCGCCAAGGAGCCCGTGATTAAGCCCCTGACCGAAGA- TAGCAAGAAGCGCAGTTACAACCTGCTCAAGGACAGCACCAACA- CCGCGTACCGCAGCTGGTACCTGGCCTACAACTACGGCGAC- CCGTCGACGGGGGTGCGCTCCTGGACCCTGCTGTGCACGCCG- GACGTGACCTGCGGCTCGGAGCAGGTGTACTGGTCGCTG- CCCGACATGATGCAAGACCCCGTGACCTTCCGCTCCACGCGG- CAGGTCAGCAACTTCCCGGTGGTGGGCGCCGAGCTGCTGCCCG- TGCACTCCAAGAGCTTCTACAACGACCAGGCCGTCTACTCCCAG- CTCATCCGCCAGTTCACCTCTCTGACCCACGTGTTCAATCGCTTT- CCTGAGAACCAGATTCTGGCGCGCCCGCCCGCCCCCACCAT- CACCACCGTCAGTGAAAACGTTCCTGCTCTCACAGATCACGGGA- CGCTACCGCTGCGCAACAGCATCGGAGGAGTCCAGCGAGTGAC- CGTTACTGACGCCAGACGCCGCACCTGCCCCTACGTTTA- CAAGGCCTTGGGCATAGTCTCGCCGCGCGTCCTTTCCAGCCG- CACTTTTTGAGCAACACCACCATCATGTCCATCCTGATCTCAC- CCAGCAATAACTCCGGCTGGGGACTGCTGCGCGCGCCCAGCAA- GATGTTCGGAGGGGCGAGGAAGCGTTCCGAGCAGCACCCCG- TGCGCGTGCGCGGGCACTTCCGCGCCCCCTGGGGAGCGCA- CAAACGCGGCCGCGCGGGGCGCACCACCGTGGACGACG- CCATCGACTCGGTGGTGGAGCAGGCGCGCAACTACAGGCCCG- CGGTCTCTACCGTGGACGCGGCCATCCAGACCGTGGTG- CGGGGCGCGCGGCGGTACGCCAAGCTGAAGAGCCGCCGGAAG- CGCGTGGCCCGCCGCCACCGCCGCCGACCCGGGGCCGCCG- CCAAACGCGCCGCCGCGGCCCTGCTTCGCCGGGCCAAGCG- CACGGGCCGCCGCGCCGCCATGAGGGCCGCGCGCCGCTTGG- CCGCCGGCATCACCGCCGCCACCATGGCCCCCCGTACCCGAA- GACGCGCGGCCGCCGCCGCCGCCGCCGCCATCAGTGACATGG- CCAGCAGGCGCCGGGGCAACGTGTACTGGGTGCGCGACTCGG- TGACCGGCACGCGCGTGCCCGTGCGCTTCCGCCCCCCGCGGA- CTTGAGATGATGTGAAAAAACAACACTGAGTCTCCTGCTGTTGTG- TGTATCCCAGCGGCGGCGGCGCGCGCAGCGTCATGTCCAAG- CGCAAAATCAAAGAAGAGATGCTCCAGGTCGTCGCGCCGGAGA- TCTATGGGCCCCCGAAGAAGGAAGAGCAGGATTCGAAGCCCCG- CAAGATAAAGCGGGTCAAAAAGAAAAAGAAAGATGATGACGATG- CCGATGGGGAGGTGGAGTTCCTGCGCGCCACGGCGCCCAGG- CGCCCGGTGCAGTGGAAGGGCCGGCGCGTAAAGCGCGTCCTG- CGCCCCGGCACCGCGGTGGTCTTCACGCCCGGCGAGCG- CTCCACCCGGACTTTCAAGCGCGTCTATGACGAGGTGTACGG- CGACGAAGACCTGCTGGAGCAGGCCAACGAGCGCTTCGGAGAG- TTTGCTTACGGGAAGCGTCAGCGGGCGCTGGGGAAGGAGGAC- CTGCTGGCGCTGCCGCTGGACCAGGGCAACCCCACCCCCAG- TCTGAAGCCCGTGACCCTGCAGCAGGTGCTGCCGAGCAGCG- CACCCTCCGAGGCGAAGCGGGGTCTGAAGCGCGAGGGCGG- CGACCTGGCGCCCACCGTGCAGCTCATGGTGCCCAAGCGGCA- GAGGCTGGAGGATGTGCTGGAGAAAATGAAAGTAGACCCCGG- TCTGCAGCCGGACATCAGGGTCCGCCCCATCAAGCAGGTGGCG- CCGGGCCTCGGCGTGCAGACCGTGGACGTGGTCATCCCCAC- CGGCAACTCCCCCGCCGCCGCCACCACTACCGCTGCCTCCACG- GACATGGAGACACAGACCGATCCCGCCGCAGCCGCAGCCGCA- GCCGCCGCCGCGACCTCCTCGGCGGAGGTGCAGACGGAC- CCCTGGCTGCCGCCGGCGATGTCAGCTCCCCGCGCGCGTCG- CGGGCGCAGGAAGTACGGCGCCGCCAACGCGCTCCTG- CCCGAGTACGCCTTGCATCCTTCCATCGCGCCCACCCCCGGC- TACCGAGGCTATACCTACCGCCCGCGAAGAGCCAAGGGTT- CCACCCGCCGTCCCCGCCGACGCGCCGCCGCCACCACCCG- CCGCCGCCGCCGCAGACGCCAGCCCGCACTGGCTCCAG- TCTCCGTGAGGAAAGTGGCGCGCGACGGACACACCCTGGTG- CTGCCCAGGGCGCGCTACCACCCCAGCATCGTTTAAAAGCCTG- TTGTGGTTCTTGCAGATATGGCCCTCACTTGCCGCCTCCGTTT- CCCGGTGCCGGGATACCGAGGAGGAAGATCGCGCCGCAGGA- GGGGTCTGGCCGGCCGCGGCCTGAGCGGAGGCAGCCGCCG- CGCGCACCGGCGGCGACGCGCCACCAGCCGACGCATGCGCGG- CGGGGTGCTGCCCCTGTTAATCCCCCTGATCGCCGCGG- CGATCGGCGCCGTGCCCGGGATCGCCTCCGTGGCCTTGCAAG- CGTCCCAGAGGCATTGACAGACTTGCAAACTTGCAAATATGGA- AAAAAAAACCCCAATAAAAAAGTCTAGACTCTCACGCTCGCTTGG- TCCTGTGACTATTTTGTAGAATGGAAGACATCAACTTTGCGTCG- CTGGCCCCGCGTCACGGCTCGCGCCCGTTCCTGGGACACTGGA- ACGATATCGGCACCAGCAACATGAGCGGTGGCGCCTTCAG- TTGGGGCTCTCTGTGGAGCGGCATTAAAAGTATCGGGTCTGCCG- TTAAAAATTACGGCTCCCGGGCCTGGAACAGCAGCACGGGCCA- GATGTTGAGAGACAAGTTGAAAGAGCAGAACTTCCAGCAGAAGG- TGGTGGAGGGCCTGGCCTCCGGCATCAACGGGGTGGTGGAC- CTGGCCAACCAGGCCGTGCAGAATAAGATCAACAGCAGACTG- GACCCCCGGCCGCCGGTGGAGGAGGTGCCGCCGGCGCTGGA- GACGGTGTCCCCCGATGGGCGTGGCGAGAAGCGCCCGCGG- CCCGATAGGGAAGAGACCACTCTGGTCACGCAGACCGATGAG- CCGCCCCCGTATGAGGAGGCCCTGAAGCAAGGTCTGCCCAC- CACGCGGCCCATCGCGCCCATGGCCACCGGGGTGGTGGGCCG- CCACACCCCCGCCACGCTGGACTTGCCTCCGCCCGCCGATGTG- CCGCAGCAGCAGAAGGCGGCACAGCCGGGCCCGCCCGCGAC- CGCCTCCCGTTCCTCCGCCGGTCCTCTGCGCCGCGCGGCCAG- CGGCCCCCGCGGGGGGGTCGCGAGGCACGGCAACTGGCAGAG- CACGCTGAACAGCATCGTGGGTCTGGGGGTGCGGTCCGTGAAG- CGCCGCCGATGCTACTGAATAGCTTAGCTAACGTGTTGTATGTG- TGTATGCGCCCTATGTCGCCGCCAGAGGAGCTGCTGAGTCG- CCGCCGTTCGCGCGCCCACCACCACCGCCACTCCGCCCCTCAA- GATGGCGACCCCATCGATGATGCCGCAGTGGTCGTACATGCA- CATCTCGGGCCAGGACGCCTCGGAGTACCTGAGCCCCGGG- CTGGTGCAGTTCGCCCGCGCCACCGAGAGCTACTTCAG- CCTGAGTAACAAGTTTAGGAACCCCACGGTGGCGCCCACG- CACGATGTGACCACCGACCGGTCTCAGCGCCTGACGCTGCGG- TTCATTCCCGTGGACCGCGAGGACACCGCGTACTCGTACAAGG- CGCGGTTCACCCTGGCCGTGGGCGACAACCGCGTGCTGGACA- TGGCCTCCACCTACTTTGACATCCGCGGGGTGCTGGACCGGGG- TCCCACTTTCAAGCCCTACTCTGGCACCGCCTACAACTCCCTGG- CCCCCAAGGGCGCTCCCAACTCCTGCGAGTGGGAGCAAGAGGA- AACTCAGGCAGTTGAAGAAGCAGCAGAAGAGGAAGAAGAAGA- TGCTGACGGTCAAGCTGAGGAAGAGCAAGCAGCTACCAAAAA- GACTCATGTATATGCTCAGGCTCCCCTTTCTGGCGAAAAAATTAG- TAAAGATGGTCTGCAAATAGGAACGGACGCTACAGCTACAGAA- CAAAAACCTATTTATGCAGACCCTACATTCCAGCCCGAACCCCAA- ATCGGGGAGTCCCAGTGGAATGAGGCAGATGCTACAGTCG- CCGGCGGTAGAGTGCTAAAGAAATCTACTCCCATGAAACCATGC- TATGGTTCCTATGCAAGACCCACAAATGCTAATGGAGGTCAGGG- TGTACTAACGGCAAATGCCCAGGGACAGCTAGAATCTCAGG- TTGAAATGCAATTCTTTTCAACTTCTGAAAACGCCCGTAACGAGG- CTAACAACATTCAGCCCAAATTGGTGCTGTATAGTGAGGATGTG- CACATGGAGACCCCGGATACGCACCTTTCTTACAAGCCCG- CAAAAAGCGATGACAATTCAAAAATCATGCTGGGTCAGCAG- TCCATGCCCAACAGACCTAATTACATCGGCTTCAGAGACAACTT- TATCGGCCTCATGTATTACAATAGCACTGGCAACATGGGAGTG- CTTGCAGGTCAGGCCTCTCAGTTGAATGCAGTGGTGGACTTG- CAAGACAGAAACACAGAACTGTCCTACCAGCTCTTGCTTGATT- CCATGGGTGACAGAACCAGATACTTTTCCATGTGGAATCAGGCA- GTGGACAGTTATGACCCAGATGTTAGAATTATTGAAAATCATGGA- ACTGAAGACGAGCTCCCCAACTATTGTTTCCCTCTGGGTGGCA- TAGGGGTAACTGACACTTACCAGGCTGTTAAAACCAACAATGG- CAATAACGGGGGCCAGGTGACTTGGACAAAAGATGAAACTTTTG- CAGATCGCAATGAAATAGGGGTGGGAAACAATTTCGCTATGGA- GATCAACCTCAGTGCCAACCTGTGGAGAAACTTCCTGTAC- TCCAACGTGGCGCTGTACCTACCAGACAAGCTTAAGTACAAC- CCCTCCAATGTGGACATCTCTGACAACCCCAACACCTACGATTA- CATGAACAAGCGAGTGGTGGCCCCGGGGCTGGTGGACTGCTA- CATCAACCTGGGCGCGCGCTGGTCGCTGGACTACATGGA- CAACGTCAACCCCTTCAACCACCACCGCAATGCGGGCCTGCGC- TACCGCTCCATGCTCCTGGGCAACGGGCGCTACGTGCCCTT- CCACATCCAGGTGCCCCAGAAGTTCTTTGCCATCAAGAAC- CTCCTCCTCCTGCCGGGCTCCTACACCTACGAGTGGAACTTCAG- GAAGGATGTCAACATGGTCCTCCAGAGCTCTCTGGG- TAACGATCTCAGGGTGGACGGGGCCAGCATCAAGTTCGAGAG- CATCTGCCTCTACGCCACCTTCTTCCCCATGGCCCACAACACGG- CCTCCACGCTCGAGGCCATGCTCAGGAACGACACCAACGACCA- GTCCTTCAATGACTACCTCTCCGCCGCCAACATGCTCTACCCCA- TACCCGCCAACGCCACCAACGTCCCCATCTCCATCCCCTCGCG- CAACTGGGCGGCCTTCCGCGGCTGGGCCTTCACCCGCCTCAA- GACCAAGGAGACCCCCTCCCTGGGCTCGGGATTCGACCCCTAC- TACACCTACTCGGGCTCCATTCCCTACCTGGACGGCACCTTC- TACCTCAACCACACTTTCAAGAAGGTCTCGGTCACCTTCGAC- TCCTCGGTCAGCTGGCCGGGCAACGACCGTCTGCTCAC- CCCCAACGAGTTCGAGATCAAGCGCTCGGTCGACGGGGAGGGC- TACAACGTGGCCCAGTGCAACATGACCAAGGACTGGTTCCTGG- TCCAGATGCTGGCCAACTACAACATCGGCTACCAGGGCTTCTA- CATCCCAGAGAGCTACAAGGACAGGATGTACTCCTTCTTCAGGA- ACTTCCAGCCCATGAGCCGGCAGGTGGTGGACCAGACCAAGTA- CAAGGACTACCAGGAGGTGGGCATCATCCACCAGCACAACAAC- TCGGGCTTCGTGGGCTACCTCGCCCCCACCATGCGCGAGGGA- CAGGCCTACCCCGCCAACTTCCCCTATCCGCTCATAGGCAAGAC- CGCGGTCGACAGCATCACCCAGAAAAAGTTCCTCTGCGACCG- CACCCTCTGGCGCATCCCCTTCTCCAGCAACTTCATG- TCCATGGGTGCGCTCTCGGACCTGGGCCAGAACTTGCTCTACG- CCAACTCCGCCCACGCCCTCGACATGACCTTCGAGGTCGAC- CCCATGGACGAGCCCACCCTTCTCTATGTTCTGTTCGAAG- TCTTTGACGTGGTCCGGGTCCACCAGCCGCACCGCGGCGT- CATCGAGACCGTGTACCTGCGTACGCCCTTCTCGGCCGG- CAACGCCACCACCTAAAGAAGCAAGCCGCAGTCATCGCCG- CCTGCATGCCGTCGGGTTCCACCGAGCAAGAGCTCAGGG- CCATCGTCAGAGACCTGGGATGCGGGCCCTATTTTTTGGGCAC- CTTCGACAAGCGCTTCCCTGGCTTTGTCTCCCCACACAAGCTGG- CCTGCGCCATCGTCAACACGGCCGGCCGCGAGACCGGGGGCG- TGCACTGGCTGGCCTTCGCCTGGAACCCGCGCTCCAAAACATG- CTTCCTCTTTGACCCCTTCGGCTTTTCGGACCAGCGGCTCAAG- CAAATCTACGAGTTCGAGTACGAGGGCTTGCTGCGTCGCAGCG- CCATCGCCTCCTCGCCCGACCGCTGCGTCACCCTCGAAAAG- TCCACCCAGACCGTGCAGGGGCCCGACTCGGCCGCCTGCGG- TCTCTTCTGCTGCATGTTTCTGCACGCCTTTGTGCACTGGCCT- CAGAGTCCCATGGACCGCAACCCCACCATGAACTTGCTGA- CGGGGGTGCCCAACTCCATGCTCCAGAGCCCCCAGGTCGAG- CCCACCCTGCGCCGCAACCAGGAGCAGCTCTACAGCTTCCTG- GAGCGCCACTCGCCTTACTTCCGCCGCCACAGCGCACAGATCA- GGAGGGCCACCTCCTTCTGCCACTTGCAAGAGATG- CAAGAAGGGTAATAACGATGTACACACTTTTTTTCTCAATAAA- TGGCATCTTTTTATTTATACAAGCTCTCTGGGGTATTCATTT- CCCACCACCACCCGCCGTTGTCGCCATCTGGCTCTATTTAGAAA- TCGAAAGGGTTCTGCCGGGAGTCGCCGTGCGCCACGGGCAGG- GACACGTTGCGATACTGGTAGCGGGTGCCCCACTTGAAC- TCGGGCACCACCAGGCGAGGCAGCTCGGGGAAGTTTTCG- CTCCACAGGCTGCGGGTCAGCACCAGCGCGTTCATCAGG- TCGGGCGCCGAGATCTTGAAGTCGCAGTTGGGGCCGCCG- CCCTGCGCGCGCGAGTTGCGGTACACCGGGTTGCAGCACTGGA- ACACCAACAGCGCCGGGTGCTTCACGCTGGCCAGCACGCTG- CGGTCGGAGATCAGCTCGGCGTCCAGGTCCTCCGCGTTGCTCA- GCGCGAACGGGGTCATCTTGGGCACTTGCCGCCCCAGGA- AGGGCGCGTGCCCCGGTTTCGAGTTGCAGTCGCAGCGCAG- CGGGATCAGCAGGTGCCCGTGCCCGGACTCGGCGTTGGGGTA- CAGCGCGCGCATGAAGGCCTGCATCTGGCGGAAGG- CCATCTGGGCCTTGGCGCCCTCCGAGAAGAACATGCCGCAGGA- CTTGCCCGAGAACTGGTTTGCGGGGCAGCTGGCGTCGTGCAGG- CAGCAGCGCGCGTCGGTGTTGGCGATCTGCACCACGTTGCG- CCCCCACCGGTTCTTCACGATCTTGGCCTTGGACGATTG- CTCCTTCAGCGCGCGCTGCCCGTTCTCGCTGGTCACA- TCCATCTCGATCACATGTTCCTTGTTCACCATGCTGCTGCCGTG- CAGACACTTCAGCTCGCCCTCCGTCTCGGTGCAGCGGTGCTG- CCACAGCGCGCAGCCCGTGGGCTCGAAAGACTTGTAGGTCAC- CTCCGCGAAGGACTGCAGGTACCCCTGCAAAAAGCGGCCCAT- CATGGTCACGAAGGTCTTGTTGCTGCTGAAGGTCAGCTGCAG- CCCGCGGTGCTCCTCGTTCAGCCAGGTCTTGCACACGGCCG- CCAGCGCCTCCACCTGGTCGGGCAGCATCTTGAAGTTCACCTT- CAGCTCATTCTCCACGTGGTACTTGTCCATCAGCGTGCGCGCCG- CCTCCATGCCCTTCTCCCAGGCCGACACCAGCGGCAGGCT- CACGGGGTTCTTCACCATCACCGTGGCCGCCGCCTCCGCCGCG- CTTTCGCTTTCCGCCCCGCTGTTCTCTTCCTCTTCCTCCTCTT- CCTCGCCGCCGCCCACTCGCAGCCCCCGCACCACGGGGTCG- TCTTCCTGCAGGCGCTGCACCTTGCGCTTGCCGTTGCG- CCCCTGCTTGATGCGCACGGGCGGGTTGCTGAAGCCCACCAT- CACCAGCGCGGCCTCTTCTTGCTCGTCCTCGCTGTCCAGAATGA- CCTCCGGGGAGGGGGGGTTGGTCATCCTCAGTACCGAGG- CACGCTTCTTTTTCTTCCTGGGGGCGTTCGCCAGCTCCGCGG- CTGCGGCCGCTGCCGAGGTCGAAGGCCGAGGGCTGGGCGTG- CGCGGCACCAGCGCGTCCTGCGAGCCGTCCTCGTCCTCCTCG- GACTCGAGACGGAGGCGGGCCCGCTTCTTCGGGGGCGCG- CGGGGCGGCGGAGGCGGCGGCGGCGACGGAGACGGGGACGA- GACATCGTCCAGGGTGGGTGGACGGCGGGCCGCGCCGCG- TCCGCGCTCGGGGGTGGTCTCGCGCTGGTCCTCTTCCCGAC- TGGCCATCTCCCACTGCTCCTTCTCCTATAGGCAGAAAGAGAT- CATGGAGTCTCTCATGCGAGTCGAGAAGGAGGAGGACAGCC- TAACCGCCCCCTCTGAGCCCTCCACCACCGCCGCCACCACCG- CCAATGCCGCCGCGGACGACGCGCCCACCGAGACCACCGCCA- GTACCACCCTCCCCAGCGACGCACCCCCGCTCGAGAATGAAG- TGCTGATCGAGCAGGACCCGGGTTTTGTGAGCGGAGAGGAGGA- TGAGGTGGATGAGAAGGAGAAGGAGGAGGTCGCCGCCTCAGTG- CCAAAAGAGGATAAAAAGCAAGACCAGGACGACGCAGATAAGGA- TGAGACAGCAGTCGGGCGGGGGAACGGAAGCCATGATG- CTGATGACGGCTACCTAGACGTGGGAGACGACGTGCTGCT- TAAGCACCTGCACCGCCAGTGCGTCATCGTCTGCGACGCGCTG- CAGGAGCGCTGCGAAGTGCCCCTGGACGTGGCGGAGGTCAG- CCGCGCCTACGAGCGGCACCTCTTCGCGCCGCACGTG- CCCCCCAAGCGCCGGGAGAACGGCACCTGCGAGCCCAACCCG- CGTCTCAACTTCTACCCGGTCTTCGCGGTACCCGAGGTGCTGG- CCACCTACCACATCTTTTTCCAAAACTGCAAGA- TCCCCCTCTCCTGCCGCGCCAACCGCACCCGCGCCGACAAAAC- CCTGACCCTGCGGCAGGGCGCCCACATACCTGATATCG- CCTCTCTGGAGGAAGTGCCCAAGATCTTCGAGGGTCTCGGTCG- CGACGAGAAACGGGCGGCGAACGCTCTGCACGGAGACAG- CGAAAACGAGAGTCACTCGGGGGTGCTGGTGGAGCTCGAGGG- CGACAACGCGCGCCTGGCCGTACTCAAGCGCAGCATAGAGGT- CACCCACTTTGCCTACCCGGCGCTCAACCTGCCCCCCAAGGT- CATGAGTGTGGTCATGGGCGAGCTCATCATGCGCCGCGCCCAG- CCCCTGGCCGCGGATGCAAACTTGCAAGAGTCCTCCGAGGA- AGGCCTGCCCGCGGTCAGCGACGAGCAGCTGGCGCGCTGG- CTGGAGACCCGCGACCCCGCGCAGCTGGAGGAGCGGCGCAAG- CTCATGATGGCCGCGGTGCTGGTCACCGTGGAGCTCGAGTG- TCTGCAGCGCTTCTTCGCGGACCCCGAGATGCAGCGCAAG- CTCGAGGAGACCCTGCACTACACCTTCCGCCAGGGCTACGTG- CGCCAGGCCTGCAAGATCTCCAACGTGGAGCTCTGCAACCTGG- TCTCCTACCTGGGCATCCTGCACGAGAACCGCCTCGGGCA- GAACGTCCTGCACTCCACCCTCAAAGGGGAGGCGCGCCGCGAC- TACATCCGCGACTGCGCCTACCTCTTCCTCTGCTACACCTGGCA- GACGGCCATGGGGGTCTGGCAGCAGTGCCTGGAGGAGCG- CAACCTCAAGGAGCTGGAAAAGCTCCTCAAGCGCACCCTCAGG- GACCTCTGGACGGGCTTCAACGAGCGCTCGGTGGCCGCCGCG- CTGGCGGACATCATCTTTCCCGAGCGCCTGCTCAAGACCCTG- CAGCAGGGCCTGCCCGACTTCACCAGCCAGAGCATGCTGCA- GAACTTCAGGACTTTCATCCTGGAGCGCTCGGGCATCCTG- CCGGCCACTTGCTGCGCGCTGCCCAGCGACTTCGTGCCCAT- CAAGTACAGGGAGTGCCCGCCGCCGCTCTGGGGCCACTGCTAC- CTCTTCCAGCTGGCCAACTACCTCGCCTACCACTCGGACCT- CATGGAAGACGTGAGCGGCGAGGGCCTGCTCGAGTGCCACTG- CCGCTGCAACCTCTGCACGCCCCACCGCTCTCTAGTCTGCAAC- CCGCAGCTGCTCAGCGAGAGTCAGATTATCGGTACCTTCGAG- CTGCAGGGTCCCTCGCCTGACGAGAAGTCCGCGGCTCCAGGG- CTGAAACTCACTCCGGGGCTGTGGACTTCCGCCTACCTACGCAA- ATTTGTACCTGAGGACTACCACGCCCACGAGATCAGGTTC- TACGAAGACCAATCCCGCCCGCCCAAGGCGGAGCTCACCG- CCTGCGTCATCACCCAGGGGCACATCCTGGGCCAATTGCAAG- CCATCAACAAAGCCCGCCGAGAGTTCTTGCTGAAAAAGGG- TCGGGGGGTGTACCTGGACCCCCAGTCCGGCGAGGAGCTAAAC- CCGCTACCCCCGCCGCCGCCCCAGCAGCGGGACCTTGCTT- CCCAGGATGGCACCCAGAAAGAAGCAGCAGCCGCCGCCGCCG- CCGCAGCCATACATGCTTCTGGAGGAAGAGGAGGAGGACTGG- GACAGTCAGGCAGAGGAGGTTTCGGACGAGGAGCAGGAGGAGA- TGATGGAAGACTGGGAGGAGGACAGCAGCCTAGACGAGGAAG- CTTCAGAGGCCGAAGAGGTGGCAGACGCAACACCATCG- CCCTCGGTCGCAGCCCCCTCGCCGGGGCCCCTGAAA- TCCTCCGAACCCAGCACCAGCGCTATAACCTCCGCTCCTCCGG- CGCCGGCGCCACCCGCCCGCAGACCCAACCGTAGATGGGACA- CCACAGGAACCGGGGTCGGTAAGTCCAAGTGCCCGCCGCCG- CCACCGCAGCAGCAGCAGCAGCAGCGCCAGGGCTACCGCTCG- TGGCGCGGGCACAAGAACGCCATAGTCGCCTGCTTGCAAGAC- TGCGGGGGCAACATCTCTTTCGCCCGCCGCTTCCTGCTATT- CCACCACGGGGTCGCCTTTCCCCGCAATGTCCTGCATTACTAC- CGTCATCTCTACAGCCCCTACTGCAGCGGCGACCCAGAGGCGG- CAGCGGCAGCCACAGCGGCGACCACCACCTAGGAAGATA- TCCTCCGCGGGCAAGACAGCGGCAGCAGCGGCCAGGAGAC- CCGCGGCAGCAGCGGCGGGAGCGGTGGGCGCACTGCG- CCTCTCGCCCAACGAACCCCTCTCGACCCGGGAGCTCAGACA- CAGGATCTTCCCCACTTTGTATGCCATCTTCCAACAGAGCA- GAGGCCAGGAGCAGGAGCTGAAAATAAAAAACAGATCTCTGCG- CTCCCTCACCCGCAGCTGTCTGTATCACAAAAGCGAAGATCAG- CTTCGGCGCACGCTGGAGGACGCGGAGGCACTCTTCAGCAAA- TACTGCGCGCTCACTCTTAAAGACTAGCTCCGCGCCCTTCTCGA- ATTTAGGCGGGAGAAAACTACGTCATCGCCGGCCGCCGCCCAG- CCCGCCCAGCCGAGATGAGCAAAGAGATTCCCACGCCATACA- TGTGGAGCTACCAGCCGCAGATGGGACTCGCGGCGGGAGCGG- CCCAGGACTACTCCACCCGCATGAACTACATGAGCGCGGGAC- CCCACATGATCTCACAGGTCAACGGGATCCGCGCCCAG- CGAAACCAAATACTGCTGGAACAGGCGGCCATCACCGCCACG- CCCCGCCATAATCTCAACCCCCGAAATTGGCCCGCCGCCCTCG- TGTACCAGGAAACCCCCTCCGCCACCACCGTACTACTTCCGCG- TGACGCCCAGGCCGAAGTCCAGATGACTAACTCAGGGGCGCAG- CTCGCGGGCGGCTTTCGTCACGGGGCGCGGCCGCTCCGACCA- GGTATAAGACACCTGATGATCAGAGGCCGAGGTATCCAGCT- CAACGACGAGTCGGTGAGCTCTTCGCTCGGTCTCCGTCCGGA- CGGAACTTTCCAGCTCGCCGGATCCGGCCGCTCTTCGTTCACG- CCCCGCCAGGCGTACCTGACTCTGCAGACCTCGTCCTCGGAG- CCCCGCTCCGGCGGCATCGGAACCCTCCAGTTCGTGGAGGAG- TTCGTGCCCTCGGTCTACTTCAACCCCTTCTCGGGACCTCCCG- GACGCTACCCCGACCAGTTCATTCCGAACTTTGACGCGGTGAAG- GACTCGGCGGACGGCTACGACTGAATGTCAGGTGTCGAGGCA- GAGCAGCTTCGCCTGAGACACCTCGAGCACTGCCGCCGCCA- CAAGTGCTTCGCCCGCGGTTCTGGTGAGTTCTGCTACTTTCAGC- TACCCGAGGAGCATACCGAGGGGCCGGCGCACGGCGTCCG- CCTGACCACCCAGGGCGAGGTTACCTGTTCCCTCATCCGGGAG- TTTACCCTCCGTCCCCTGCTAGTGGAGCGGGAGCGGGG- TCCCTGTGTCCTAACTATCGCCTGCAACTGCCCTAACCCTGGAT- TACATCAAGATCTTTGCTGTCATCTCTGTGCTGAGTTTAA- TAAACGCTGAGATCAGAATCTACTGGGGCTCCTGTCG- CCATCCTGTGAACGCCACCGTCTTCACCCACCCCGACCAGG- CCCAGGCGAACCTCACCTGCGGTCTGCATCGGAGGG- CCAAGAAGTACCTCACCTGGTACTTCAACGGCACCCCCTTTG- TGGTTTACAACAGCTTCGACGGGGACGGAGTCTCCCTGAAAGAC- CAGCTCTCCGGTCTCAGCTACTCCATCCACAAGAACACCAC- CCTCCAACTCTTCCCTCCCTACCTGCCGGGAACCTACGAGTGCG- TCACCGGCCGCTGCACCCACCTCACCCGCCTGATCGTAAACCA- GAGCTTTCCGGGAACAGATAACTCCCTCTTCCCCAGAACAGGA- GGTGAGCTCAGGAAACTCCCCGGGGACCAGGGCGGAGACG- TACCTTCGACCCTTGTGGGGTTAGGATTTTTTATTACCGGGTTG- CTGGCTCTTTTAATCAAAGTTTCCTTGAGATTTGTTCTTTCCTTC- TACGTGTATGAACACCTCAACCTCCAATAACTCTACCCTTTCTT- CGGAATCAGGTGACTTCTCTGAAATCGGGCTTGGTGTGCTGCT- TACTCTGTTGATTTTTTTCCTTATCATACTCAGCCTTCTGTGCCT- CAGGCTCGCCGCCTGCTGCGCACACATCTATATCTACTGCTGG- TTGCTCAAGTGCAGGGGTCGCCACCCAAGATGAACAGGTACA- TGGTCCTATCGATCCTAGGCCTGCTGGCCCTGGCGGCCTGCAG- CGCCGCCAAAAAAGAGATTACCTTTGAGGAGCCCGCTTGCAATG- TAACTTTCAAGCCCGAGGGTGACCAATGCACCACCCTCGTCAAA- TGCGTTACCAATCATGAGAGGCTGCGCATCGACTACAAAAA- CAAAACTGGCCAGTTTGCGGTCTATAGTGTGTTTACGCCCGGA- GACCCCTCTAACTACTCTGTCACCGTCTTCCAGGGCGGACAGTC- TAAGATATTCAATTACACTTTCCCTTTTTATGAGTTATGCGATG- CGGTCATGTACATGTCAAAACAGTACAACCTGTGG- CCTCCCTCTCCCCAGGCGTGTGTGGAAAATACTGGGTCTTACTG- CTGTATGGCTTTCGCAATCACTACGCTCGCTCTAATCTGCACGG- TGCTATACATAAAATTCAGGCAGAGGCGAATCTTTA- TCGATGAAAAGAAAATGCCTTGATCGCTAACACCGGCTTTCTA- TCTGCAGAATGAATGCAATCACCTCCCTACTAATCACCACCAC- CCTCCTTGCGATTGCCCATGGGTTGACACGAATCGAAGTGCCAG- TGGGGTCCAATGTCACCATGGTGGGCCCCGCCGGCAATTCCAC- CCTCATGTGGGAAAAATTTGTCCGCAATCAATGGGTTCATTTCTG- CTCTAACCGAATCAGTATCAAGCCCAGAGCCATCTGCGATGGG- CAAAATCTAACTCTGATCAATGTGCAAATGATGGATGCTGGGTAC- TATTACGGGCAGCGGGGAGAAATCATTAATTACTGGCGACCCCA- CAAGGACTACATGCTGCATGTAGTCGAGGCACTTCCCACTAC- CACCCCCACTACCACCTCTCCCACCACCACCACCACTACTAC- TACTACTACTACTACTACTACTACTACCACTACCGCTGCCCGCCA- TACCCGCAAAAGCACCATGATTAGCACAAAGCCCCCTCGTGCT- CACTCCCACGCCGGCGGGCCCATCGGTGCGACCTCAGAAAC- CACCGAGCTTTGCTTCTGCCAATGCACTAACGCCAGCGCT- CATGAACTGTTCGACCTGGAGAATGAGGATGTCCAGCAGAG- CTCCGCTTGCCTGACCCAGGAGGCTGTGGAGCCCGTTG- CCCTGAAGCAGATCGGTGATTCAATAATTGACTCTTCTTCTTTTG- CCACTCCCGAATACCCTCCCGATTCTACTTTCCACATCACGGG- TACCAAAGACCCTAACCTCTCTTTCTACCTGATGCTGCTGCTCTG- TATCTCTGTGGTCTCTTCCGCGCTGATGTTACTGGGGATGTT- CTGCTGCCTGATCTGCCGCAGAAAGAGAAAAGCTCGCTCTCA- GGGCCAACCACTGATGCCCTTCCCCTACCCCCCGGATTTTGCA- GATAACAAGATATGAGCTCGCTGCTGACACTAACCGCTTTAC- TAGCCTGCGCTCTAACCCTTGTCGCTTGCGACTCGAGATTCCA- CAATGTCACAGCTGTGGCAGGAGAAAATGTTACTTTCAAC- TCCACGGCCGATACCCAGTGGTCGTGGAGTGGCTCAGGTAGC- TACTTAACTATCTGCAATAGCTCCACTTCCCCCGGCATA- TCCCCAACCAAGTACCAATGCAATGCCAGCCTGTTCACCCTCAT- CAACGCTTCCACCCTGGACAATGGACTCTATGTAGGCTATGTAC- CCTTTGGTGGGCAAGGAAAGACCCACGCTTACAACCTGGAAGTT- CGCCAGCCCAGAACCACTACCCAAGCTTCTCCCACCACCACCAC- CACCACCACCATCACCAGCAGCAGCAGCAGCAGCAGCCACAG- CAGCAGCAGCAGATTATTGACTTTGGTTTTGGCCAGCTCATCTG- CCGCTACCCAGGCCATCTACAGCTCTGTGCCCGAAACCACTCA- GATCCACCGCCCAGAAACGACCACCGCCACCACCCTACACAC- CTCCAGCGATCAGATGCCGACCAACATCACCCCCTTGGCTCTT- CAAATGGGACTTACAAGCCCCACTCCAAAACCAGTGGATGCGG- CCGAGGTCTCCGCCCTCGTCAATGACTGGGCGGGGCTGGGAA- TGTGGTGGTTCGCCATAGGCATGATGGCGCTCTGCCTGCTTCTG- CTCTGGCTCATCTGCTGCCTCCACCGCAGGCGAGCCAGAC- CCCCCATCTATAGACCCATCATTGTCCTGAACCCCGATAA- TGATGGGATCCATAGATTGGATGGCCTGAAAAACCTACTTTTTT- CTTTTACAGTATGATAAATTGAGACATGCCTCGCATTTTCTTGTA- CATGTTCCTTCTCCCACCTTTTCTGGGGTGTTCTACGCTGGCCG- CTGTGTCTCACCTGGAGGTAGACTGCCTCTCACCCTTCACTGTC- TACCTGCTTTACGGATTGGTCACCCTCACTCTCATCTGCAGCCTA- ATCACAGTAATCATCGCCTTCATCCAGTGCATTGATTACATCTG- TGTGCGCCTCGCATACTTCAGACACCACCCGCAGTACCGAGA- CAGGAACATTGCCCAACTTCTAAGACTGCTCTAATCATGCATAA- GACTGTGATCTGCCTTCTGATCCTCTGCATCCTGCCCACCCT- CACCTCCTGCCAGTACACCACAAAATCTCCGCGCAAAAGACATG- CCTCCTGCCGCTTCACCCAACTGTGGAATATACCCAAATGCTA- CAACGAAAAGAGCGAGCTCTCCGAAGCTTGGCTGTATGGGGT- CATCTGTGTCTTAGTTTTCTGCAGCACTGTCTTTGCCCTCATAA- TCTACCCCTACTTTGATTTGGGATGGAACGCGATCGATG- CCATGAATTACCCCACCTTTCCCGCACCCGAGATAATTCCACTG- CGACAAGTTGTACCCGTTGTCGTTAATCAACGCCCCCCATCCCC- TACGCCCACTGAAATCAGCTACTTTAACCTAACAGGCGGAGA- TGACTGACGCCCTAGATCTAGAAATGGACGGCATCAGTACCGAG- CAGCGTCTCCTAGAGAGGCGCAGGCAGGCGGCTGAGCAAGAG- CGCCTCAATCAGGAGCTCCGAGATCTCGTTAACCTGCACCAGTG- CAAAAGAGGCATCTTTTGTCTGGTAAAGCAGGCCAAAGTCACC- TACGAGAAGACCGGCAACAGCCACCGCCTCAGTTACAAATTG- CCCACCCAGCGCCAGAAGCTGGTGCTCATGGTGGGTGAGAA- TCCCATCACCGTCACCCAGCACTCGGTAGAGACCGAGGGGTG- TCTGCACTCCCCCTGTCGGGGTCCAGAAGACCTCTGCAC- CCTGGTAAAGACCCTGTGCGGTCTCAGAGATTTAGTCCCCTT- TAACTAATCAAACACTGGAATCAATAAAAAGAATCACTTACTTAAA- ATCAGACAGCAGGTCTCTGTCCAGTTTATTCAGCAGCAC- CTCCTTCCCCTCCTCCCAACTCTGGTACTCCAAACGCCTTCTGG- CGGCAAACTTCCTCCACACCCTGAAGGGAATGTCAGATTCTTG- CTCCTGTCCCTCCGCACCCACTATCTTCATGTTGTTGCAGA- TGAAGCGCACCAAAACGTCTGACGAGAGCTTCAACCCCGTGTAC- CCCTATGACACGGAAAGCGGCCCTCCCTCCGTCCCTTTCCTCAC- CCCTCCCTTCGTGTCTCCCGATGGATTCCAAGAAAG- TCCCCCCGGGGTCCTGTCTCTGAACCTGGCCGAGCCCCTGGT- CACTTCCCACGGCATGCTCGCCCTGAAAATGGGAAGTGG- CCTCTCCCTGGACGACGCTGGCAACCTCACCTCTCAAGATAT- CACCACCGCTAGCCCTCCCCTCAAAAAAACCAAGACCAACCTCA- GCCTAGAAACCTCATCCCCCCTAACTGTGAGCACCTCAGGCG- CCCTCACCGTAGCAGCCGCCGCTCCCCTGGCGGTGGCCGG- CACCTCCCTCACCATGCAATCAGAGGCCCCCCTGACAGTACAG- GATGCAAAACTCACCCTGGCCACCAAAGGCCCCCTGACCGTG- TCTGAAGGCAAACTGGCCTTGCAAACATCGGCCCCGCTGACGG- CCGCTGACAGCAGCACCCTCACAGTCAGTGCCACACCACCCCT- TAGCACAAGCAATGGCAGCTTGGGTATTGACATGCAAG- CCCCCATTTACACCACCAATGGAAAACTAGGACTTAACTTTGG- CGCTCCCCTGCATGTGGTAGACAGCCTAAATGCACTGACTGTAG- TTACTGGCCAAGGTCTTACGATAAACGGAACAGCCCTACAAAC- TAGAGTCTCAGGTGCCCTCAACTATGACACATCAGGAAACC- TAGAATTGAGAGCTGCAGGGGGTATGCGAGTTGATGCAAATGGT- CAACTTATCCTTGATGTAGCTTACCCATTTGATGCACAAAACAA- TCTCAGCCTTAGGCTTGGACAGGGACCCCTGTTTGTTAACTCTG- CCCACAACTTGGATGTTAACTACAACAGAGGCCTCTACCTGTT- CACATCTGGAAATACCAAAAAGCTAGAAGTTAATATCAAAACAG- CCAAGGGTCTCATTTATGATGACACTGCTATAGCAATCAATG- CGGGTGATGGGCTACAGTTTGACTCAGGCTCAGATACAAA- TCCATTAAAAACTAAACTTGGATTAGGACTGGATTATGACTCCAG- CAGAGCCATAATTGCTAAACTGGGAACTGGCCTAAGCTTTGA- CAACACAGGTGCCATCACAGTAGGCAACAAAAATGATGACAAG- CTTACCTTGTGGACCACACCAGACCCATCCCCTAACTGTAGAA- TCTATTCAGAGAAAGATGCTAAATTCACACTTGTTTTGACTAAA- TGCGGCAGTCAGGTGTTGGCCAGCGTTTCTGTTTTATCTG- TAAAAGGTAGCCTTGCGCCCATCAGTGGCACAGTAACTAGTGCT- CAGATTGTCCTCAGATTTGATGAAAATGGAGTTCTACTAAGCAA- TTCTTCCCTTGACCCTCAATACTGGAACTACAGAAAAGGTGACCT- TACAGAGGGCACTGCATATACCAACGCAGTGGGATTTATG- CCCAACCTCACAGCATACCCAAAAACACAGAGCCAAACTGC- TAAAAGCAACATTGTAAGTCAGGTTTACTTGAATGGGGACAAA- TCCAAACCCATGACCCTCACCATTACCCTCAATGGAACTAA- TGAAACAGGAGATGCCACAGTAAGCACTTACTCCATGTCATTCT- CATGGAACTGGAATGGAAGTAATTACATTAATGAAACGTT- CCAAACCAACTCCTTCACCTTCTCCTACATCGCCCAAGAA- TAAAAAGCATGACGCTGTTGATTTGATTCAATGTGTTTCTGTTTTA- TTTTCAAGCACAACAAAATCATTCAAGTCATTCTTCCATCTTAGCT- TAATAGACACAGTAGCTTAATAGACCCAGTAGTGCAAAG- CCCCATTCTAGCTTATAGATCAGACAGTGATAATTAACCACCAC- CACCACCATACCTTTTGATTCAGGAAATCATGATCATCACAGGA- TCCTAGTCTTCAGGCCGCCCCCTCCCTCCCAAGACACAGAATA- CACAGTCCTCTCCCCCCGACTGGCTTTAAATAACACCATCTGG- TTGGTCACAGACATGTTCTTAGGGGTTATATTCCACACGG- TCTCCTGCCGCGCCAGGCGCTCGTCGGTGATGTTGATAAAC- TCTCCCGGCAGCTCGCTCAAGTTCACGTCGCTGTCCAGCGG- CTGAACCTCCGGCTGACGCGATAACTGTGCGACCGGCTGCTG- GACGAACGGAGGCCGCGCCTACAAGGGGGTAGAGTCATAA- TCCTCGGTCAGGATAGGGCGGTGATGCAGCAGCAGCGAG- CGAAACATCTGCTGCCGCCGCCGCTCCGTCCGGCAGGAAAA- CAACACGCCGGTGGTCTCCTCCGCGATAATCCGCACCGCCCG- CAGCATCAGCTTCCTCGTTCTCCGCGCGCAGCACCTCACCCTTA- TCTCGCTCAAATCGGCGCAGTAGGTACAGCACAGCACCACGATG- TTATTCATGATCCCACAGTGCAGGGCGCTGTATCCAAAGCT- CATGCCGGGAACCACCGCCCCCACGTGGCCATCGTACCACAAG- CGCACGTAAATCAAGTGTCGACCCCTCATGAACGCGCTGGACA- CAAACATTACTTCCTTGGGCATGTTGTAATTCACCACCTCCCGG- TACCAGATAAACCTCTGGTTGAACAGGGCACCTTCCACCAC- CATCCTGAACCAAGAGGCCAGAACCTGCCCACCGGCTATGCAC- TGCAGGGAACCCGGGTTGGAACAATGACAATGCAGAC- TCCAAGGCTCGTAACCGTGGATCATCCGGCTGCTGAAGG- CATCGATGTTGGCACAACACAGACACACGTGCATGCACTTTCT- CATGATTAGCAGCTCTTCCCTCGTCAGGATCATATCCCAAGGAA- TAACCCATTCTTGAATCAACGTAAAACCCACACAGCAGGGAAGG- CCTCGCACATAACTCACGTTGTGCATGGTCAGCGTGTTGCATT- CCGGAAACAGCGGATGATCCTCCAGTATCGAGGCGCGGG- TCTCCTTCTCACAGGGAGGTAAAGGGTCCCTGCTGTACGGACTG- CGCCGGGACGACCGAGATCGTGTTGAGCGTAGTGTCATGGA- AAAGGGAACGCCGGACGTGGTCATACTTCTTGAAGCAGAACCA- GGTTCGCGCGTGGCAGGCCTCCTTGCGTCTGCGGTCTCGCCG- TCTAGCTCGCTCCGTGTGATAGTTGTAGTACAGCCACTCCCGCA- GAGCGTCGAGGCGCACCCTGGCTTCCGGATCTATGTAGAC- TCCGTCTTGCACCGCGGCCCTGATAATATCCACCACCGTAGAA- TAAGCAACACCCAGCCAAGCAATACACTCGCTCTGCGAGCGG- CAGACAGGAGGAGCGGGCAGAGATGGGAGAACCATGA- TAAAAAACTTTTTTTAAAGAATATTTTCCAATTCTTCGAAAGTAA- GATCTATCAAGTGGCAGCGCTCCCCTCCACTGGCGCGGTCAAAC- TCTACGGCCAAAGCACAGACAACGGCATTTCTAAGATGTTCCTTA- ATGGCGTCCAAAAGACACACCGCTCTCAAGTTGCAGTAAACTA- TGAATGAAAACCCATCCGGCTGATTTTCCAATATAGACGCG- CCGGCAGCGTCCACCAAACCCAGATAATTTTCTTCTCTCCAG- CGGTTTACGATCTGTCTAAGCAAATCCCTTATATCAAGTCCGAC- CATGCCAAAAATCTGCTCAAGAGCGCCCTCCACCTTCATGTA- CAAGCAGCGCATCATGATTGCAAAAATTCAGGTTCTTCAGAGAC- CTGTATAAGATTCAAAATGGGAACATTAACAAAAATTCCTCTG- TCGCGCAGATCCCTTCGCAGGGCAAGCTGAACATAATCAGACA- GGTCCGAACGGACCAGTGAGGCCAAATCCCCACCAGGAACCA- GATCCAGAGACCCTATACTGATTATGACGCGCATACTCGGGGC- TATGCTGACCAGCGTAGCGCCGATGTAGGCGTGCTGCATGGG- CGGCGAGATAAAATGCAAAGTGCTGGTTAAAAAATCAGGCAAAG- CCTCGCGCAAAAAAGCTAACACATCATAATCATGCTCATGCAGG- TAGTTGCAGGTAAGCTCAGGAACCAAAACGGAATAACACA- CGATTTTCCTCTCAAACATGACTTCGCGGATACTGCGTAAAA- CAAAAAATTATAAATAAAAAATTAATTAAATAACTTAAACATTGGA- AGCCTGTCTCACAACAGGAAAAACCACTTTAATCAACATAAGA- CGGGCCACGGGCATGCCGGCATAGCCGTAAAAAAATTGG- TCCCCGTGATTAACAAGTACCACAGACAGCTCCCCGGTCATG- TCGGGGGTCATCATGTGAGACTCTGTATACACGTCTGGATTG- TGAACATCAGACAAACAAAGAAATCGAGCCACGTAGCCCGGAGG- TATAATCACCCGCAGGCGGAGGTACAGCAAAACGACCCCCATA- GGAGGAATCACAAAATTAGTAGGAGAAAAAAATACATAAACAC- CAGAAAAACCCTGTTGCTGAGGCAAAATAGCG- CCCTCCCGATCCAAAACAACATAAAGCGCTTCCACAGGAGCAG- CCATAACAAAGACCCGAGTCTTACCAGTAAAAGAAAAAAGA- TCTCTCAACGCAGCACCAGCACCAACACTTCGCAGTGTAAAAGG- CCAAGTGCCGAGAGAGTATATATAGGAATAAAAAGTGACG- TAAACGGGCAAAGTCCAAAAAACGCCCAGAAAAACCGCACG- CGAACCTACGCCCCGAAACGAAAGCCAAAAAACACTAGACAC- TCCCTTCCGGCGTCAACTTCCGCTTTCCCACGCTACGTCACTT- CCCCCGGTCAAACAAACTACATATCCCGAACTTCCAAGTCG- CCACGCCCAAAACACCGCCTACACCTCCCCGCCCGCCGGCCCG- CCCCCGGACCCGCCTCCCGCCCCGCGCCGCCCATCTCATTAT-
CATATTGGCTTCAATCCAAAATAAGGTATATTATTGATGATG SEQ ID NO: 2 - Sequência polinucleotídica que codifica o promo- tor CASI GGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGG- CTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACG- TATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAA- TGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACAT- CAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGA- CGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTA- TGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGC- TATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCAC- TCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATT- TATTTTTTAATTATTTTGTGCAGCGATGGGGG- CGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGG- CGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGG- CGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTA- TGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCG- CTCCCTATCAGTGATAGAGATCTCCCTATCAGTGATAGAGATCG- TCGACGAGCTCGCGGCGGGCGGGAGTCGCTGCGCGCTGCCTT- CGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCG- CCCCGGCTCTGACTGACCGCGTTACTAAAACAGGTAAGTCCGG- CCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCG- CCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGG- CGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAG-
CGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAG- CAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCAC- TGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAG- TCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGG- TGAACGCCGATGATGCCTCTACTAACCATGTTCATGTTTT-
CTTTTTTTTTCTACAGGTCCTGGGTGACGAACAG SEQ ID NO: 3 - Sequência polinucleotídica que codifica o promo- tor de hCMV intensificado CCATTGCATACGTTGTATCCATATCATAATATGTACATTTATA- TTGGCTCATGTCCAACATTACCGCCATGTTGACATTGATTATTGA- CTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAG- CCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGG- CCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCA- ATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTT- CCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCAC- TTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTA- TTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAG- TACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTA- TTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACAT- CAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAG- TCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAA- TCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGA- CGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATA- TAAGGCGAAGCGCTCCCTATCAGTGATAGAGATCTCCCTATCAG- TGATAGAGATCGTCGACGAGCTCGCGGCGGGCGGGAGTCG- CTGCGCGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCG- CCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTAC- TAAAACAGGTAAGTCCGGCCTCCGCGCCGGGTTTTGGCG- CCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACG- TCAGACGAAGGGCGCAGCGAGCGTCCTGATCCTTCCGCCCGGA-
CGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCT- TAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGAC- TTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAA- CAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGG- GATCTCCGTGGGGCGGTGAACGCCGATGATGCCTCTACTAAC- CATGTTCATGTTTTCTTTTTTTTTCTACAGGTCCTGGGTGACGAA-
CAG SEQ ID NO: 4 - Sequência polinucleotídica que codifica a cassete de hCMV NM2 bghpolyA CCATTGCATACGTTGTATCCATATCATAATATGTACATTTATA- TTGGCTCATGTCCAACATTACCGCCATGTTGACATTGATTA- TTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCA- TAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAA- TGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGA- CGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGAC- TTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTG- CCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACG- CCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCAT- TATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTA- CATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG- TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACT- CACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAG- TTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCG- TAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTG- TACGGTGGGAGGTCTATATAAGCAGAGCTCTCCCTATCAGTGA- TAGAGATCTCCCTATCAGTGATAGAGATCGTCGACGAGCTCG- TTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTG- TTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCG- CGGCCGGGAACGGTGCATTGGAACGCGGATTCCCCGTG- CCAAGAGTGAGATCTTCCGTTTATCTAGGTACCAGATATCG-
CCACCATGGCCCTGAGCAAAGTGAAACTGAACGATACACTGAA- CAAGGACCAGCTGCTGTCCAGCAGCAAGTACACCATCCAGCG- GAGCACCGGCGACAGCATCGATACCCCCAACTACGACGTGCA- GAAGCACATCAACAAGCTGTGCGGCATGCTGCTGATCACAGAG- GACGCCAACCACAAGTTCACCGGCCTGATCGGCATGCTGTACG- CCATGAGCCGGCTGGGCCGGGAGGACACCATCAAGATCCTG- CGGGACGCCGGCTACCACGTGAAGGCCAATGGCGTGGACG- TGACCACACACCGGCAGGACATCAACGGCAAAGAAATGAAGTT- CGAGGTGCTGACCCTGGCCAGCCTGACCACCGAGATCCAGAT- CAATATCGAGATCGAGAGCCGGAAGTCCTACAAGAAAATG- CTGAAAGAAATGGGCGAGGTGGCCCCCGAGTACAGACACGACA- GCCCCGACTGCGGCATGATCATCCTGTGTATCGCCGCCCTGG- TGATCACAAAGCTGGCCGCTGGCGACAGATCTGGCCTGACAG- CCGTGATCAGACGGGCCAACAATGTGCTGAAGAACGAGA- TGAAGCGGTACAAGGGCCTGCTGCCCAAGGACATTGCCAACAG- CTTCTACGAGGTGTTCGAGAAGTACCCCCACTTCATCGACGTG- TTCGTGCACTTCGGCATTGCCCAGAGCAGCACCAGAGGCGG- CTCCAGAGTGGAGGGCATCTTCGCCGGCCTGTTCATGAACGCC- TACGGCGCTGGCCAGGTGATGCTGAGATGGGGCGTGCTGG- CCAAGAGCGTGAAGAACATCATGCTGGGCCACGCCAGCGTGCA- GGCCGAGATGGAACAGGTGGTGGAGGTGTACGAGTACGCCCA- GAAGCTGGGCGGAGAGGCCGGCTTCTACCACATCCTGAACAAC- CCTAAGGCCTCCCTGCTGTCCCTGACCCAGTTCCCCCACTT- CTCCAGCGTGGTGCTGGGAAATGCCGCCGGACTGGGCAT- CATGGGCGAGTACCGGGGCACCCCCAGAAACCAGGACCTG- TACGACGCCGCCAAGGCCTACGCCGAGCAG- CTGAAAGAAAACGGCGTGATCAACTACAGCGTGCTGGACCTGAC- CGCTGAGGAACTGGAAGCCATCAAGCACCAGCTGAACCCCAAG- GACAACGACGTGGAGCTGGGAGGCGGAGGATCTGGCGGCGGA- GGCATGAGCAGACGGAACCCCTGCAAGTTCGAGATCCGGGG- CCACTGCCTGAACGGCAAGCGGTGCCACTTCAGCCACAACTAC- TTCGAGTGGCCCCCTCATGCTCTGCTGGTGCGGCAGAACTT- CATGCTGAACCGGATCCTGAAGTCCATGGACAAGAGCATCGACA- CCCTGAGCGAGATCAGCGGAGCCGCCGAGCTGGACAGAAC- CGAGGAATATGCCCTGGGCGTGGTGGGAGTGCTGGAAAGCTA- CATCGGCTCCATCAACAACATCACAAAGCAGAGCGCCTGCG- TGGCCATGAGCAAGCTGCTGACAGAGCTGAACAGCGACGACAT- CAAGAAGCTGAGGGACAACGAGGAACTGAACAGCCCCAAGA- TCCGGGTGTACAACACCGTGATCAGCTACATTGAGAGCAACCG- CAAGAACAACAAGCAGACCATCCATCTGCTGAAGCGGCTG- CCCGCCGACGTGCTGAAAAAGACCATCAAGAACACCCTGGACA- TCCACAAGTCCATCACCATCAACAATCCCAAAGAAAGCACCGTG- TCTGACACCAACGATCACGCCAAGAACAACGACACCAC- CTGATGAGCGGCCGCGATCTGCTGTGCCTTCTAGTTGCCAG- CCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGA- AGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTG- CATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGG- TGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAA- TAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG
[000130] Sequência do promotor de CMV: em negrito
[000131] Sequência de transgene NM2: em itálico
[000132] sinal PolyA de bghpolyA: itálico + sublinhado SEQ ID NO: 5 - Sequência de proteína NM2 MALSKVKLNDTLNKDQLLSSSKYTIQRSTGDSIDTPNYDVQKHIN- KLCGMLLITEDANHKFTGLIGMLYAMSRLGREDTIKILRDA- GYHVKANGVDVTTHRQDINGKEMKFEVLTLASLTTEIQINIEIES- RKSYKKMLKEMGEVAPEYRHDSPDCGMIILCIAALVITKLAAG- DRSGLTAVIRRANNVLKNEMKRYKGLLPKDIANS- FYEVFEKYPHFIDVFVHFGIAQSSTRGGSRVEGIFA- GLFMNAYGAGQVMLRWGVLAKSVKNIMLGHASVQAE-
MEQVVEVYEYAQKLGGEAGFYHILNNPKASLLSLTQFPHFSSVVLG- NAAGLGIMGEYRGTPRNQDLYDAAKAYAEQLKENGVINYSVLDL- TAEELEAIKHQLNPKDNDVELGGGGSGGGGMSRRNPCKFEI- RGHCLNGKRCHFSHNYFEWPPHALLVRQNFMLNRILKSMDKSIDTL- SEISGAAELDRTEEYALGVVGVLESYIGSINNITKQSACVAMSKLL- TELNSDDIKKLRDNEELNSPKIRVYNTVISYIESNRKNNKQTIHLLKRL-
PADVLKKTIKNTLDIHKSITINNPKESTVSDTNDHAKNNDTT SEQ ID NO: 6 - Sequência polinucleotídica que codifica a cassete de hCMV F0 WPRE bghpolyA CCATTGCATACGTTGTATCCATATCATAATATGTACATTTATA- TTGGCTCATGTCCAACATTACCGCCATGTTGACATTGATTA- TTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCA- TAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAA- TGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGA- CGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGAC- TTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTG- CCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACG- CCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCAT- TATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTA- CATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGG- TTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACT- CACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAG- TTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCG- TAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTG- TACGGTGGGAGGTCTATATAAGGCGAAGCGCTCCCTATCAG- TGATAGAGATCTCCCTATCAGTGATAGAGATCGTCGACGAG- CTCGCGGCGGGCGGGAGTCGCTGCGCGCTGCCTTCGCCCCG- TGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGG- CTCTGACTGACCGCGTTACTAAAACAGGTAAGTCCGGCCTCCG- CGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCT-
CACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGCGAG- CGTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCG- CTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAG- GACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGG- TTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAG- TCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGG- TGAACGCCGATGATGCCTCTACTAACCATGTTCATGTTTT- CTTTTTTTTTCTACAGGTCCTGGGTGACGAACAGGATATCG- CCACCATGGAACTGCTGATCCTGAAGGCCAACGCCATCACCAC- CATCCTGACCGCCGTGACCTTCTGCTTCGCCAGCGGCCAGAACA- TCACCGAGGAATTCTACCAGAGCACCTGTAGCGCCGTGAG- CAAGGGCTACCTGAGCGCCCTGAGAACCGGCTGGTACACCAG- CGTGATCACCATCGAGCTGAGCAACATCAAAGAAAACAAGTG- CAACGGCACCGACGCCAAAGTGAAGCTGATCAAGCAGGAACTG- GACAAGTACAAGAACGCCGTGACCGAGCTGCAGCTGCTGATG- CAGAGCACCCCCGCCACCAACAACCGGGCCAGACGGGAGCTG- CCCCGGTTCATGAACTACACCCTGAACAACGCCAAAAAGAC- CAACGTGACCCTGAGCAAGAAGCGGAAGCGGCGGTTCCTGGG- CTTTCTGCTGGGCGTGGGCAGCGCCATTGCCAGCGGCGTGG- CCGTGTCTAAGGTGCTGCACCTGGAAGGCGAAGTGAACAAGAT- CAAGAGCGCCCTGCTGAGCACCAACAAGGCCGTGGTG- TCCCTGAGCAACGGCGTGAGCGTGCTGACCAGCAAGGTGCTG- GATCTGAAGAACTACATCGACAAGCAGCTGCTGCCCATCGTGAA- CAAGCAGAGCTGCAGCATCAGCAACATCGAGACAGTGATCGAG- TTCCAGCAGAAGAACAACCGGCTGCTGGAAATCACCCGGGAG- TTCAGCGTGAACGCCGGCGTGACCACCCCTGTGTCCACCTACA- TGCTGACCAACAGCGAGCTGCTGAGCCTGATCAACGACATG- CCCATCACCAACGACCAGAAAAAGCTGATGAGCAACAACGTGCA- GATCGTGCGGCAGCAGAGCTACTCCATCATGTCCATCAT- CAAAGAAGAGGTGCTGGCCTACGTGGTGCAGCTGCCCCTG- TACGGCGTGATCGACACCCCCTGCTGGAAGCTGCACACCAG- CCCCCTGTGCACCACCAACACCAAAGAGGGCAGCAACATCTG- CCTGACCCGGACCGACAGAGGCTGGTACTGCGACAACGCCGG- CAGCGTGTCATTCTTTCCACAGGCCGAGACATGCAAGGTGCA- GAGCAACCGGGTGTTCTGCGACACCATGAACAGCCTGACCCTG- CCCTCCGAAGTGAACCTGTGCAACGTGGACATCTTCAAC- CCCAAGTACGACTGCAAGATCATGACCTCCAAGACCGACGTG- TCCAGCTCCGTGATCACCTCCCTGGGCGCCATCGTGTCCTGC- TACGGCAAGACCAAGTGCACCGCCAGCAACAAGAACCGGGG- CATCATCAAGACCTTCAGCAACGGCTGCGACTACGTGTCCAA- CAAGGGGGTGGACACCGTGTCCGTGGGCAACACCCTGTAC- TACGTGAACAAACAGGAAGGCAAGAGCCTGTACGTGAAGGG- CGAGCCCATCATCAACTTCTACGACCCCCTGGTGTTCCCCAG- CGACGAGTTCGACGCCAGCATCAGCCAGGTGAACGAGAAGAT- CAACCAGAGCCTGGCCTTCATCCGGAAGTCCGACGAGCTGCTG- CACAATGTGAATGCCGGCAAGTCCACCACCAACTGATGAGCGG- CCATCTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGAC- TGGTATTCTTAACTATGTTGCTCCTTTTACGCTATGTGGATACG- CTGCTTTAATGCCTTTGTATCATGCTATTGCTTCCCGTATGG- CTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTA- TGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTG- CACTGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTG- CCACCACCTGTCAGCTCCTTTCCGGGACTTTCGCTTT- CCCCCTCCCTATTGCCACGGCGGAACTCATCGCCGCCTG- CCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGA- CAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGG- CTGCTCGCCTGTGTTGCCACCTGGATTCTGCGCGGGACG- TCCTTCTGCTACGTCCCTTCGGCCCTCAATCCAGCGGACCTT- CCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCTTCCGCG- TCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGG- CCGCCTCCCCGCCTGCGGCCGCGATCTGCTGTGCCTTCTAG- TTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGA- CCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAG- GAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATT- CTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGG-
GAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG Sequência do promotor de CMV intensificado: em negrito
[000133] Sequência de transgene F0: Em itálico
[000134] Sequência de WPRE: sublinhado em negrito
[000135] sinal PolyA de bghpolyA: itálico + sublinhado SEQ ID NO: 7 - Sequência de proteína F0 MELLILKANAITTILTAVTFCFASGQNITEEFYQSTCSAVSKGYLSAL- RTGWYTSVITIELSNIKENKCNGTDAKVKLIKQELDKYKNA- VTELQLLMQSTPATNNRARRELPRFMNYTLNNAKKTNVTLSK- KRKRRFLGFLLGVGSAIASGVAVSKVLHLEGEVNKIKSALLSTN- KAVVSLSNGVSVLTSKVLDLKNYIDKQLLPIVNKQSCSISNI- ETVIEFQQKNNRLLEITREFSVNAGVTTPVSTYMLTNSELLSLINDM- PITNDQKKLMSNNVQIVRQQSYSIMSIIKEEVLAYVVQL- PLYGVIDTPCWKLHTSPLCTTNTKEGSNICLTRTDRGWYCD- NAGSVSFFPQAETCKVQSNRVFCDTMNSLTLPSEVNLCNVDIFN- PKYDCKIMTSKTDVSSSVITSLGAIVSCYGKTKCTASNKNRGIIKT- FSNGCDYVSNKGVDTVSVGNTLYYVNKQEGKSLYVKGEPIINFYD-
PLVFPSDEFDASISQVNEKINQSLAFIRKSDELLHNVNAGKSTTN SEQ ID NO: 8 Sequência polinucleotídica da sequência de promo- tor e de intensificador de hCMV CCATTGCATACGTTGTATCCATATCATAATATGTACATTTATA- TTGGCTCATGTCCAACATTACCGCCATGTTGACATTGATTATTGA- CTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAG- CCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGG- CCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCA-
ATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTT- CCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCAC- TTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTA- TTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAG- TACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTA- TTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACAT- CAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAG- TCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAA- TCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGA-
CGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAG SEQ ID NO: 9 Sequência polinucleotídica do fragmento de beta- actina de frango GCGAAGCGCTCCCTATCAGTGATAGAGATCTCCCTATCAGTGA- TAGAGATCGTCGACGAGCTCGCGGCGGGCGGGAGTCGCTGCG- CGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCG-
CCGCCCGCCCCGGCTCTGACTGACCGCGTTACT SEQ ID NO: 10 Sequência polinucleotídica da região de doador de splice
[000136] AAAACAGGTAAGTCC SEQ ID NO: 11 Sequência polinucleotídica do intensificador de ubiquitina (UBC) GGCCTCCGCGCCGGGTTTTGGCGCCTCCCGCGGGCG- CCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGG- CGCAGCGAGCGTCCTGATCCTTCCGCCCGGACGCTCAGGACAG- CGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAG- CAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCAC- TGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAG- TCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGG-
TGAACGCCGATGAT SEQ ID NO: 12 Sequência polinucleotídica da região de aceitador de splice GCCTCTACTAACCATGTTCATGTTTTCTTTTTTTTTCTACAGG-
TCCTGGGTGACGAACAG

Claims (18)

REIVINDICAÇÕES
1. Promotor, caracterizado pelo fato de que compreende: (i) uma sequência de intensificador de hCMV; (ii) uma sequência de promotor de hCMV; (iii) uma região de doador de splice; (iv) uma sequência de intensificador derivado de célula; e (v) uma região de aceitador de splice.
2. Vetor adenoviral, caracterizado pelo fato de que compre- ende uma cassete de expressão, em que a cassete de expressão compreende um transgene e um promotor, em que o promotor com- preende: (i) uma sequência de intensificador de hCMV; (ii) uma sequência de promotor de hCMV; (iii) uma região de doador de splice; (iv) uma sequência de intensificador derivado de célula; e (vi) uma região de aceitador de splice.
3. Vetor adenoviral, caracterizado pelo fato de que compre- ende uma primeira e uma segunda cassete de expressão, em que ca- da cassete de expressão compreende um transgene e um promotor, em que o promotor da primeira cassete de expressão e/ou da segunda cassete de expressão é um promotor compreendendo: (i) uma sequência de intensificador de hCMV; (ii) uma sequência de promotor de hCMV; (iii) uma região de doador de splice; (iv) uma sequência de intensificador derivado de célula; e (v) uma região de aceitador de splice.
4. Promotor ou vetor adenoviral, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que a sequência de intensificador derivado de célula é uma sequência de intensificador de ubiquitina (UBC).
5. Promotor ou vetor adenoviral, de acordo com a reivindi- cação 4, caracterizado pelo fato de que o intensificador de UBC com- preende a sequência da SEQ ID NO: 11.
6. Promotor ou vetor adenoviral, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que compreende uma ou mais das SEQ ID NO: 8, SEQ ID NO:10, SEQ ID NO:11 e SEQ ID NO: 12.
7. Vetor adenoviral, de acordo com a reivindicação 3, carac- terizado pelo fato de que a primeira cassete de expressão compreende o promotor.
8. Vetor adenoviral, de acordo com a reivindicação 3 ou 7, caracterizado pelo fato de que a segunda cassete de expressão com- preende o promotor.
9. Promotor ou vetor adenoviral, de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo fato de que o promotor compreende adicionalmente: (vi) um fragmento da sequência de beta-actina de frango; em que o fragmento da sequência de beta-actina de frango compreende uma região não traduzida em 5’ da sequência de beta- actina de frango e não contém a sequência de promotor.
10. Promotor, caracterizado pelo fato de que compreende uma sequência de ácido nucleico com pelo menos 84,1% de identida- de à SEQ ID NO: 3.
11. Vetor adenoviral, caracterizado pelo fato de que com- preende uma cassete de expressão, em que a cassete de expressão compreende um transgene e um promotor, em que o promotor com- preende uma sequência de ácido nucleico com pelo menos 84,1% de identidade à SEQ ID NO: 3.
12. Vetor adenoviral, caracterizado pelo fato de que com- preende uma primeira e uma segunda cassete de expressão, em que cada cassete de expressão compreende um transgene e um promotor, em que o promotor da primeira cassete de expressão e/ou da segunda cassete de expressão é um promotor que tem pelo menos 84,1 % de identidade à SEQ ID NO: 3.
13. Vetor adenoviral, de acordo com a reivindicação 12, ca- racterizado pelo fato de que a primeira cassete de expressão compre- ende o promotor.
14. Vetor adenoviral, de acordo com a reivindicação 12 ou 13, caracterizado pelo fato de que a segunda cassete de expressão compreende o promotor.
15. Promotor ou vetor adenoviral, de acordo com qualquer uma das reivindicações 10 a 14, caracterizado pelo fato de que o pro- motor compreende uma sequência de ácido nucleico que tem pelo menos cerca de 84,5%, pelo menos cerca de 85%, pelo menos cerca de 86%, pelo menos cerca de 87%, pelo menos cerca de 88%, pelo menos cerca de 89% ou mais, de identidade de sequência à SEQ ID NO: 3
16. Promotor ou vetor adenoviral, de acordo com qualquer uma das reivindicações 10 a 15, caracterizado pelo fato de que o pro- motor compreende uma sequência de ácido nucleico que tem pelo menos cerca de 90%, pelo menos cerca de 95%, pelo menos cerca de 96%, pelo menos cerca de 97%, pelo menos cerca de 98%, pelo me- nos cerca de 99% ou mais, de identidade de sequência à SEQ ID NO:
3.
17. Promotor ou vetor adenoviral, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado pelo fato de que o promo- tor compreende a sequência de ácido nucleico da SEQ ID NO: 3.
18. Promotor ou vetor adenoviral, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que o promo- tor consiste na sequência de ácido nucleico da SEQ ID NO: 3.
BR112020007042-4A 2017-10-16 2018-10-16 promotor intensificado BR112020007042A2 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201762572951P 2017-10-16 2017-10-16
US201762572944P 2017-10-16 2017-10-16
US201762572927P 2017-10-16 2017-10-16
US62/572,951 2017-10-16
US62/572,944 2017-10-16
US62/572,927 2017-10-16
PCT/EP2018/078242 WO2019076892A1 (en) 2017-10-16 2018-10-16 ENHANCED PROMOTER

Publications (1)

Publication Number Publication Date
BR112020007042A2 true BR112020007042A2 (pt) 2020-11-17

Family

ID=63896168

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020007042-4A BR112020007042A2 (pt) 2017-10-16 2018-10-16 promotor intensificado

Country Status (8)

Country Link
US (2) US11352643B2 (pt)
EP (1) EP3697902A1 (pt)
JP (1) JP7240390B2 (pt)
CN (1) CN111328344A (pt)
BR (1) BR112020007042A2 (pt)
CA (1) CA3084358A1 (pt)
MX (1) MX2020003389A (pt)
WO (1) WO2019076892A1 (pt)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008114149A2 (en) 2007-03-21 2008-09-25 Id Biomedical Corporation Of Quebec Chimeric antigens
RU2604815C2 (ru) 2009-02-02 2016-12-10 ГлаксоСмитКлайн Байолоджикалз с.а. Нуклеинокислотные и аминокислотные последовательности аденовируса обезьян, векторы, содержащие указанные последовательности, и их применение
WO2012089231A1 (en) 2010-12-30 2012-07-05 Okairòs Ag Paramyxovirus vaccines
WO2012115980A1 (en) * 2011-02-22 2012-08-30 California Institute Of Technology Delivery of proteins using adeno-associated virus (aav) vectors
CN108025058B (zh) 2015-06-12 2022-12-16 葛兰素史密丝克莱恩生物有限公司 腺病毒多核苷酸和多肽
GB201513176D0 (en) 2015-07-27 2015-09-09 Glaxosmithkline Biolog Sa Novel methods for inducing an immune response

Also Published As

Publication number Publication date
CN111328344A (zh) 2020-06-23
WO2019076892A1 (en) 2019-04-25
JP2020537524A (ja) 2020-12-24
US20220364115A1 (en) 2022-11-17
US20210189420A1 (en) 2021-06-24
EP3697902A1 (en) 2020-08-26
CA3084358A1 (en) 2019-04-25
US11352643B2 (en) 2022-06-07
JP7240390B2 (ja) 2023-03-15
MX2020003389A (es) 2022-08-04

Similar Documents

Publication Publication Date Title
JP6230527B2 (ja) サルアデノウイルス及び雑種アデノウイルスベクター
ES2959811T3 (es) Construcciones de adenovirus de chimpancé con antígenos de Lyssavirus
AU2019271972A1 (en) Adenovirus polynucleotides and polypeptides
WO2020063370A2 (zh) 免疫组合物及其制备方法与应用
US11268108B2 (en) Replication competent adenoviral vectors
US11859199B2 (en) Adenoviral vectors with two expression cassettes encoding RSV antigenic proteins or fragments thereof
US20240093161A1 (en) Simian adenoviral vectors with two expression cassettes
US11229692B2 (en) Methods and compositions for inducing protective immunity against RSV infection
BR112020024285A2 (pt) polinucleotídeos e polipeptídeos de adenovírus
BR112020012273A2 (pt) métodos e composições para induzir uma resposta imune contra o vírus da hepatite b (hbv)
BR112020007042A2 (pt) promotor intensificado
EA039001B1 (ru) Аденовирусные полинуклеотиды и полипептиды

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 6A ANUIDADE.